Bu bölümde, veri analizinin keşifsel veri analizi (EDA) adı verilen ilk versiyonuyla karşılaşacağız. EDA, veri keşfi yoluyla belirli bir popülasyon veya örneklemdeki desenleri ve eğilimleri bulmak için veri analizi yapma sürecidir. Temel olarak, bu tür analiz, görsel keşif yoluyla gerçekleştirilir ve bu nedenle veri görselleştirme yöntemleri bu analizin önemli bir parçasını oluşturacaktır. Veri setimizin hangi bölümlerinin görselleştirilmeye uygun olduğunu ve hangilerinin olmadığını bilmek için, tanımlayıcı istatistik yöntemleri aracılığıyla edinilen temel bilgileri kullanırız. Bu bölümde, verilerin merkezini ölçmek için kullanılan temel istatistik yöntemlerini tanımlayabiliriz. Bu yöntemler arasında en yaygın olanları şunlardır: Ortalama veya ortalama, dizin öğelerinin ortalama değeridir. Ortalama, simetrik olarak dağıtılan ve aykırı değerler içermeyen verileri karakterize etmek için uygundur (örneğin, boy, kilo). Simetrik olarak dağıtılan veriler, veri kümesindeki öğelerin sayısının ortalama sınırın altında ve üstünde benzer olması gereken, ideal olarak aynı olan verilerdir. Ortalama değerinin hesaplanması için ilişki şöyledir: Burada µA, A özniteliğinin ortalama değeridir, n öğe sayısıdır.(AI)
Atıf Sayısı :