Veri Analizinin Temeli: Tanımlayıcı İstatistik Nedir, Ne İşe Yarar?
- Nominal Analiz
- 22 Tem
- 2 dakikada okunur
Tanımlayıcı (betimsel) istatistik, elde edilen verileri özetlemek, anlamak ve temel eğilimlerini hızlıca görmek için kullanılan istatistiksel yöntemler bütünüdür. Betimsel istatistikler, büyük veri yığınlarını sadeleştirir, verilerdeki ana eğilimleri ve dağılımları öne çıkarır.

Tanımlayıcı İstatistik Tablosu Örneği
Örnek Analiz:
Örneğin; 5 öğrencinin notları: 70, 80, 80, 80, 90
Aşağıdaki tablo, örnek bir sınıfta öğrencilerin sınav notlarına ait temel tanımlayıcı istatistikleri göstermektedir:
İstatistiksel Ölçüt | Değer |
Ortalama (Mean) | 80 |
Medyan (Median) | 80 |
Mod (Mode) | 80 |
Minimum Değer | 70 |
Maksimum Değer | 90 |
Standart Sapma | 7,07 |
Varyans | 50 |
Gözlem Sayısı (n) | 5 |
Neden Önemlidir?
Karmaşık veri setlerini sadeleştirir.
Karar verme süreçlerini hızlandırır ve objektifleştirir.
Veri profilini ortaya koyarak ileri analizlere temel oluşturur.
Sık Kullanılan Yöntemler ve Açıklamaları
Merkezi Eğilim Ölçüleri
Ortalama: Verilerin aritmetik ortalamasıdır. Aykırı değerlerden etkilenebilir.
Medyan: Sıralanmış verilerin ortasındaki değerdir. Aykırı değerlerden az etkilenir.
Mod: En sık tekrar eden değerdir. Özellikle kategorik veriler için kullanışlıdır.
Dağılım Ölçüleri
Standart Sapma: Verilerin ortalamadan ne kadar saptığını gösterir.
Varyans: Standart sapmanın karesi olup, veriler arasındaki değişkenliği ölçer.
Çeyrekler Açıklığı (IQR): Orta %50’lik veri aralığını ifade eder, uç değerlerin etkisini azaltır.
Veri Görselleştirme Teknikleri
Histogram: Veri aralıklarının frekansını gösterir, dağılımı anlamak için idealdir.
Pasta Grafiği: Oransal dağılımı görsel olarak gösterir.
Sütun/Çubuk Grafiği: Kategorik verileri karşılaştırmak için kullanılır.
Örnek Analiz:
Örneğin; 5 öğrencinin notları: 70, 80, 80, 80, 90
Ortalama = 80
Medyan = 80
Mod = 80
Standart Sapma ≈ 7,07
Varyans = 50
Minimum = 70, Maksimum = 90
Buradan sınıfın genel olarak aynı başarı seviyesinde olduğu, notların ortalamadan çok fazla sapmadığı (düşük standart sapma), ve dağılımın dar olduğu görülür.

Sonuç
Betimsel istatistikler, verilerin özetlenmesini ve ilk bakışta anlaşılmasını sağlar. Daha derinlemesine analizler için mutlaka betimsel istatistiklerle başlamalı ve verinin genel yapısını ortaya koymalısınız. Grafikler ve tablolar bu süreci destekleyerek analizlerinizi daha etkili hale getirir.
Yorumlar