top of page

Veri Analizinin Temeli: Tanımlayıcı İstatistik Nedir, Ne İşe Yarar?

Tanımlayıcı (betimsel) istatistik, elde edilen verileri özetlemek, anlamak ve temel eğilimlerini hızlıca görmek için kullanılan istatistiksel yöntemler bütünüdür. Betimsel istatistikler, büyük veri yığınlarını sadeleştirir, verilerdeki ana eğilimleri ve dağılımları öne çıkarır.

tanımlayıcı betimleyici istatistik görseli

Tanımlayıcı İstatistik Tablosu Örneği

Örnek Analiz:

Örneğin; 5 öğrencinin notları: 70, 80, 80, 80, 90


Aşağıdaki tablo, örnek bir sınıfta öğrencilerin sınav notlarına ait temel tanımlayıcı istatistikleri göstermektedir:

İstatistiksel Ölçüt

Değer

Ortalama (Mean)

80

Medyan (Median)

80

Mod (Mode)

80

Minimum Değer

70

Maksimum Değer

90

Standart Sapma

7,07

Varyans

50

Gözlem Sayısı (n)

5

Neden Önemlidir?

  • Karmaşık veri setlerini sadeleştirir.

  • Karar verme süreçlerini hızlandırır ve objektifleştirir.

  • Veri profilini ortaya koyarak ileri analizlere temel oluşturur.



Sık Kullanılan Yöntemler ve Açıklamaları

Merkezi Eğilim Ölçüleri

  • Ortalama: Verilerin aritmetik ortalamasıdır. Aykırı değerlerden etkilenebilir.

  • Medyan: Sıralanmış verilerin ortasındaki değerdir. Aykırı değerlerden az etkilenir.

  • Mod: En sık tekrar eden değerdir. Özellikle kategorik veriler için kullanışlıdır.


Dağılım Ölçüleri

  • Standart Sapma: Verilerin ortalamadan ne kadar saptığını gösterir.

  • Varyans: Standart sapmanın karesi olup, veriler arasındaki değişkenliği ölçer.

  • Çeyrekler Açıklığı (IQR): Orta %50’lik veri aralığını ifade eder, uç değerlerin etkisini azaltır.


Veri Görselleştirme Teknikleri

  • Histogram: Veri aralıklarının frekansını gösterir, dağılımı anlamak için idealdir.

  • Pasta Grafiği: Oransal dağılımı görsel olarak gösterir.

  • Sütun/Çubuk Grafiği: Kategorik verileri karşılaştırmak için kullanılır.


Örnek Analiz:

Örneğin; 5 öğrencinin notları: 70, 80, 80, 80, 90

  • Ortalama = 80

  • Medyan = 80

  • Mod = 80

  • Standart Sapma ≈ 7,07

  • Varyans = 50

  • Minimum = 70, Maksimum = 90

Buradan sınıfın genel olarak aynı başarı seviyesinde olduğu, notların ortalamadan çok fazla sapmadığı (düşük standart sapma), ve dağılımın dar olduğu görülür.

tanımlayıcı betimleyici istatistik yazı görseli

Sonuç

Betimsel istatistikler, verilerin özetlenmesini ve ilk bakışta anlaşılmasını sağlar. Daha derinlemesine analizler için mutlaka betimsel istatistiklerle başlamalı ve verinin genel yapısını ortaya koymalısınız. Grafikler ve tablolar bu süreci destekleyerek analizlerinizi daha etkili hale getirir.

Yorumlar


bottom of page