Betimsel İstatistikler: Veri Analizinin İlk Adımı
- Nominal Analiz
- 16 Kas
- 3 dakikada okunur
Betimsel istatistikler, bir veri setini anlamanın ve araştırma sürecine sağlam bir başlangıç yapmanın en temel yöntemidir. Araştırmacı, veri topladıktan sonra ilk olarak verinin yapısını, dağılımını, ortalamasını, en düşük ve en yüksek değerlerini ve değişkenliğini inceleyerek elde ettiği bilgiye anlam kazandırır.
Çünkü herhangi bir çıkarım testine geçmeden önce verinin “nasıl göründüğünü” bilmek zorunludur.
Veri seti ister küçük bir örneklemden ister geniş bir popülasyondan gelsin, betimsel istatistikler veriye dair ilk fotoğrafı sunar ve araştırmacıya sonraki aşamada hangi yöntemleri kullanacağını belirlemede yol gösterir.

Betimsel İstatistik Türleri
Betimsel istatistikler üç temel başlık altında incelenir:
1) Dağılım (Frekans Yapısı)
Bir değişkendeki her bir değerin veri setinde kaç kez tekrar ettiğini gösterir. Frekans tabloları veya grafikler (çubuk grafikleri, histogramlar) ile sunulur. Örneğin, bir araştırmada katılımcıların kaç kez kütüphaneye gittiğine bakıyorsanız, sıklık tablosu bize bu davranışın veri setindeki yaygınlığını gösterir.
2) Merkezi Eğilim (Ortalama Değerler)
Bir veri setinin “merkezini” ifade eden üç yaygın ölçü vardır:
Aritmetik Ortalama
Ortanca (Median)
Tepe Değeri (Mod)
Ortalama, tüm değerlerin toplamının gözlem sayısına bölünmesiyle elde edilir. Ortanca, veri sıralandığında tam ortada kalan değerdir. Mod ise veri setinde en çok tekrar eden değerdir.
Bu üçü birlikte, verinin nerede yoğunlaştığını anlamayı sağlar.
3) Değişkenlik (Dağılım Genişliği)
Verilerin ortalamadan ne kadar uzaklaştığını gösterir.
Aralık (Range)
Standart Sapma
Varyans
Örneğin standart sapma yüksekse, veri setinde değerler ortalamadan oldukça uzaklaşmıştır; bu da verinin homojen olmadığını gösterir.
Örnek Bir Uygulama
Katılımcılara son bir yıl içinde kaç kez kütüphaneye gittikleri sorulsun.
İlk altı katılımcının cevapları şöyle olsun:
15, 3, 12, 0, 24, 3
Bu küçük veri seti üzerinde üç tür betimsel istatistik incelemesi yapılabilir.
• Ortalama
Toplam: 57
Gözlem sayısı: 6
Ortalama = 57 / 6 = 9,5
• Ortanca
Sıralı değerler: 0, 3, 3, 12, 15, 24
Ortadaki iki değer: 3 ve 12
Ortanca = (3 + 12) / 2 = 7,5
• Mod
En çok tekrar eden değer: 3
Mod = 3
• Aralık
En büyük – en küçük = 24 – 0
Aralık = 24
• Standart Sapma
Standart sapma ≈ 9,18
Bu veri setinde ortalama oldukça yüksek görünse de standart sapmanın büyük olması, değerlerin birbirinden oldukça farklı olduğunu gösterir. Bu da tek başına ortalamaya bakmanın yanıltıcı olabileceğini kanıtlar.
Tek Değişkenli (Univariate) Betimsel İstatistikler
Tek bir değişkenin tüm özellikleri dağılım, merkezi eğilim ve değişkenlik ölçüleriyle birlikte değerlendirilir.
Örneğin “kütüphane ziyaret sayısı” değişkeni için aşağıdaki gibi bir tablo oluşturulabilir:
Ölçü | Değer |
Gözlem Sayısı | 6 |
Ortalama | 9,5 |
Ortanca | 7,5 |
Mod | 3 |
Standart Sapma | 9,18 |
Varyans | 84,3 |
Aralık | 24 |
Bu özet tablo, tek bir değişken hakkında hızlı ve anlaşılır bir değerlendirme yapmayı sağlar.
İki Değişkenli (Bivariate) Betimsel İstatistikler
Bir araştırmada birden fazla değişken varsa, değişkenlerin birlikte nasıl davrandığı incelenir. Amaç, ilişkilerin ve örüntülerin ilk aşamada tanımlanmasıdır.
• Çapraz Tablolar (Contingency Tables)
Bu tablolar iki değişkenin kesişme noktalarını gösterir.
Örneğin:
Düşey eksen: “Yaş grubu”
Yatay eksen: “Kütüphane ziyaret sıklığı”
Bu sayede iki değişkenin birlikte nasıl dağıldığı kolayca görülür.
• Yayılım Grafiği (Scatter Plot)
Sürekli iki değişken arasındaki ilişkiyi görselleştirmek için kullanılır.
Örnek: “Kütüphane ziyaret sayısı” ile “sinema salonuna gitme sıklığı” arasındaki ilişki grafikle gösterildiğinde, eğilim çizgisi bize bu iki davranış arasında ters yönlü bir ilişki olup olmadığını gösterebilir.
Betimsel İstatistiklerin Araştırma Sürecindeki Yeri
Betimsel istatistikler, veri analizi sürecinin temel taşıdır.
Çünkü:
Veri yapısı anlaşılmadan ileri analiz yapılamaz.
Uç değerler ve hatalı girişler bu aşamada fark edilir.
Doğru test türü (parametrik / parametrik olmayan) ancak dağılım incelenerek belirlenir.
Sonraki aşama olan çıkarımsal istatistiklerin temel varsayımlarının uygunluğu buradan anlaşılır.
Kısacası betimsel istatistikler, veriyi “okumayı” sağlar; çıkarımsal istatistikler ise veriye “yorum katmayı” ve “genelleme yapmayı”.








Yorumlar