Nicel Verilerin Özetlenmesi: Merkezi Eğilim ve Yayılım Ölçüleriyle Anlamlı Sonuçlar Elde Etmek - Örnek Veri Setiyle Detaylı Anlatım
- Nominal Analiz
- 10 Tem
- 4 dakikada okunur
Veri analizi sürecinde karşılaştığımız en temel soru şudur: “Bu sayısal veriler bize ne söylüyor?” Araştırmalarımızda topladığımız yaş, boy, gelir, sınav puanı gibi nicel (sayısal) veriler, çoğu zaman yüzlerce hatta binlerce rakamdan oluşan uzun listeler halindedir. Tüm bu sayısal değerlerin anlamlı bir bütün oluşturabilmesi için onları özetlememiz gerekir. İşte burada merkezi eğilim ölçüleri ve yayılım (dağılım) ölçüleri devreye girer.

Merkezi Eğilim Ölçüleri: Verilerin Merkezinde Ne Var?
Nicel verilerin ilk özetleme adımı, veri setinin “merkezini” bulmaktır. Bu amaçla kullanılan en önemli ölçüler şunlardır:
Aritmetik Ortalama (Mean): Tüm gözlem değerleri toplanıp gözlem sayısına bölünerek bulunur. En çok bilinen ve kullanılan merkezi eğilim ölçüsüdür. Özellikle normal dağılıma sahip verilerde kullanılması uygundur.
Formül: Ortalama = (X₁ + X₂ + … + Xn) / n
Ortanca (Medyan): Veriler küçükten büyüğe sıralanır ve ortada kalan değer ortancadır. Eğer veri sayısı çiftse, ortadaki iki değerin aritmetik ortalaması alınır. Uç değerlerin (aykırı değerlerin) etkisinin fazla olduğu durumlarda ortanca, merkezi daha doğru gösterir.
Mod (Tepe Değer): Veri setinde en sık tekrar eden değerdir. Özellikle çoklu tepe değerlerin (modların) olabildiği durumlarda, veri dağılımının farklı özellikleri hakkında fikir verir.
Merkezi Eğilim Ölçüleri Örneği
Örnek Veri Seti:
Bir grup öğrencinin sınav puanları (100 üzerinden):
Kişi | Puan |
1 | 50 |
2 | 70 |
3 | 85 |
4 | 55 |
5 | 65 |
6 | 90 |
7 | 70 |
8 | 40 |
9 | 80 |
10 | 70 |
Aritmetik Ortalama (Mean) Hesaplama:
Adım 1: Tüm puanları topla: 50 + 70 + 85 + 55 + 65 + 90 + 70 + 40 + 80 + 70 = 675
Adım 2: Gözlem sayısına böl: 675 / 10 = 67,5
Aritmetik Ortalama: 67,5
Ortanca (Medyan) Hesaplama:
Adım 1: Puanları küçükten büyüğe sırala: 40, 50, 55, 65, 70, 70, 70, 80, 85, 90
Adım 2: Gözlem sayısı çift (10 kişi), ortadaki iki değeri bul: 5. değer: 706. değer: 70
Adım 3: Ortadaki iki değerin ortalaması: (70 + 70) / 2 = 70
Ortanca (Medyan): 70
Mod (Tepe Değer) Hesaplama:
Hangi değer en çok tekrar ediyor?
70 puanı 3 kez tekrar ediyor (diğerleri 1 kez).
Mod (Tepe Değer): 70
Kısa Tabloyla Sonuçlar
Ölçü | Değer | Yorum |
Aritmetik Ortalama | 67,5 | Ortalama başarı düzeyi |
Ortanca (Medyan) | 70 | Merkezdeki tipik değer, uç değerlerden etkilenmez |
Mod (Tepe Değer) | 70 | En sık görülen başarı puanı |
Yayılım (Dağılım) Ölçüleri: Veriler Ne Kadar Dağılmış?
Verilerin sadece merkezini bilmek çoğu zaman yeterli olmaz; verilerin bu merkezin etrafında nasıl dağıldığını da anlamamız gerekir. Bu amaçla kullanılan başlıca yayılım ölçüleri şunlardır:
Standart Sapma (Std. Deviation): Her bir gözlemin aritmetik ortalamadan sapmalarının karelerinin ortalamasının kareköküdür. Standart sapma büyüdükçe, veriler merkezin etrafında daha geniş dağılmıştır anlamına gelir.
Varyans: Standart sapmanın karesidir. Verilerin ortalamadan ne kadar saptığını gösterir.
Minimum ve Maksimum Değerler: Veri setindeki en küçük ve en büyük değerlerdir.
Ranj (Değişim Aralığı):Maksimum ve minimum değerler arasındaki farktır. Kaba bir yayılım ölçüsüdür.
Çeyrek Değerler (Quartiles): Veri setinin %25’i, %50’si (ortanca) ve %75’inin altında kalan değerlere bakılır.
1. Çeyrek (Q1): %25’in altında kalan değer
Ortanca (Q2): %50’nin altında kalan değer
3. Çeyrek (Q3): %75’in altında kalan değer
Standart Hata: Ortalama değerin güvenilirliği hakkında bilgi verir; standart sapmanın, gözlem sayısının kareköküne bölünmesiyle hesaplanır.
Dağılım Özelliğine Göre Özetleme Seçimi
Normal Dağılım Gösteren Veriler: Ortalama, standart sapma, minimum ve maksimum değerleriyle özetlenir.
Normal Dağılım Göstermeyen Veriler: Ortanca, 1. ve 3. çeyrek, minimum ve maksimum ile özetleme daha uygundur.
Yayılım (Dağılım) Ölçüleri Örneği
Örnek Veri Seti:
Bir grup öğrencinin sınav puanları (10 kişi):
Kişi | Puan |
1 | 40 |
2 | 50 |
3 | 55 |
4 | 65 |
5 | 70 |
6 | 70 |
7 | 70 |
8 | 80 |
9 | 85 |
10 | 90 |
1. Minimum ve Maksimum Değerler
Minimum: 40
Maksimum: 90
2. Ranj (Değişim Aralığı)
Ranj = Maksimum - Minimum = 90 - 40 = 50
3. Çeyrek Değerler (Quartiles)
Veriler küçükten büyüğe dizili: 40, 50, 55, 65, 70, 70, 70, 80, 85, 90
Q1 (1. Çeyrek, %25): 10 kişi × 0,25 = 2,5 → 3. kişi ile 2. kişi arası (50 + 55) / 2 = 52,5
Q2 (Ortanca, %50): 10 kişi × 0,50 = 55. ve 6. kişi (70 ve 70): (70 + 70) / 2 = 70
Q3 (3. Çeyrek, %75):10 kişi × 0,75 = 7,5 → 7. ve 8. kişi arası (70 + 80) / 2 = 75
4. Standart Sapma ve Varyans
Önce aritmetik ortalamayı bul:
Toplam: 40 + 50 + 55 + 65 + 70 + 70 + 70 + 80 + 85 + 90 = 675
Ortalama: 675 / 10 = 67,5
Her değerin ortalamadan farkının karesini hesapla ve topla:
(40 - 67,5)² = 756,25
(50 - 67,5)² = 306,25
(55 - 67,5)² = 156,25
(65 - 67,5)² = 6,25
(70 - 67,5)² = 6,25
(70 - 67,5)² = 6,25
(70 - 67,5)² = 6,25
(80 - 67,5)² = 156,25
(85 - 67,5)² = 306,25
(90 - 67,5)² = 506,25
Toplam: 2206,25
Varyans (n-1): 2206,25 / 9 = 245,14
Standart Sapma: √245,14 ≈ 15,66
5. Standart Hata
Standart Hata = Standart Sapma / √n = 15,66 / √10 ≈ 4,95
Kısa Sonuç Tablosu
Ölçü | Değer |
Minimum | 40 |
Maksimum | 90 |
Ranj | 50 |
1. Çeyrek (Q1) | 52,5 |
Ortanca (Q2) | 70 |
3. Çeyrek (Q3) | 75 |
Ortalama | 67,5 |
Standart Sapma | 15,66 |
Varyans | 245,14 |
Standart Hata | 4,95 |
Kısa Yorum
Bu örnekte, öğrencilerin sınav puanları oldukça geniş bir aralıkta dağılmıştır (ranj: 50). Ortalama puan 67,5; ortanca ve mod ise 70’tir. Standart sapmanın yüksek olması, bazı öğrencilerin puanlarının ortalamadan uzaklaştığını gösterir. Çeyrekler ve diğer dağılım ölçüleri, verinin yapısı hakkında daha ayrıntılı bilgi sunar.
Comentarios