top of page

Nicel Verilerin Özetlenmesi: Merkezi Eğilim ve Yayılım Ölçüleriyle Anlamlı Sonuçlar Elde Etmek - Örnek Veri Setiyle Detaylı Anlatım

Veri analizi sürecinde karşılaştığımız en temel soru şudur: “Bu sayısal veriler bize ne söylüyor?” Araştırmalarımızda topladığımız yaş, boy, gelir, sınav puanı gibi nicel (sayısal) veriler, çoğu zaman yüzlerce hatta binlerce rakamdan oluşan uzun listeler halindedir. Tüm bu sayısal değerlerin anlamlı bir bütün oluşturabilmesi için onları özetlememiz gerekir. İşte burada merkezi eğilim ölçüleri ve yayılım (dağılım) ölçüleri devreye girer.

merkezi eğilim ölçüleri 2

Merkezi Eğilim Ölçüleri: Verilerin Merkezinde Ne Var?

Nicel verilerin ilk özetleme adımı, veri setinin “merkezini” bulmaktır. Bu amaçla kullanılan en önemli ölçüler şunlardır:

  • Aritmetik Ortalama (Mean): Tüm gözlem değerleri toplanıp gözlem sayısına bölünerek bulunur. En çok bilinen ve kullanılan merkezi eğilim ölçüsüdür. Özellikle normal dağılıma sahip verilerde kullanılması uygundur.

    • Formül: Ortalama = (X₁ + X₂ + … + Xn) / n

  • Ortanca (Medyan): Veriler küçükten büyüğe sıralanır ve ortada kalan değer ortancadır. Eğer veri sayısı çiftse, ortadaki iki değerin aritmetik ortalaması alınır. Uç değerlerin (aykırı değerlerin) etkisinin fazla olduğu durumlarda ortanca, merkezi daha doğru gösterir.

  • Mod (Tepe Değer): Veri setinde en sık tekrar eden değerdir. Özellikle çoklu tepe değerlerin (modların) olabildiği durumlarda, veri dağılımının farklı özellikleri hakkında fikir verir.


Merkezi Eğilim Ölçüleri Örneği

Örnek Veri Seti:

Bir grup öğrencinin sınav puanları (100 üzerinden):

Kişi

Puan

1

50

2

70

3

85

4

55

5

65

6

90

7

70

8

40

9

80

10

70

Aritmetik Ortalama (Mean) Hesaplama:

  • Adım 1: Tüm puanları topla: 50 + 70 + 85 + 55 + 65 + 90 + 70 + 40 + 80 + 70 = 675

  • Adım 2: Gözlem sayısına böl: 675 / 10 = 67,5

Aritmetik Ortalama: 67,5


Ortanca (Medyan) Hesaplama:

  • Adım 1: Puanları küçükten büyüğe sırala: 40, 50, 55, 65, 70, 70, 70, 80, 85, 90

  • Adım 2: Gözlem sayısı çift (10 kişi), ortadaki iki değeri bul: 5. değer: 706. değer: 70

  • Adım 3: Ortadaki iki değerin ortalaması: (70 + 70) / 2 = 70

Ortanca (Medyan): 70


Mod (Tepe Değer) Hesaplama:

  • Hangi değer en çok tekrar ediyor?

  • 70 puanı 3 kez tekrar ediyor (diğerleri 1 kez).

Mod (Tepe Değer): 70


Kısa Tabloyla Sonuçlar

Ölçü

Değer

Yorum

Aritmetik Ortalama

67,5

Ortalama başarı düzeyi

Ortanca (Medyan)

70

Merkezdeki tipik değer, uç değerlerden etkilenmez

Mod (Tepe Değer)

70

En sık görülen başarı puanı

Yayılım (Dağılım) Ölçüleri: Veriler Ne Kadar Dağılmış?

Verilerin sadece merkezini bilmek çoğu zaman yeterli olmaz; verilerin bu merkezin etrafında nasıl dağıldığını da anlamamız gerekir. Bu amaçla kullanılan başlıca yayılım ölçüleri şunlardır:

  • Standart Sapma (Std. Deviation): Her bir gözlemin aritmetik ortalamadan sapmalarının karelerinin ortalamasının kareköküdür. Standart sapma büyüdükçe, veriler merkezin etrafında daha geniş dağılmıştır anlamına gelir.

  • Varyans: Standart sapmanın karesidir. Verilerin ortalamadan ne kadar saptığını gösterir.

  • Minimum ve Maksimum Değerler: Veri setindeki en küçük ve en büyük değerlerdir.

  • Ranj (Değişim Aralığı):Maksimum ve minimum değerler arasındaki farktır. Kaba bir yayılım ölçüsüdür.

  • Çeyrek Değerler (Quartiles): Veri setinin %25’i, %50’si (ortanca) ve %75’inin altında kalan değerlere bakılır.

    • 1. Çeyrek (Q1): %25’in altında kalan değer

    • Ortanca (Q2): %50’nin altında kalan değer

    • 3. Çeyrek (Q3): %75’in altında kalan değer

  • Standart Hata: Ortalama değerin güvenilirliği hakkında bilgi verir; standart sapmanın, gözlem sayısının kareköküne bölünmesiyle hesaplanır.


Dağılım Özelliğine Göre Özetleme Seçimi

  • Normal Dağılım Gösteren Veriler: Ortalama, standart sapma, minimum ve maksimum değerleriyle özetlenir.

  • Normal Dağılım Göstermeyen Veriler: Ortanca, 1. ve 3. çeyrek, minimum ve maksimum ile özetleme daha uygundur.


Yayılım (Dağılım) Ölçüleri Örneği

Örnek Veri Seti:

Bir grup öğrencinin sınav puanları (10 kişi):

Kişi

Puan

1

40

2

50

3

55

4

65

5

70

6

70

7

70

8

80

9

85

10

90

1. Minimum ve Maksimum Değerler

  • Minimum: 40

  • Maksimum: 90


2. Ranj (Değişim Aralığı)

  • Ranj = Maksimum - Minimum = 90 - 40 = 50


3. Çeyrek Değerler (Quartiles)

Veriler küçükten büyüğe dizili: 40, 50, 55, 65, 70, 70, 70, 80, 85, 90

  • Q1 (1. Çeyrek, %25): 10 kişi × 0,25 = 2,5 → 3. kişi ile 2. kişi arası (50 + 55) / 2 = 52,5

  • Q2 (Ortanca, %50): 10 kişi × 0,50 = 55. ve 6. kişi (70 ve 70): (70 + 70) / 2 = 70

  • Q3 (3. Çeyrek, %75):10 kişi × 0,75 = 7,5 → 7. ve 8. kişi arası (70 + 80) / 2 = 75


4. Standart Sapma ve Varyans

Önce aritmetik ortalamayı bul:

  • Toplam: 40 + 50 + 55 + 65 + 70 + 70 + 70 + 80 + 85 + 90 = 675

  • Ortalama: 675 / 10 = 67,5


Her değerin ortalamadan farkının karesini hesapla ve topla:

  • (40 - 67,5)² = 756,25

  • (50 - 67,5)² = 306,25

  • (55 - 67,5)² = 156,25

  • (65 - 67,5)² = 6,25

  • (70 - 67,5)² = 6,25

  • (70 - 67,5)² = 6,25

  • (70 - 67,5)² = 6,25

  • (80 - 67,5)² = 156,25

  • (85 - 67,5)² = 306,25

  • (90 - 67,5)² = 506,25

Toplam: 2206,25

  • Varyans (n-1): 2206,25 / 9 = 245,14

  • Standart Sapma: √245,14 ≈ 15,66


5. Standart Hata

  • Standart Hata = Standart Sapma / √n = 15,66 / √10 ≈ 4,95


Kısa Sonuç Tablosu

Ölçü

Değer

Minimum

40

Maksimum

90

Ranj

50

1. Çeyrek (Q1)

52,5

Ortanca (Q2)

70

3. Çeyrek (Q3)

75

Ortalama

67,5

Standart Sapma

15,66

Varyans

245,14

Standart Hata

4,95

Kısa Yorum

Bu örnekte, öğrencilerin sınav puanları oldukça geniş bir aralıkta dağılmıştır (ranj: 50). Ortalama puan 67,5; ortanca ve mod ise 70’tir. Standart sapmanın yüksek olması, bazı öğrencilerin puanlarının ortalamadan uzaklaştığını gösterir. Çeyrekler ve diğer dağılım ölçüleri, verinin yapısı hakkında daha ayrıntılı bilgi sunar.

Comentarios


bottom of page