Hipotez Testleri, Anlamlılık Düzeyi ve Hata Tipleri
- Nominal Analiz
- 16 Tem
- 3 dakikada okunur
Hipotezin Sınanması ve Alfa (α) Düzeyi
Bilimsel bir araştırmada en temel amaçlardan biri, değişkenler arasında “gerçekte” bir fark veya ilişki olup olmadığını anlamaktır. Araştırmacı, gözlemlediği bir olguyla ilgili bir hipotez (iddaa/denence) ortaya koyar ve bunu veriyle test etmek ister. İstatistikte, hipotezler genellikle şu şekilde düzenlenir:
H0 (Yokluk/Sıfır Hipotezi): “İki grup/olay/özellik arasında fark veya ilişki yoktur.”
H1 (Araştırma/Alternatif Hipotezi): “İki grup/olay/özellik arasında fark veya ilişki vardır.”

Hipotez testlerinde alfa (α) düzeyi, yani anlamlılık düzeyi, araştırmacının kabul edebileceği maksimum hata payıdır. Alfa değeri genellikle 0,05 (veya %5) olarak belirlenir. Bu değer, araştırmacının “yanlışlıkla doğru bir H0 hipotezini reddetmeyi” (Tip I hata) göze aldığı risk oranıdır.
Kritik Bilgi:
Bir testte p değeri < α ise, H0 reddedilir; H1 kabul edilir.
p değeri ≥ α ise, H0 reddedilemez (yani fark/ilişki yoktur sonucu verilir).
P Değeri ve Anlamı
P değeri, gözlenen farkın/ilişkinin tamamen tesadüfi olarak ortaya çıkma olasılığıdır.
Düşük p değeri (ör. p < 0,05): Fark/ilişkinin şansa bağlı olma olasılığı azdır; yani sonuç istatistiksel olarak anlamlıdır.
Yüksek p değeri (ör. p > 0,05): Fark/ilişkinin şansa bağlı olma olasılığı yüksektir; sonuç anlamlı değildir.
Unutma: P değeri kanıtın derecesini gösterir, mutlak doğru/yanlış demek değildir.

Hata Tipleri: Tip I ve Tip II Hata
Tip I Hata (α Hatası):
Tanım: Gerçekte fark/ilişki yok iken, test sonucunda “var” denmesi.
Sebebi: Alfa düzeyiyle ilgilidir. Alfa = 0,05 ise, 100 testin 5’inde yanlışlıkla H0 reddedilebilir.
Tablodaki Yeri: Gerçekte fark/ilişki yok, fakat “fark/ilişki var” kararı verilmişse bu Tip I hatadır (kırmızı kutu).
Tip II Hata (β Hatası):
Tanım: Gerçekte fark/ilişki var iken, test sonucunda “yok” denmesi.
Sebebi: Genellikle küçük örneklem büyüklüğü, düşük test gücü veya yüksek hata payı nedeniyle olur.
Tablodaki Yeri: Gerçekte fark/ilişki var, fakat “fark/ilişki yok” kararı verilmişse bu Tip II hatadır (kırmızı kutu).
Doğru Karar:
Gerçekte fark/ilişki yok ve “yok” kararı verilmişse (doğru negatif).
Gerçekte fark/ilişki var ve “var” kararı verilmişse (doğru pozitif, istatistiksel güç/power).
İstatistiksel Güç (Power) ve Etki
İstatistiksel güç (power): Gerçekte var olan bir farkı/ilişkiyi testin doğru tespit edebilme olasılığıdır.
Yüksek güç (power > %80): Test, gerçekte olan bir farkı/ilişkiyi büyük oranda yakalar (Tip II hata riski azalır).
Düşük güç: Fark/ilişki olsa da, test “yok” diyebilir (Tip II hata riski artar).
Alfa Düzeyi Nasıl Belirlenir?
Sosyal bilimlerde standart alfa: 0,05 (%5).
Daha yüksek güvenlik gerektiren alanlarda: 0,01 (%1) veya daha düşük olabilir.
Not: Alfa düzeyi test öncesinde seçilir ve değiştirilmemelidir!
P Değeri Nasıl Yorumlanır?
p < 0,05: Sonuç anlamlı; H0 reddedilir, H1 kabul edilir.
p > 0,05: Sonuç anlamlı değil; H0 reddedilemez, H1 için yeterli kanıt yok.

Raporlama ve Yorumlama:
Hipotez testlerinde yalnızca “p < 0,05” diyerek karar vermek yeterli değildir! Aşağıdakiler de raporlanmalıdır:
Test istatistiği (ör: t, F, χ² değeri vs.)
p değeri
Etki büyüklüğü (effect size)
%95 güven aralığı
Testin gücü (power) (eğer hesaplanabiliyorsa)

Görseldeki Tabloyu Açıklayalım:
Test Sonucu: Fark/İlişki Yok | Test Sonucu: Fark/İlişki Var | |
Gerçekte Yok | Doğru Karar (yeşil) | Tip I Hata (kırmızı) |
Gerçekte Var | Tip II Hata (kırmızı) | Doğru Karar (Power, yeşil) |
Kırmızı alanlar hataları (yanlış kararları), yeşil alanlar ise doğru kararları simgeler.
Amacımız hata olasılığını azaltmak ve istatistiksel gücü artırmaktır.
Özetle:
Alfa (α) düzeyi, istatistiksel testte kabul edilen hata payıdır (%5 en yaygın).
p değeri, elde edilen farkın şansa bağlı olma olasılığıdır.
Tip I hata, H0 doğru iken yanlışlıkla reddedilmesidir.
Tip II hata, H0 yanlış iken yanlışlıkla kabul edilmesidir.
İstatistiksel güç (power), gerçekte var olan bir farkı doğru yakalama ihtimalidir.
Test sonuçları, yalnızca p değeri ile değil, testin gücü ve etki büyüklüğü gibi kriterlerle birlikte yorumlanmalıdır.
Yorumlar