Friedman Testi & Post‑Hoc Wilcoxon İşaretli Sıralar Testi | Tekrarlayan Ölçümler İçin Non‑Parametrik Yaklaşımın Teorik Temelleri
- Nominal Analiz
- 27 Tem
- 3 dakikada okunur
Sosyal bilimler, tıp ve davranış araştırmalarında aynı grubun birden fazla ölçümünün karşılaştırılması sık rastlanan bir durumdur.
Parametrik varsayımlar (özellikle normallik ve sferisite) sağlanmadığında, Tekrarlayan Ölçümler için Tek Yönlü Varyans Analizi yerine Friedman testi tercih edilir.
Friedman, her gözlemi sıra değerine dönüştürerek varyans analizinin mantığını korur; böylece dağılım şekline duyarlı olmaz.
Test, ölçüm düzeyleri arasında genel bir sıra ortalaması farkı olup olmadığını sınar.

Parametrik ↔ Non‑Parametrik Karşılaştırma
Özellik | Parametrik (Tekrarlayan ÖÇ ANOVA) | Non‑Parametrik (Friedman) |
Veri ölçeği | En az aralık | En az sıralama |
Varsayımlar | Normallik, sferisite | Sıra dönüşümü ile çoğu varsayım ortadan kalkar |
Merkez ölçüsü | Ortalama | Sıra ortalaması |
Dağılım | F dağılımı | Yaklaşık χ² (büyük n) |
Friedman Testi: Teorik Mekanizma
1 Sıra Dönüşümü
Her denek içindeki k ölçüm, en küçük = 1 olacak şekilde sıraya dizilir.
Eşit durumlarda ortalama sıra verilerek bağ durumunun (ties) etkisi azaltılır.
2 Test İstatistiği

Rj: j. ölçümün sıra toplamı
N: denek sayısı
Serbestlik derecesi: k−1
Büyük örneklemlerde Q değeri ki‑kare dağılımına yaklaşır.
3 Varsayımlar
Bağlantılı örneklem: Ölçümler aynı bireylerden.
Ölçek: Bağımlı değişken en az ordinal.
Rastgelelik: Örneklem seçimi rastgele/temsil edici.
4 Hipotezler
H0: Ölçüm sıra ortalamaları eşittir.
H1: En az iki ölçümün sıra ortalaması farklıdır.
5 Etki Büyüklüğü – Kendall’s W

0 ≤ W ≤ 1 (0: hiç uyum yok, 1: tam uyum)
Yorum ‒ 0,00–0,20: çok zayıf, 0,21–0,40: zayıf, 0,41–0,60: orta, 0,61–0,80: güçlü, 0,81–1,00: çok güçlü.
Neden Post‑Hoc Analiz?
Friedman testi “fark var mı?” sorusuna toplu yanıt verir. “Hangi ölçümler farklı?” sorusunu cevaplamak için çiftli karşılaştırmalara ihtiyaç duyulur. Burada en yaygın yöntem Wilcoxon İşaretli Sıralar Testi (WİST)’dir.
Wilcoxon İşaretli Sıralar Testi: Teorik Çerçeve
1 Temel İlkeler
Aynı denekten gelen iki ölçüm arasındaki medyan farkını inceler.
Ham farklar sıralanır, işaretlerine (+/–) göre toplanır.
Küçük örneklemlerde Tam T istatistiği, büyük örneklemlerde Z dönüştürmesi kullanılır.
2 Varsayımlar
Bağımlılık: Ölçümlerin aynı bireye ait olması.
Sürekli veya sıralama ölçeği.
Bağımsız gözlem: Denekler arası bağımsızlık.
3 Hipotezler
H0: Medyan fark = 0.
H1: Medyan fark ≠ 0 (çift yönlü) veya > 0 / < 0 (tek yönlü).
4 Etki Büyüklüğü

0,10: küçük, 0,30: orta, 0,50: büyük etki.
Çoklu Karşılaştırmalarda Alfa Kontrolü
Yöntem | Düzeltme Formülü | Güç–Koruma Dengesi |
Bonferroni | αadj=α/m | Basit, korumacı; güç düşer |
Holm | Artan p‑değer sıralaması | Daha güçlü, yine güvenli |
Dunn | Sıra toplamı farklarına z‑skor | Non‑parametrik veri için özgün |
Benjamini–Hochberg | FDR kontrolü | Keşifsel analizlerde güç korur |
m = karşılaştırma sayısı.
Tasarım, Güç ve Örneklem Büyüklüğü
Sıra‑tabanlı testler, parametrik muadillerine göre daha az istatistiksel güçe sahiptir; bu nedenle daha büyük örneklem gerekebilir.
G*Power veya Monte Carlo simülasyonları ile minimum N kestirilebilir.
Bağlılık düzeyi (ölçümlerin korelasyonu) güç hesaplarında kritik rol oynar.
Teorik Yorumlama İlkeleri
Önce genel fark (Friedman), sonra ikili farklar (WİST).
Etki büyüklüğü raporlanmadan bulgunun pratik önemi anlaşılamaz.
Çoklu test düzeltmesi yapılmazsa yanlış‑pozitif sonuç riski artar.
Medyan yerine sıra ortalaması vurgulanmalı; aksi kuramsal hata doğurur.
Sık Yapılan Kuramsal Hatalar
Friedman sonucunu medyan farkıymış gibi yorumlamak.
WİST’i bağımsız örnekler için kullanmak.
Bonferroni’yi atlayıp tip I hata oranını şişirmek.
Veri ölçeğini (ordinal vs. aralık) göz ardı etmek.
Bağ (tie) düzeltmelerini hesaba katmadan etki büyüklüğü hesaplamak.

Alternatif Kuramsal Yaklaşımlar
Aligned Rank Transform (ART): Interaksiyon içeren faktöriyel modeller.
Friedman Aligned Ranks: Ana etki için hassasiyet artışı.
Beyazyen hiyerarşik modeller: Küçük örneklem ve ön‑bilgi kullanımı.
Permutation (randomization) testleri: Dağılım varsayımı gerektirmez.
Friedman testi, tekrarlayan ölçümlerde parametrik varsayımları aşan araştırmacılar için güvenilir bir genel fark tarayıcısıdır. Post‑hoc Wilcoxon testleri ile desteklendiğinde, hangi zaman noktasının değişime öncülük ettiğini ortaya koyar.
Etki büyüklüğü ve alfa düzeltmeleri entegre edildiğinde sonuçlar yalnızca istatistiksel değil, pratik açıdan da anlam kazanır. Araştırmacılar, tasarım aşamasında örneklem büyüklüğü ve bağlılık yapısını öngörerek bu güçlü non‑parametrik ikiliyi daha da etkili hâle getirebilir.
Yorumlar