G*Power Uygulamalı Çalışma ve Yorumlama: Wilcoxon–Mann–Whitney Testi
- Nominal Analiz
- 23 Eyl
- 4 dakikada okunur
Wilcoxon–Mann–Whitney (WMW) testi, iki bağımsız grubun medyan veya dağılımlarını karşılaştırmak için kullanılan parametrik olmayan bir yöntemdir. Normal dağılım varsayımı gerektirmediği için özellikle verilerin dağılımı hakkında belirsizlik olduğunda tercih edilir.
Bu test, iki grup arasındaki sıralama farklılıklarını temel alır ve özellikle deneysel çalışmalar, klinik araştırmalar veya psikometrik ölçümlerde sıklıkla uygulanır.
Teorik Çerçeve
WMW testinin temel mantığı, iki bağımsız grubun verilerini bir araya getirip sıralamak ve ardından her grubun sıra toplamlarını karşılaştırmaktır. Eğer gruplar arasındaki fark yalnızca tesadüfîyse, sıra toplamları benzer olacaktır. Eğer bir etki varsa, sıra toplamlarında belirgin bir kayma görülür.
Bu test, shift model adı verilen bir yaklaşım üzerine kuruludur. Bu modele göre, tedavi grubu (G) kontrol grubuna (F) göre belirli bir miktar (Δ) kadar kaymış kabul edilir. Kayma ne kadar büyükse, iki grup arasındaki dağılım farkı da o kadar artar.
G*Power, bu test için iki farklı güç analizi yöntemi sunar:
A.R.E. (Asymptotic Relative Efficiency) yöntemi: Testin gücünü t-testine göre ölçeklendirir.
Lehmann yöntemi: Direkt olarak sıralama momentleri üzerinden test gücünü hesaplar.
Yaygın Parametreler ve İpuçları
Aşağıdaki parametrelerden yola çıkarak:
Parent Distribution (Ana dağılım): Laplace veya Logistic gibi önceden tanımlı bir dağılım seçilebilir.
Örneklem büyüklükleri (N1 ve N2): Kontrol ve deney gruplarındaki katılımcı sayıları girilir.
Etki büyüklüğü d veya Moment p1: Grup ortalamaları ve standart sapma üzerinden hesaplanan veya doğrudan girilen etki büyüklüğü.
Tail(s): İki yönlü (Two) ya da tek yönlü (One) seçimi yapılır.
Anlamlılık düzeyi α ve Güç (1-β): Testin hedeflenen hata düzeyi ve gücü belirtilir.
G*Power çıktısında kritik z değeri, actual power (gerçekleşen güç), moment p1 ve p2 değerleri yer alır. Bunlar testin etkisini ve örneklem büyüklüğünün yeterliliğini gösterir.
Bu test, küçük örneklemlerde bile etkili çalışır ve normal dağılıma duyarlı olmadığından güçlü bir alternatiftir. Örneklem büyüklükleri dengelendiğinde (örneğin N1 = N2), testin gücü artar ve toplam örneklem ihtiyacı azalır. Bu durum özellikle klinik veya saha araştırmalarında kaynak tasarrufu sağlar.
Ayrıca kullanılan ana dağılımın (Normal, Laplace, Logistic) seçimi güç tahminlerini etkiler. Örneğin Laplace veya Logistic gibi daha “kurtosis”i yüksek dağılımlar, güç analizi çıktılarında farklılık yaratabilir. Bu yüzden seçilen dağılım, çalışmanın veri yapısına uygun olmalıdır.
Uygulamalı Çalışma 1: Laplace Dağılımı ve d=0.375
Girdi Parametreleri
Analiz türü: Post hoc
Parent distribution: Laplace
Tail(s): Two
Etki büyüklüğü (d): 0.375
α err prob: 0.05
N1=67, N2=134
Lehmann yöntemi, continuity correction

Çıktı Parametreleri
Noncentrality parameter δ: 3.0695073
Critical t: 1.9679163
Df (degrees of freedom): 299.5
Power (1-β): 0.8642658

Yorum: Bu sonuçlar, Laplace dağılımı varsayımı altında ve d=0.375 etki büyüklüğüyle yapılan post hoc analizde %86,4 güç elde edildiğini gösteriyor. Bu güç, orijinal örneklem (67 ve 134 kişi) ve belirlenen etki büyüklüğü ile çalışmanın hedeflediği anlamlılık düzeyinde farkı saptama olasılığının oldukça yüksek olduğunu ifade eder.
Noncentrality parameter (δ=3.07): Etki büyüklüğünü ve örneklem büyüklüğünü birleştiren bir parametredir. δ büyüdükçe gücün artması beklenir.
Critical t (1.9679): Bu değer, α=0.05 iki yönlü test için kritik t-değerini gösterir. Test istatistiği bu değerin ötesine geçtiğinde H0 reddedilir.
Df (299.5): Serbestlik derecesi iki grubun toplamına göre hesaplanır. Bu değer örneklem büyüklüğünün etkisini yansıtır.
Sonuç: Bu senaryoda, seçilen parametrelerle Wilcoxon–Mann–Whitney testi, güçlü bir istatistiksel performans sergilemiştir. Logistic veya farklı dağılımlar altında gücün nasıl değiştiğini görmek için benzer bir şekilde karşılaştırmalı analiz yapılabilir.
Uygulamalı Çalışma 2: Logistic Dağılım ve Moment p1=0.6
Girdi Parametreleri
Analiz türü: Post hoc
Parent distribution: Logistic
Tail(s): One
Relative SD: 1.15
Moment p1: 0.6
α err prob: 0.05
N1=67, N2=134

Çıktılar
Critical z: 1.6448536
Actual power (1-β): 0.6461276
Effect size d: 0.2911838
Moment p2: 0.4251206

Yorum: Logistic dağılım ve p1 girişi ile elde edilen güç değeri %64,6’dır. Bu, Laplace senaryosuna göre daha düşük bir güce işaret eder. Logistic dağılım, verilerin daha farklı bir şekilde sıralandığı senaryolar için uygundur ancak bu örnek parametrelerle güç kaybı gözlenmiştir. Moment p2 değeri, tahmini dağılımın simetrisini Logistic yapıya göre yansıtır.
3. Uygulamalı Çalışma 3: Laplace Dağılım ve d=0.2911838
Girdi Parametreleri
Analiz türü: Post hoc
Parent distribution: Laplace
Tail(s): One
Relative SD: 1.15
Etki büyüklüğü (d): 0.2911838
α err prob: 0.05
N1=67, N2=134

G*Power Çıktıları
Critical z: 1.6448536
Power (1–β err prob): 0.9977505
Effect size d (raporlanan): 0.5648342
Moment p2: 0.5410332

Yorum:
Güç değeri %99,8 düzeyinde; bu, tek yönlü test kurulumunda seçilen parametrelerle farkı saptama olasılığının pratikte neredeyse kesin olduğu anlamına gelir.
Critical z değeri 1.6448536, tek yönlü test kurulumuna uygun bir eşik değeridir.
Çıktıda görünen Effect size d = 0.5648, programın iç hesapta raporladığı etki büyüklüğüdür; bu değer, seçili yöntem ve dağılım ayarları altında etkinin fiilî büyüklüğünü G*Power’ın yeniden ifade edişidir ve yüksek gücü açıklamaktadır.
Moment p2 = 0.5410, sıralama momentlerine dayalı yaklaşımda beklenen yapıyı yansıtır ve Laplace varsayımıyla tutarlıdır.
Kısa Değerlendirme
Bu güncel senaryoda güç çok yüksektir. Pratik açıdan:
Hedef güç eşiğiniz daha düşükse örneklem sayısı azaltılarak daha verimli bir tasarıma geçilebilir.
Aynı örneklemle iki yönlü teste geçildiğinde güç düşer; tek/çift yön seçiminin etkisini göz önünde bulundurmak gerekir.
Dağılım seçimi (Laplace) bu verilerde avantaj sağlamaktadır; Logistic seçimi altında daha düşük güç elde edildiğini önceki çalışmalarda gördük.
Karşılaştırmalı Değerlendirme
Aşağıdaki özet, üç uygulamalı çalışmanın güncel G*Power çıktıları üzerinden hazırlanmıştır.
Senaryo | Parent distribution | Giriş tipi | Test yönü | N1/N2 | Diğer ayarlar | Kritik değer | Güç (1–β) | Not |
1 | Laplace, d=0.375 | d | Two | 67 / 134 | Lehmann, continuity correction | Critical t=1.9679, δ=3.0695, df=299.5 | 0.8643 | İki yönlü testle yüksek güç |
2 | Logistic, p1=0.6 | Moment p1 | One | 67 / 134 | Relative SD=1.15 | Critical z=1.6449 | 0.6461 | Tek yönlü; güç daha düşük |
3 | Laplace, d=0.2911838 | d | One | 67 / 134 | Relative SD=1.15 | Critical z=1.6449, rap. d=0.5648 | 0.9978 | Tek yönlü; çok yüksek güç |
Güncel yorumlar
Senaryo 1 (Laplace, d=0.375, two-tailed): %86,4 güç elde edildi. δ ve df değerleri örneklem büyüklüğü ile etkinin birlikte güçlü olduğunu gösteriyor. İki yönlü kuruluma rağmen farkı yakalama olasılığı yüksektir.
Senaryo 2 (Logistic, p1=0.6, one-tailed): %64,6 güç elde edildi. Aynı örneklemde dağılım seçimi ve p1 tabanlı etki tanımı gücü aşağı çekti. Bu yapı, çalışmanın sınırda bir duyarlılığa sahip olduğunu gösterir.
Senaryo 3 (Laplace, d=0.2911838, one-tailed): %99,8 güç ile farkı saptama olasılığı pratikte neredeyse kesindir. Raportlanan d’nin yükselmesi, tek yönlü kurulum ve Laplace varsayımı birlikte gücü maksimize etmiştir.
Sonuçların bütüncül karşılaştırması
Dağılım etkisi: Laplace varsayımı, aynı örneklem altında Logistic’e kıyasla daha yüksek güç verdi (Senaryo 1 ve 3 > Senaryo 2).
Test yönü: Tek yönlü kurulum gücü belirgin biçimde artırdı (Senaryo 3’ün gücü ≫ Senaryo 1).
Etki tanımı: p1 tabanlı Logistic senaryo, aynı örneklemde d tabanlı Laplace senaryolarına göre daha düşük güç üretti.
Tasarım önerisi: Hedef güç daha düşükse Senaryo 3 koşullarında örneklem azaltılabilir; iki yönlü hipotez gerekiyorsa Senaryo 1’de gücü artırmak için örneklem büyütmek veya etkiyi daha netleştirecek ölçüm stratejileri düşünülmelidir.








Yorumlar