top of page

G*Power Uygulamalı Çalışma ve Yorumlama: Wilcoxon–Mann–Whitney Testi

Wilcoxon–Mann–Whitney (WMW) testi, iki bağımsız grubun medyan veya dağılımlarını karşılaştırmak için kullanılan parametrik olmayan bir yöntemdir. Normal dağılım varsayımı gerektirmediği için özellikle verilerin dağılımı hakkında belirsizlik olduğunda tercih edilir.


Bu test, iki grup arasındaki sıralama farklılıklarını temel alır ve özellikle deneysel çalışmalar, klinik araştırmalar veya psikometrik ölçümlerde sıklıkla uygulanır.


Teorik Çerçeve

WMW testinin temel mantığı, iki bağımsız grubun verilerini bir araya getirip sıralamak ve ardından her grubun sıra toplamlarını karşılaştırmaktır. Eğer gruplar arasındaki fark yalnızca tesadüfîyse, sıra toplamları benzer olacaktır. Eğer bir etki varsa, sıra toplamlarında belirgin bir kayma görülür.


Bu test, shift model adı verilen bir yaklaşım üzerine kuruludur. Bu modele göre, tedavi grubu (G) kontrol grubuna (F) göre belirli bir miktar (Δ) kadar kaymış kabul edilir. Kayma ne kadar büyükse, iki grup arasındaki dağılım farkı da o kadar artar.


G*Power, bu test için iki farklı güç analizi yöntemi sunar:

  • A.R.E. (Asymptotic Relative Efficiency) yöntemi: Testin gücünü t-testine göre ölçeklendirir.

  • Lehmann yöntemi: Direkt olarak sıralama momentleri üzerinden test gücünü hesaplar.


Yaygın Parametreler ve İpuçları

Aşağıdaki parametrelerden yola çıkarak:

  • Parent Distribution (Ana dağılım): Laplace veya Logistic gibi önceden tanımlı bir dağılım seçilebilir.

  • Örneklem büyüklükleri (N1 ve N2): Kontrol ve deney gruplarındaki katılımcı sayıları girilir.

  • Etki büyüklüğü d veya Moment p1: Grup ortalamaları ve standart sapma üzerinden hesaplanan veya doğrudan girilen etki büyüklüğü.

  • Tail(s): İki yönlü (Two) ya da tek yönlü (One) seçimi yapılır.

  • Anlamlılık düzeyi α ve Güç (1-β): Testin hedeflenen hata düzeyi ve gücü belirtilir.


G*Power çıktısında kritik z değeri, actual power (gerçekleşen güç), moment p1 ve p2 değerleri yer alır. Bunlar testin etkisini ve örneklem büyüklüğünün yeterliliğini gösterir.


Bu test, küçük örneklemlerde bile etkili çalışır ve normal dağılıma duyarlı olmadığından güçlü bir alternatiftir. Örneklem büyüklükleri dengelendiğinde (örneğin N1 = N2), testin gücü artar ve toplam örneklem ihtiyacı azalır. Bu durum özellikle klinik veya saha araştırmalarında kaynak tasarrufu sağlar.


Ayrıca kullanılan ana dağılımın (Normal, Laplace, Logistic) seçimi güç tahminlerini etkiler. Örneğin Laplace veya Logistic gibi daha “kurtosis”i yüksek dağılımlar, güç analizi çıktılarında farklılık yaratabilir. Bu yüzden seçilen dağılım, çalışmanın veri yapısına uygun olmalıdır.


Uygulamalı Çalışma 1: Laplace Dağılımı ve d=0.375

Girdi Parametreleri

  • Analiz türü: Post hoc

  • Parent distribution: Laplace

  • Tail(s): Two

  • Etki büyüklüğü (d): 0.375

  • α err prob: 0.05

  • N1=67, N2=134

  • Lehmann yöntemi, continuity correction

Laplace Dağılımı ve d=0.375 g power uygulamalı çalışma giriş parametreleri

Çıktı Parametreleri

  • Noncentrality parameter δ: 3.0695073

  • Critical t: 1.9679163

  • Df (degrees of freedom): 299.5

  • Power (1-β): 0.8642658

Laplace Dağılımı ve d=0.375 g power uygulamalı çalışma çıktı parametreleri

Yorum: Bu sonuçlar, Laplace dağılımı varsayımı altında ve d=0.375 etki büyüklüğüyle yapılan post hoc analizde %86,4 güç elde edildiğini gösteriyor. Bu güç, orijinal örneklem (67 ve 134 kişi) ve belirlenen etki büyüklüğü ile çalışmanın hedeflediği anlamlılık düzeyinde farkı saptama olasılığının oldukça yüksek olduğunu ifade eder.

  • Noncentrality parameter (δ=3.07): Etki büyüklüğünü ve örneklem büyüklüğünü birleştiren bir parametredir. δ büyüdükçe gücün artması beklenir.

  • Critical t (1.9679): Bu değer, α=0.05 iki yönlü test için kritik t-değerini gösterir. Test istatistiği bu değerin ötesine geçtiğinde H0 reddedilir.

  • Df (299.5): Serbestlik derecesi iki grubun toplamına göre hesaplanır. Bu değer örneklem büyüklüğünün etkisini yansıtır.


Sonuç: Bu senaryoda, seçilen parametrelerle Wilcoxon–Mann–Whitney testi, güçlü bir istatistiksel performans sergilemiştir. Logistic veya farklı dağılımlar altında gücün nasıl değiştiğini görmek için benzer bir şekilde karşılaştırmalı analiz yapılabilir.


Uygulamalı Çalışma 2: Logistic Dağılım ve Moment p1=0.6

Girdi Parametreleri

  • Analiz türü: Post hoc

  • Parent distribution: Logistic

  • Tail(s): One

  • Relative SD: 1.15

  • Moment p1: 0.6

  • α err prob: 0.05

  • N1=67, N2=134

Logistic Dağılım ve Moment p1=0.6 g power uygulamalı analiz giriş parametreleri

Çıktılar

  • Critical z: 1.6448536

  • Actual power (1-β): 0.6461276

  • Effect size d: 0.2911838

  • Moment p2: 0.4251206

Logistic Dağılım ve Moment p1=0.6 g power uygulamalı analiz çıkış parametreleri

Yorum: Logistic dağılım ve p1 girişi ile elde edilen güç değeri %64,6’dır. Bu, Laplace senaryosuna göre daha düşük bir güce işaret eder. Logistic dağılım, verilerin daha farklı bir şekilde sıralandığı senaryolar için uygundur ancak bu örnek parametrelerle güç kaybı gözlenmiştir. Moment p2 değeri, tahmini dağılımın simetrisini Logistic yapıya göre yansıtır.


3. Uygulamalı Çalışma 3: Laplace Dağılım ve d=0.2911838

Girdi Parametreleri

  • Analiz türü: Post hoc

  • Parent distribution: Laplace

  • Tail(s): One

  • Relative SD: 1.15

  • Etki büyüklüğü (d): 0.2911838

  • α err prob: 0.05

  • N1=67, N2=134

3. Uygulamalı Çalışma 3 Laplace Dağılım ve d=0.2911838 g power giriş parametreleri

G*Power Çıktıları

  • Critical z: 1.6448536

  • Power (1–β err prob): 0.9977505

  • Effect size d (raporlanan): 0.5648342

  • Moment p2: 0.5410332

3. Uygulamalı Çalışma 3 Laplace Dağılım ve d=0.2911838 g power çıkış parametreleri

Yorum:

  • Güç değeri %99,8 düzeyinde; bu, tek yönlü test kurulumunda seçilen parametrelerle farkı saptama olasılığının pratikte neredeyse kesin olduğu anlamına gelir.

  • Critical z değeri 1.6448536, tek yönlü test kurulumuna uygun bir eşik değeridir.

  • Çıktıda görünen Effect size d = 0.5648, programın iç hesapta raporladığı etki büyüklüğüdür; bu değer, seçili yöntem ve dağılım ayarları altında etkinin fiilî büyüklüğünü G*Power’ın yeniden ifade edişidir ve yüksek gücü açıklamaktadır.

  • Moment p2 = 0.5410, sıralama momentlerine dayalı yaklaşımda beklenen yapıyı yansıtır ve Laplace varsayımıyla tutarlıdır.


Kısa Değerlendirme

Bu güncel senaryoda güç çok yüksektir. Pratik açıdan:

  • Hedef güç eşiğiniz daha düşükse örneklem sayısı azaltılarak daha verimli bir tasarıma geçilebilir.

  • Aynı örneklemle iki yönlü teste geçildiğinde güç düşer; tek/çift yön seçiminin etkisini göz önünde bulundurmak gerekir.

  • Dağılım seçimi (Laplace) bu verilerde avantaj sağlamaktadır; Logistic seçimi altında daha düşük güç elde edildiğini önceki çalışmalarda gördük.


Karşılaştırmalı Değerlendirme

Aşağıdaki özet, üç uygulamalı çalışmanın güncel G*Power çıktıları üzerinden hazırlanmıştır.

Senaryo

Parent distribution

Giriş tipi

Test yönü

N1/N2

Diğer ayarlar

Kritik değer

Güç (1–β)

Not

1

Laplace, d=0.375

d

Two

67 / 134

Lehmann, continuity correction

Critical t=1.9679, δ=3.0695, df=299.5

0.8643

İki yönlü testle yüksek güç

2

Logistic, p1=0.6

Moment p1

One

67 / 134

Relative SD=1.15

Critical z=1.6449

0.6461

Tek yönlü; güç daha düşük

3

Laplace, d=0.2911838

d

One

67 / 134

Relative SD=1.15

Critical z=1.6449, rap. d=0.5648

0.9978

Tek yönlü; çok yüksek güç

Güncel yorumlar

  • Senaryo 1 (Laplace, d=0.375, two-tailed): %86,4 güç elde edildi. δ ve df değerleri örneklem büyüklüğü ile etkinin birlikte güçlü olduğunu gösteriyor. İki yönlü kuruluma rağmen farkı yakalama olasılığı yüksektir.

  • Senaryo 2 (Logistic, p1=0.6, one-tailed): %64,6 güç elde edildi. Aynı örneklemde dağılım seçimi ve p1 tabanlı etki tanımı gücü aşağı çekti. Bu yapı, çalışmanın sınırda bir duyarlılığa sahip olduğunu gösterir.

  • Senaryo 3 (Laplace, d=0.2911838, one-tailed): %99,8 güç ile farkı saptama olasılığı pratikte neredeyse kesindir. Raportlanan d’nin yükselmesi, tek yönlü kurulum ve Laplace varsayımı birlikte gücü maksimize etmiştir.


Sonuçların bütüncül karşılaştırması

  • Dağılım etkisi: Laplace varsayımı, aynı örneklem altında Logistic’e kıyasla daha yüksek güç verdi (Senaryo 1 ve 3 > Senaryo 2).

  • Test yönü: Tek yönlü kurulum gücü belirgin biçimde artırdı (Senaryo 3’ün gücü ≫ Senaryo 1).

  • Etki tanımı: p1 tabanlı Logistic senaryo, aynı örneklemde d tabanlı Laplace senaryolarına göre daha düşük güç üretti.

  • Tasarım önerisi: Hedef güç daha düşükse Senaryo 3 koşullarında örneklem azaltılabilir; iki yönlü hipotez gerekiyorsa Senaryo 1’de gücü artırmak için örneklem büyütmek veya etkiyi daha netleştirecek ölçüm stratejileri düşünülmelidir.

Yorumlar


bottom of page