top of page

Çoklu Doğrusal Regresyonda Örneklem Büyüklüğü & Uç Değerler “Model sağlamlığı verinin gücüyle başlar, temizliğiyle devam eder.”

1. Neden “Yeterli” Örneklem?

Regresyon katsayıları özgürlük derecelerine bağlı hesaplanır. Örneklem küçükse:

  • Katsayıların standart hataları büyür → güven aralıkları genişler.

  • Tahminler gürültüye duyarlı olur → genelleme zayıflar.

Çoklu Doğrusal Regresyonda Örneklem Büyüklüğü Yeterli Örneklem
Güç (1 – β) = 0,80  ve α = 0,05 düzeyleri kabul gören eşi̇klerdir.

2. Çapraz Geçerlilik (Cross‑Validation) Yaklaşımı

2.1 Klasik Formüller

Kaynak

Formül

Örnek (m = 5 X)

Stevens (2009)

n ≥ 15 × m

15 × 5 = 75

Green (1991)

n ≥ 50 + 8 m


veya n ≥ 104 + m

50 + 8 × 5 = 90


104 + 5 = 109

Kural: İki Green formülünden büyük olan seçilir.

2.2 Eleştiriler

Brooks & Barcikowski (2012) ile Knofczynski & Mundfrom (2008) gösterdi ki:

  • R² düşükse (< 0,40) bu formüller yetersiz örneklem önerebilir.

  • Model doğruluğu için R² beklentisi, güç ve X sayısı birlikte ele alınmalıdır.


2.3 Pratik Yol

  1. Beklenen etki büyüklüğü (R²) tahmin edilir.

  2. Güç analizi (G*Power vb.) ile n hesaplanır.

  3. Green‑Stevens çıkışı ≥ güç analizinden küçükse daha büyük örneklem tercih edilir.


3. Uç Değer (Outlier) Tartışması

3.1 Tanım

Z‑skoru |z| > 3 olan gözlemler “aşırı uç” kabul edilir.


3.2 İstatistiksel Etki

  • Standart hatayı büyütür → B katsayıları sapar.

  • R² şişebilir veya düşebilir.


3.3 Etik & Temsiliyet

  • Örneklem tesadüfi seçildiyse uç değer, evrendeki marjinal gerçeği temsil edebilir.

  • Normal dağılım onayı alınmışsa uç değer silmek veri manipülasyonu sayılabilir.

Öneri: Ölçüm/aktarım hatası mı? → Düzelt/çıkar. Gerçek değer mi? → Robust regresyon, Winsorize veya iki model raporla (uçlu & uçsuz).

4. Varsayım Checklist

  • X & Y normal, aralık ölçekli

  • Doğrusallık (Pearson r)

  • Multicollinearity: r < 0,8 ; VIF < 10 ; Tol > 0,20

  • Artık normalliği (ZRESID histogram & P‑P)

  • Homoscedasticity (ZPRED–ZRESID saçılım)

  • Durbin‑Watson 1,5–2,5 (seri bağımlılık yok)


5. SPSS Uygulama Adımları

  1. Analyze → Regression → Linear

  2. Dependent: Y | Independent(s): X₁ X₂ …

  3. Statistics: Estimates, Model fit, R² change, Part/Partial r, Collinearity

  4. Plots: ZRESID (Y) vs ZPRED (X) + Histogram + Normal P‑P

  5. Save: Standardized residuals & predicted (Cook’s D incelemesi)

  6. Run → Çıktıları sırasıyla yorumla (Model Summary, ANOVA, Coefficients).


6. Örnek Yorum Şablonu

Model geçerli (F(5, 103)= 9,42, p<0,001).
Adj.R² = 0,41; X₃ en güçlü yordayıcıdır (β = 0,46, p<0,001).
VIF değerleri 1,2–2,8 aralığında; çoklu ort. doğrusallık sorunu yok.
ZRESID – ZPRED saçılımı rastgele → homoscedasticity sağlanmıştır.
Cook’s D < 0,50 tüm gözlemler için → aykırı etkisi kritik değil.

7. İpuçları

  • Adj.R² küçükse etkileşim terimleri veya yeni X’ler ekleyin.

  • VIF yüksek → X’leri merkezileştir veya çıkart.

  • Örneklem planlarken Green + güç analizi yapın, düşük R² senaryolarını gözden kaçırmayın.

Yorumlar


bottom of page