Çoklu Doğrusal Regresyonda Örneklem Büyüklüğü & Uç Değerler “Model sağlamlığı verinin gücüyle başlar, temizliğiyle devam eder.”
- Nominal Analiz
- 29 Tem
- 2 dakikada okunur
1. Neden “Yeterli” Örneklem?
Regresyon katsayıları özgürlük derecelerine bağlı hesaplanır. Örneklem küçükse:
Katsayıların standart hataları büyür → güven aralıkları genişler.
Tahminler gürültüye duyarlı olur → genelleme zayıflar.

Güç (1 – β) = 0,80 ve α = 0,05 düzeyleri kabul gören eşi̇klerdir.
2. Çapraz Geçerlilik (Cross‑Validation) Yaklaşımı
2.1 Klasik Formüller
Kaynak | Formül | Örnek (m = 5 X) |
Stevens (2009) | n ≥ 15 × m | 15 × 5 = 75 |
Green (1991) | n ≥ 50 + 8 m veya n ≥ 104 + m | 50 + 8 × 5 = 90 104 + 5 = 109 |
Kural: İki Green formülünden büyük olan seçilir.
2.2 Eleştiriler
Brooks & Barcikowski (2012) ile Knofczynski & Mundfrom (2008) gösterdi ki:
R² düşükse (< 0,40) bu formüller yetersiz örneklem önerebilir.
Model doğruluğu için R² beklentisi, güç ve X sayısı birlikte ele alınmalıdır.
2.3 Pratik Yol
Beklenen etki büyüklüğü (R²) tahmin edilir.
Güç analizi (G*Power vb.) ile n hesaplanır.
Green‑Stevens çıkışı ≥ güç analizinden küçükse daha büyük örneklem tercih edilir.
3. Uç Değer (Outlier) Tartışması
3.1 Tanım
Z‑skoru |z| > 3 olan gözlemler “aşırı uç” kabul edilir.
3.2 İstatistiksel Etki
Standart hatayı büyütür → B katsayıları sapar.
R² şişebilir veya düşebilir.
3.3 Etik & Temsiliyet
Örneklem tesadüfi seçildiyse uç değer, evrendeki marjinal gerçeği temsil edebilir.
Normal dağılım onayı alınmışsa uç değer silmek veri manipülasyonu sayılabilir.
Öneri: Ölçüm/aktarım hatası mı? → Düzelt/çıkar. Gerçek değer mi? → Robust regresyon, Winsorize veya iki model raporla (uçlu & uçsuz).
4. Varsayım Checklist
X & Y normal, aralık ölçekli
Doğrusallık (Pearson r)
Multicollinearity: r < 0,8 ; VIF < 10 ; Tol > 0,20
Artık normalliği (ZRESID histogram & P‑P)
Homoscedasticity (ZPRED–ZRESID saçılım)
Durbin‑Watson 1,5–2,5 (seri bağımlılık yok)
5. SPSS Uygulama Adımları
Analyze → Regression → Linear
Dependent: Y | Independent(s): X₁ X₂ …
Statistics: Estimates, Model fit, R² change, Part/Partial r, Collinearity
Plots: ZRESID (Y) vs ZPRED (X) + Histogram + Normal P‑P
Save: Standardized residuals & predicted (Cook’s D incelemesi)
Run → Çıktıları sırasıyla yorumla (Model Summary, ANOVA, Coefficients).
6. Örnek Yorum Şablonu
Model geçerli (F(5, 103)= 9,42, p<0,001).
Adj.R² = 0,41; X₃ en güçlü yordayıcıdır (β = 0,46, p<0,001).
VIF değerleri 1,2–2,8 aralığında; çoklu ort. doğrusallık sorunu yok.
ZRESID – ZPRED saçılımı rastgele → homoscedasticity sağlanmıştır.
Cook’s D < 0,50 tüm gözlemler için → aykırı etkisi kritik değil.
7. İpuçları
Adj.R² küçükse etkileşim terimleri veya yeni X’ler ekleyin.
VIF yüksek → X’leri merkezileştir veya çıkart.
Örneklem planlarken Green + güç analizi yapın, düşük R² senaryolarını gözden kaçırmayın.








Yorumlar