Doğrusal Regresyonda (Linear Regression) Değişken Seçim Yöntemleri, Grafikler, Kayıt Kuralları ve Tanılama İstatistikleri: SPSS Üzerine Kapsamlı Bir Rehber
- Nominal Analiz
- 28 Kas
- 3 dakikada okunur
Doğrusal regresyon analizinde, modelin doğru kurulması kadar, değişkenlerin hangi yöntemle modele dâhil edildiği, hangi diyagnostik grafiklerin değerlendirildiği ve SPSS’in sağladığı ek istatistiklerin doğru yorumlanması da aynı derecede önemlidir.
Bu kapsamlı rehberde, SPSS Linear Regression penceresinde yer alan tüm gelişmiş seçenekleri detaylı olarak açıklıyoruz.
1. Regresyonda Değişken Seçim Yöntemlerinin Mantığı
SPSS, bağımsız değişkenlerin modele alınması için farklı seçim yöntemleri sunar. Bu yöntemler, modelin esnekliğini ve gerçek hayattaki ilişkilere uyum derecesini doğrudan etkiler.

1.1. “Enter” Yöntemi (Tüm Değişkenleri Birlikte Ekleme)
Tüm bağımsız değişkenlerin tek adımda modele dâhil edildiği klasik yöntemdir.
Model tamamen araştırmacının kararına dayanır.
Temel, varsayımsal modeller için uygundur.

1.2. Stepwise (Adım Adım) Yöntemi
Her adımda modele en faydalı değişken girer; faydasını yitiren çıkartılır.
Bağımsız değişken sayısı fazla olduğunda tercih edilir.
Ancak p-değerleri tek bir model için hesaplandığından, anlamlılık değerleri güvenilir değildir.
1.3. Remove (Tüm Değişkenleri Çıkarma)
Bir bloktaki tüm bağımsız değişkenleri tek adımda modelden siler.
1.4. Backward Elimination (Geriye Doğru Eleme)
Tüm değişkenlerle başlar, katkısı en az olanı analizden çıkartarak ilerler.
Modeli sadeleştirmek için idealdir.
1.5. Forward Selection (İleriye Doğru Seçim)
İlk olarak bağımlı değişkenle korelasyonu en yüksek bağımsız değişken seçilir.
Kriteri karşılayan yeni değişkenler eklenerek model büyür.
2. Tolerans (Tolerance) ve Çoklu Bağlantı (Multicollinearity) Koşulu
SPSS, hangi yöntem seçilirse seçilsin:
Toleransı düşük değişkenleri (çoklu bağlantı sorunu olan) modele eklemez.
Varsayılan eşik: 0.0001
Bu eşik altında toleransı olan bir değişken modele girerse, diğer değişkenlerin varyansını bozarak standart hataları şişirir.
3. Kayıt Seçim Kuralları (Set Rule) ile Hangi Vakaların Analize Gireceğini Belirlemek
“Set Rule” bölümü kullanılarak yalnızca belirli ölçütlere sahip kayıtlar analize dâhil edilebilir.
Örneğin:
yas = 50 olan vakalar,
cinsiyet = kadın olanlar,
kan_basinci <= 140 olanlar.
Bu filtre, regresyon analizinin belirli bir alt gruba uygulanmasını sağlar.

4. Doğrusal Regresyonda Grafikler ve Tanı Kriterleri
SPSS; artık değerlerin (residual), tahmin değerlerinin ve etkili gözlemlerin incelenmesi için önemli grafik araçları sunar.
4.1. Standartlaştırılmış Artıklar ile Tahminler Arasındaki Grafi̇k (ZRESID – ZPRED)
Modelin şu varsayımlarını değerlendirir:
Doğrusallık
Değişen varyans (homojenlik)
Hata dağılımının yapısı
Bu grafikte:
Noktalar rastgele dağılmışsa → varsayımlar sağlanıyor.
Huni şeklinde dağılım varsa → değişen varyans sorunu vardır.

4.2. Tüm Kısmi Grafikler (Partial Plots)
Her bağımsız değişkenin bağımlı değişken ile diğer tüm değişkenlerden arındırılmış ilişkisini gösterir.
Yorumlanması son derece güçlüdür.
Ancak en az iki bağımsız değişken olmalıdır.
4.3. Standartlaştırılmış Artıkların Histogramı
Artıkların normal dağılıma uyup uymadığını gösterir.
Normal dağılıma yakınsa → modelin hataları sağlamdır.
4.4. Normal P-P Plot
Artıkların teorik normal dağılımdan sapmalarını gösterir.
Noktalar diagonal çizgi üzerinde ise → normalite sağlanmıştır.
5. Kaydedilebilen Yeni Değişkenler ve Tanısal İstatistikler
SPSS, regresyon sonrasında veri setine birçok yeni değişken ekleyebilir:
5.1. Tahmin Edilen Değerler (Predicted Values)
Unstandardized: Ham tahmin değeri
Standardized: 0 ortalama, 1 SD’ye dönüştürülmüş tahmin
Adjusted: Kayıt dışarıda bırakıldığında tahmin değeri
S.E. of Mean Predictions: Tahmin hatasının standart hatası
5.2. Artıklar (Residuals)
Unstandardized residual: Gerçek – Tahmin
Standardized residual
Studentized residual
Deleted residual
Studentized deleted residual
Özellikle outlier ve etkili gözlem araştırmasında kritik öneme sahiptir.
5.3. Uzaklık Ölçüleri (Distances)
Mahalanobis Distance: Aykırı gözlem saptamada güçlü.
Cook’s Distance: Modelin katsayılarını ne kadar bozduğu.
Leverage Values: Her gözlemin modele etkisi.
5.4. Etki İstatistikleri (Influence Statistics)
DfBeta(s): Bir gözlem çıkarıldığında katsayı değişimi
DfFit: Tahmin değerindeki değişim
Covariance Ratio: Kovaryans matrisinin duyarlılığı
6. Tahmin Aralıkları (Prediction Intervals)
SPSS iki tür tahmin aralığı üretir:
Ortalama Tahmin Aralığı (Mean Prediction Interval)
Belirli bir X değerinde beklenen ortalama Y’nin aralığıdır.
Bireysel Tahmin Aralığı (Individual Prediction Interval)
Tek bir bireyin Y değerinin hangi aralıkta olacağıdır.
Güven düzeyi (Confidence Level): %90, %95, %99 yaygın seçeneklerdir.
7. Regresyon Katsayılarının Kaydedilmesi ve Modelin XML’e Aktarılması
SPSS, regresyon katsayılarını yeni bir veri setine kaydedebilir veya modeli PMML (XML) olarak dışa aktarabilir.
Bu XML dosyası:
Aynı modeli başka veri setlerine uygulamak
Yazılım entegrasyonu yapmak
Makine öğrenimi süreçlerinde kullanmak
için önemlidir.

Regresyon Analizinde Yorumlama Sürecinin Genel Bütünlüğü
Bu kapsamlı SPSS menü seçenekleri, doğrusal regresyon analizinin yalnızca katsayılarla sınırlı olmadığını; modelin kalitesinin, varsayımlarının ve tanısal istatistiklerinin bütünsel olarak değerlendirilmesi gerektiğini gösterir.
Doğru değişken seçimi
Artık analizleri
Outlier taraması
Modelin açıklayıcılığı
Etki istatistikleri
Tahmin aralıkları
bir araya geldiğinde, regresyon modeli hem güvenilir hem de öngörücü bir araç hâline gelir.








Yorumlar