top of page

Doğrusal Regresyonda (Linear Regression) Değişken Seçim Yöntemleri, Grafikler, Kayıt Kuralları ve Tanılama İstatistikleri: SPSS Üzerine Kapsamlı Bir Rehber

Doğrusal regresyon analizinde, modelin doğru kurulması kadar, değişkenlerin hangi yöntemle modele dâhil edildiği, hangi diyagnostik grafiklerin değerlendirildiği ve SPSS’in sağladığı ek istatistiklerin doğru yorumlanması da aynı derecede önemlidir.


Bu kapsamlı rehberde, SPSS Linear Regression penceresinde yer alan tüm gelişmiş seçenekleri detaylı olarak açıklıyoruz.

Akademik Danışmanlık
G*Power Güç Analizi & Örneklem Hesaplama
TRY 749.00
Hizmeti Satın Al

1. Regresyonda Değişken Seçim Yöntemlerinin Mantığı

SPSS, bağımsız değişkenlerin modele alınması için farklı seçim yöntemleri sunar. Bu yöntemler, modelin esnekliğini ve gerçek hayattaki ilişkilere uyum derecesini doğrudan etkiler.

regresyon analizinde değişken seçimleri nasıl yapılmalıdır?

1.1. “Enter” Yöntemi (Tüm Değişkenleri Birlikte Ekleme)

Tüm bağımsız değişkenlerin tek adımda modele dâhil edildiği klasik yöntemdir.

  • Model tamamen araştırmacının kararına dayanır.

  • Temel, varsayımsal modeller için uygundur.

regresyonda değişken seçim yöntemleri: enter, stepwise, remove, backward, forward yöntemleri açıklamaları ve seçim mantığı

1.2. Stepwise (Adım Adım) Yöntemi

Her adımda modele en faydalı değişken girer; faydasını yitiren çıkartılır.

  • Bağımsız değişken sayısı fazla olduğunda tercih edilir.

  • Ancak p-değerleri tek bir model için hesaplandığından, anlamlılık değerleri güvenilir değildir.


1.3. Remove (Tüm Değişkenleri Çıkarma)

Bir bloktaki tüm bağımsız değişkenleri tek adımda modelden siler.


1.4. Backward Elimination (Geriye Doğru Eleme)

Tüm değişkenlerle başlar, katkısı en az olanı analizden çıkartarak ilerler.

  • Modeli sadeleştirmek için idealdir.


1.5. Forward Selection (İleriye Doğru Seçim)

İlk olarak bağımlı değişkenle korelasyonu en yüksek bağımsız değişken seçilir.

  • Kriteri karşılayan yeni değişkenler eklenerek model büyür.


2. Tolerans (Tolerance) ve Çoklu Bağlantı (Multicollinearity) Koşulu

SPSS, hangi yöntem seçilirse seçilsin:

  • Toleransı düşük değişkenleri (çoklu bağlantı sorunu olan) modele eklemez.

  • Varsayılan eşik: 0.0001

Bu eşik altında toleransı olan bir değişken modele girerse, diğer değişkenlerin varyansını bozarak standart hataları şişirir.


3. Kayıt Seçim Kuralları (Set Rule) ile Hangi Vakaların Analize Gireceğini Belirlemek

“Set Rule” bölümü kullanılarak yalnızca belirli ölçütlere sahip kayıtlar analize dâhil edilebilir.


Örneğin:

  • yas = 50 olan vakalar,

  • cinsiyet = kadın olanlar,

  • kan_basinci <= 140 olanlar.

Bu filtre, regresyon analizinin belirli bir alt gruba uygulanmasını sağlar.

doğrusal regresyon analizinde değişkene kural atamak

4. Doğrusal Regresyonda Grafikler ve Tanı Kriterleri

SPSS; artık değerlerin (residual), tahmin değerlerinin ve etkili gözlemlerin incelenmesi için önemli grafik araçları sunar.


4.1. Standartlaştırılmış Artıklar ile Tahminler Arasındaki Grafi̇k (ZRESID – ZPRED)

Modelin şu varsayımlarını değerlendirir:

  • Doğrusallık

  • Değişen varyans (homojenlik)

  • Hata dağılımının yapısı


Bu grafikte:

  • Noktalar rastgele dağılmışsa → varsayımlar sağlanıyor.

  • Huni şeklinde dağılım varsa → değişen varyans sorunu vardır.

doğrusal regresyon analizinde grafik üretimi histogram partial plots grafik türleri x ve y ekseni tanımlama

4.2. Tüm Kısmi Grafikler (Partial Plots)

Her bağımsız değişkenin bağımlı değişken ile diğer tüm değişkenlerden arındırılmış ilişkisini gösterir.

  • Yorumlanması son derece güçlüdür.

  • Ancak en az iki bağımsız değişken olmalıdır.


4.3. Standartlaştırılmış Artıkların Histogramı

Artıkların normal dağılıma uyup uymadığını gösterir.

  • Normal dağılıma yakınsa → modelin hataları sağlamdır.


4.4. Normal P-P Plot

Artıkların teorik normal dağılımdan sapmalarını gösterir.

  • Noktalar diagonal çizgi üzerinde ise → normalite sağlanmıştır.


5. Kaydedilebilen Yeni Değişkenler ve Tanısal İstatistikler

SPSS, regresyon sonrasında veri setine birçok yeni değişken ekleyebilir:


5.1. Tahmin Edilen Değerler (Predicted Values)

  • Unstandardized: Ham tahmin değeri

  • Standardized: 0 ortalama, 1 SD’ye dönüştürülmüş tahmin

  • Adjusted: Kayıt dışarıda bırakıldığında tahmin değeri

  • S.E. of Mean Predictions: Tahmin hatasının standart hatası


5.2. Artıklar (Residuals)

  • Unstandardized residual: Gerçek – Tahmin

  • Standardized residual

  • Studentized residual

  • Deleted residual

  • Studentized deleted residual

Özellikle outlier ve etkili gözlem araştırmasında kritik öneme sahiptir.


5.3. Uzaklık Ölçüleri (Distances)

  • Mahalanobis Distance: Aykırı gözlem saptamada güçlü.

  • Cook’s Distance: Modelin katsayılarını ne kadar bozduğu.

  • Leverage Values: Her gözlemin modele etkisi.


5.4. Etki İstatistikleri (Influence Statistics)

  • DfBeta(s): Bir gözlem çıkarıldığında katsayı değişimi

  • DfFit: Tahmin değerindeki değişim

  • Covariance Ratio: Kovaryans matrisinin duyarlılığı

Akademik Danışmanlık
Akademik Tez Yazım Danışmanlığı
Hizmeti Satın Al

6. Tahmin Aralıkları (Prediction Intervals)

SPSS iki tür tahmin aralığı üretir:

  1. Ortalama Tahmin Aralığı (Mean Prediction Interval)

    Belirli bir X değerinde beklenen ortalama Y’nin aralığıdır.

  2. Bireysel Tahmin Aralığı (Individual Prediction Interval)

    Tek bir bireyin Y değerinin hangi aralıkta olacağıdır.

Güven düzeyi (Confidence Level): %90, %95, %99 yaygın seçeneklerdir.


7. Regresyon Katsayılarının Kaydedilmesi ve Modelin XML’e Aktarılması

SPSS, regresyon katsayılarını yeni bir veri setine kaydedebilir veya modeli PMML (XML) olarak dışa aktarabilir.


Bu XML dosyası:

  • Aynı modeli başka veri setlerine uygulamak

  • Yazılım entegrasyonu yapmak

  • Makine öğrenimi süreçlerinde kullanmak

için önemlidir.

regresyon katsayılarının kaydedilmesi ve xml olarak dışa aktarılması

Regresyon Analizinde Yorumlama Sürecinin Genel Bütünlüğü

Bu kapsamlı SPSS menü seçenekleri, doğrusal regresyon analizinin yalnızca katsayılarla sınırlı olmadığını; modelin kalitesinin, varsayımlarının ve tanısal istatistiklerinin bütünsel olarak değerlendirilmesi gerektiğini gösterir.

  • Doğru değişken seçimi

  • Artık analizleri

  • Outlier taraması

  • Modelin açıklayıcılığı

  • Etki istatistikleri

  • Tahmin aralıkları

bir araya geldiğinde, regresyon modeli hem güvenilir hem de öngörücü bir araç hâline gelir.

Yorumlar


bottom of page