Model Seçim Yöntemleri: Doğrusal Modellerde En Uygun Değişkenler Nasıl Belirlenir?
- Nominal Analiz
- 14 Kas 2025
- 2 dakikada okunur
Doğrusal modellerin başarısı yalnızca kullanılan algoritmaya değil, modele hangi değişkenlerin alınacağına ve bu değişkenlerin hangi sırayla ekleneceğine de bağlıdır.
SPSS’in Automatic Linear Models modülünde bulunan Model Seçim Yöntemleri (Model Selection), modelin performansını optimize etmek için en uygun değişken bileşimini otomatik olarak belirler.
Bu bölüm, model seçim stratejilerinin nasıl çalıştığını, hangi kriterlere göre karar verdiğini ve hangi durumlarda hangi yöntemin daha uygun olduğunu ayrıntılı biçimde açıklar.
1. Model Seçim Yönteminin Belirlenmesi
SPSS, kullanıcıya dört seçenek sunar:
Tüm değişkenleri modele dahil et (Include all predictors)
İleri yönlü adım yöntemini kullan (Forward Stepwise Selection)
En iyi alt kümeyi araştır (Best Subsets Selection)
Gelişmiş hedeflere yönelik seçenekler (bagging, boosting vb.)
Varsayılan yöntem İleri Yönlü Adım Yöntemidir (Forward Stepwise).

2. İleri Yönlü Adım Yöntemi (Forward Stepwise Selection)
Bu yöntemde model:
İlk adımda hiçbir bağımsız değişken olmadan başlar,
Her adımda modele katkısı en yüksek olan değişkeni ekler,
Gerektiğinde katkısı düşen değişkenleri modelden çıkarır.
Bu süreç, seçilen kriterlere göre yönetilir.

2.1. Etki Eklenme / Çıkarılma Kriterleri
SPSS dört ana kriter sunar:
A. Bilgi Kriteri (Information Criterion – AICC)
Modelin uyum iyiliği + aşırı karmaşıklık cezası.
Basit ama etkili modelleri tercih eder.
B. F İstatistiği (F Statistics)
Bir bağımsız değişken eklendiğinde model hatasındaki iyileşmeyi test eder.
Eklenme için p < 0.05 (varsayılan),
Çıkarılma için p > 0.10 (varsayılan).
Bu yöntem özellikle istatistiksel anlamlılık temelli bir model isterken uygundur.
C. Düzeltilmiş R-Kare (Adjusted R-Squared)
Model uyumunu değerlendirir,
Gereksiz değişkenleri cezalandırır.
D. Aşırı Uyum Önleme Kriteri (Overfit Prevention Criterion – ASE)
Verinin %30’luk bir bölümünü overfit önleme seti olarak ayırır.
Gerçek tahmin performansını değerlendirir.
Aşırı uyumun önüne geçer.
Kriter F İstatistiği dışındaysa, SPSS her adımda:
Kriteri en fazla artıran değişkeni ekler,
Kriteri azaltan değişkenleri çıkarır.
2.2. Maksimum Etki Sayısının Özelleştirilmesi
İstersen:
Modele alınabilecek en fazla değişken sayısını sınırlayabilirsin.
Örneğin maksimum 5 etki seçilirse, algoritma o noktada durur.
Bu özellik özellikle:
Çok değişkenli veri setlerinde,
Aşırı karmaşık modelleri engellemek istediğinde kullanışlıdır.
2.3. Maksimum Adım Sayısının Özelleştirilmesi
Varsayılan:3 × toplam aday etki sayısı
İstersen adım sayısını manuel sınırlayabilirsin. Örneğin algoritmanın 10 adımı geçmesini istemiyorsan, 10 yazarsın.
3. En İyi Alt Kümeler Yöntemi (Best Subsets Selection)
Bu yöntem:
Mevcut tüm değişken kombinasyonlarını dener veya
Hesaplama maliyetine göre genişletilmiş bir alt küme inceler.
Her kombinasyon şu kriterlerden birine göre değerlendirilir:
Bilgi Kriteri (AICC)
Düzeltilmiş R-Kare (Adjusted R-Squared)
ASE (Overfit Önleme Kriteri)
En yüksek değere sahip model “en iyi model” olarak seçilir.
Bu yöntemin avantajı:
Modeli global optimuma yakın seçebilmesidir.
Dezavantajı:
Çok değişkenli veri setlerinde daha fazla işlemci süresi gerektirir.
Boosting, bagging veya büyük veri bloklaması ile birlikte kullanıldığında:
İşlem süresi belirgin ölçüde artabilir.
Genel Değerlendirme
Model seçimi modeli yalnızca “doğru” yapmak değildir;
aynı zamanda:
Aşırı uyumu engellemek,
Gereksiz değişkenleri modelden çıkarmak,
Tahmin doğruluğunu artırmak,
Yorumlanabilirliği korumak açısından kritik bir aşamadır.
SPSS'in sunduğu bu gelişmiş seçim yöntemleri sayesinde kullanıcı:
Hangi değişkenin gerçekten önemli olduğunu görebilir,
Modeli gereksiz yüklerden arındırabilir,
Daha öngörücü ve kararlı modeller üretebilir.








Yorumlar