Topluluk Modelleri (Ensembles) SPSS Automatic Linear Models’da Nasıl Çalışır?
- Nominal Analiz
- 16 Kas 2025
- 2 dakikada okunur
Topluluk modelleri (ensemble yöntemleri), birden fazla alt modelin birleşiminden oluşan güçlü bir tahmin sistemi üretir. Automatic Linear Models özelliğinde bu mekanizma; boosting, bagging ve çok büyük veri kümeleri için bölme tabanlı modeller üzerinden yönetilir.
Bu bölüm, her bir ayarın ne anlama geldiğini, hangi durumlarda etkili olduğunu ve SPSS içindeki seçeneklerin nasıl yorumlanacağını kapsamlı şekilde açıklar.
1. Topluluk Modeli Nasıl Skor Üretir?
Bir topluluk modelinde nihai tahmin değeri, modelde yer alan tüm alt modellerin tahminlerinin birleştirilmesiyle oluşturulur. SPSS’te bu işlem şu kurallara göre yürütülür:
● Sürekli bağımlı değişkenlerde varsayılan birleştirme kuralı
Ortalama (Mean)
Medyan (Median)
Bu kurallar yalnızca bagging ve çok büyük veri seti modellerinde geçerlidir.

Önemli Not (Boosting):
Boosting kullanıldığında bu seçenekler devredışı kalır. Boosting daima:
Sürekli değişkenlerde Ağırlıklı Medyan,
Kategorik değişkenlerde Ağırlıklı Çoğunluk Oyu kullanır.
2. Alt Model (Base Model) Sayısını Belirleme
Topluluk modellerinin gücü, kaç tane alt modelden oluştuğuna bağlıdır.
SPSS’te ayarlanabilir:
Boosting için: Üretilecek ardışık model sayısı
Bagging için: Oluşturulacak bootstrap örneklem sayısı
Çok büyük veri setlerinde: Veri bloklarına göre kaç model oluşturulacağı
Nasıl karar verilir?
Daha fazla model → daha yüksek doğruluk, ancak daha uzun işlem süresi
Genellikle 10–50 arası iyi çalışır.
Çok büyük veri kümelerinde sayı daha yüksek olabilir.
3. Gelişmiş Ayarlar (Advanced Settings)
● Rastgelelik (Random Seed) Ayarı
Analizin tekrarlanabilir olması için kullanılır.
Aynı seed → Aynı sonuçlar
Farklı seed → Farklı veri bölmeleri ve sonuçlar
SPSS’de seed 1 ile 2.147.483.647 arasında bir tamsayı olabilir.
Neden önemlidir?
Bir akademik çalışmada modelin tekrarlanabilir olması gerekir. Seed ayarı bunun güvencesidir.
4. Model Çıktılarının Kaydedilmesi
Automatic Linear Models, üretilen modelin başka veri setlerinde de kullanılmasını sağlayacak seçenekler sunar.
● Tahmin Değerini Kaydetme (Predicted Value)
SPSS veri dosyasına PredictedValue isminde bir değişken eklenir.
Bu değer:
Modelin her bir gözlem için ürettiği tahminidir.
Daha sonra ROC, AUC, regresyon hataları gibi ek analizlerde kullanılabilir.
● Modeli Dışa Aktarma (Model Export)
Model bir .zip dosyası olarak dışarı alınır.
Bu dosya:
Başka SPSS oturumlarında
Büyük veri projelerinde
Uzak sunucularda toplu skorlamalardakullanılabilir.
5. Model Özeti (Model Summary) Nasıl Yorumlanır?
Model Summary bölümü, kurulan modelin genel performansını gösteren kısa fakat etkili bir paneldir.
Tabloda Görülenler
Bağımlı değişkenin adı
Otomatik veri hazırlama (Automatic Data Preparation) kullanılıp kullanılmadığı
Seçilen model seçimi yöntemi (Forward Stepwise, Best Subset, vb.)
Son model için kullanılan seçim kriterinin değeri
Not: Bu kriter küçük olması daha iyidir formatında gösterilir.
6. Performans Grafiği (Performance – Accuracy Chart)
Grafikte yer alan değer:
% (100 × Düzeltilmiş R-Kare) olarak sunulur.
Ne kadar yüksekse model o kadar başarılıdır.
Bu değer özellikle:
Aynı veri seti üzerinde kurulan farklı modellerin karşılaştırılmasında
Model seçim metodunun etkisini incelemedekullanılır.
Automatic Linear Models İçinde Ensemble Seçenekleri Nasıl Stratejik Avantaj Sağlar?
Topluluk modelleri, klasik tekil regresyon modellerine göre daha esnek ve yüksek performanslı sonuçlar üretebilir.
Özellikle:
Karmaşık veri yapılarında
Gürültülü değişkenlerde
Çok sayıda bağımsız değişken içeren çalışmalarda
Model doğruluğu veya kararlılığı kritik olduğunda
boosting ve bagging seçenekleri öne çıkar.
Automatic Linear Models ise bu süreci:
Kolay,
Otomatik,
Denetimli,
Yeniden üretilebilir (reproducible)
hale getirerek hem araştırmacılar hem de uygulayıcılar için güçlü bir araç sunar.








Yorumlar