Topluluk Modelleri (Ensembles) SPSS Automatic Linear Models’da Nasıl Çalışır?

Nominal Analiz
16 Kas 2025
2 dakikada okunur

Topluluk modelleri (ensemble yöntemleri), birden fazla alt modelin birleşiminden oluşan güçlü bir tahmin sistemi üretir. Automatic Linear Models özelliğinde bu mekanizma; boosting, bagging ve çok büyük veri kümeleri için bölme tabanlı modeller üzerinden yönetilir.

Bu bölüm, her bir ayarın ne anlama geldiğini, hangi durumlarda etkili olduğunu ve SPSS içindeki seçeneklerin nasıl yorumlanacağını kapsamlı şekilde açıklar.

1. Topluluk Modeli Nasıl Skor Üretir?

Bir topluluk modelinde nihai tahmin değeri, modelde yer alan tüm alt modellerin tahminlerinin birleştirilmesiyle oluşturulur. SPSS’te bu işlem şu kurallara göre yürütülür:

● Sürekli bağımlı değişkenlerde varsayılan birleştirme kuralı

Ortalama (Mean)
Medyan (Median)

Bu kurallar yalnızca bagging ve çok büyük veri seti modellerinde geçerlidir.

SPSS otomatik lineer model boosting bagging büyük veri kümeleri, topluluk modeli skoru

Önemli Not (Boosting):

Boosting kullanıldığında bu seçenekler devredışı kalır. Boosting daima:

Sürekli değişkenlerde Ağırlıklı Medyan,
Kategorik değişkenlerde Ağırlıklı Çoğunluk Oyu kullanır.

2. Alt Model (Base Model) Sayısını Belirleme

Topluluk modellerinin gücü, kaç tane alt modelden oluştuğuna bağlıdır.

SPSS’te ayarlanabilir:

Boosting için: Üretilecek ardışık model sayısı
Bagging için: Oluşturulacak bootstrap örneklem sayısı
Çok büyük veri setlerinde: Veri bloklarına göre kaç model oluşturulacağı

Nasıl karar verilir?

Daha fazla model → daha yüksek doğruluk, ancak daha uzun işlem süresi
Genellikle 10–50 arası iyi çalışır.
Çok büyük veri kümelerinde sayı daha yüksek olabilir.

3. Gelişmiş Ayarlar (Advanced Settings)

● Rastgelelik (Random Seed) Ayarı

Analizin tekrarlanabilir olması için kullanılır.

Aynı seed → Aynı sonuçlar
Farklı seed → Farklı veri bölmeleri ve sonuçlar

SPSS’de seed 1 ile 2.147.483.647 arasında bir tamsayı olabilir.

Neden önemlidir?

Bir akademik çalışmada modelin tekrarlanabilir olması gerekir. Seed ayarı bunun güvencesidir.

Akademik Danışmanlık

G*Power Güç Analizi & Örneklem Hesaplama

TRY 749.00

3 sa. 15 dk.

Hizmeti Satın Al

4. Model Çıktılarının Kaydedilmesi

Automatic Linear Models, üretilen modelin başka veri setlerinde de kullanılmasını sağlayacak seçenekler sunar.

● Tahmin Değerini Kaydetme (Predicted Value)

SPSS veri dosyasına PredictedValue isminde bir değişken eklenir.

Bu değer:

Modelin her bir gözlem için ürettiği tahminidir.
Daha sonra ROC, AUC, regresyon hataları gibi ek analizlerde kullanılabilir.

● Modeli Dışa Aktarma (Model Export)

Model bir .zip dosyası olarak dışarı alınır.

Bu dosya:

Başka SPSS oturumlarında
Büyük veri projelerinde
Uzak sunucularda toplu skorlamalardakullanılabilir.

5. Model Özeti (Model Summary) Nasıl Yorumlanır?

Model Summary bölümü, kurulan modelin genel performansını gösteren kısa fakat etkili bir paneldir.

Tabloda Görülenler

Bağımlı değişkenin adı
Otomatik veri hazırlama (Automatic Data Preparation) kullanılıp kullanılmadığı
Seçilen model seçimi yöntemi (Forward Stepwise, Best Subset, vb.)
Son model için kullanılan seçim kriterinin değeri

Not: Bu kriter küçük olması daha iyidir formatında gösterilir.

6. Performans Grafiği (Performance – Accuracy Chart)

Grafikte yer alan değer:

% (100 × Düzeltilmiş R-Kare) olarak sunulur.
Ne kadar yüksekse model o kadar başarılıdır.

Bu değer özellikle:

Aynı veri seti üzerinde kurulan farklı modellerin karşılaştırılmasında
Model seçim metodunun etkisini incelemedekullanılır.

Automatic Linear Models İçinde Ensemble Seçenekleri Nasıl Stratejik Avantaj Sağlar?

Topluluk modelleri, klasik tekil regresyon modellerine göre daha esnek ve yüksek performanslı sonuçlar üretebilir.

Özellikle:

Karmaşık veri yapılarında
Gürültülü değişkenlerde
Çok sayıda bağımsız değişken içeren çalışmalarda
Model doğruluğu veya kararlılığı kritik olduğunda

boosting ve bagging seçenekleri öne çıkar.

Automatic Linear Models ise bu süreci:

Kolay,
Otomatik,
Denetimli,
Yeniden üretilebilir (reproducible)

hale getirerek hem araştırmacılar hem de uygulayıcılar için güçlü bir araç sunar.