top of page

Topluluk Modelleri (Ensembles) SPSS Automatic Linear Models’da Nasıl Çalışır?

Topluluk modelleri (ensemble yöntemleri), birden fazla alt modelin birleşiminden oluşan güçlü bir tahmin sistemi üretir. Automatic Linear Models özelliğinde bu mekanizma; boosting, bagging ve çok büyük veri kümeleri için bölme tabanlı modeller üzerinden yönetilir.


Bu bölüm, her bir ayarın ne anlama geldiğini, hangi durumlarda etkili olduğunu ve SPSS içindeki seçeneklerin nasıl yorumlanacağını kapsamlı şekilde açıklar.


1. Topluluk Modeli Nasıl Skor Üretir?

Bir topluluk modelinde nihai tahmin değeri, modelde yer alan tüm alt modellerin tahminlerinin birleştirilmesiyle oluşturulur. SPSS’te bu işlem şu kurallara göre yürütülür:

● Sürekli bağımlı değişkenlerde varsayılan birleştirme kuralı

  • Ortalama (Mean)

  • Medyan (Median)

Bu kurallar yalnızca bagging ve çok büyük veri seti modellerinde geçerlidir.

SPSS otomatik lineer model boosting bagging büyük veri kümeleri, topluluk modeli skoru

Önemli Not (Boosting):

Boosting kullanıldığında bu seçenekler devredışı kalır. Boosting daima:

  • Sürekli değişkenlerde Ağırlıklı Medyan,

  • Kategorik değişkenlerde Ağırlıklı Çoğunluk Oyu kullanır.


2. Alt Model (Base Model) Sayısını Belirleme

Topluluk modellerinin gücü, kaç tane alt modelden oluştuğuna bağlıdır.

SPSS’te ayarlanabilir:

  • Boosting için: Üretilecek ardışık model sayısı

  • Bagging için: Oluşturulacak bootstrap örneklem sayısı

  • Çok büyük veri setlerinde: Veri bloklarına göre kaç model oluşturulacağı


Nasıl karar verilir?

  • Daha fazla model → daha yüksek doğruluk, ancak daha uzun işlem süresi

  • Genellikle 10–50 arası iyi çalışır.

  • Çok büyük veri kümelerinde sayı daha yüksek olabilir.


3. Gelişmiş Ayarlar (Advanced Settings)

● Rastgelelik (Random Seed) Ayarı

Analizin tekrarlanabilir olması için kullanılır.

  • Aynı seed → Aynı sonuçlar

  • Farklı seed → Farklı veri bölmeleri ve sonuçlar


SPSS’de seed 1 ile 2.147.483.647 arasında bir tamsayı olabilir.


Neden önemlidir?

Bir akademik çalışmada modelin tekrarlanabilir olması gerekir. Seed ayarı bunun güvencesidir.

Akademik Danışmanlık
G*Power Güç Analizi & Örneklem Hesaplama
TRY 749.00
3 sa. 15 dk.
Hizmeti Satın Al

4. Model Çıktılarının Kaydedilmesi

Automatic Linear Models, üretilen modelin başka veri setlerinde de kullanılmasını sağlayacak seçenekler sunar.


● Tahmin Değerini Kaydetme (Predicted Value)

SPSS veri dosyasına PredictedValue isminde bir değişken eklenir.

Bu değer:

  • Modelin her bir gözlem için ürettiği tahminidir.

  • Daha sonra ROC, AUC, regresyon hataları gibi ek analizlerde kullanılabilir.


● Modeli Dışa Aktarma (Model Export)

Model bir .zip dosyası olarak dışarı alınır.

Bu dosya:

  • Başka SPSS oturumlarında

  • Büyük veri projelerinde

  • Uzak sunucularda toplu skorlamalardakullanılabilir.


5. Model Özeti (Model Summary) Nasıl Yorumlanır?

Model Summary bölümü, kurulan modelin genel performansını gösteren kısa fakat etkili bir paneldir.


Tabloda Görülenler

  • Bağımlı değişkenin adı

  • Otomatik veri hazırlama (Automatic Data Preparation) kullanılıp kullanılmadığı

  • Seçilen model seçimi yöntemi (Forward Stepwise, Best Subset, vb.)

  • Son model için kullanılan seçim kriterinin değeri

Not: Bu kriter küçük olması daha iyidir formatında gösterilir.


6. Performans Grafiği (Performance – Accuracy Chart)

Grafikte yer alan değer:

  • % (100 × Düzeltilmiş R-Kare) olarak sunulur.

  • Ne kadar yüksekse model o kadar başarılıdır.


Bu değer özellikle:

  • Aynı veri seti üzerinde kurulan farklı modellerin karşılaştırılmasında

  • Model seçim metodunun etkisini incelemedekullanılır.


Automatic Linear Models İçinde Ensemble Seçenekleri Nasıl Stratejik Avantaj Sağlar?

Topluluk modelleri, klasik tekil regresyon modellerine göre daha esnek ve yüksek performanslı sonuçlar üretebilir.


Özellikle:

  • Karmaşık veri yapılarında

  • Gürültülü değişkenlerde

  • Çok sayıda bağımsız değişken içeren çalışmalarda

  • Model doğruluğu veya kararlılığı kritik olduğunda

boosting ve bagging seçenekleri öne çıkar.


Automatic Linear Models ise bu süreci:

  • Kolay,

  • Otomatik,

  • Denetimli,

  • Yeniden üretilebilir (reproducible)

hale getirerek hem araştırmacılar hem de uygulayıcılar için güçlü bir araç sunar.

Yorumlar


bottom of page