Otomatik Veri Hazırlama Ayarları: Model Kurulumunda Temel İlkeler
- Nominal Analiz
- 14 Kas 2025
- 2 dakikada okunur
Doğrusal modellerin başarısı yalnızca algoritmaya değil, verinin model için nasıl hazırlandığına da bağlıdır. SPSS’in Automatic Linear Models arayüzünde yer alan Automatic Data Preparation seçeneği, veriyi analiz öncesinde otomatik olarak dönüştürür, temizler ve model için en uygun hâle getirir.
Bu bölüm, otomatik veri hazırlamanın nasıl çalıştığını ve neden kritik olduğunu detaylandırır.

1. Tarih ve Saat Değişkenlerinin Süreye Dönüştürülmesi
Tarih ve saat türündeki değişkenler model tarafından doğrudan yorumlanamaz.
Bu nedenle SPSS şu dönüşümleri otomatik yapar:
Tarih değişkenleri: Her bir değer, 1970-01-01 tarihinden bugüne kadar geçen süreyi temsil eden sürekli bir değişkene dönüştürülür.
Saat değişkenleri: Her saat bilgisi, 00:00:00 başlangıcından itibaren geçen süreye dönüştürülür.
Bu dönüşüm, tarih-saat bilgisinin model tarafından sayısal ve karşılaştırılabilir hâle gelmesini sağlar.
2. Ölçüm Düzeyinin Otomatik Ayarlanması
SPSS, modelin daha doğru çalışması için değişkenlerin ölçüm düzeyini yeniden değerlendirir:
Sürekli değişken (scale) olup 5’ten az farklı değer içeriyorsa → Sıralı (ordinal) düzeye çevrilir.
Ordinal değişken olup 10’dan fazla farklı değer içeriyorsa → Sürekli (scale) düzeye çevrilir.
Bu işlem, verinin gerçek yapısına uygun biçimde modellenmesini sağlar.
3. Aykırı Değer Yönetimi (Outlier Handling)
Sürekli (scale) değişkenlerde ortalamadan 3 standart sapma uzaklıktaki değerler, otomatik olarak bu eşiğe çekilir.
Bu sayede:
Modelin aşırı uç değerlerden etkilenmesi engellenir,
Koşu modelinde kararlılık artar.
4. Eksik Değer Tamamlama (Missing Value Handling)
SPSS eksik değerleri değişken türüne göre otomatik doldurur:
Nominal değişken: En sık görülen kategori (mod).
Ordinal değişken: Ortanca değer (median).
Sürekli değişken: Ortalama değer (mean).
Bu sistem, modelde bilgi kaybı olmadan tüm gözlemlerin kullanılmasını sağlar.

5. Kategorilerin Denetimli Birleştirilmesi (Supervised Merging)
SPSS, hedef değişkenle ilişkisine göre kategorileri değerlendirir:
Kategoriler arasında anlamlı fark yoksa (p > 0.1), bu kategoriler birleştirilir.
Tüm kategoriler birleşirse değişken modelden çıkarılır — çünkü hedefi açıklamada katkısı yoktur.
Bu yöntem:
Gereksiz kategorileri azaltır,
Modeli sadeleştirir,
Yüksek boyutluluk sorununu engeller.
6. Güven Düzeyi (Confidence Level – %95)
Model katsayılarının güven aralıkları için kullanılan güven düzeyi varsayılan olarak %95’tir.
İstenirse:
Daha geniş aralık için (%99 gibi) artırılabilir
Daha dar aralık için (%90 gibi) azaltılabilir
Genel Değerlendirme
Automatic Data Preparation, veri biliminde en zaman alan adımlardan biri olan veri temizleme, dönüştürme ve düzenleme işlemlerini otomatik hâle getirir.
Bu modül sayesinde:
Veri daha doğru yapılandırılır,
Model daha dengeli çalışır,
Aşırı uçlar ve eksik değerlerin olumsuz etkisi azaltılır,
Kategoriler ve ölçüm düzeyleri optimize edilir.
Sonuç olarak, modelci yalnızca ilişkilerin yorumuna odaklanabilir; veri hazırlama yükü SPSS tarafından yönetilir.








Yorumlar