OLAP Cubes (Çok Boyutlu Veri Analizi) Analizinde Kullanılan Özet İstatistikler: SPSS'te Alt Grup Değerlendirme Seçenekleri
- Nominal Analiz
- 11 saat önce
- 3 dakikada okunur
OLAP Cubes analizi, SPSS kullanıcılarına çok boyutlu veri setlerini çaprazlayarak inceleme ve her bir kategori kombinasyonu için özet istatistikler üretme imkânı sunar. Bu özet istatistikler sayesinde, sadece sayısal sonuçlar değil, aynı zamanda verinin dağılımı, yapısı ve simetrisi hakkında da fikir edinilebilir.

Temel ölçülerle başlamak
Her analizde ilk bakılan ölçütlerden biri toplam değerdir. OLAP Cube tablolarında bu genellikle sum (toplam) olarak gösterilir. Değerlerin toplanarak bir bütünlük oluşturduğu bu ölçüm, özellikle maliyet, süre, puan gibi sayısal hacimlerle çalışırken önemlidir. Toplamın yanında yer alan number of cases (N) – (gözlem sayısı), analizde kullanılan geçerli kayıt miktarını gösterir. Her iki ölçüm de verinin sayısal büyüklüğü hakkında fikir verir.
Merkezi eğilim ölçüleri
Verilerin ortalaması, medyanı ve gruplu medyanı, bir değişkenin alt kategorilerde nasıl dağıldığını göstermek için kullanılır.
mean (aritmetik ortalama): Klasik ortalama değeridir. Aykırı değerlere duyarlıdır.
median (ortanca): Veriler küçükten büyüğe sıralandığında ortada kalan değeri verir.
grouped median (gruplu ortanca): Özellikle yaş gibi gruplandırılarak kodlanan verilerde kullanılır. Örneğin 30’lu yaşlar “35”, 40’lı yaşlar “45” olarak kodlandığında, medyan bu kodlarla hesaplanır.
Minimum, maksimum ve aralık
Bir grubun uç noktaları, dağılımın genişliği hakkında önemli bilgiler verir.
minimum (en küçük değer): Gözlenen en düşük değeri belirtir.
maximum (en büyük değer): Gözlenen en yüksek değeri gösterir.
range (aralık): Maksimum ile minimum arasındaki farktır.
Bu üç ölçüm, grupların iç yapısında uç değerlerin nasıl dağıldığını anlamayı sağlar.

Dağılım ölçümleri: Varyans ve standart sapma
Ortalama tek başına yeterli değildir; verilerin bu ortalama etrafında nasıl dağıldığını anlamak gerekir.
standard deviation (standart sapma): Gözlemlerin ortalamadan ne kadar saptığını gösterir.
variance (varyans): Standart sapmanın karesidir. Daha teknik analizlerde kullanılır.
Her iki ölçü de özellikle normal dağılıma sahip verilerde yayılımı yorumlamak için kullanılır.

Ortalama değer ne kadar güvenilir?
Bir ortalamanın güvenilirliği, her zaman tek başına anlaşılmaz. Bu nedenle standard error of mean (ortalama standart hatası), ortalamanın ne kadar değişkenlik gösterebileceğini ölçer. Aynı dağılımdan farklı örneklemler alındığında ortalamanın hangi aralıkta kalacağını tahmin etmeye yardımcı olur. Bu hata payı yüksekse, o ortalamanın güvenilirliği sorgulanmalıdır.
Simetri bozulmuş mu? Çarpıklık ve basıklık
Verilerin simetrik olup olmadığını anlamak için skewness (çarpıklık) ve kurtosis (basıklık) değerlerine bakılır:
skewness (çarpıklık):
0’a yakınsa simetriktir.
Pozitifse sağa, negatifse sola kuyrukludur.
kurtosis (basıklık):
0 → Normal dağılım
0 → Sivri dağılım (uç değerler fazla)
< 0 → Basık dağılım (uç değerler az)
Bu iki ölçümün anlamlı olup olmadığını anlamak için standart hataları da hesaplanır:
standard error of skewness (çarpıklık standart hatası)
standard error of kurtosis (basıklık standart hatası)
Değerin kendi standart hatasının ±2 katından büyük olması durumunda, dağılımın normalden anlamlı düzeyde saptığı kabul edilir.
Alternatif ortalamalar: Geometrik ve harmonik
Her zaman aritmetik ortalama kullanılmaz. Özellikle orantısal ya da çarpımsal veri söz konusuysa farklı türde ortalamalara başvurmak gerekir.
geometric mean (geometrik ortalama): Gözlem değerlerinin çarpımının, gözlem sayısı kadar kökünün alınmasıyla hesaplanır.
harmonic mean (harmonik ortalama): Grup büyüklükleri eşit olmadığında daha doğru sonuçlar verir. Özellikle oran, hız gibi verilerde kullanılır.
Bu ortalamalar, klasik yöntemlerle yanıltıcı sonuçlar alınan gruplarda daha güvenilir bir genel görünüm sağlar.
Oranlar ne söylüyor?
Sadece mutlak değerler değil, oranlar da veri yapısını anlamada çok etkilidir. OLAP Cubes analizinde kullanılan yüzdelik oranlar şunlardır:
percent of total N (toplam gözlem oranı): Kategorinin tüm veri içindeki payı
percent of total sum (toplam değer oranı): Kategorinin toplam değer içindeki katkısı
percent of N within grouping (grup içi gözlem oranı): Aynı gruptaki gözlem yüzdesi
percent of sum within grouping (grup içi toplam değer oranı): Toplam değer üzerinden grup içindeki pay
Bu oranlar, bir grubun veri seti içindeki sayısal ve ağırlıksal önemini göstermede kullanılır. Örneğin “cerrahi geçirmiş erkek hastaların toplam tedavi maliyetine etkisi nedir?” gibi bir soruya bu oranlar üzerinden yanıt aranabilir.

İlk ve son değerler
Zaman dizilimi ya da işlem sırası önemli olduğunda, first (ilk değer) ve last (son değer) istatistikleri devreye girer.
first (ilk): Veri dosyasında bir kategoride ilk karşılaşılan değeri gösterir.
last (son): Aynı şekilde son görülen değeri belirtir.
Bu değerler özellikle sürece dayalı ya da zamana duyarlı veri kümelerinde işlevseldir.
Sıralama neden önemli?
SPSS’te OLAP Cube analizinde istatistikler Cell Statistics listesinden seçilir. Bu seçimdeki sıralama, çıktının sunum sırasını belirler. Yani önce toplam, sonra ortalama, sonra standart sapma görmek istiyorsan; bu sıralamayı seçim sırasında doğru yapmalısın. Analizin sadece yapılması değil, okunabilir biçimde sunulması da önemlidir.








Yorumlar