top of page

OLAP Cubes (Çok Boyutlu Veri Analizi) Analizinde Kullanılan Özet İstatistikler: SPSS'te Alt Grup Değerlendirme Seçenekleri

OLAP Cubes analizi, SPSS kullanıcılarına çok boyutlu veri setlerini çaprazlayarak inceleme ve her bir kategori kombinasyonu için özet istatistikler üretme imkânı sunar. Bu özet istatistikler sayesinde, sadece sayısal sonuçlar değil, aynı zamanda verinin dağılımı, yapısı ve simetrisi hakkında da fikir edinilebilir.

OLAP CUbes SPSS Çok boyutlu veri analizi kategori kombinasyonu ile özet istatistikler

Temel ölçülerle başlamak

Her analizde ilk bakılan ölçütlerden biri toplam değerdir. OLAP Cube tablolarında bu genellikle sum (toplam) olarak gösterilir. Değerlerin toplanarak bir bütünlük oluşturduğu bu ölçüm, özellikle maliyet, süre, puan gibi sayısal hacimlerle çalışırken önemlidir. Toplamın yanında yer alan number of cases (N) – (gözlem sayısı), analizde kullanılan geçerli kayıt miktarını gösterir. Her iki ölçüm de verinin sayısal büyüklüğü hakkında fikir verir.


Merkezi eğilim ölçüleri

Verilerin ortalaması, medyanı ve gruplu medyanı, bir değişkenin alt kategorilerde nasıl dağıldığını göstermek için kullanılır.

  • mean (aritmetik ortalama): Klasik ortalama değeridir. Aykırı değerlere duyarlıdır.

  • median (ortanca): Veriler küçükten büyüğe sıralandığında ortada kalan değeri verir.

  • grouped median (gruplu ortanca): Özellikle yaş gibi gruplandırılarak kodlanan verilerde kullanılır. Örneğin 30’lu yaşlar “35”, 40’lı yaşlar “45” olarak kodlandığında, medyan bu kodlarla hesaplanır.


Minimum, maksimum ve aralık

Bir grubun uç noktaları, dağılımın genişliği hakkında önemli bilgiler verir.

  • minimum (en küçük değer): Gözlenen en düşük değeri belirtir.

  • maximum (en büyük değer): Gözlenen en yüksek değeri gösterir.

  • range (aralık): Maksimum ile minimum arasındaki farktır.

Bu üç ölçüm, grupların iç yapısında uç değerlerin nasıl dağıldığını anlamayı sağlar.

SPSS Minimum Maksimum ve Aralık İstatistik

Dağılım ölçümleri: Varyans ve standart sapma

Ortalama tek başına yeterli değildir; verilerin bu ortalama etrafında nasıl dağıldığını anlamak gerekir.

  • standard deviation (standart sapma): Gözlemlerin ortalamadan ne kadar saptığını gösterir.

  • variance (varyans): Standart sapmanın karesidir. Daha teknik analizlerde kullanılır.

Her iki ölçü de özellikle normal dağılıma sahip verilerde yayılımı yorumlamak için kullanılır.

SPSS OLAP Cubes Dağılım Ölçüleri Varyans ve Standart Sapma

Ortalama değer ne kadar güvenilir?

Bir ortalamanın güvenilirliği, her zaman tek başına anlaşılmaz. Bu nedenle standard error of mean (ortalama standart hatası), ortalamanın ne kadar değişkenlik gösterebileceğini ölçer. Aynı dağılımdan farklı örneklemler alındığında ortalamanın hangi aralıkta kalacağını tahmin etmeye yardımcı olur. Bu hata payı yüksekse, o ortalamanın güvenilirliği sorgulanmalıdır.


Simetri bozulmuş mu? Çarpıklık ve basıklık

Verilerin simetrik olup olmadığını anlamak için skewness (çarpıklık) ve kurtosis (basıklık) değerlerine bakılır:

  • skewness (çarpıklık):

    • 0’a yakınsa simetriktir.

    • Pozitifse sağa, negatifse sola kuyrukludur.

  • kurtosis (basıklık):

    • 0 → Normal dağılım

    • 0 → Sivri dağılım (uç değerler fazla)

    • < 0 → Basık dağılım (uç değerler az)


Bu iki ölçümün anlamlı olup olmadığını anlamak için standart hataları da hesaplanır:

  • standard error of skewness (çarpıklık standart hatası)

  • standard error of kurtosis (basıklık standart hatası)

Değerin kendi standart hatasının ±2 katından büyük olması durumunda, dağılımın normalden anlamlı düzeyde saptığı kabul edilir.


Alternatif ortalamalar: Geometrik ve harmonik

Her zaman aritmetik ortalama kullanılmaz. Özellikle orantısal ya da çarpımsal veri söz konusuysa farklı türde ortalamalara başvurmak gerekir.

  • geometric mean (geometrik ortalama): Gözlem değerlerinin çarpımının, gözlem sayısı kadar kökünün alınmasıyla hesaplanır.

  • harmonic mean (harmonik ortalama): Grup büyüklükleri eşit olmadığında daha doğru sonuçlar verir. Özellikle oran, hız gibi verilerde kullanılır.

Bu ortalamalar, klasik yöntemlerle yanıltıcı sonuçlar alınan gruplarda daha güvenilir bir genel görünüm sağlar.


Oranlar ne söylüyor?

Sadece mutlak değerler değil, oranlar da veri yapısını anlamada çok etkilidir. OLAP Cubes analizinde kullanılan yüzdelik oranlar şunlardır:

  • percent of total N (toplam gözlem oranı): Kategorinin tüm veri içindeki payı

  • percent of total sum (toplam değer oranı): Kategorinin toplam değer içindeki katkısı

  • percent of N within grouping (grup içi gözlem oranı): Aynı gruptaki gözlem yüzdesi

  • percent of sum within grouping (grup içi toplam değer oranı): Toplam değer üzerinden grup içindeki pay

Bu oranlar, bir grubun veri seti içindeki sayısal ve ağırlıksal önemini göstermede kullanılır. Örneğin “cerrahi geçirmiş erkek hastaların toplam tedavi maliyetine etkisi nedir?” gibi bir soruya bu oranlar üzerinden yanıt aranabilir.

SPSS OLAP Cubes toplam gözlem oranı , toplam değer oranı , grup içi gözlem oranı , grup içi toplam değer oranı istatistik

İlk ve son değerler

Zaman dizilimi ya da işlem sırası önemli olduğunda, first (ilk değer) ve last (son değer) istatistikleri devreye girer.

  • first (ilk): Veri dosyasında bir kategoride ilk karşılaşılan değeri gösterir.

  • last (son): Aynı şekilde son görülen değeri belirtir.

Bu değerler özellikle sürece dayalı ya da zamana duyarlı veri kümelerinde işlevseldir.


Sıralama neden önemli?

SPSS’te OLAP Cube analizinde istatistikler Cell Statistics listesinden seçilir. Bu seçimdeki sıralama, çıktının sunum sırasını belirler. Yani önce toplam, sonra ortalama, sonra standart sapma görmek istiyorsan; bu sıralamayı seçim sırasında doğru yapmalısın. Analizin sadece yapılması değil, okunabilir biçimde sunulması da önemlidir.

Yorumlar


bottom of page