SPSS OLAP Cubes (Çok Boyutlu Veri Analizi)
- Nominal Analiz
- 13 saat önce
- 4 dakikada okunur
Analizin Amacı
SPSS’te OLAP Cubes (Online Analytical Processing) yöntemi, sayısal (sürekli) değişkenlerin ortalama, toplam, varyans gibi istatistiksel değerlerini; bir veya birden fazla kategorik gruplama değişkenine göre çok boyutlu biçimde özetlemek için kullanılır.
Bu yöntem, klasik tablo analizlerinden farklı olarak çok katmanlı (multi-layered) yapı oluşturur ve her kategori kombinasyonu için özet istatistikleri ayrı ayrı gösterir.
OLAP Cubes Özellikleri
Çok boyutlu analiz yapısı: Aynı anda birden fazla değişken üzerinden tablo ve alt tablo oluşturur.
Kapsamlı istatistik listesi: Toplam, ortalama, medyan, varyans, standart sapma, çarpıklık, basıklık gibi temel tanımlayıcı istatistikleri otomatik hesaplar.
Katman (Layer) desteği: Her bir kategorik değişken, ayrı bir “katman” olarak işlenir ve bu sayede örneğin “cinsiyet × diyabet durumu × yaş grubu” gibi çoklu kombinasyonlar incelenebilir.
Özelleştirilebilir istatistik seçimi: İstenilen istatistik türleri seçilerek gereksiz verilerden arındırılmış bir özet oluşturulabilir.
SPSS’te OLAP Cubes Uygulama Adımları
Menüden: Analyze → Reports → OLAP Cubes... seçilir.

Summary Variables (Özet Değişkenler): Sayısal değişken(ler) seçilir.(örneğin “kalış süresi”, “tedavi maliyeti” vb.)
Grouping Variables (Gruplama Değişkenleri): Kategorik değişken(ler) belirlenir.(örneğin “cinsiyet”, “diyabet durumu”, “cerrahi komplikasyon”)

Statistics... sekmesinden istenen istatistik türleri işaretlenir (örneğin Mean, N, Std. Deviation).

Differences... sekmesinden gruplar veya değişkenler arası fark hesaplamaları eklenebilir.

Title... sekmesinden tablo başlığı özelleştirilebilir.

Elde Edilebilecek İstatistiksel Sonuçlar
1. Tanımlayıcı Değerler
Sum (Toplam): Seçilen sürekli değişkenin tüm değerlerinin toplamı.
Mean (Ortalama): Kategorilere göre ortalama değer.
Median (Medyan): Dağılımın ortasındaki gözlem.
Grouped Median: Kodlanmış grup verileri üzerinden medyan.
Minimum / Maximum: Değişkenin aldığı en düşük ve en yüksek değer.
Range (Aralık): Maksimum ile minimum arasındaki fark.
2. Dağılım Ölçütleri
Standard Deviation (Standart Sapma): Verilerin ortalama etrafındaki yayılımını gösterir.
Variance (Varyans): Değerlerin ortalama etrafındaki kare farklarının ortalamasıdır.
Skewness (Çarpıklık): Dağılımın simetrik olup olmadığını ölçer.
Kurtosis (Basıklık): Dağılımın sivriliğini veya basıklığını gösterir.
3. Yüzdesel Değerler
% of Total Cases (Toplam Vaka Yüzdesi): Her kategorinin toplam içindeki oranı.
% of Total Sum (Toplam Değer Yüzdesi): Her kategorinin toplam değere katkı oranı.
% within Group (Grup İçi Yüzde): Aynı gruptaki diğer kategorilere göre yüzdesel dağılım.
4. Özel Ortalama Türleri
Geometric Mean (Geometrik Ortalama): Oran veya büyüme temelli analizlerde tercih edilir.
Harmonic Mean (Harmonik Ortalama): Grupların örneklem büyüklükleri eşit olmadığında daha doğru ortalama tahmini sağlar.
Örnek Uygulama Alanı
Bu aşamada örnek olarak, tıbbi veri analizlerinde şu tür bir yapı kullanılabilir:
Sürekli değişken: Tedavi süresi, hastane maliyeti veya yaş
Gruplama değişkenleri: Cinsiyet, diyabet durumu, cerrahi sonuç
Bu değişkenler OLAP Cubes aracılığıyla çok boyutlu olarak birleştirildiğinde, örneğin şu sorulara yanıt bulunabilir:
Diyabetli hastalarda ortalama tedavi süresi ne kadar?
Cinsiyet ve diyabet etkileşimi, tedavi maliyetini nasıl değiştiriyor?
Komplikasyon görülen hastaların yaş ortalaması ne yönde sapma gösteriyor?

SPSS Çıktısının Yorumlanması

Case Processing Summary – Yorumlama
Bu tablo, üç ayrı sürekli değişkenin (hastanede kalış süresi, tedavi maliyeti, yaş) çok boyutlu analiz öncesi örnekleme dâhil edilme durumunu göstermektedir. Her bir değişken için aynı üç kategorik faktör (cinsiyet, diyabet öyküsü ve cerrahi işlem durumu) ile çaprazlama yapılmıştır.
1. Ortak Yapı
Analiz toplam 10.000 gözlem üzerinden yürütülmüştür.
Tüm değişkenlerde aynı örneklem kullanılmıştır.
Üç ayrı analiz yürütülmesine rağmen, geçerli ve geçersiz vaka sayıları her biri için aynıdır.
2. Dahil Edilen Vakalar (Included Cases)
N = 7.998 (%80,0)
Bu gruptaki bireylerin tüm ilgili değişkenlerde (örneğin yaş, cinsiyet, diyabet öyküsü, cerrahi işlem durumu) eksiksiz bilgiye sahip olduğu anlamına gelir.
%80’lik oran, çok boyutlu analiz için yeterli bir örneklemin elde edildiğini ve güvenilir karşılaştırmalar yapılabileceğini gösterir.
3. Hariç Tutulan Vakalar (Excluded Cases)
N = 2.002 (%20,0)
Bu gözlemler, en az bir değişkende eksik bilgi bulunduğu için otomatik olarak dışlanmıştır.
Eksikliklerin yaş, tedavi maliyeti veya geçmiş tıbbi öykülerde (örneğin diyabet bilgisi) yoğunlaşması muhtemeldir.
%20’lik eksiklik oranı kabul edilebilir seviyede olsa da, veri kalitesi açısından dikkat çekicidir.
4. Toplam (Total)
N = 10.000 (%100,0)
Bu değer, veri setinin başlangıçta kaç gözlem içerdiğini gösterir.
OLAP Cubes analizleri yalnızca geçerli 7.998 vaka üzerinden gerçekleştirilmiştir.
5. Yorumsal Değerlendirme
Her üç analizde de aynı örneklem kullanıldığı için, karşılaştırmalı alt grup analizleri tutarlı bir yapıya oturtulabilir.
Cinsiyet, diyabet öyküsü ve cerrahi işlem durumu gibi değişkenler her bir sürekli değişken için aynı mantıkla kırıldığı için, analizler arası karşılaştırma yapılması mümkündür.
Analiz yapısı şu tip soruları desteklemeye uygundur:
Diyabeti olan ve olmayan bireylerin hastanede kalış süresi fark ediyor mu?
Cerrahi işlem geçiren erkek ve kadın hastalar arasında maliyet farkı oluşuyor mu?
Yaş ortalamaları, cerrahi işlem görme durumuna göre değişiyor mu?

OLAP Cubes – Sonuçların Yorumlanması
Genel Bilgi
Analiz 7.998 geçerli vaka üzerinden yapılmıştır.
Her üç değişken de (hastanede kalış süresi, tedavi maliyeti ve yaş) aynı örneklem üzerinde değerlendirilmiştir.
Yüzde değerleri %100 olarak verilmiştir; bu, tüm hesaplamaların yalnızca geçerli vakaları kapsadığını gösterir.
Hastanede Kalış Süresi
Toplam kalış süresi 28.629 gün olarak hesaplanmıştır.
Ortalama kalış süresi 3,58 gün düzeyindedir.
Standart sapma 2,685, kalış sürelerinde belirli bir çeşitlilik olduğunu göstermektedir.
Ortalama düşük olmasına rağmen sapmanın yüksek oluşu, bazı hastaların uzun süreli yatışlarının genel ortalamayı etkilemiş olabileceğini düşündürür.
Tedavi Maliyeti (bin TL)
Toplam tedavi maliyeti 159.906,1 bin TL’dir.
Ortalama maliyet 19,993 bin TL (yaklaşık 19.993 TL) seviyesindedir.
Standart sapma 17,3126, maliyetlerin hastadan hastaya ciddi şekilde değiştiğini gösterir.
Bu değişkenlik, farklı tedavi türleri, cerrahi işlemler veya diyabetli hastaların ek bakım maliyetleriyle ilişkili olabilir.
Yaş
Toplam yaş toplamı 494.656 olarak verilmiştir.
Ortalama yaş 61,85 yıl’dır.
Standart sapma 8,884, yaş dağılımının genellikle 50–70 aralığında yoğunlaştığını gösterir.
Bu dağılım, örneklemin ağırlıklı olarak orta-ileri yaş yetişkinlerden oluştuğunu düşündürmektedir.
Genel Değerlendirme
Üç değişken birlikte incelendiğinde, örneklemin yaşça ileri bireylerden oluştuğu, tedavi maliyetlerinin yüksek değişkenlik gösterdiği ve kalış süresinin kısa ama heterojen olduğu görülmektedir.
Bu yapı, sağlık hizmeti türleri ve hastalık profillerinin çeşitliliğini yansıtır.
OLAP Cubes analizi sayesinde, ilerleyen adımlarda bu ortalamalar cinsiyet, diyabet öyküsü veya cerrahi işlem durumuna göre kırılarak detaylı karşılaştırmalar yapılabilir.
Avantajları
Çok boyutlu veri çözümleme: Farklı gruplar arası etkileşim kolayca incelenir.
Otomatik istatistik üretimi: Tüm temel istatistikler tek adımda elde edilir.
Klinik araştırmalara uygun: Sağlık verilerinde yaş, cinsiyet, tanı gibi çoklu faktörlerin etkisini bir arada analiz eder.
Raporlama kolaylığı: Sonuçlar tablo formatında özetlenir ve dışa aktarılabilir.







Yorumlar