SPSS’te Uzaklık ve Benzerlik Ölçüleri: Veriler Arasındaki Farkı Nasıl Hesaplarız?
- Nominal Analiz
- 31 Eki 2025
- 3 dakikada okunur
Veri analizinde iki değişken veya iki vaka arasındaki ilişkiyi sadece yönüyle değil, büyüklüğüyle de anlamak gerekir.
İşte SPSS’teki “Distances” (Uzaklıklar) penceresi, bu ilişkiyi sayısal biçimde ölçmek için kullanılır.
Bu araç sayesinde veriler arasındaki farklar veya benzerlikler belirlenir ve karmaşık veri yapıları daha anlamlı hale getirilir.

⚙️ Uzaklık Ölçüleri (Dissimilarity Measures) Nasıl Seçilir?
SPSS’te uygun uzaklık ölçüsünü seçmek, verinin türüne bağlıdır. Her veri tipi için farklı ölçüler bulunur:

🔸 1. Sürekli Veriler (Interval Data)
Bu tür veriler, sayısal ölçekteki değişkenleri kapsar (örneğin kan basıncı, nabız, kilo, yaş).Kullanılabilecek ölçüler:
Öklid (Euclidean Distance): İki nokta arasındaki gerçek geometrik uzaklık.
Karesel Öklid (Squared Euclidean): Büyük farkları daha çok vurgular.
Chebychev: Sadece en büyük farkı dikkate alır.
Blok (City-block / Manhattan): Her eksendeki farkların toplamına dayanır.
Minkowski: Kullanıcının belirlediği parametreye göre özelleştirilebilen bir uzaklık türüdür.
Customized: Araştırmacının özel koşullarına göre tanımlanabilen ölçü seçeneğidir.
🔸 2. Sayım Verileri (Count Data)
Bu tür veriler, sıklık veya olay sayısı gibi değerleri içerir.
Uygun ölçüler:
Ki-Kare (Chi-square): Gözlenen ve beklenen frekans farklarına dayanır.
Phi-Kare (Phi-square): İki değişkenin ortak varyansını değerlendirir.
🔸 3. İkili Veriler (Binary Data)
İkili değişkenler “var / yok” veya “1 / 0” biçiminde kategorik değerler içerir.
SPSS bu tür veriler için aşağıdaki ölçüleri sunar:
Euclidean ve Squared Euclidean: Sayısal temelli uzaklıklar.
Size Difference ve Pattern Difference: Varlık ve desen farkını ölçer.
Variance ve Shape: Değişkenlik veya şekil farkını değerlendirir.
Lance and Williams: İleri düzey ikili veri uzaklık ölçüsüdür.
🧠 Not: “Present” ve “Absent” değerlerini belirtmek gerekir. SPSS yalnızca bu iki anlamlı değeri dikkate alır, diğer değerleri yok sayar.
🔍 Verilerin Standardizasyonu (Transform Values)
Analizden önce değişkenlerin ölçüm düzeyleri veya dağılım aralıkları farklıysa, standardizasyon (standardization) işlemi yapılabilir. Bu işlem, uzaklık hesaplamalarını daha dengeli hale getirir.
SPSS’te kullanılabilen standardizasyon yöntemleri:
Z skoru (Z-scores): Ortalama 0, standart sapma 1 olacak şekilde dönüştürür.
–1 ile 1 arası dönüşüm (Range –1 to 1): Veriyi simetrik aralığa sıkıştırır.
0 ile 1 arası dönüşüm (Range 0 to 1): Veriyi normalize eder.
Maksimum mutlak değer 1 (Maximum magnitude of 1): En yüksek değeri 1’e eşitler.
Ortalama 1 (Mean of 1): Tüm değerlerin ortalaması 1 olacak şekilde ölçeklendirir.
Standart sapma 1 (Standard deviation of 1): Değişkenlik bazında eşitlenmiş ölçek sağlar.
🧩 Bu dönüşümler ikili (binary) veriler için uygulanamaz.
🔄 Ölçü Dönüşümleri (Transform Measures)
SPSS, hesaplanan uzaklık değerleri üzerinde ek dönüşümler yapma imkânı sunar. Bu adım, ölçüm sonrası verilerin analizini kolaylaştırır.
Kullanılabilecek dönüşüm türleri:
Mutlak değer alma (Absolute values): Negatif farkları pozitif hale getirir.
İşaret değiştirme (Change sign): Uzaklık yönünü tersine çevirir.
0–1 aralığına ölçekleme (Rescale to 0–1 range): Tüm değerleri normalize eder.
Bu dönüşümler özellikle büyük uzaklık farklarının analizde baskın olmasını önlemek için tercih edilir.

🤝 Benzerlik Ölçüleri (Similarity Measures) Ne İşe Yarar?
Uzaklık ölçüleri farklılıkları hesapladığı gibi, benzerlik ölçüleri de iki değişkenin ne kadar ortak yön taşıdığını gösterir.
🔸 Sürekli Veriler İçin
Pearson Korelasyonu (Pearson Correlation): Doğrusal ilişki gücünü ölçer.
Kosinüs Benzerliği (Cosine Similarity): Değişkenlerin yönsel benzerliğini ölçer (özellikle vektörel analizlerde kullanılır).
🔸 İkili Veriler İçin
SPSS bu tür veriler için oldukça geniş bir ölçüm yelpazesi sunar:
Russell and Rao, Simple Matching, Jaccard, Dice, Rogers and Tanimoto, Sokal and Sneath (1–5), Kulczynski (1–2), Hamann, Lambda, Anderberg’s D, Yule’s Y, Yule’s Q, Ochiai, Phi 4-point, Dispersion.
Bu ölçüler; iki değişkenin aynı anda “var” veya “yok” olduğu durumların oranını dikkate alır. Özellikle tıbbi çalışmalarda semptomların birlikte görülme olasılığını anlamak için kullanılır.
🧠 “Present” ve “Absent” değerleri yine tanımlanmalıdır; SPSS yalnızca bu iki durumu analiz eder.
📊 SPSS’te Standardizasyon ve Dönüştürme Seçenekleri
Tıpkı uzaklık analizinde olduğu gibi, benzerlik analizinde de veri ölçeklerini eşitlemek için standardizasyon uygulanabilir:
Z-skoru, 0–1 aralığına dönüştürme, ortalama 1 yapma gibi yöntemler geçerlidir.
Dönüştürme işlemleri (örneğin absolute values, rescale 0–1) uzaklık ölçümlerinde olduğu gibi sonradan uygulanabilir.
💬 Sonuç: Uzaklık mı, Benzerlik mi?
SPSS’in “Distances” aracı, veri ilişkilerini tek bir yönden değil, hem fark hem benzerlik boyutunda analiz etme olanağı verir.
Sürekli değişkenlerle Öklid veya Pearson türü ölçüler,
İkili değişkenlerle Jaccard veya Dice türü ölçüler,
Sayım verileriyle Ki-kare ya da Phi-kare yöntemi seçilerek verinin yapısı derinlemesine incelenebilir.
Bu analiz, istatistiksel modellemenin ilk adımıdır: Veriler arasındaki mesafeyi anlamak, aralarındaki ilişkiyi çözmenin ön koşuludur.








Yorumlar