top of page

Betimsel İstatistikler: Veri Analizinin İlk Adımı

Betimsel istatistikler, bir veri setini anlamanın ve araştırma sürecine sağlam bir başlangıç yapmanın en temel yöntemidir. Araştırmacı, veri topladıktan sonra ilk olarak verinin yapısını, dağılımını, ortalamasını, en düşük ve en yüksek değerlerini ve değişkenliğini inceleyerek elde ettiği bilgiye anlam kazandırır.


Çünkü herhangi bir çıkarım testine geçmeden önce verinin “nasıl göründüğünü” bilmek zorunludur.


Veri seti ister küçük bir örneklemden ister geniş bir popülasyondan gelsin, betimsel istatistikler veriye dair ilk fotoğrafı sunar ve araştırmacıya sonraki aşamada hangi yöntemleri kullanacağını belirlemede yol gösterir.

betimsel tanımlayıcı istatistikler nelerdir tanımları nelerdir ne işe yararlar basit anlatım ve örnekli açıklama

Betimsel İstatistik Türleri

Betimsel istatistikler üç temel başlık altında incelenir:


1) Dağılım (Frekans Yapısı)

Bir değişkendeki her bir değerin veri setinde kaç kez tekrar ettiğini gösterir. Frekans tabloları veya grafikler (çubuk grafikleri, histogramlar) ile sunulur. Örneğin, bir araştırmada katılımcıların kaç kez kütüphaneye gittiğine bakıyorsanız, sıklık tablosu bize bu davranışın veri setindeki yaygınlığını gösterir.


2) Merkezi Eğilim (Ortalama Değerler)

Bir veri setinin “merkezini” ifade eden üç yaygın ölçü vardır:

  • Aritmetik Ortalama

  • Ortanca (Median)

  • Tepe Değeri (Mod)


Ortalama, tüm değerlerin toplamının gözlem sayısına bölünmesiyle elde edilir. Ortanca, veri sıralandığında tam ortada kalan değerdir. Mod ise veri setinde en çok tekrar eden değerdir.

Bu üçü birlikte, verinin nerede yoğunlaştığını anlamayı sağlar.


3) Değişkenlik (Dağılım Genişliği)

Verilerin ortalamadan ne kadar uzaklaştığını gösterir.

  • Aralık (Range)

  • Standart Sapma

  • Varyans


Örneğin standart sapma yüksekse, veri setinde değerler ortalamadan oldukça uzaklaşmıştır; bu da verinin homojen olmadığını gösterir.


Örnek Bir Uygulama

Katılımcılara son bir yıl içinde kaç kez kütüphaneye gittikleri sorulsun.


İlk altı katılımcının cevapları şöyle olsun:

15, 3, 12, 0, 24, 3

Bu küçük veri seti üzerinde üç tür betimsel istatistik incelemesi yapılabilir.


• Ortalama

Toplam: 57

Gözlem sayısı: 6

Ortalama = 57 / 6 = 9,5


• Ortanca

Sıralı değerler: 0, 3, 3, 12, 15, 24

Ortadaki iki değer: 3 ve 12

Ortanca = (3 + 12) / 2 = 7,5


• Mod

En çok tekrar eden değer: 3

Mod = 3


• Aralık

En büyük – en küçük = 24 – 0

Aralık = 24


• Standart Sapma

Standart sapma ≈ 9,18


Bu veri setinde ortalama oldukça yüksek görünse de standart sapmanın büyük olması, değerlerin birbirinden oldukça farklı olduğunu gösterir. Bu da tek başına ortalamaya bakmanın yanıltıcı olabileceğini kanıtlar.


Tek Değişkenli (Univariate) Betimsel İstatistikler

Tek bir değişkenin tüm özellikleri dağılım, merkezi eğilim ve değişkenlik ölçüleriyle birlikte değerlendirilir.


Örneğin “kütüphane ziyaret sayısı” değişkeni için aşağıdaki gibi bir tablo oluşturulabilir:

Ölçü

Değer

Gözlem Sayısı

6

Ortalama

9,5

Ortanca

7,5

Mod

3

Standart Sapma

9,18

Varyans

84,3

Aralık

24

Bu özet tablo, tek bir değişken hakkında hızlı ve anlaşılır bir değerlendirme yapmayı sağlar.


İki Değişkenli (Bivariate) Betimsel İstatistikler

Bir araştırmada birden fazla değişken varsa, değişkenlerin birlikte nasıl davrandığı incelenir. Amaç, ilişkilerin ve örüntülerin ilk aşamada tanımlanmasıdır.


• Çapraz Tablolar (Contingency Tables)

Bu tablolar iki değişkenin kesişme noktalarını gösterir.

Örneğin:

  • Düşey eksen: “Yaş grubu”

  • Yatay eksen: “Kütüphane ziyaret sıklığı”

Bu sayede iki değişkenin birlikte nasıl dağıldığı kolayca görülür.


• Yayılım Grafiği (Scatter Plot)

Sürekli iki değişken arasındaki ilişkiyi görselleştirmek için kullanılır.

Örnek: “Kütüphane ziyaret sayısı” ile “sinema salonuna gitme sıklığı” arasındaki ilişki grafikle gösterildiğinde, eğilim çizgisi bize bu iki davranış arasında ters yönlü bir ilişki olup olmadığını gösterebilir.


Betimsel İstatistiklerin Araştırma Sürecindeki Yeri

Betimsel istatistikler, veri analizi sürecinin temel taşıdır.

Çünkü:

  • Veri yapısı anlaşılmadan ileri analiz yapılamaz.

  • Uç değerler ve hatalı girişler bu aşamada fark edilir.

  • Doğru test türü (parametrik / parametrik olmayan) ancak dağılım incelenerek belirlenir.

  • Sonraki aşama olan çıkarımsal istatistiklerin temel varsayımlarının uygunluğu buradan anlaşılır.


Kısacası betimsel istatistikler, veriyi “okumayı” sağlar; çıkarımsal istatistikler ise veriye “yorum katmayı” ve “genelleme yapmayı”.

Yorumlar


bottom of page