İstatistik Ders-2 : Ortalama Hesaplama

Ortalama Hesaplama

Ortalama hesaplamaya geçmeden önce hesaplama yaparken kullanacağım programdan bahsetmek istiyorum.

Jupyter Notebook

İstatistiksel hesaplama yaparken Jupyter Notebook (eski adı IPython Notebook) kullanacağım. Jupyter Notebook, açık-kaynak bir web uygulamasıdır. Bu uygulama ile içinde kod, denklemler, görseller ve metin içeren belgeler oluşturabilir ve paylaşabilirsiniz. Bu uygulamanın kullanım alanları arasında veri temizleme ve dönüştürme, sayısal simulasyon, istatistiki modelleme, veri görselleştirme, makina öğrenmesi ve daha bir çok alan vardır. Uygulamayı yüklemek isterseniz https://jupyter.org/ sitesini ziyaret edin. Excel, SPSS, R Studio veya başka bir program da kullanabilirsiniz. 

Ortalama Nasıl Hesaplanır?

Ortalama (average), bize bir veri grubunun tamamı hakkında bilgi verir.. Örneğin, bir sınıftaki öğrencilerin matematik dersinden aldıkları puanların ortalaması o sınıftaki öğrencilerin matematik dersindeki başarısı hakkında bize bilgi verir. 

İstatistikte ortalamalar (averages) merkezi eğilim ölçümleri (measures of central tendency) olarak da geçer ve üç farklı biçimde hesaplanır. Bunlar ortalama (mean), ortanca (median) ve mod (mode)’dur. Bunların her biri verilerin dağılımları hakkında farklı bir bakış açısı verir. Şimdi sırayla bunlara bakalım.

Ortalama (Mean)

Ortalama, en fazla bilinen ortalama hesaplama yöntemidir. Burada kısaca bir sayı grubundaki tüm değerler toplanır ve bir toplam değer elde edilir. Daha sonra kaç tane sayı varsa bu hesaplanır ve toplam değer, elde edilen bu sonuca bölünür. Bu yaptığımız işlem aritmetik ortalama olarak da geçer. Farklı ortalama alma yöntemleri de vardır. Bunlar geometrik ortalama, harmonik ortalama gibi. Fakat bunlar bu yazının konusu değildir. Şimdi bir örnek yapalım. Örneğin, bir önceki dersteki öğrencilerin yaşları toplamı 161’dir. Öğrenci sayısı ise 9’dur. Burada öğrencilerin yaşlarının ortalaması ise 161 / 9 = 17,8’dir. 

Ortalama almanın formülü şu şekildedir:

[latexpage]\[\overline{X} = \frac{\Sigma{X}}{n}}$ \]

  • Burada X üzeri çizgi ($\overline{X}$) ortalama demektir.
  • Σ sembolü Yunan alfabesindeki Sigmadır. Toplam demektir. Kendisinden sonra gelen değerleri birlikte toplar.
  • X ise veri grubundaki tüm değerlerdir. Örneğin öğrencilerin aldığı puanlardır.
  • n ise ortalamasını almak istediğiniz grubun büyüklüğüdür. Buna istatistikte örneklem büyüklüğü denmektedir.

Şimdi bir örnek yapalım. Aşağıda, öğrencilerin aldıkları matematik dersinden aldıkları puanları gösteren bir tablo vardır. 

Öğrenci Adı Aldığı Puan
Hilal 75
Duru 80
Mehmet 70
Furkan 65

Şimdi bu puanların ortalamasını bulalım.

[latexpage]\[\overline{X} = \frac{\Sigma{X}}{n}} = \frac{75 + 80 + 70 + 65}{4} = 72,5 }\]

Peki bunu Jupyter Notebook ile nasıl hesaplarım. Buna dair hesaplama aşağıdadır. 

[advanced_iframe src=”https://yalinanaliz.com/wp-content/uploads/2018/04/İstatistik-Ders2.html” width=”100%” height=”400″]

Formülüzdeki n’nin örneklem büyüklüğü olduğunu söylemiştik. Bir de N (büyük n) vardır. Bu da evren büyüklüğüdür. Buradaki evren büyüklüğünü o okuldaki matematik sınavına giren tüm öğrenci sayısı diyebiliriz. Ben burada sadece o okuldaki dört öğrenciden oluşan bir sınıfını örneklem olarak aldım. Yaptığım işlem ise bu örneklemin ortalamasını almaktır. Buna da örneklem ortalaması (sample mean) denir.

Bazı yerlerde evren (population) ifadesi kitle, anakütle  gibi farklı isimlerle geçebilir. Peki niye örneklem alıyoruz. Çünkü tüm evreni çalışmak bazı durumlarda maliyetli veya çok zor olabilir. Örneğin, Türkiye’deki seçimlerle ilgili bir çalışma yapmak istiyorsunuz. Burada evren Türkiye’deki tüm seçmen kitlesidir. Siz bu tüm seçmenlere ulaşıp tercihlerini sormanız çok zor ve maliyetlidir. Bunun yerine belirli seçmen kitlesini (buna örneklem diyoruz) seçip bunlar üzerinde çalışma yapmanız daha makuldur. Aşağıdaki şekilleri az önce verdiğim örneğe uyarlayabilirsiniz. 

Eğer tüm evreni (kitleyi) çalışıyor ve bunun ortalamasını alıyorsanız burada $\overline{X}$ yerine $\mu$ harfini kullanın. $\mu$ Yunan alfabesinden bir harftir ve mü diye okunur.

Ağırlıklıklı Ortalama

Bazı durumlarda bir değer birden fazla tekrar edebilir. Örneğin, bir sınıfta birden fazla kişi aynı puanı almış olabilir. Bu puanların ortalamasını bulmak için basit bir şekilde yan yana toplayıp kişi sayısına bölebilirsiniz ya da puanlar ve tekrar sayısından bir tablo oluşturup daha sonra bu iki değeri çarpar ve toplam frekansa bölebilirsiniz. İkinci yaptığınız işleme ağırlıklı ortalama (weighted mean) denmektedir. Aşağıda bunun bir uygulaması vardır. 

Puan Tekrar Sayısı (Frekans) Puan x Tekrar Sayısı
80 5 400
75 9 675
76 1 76
85 4 340
Toplam 19 1491

Burada ağırlıklı ortalama 1491 / 19 = 78,5’tir. Bu örnekte 80 puanını 5 kişi almıştır. 5 tane 80’i alt alta yazmaktansa tekrar sayısını yazıp hesaplamak daha kolaydır. Ağırlıklı ortalama bu şekildeydi.

Bazı durumlarda ortalama grubu tam yansıtmayabilir. Örneğin, 5 kişilik bir şirkette çalışanların maaşları 2000, 3000, 4000, 5000, 15000 şeklindedir. Bunları ortalaması 5800’dür. Buradan bu şirkette çalışanların ortalama maaşı yüksektir şeklinde bir sonuç  çıkarmanız hatalı olur.  Çünkü burada 15000 şeklinde bir uç değerimiz vardır. Bu değer ortalamayı yükseltir. Bu açıdan aritmetik ortalamalar uç değerlere karşı hassastır. Bir uç değer ortalamayı yükseltir ve yanlış yorumlara neden olur.  Bu tip gelir düzeyi ortalaması hesaplamalarında aritmetik ortalama değil ortanca (median) ortalama yöntemi kullanılır. Bir sonraki yazıda bu konudan bahsedeciğiz. Hoşçakalın.

 

Bir Cevap Yazın