Ortalama

Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.

Tarihçe

Ortalama kavramı başlangıçta deniz nakliyatında ortaya çıkan zarar kavramından geliştirilmiştir. Deniz nakliyatında zarar, ya zarar gören eşya sahibi tarafından özel avarya olarak tümüyle yüklenilir veya nakledilen eşyaların satış kârını ortak olarak paylaşanlar tarafından genel avarya ortaklık payına göre karşılanır. Genel avarya hesabının yapılması için geliştirilip kullanılan matematiksel hesaplar aritmetik ortalamanın ilk kullanılma alanı olmuştur. Bu kavrama Arapça avar, Italyanca avaria, Türkçede (pek çok denizcilik terimi gibi İtalyanca'dan alınan) avarya ve İngilizce average adı verilmektedir. İngilizcede aynı sözcük, ve bazı günlük pratik hallerde Türkçede kullanılan averaj sözcüğü ortalamaya eşit anlamda kullanılmaktadır.

İstatistikte bilimsel olarak ortalamalar kavramına bir aksiyomatik yaklaşım J.Bibby (1974) tarafından verilmiştir.[1]

Ortalama tipleri

Ortalama bir sayısal veri dizisininin merkezsel konumunu temsil etmek için seçilen tek bir sayı halinde bir özettir. Eğer veri dizisinde tüm elemanlar aynı sayı ise ortalama bu tek sayıdır. Ancak bu tip veri dizisi pratikte gayet az olarak bulunduğu, hatta nerede ise hiç bulunmadığı için, bir pratik veri dizisinin merkezsel konumunu farklı şekilde temsil edecek ortalamalar geliştirilmiştir. Önce bu ortalamalardan en çok kullanılanları kısaca ele alınacak ve sonra daha geniş kapsamlı bir tablo sunulacaktır.

En çok kullanılan ortalama tipleri

Günlük hayatta en çok kullanılan ortalama türü aritmetik ortalama olmakla birlikte, bazı durumlarda mod, medyan, geometrik ortalama ve diğer ortalama türleri tercih edilmektedir.

Aritmetik ortalama

Aritmetik ortalama bir anakütle veya bir örneklem veri değerlerinin toplamlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne bölünerek elde edilen merkezsel konum değeridir. Bu tanınım şu formülle gösterilir:

Burada örneklem aritmetik ortalaması sembolüdür; anakütle aritmetik ortalaması için μ kullanılır.

Bu yöntem istatistikte sıkça kullanılır. Fakat bazı eksik yönleri vardır.

  • Verilerin ölçülme ölçeğinin aralıklı veya oransal olması gerekir. İsimsel ölçekli veriler için aritmetik ortalama anlamsızdır. Birçok istatistikçi sırasal ölçekli veriler için aritmetik ortalamanın anlamsız olduğunu kabul etmektedirler; ancak pratikte, özellikle bir anketten ortaya çıkarılan, sırasal ölçekli veriler için aritmetik ortalama hesaplanıp önemli alanlarda kullanılmaktadır.
  • Eğer anakütle veya örneklem veri dağılımı simetrik olmayıp çarpıklık gösteriyorsa, aritmetik ortalama merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitmeye eğilimlidir. Bu halde aritmetik ortalama istatistik bilenlerin istatistik bilmeyenlere karşı kullanabilecekleri bir aldatmaca yolu olarak da kullanılabilir.

Örnek: Bir iş yerinde işçiler maaşlarının düşük olmasından dolayı şikayetçidirler. Fakat yöneticiler tam tersini savunabilirler. Maaş dağılımları şöyle olsun:

1 Genel Müdür: 15.000,00 YTL
2 tane Genel Müdür Yardımcısı: her biri 5.500,00 YTL
5 tane idari işler sorumluları (Halkla ilişkiler, İnsan kaynakları...vb): her biri 1.500,00 YTL
30 tane normal personel = her biri 1.000,00 YTL
Böyle bir durumda maaşların aritmetik ortalaması alınırsa
[15000+(2x5500)+(5x1500)+(30x1000)]/38 = 1.671,05 YTL

olarak ortalama aylık maaş hesaplanır. Ama bu ortalama merkezsel konumu göstermez. 38 personelden ancak 3'ü ortalamadan fazla maaş almakta görülmektedir ve maaş dağılımı çok bariz şekilde çarpıktır. Çok küçük sayıda kişi (müdür ve 2 yardımcısı) karşılaştırılmalı olarak çok büyük değerde maaş almakta ama çok büyük sayıda kişi düşük değerde maaş almaktadır. Böylece maaş dağılımı gayet asimetrik olup sağda ince uzun bir kuyruk bulunmaktadır; veri dağılımı pozitif çarpıklık göstermektedir. Bu nedenle maaş aritmetik ortalaması merkezsel konum göstergesi olmaktan çıkmıştır.

GRiS[2]

Aritmetik Ortalama'nın Çarpık veri dizilerinde işlevini kaybetmesi durumunun önüne geçebilmek için, 2014 yılında yayınlanan "İstatistikte Altın Oran" Kitabında yeni bir ortalama tanımlanmıştır[3]. Bu yeni ortalama GRiS (Golden Ratio in Statistics) Ortalama olarak adlandırılmıştır. Bu ortalamanın özelliği, veri dizisindeki her bir elemanın, konumuna göre katkı sağlamasıdır.

GRiS ortalama katsayı maskesi

Veri Dizisi küçükten büyüğe sıralandıktan sonra, her bir elemana bulunduğu konuma göre, yukarıda gösterilen GRiS ortalama katsayı maskesindeki ağırlıklandırma katsayıları atanır. Her bir elemanın Medyan'dan farkı, kendine atanmış ağırlıklandırma katsayısı ile çarpılır, bu çarpımların toplamı, ağırlıklandırma katsayıları toplamına bölünür ve medyandan sapma hesaplanır. Veri dizisinin her iki ucunda bulunan elemanlar, aynı ölçüde baskılandığı için; GRiS ortalama her durumda medyana, aritmetik ortalamadan daha yakın konumlanmaktadır. Bu yöntem sayesinde aritmetik ortalamanın en bariz zayıflığı olan merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitme eğilimi bertaraf edilmiştir.

Geometrik ortalama

Geometrik ortalama bir anakütle veya bir örneklem veri değerlerinin çarpımlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne eşit kökü alınmak suretiyle elde edilen bir merkezsel konum değeridir. Bu tanımlama için formül şöyle verilir:

Burada G geometrik ortalama sembolüdür.

Bu tür ortalamanın da dezavantajları bulunmaktadır:

  • Büyük bir sayıda kök almak el hesabı ile imkânsız olduğu için bu tür ortalama genel olarak elektronik hesap makinelerinin veya bilgisayarların gelişmesinden önce kullanılması çok zor olmaktaydı. Verilerin logaritması alınıp bu logaritma verilerinin toplamı bulunduktan sonra eldeki veri büyüklük sayısına bölünerek geometrik ortalamanın logaritma değeri bulunur, bunun antilogaritmasının alınması gerekirdi. Orta basitlikte hesaplar yapabilen elektronik hesap makinaları veya kompüter kullanılarak geometrik ortalama almak çok kolaylaşmıştır.
  • Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir. Eğer tek bir veri değeri sıfır ise, geometrik ortalama almak anlamsız olacaktır.
  • Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir; isimsel ölçekli, sırasal ölçekli ve aralıksal ölçekli veri değerleri için geometrik ortalama anlamsız olur.

Mod

Mod veri dizisi içinde en çok defa tekrarlanan veri değeridir. Mod isimsel ölçekli veriler için anlamlı olan tek ortalama ölçüsüdür. Ancak veri dizisi içinde tek bir mod olmayabilir yahut birden fazla sayıda mod bulunabilir.

Medyan

Medyan bir veri dizisinin küçükten büyüğe veya büyükten küçüğe sıralanmasından sonra bu dizinin tam ortasında bulunan değerdir. Eğer veri büyüklüğü tek sayılı ise medyan verilen bir veri değerine eşit olur. Eğer veri büyüklüğü çift sayılı ise medyan orta iki değerin ortalaması olur. Medyan bulmak için basit bir algoritmaya göre sıralanmış veri değerlerinin kalan en küçük ve en büyük değerleri birer birer elimine edilir; veri sayısı tek ise en son kalan tek veri medyandır; eğer veri sayısı çift ise son kalan iki veri çiftinin ortalaması medyan olur.

Genelleştirilmiş ortalama türleri

İstatistikçiler ortalama türlerini genelleştiren tek bir formül bulmak için değişik yaklaşımlar kullanmışlardır:

Bu formülde m için değişik değerler değişik ortalama türü verirler: :

    • eğer m = 1 ise aritmetik ortalama;
    • eğer m = 2 ise kuadratik ortalama;
    • eğer m = -1 ise harmonik ortalama;
    • limit m → 0 ise geometrik ortalamaya yaklaşır.
  • Genelleştirilmiş f-ortalaması formülü diğer bir örnektir. Genelleştirilmiş f-ortalaması için formül şudur:

Burada f tersi alınabilir bir fonksiyondur. Bu formül değişik ortalamalar için şu şekilleri alır:

    • Geometrik ortalama için f(x)=log x olur.
    • Harmonik ortalama için f(x)= 1/x olur.
    • Çok az bilinen üstel ortalama için f(x)=ex olur.

Ancak bu genelleştirme ile tüm ortalamaların ayrı ayrı formüllerini bulmak imkânsızdır.

  • Diğer bir genelleştirme, ortalamalar listesi elamanlarının permütasyonu halinde simetrik olan bir g(x1, x2, ..., xn) fonksiyonunun değişik şekillerde ifadesi ile yapılır:[4]
    • Aritmetik ortalama için g(x1, x2, ..., xn) =x1+x2+ ...+ xn.
    • Geometrik ortalama için g(x1, x2, ..., xn) =x1·x2· ...· xn.
    • Harmonik ortalama için g(x1, x2, ..., xn) =x1−1+x2−1+ ...+ xn−1.

Değişik ortalama tipleri özeti

İstatistik bilim dalında bir sıra değişik ortalama tipleri geliştirilmiş ve bunlardan araştırıcının isteğine göre birinin veya birkaçının eldeki veriler için merkezsel konum ölçüsü olarak kullanılması imkânı sağlanmıştır.

İsimDenklem veya betimleme
Aritmetik ortalama
Medyan (ortanca)Bu yüksek değerde olan veriler ile düşük değerde olan verilerin tam ortasında bulunan bir sayı.
Geometrik medyanRn düzeyindeki noktalar için, medyan kavramının, matematik rotasyon dönüşümünde sabit kalan bir genişletilmesi,
Mod (tepedeğer)Verilerin en çok defa tekrarlanmış değeri
Geometrik ortalama
Harmonik ortalama
Kuadratik ortalama
(veya ortalama kareler karekökü)
Genelleştirilmiş ortalama
Ağırlıklı ortalama
Kesilmiş ortalamaBelirli bir yüzde oranda en yüksek ve en düşük veri değerlerinin bertaraf edilmelerinden sonra hesaplanan aritmetik ortalamadır.
Çeyrekler açıklığı ortasıÇeyrekler açıklığı kullanılarak kesilmiş ortalamanın özel bir hali.
Açıklık-ortası
Winsorize ortalamasıBir çeşit kesilmiş ortalama olup belirli bir yüzde olarak kesilen en yüksek ve en düşük değerler bertaraf edileceğine kalan sayılar için en yuksek ve en düşük veri değerleri yerine ikame edilirler.
Anualizasyon

Ayrıca bakınız

Kaynakça

  1. Bibby, J. (1974) "Axiomatisations of the average and a further generalization of monotonic sequences" Glasgow Mathematical Journal C.15, say.63–65.
  2. Gunver, Mehmet Guven; Senocak, Mustafa Sukru; Vehid, Suphi. "TO DETERMINE SKEWNESS, MEAN AND DEVIATION WITH A NEW APPROACH ON CONTINUOUS DATA" 2 Haziran 2018 tarihinde Wayback Machine sitesinde arşivlendi.PONTE International Scientific Researchs Journal73 (2). doi:10.21506/j.ponte.2017.2.34
  3. Mehmet Güven GÜNVER, Prof. Dr. Mustafa Şükrü ŞENOCAK, Doç Dr. Suphi VEHİD, İstatistikte Altın Oran, Türkmen Kitabevi, 2014, ISBN : 9786054749409
  4. Bakın Bibby,J. (1974) "Axiomatisations of the average and a further generalisation of monotonic sequences", Glasgow Mathematical Journal, C.15, say. 63–65,
  • Spiegel, Murray R, ve Stephens, Larry J. (Tr.Çev.: Çelebioğlu, Salih) (2013) İstatistik, İstanbul: Nobel Akademik Yayıncılık ISBN 9786051337043

Dış bağlantılar

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.