Pareto dağılımı
Pareto dağılımı, olasılık kuramı ve istatistik bilim dallarında birçok pratik uygulaması bulunan ve "küçük" bir nesnenin bir "büyük" nesneye dağılımında kararlılık elde edildiği hallerde kullanılan bir sürekli olasılık dağılımı veya bir güç kuramıdır. İlk olarak bir İtalyan iktisatçısı olan Vilfredo Pareto tarafından ekonomilerde bireylerin servet dağılımını göstermek için kullanılmıştır. İktisat bilim dalı dışında bu dağılım Bradford dağılımı adı altında da bilinmektedir.
Olasılık yoğunluk fonksiyonu xm = 1 oldugu halde çeşitli k değerleri için Pareto olasılık yoğunluk fonksiyonları. Yatay eksen x parametredir. Limitte k → ∞, dağılım δ(x - xm) yaklaşır; burada δ Dirac delta fonksiyonudur. | |
Yığmalı dağılım fonksiyonu xm = 1 oldugu halde çeşitli k değerleri icin Pareto yığmalı dağılım fonksiyonları. Yatay eksen x parametredir. | |
Parametreler | ölçek (reel) shape (reel) |
---|---|
Destek | |
Olasılık yoğunluk fonksiyonu (OYF) | {{{OYF}}} |
Birikimli dağılım fonksiyonu (YDF) | {{{YDF}}} |
Ortalama | for |
Medyan | |
Mod | |
Varyans | icin |
Çarpıklık | icin |
Fazladan basıklık | icin |
Entropi | |
Moment üreten fonksiyon (mf) | tanımlanmaz; ham momentler icin metine bakın |
Karakteristik fonksiyon |
Uygulama alanları
Pareto dağılımı iktisat dışında, sosyal bilimler, fen, geofizik, sigortacılık ve birçok gözümlenen doal fonomen incelemeleri için geniş bir alanda uygulanabilimektedir.
- İktisatta, Wilfredo Pareto'nun ilk defa gösterdiği gibi, herhangi bir ülke veya idarî birim içinde servetin veya gelirin büyük bir kısmının incelenen sosyetenin küçük bir bireyler grubu tarafından sahip olunduğunu bu dağılım çok bariz bir şekilde göstermektedir. Bu öneri biraz daha az bilimsel olarak bazen Pareto prensibi veya 80-20 ilkesi olarak açıklanmakta ve bir ülkenin nüfusunun %20'si, servetin veya gelirin %80'ine sahip olduğu bu şekilde ifade edilmektedir.
- Tek hisse senedi için standardize edilmiş fiyat getirileri dağılımı.
- İçinde çok büyük sayıda sözcük bulunan ve bazı sözcükler çok tekrarlanırken diğer sözcüklerin nadir olarak kullanıldığı uzun metinlerde sözcük uzunluğu dağılımı.
- Değişik dillerde ve ülkelerde insanlara verilmiş olan isimlerin çokluluk dağılımları.
- TCP protokolunu kullanan İnternet trafiği için dosya büyüklüğü dağılımı.
- Mutlak sıfır yakınında Bose-Einstein yoğunlaşmaları grupları.
- Kum parçacıklarının büyüklük dağılımları.
- Metoritlerin büyüklük dağılımları.
- Orman yangınlarında yanan alanların yüzölçüm dağılımları.
Özellikler
Tanınım
Eğer X bir Pareto dağılım gösteren rassal değişken ise, Xin olasılığının değerini herhangi bir reel sayı olan xden daha büyük olması, yani tüm x ≥ xm için, şu ifade ile verilir:
Burada xm mutlaka X için verilen en küçük sayı değeri ve k ise pozitif değerde bir parametredir.
Pareto dağılımları ailesinin tanımlanması için iki tane sayısal parametre gerekmektedir:
- ve
Pareto dağılımı iktisatda servet veya gelir dağılımı modelinde kullanıldığı zaman k parametresi Pareto endeksi olarak adlandırılır.
Olasılık yoğunluk fonksiyonu
Bu tanınımdan hemen şu Pareto dağılımı için olasılık yoğunluk fonksiyonu ortaya çıkartılır:
Diğer özellikler
- Pareto dağılımı gösteren bir rassal değişken için beklenen değer şöyle ifade edilir:
Eğer k ≤ 1 ise beklenen değer sonsuz olacaktır.
- Varyans şöyle ifade edilir:
Eğer ise, varyans sonsuzdur.
- Ham momentler şöyle verilir:
Ancak bu momentler sadece için anlamlıdır.
- Bu demektir ki, katsayıları ile olan bir Taylor serisi şeklinde tanımlanan moment üreten fonksiyon tanımlanmamıştır.
- Karakteristik fonksiyonu şöyle verilir:
Burada Γ(a,x) bir tamamalanmamış Gamma fonksiyonu olur.
- Pareto dağılımının bir üstel dağılım ile şu şekilde ilişkisi bulunur:
- Dirac delta fonksiyonu Pareto dağılımının bir limit halidir.
Bir karakterizasyon teoremi
Bağımsız ve hepsi aynı dağılımlı rassal değiskenler olan Xi, i = 1, 2, 3, ... in k > 0 değerleri için [k, ∞) aralığında desteklenen olasılık dağılımları bulunduğu kabul edilsin. Ayrıca, tüm n değerleri için şu iki rassal değişken olan
- min{ X1, ..., Xn } ve :(X1 + ... + Xn)/min{ X1, ..., Xn }
birbirinden bağımsız değişkenler oldukları varsayılsın.
Bu halde her iki değişken de Pareto dağılım gösterir.
Zipf'in yasası ile ilişki
Pareto dağılımı sürekli olasılık dağılımdır. Zipf'in yasası veya diğer adı ile zeta dağılımı sürekli Pareto dağılımının araklıklı dağılım karşılığıdır.
Pareto, Lorenz ve Gini
Lorenz eğrisi gösterimi çok kere servet veya gelir dağılımını karakterize etmek için kullanılır.[1] Herhangi bir gelir veya servet dağılımı için Lorenz eğrisi L(F) olarak ifade edilip ya bir olasılık yoğunluk fonksiyonu olan veya yığımlı dağılım fonksiyonu olan ile şöyle ifade edilebilir:
Burada x(F) yığımlı dağılım fonksiyonunun tersidir.
Şu Pareto dağılımı için
Lorenz eğrisi şöyle hesaplanabilir:
L(F) ifadesinin paydası x in ortalama değeri olduğu için, k değeri 1'e eşit veya 1den büyük olmalıdır. Birkaç Pareto dağılımı ile ilişkili Lorenz eğrileri yukarıdaki gösterimde görülebilir.
Gini katsayısı Lorenz eğrisi ile dağılımda-eşitlik ifade eden [0,0] ile [1,1] noktalarını bağlayan çapraz doğru arasındaki farkı, yani eşitlikten sapmayı, ölçen bir katsayıdır. Özellikle gösterilmiştir ki, Gini katsaysı, Lorenz eğrisi ile dağılımda-eşitlik doğrusu arasındaki alanın yuzolçümünün iki mislidir.[2].
Bu halde Pareto dağılımı için Gini katsayısı şöyle hesaplanır:
Parametre kestirimi
Verilmis bir rastgele orneklem veri dizisi olan için k ve parametreli Paretoi dagilimi için olabilirlilik fonksiyonu soyle verilir:
Böylece logaritmik olabilirlilik fonskiyonu su olur:
Bu fonksiyondan gorulmektedir ki terimi ile monotonik artis göstermektedir. Yani değeri ne kadar büyük olursa olabilirlilik fonksiyonun değeri de oylece büyük olacaktır. olduğu için sonuç olarak
cikartılmaktadır.
k için bir kestrimci bulmak için, bunun gerekli kismi turevini almak; yani
ve bunun nerede ifira esit olduğunu bulmak gereklidir. Böylece, k için maksimum olabilirlilik kestirimi su olur:
Bunun beklenen istatistiksel hatasi soyle ifade edilir:
Grafik olarak gösterim
Pareto dağılımı için doğrusal ölçek kullanılarak elde edilen gösterimdeki eğrinin genel olarak ortaya çıkartığı uzun kuyruk özelliği, ayni veri dizisi logaritma-logaritma ölçekli bir grafikte gösterilince ortadan kalkmakta ve negatif eğim gösteren bir doğru ortaya çıkmaktadır.
Pareto dağılımı simulasyonu
Pareto olasilik dagilimi simulasyonu için birçok komputer istatistik paketinden yardım gorme imkâni su anda bulunmamaktadır. Oysaki Pareto dagilimi özellikle aktureya hesapları için, özellikle portfoy maliyetlerinin hesaplaması için, çok sik olarak kullanılması gerekmektedir ve bu hesaplar için istatistik paketleri özel Pareto dagilimi simulasyonları vermemektedirler.
Diger taraftan istatistik paketlerinin verdikleri bazı özel olasilik dagilimi simulasyonlarını birbirine ekliyerek Pareto dagilimi gösteren rassal değişken simulasyon sonuçları cikartmak zor degildir. Bu surec kolayca basarılması icik yordam soyle verilebilir:
Birinci şekilde bir gamma dagilimi tarafında uretilen bir rastgele orneklem için bulunan λ ile bir ustel dagilimdan rastgele sayılar ortaya cikartilir; yani
ve
Bu hesaplar 0da başlayan bir rastgele veri serisi uretirler. Bunun üstüne eklemek gerekir.
Diger bir şekilde simulasyon, ters donusum orneklem alma islemi kullanılarak elde edilir. birim araklita bulunan surekli tekduze dagilimdan değişebiliri için rastgele olarak elde edilir. Bu değişebilir için
fonksiyonu Pareto-dagilimi gösterir.[4]
Ayrıca bakınız
- Pareto prensibi
- Pareto enterpolasyonu
- Pareto etkinliği
- Pareto analizi
- The Long Tail
Kaynakça
- Lorenz,M.O. (1905). "Methods of measuring the concentration of wealth." Publications of the American Statistical Association. C.9 say.209–219.
- Aabergé,R. (2005) kaynak International Conference to Honor Two Eminent Social Scientists, Mayıs 2005 toplantısında bildiri -- http://www.unisi.it/eventi/GiniLorenz05/25%20may%20paper/PAPER_Aaberge.pdf
- http://aps.arxiv.org/PS_cache/cond-mat/pdf/0412/0412004v3.pdf
- "Arşivlenmiş kopya". 23 Mayıs 2007 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Haziran 2008.