Poisson dağılımı

Poisson dağılımı, (okunuşu: puason dağılımı) olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasılığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.

Poisson
Olasılık kütle fonksiyonu

Yatay eksen indeks k . Fonksiyon yalnızca k'nın tam sayı değerleri için geçerlidir. Noktaları bağlayan çizgiler süreklilik göstermez; kullanıcıya yardımcı olmak üzere çizilmişlerdir.
Yığmalı dağılım fonksiyonu

Yatay eksen indeks k .
Parametreler
Destek
Olasılık kütle fonksiyonu (OYF)
Birikimli dağılım fonksiyonu (YDF)

(burada Tamamlanmamis gamma fonksiyonu olur)

Ortalama
Medyan yaklaşık olarak
Mod ve eğer bir tam sayı ise
Varyans
Çarpıklık
Fazladan basıklık
Entropi

(büyük değeri için)

Moment üreten fonksiyon (mf)
Karakteristik fonksiyon

Poisson dağılımı çok kere belirli sabit zaman aralığı birimleri bulunan problemlere uygulanmakla beraber, diğer birimsel aralıklı problemlere de (yani birim uzaklık, alan veya hacim içeren problemlere de) başarı ile uygulanabilir.

Örnekler

Poisson dağılımı Poisson süreci ile birlikte ortaya çıkar. Poisson süreci aralıklı karakterde olan (yani 0, 1, 2, 3 .. kere meydana çıkan) bazı olgularin bir birim zaman, alan, mekân veya hacimde sabit bir olasılıkla oluşması şeklini alır. Bu çeşit olaylara ve Poisson dağılımının uygulanmasına örnekler şunlardır:

  • Prusya süvari birliklerinde her bir yıl at ve katır tepmeleri ile ölen asker sayısı: Bu klasik örnek 1868'de Ladislaus Josephovich Bortkiewicz tarafından bir kitapta yayınlanmış ve çok tanınmış bir örnek olarak yıllarca askeri ve sivil yüksek okul öğrencilerine verilmiştir.
  • Bir saat aralığında belli bir Internet sitesine gelen bağlantılar sayısı;
  • Yarım saat içinde bir nakliyat deposuna yükleme-boşatılma için gelen kamyon sayısı;
  • Her bir beş dakika içinde bir telefon cevap merkezine gelen telefonlar sayısı;
  • Belli bir trafik kavşağından 1 dakika içinde geçen otomobil sayısı;
  • Belli bir zaman aralığında bir büyük binada yanıp çalışması duran floresan lambalarının sayısı;
  • Bir mucit kişinin çalışma hayatı boyunca patentini aldığı keşifler sayısı;

[Not: Birbirini takip eden Poisson tipi olaylar arasındaki aralık karşılıklı ilişkili olarak bir üstel dağılım olur. Örneğin, bir floresan ampülünun çalışma süresi veya otobüslerin gelmesi arasındaki bekleme zamanı.]

Tarihçe

Bu dağılım ilk defa Siméon-Denis Poisson (1781–1840) tarafından diğer olasılık hakkındaki yazıları ile birlikte 1838'de yayınlanan Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Ceza hukuku ve medeni hukuk alanlarındaki hükümlerin olasılığı üzerinde araştırmalar") adındaki eserinde ortaya atılmıştır.

Nadir olaylar için Poisson dağılımı

Poisson dağılımının genel odaklandığı rassal değişken bir sayılabilen olaydır; bu olay belli bir sabit uzunlukta olan (genellikle zaman) aralıkta ayrık olarak ortaya çıkar ve bu aralıkta gözlenen olayların sayısı Poisson dağılım için rassal değişkendir. Bu sabit aralıkta ortaya çıkan olaylar sayısının beklenen değeri (ortaya çıkmanın ortalama sayısı) λ olarak sabittir ve bu ortalama değer aralık uzunluğuna orantılıdır. Eğer her 4 dakikalık zaman aralığı içinde ortalama 5 olay meydana geliyorsa, sabit 8 dakikalık aralıkta ortalama 10 (=8x5/4) olay ortaya çıkar. Herhangi bir negatif olmayan bir tam sayı olan k sayıda (k = 0, 1, 2, 3...) olay ortaya çıkma olasılığı şöyle ifade edilir:

burada

  • e, doğal logaritmanın tabanı (e = 2.71828...);
  • k, olasılığı fonksiyon ile verilmekte olan olayın ortaya çıkma sayısı;
  • k!, k için faktöriyel
  • λ verilen sabit aralıkta ortaya çıkma sayısının beklenen değeri; bir pozitif gerçel sayı.

Bu k'nin fonksiyonu Poisson dağılım için olasılık kütle fonksiyonu olur.

Poisson dağılımı için λ parametresi yalnızca beklenen değer, yani ortaya çıkan sayıda olay için bir ortalama, değildir. Aynı zamanda

yani varyans da olur. Böylece gözlenen olay meydan çıkış sayısı bir ortalama değer λ ile bir standart sapması olması niteliklerini taşiyan bir olasılık dağılımı, Poisson dağılımı, göstermektedir.

Genellikle bir Poisson dağılımı büyük sayıda olay ortaya çıkabilmesi mümkün olduğu, ama bu ortaya çıkması mümkün olayların nadir olduğu kabul edilen, sistemlerde uygulanabilir. Bilimsel alanlarda klasik örnekler atomların nükleer parçalanması; verilen bir DNA zincirinde ortaya çıkan mutasyon sayısı vb. Bu örneklerle ve diğer birçok örneğin için, ortaya çıkan nadir olay sayısı ayrık denemelerin sonucudur ve daha kesinlikle bir binom dağılım kullanılarak model haline getirilebilirler. Fakat n ve λ/n parametreli bir binom dağılımı (yani her deneme için λ/n başarı olasılığı olan n sayıda deneme için belirli bir başarı sayısı için olasılık dağılımı), deneme sayısı n büyüyüp limitte sonsuzluğa yaklaştıkça, beklenen değeri λ olan bir Poisson dağılıma yakınsallaşır. Bu limit bazen nadir olaylar kuralı olarak anılmaktadır. Bu ifade bir bakıma yanıltıcıdır; çünkü birçok Poisson dağılımı ile modellenebilen olaylar arasında birçoğu (örneğin bir otobüs durağına yarım saat aralığında gelen otobüs sayısı; bir mobil telefona bir saat aralığında gelen çağrı sayısı gibi) hiç de nadir olmayan olaylar bulunur. Ancak binom dağılımının büyük sayılar için hesaplanması faktöriyel sayılar kullanılması gerektirdiği için, bu uzun hesaplama biraz sıkıcı görülebilmekte ve bu nedenle Poisson dağılımı yaklaşık olarak binom dağılım yerine kullanılmaktadır.

Binom dağılımından limitte Poisson dağılım olasılık kütle fonksiyonunun çıkartılmasınin matemetiksel kanıtı şöyle yapılır:

Önce, değişkenler hesabı (calculus) içinde kullanılan limitin şöyle ifade edildiğı hatırlanır:

p = λ/n eşitliği bu ifade içine konulursa, şu genel denkleme varılır:

Şimdi bu son ifade biraz daha açılır ve şu elde edilir:

Limitte, ilk parantez içindeki ifade 1 e yakınsama gösterir (yani n ∞'a yaklaştıkça, ilk parantezdeki ifade 1'e yakınsar ) ve ikinci parantez içindeki ifade, ifade içinde n olmaması nedeniyle, sabit kalır; üçüncü parantez içindeki ifade e−λ değerine yakınsar ve son olarak da dördüncü parantezdeki ifade, 1 e yakınsar. Sonuçta, limitte şu ortaya çıkar:

Daha genel olarak, n ve pn parametreleri olan binom rassal değişkenler için bir sıra Binom ifadesi

olursa, bu seri dağılımda ortalaması λ olan bir Poisson rassal değişkeni için serilere yakınlaşır.[1].

Örnek:

0 0.368
1 0.368
2 0.184
3 0.061
4 0.015
5 0.003
6 0.0005

Bir nehirde ortalama olarak her 100 yılda bir taşkın seli meydana gelir. Poisson modelinin uygun olduğunu varsayarak, 100 yıllık bir aralıkta k = 0, 1, 2, 3, 4, 5 veya 6 taşkın seli olma olasılığını hesaplayın.

Ortalama olay oranı 100 yılda bir taşma olduğundan, λ = 1

Özellikler

  • Poisson dağılımı gösteren rassal bir değişken için beklenen değer ve varyans değeri de λdır. Poisson dağılımının yüksek momentleri λ terimleri ile oluşan (matematiksel kombinatorik kuramında anlamlı olan katsayıları bulunan) Touchard polinomlarıdır. Eğer Poisson dağılımı için beklenen değer 1 ise, o zaman Dobinski'nin formülüne göre ninci moment n büyüklüğünde olan set bölünümlerinin sayısına eşittir.
  • Tam sayılı olmayan bir λ lambda parametreli Poisson dağılımı gösteren bir rassal değişkenin mod değeri, λ 'dan küçük olan en büyük pozitif tam sayıya, yani 'ya, eşittir.
  • Poisson dağılımı gösteren rassal değişkenlerin toplamı:
Eğer ifadesi parametresi ile Poisson dağılımı gösteriyor ve terimleri bağımsız iseler, o halde

ifadesi de parametresi toplama katılan parametre toplamlarından olan bir Poisson dağılımı gösterir.

  • Poisson dağılımı için tüm kümülantlar beklenen değer olan λya eşittirler. Poisson dağılımı için ninci faktöriyel moment λn olur
  • Poisson dağılımlari sonsuz olarak bölünebilir olasılık dağılımlarıdır.
  • Poi(λ0) ile Poi(λ) arasındaki yönlendirilmiş Kullback-Leibler ayrılımı şöyle ifade edilir;

Poisson dağılımı ile üretilen rassal değişkenlerin simulasyonu

Poisson dağılımlı rassal sayıları üretmek için en basit yollardan birisi Knuth tarafından aşağıdaki gibi bir bilgisayar algoritmasıyla verilmiştir[2]:

algoritma poisson rassal sayı üretimi (Knuth):
    init:
        Let L ← e−λ, k ← 0 and p ← 1.
    do:
         k ← k + 1.
         [0,1] aralığı içinde birörnek dağılımlı rassal sayı u üret ve let p ← p × u.
    while p ≥ L.
    return k − 1.

Basit olmakla beraber, karmaşıklık λ ile doğrusal olarak oranlıdır. Bu sorun etkisini azaltmak için çeşitli diğer algoritmalar geliştirilmiştir.[3][4]

İlişkili dağılımlar

  • Eğer ve ise, o halde farkı bir Skellam dağılımı gösterir.
  • Eğer ve bağımsızlarsa ve ise, o zaman ya koşullu dağılımı, bir binom dağılımı olur. Özellikle, olur. Daha genel olarak, eğer X1, X2,...,Xn rassal değişkenleri, parametreleri
    λ1, λ2,..., λn olan Poisson dağılımı gösteriyorlarsa, o zaman .
  • Eğer denemeler sayısı limitte sonsuza doğru yaklaşır ve başarı sayısının beklenen değeri sabit kalırsa, bu binom dağılım limitte Poisson dağılıma yaklaşacağı ispat edilmiştir. Bu nedenle Poisson dağılım, eğer n yeterce büyük ve p yeterce küçük ise, bir binom dağılım yerine yaklaşım olarak kullanılabilir. Alışılagelen bir kurala göre, eğer n en aşağı 20 ise ve p 0,05'e eşit veya daha küçük ise, Poisson dağılımı binom dağılımının iyi bir yaklaşımı olacaktır. Bu kurala göre eğer n ≥ 100 ve np ≤ 10 ise, bu yaklaşım mükemmel olur.[5]
  • Yeter derecede yüksek λ değeri (diyelim λ>1000) için, ortalaması λ ve varyansı λ olan bir normal dağılım, Poisson dağılım için çok iyi bir yaklaşım olur. Eğer λ 10'dan biraz büyük ise, bu halde normal dağılım ancak uygun bir süreklilik doğrulaması kullanılırsa uygun bir yaklaşım olabilir. Başka bir deyim ile, eğer P(X  x) ifadeleri P(X  x + 0.5) ile değiştirilirse
olur.
  • Eğer bir sabit zaman aralığı içinde bir hizmet alanına gelenler sayısı, ortalaması olan bir Poisson dağılımına uygun ise, o halde gelişler-arası zaman aralıkları, oran parametresi olan, bir üstel dağılım gösterir.

Parametre tahmini

Maksimum olabilirlik

ki için n tane ölçülmüş değer kapsayan bir örneklem alınsın. Bu örneklemin kökenindeki Poisson dağılım gösteren anakütle için Poisson parametresi olan λ için bir uygun bir kestirim değeri bulunması hesaplama hedefidir.

Bu kestirimi maksimum değişebilirlik yöntemi ile bulmak için önce bir log-değişebilirlilik fonksiyonu şöyle biçimlendirilir:

λ ile L fonksiyonunun türevi alınıp bu türev sıfıra eşitlenirse

ifadesi ortaya çıkar. λ için çözüm yapılırsa λ için maksimum olabilirlilik kestirimini(MOK) şöyle buluruz:

Her gözlem için ortalama λ olduğu için bu ifadenin beklenen değeri de λ olur. Bu nedenle bu kestirim λ için bir yansiz kestirim olur. Bunun kestirim varyans değeri Cramer-Rao alt sınırına ulaşıp geçtigi için, bu kestirim bir etkin kestirim de olur.

Bayes tipi çıkarımsal analiz

Bayes tipi çıkarımsal analiz için Poisson dağılımının oran parametresi olan λ için eşlenik öncel bir gamma dağılımı gösterir. Şu ifadeye göre

λnin bir Gamma olasılık yoğunluk fonksiyonuna göre dağılım gösterdiğini; gnin bir şekil parametresi olan α ile bir ters ölçek parametresi olan β ile parametrelenmiş oldugunu, şöyle gösterilsin:

O zaman, daha önce olduğu gibi n sayıda ölçülmüş değerden oluşan örneklem ki ve bir Gamma(α, β) dağılımlı önsel verilmiş ise, sonsal dağılım şu olur:

Sonsal ortalama olan E[λ] limitte doğru gittikçe maksimum olabilirlik kestirimi olan ifadesine yaklaşır.

Eklecek verilerin sonsal kestirimci dağılımı bir Gamma-Poisson dağılım yani bir negatif binom dağılımı olur.

Küçük sayılar kuralı

Kural sözcüğü istatistik bilimi içinde olasılık dağılımı kavramı ile eş anlamlı olarak kullanılmaktadır. Kurala göre yakınsama kavramı dağılımda yakınsama ile aynı anlamda kullanılmaktadır. Buna dayanarak Poisson dağılımı bazen küçük sayılar kuralı olarak anılmaktadır. Buna neden bu dağılımın, nadir olacağı kabul edilmekle beraber, birçok fırsatta ortaya çıkabilen bir olayın ortaya çıkma sayısını açıklayan olasılık dağılımı olmasıdır. 1898'de Ladislaus Bortkiewicz'in Poisson dağılımı hakkında yayınladığı kitabın adı Küçük Sayılar Kuralıdır. Bazı matematik tarihçileri buna ithafen Poisson dağılımının adının da Bortkiewicz dağılımı olmasını istemişlerdir.[2]

Ayrıca bakınız

  • Bileşik Poisson dağılımı
  • Tweedie dağılımı
  • Poisson süreci
  • Poisson regresyonu
  • Poisson dağılımı tablosu
  • Kuyruk kuramı
  • Erlang dağılımı n sayıda olayın tümüyle ortaya çıkmasına kadar bekleme zamanlarını tanımlar. Zaman içinde dağılım gösteren olaylar için Poisson dağılımı, daha önceden aralığı sabit olarak tayin edilmiş zaman birimi içinde ortaya çıkan olay sayısını verir; Erlang dağılımı ise ninci olayın olup bitmesine kadar geçen zamanının olasılık dağılımını inceler.
  • Skellam dağılımı: Mutlaka aynı asıl dağılımdan ortaya çıkmayan iki Poisson değişirin farkının dağılımını verir.
  • Tamamlanmamış gamma fonksiyonu: Yığmalı olasılık fonksiyonunun hesaplanması için kullanılır.
  • Dobinski'nin formülü: Poisson dağılımı için momentlerin kombinatrik hesapla yorumlanması.
  • Schwarz formülü
  • Robbins ön kuramı: Empirik Bayes yönteminin Poisson dağılıma bağlı olduğunu gösteren bir ön kuram.

Kaynakça

  1. Daha fazla ayrıntı için nadir olaylar kuralı 20 Şubat 2016 tarihinde Wayback Machine sitesinde arşivlendi. maddesine bakınız.
  2. Donald E. Knuth (1969) Seminumerical Algorithms: The Art of Computer Programming, Volume 2, Addison Wesley.
  3. Joachim H. Ahrens ve Ulrich Dieter (1974) "Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions" Computing C.12 No.3 say.223-246 doi=10.1007/BF02293108.
  4. Joachim H. Ahrens ve Ulrich Dieter (1982) "Computer Generation of Poisson Deviates" ACM Transactions on Mathematical Software C.8 No.2 say.163-179 doi=10.1145/355993.355997.
  5. NIST/SEMATECH, '6.3.3.1. Sayımlar için kalite kontrol grafikleri' 11 Mart 2008 tarihinde Wayback Machine sitesinde arşivlendi., e-Handbook of Statistical Methods, 25 Ekim 2006'da bakıldı.


Dış bağlantılar

Online görselleştirme aletleri

İnternet siteleri

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.