Sıfır hipotez
Çıkarımsal istatistikte, sıfır hipotez beklenenin dışında bir durumun olmadığını, mesela gruplar ya da değişkenler arasında bir ilişki bulunmadığını veya ölçülen iki olgunun arasında bir fark olmadığını kabul eden genel bir önermedir.[1][2] Örneğin tıpta, denenen bir tedavinin etkisiz olması; hukukta, sanığın suçsuz olması birer sıfır hipotezdir. Modern bilim hipotezler üretip bunları test ederek ilerler; bir sıfır hipotezinin belirli bir güvenilirlik aralığında istatistiksel olarak kabul ya da reddedilmesi hipotez testleriyle yapılmaktadır.
"Sıfır hipotez" terimi ilk olarak İngiliz asıllı istatistikçi ve genetikçi Ronald Fisher tarafından tanımlanıp kullanılmıştır.[3][4]
Tipik olarak çıkarımsal analiz için "sıfır hipotez" yanında "alternatif hipotez" adı verilen bir ikiz hipotez ile birlikte ortaya konulur. "Alternatif hipotez" kavramı R.Fisher'in formülasyonun da bulunmamaktadır. Jerzy Neyman ve Egon Pearson adlı Amerikalı istatistikçiler tarafından "alternatif hipotez" kavramı geliştirilmiştir. "Alternatif hipotez"'in mantıken "sıfır hipotez"in aksi olması gerekli değildir. Eğer bir deney yapılırsa "alternatif hipotez" gerçek ise, bu deneylerin sonucunu tahmin edip edilemiyeceğinin olasılığına işaret eder. Günümüzde istatistiksel çıkarımsal analizlerde hem "sıfır hipotez" hem de "alternatif hipotez" kullanılması bir gelenek haline girmiştir.
Prensip
"Hipotez sınaması", toplanan verinin, sıfır hipotezin doğru olduğunu varsayarak, bunun ne olasılıkla mümkün olduğunu ölçerek yapılır. Veriler fazla olanak dışıysa (genellikle %5’inden daha az olasılıkla gözlemlenecek şekilde iseler) o zaman araştırıcı sıfır hipotezin yanlış olduğu çıkarımına varır. Şayet veriler sıfır hipotez ile çelişmiyorsa o zaman hiçbir çıkarıma varmaz. Bu halde sıfır hipotez doğru da olabilir yanlış da; veriler herhangi bir çıkarım yapabilmek için yeterli kanıt vermemektedir.
Mesela, belirli bir ilaç kalp krizi geçirme tesadüfünü düşürebiliyorsa; muhtemel sıfır hipotezler "bu ilaç kalp krizi geçirme olasılığını azaltmaz" veya "bu ilacın bir kalp krizi geçirme olasılığına bir etkisi yoktur" şeklinde olur. Hipotez sınaması, bir "denetimli deney (controlled experiment)" olarak çalışma grubundaki insanların yarısına bu ilacı vermek şeklinde olur. Veriler, ilacı alan insanlarda istatistiksel anlamlı bir değişiklik gösterirse, sıfır hipotez reddedilir.
Sıfır hipotez (H0) seçimi
Sıfır hiptotezin seçimi ve (eğer "tek-kuyruklu sınama" ise) yönlenmesi hakkında fikirler hipotez sınaması için çok kritiktir. Bir yazı-tura deneyinde havaya atılan madeni paranın yansız olup olmadığı (yani çok sayıda yapılan deneylerde %50 defa 'yazı' gelip gelmediği) sorusunu sorduğumuzu kabul edelim. Bu deney için mümkün olan bir sıfır hipotez "bu madeni para 'yazı' gelmesi için yanlı değildir" olabilir. Deney madeni parayı tekrar tekrar çok defa havaya atıp ne tarafına (yazı mı tura mı) düştüğünü kaydetmektir. Madeni parayı 5 defa havaya atarsak mümkün olan bir sonuç 5 tane 'yazı' gelmesidir. Yapılmış olan sıfır hipoteze göre, bu verilerin ortaya çıkmış olması çok az olasıdır, çünkü eğer madeni para yansız" ise ide bu deneyde 5 'yazı' gelmesi olasılığı %3 olacaktır. Bu deney verisi, sıfır hipotezi yanıtlamamaktadır; bundan çıkarım, atılan madeni para yanlı olduğudur.
Alternatif olarak "madeni para yansızdır" sıfır hipotezi, 'yazı' sonuçları yanında 'tura' sonuçlarının da ele alınmasına izin verir. Bu halde 5 'yazı' veya 5 'tura' gelmesi olasılığı, (iki-kuyruklu sınama ile) %6'ya yükselir ve bu da sıfır hipotezi korumak için istatistikesl olarak anlamlı olmamaktadır.[5]
Bu gösterim hipotez sınama tekniğinin tehlikesini ortaya koymaktadır; tek bir veri setini kullanarak değişik sıfır hipotezler verilerek sınamalar yapmak, verisetindeki onu alınamaz "gürültü" nedeniyle sinanan bazı "sıfır hipotezlerin" yanlış olarak rededilmesine yol açacaktır.
Farkların sınaması
Ele alınan iki rastgele örnek içinde hem erkek hem de kadınlar rastgele bulunmakta ve örnek bunları bir test notu olduğunu farzedelim ve acaba "erkekler ortalama notu" ile "kadınlar ortalama notu" arasında bir fark olup olmadığını inceleyelim. Bir mümkün sıfır hipotez, "erkekler ortalama notu" ile "kadınlar ortalama notu"'nun aynı olduğudur; yani
- H0: μ1 = μ2
burada
- H0 = sıfır hipotez
- μ1 = anakitle 1 (erkekler) ortalaması
- μ2 = anakitle 2 (kadınlar) ortalaması.
Aynı anakitleden rastgele örneklem ile elde edilen veri-setinden daha güçlü sıfır hipotezler de ele alınabilirdi: örneğin notların varyanslarının eşitliği veya notların dağılımların belirli bir teorik olasılık dağılımı şekilde olması.
Terminoloji
Sıfır hipotezlerle bağlantılı terminoloji burada kısmen ele alınacaktır ve bunlar doğrudan istatistiksel hipotez sınaması konusu ile ilgilidirler. Fakat bu terimler daha ayrıntılı ve daha ince analizle de ele edilmektedir ve bunun için daha detaylı için bakılacak bilgiler istatistiksel hipotez sınaması maddesindedir.
Ele alınan ilk terimler
- Basit hipotez
- Anakitle dağılımını tüm olarak "tanımlayan" herhangi bir hipotez;
- Bileşik hipotez
- Anakitle dağılımını tüm olarak "tanımlamayan" herhangi bir hipotez
olur.
Nokta hipotez terimini tanımlamak çok karmaşık olabilir. Bu terim bütün mümkün anakitle dağılımlarının parametrik formda alınmaları halinde kullanılır. Bir "nokta hipotez" ya parametrelerin tümünün veya parametrelerin bir kısmı setinin tamamiyle gerçek olarak tanımlanması halleridir. Formel olarak, sadece parametrelerin bir kısmının tanımlanması halinde "bileşik hipotez" ortaya çıkar; ama buna rağmen pratikte "nokta hipotez" terimi çok kere yine de kullanılmaktadır. Özellikle bu halde hipotez sınaması öyle yapılanmıştır ki test istatistiğinin dağılımı (yani sıfır hipoteze uygun olarak verilmiş dağılımı), nokta sıfır hipoteze uygun olarak tanımlanmayan değerleri olmayan parametrelere bağlı olmaz.
Parametrelerin bir kısım altsetinde nokta hipotezlerin dikkatli olarak ele alınmaları, onların bileşik hipotez olacak incelenmesine yol açar. Böylelikle test istatistiğinin sabit kritik değeri için p-değeri ile nokta sıfır hipotezle tanımlanmayan parametrelerin birlikte değişmesi incelenir,
Bir tek-kuyruklu hipotez, bir parametrenin değerinin ya
- belirlenen bir değerden yüksek olacağını veya
- belirlenen bir değerin altında olacağını
tanımlayan bir hipotezdir.
Tıp alanında bir tek-kuyruklu hipotez örneği, halen bilinen bir tedavi olan A tedavisinin yeni bir tedavi olan B tedavisinden hiç olmazsa daha fena sonuç verip vermiyeceğinin incelenmesidir. Buna tekabül eden alternatif hipotez tedavi B'nin tedavi A'dan daha iyi tedavi sonucu vereceğidir. Burada eğer sıfır hipotez kabul edilirse (yani, tedavi A'nın tedavi B'ye kıyasla hiç olmazsa daha iyi olacağı hipotezinin rededilmesi için hiçbir neden bulunmaması halinde), yapılacak çıkarım tadavi A'nın kullanılmasına devam edilmesidir. Eğer sıfır hipotez rededilirse çıkarım, yeni tedavi B'nin gelecekte kullanılmasıdır; çünkü bu tedavinin A tedavisinden daha iyi olacağı hakkında kanıt bulunmaktadır. Bu halde sınama ve çıkarım A ve B tadavilerinin değişik olup olmadığı sorusunu inceleme ile yetinmemektedir; hipotez sınaması ile aranan kanıt, tedavi B'nin tedavi A'dan iyi olup olmadığı hakkındadır. Hipotezi "daha iyidir" şekilde karşılaştırma olarak formüle etme, hipoteze bir "yönleme sağlama" olarak ifade edilmektedir.
Sıfır hipotezin yönü
Ōrneklem büyüklüğü
Kaynakça
- Everitt, Brian (1998). The Cambridge Dictionary of Statistics. Cambridge, UK New York: Cambridge University Press. ISBN 978-0521593465.
- "H0 ve H1 hipotezi nasıl kurulur". biistatistik.com. 8 Temmuz 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Şubat 2020.
- "Glossary". Statistics.berkeley.edu. 25 Temmuz 2010. 8 Mart 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Temmuz 2010.
- Oxford Lügatı: 1935 R. A. Fisher, Design Experience ıı. 19, "Bu hipotezi 'sıfır hipotez' olarak adlandırabiliriz. Ama şu anlaşılmalıdır ki sıfır hipotez hiçbir zaman ispat edilemez veya kurulu prensip olarak kabul edilemez; fakat deneyler yapıldıkça kanıtılıp çürütülebilirler.
- Bu deney veri seti sadece bir konuyu göstermek için kullanılmaktadır; gerçekte madeni parayı 5 defa havaya atma deneyi çok küçük sayıdadır ve bir sınama çıkarımı yapmak için yeterli değildir. 30 deneyimden daha az sayıda deney herhangi bir belirli sınama çıkarımının rizikosunu artırmaktadır.
- Ingilizce Wikipedia "Null Hypothesis" maddesi31 Ağustos 2011 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
Ayrica bakınız
- Istatistiksel hipothez sinamasi
Dış bağlantılar
- H.J.Adèr ve G.J.Mellenbergh, (2007) Advising on research methods: A consultant’s companion, Huizen, Hollanda:Johannes van Kessel Publishing ISBN 9079418013 (İngilizce)
- HyperStat Online: Sifir hipotez10 Şubat 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)