Varyans
Olasılık kuramı ve istatistik bilim dallarında varyans bir rassal değişken, bir olasılık dağılımı veya örneklem için istatistiksel yayılımın, mümkün bütün değerlerin beklenen değer veya ortalamadan uzaklıklarının karelerinin ortalaması şeklinde bulunan bir ölçüdür. Ortalama bir dağılımın merkezsel konum noktasını bulmaya çalışırken, varyans değerlerin ne ölçekte veya ne derecede yaygın olduklarını tanımlamayı hedef alır. Varyans için ölçülme birimi orijinal değişkenin biriminin karesidir. Varyansın kare kökü standart sapma olarak adlandırılır; bunun ölçme birimi orijinal değişkenle aynı birimde olur ve bu nedenle daha kolayca yorumlanabilir.
Bir reel sayı halinde olan rassal değişkenin varyansı o rassal değişkenin ikinci merkezsel momenti ve aynı zamanda ikinci kümülantı olur. Eğer varyans değeri var ise, ortalama değeri de vardır. Ama bunun aksi doğru değildir.
Formüller
Eğer beklenen değer varsa, bir olasılık dağılımı için varyans dağılımın kendi ortalamasından sapmasının karesinin beklenen değeridir. Varyans kavramı dağılıma ait her bir değerin dağılımın ortalamasından ne kadar uzak olduğuyla ilgilidir. Varyans söz konusu sapmaların ortalama değerini ölçmektedir.
X değişkeninin beklenen değeri μ = E(X) olmak üzere, varyans şöyle tanımlanır:
Matematik notasyon kullanılarak bir rassal değişken X için varyans ya Var(X) ya ya da daha basitce σ2 olarak gösterilir..
Bu tanımlama, eğer beklenen değer varsa, hem ayrık rassal değişkenler hem sürekli rassal değişkenler hem de karışık değişkenler için genel olarak doğrudur. Bu tanımdan ve beklenen değerlerin doğrusal olma niteliğinden varyans için şu formül çıkartılabilir:
Buna hesaplama formülü adı da verilir. Bu formüle göre
- Varyans, karelerin ortalaması eksi ortalamanın karesine eşittir.
Bir X ayrık rassal değişkeni için, x değerleri olasılığa eşit olan olasılık kütle fonksiyonu bulunur; yani x1↦p1, ..., xn↦pn, olur. Bu halde aralıklı olasılık dağılımları için varyans şöyle de ifade edilebilir:
Buna göre varyans Xin kendi ortalamasından sapma karesinin beklenen değeri olur. Daha basit bir ifade ile
- Aralıklı rassal değişken için, varyans her bir veri noktasının veri ortalamasından uzaklıklarının karelerinin ortalamasıdır; yani ortalama sapma kareleridir.
Bir X sürekli rassal değişkeni için beklenen değer E(X) operatörü yerine olasılık yoğunluk fonksiyonu yani i kapsayan ve entegrasyon gereken formül konulursa, varyans şu şekilde ifade edilebilir:
- ,
Ancak bazı olasılık dağılımları (örnegin Cauchy dağılımı) için beklenen değer anlamsızdır ve bu halde varyans da anlamlı değildir. Diğer bazı olasılık dağılımlarında ise beklenen değer bulunmakla beraber sonlu sayılı bir varyans bulunamaz, çünkü sürekli değişkenler için varyans değeri bulmak için gereken entegral yakınsama göstermez (örneğin Pareto dağılımı).
Örnekler
Varyans; verilerin aritmetik ortalamadan sapmalarının karelerinin aritmetik ortalaması olduğuna göre,
2,2,3,5,3 serisinin varyansı şu şekilde bulunur;
1) Verilerin aritmetik ortalaması (A.O) hesaplanır.
2) 1. maddedeki ortalamadan,verilerin sapmalarının karelerinin aritmetik ortalaması alınarak varyans bulunur.
Örneğin 1: Tablo ile verilmiş bir aralıklı deneysel dağılım
Bu örnekte bir X rastlantı değişkeninin i=1,2,3 için aldığı değerler ve X in bu değerleri alması olasılığı bir tablo olarak verilmiştir.
i | 1 | 2 | 3 |
xi | -1 | 1 | 2 |
f(xi) | 0,5 | 0,3 | 0,2 |
Beklenen değer şöyle hesaplanır:
Genel formülle, varyans şöyle bulunur:
Hesaplama formülu ile ise varyans şöyle hesaplanır ve aynı sonuç verir:
Örneğin 2: Olasılık yoğunluk fonksiyonu verilmiş bir sürekli dağılım
Sürekli rassal değişken X için olasılık yoğunluk fonksiyonu şöyle verilmiştir:
Beklenen değer E(X) şöyle hesaplanır:
Varyans değeri Var(X) şöyle bulunur:
Anakütle varyansı ve örneklem varyansı
Teorik olasılık kuramı incelemeleri için varyans: formülü kullanılarak tanımlanır.
Sonlu bir anakütlenin varyansı aşağıdaki şekilde gösterilir:
. Bu özel bir varyans tanımı olarak sonlu anakütlelere özgü bir tanımdır.
Örneklem varyansı ise şu şekilde tanımlanmaktadır:
Örneklem varyansı, anakütle varyansının yansız bir kestirmicisidir. İspatı ise aşağıdaki şekilde gösterilir:
Bu özellikten faydalanılarak örneklem varyansının hesaplanması ile anakütle varyansına ilişkin kestirimlerde bulunulabilir. Bu durumda örneklemin rastsal bir örneklem olması önemlidir. Aksi takdirde örnekleme dayalı kestirimler sağlıklı sonuçlar vermeyecektir.
Varyansın biçimsel özellikleri
Varyansın şu özellikleri bulunmaktadır:
Aralarında korelasyon bulunmayan değişkenlerin toplamı için varyans
Varyansin diğer istatistiksel yayılım ölçülerine kıyasla tercihli olarak kullanılmasına nedenlerden birisi, birbirleri arasinda korelasyon olmayan rassal değişkenlerin toplamının (veya farkının) varyansının, her bir rassal değişkenin tek başına olan varyanslarının toplamına (veya farkına) eşit olmasıdır; yani
Bu öneri çok kere korelasyon yerine daha güçlü bir ilişki olan değişkenlerin bağımsızlığı şartı kullanılarak verilir, ama korelasyon ilişkisi de yeterlidir.
Bu nedenle eğer değişkenlerin varyansları tüm ayni ise (yani hepsi σ2 ise), hemen bu formüle göre bunların ortalamasının varyansının şu ifade
olduğu görülür; çünkü n ile bölme bir doğrusal dönüşümdür.
Bu gerçek, merkezsel limit teoremi içinde özellikle kullanılan, örneklem ortalamasının standart hatasını belirler.
Aralarında korelasyon bulunan değişkenlerin toplamının varyansı
Genel olarak, değişkenler birbirleriyle aralarında korelasyon gösteriyorlarsa, toplamlarının varyansı kovaryanslarının toplamı olur:
Burada Kov kovaryanstır ve eğer herhangi bir rassal değişken bağımsız ise, bu değişkenle diğer değişkenlar arasında bulunan her kovaryans değeri 0 olur. Verilen formül toplamın varyansının toplamı yapan parçaların kovaryans matrisinin bütün elemanlarına eşit olduğunu göstermektedir. Bu formül klasik sınama kuramında Cronbach'in alfa ölçüsü kavramını geliştirmek için de kullanılır.
Eğer değişkenlerin hep birbirine eğit varyansları, yani σ2, varsa ve ayrı ayrı değişkenler arasındaki korelasyonların ortalama değeri ρ ise, bu halde varyansların ortalaması şöyle ifade edilir:
Bu formüle göre ortalamanın varyansı korelasyonlar ortalaması ile birlikte artış gösterir.
Bunun yanında, eğer değişkenler için varyans 1 değerde ise (örneğin değişken değerleri standardize edilmişlerse) o halde bu formül daha da basitleştirilip şu sekli alır:
Bu formul klasik sinama teorisinde Spearman-Brown öngörü formülü için kullanılır. Eğer korelasyonlar sabit kalırlarsa veya aynı şekilde yakınsama gösterirlerse, bu ifade, n limitte sonsuz değere yakınsama gösterdikçe, ρ değerine yakınsama gösterir. Bunun bir sonucuna göre, eşit korelasyonları olan veya yakınsama gösteren ortalama korelasyonu olan standardize edilmiş değişkenler için ortalamanın varyansı şöyle ifade edilebilir:
Buna göre büyük sayıda standardize edilmiş değişkenlerin ortalamasının varyansı, yaklaşık olarak bunların ortalama korelasyonuna eşittir.
Bu formul diğer bir sonuç da ortaya çıkartır. Büyük sayılar yasası örneklem ortalamasının anakütle ortalamasına yakınsama göstereceğini önermesine rağmen, bu formülden açıktır ki, birbirine korelasyonu olan değişkenler bulunuyorsa örneklem ortalaması anakütle ortalamasına yakınsama göstermez.
Değişkenlerin ağırlıklı toplamının varyansı
Varyans için hesaplama formülü
Varyans için hesaplama formülü hemen dogrudan dogruya beklenen değerlerin dogrusalligindan ve yukarida verilen tanimlamadan ortaya cikar\;
Bu çok zaman pratikte varyans hesaplamasi için kullanilir. Fakat eger denklemin iki kisminin degerleri birbirine esit veya cok yakinsa numerik yaklasimlama hatasindan etkilenip yanlis değerler verebilir.
Karakteristik özellik
Bir rassal değişkenin ikinci momentinin minimum değeri bu moment, rassal değişkenin ortalaması etrafında alınınca ortaya çıkar; yani
- ,
Bunun aksi olarak, eğer sürekli bir fonksiyon olan tüm X rassal değişkenleri için
koşulunu sağlıyorsa, o halde mutlaka ( a > 0) şeklinde bir fonksiyon olmasi gerekmektedir. Bu koşul çoklu boyutlu hallerde de geçerlidir. [1]
Ayrıca bakınız
Kaynakça
- Kaynak: A. Kagan and L. A. Shepp, "Why the variance?", Statistics and Probability Letters, C. 38, No 4, 1998, say. 329–333. (İngilizce)
Dış kaynaklar
- Spiegel, Murray R, ve Stephens, Larry J. (Tr.Çev.: Çelebioğlu, Salih) (2013) İstatistik , İstanbul: Nobel Akademik Yayıncılık ISBN 9786051337043