Standart sapma bir harfle gösterilir. Ortalama doğrusal ve standart sapma

Standart sapma, kurumsal dünyada bir konuşma veya sunumda bunu iyi bir şekilde başarabilen insanlara güvenilirlik kazandıran, bunun ne olduğunu bilmeyen ama söylemekten utananlar arasında ise belirsiz bir yanlış anlama bırakan istatistiksel terimlerden biridir. sormak. Aslında yöneticilerin çoğu standart sapma kavramını anlamıyor ve eğer siz de onlardan biriyseniz, yalanla yaşamayı bırakmanın zamanı geldi. Bugünkü makalemde, bu yeterince takdir edilmeyen istatistiksel ölçümün, üzerinde çalıştığınız verileri daha iyi anlamanıza nasıl yardımcı olabileceğini anlatacağım.

Standart sapma neyi ölçer?

İki mağazanın sahibi olduğunuzu düşünün. Kayıpları önlemek için stok bakiyelerini net bir şekilde kontrol etmek önemlidir. Hangi yöneticinin envanteri daha iyi yönettiğini bulmak amacıyla son altı haftalık envanteri analiz etmeye karar veriyorsunuz. Her iki mağazanın ortalama haftalık stok maliyeti yaklaşık olarak aynıdır ve yaklaşık 32 geleneksel birime denk gelmektedir. İlk bakışta ortalama ikinci tur, her iki yöneticinin de benzer performans gösterdiğini gösteriyor.

Ancak ikinci mağazanın faaliyetlerine daha yakından bakarsanız, ortalama değer doğru olmasına rağmen stok değişkenliğinin çok yüksek olduğunu (10'dan 58 USD'ye kadar) göreceksiniz. Dolayısıyla ortalamanın verileri her zaman doğru değerlendirmediği sonucuna varabiliriz. Standart sapmanın devreye girdiği yer burasıdır.

Standart sapma, değerlerin ortalamaya göre nasıl dağıldığını gösterir. Yani ikinci turdaki yayılmanın haftadan haftaya ne kadar büyük olduğunu anlayabilirsiniz.

Örneğimizde ortalamayla birlikte standart sapmayı hesaplamak için Excel'in STANDART DEVAL fonksiyonunu kullandık.

İlk yönetici durumunda standart sapma 2 idi. Bu bize örneklemdeki her değerin ortalamadan 2 saptığını gösteriyor. Bu iyi mi? Soruya farklı bir açıdan bakalım; 0'lık standart sapma bize örnekteki her değerin ortalamasına eşit olduğunu söyler (bizim durumumuzda 32,2). Dolayısıyla standart sapmanın 2 olması 0'dan pek farklı değildir, bu da çoğu değerin ortalamaya yakın olduğunu gösterir. Standart sapma 0'a ne kadar yakınsa ortalama o kadar güvenilirdir. Ayrıca, 0'a yakın bir standart sapma, verilerdeki değişkenliğin az olduğunu gösterir. Yani, standart sapması 2 olan bir ikinci tur değeri, ilk yöneticinin inanılmaz tutarlılığını gösterir.

İkinci mağazada ise standart sapma 18,9 oldu. Yani ikinci akışın maliyeti ortalama olarak haftadan haftaya ortalama değerden 18,9 oranında sapıyor. Çılgın yayılma! Standart sapma 0'dan ne kadar uzak olursa ortalamanın doğruluğu o kadar az olur. Bizim durumumuzda 18,9 rakamı ortalama değere (haftada 32,8 USD) güvenilemeyeceğini gösteriyor. Bu aynı zamanda bize haftalık ikinci akışın oldukça değişken olduğunu da söylüyor.

Kısaca standart sapma kavramı budur. Diğer önemli istatistiksel ölçümler (Mod, Medyan...) hakkında fikir vermese de aslında standart sapma çoğu istatistiksel hesaplamada çok önemli bir rol oynar. Standart sapma ilkelerini anlamak birçok iş sürecinize ışık tutacaktır.

Standart sapma nasıl hesaplanır?

Artık standart sapma sayısının ne söylediğini biliyoruz. Nasıl hesaplandığını bulalım.

10'dan 70'e kadar olan veri setine 10'luk adımlarla bakalım. Gördüğünüz gibi zaten H2 hücresindeki (turuncu) STANDARDEV fonksiyonunu kullanarak standart sapma değerini hesapladım.

Excel'in 21.6'ya ulaşmak için attığı adımlar aşağıdadır.

Daha iyi anlaşılması için tüm hesaplamaların görselleştirildiğini lütfen unutmayın. Aslında Excel'de hesaplama anında gerçekleşir ve tüm adımlar perde arkasında bırakılır.

İlk olarak Excel örnek ortalamayı bulur. Bizim durumumuzda ortalama 40 olarak ortaya çıktı ve bir sonraki adımda bu değer her numune değerinden çıkarıldı. Elde edilen her farkın karesi alınır ve toplanır. Elimizde 2800'e eşit bir toplam var ve bu rakamın örnek eleman sayısı eksi 1'e bölünmesi gerekiyor. 7 elemana sahip olduğumuz için 2800'ü 6'ya bölmemiz gerektiği ortaya çıkıyor. Elde edilen sonuçtan karekökü buluyoruz, bu rakam standart sapma olacaktır.

Görselleştirmeyi kullanarak standart sapmayı hesaplama ilkesini tam olarak bilmeyenler için, bu değeri bulmanın matematiksel bir yorumunu vereceğim.

Excel'de standart sapmayı hesaplamak için işlevler

Excel'in çeşitli standart sapma formülleri vardır. Tek yapmanız gereken =STDEV yazmanız ve kendiniz göreceksiniz.

STDEV.V ve STDEV.G işlevlerinin (listedeki birinci ve ikinci işlevler), daha önceki sürümlerle uyumluluk amacıyla tutulan STDSAPMA ve STDSAPMA işlevlerini (listedeki beşinci ve altıncı işlevler) sırasıyla kopyaladığını belirtmek gerekir. Excel'in sürümleri.

Genel olarak .B ve .G fonksiyonlarının sonlarındaki farklılık, bir örneklemin veya popülasyonun standart sapmasının hesaplanması prensibini gösterir. Bu iki dizi arasındaki farkı daha önceki yazımda anlatmıştım.

STANDARDEV ve STANDDREV işlevlerinin (listedeki üçüncü ve dördüncü işlevler) özel bir özelliği, bir dizinin standart sapmasını hesaplarken mantıksal ve metin değerlerinin dikkate alınmasıdır. Metin ve gerçek boolean değerleri 1, false boolean değerleri ise 0'dır. Bu iki fonksiyona ihtiyaç duyacağım bir durumu hayal edemiyorum, bu yüzden bunların göz ardı edilebileceğini düşünüyorum.

Wikipedia'dan materyal - özgür ansiklopedi

Standart sapma(eş anlamlılar: standart sapma, standart sapma, kare sapma; ilgili terimler: standart sapma, standart yayılma) - olasılık teorisi ve istatistikte, rastgele bir değişkenin değerlerinin matematiksel beklentisine göre dağılımının en yaygın göstergesi. Değer örneklerinin sınırlı dizileri ile matematiksel beklenti yerine örnek kümesinin aritmetik ortalaması kullanılır.

Temel bilgiler

Standart sapma, rastgele değişkenin kendi birimlerinde ölçülür ve aritmetik ortalamanın standart hatasını hesaplarken, güven aralıkları oluştururken, hipotezleri istatistiksel olarak test ederken, rastgele değişkenler arasındaki doğrusal ilişkiyi ölçerken kullanılır. Bir rastgele değişkenin varyansının karekökü olarak tanımlanır.

Standart sapma:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

Standart Sapma(rastgele bir değişkenin standart sapmasının tahmini X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre) S:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x)\sağ)^2);

Üç sigma kuralı

Üç sigma kuralı (3\sigma) - normal olarak dağıtılan bir rastgele değişkenin neredeyse tüm değerleri aralıkta yer alır \left(\bar(x)-3\sigma;\bar(x)+3\sigma\right). Daha kesin olarak - yaklaşık 0,9973 olasılıkla, normal olarak dağıtılan bir rastgele değişkenin değeri belirtilen aralıkta yer alır (değerin \bar(x) doğrudur ve numune işleme sonucunda elde edilmemiştir).

Gerçek değer ise \bar(x) bilinmiyorsa kullanmamalısınız \sigma, A S. Böylece üç sigma kuralı üç kuralına dönüştürülür. S .

Standart sapma değerinin yorumlanması

Daha büyük bir standart sapma değeri, sunulan setteki değerlerin, setin ortalama değeri ile daha büyük bir yayılımını gösterir; buna göre daha küçük bir değer, kümedeki değerlerin ortalama değer etrafında gruplandığını gösterir.

Örneğin üç sayı kümemiz var: (0, 0, 14, 14), (0, 6, 8, 14) ve (6, 6, 8, 8). Her üç kümenin de ortalama değerleri 7'ye ve standart sapmaları sırasıyla 7, 5 ve 1'e eşittir. Son kümenin küçük bir standart sapması vardır, çünkü kümedeki değerler ortalama değer etrafında gruplandırılmıştır; ilk set en büyük standart sapma değerine sahiptir - setin içindeki değerler ortalama değerden büyük ölçüde farklıdır.

Genel anlamda standart sapma bir belirsizlik ölçüsü olarak düşünülebilir. Örneğin fizikte standart sapma, bir niceliğin ardışık ölçümlerinin hatasını belirlemek için kullanılır. Bu değer, teori tarafından tahmin edilen değerle karşılaştırıldığında incelenen olgunun makullüğünü belirlemek için çok önemlidir: ölçümlerin ortalama değeri teorinin tahmin ettiği değerlerden büyük ölçüde farklıysa (büyük standart sapma), daha sonra elde edilen değerler veya bunları elde etme yöntemi yeniden kontrol edilmelidir.

Pratik Uygulama

Uygulamada standart sapma, bir kümedeki değerlerin ortalama değerden ne kadar farklı olabileceğini tahmin etmenize olanak tanır.

Ekonomi ve finans

Portföy getirisinin standart sapması \sigma =\sqrt(D[X]) portföy riski ile tanımlanır.

İklim

Diyelim ki aynı ortalama maksimum günlük sıcaklığa sahip iki şehir var, ancak biri sahilde, diğeri ise ovada bulunuyor. Kıyıda yer alan şehirlerin birçok farklı maksimum gündüz sıcaklığına sahip olduğu ve iç kesimlerde bulunan şehirlerden daha düşük olduğu bilinmektedir. Bu nedenle, bu değerin ortalama değeri aynı olmasına rağmen, bir kıyı kenti için maksimum günlük sıcaklıkların standart sapması, ikinci şehre göre daha az olacaktır; bu, pratikte maksimum hava sıcaklığının aynı bölgede olma ihtimali anlamına gelir. yılın herhangi bir gününde ortalama değerden farklı olarak iç kesimlerde bulunan bir şehir için daha yüksek olacaktır.

Spor

Atılan ve yenen gol sayısı, gol şansı vb. gibi bazı parametrelere göre derecelendirilen birkaç futbol takımının olduğunu varsayalım. Bu gruptaki en iyi takımın daha iyi değerlere sahip olması muhtemeldir. daha fazla sayıda parametre üzerinde Sunulan parametrelerin her biri için takımın standart sapması ne kadar küçük olursa, bu tür takımların sonucu o kadar öngörülebilir olur; Öte yandan, standart sapması büyük olan bir takımın sonucunu tahmin etmek zordur ve bu da dengesizlikle açıklanır; örneğin güçlü bir savunma ama zayıf bir atak.

Takım parametrelerinin standart sapmasını kullanmak, iki takım arasındaki bir maçın sonucunu bir dereceye kadar tahmin etmeyi, takımların güçlü ve zayıf yönlerini ve dolayısıyla seçilen dövüş yöntemlerini değerlendirmeyi mümkün kılar.

Ayrıca bakınız

"Kök Ortalama Kare Sapması" makalesi hakkında yorum yazın

Edebiyat

  • Borovikov V.İSTATİSTİK. Bilgisayarda veri analizi sanatı: Profesyoneller için / V. Borovikov. - St.Petersburg. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1..

Standart Sapmayı karakterize eden bir alıntı

Ve kapıyı hızla açarak kararlı adımlarla balkona çıktı. Konuşma aniden kesildi, şapkalar ve kepler çıkarıldı ve tüm gözler dışarı çıkan konta çevrildi.
- Merhaba arkadaşlar! - sayı hızlı ve yüksek sesle söyledi. - Geldiğiniz için teşekkür ederim. Şimdi size geleceğim ama öncelikle kötü adamla uğraşmamız gerekiyor. Moskova'yı öldüren haini cezalandırmamız gerekiyor. Beni bekle! “Ve kont kapıyı sertçe çarparak aynı hızla odasına döndü.
Kalabalıktan bir zevk mırıltısı yayıldı. “Bu onun tüm kötüleri kontrol edeceği anlamına geliyor! Ve sen Fransızca dersin... o sana tüm mesafeyi verir!” - insanlar sanki inanç eksikliğinden dolayı birbirlerini suçluyormuş gibi dediler.
Birkaç dakika sonra bir subay aceleyle ön kapıdan çıktı, bir şeyler emretti ve ejderhalar ayağa kalktı. Balkondaki kalabalık heyecanla verandaya doğru ilerledi. Öfkeli, hızlı adımlarla verandaya çıkan Rostopchin, sanki birini arıyormuş gibi aceleyle etrafına baktı.
-Nerede o? - dedi kont ve bunu söylediği anda evin köşesinden iki ejderhanın arasından uzun ince boyunlu, kafası yarı tıraşlı ve büyümüş genç bir adamın çıktığını gördü. Bu genç adam, bir zamanlar şık, mavi kumaş kaplı, eski püskü tilki koyun derisi bir ceket ve kirli mahkum harem pantolonu giymiş, temizlenmemiş, yıpranmış ince çizmelerin içine tıkılmıştı. İnce, zayıf bacaklarına ağır bir şekilde asılı olan prangalar, genç adamın tereddütlü yürüyüşünü zorlaştırıyordu.
- A! - dedi Rastopchin, bakışlarını aceleyle tilki koyun derisi paltolu genç adamdan çevirerek ve verandanın alt basamağını işaret ederek. - Buraya koy! “Prangalarını şakırdatan genç adam, koyun derisi paltosunun ütülü yakasını parmağıyla tutarak belirtilen basamağa ağır bir şekilde adım attı, uzun boynunu iki kez çevirdi ve içini çekerek ince, çalışmayan ellerini karnının önünde kavuşturdu. teslimiyetçi bir hareketle.
Genç adam basamakta yerini alırken sessizlik birkaç saniye devam etti. Sadece arka sıralarda tek bir yere sıkışan insanlardan inlemeler, inlemeler, titremeler ve hareket eden ayakların takırtıları duyuldu.
Belirtilen yerde durmasını bekleyen Rastopchin kaşlarını çattı ve eliyle yüzünü ovuşturdu.
- Çocuklar! - dedi Rastopchin metalik çınlayan bir sesle, - bu adam, Vereshchagin, Moskova'nın yok olduğu aynı alçaktır.
Tilki koyun derisi paltolu genç bir adam itaatkar bir pozda duruyordu, ellerini karnının önünde birleştirip hafifçe eğilmişti. Bir deri bir kemik kalmış genç yüzü, umutsuz bir ifadeyle, traşlı bir kafa yüzünden şekilsizleşmişti. Sayımın ilk kelimelerini söylerken yavaşça başını kaldırdı ve sanki ona bir şey söylemek istiyormuş ya da en azından onunla göz göze gelmek istiyormuş gibi sayıma baktı. Ama Rastopchin ona bakmadı. Genç adamın ip gibi uzun ince boynunda, kulağın arkasındaki damar gerginleşerek maviye döndü ve bir anda yüzü kırmızıya döndü.
Bütün gözler ona odaklanmıştı. Kalabalığa baktı ve sanki insanların yüzlerinde okuduğu ifadeden cesaret almış gibi üzgün ve çekingen bir şekilde gülümsedi ve tekrar başını eğerek ayaklarını basamakta düzeltti.
Rastopchin eşit ve keskin bir sesle, "Çarına ve anavatanına ihanet etti, kendisini Bonaparte'a teslim etti, tüm Ruslar arasında Rusların adını lekeleyen tek kişi o ve Moskova onun yüzünden yok oluyor" dedi; ama aniden aynı itaatkâr pozda durmaya devam eden Vereshchagin'e hızla baktı. Sanki bu bakış onu patlatmış gibi, elini kaldırarak neredeyse bağırarak halka dönerek: "Onunla yargını hallet!" Onu sana veriyorum!
İnsanlar sessizdi ve yalnızca birbirlerine daha da yakınlaştılar. Birbirimize sarılmak, bu enfeksiyonlu havasızlığı solumak, hareket edecek gücü bulamamak ve bilinmeyen, anlaşılmaz ve korkunç bir şeyi beklemek dayanılmaz hale geldi. Ön sıralarda duran, önlerinde olup biteni gören ve duyanlar, gözleri korkuyla açılmış, ağızları açık, tüm güçlerini kullanarak arkalarındakilerin sırtlarındaki baskıyı bastırdılar.
-Dövün onu!.. Hain ölsün, Rus'un adını lekelemesin! - diye bağırdı Rastopchin. - Yakut! Ben emrediyorum! - Kelimeleri değil, Rastopchin'in sesinin öfkeli seslerini duyan kalabalık inledi ve ileri doğru ilerledi, ancak tekrar durdu.
Tekrar oluşan anlık sessizliğin ortasında Vereshchagin'in çekingen ve aynı zamanda teatral sesi, "Sayın!.." dedi. "Kont, üstümüzde bir tanrı var..." dedi Vereshchagin başını kaldırarak ve ince boynundaki kalın damar yine kanla doldu ve renk hızla belirip yüzünden kaçtı. Söylemek istediğini bitirmedi.
- Doğrayın onu! Emrediyorum!.. - diye bağırdı Rastopchin, aniden Vereshchagin gibi solgunlaştı.
- Kılıçlar dışarı! - memur, kılıcını kendisi çekerek ejderhalara bağırdı.
Daha da güçlü bir dalga insanların arasından geçti ve ön sıralara ulaşan bu dalga, ön sıraları sarsarak hareket ettirdi ve onları verandanın merdivenlerine kadar getirdi. Vereshchagin'in yanında, yüzünde taşlaşmış bir ifade olan ve elini kaldırmış uzun boylu bir adam duruyordu.
- Yakut! - Neredeyse bir subay ejderhalara fısıldadı ve askerlerden biri aniden öfkeyle çarpık bir yüzle Vereshchagin'in kafasına kör bir kılıçla vurdu.
"A!" - Vereshchagin kısaca ve şaşkınlıkla bağırdı, korkuyla etrafına baktı ve sanki bunun ona neden yapıldığını anlamıyormuş gibi. Kalabalıkta aynı şaşkınlık ve dehşet iniltisi dolaştı.
"Aman Tanrım!" – birinin üzücü ünlemi duyuldu.
Ancak Vereshchagin'in kaçtığı şaşkınlık çığlığının ardından acı içinde acınası bir çığlık attı ve bu çığlık onu mahvetti. Hala kalabalığı tutan, en yüksek dereceye kadar uzanan insani duygu bariyeri anında kırıldı. Suç başlamıştı, tamamlanması gerekiyordu. Acınası sitem iniltisi, kalabalığın tehditkar ve öfkeli kükremesi tarafından bastırıldı. Gemileri parçalayan son yedinci dalga gibi, bu durdurulamayan son dalga da arka saflardan yükseldi, ön saflara ulaştı, onları devirdi ve her şeyi yuttu. Saldıran ejderha, darbesini tekrarlamak istedi. Vereshchagin bir korku çığlığı atarak elleriyle kendini koruyarak insanlara doğru koştu. Çarptığı uzun boylu adam, elleriyle Vereshchagin'in ince boynunu yakaladı ve çılgın bir çığlık atarak kükreyen insan kalabalığının ayaklarının altına düştü.
Bazıları Vereshchagin'i dövüp parçaladı, diğerleri uzun ve küçüktü. Ezilen insanların ve uzun boylu adamı kurtarmaya çalışanların çığlıkları kalabalığın öfkesini daha da artırdı. Ejderhalar uzun bir süre boyunca kanlar içinde, yarı ölünceye kadar dövülmüş fabrika işçisini serbest bırakamadı. Ve Vereshchagin'i döven, boğan ve parçalayan insanlar, kalabalığın bir kez başladıktan sonra işi tamamlamaya çalıştığı tüm hummalı aceleye rağmen uzun bir süre onu öldüremedi; ama kalabalık, ortada tek bir kütle gibi, bir yandan diğer yana sallanarak onları her taraftan bastırdı ve onlara onu bitirme veya fırlatma fırsatı vermedi.

Bu varyans hesaplamasının bir dezavantajı olduğunu belirtmekte fayda var - önyargılı olduğu ortaya çıkıyor, yani. matematiksel beklentisi varyansın gerçek değerine eşit değildir. Bu konuda daha fazlasını okuyun. Aynı zamanda her şey o kadar da kötü değil. Örneklem büyüklüğü arttıkça hala teorik analoguna yaklaşmaktadır. asimptotik olarak tarafsızdır. Bu nedenle büyük örneklem boyutlarıyla çalışırken yukarıdaki formülü kullanabilirsiniz.

İşaret dilini sözcük diline çevirmek faydalıdır. Varyansın sapmaların ortalama karesi olduğu ortaya çıktı. Yani önce ortalama değer hesaplanır, ardından her orijinal değer ile ortalama değer arasındaki fark alınır, karesi alınır, eklenir ve ardından popülasyondaki değer sayısına bölünür. Bireysel değer ile ortalama arasındaki fark, sapmanın ölçüsünü yansıtır. Tüm sapmaların yalnızca pozitif sayılar haline gelmesi ve toplanırken pozitif ve negatif sapmaların karşılıklı olarak yok edilmesini önlemek için kareleri alınır. Daha sonra, sapmaların kareleri verildiğinde, basitçe aritmetik ortalamayı hesaplarız. Ortalama - kare - sapmalar. Sapmaların karesi alınır ve ortalaması hesaplanır. Çözüm sadece üç kelimede yatıyor.

Ancak aritmetik ortalama veya indeks gibi saf haliyle dağılım kullanılmaz. Daha ziyade diğer istatistiksel analiz türleri için gerekli olan yardımcı ve ara bir göstergedir. Normal bir ölçü birimi bile yok. Formüle bakılırsa, bu orijinal verilerin ölçü biriminin karesidir. Dedikleri gibi, şişe olmadan çözemezsiniz.

(modül 111)

Varyansı gerçeğe döndürmek, yani onu daha sıradan amaçlarla kullanmak için, bundan karekök çıkarılır. Sözde olduğu ortaya çıktı standart sapma (RMS). “Standart sapma” veya “sigma” (Yunanca harfin adından) isimleri vardır. Standart sapma formülü şöyledir:

Numune için bu göstergeyi elde etmek için aşağıdaki formülü kullanın:

Varyansta olduğu gibi, biraz farklı bir hesaplama seçeneği vardır. Ancak örneklem büyüdükçe fark ortadan kalkıyor.

Standart sapma, elbette, veri dağılımının ölçüsünü de karakterize eder, ancak artık (dağılımın aksine) aynı ölçüm birimlerine sahip oldukları için orijinal verilerle karşılaştırılabilir (bu, hesaplama formülünden açıktır). Ancak bu gösterge bile saf haliyle çok bilgilendirici değildir, çünkü kafa karıştırıcı çok fazla ara hesaplama (sapma, kare, toplam, ortalama, kök) içerir. Ancak standart sapmayla doğrudan çalışmak zaten mümkün çünkü bu göstergenin özellikleri iyi çalışılmış ve biliniyor. Mesela şu var üç sigma kuralı 1000 veri değerinden 997'sinin aritmetik ortalamanın ±3 sigma dahilinde olduğunu belirtir. Belirsizliğin bir ölçüsü olarak standart sapma birçok istatistiksel hesaplamada da yer almaktadır. Yardımı ile çeşitli tahmin ve tahminlerin doğruluk derecesi belirlenir. Eğer varyasyon çok büyükse, standart sapma da büyük olacaktır ve dolayısıyla tahmin hatalı olacaktır; bu da örneğin çok geniş güven aralıklarında ifade edilecektir.

Değişim katsayısı

Standart sapma, dağılım ölçüsünün mutlak bir tahminini verir. Bu nedenle, yayılımın değerlerin kendisine göre ne kadar büyük olduğunu anlamak için (yani ölçeklerine bakılmaksızın) göreceli bir gösterge gereklidir. Bu gösterge denir varyasyon katsayısı ve aşağıdaki formül kullanılarak hesaplanır:

Değişim katsayısı yüzde olarak ölçülür (%100 ile çarpılırsa). Bu göstergeyi kullanarak, ölçekleri ve ölçü birimleri ne olursa olsun çeşitli olayları karşılaştırabilirsiniz. Bu gerçek, varyasyon katsayısını bu kadar popüler kılan şeydir.

İstatistiklerde, varyasyon katsayısının değeri %33'ün altında ise popülasyonun homojen olduğu, %33'ün üzerinde ise heterojen olduğu kabul edilmektedir. Burada herhangi bir şey hakkında yorum yapmak benim için zor. Bunu kimin ve neden tanımladığını bilmiyorum ama bu bir aksiyom olarak kabul ediliyor.

Kuru teoriye kapıldığımı ve görsel ve mecazi bir şeyler getirmem gerektiğini hissediyorum. Öte yandan, tüm varyasyon göstergeleri yaklaşık olarak aynı şeyi açıklar, ancak farklı hesaplanırlar. Bu nedenle çeşitli örnekler göstermek zordur, ancak göstergelerin yalnızca değerleri farklılık gösterebilir, ancak özleri farklılık gösteremez. Öyleyse aynı veri seti için farklı varyasyon göstergelerinin değerlerinin nasıl farklılaştığını karşılaştıralım. Ortalama doğrusal sapmayı ('dan) hesaplama örneğini ele alalım. İşte kaynak veriler:

Ve sana hatırlatacak bir program.

Bu verileri kullanarak çeşitli varyasyon göstergelerini hesaplıyoruz.

Ortalama değer olağan aritmetik ortalamadır.

Değişim aralığı maksimum ve minimum arasındaki farktır:

Ortalama doğrusal sapma aşağıdaki formül kullanılarak hesaplanır:

Standart Sapma:

Hesaplamayı bir tabloda özetleyelim.

Görüldüğü gibi doğrusal ortalama ve standart sapma, veri değişiminin derecesi için benzer değerler vermektedir. Varyans sigma karedir, dolayısıyla her zaman nispeten büyük bir sayı olacaktır, bu da aslında hiçbir şey ifade etmez. Varyasyon aralığı, aşırı değerler arasındaki farktır ve çok şey konuşabilir.

Bazı sonuçları özetleyelim.

Bir göstergenin değişmesi, bir sürecin veya olgunun değişkenliğini yansıtır. Derecesi çeşitli göstergeler kullanılarak ölçülebilir.

1. Değişim aralığı - maksimum ve minimum arasındaki fark. Olası değerlerin aralığını yansıtır.
2. Ortalama doğrusal sapma – analiz edilen popülasyonun tüm değerlerinin ortalama değerlerinden mutlak (modülo) sapmalarının ortalamasını yansıtır.
3. Dağılım - sapmaların ortalama karesi.
4. Standart sapma, dağılımın köküdür (sapmaların ortalama karesi).
5. Değişim katsayısı, ölçek ve ölçü birimlerine bakılmaksızın değerlerin dağılma derecesini yansıtan en evrensel göstergedir. Değişim katsayısı yüzde olarak ölçülür ve farklı süreç ve olayların değişimini karşılaştırmak için kullanılabilir.

Dolayısıyla istatistiksel analizde, olayların homojenliğini ve süreçlerin istikrarını yansıtan bir göstergeler sistemi vardır. Genellikle varyasyon göstergelerinin bağımsız bir anlamı yoktur ve daha fazla veri analizi için kullanılır (güven aralıklarının hesaplanması)

Standart sapma

Değişimin en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan ortalama kare sapmadır. Standart sapma() özelliğin bireysel değerlerinin aritmetik ortalamadan ortalama kare sapmasının kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış verilere ağırlıklı standart sapma uygulanır:

Normal dağılım koşullarında ortalama kare ve ortalama doğrusal sapmalar arasında şu oran oluşur: ~ 1,25.

Değişimin ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin ordinat değerlerinin belirlenmesinde, numune gözleminin organizasyonu ile ilgili hesaplamalarda ve numune özelliklerinin doğruluğunun belirlenmesinde ve ayrıca numune özelliklerinin değerlendirilmesinde kullanılır. Homojen bir popülasyonda bir özelliğin varyasyonunun sınırları.

18. Varyans, türleri, standart sapma.

Rastgele bir değişkenin varyansı- belirli bir rastgele değişkenin yayılmasının ölçüsü, yani matematiksel beklentiden sapması. İstatistiklerde veya gösterimi sıklıkla kullanılır. Varyansın kareköküne genellikle denir standart sapma, standart sapma veya standart yayılma.

Toplam varyans (σ2) bir özelliğin varyasyonunu, bu varyasyona neden olan tüm faktörlerin etkisi altında bütünüyle ölçer. Aynı zamanda gruplama yöntemi sayesinde gruplama özelliğinden kaynaklanan varyasyonu ve hesaba katılmayan faktörlerin etkisiyle ortaya çıkan varyasyonu tespit etmek ve ölçmek mümkündür.

Gruplararası varyans (σ 2 mgr) sistematik varyasyonu, yani grubun temelini oluşturan faktör olan özelliğin etkisi altında ortaya çıkan incelenen özelliğin değerindeki farklılıkları karakterize eder.

Standart sapma(eş anlamlılar: standart sapma, standart sapma, kare sapma; ilgili terimler: standart sapma, standart yayılma) - olasılık teorisi ve istatistikte, rastgele bir değişkenin değerlerinin matematiksel beklentisine göre dağılımının en yaygın göstergesi. Sınırlı örnek değer dizileri için, matematiksel beklenti yerine örneklerin toplamının aritmetik ortalaması kullanılır.

Standart sapma, rastgele değişkenin kendisinin ölçüm birimlerinde ölçülür ve aritmetik ortalamanın standart hatasını hesaplarken, güven aralıkları oluştururken, hipotezleri istatistiksel olarak test ederken, rastgele değişkenler arasındaki doğrusal ilişkiyi ölçerken kullanılır. Bir rastgele değişkenin varyansının karekökü olarak tanımlanır.

Standart sapma:

Standart Sapma(rastgele bir değişkenin standart sapmasının tahmini X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre):

dağılım nerede; - Ben seçimin inci unsuru; - numune boyutu; - numunenin aritmetik ortalaması:

Her iki tahminin de taraflı olduğunu belirtmek gerekir. Genel durumda tarafsız bir tahmin yapmak mümkün değildir. Bu durumda yansız varyans tahminine dayalı tahmin tutarlıdır.

19. Mod ve medyanın belirlenmesinin özü, kapsamı ve prosedürü.

İstatistiklerdeki güç ortalamalarına ek olarak, değişen bir özelliğin değerinin ve dağılım serisinin iç yapısının göreceli karakterizasyonu için, esas olarak aşağıdakilerle temsil edilen yapısal ortalamalar kullanılır: moda ve medyan.

Moda- Bu serinin en yaygın çeşididir. Moda, örneğin müşteriler arasında en çok talep gören giysi ve ayakkabıların bedeninin belirlenmesinde kullanılır. Ayrık bir serinin modu, en yüksek frekansa sahip değişkendir. Bir aralık varyasyon serisi için modu hesaplarken, önce modal aralığı (maksimum frekansa göre) ve ardından aşağıdaki formülü kullanarak özelliğin modal değerinin değerini belirlemek son derece önemlidir:

§ - modanın anlamı

§ - modal aralığın alt sınırı

§ - aralık değeri

§ - modal aralık frekansı

§ - modaldan önceki aralığın frekansı

§ - modalı takip eden aralığın frekansı

Medyan -ĸᴏᴛᴏᴩᴏᴇ özelliğinin bu değeri sıralanmış serilerin temelinde yer alır ve bu seriyi eşit sayıda iki parçaya böler.

Medyanı belirlemek için ayrı bir seride frekanslar mevcutsa, önce frekansların yarı toplamını hesaplayın ve ardından değişkenin hangi değerinin buna uygun olduğunu belirleyin. (Sıralanan seri tek sayıda özellik içeriyorsa ortanca sayı şu formül kullanılarak hesaplanır:

M e = (n (toplam özellik sayısı) + 1)/2,

özelliklerin çift sayıda olması durumunda medyan, satırın ortasındaki iki özelliğin ortalamasına eşit olacaktır).

Medyan hesaplanırken aralık varyasyon serileri içinİlk önce medyanın bulunduğu medyan aralığını belirleyin ve ardından aşağıdaki formülü kullanarak medyanın değerini belirleyin:

§ - gerekli medyan

§ - medyanı içeren aralığın alt sınırı

§ - aralık değeri

§ - frekansların toplamı veya seri terimlerinin sayısı

§ - medyandan önceki aralıkların birikmiş frekanslarının toplamı

§ - medyan aralığın sıklığı

Örnek. Modu ve medyanı bulun.

Çözüm: Bu örnekte modal aralık 25-30 yaş grubu içerisindedir, çünkü bu aralık en yüksek frekansa sahiptir (1054).

Modun büyüklüğünü hesaplayalım:

Bu, öğrencilerin modal yaşının 27 olduğu anlamına gelir.

Medyanı hesaplayalım. Ortanca aralık 25-30 yaş grubudur, çünkü bu aralık içinde nüfusu iki eşit parçaya bölen bir seçenek vardır (Σf i /2 = 3462/2 = 1731). Daha sonra gerekli sayısal verileri formülde yerine koyarız ve medyanın değerini elde ederiz:

Bu da öğrencilerin yarısının 27,4 yaşın altında, diğer yarısının ise 27,4 yaşın üzerinde olduğu anlamına geliyor.

Mod ve medyana ek olarak, sıralanan seriyi 4 eşit parçaya bölen çeyrekler, ondalıklar - 10 parça ve yüzdelikler - 100 parçaya bölen çeyrekler gibi göstergeler kullanılır.

20. Örnek gözlem kavramı ve kapsamı.

Seçici gözlem sürekli gözetim kullanıldığında geçerlidir fiziksel olarak imkansızçok miktarda veri nedeniyle veya ekonomik olarak mümkün değil. Örneğin yolcu akışlarını, piyasa fiyatlarını ve aile bütçelerini incelerken fiziksel imkansızlık ortaya çıkar. Ekonomik uygunsuzluk, örneğin tatmak, tuğlaları dayanıklılık açısından test etmek vb. gibi, imhalarıyla ilişkili malların kalitesini değerlendirirken ortaya çıkar.

Gözlem için seçilen istatistiksel birimler şunlardır: örnek popülasyon veya örnek ve bunların tüm dizisi - genel nüfus(GS). Aynı zamanda numunedeki birim sayısı belirtmek N ve tüm HS boyunca - N. Davranış bilinmiyor genellikle denir göreceli boyut veya örnek paylaşım.

Örnek gözlem sonuçlarının kalitesi şunlara bağlıdır: örnek temsililik yani GS'de ne kadar temsili olduğuyla ilgili. Numunenin temsil edilebilirliğini sağlamak için kurallara uymak son derece önemlidir. birimlerin rastgele seçimi ilkesi HS biriminin numuneye dahil edilmesinin şans dışında herhangi bir faktörden etkilenemeyeceğini varsayar.

Var Rastgele seçimin 4 yoluörneklemek için:

  1. Aslında rastgele seçim veya "loto yöntemi", istatistiksel değerlere seri numaraları atandığında, belirli nesnelere (örneğin variller) kaydedilir, bunlar daha sonra bir kapta (örneğin bir torbada) karıştırılır ve rastgele seçilir. Pratikte bu yöntem, bir rastgele sayı üreteci veya rastgele sayıların matematiksel tabloları kullanılarak gerçekleştirilir.
  2. Mekanik her birine göre seçim ( Bilmiyorum Genel popülasyonun )-th değeri. Örneğin 100.000 değer içeriyorsa ve 1.000 seçmeniz gerekiyorsa her 100.000 / 1000 = 100'üncü değer örneğe dahil edilecektir. Üstelik sıralama yapılmamışsa ilk yüz içinden rastgele birincisi seçilir, diğerlerinin sayısı yüz fazla olur. Örneğin, ilk ünite 19 numaraysa, sonraki ünite 119 numara, ardından 219 numara, ardından 319 numara vb. olmalıdır. Nüfus birimleri sıralanırsa önce 50 numara, ardından 150 numara, ardından 250 numara vb. seçilir.
  3. Heterojen bir veri dizisinden değerlerin seçimi gerçekleştirilir tabakalı(tabakalı) yöntem, popülasyonun ilk önce rastgele veya mekanik seçimin uygulandığı homojen gruplara bölünmesidir.
  4. Özel bir örnekleme yöntemi seri bireysel değerleri değil, rastgele veya mekanik olarak seçtikleri, ancak sürekli gözlemin gerçekleştirildiği serilerini (bir sayıdan arka arkaya bir sayıya kadar diziler) seçtikleri seçim.

Örnek gözlemlerin kalitesi aynı zamanda şunlara da bağlıdır: numune türü: tekrarlandı veya tekrarlanamaz.Şu tarihte: yeniden seçimÖrneğe dahil edilen istatistiksel değerler veya serileri, kullanım sonrasında genel popülasyona geri döndürülerek yeni bir örneğe dahil edilme şansı elde edilir. Üstelik genel popülasyondaki tüm değerlerin örneğe dahil edilme olasılığı aynıdır. Tekrarlanmayan seçimörneğe dahil edilen istatistiksel değerlerin veya serilerinin kullanımdan sonra genel popülasyona geri dönmediği ve dolayısıyla kalan değerlerin bir sonraki örneğe dahil olma olasılığının arttığı anlamına gelir.

Tekrarlı olmayan örnekleme daha doğru sonuçlar verir ve bu nedenle daha sık kullanılır. Ancak uygulanamadığı durumlar vardır (yolcu akışlarının, tüketici talebinin incelenmesi vb.) ve ardından tekrarlanan bir seçim gerçekleştirilir.

21. Maksimum gözlem örnekleme hatası, ortalama örnekleme hatası, bunların hesaplanmasına ilişkin prosedür.

Örnek popülasyon oluşturmak için yukarıda sıralanan yöntemleri ve ortaya çıkan temsiliyet hatalarını ayrıntılı olarak ele alalım. Uygun şekilde rastgeleÖrnekleme, herhangi bir sistematik unsur olmadan popülasyondan rastgele birimlerin seçilmesine dayanmaktadır. Teknik olarak, gerçek rastgele seçim, kura çekilerek (örneğin piyangolar) veya rastgele sayılar tablosu kullanılarak gerçekleştirilir.

Seçici gözlem uygulamasında "saf haliyle" uygun rastgele seçim nadiren kullanılır, ancak diğer seçilim türleri arasında orijinaldir ve seçici gözlemin temel ilkelerini uygular. Basit rastgele örnekleme için örnekleme yöntemi teorisi ve hata formülü ile ilgili bazı soruları ele alalım.

Örnekleme yanlılığı- ϶ᴛᴏ parametrenin genel popülasyondaki değeri ile örnek gözlem sonuçlarından hesaplanan değeri arasındaki fark. Ortalama niceliksel özellik için örnekleme hatasının şu şekilde belirlendiğine dikkat etmek önemlidir:

Gösterge genellikle maksimum örnekleme hatası olarak adlandırılır. Örnek ortalaması, örneğe hangi birimlerin dahil edildiğine bağlı olarak farklı değerler alabilen rastgele bir değişkendir. Dolayısıyla örnekleme hataları da rastgele değişkenlerdir ve farklı değerler alabilirler. Bu nedenle olası hataların ortalaması belirlenir - ortalama örnekleme hatası, şunlara bağlıdır:

· örneklem büyüklüğü: sayı ne kadar büyük olursa, ortalama hata o kadar küçük olur;

· incelenen özellikteki değişimin derecesi: özelliğin varyasyonu ve dolayısıyla dağılım ne kadar küçük olursa, ortalama örnekleme hatası da o kadar küçük olur.

Şu tarihte: rastgele yeniden seçim ortalama hata hesaplanır. Pratikte genel varyans tam olarak bilinmemekle birlikte olasılık teorisinde kanıtlanmıştır. Yeterince büyük n'nin değeri 1'e yakın olduğundan, bunu varsayabiliriz. Daha sonra ortalama örnekleme hatası hesaplanmalıdır: . Ancak küçük bir örnek durumunda (n ile)<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

Şu tarihte: rastgele tekrarlanmayan örnekleme Verilen formüller değere göre ayarlanır. Bu durumda ortalama tekrarlı olmayan örnekleme hatası: Ve . Çünkü her zaman değerinden küçükse, çarpan () her zaman 1'den küçüktür. Bu, tekrarlanan seçimdeki ortalama hatanın, tekrarlanan seçimdeki ortalama hatadan her zaman daha az olduğu anlamına gelir. Mekanik numune alma genel nüfusun bir şekilde sıralandığı durumlarda kullanılır (örneğin seçmenlerin alfabetik sıraya göre listelenmesi, telefon numaraları, ev ve apartman numaraları). Birimlerin seçimi, örnekleme yüzdesinin ters değerine eşit olan belirli bir aralıkta gerçekleştirilir. Yani %2'lik bir örneklemle genel popülasyonun her 50 birimi = 1/0,02, %5'lik bir örneklemle her 1/0,05 = 20 birimi seçilir.

Referans noktası farklı şekillerde seçilir: aralığın ortasından rastgele, referans noktasında bir değişiklikle. Önemli olan sistematik hatalardan kaçınmaktır. Örneğin %5'lik bir örneklemde ilk birim 13. ise sonraki birimler 33, 53, 73 vb. olur.

Doğruluk açısından, mekanik seçim gerçek rastgele örneklemeye yakındır. Bu nedenle mekanik örneklemenin ortalama hatasını belirlemek için uygun rastgele seçim formülleri kullanılır.

Şu tarihte: tipik seçimİncelenen nüfus öncelikle homojen, benzer gruplara ayrılır. Örneğin, işletmeleri araştırırken bunlar endüstriler, alt sektörler; nüfus incelerken bunlar bölgeler, sosyal veya yaş gruplarıdır. Daha sonra, her gruptan bağımsız bir seçim mekanik olarak veya tamamen rastgele yapılır.

Tipik örnekleme diğer yöntemlere göre daha doğru sonuçlar üretir. Genel popülasyonun yazılması, her tipolojik grubun örnekte temsil edilmesini sağlar, bu da ortalama örnekleme hatası üzerindeki gruplar arası varyansın etkisini ortadan kaldırmayı mümkün kılar. Bu nedenle, varyansları toplama kuralına () göre tipik bir numunenin hatasını bulurken, yalnızca grup varyanslarının ortalamasını hesaba katmak son derece önemlidir. Daha sonra ortalama örnekleme hatası: tekrarlanan örneklemeyle, tekrarlanmayan örneklemeyle , Nerede – örneklemdeki grup içi varyansların ortalaması.

Seri (veya yuva) seçimiÖrneklem araştırmasının başlangıcından önce popülasyon serilere veya gruplara ayrıldığında kullanılır. Bu seriler bitmiş ürünlerin paketlenmesini, öğrenci gruplarını ve tugayları içerir. İncelemeye yönelik seriler mekanik olarak veya tamamen rastgele seçilir ve seriler içerisinde birimlerin sürekli incelenmesi gerçekleştirilir. Bu nedenle, ortalama örnekleme hatası yalnızca aşağıdaki formül kullanılarak hesaplanan gruplar arası (seriler arası) varyansa bağlıdır: burada r, seçilen serilerin sayısıdır; – i-inci serinin ortalaması. Seri örneklemenin ortalama hatası hesaplanır: tekrarlanan örneklemeyle, tekrarlanmayan örneklemeyle burada R, serilerin toplam sayısıdır. Kombine Seçim, dikkate alınan seçim yöntemlerinin bir kombinasyonudur.

Herhangi bir örnekleme yöntemi için ortalama örnekleme hatası, esas olarak numunenin mutlak büyüklüğüne ve daha az ölçüde numunenin yüzdesine bağlıdır. İlk durumda 4.500 birimlik bir popülasyondan, ikinci durumda ise 225.000 birimlik bir popülasyondan 225 gözlem yapıldığını varsayalım. Her iki durumda da varyanslar 25'e eşittir. Bu durumda ilk durumda, %5 seçimle örnekleme hatası şöyle olacaktır: İkinci durumda, %0,1 seçimle şuna eşit olacaktır:

Ancak örnekleme yüzdesi 50 kat azaltıldığında örneklem büyüklüğü değişmediğinden örnekleme hatası biraz arttı. Örneklem büyüklüğünün 625 gözleme çıkarıldığını varsayalım. Bu durumda örnekleme hatası: Aynı popülasyon büyüklüğü ile örneklemin 2,8 kat arttırılması, örnekleme hatasının boyutunu 1,6 kattan fazla azaltır.

22.Örnek popülasyon oluşturma yöntem ve yöntemleri.

İstatistikte, çalışmanın amaçlarına göre belirlenen ve çalışma nesnesinin özelliklerine bağlı olarak örnek popülasyonlar oluşturmak için çeşitli yöntemler kullanılır.

Örneklem araştırması yapmanın temel koşulu, örnekleme dahil edilecek genel nüfusun her birimi için fırsat eşitliği ilkesinin ihlali sonucu ortaya çıkan sistematik hataların oluşmasının önlenmesidir. Sistematik hataların önlenmesi, örnek popülasyon oluşturmak için bilimsel temelli yöntemlerin kullanılmasıyla sağlanır.

Genel popülasyondan birimleri seçmek için aşağıdaki yöntemler vardır: 1) bireysel seçim - örnek için bireysel birimler seçilir; 2) grup seçimi - örnek, niteliksel olarak homojen grupları veya incelenen birim dizilerini içerir; 3) Birleşik seçilim, bireysel ve grup seçiliminin birleşimidir. Seçim yöntemleri, örnek popülasyon oluşturma kurallarına göre belirlenir.

Örnek şöyle olmalıdır:

  • aslında rastgeleÖrnek popülasyonun, genel popülasyondan bireysel birimlerin rastgele (kasıtsız) seçilmesi sonucu oluşması gerçeğinden oluşur. Bu durumda örnek popülasyonda seçilen birim sayısı genellikle kabul edilen örnek oranına göre belirlenir. Örnek oranı, örnek popülasyondaki (n) birim sayısının genel popülasyondaki (N, ᴛ.ᴇ) birim sayısına oranıdır.
  • mekanikÖrnek popülasyondaki birimlerin seçiminin, eşit aralıklara (gruplara) bölünmüş genel popülasyondan yapılması gerçeğinden oluşur. Bu durumda popülasyondaki aralığın büyüklüğü, örneklem payının tersine eşittir. Yani %2'lik bir örnekle her 50. birim seçilir (1:0.02), %5'lik bir örnekle her 20. birim (1:0.05) vb. seçilir. Bununla birlikte, kabul edilen seçilim oranına uygun olarak, genel nüfus, adeta mekanik olarak eşit büyüklükteki gruplara bölünmüştür. Her gruptan örnek için yalnızca bir birim seçilir.
  • tipik – genel nüfusun ilk olarak homojen tipik gruplara ayrıldığı yer. Daha sonra, her bir tipik gruptan tamamen rastgele veya mekanik bir örnek, birimlerin örnek popülasyona ayrı ayrı seçilmesi için kullanılır. Tipik bir numunenin önemli bir özelliği, numune popülasyonundaki diğer birimleri seçme yöntemleriyle karşılaştırıldığında daha doğru sonuçlar vermesidir;
  • seri- genel nüfusun eşit büyüklükteki gruplara bölündüğü seriler. Örnek popülasyona seriler seçilir. Seri içerisinde seriye dahil olan birimlerin sürekli gözlemi yapılmakta;
  • kombine- örnekleme iki aşamalı olmalıdır. Bu durumda nüfus önce gruplara ayrılır. Daha sonra gruplar seçilir ve ikincisinde bireysel birimler seçilir.

İstatistikte, örnek bir popülasyondaki birimlerin seçilmesi için aşağıdaki yöntemler ayırt edilir:

  • tek kademeliörnekleme - seçilen her birim, belirli bir kritere göre (uygun rastgele ve seri örnekleme) derhal çalışmaya tabi tutulur;
  • çok aşamalıörnekleme - bireysel grupların genel popülasyonundan bir seçim yapılır ve bireysel birimler gruplardan seçilir (örnek popülasyona birimlerin seçilmesi için mekanik bir yöntemle tipik örnekleme).

Ayrıca,:

  • yeniden seçim- geri dönen topun şemasına göre. Bu durumda örneğe dahil edilen her birim veya seri genel popülasyona geri döner ve dolayısıyla tekrar örneğe dahil olma şansına sahip olur;
  • seçimi tekrarla- geri dönmeyen top şemasına göre. Aynı örneklem büyüklüğü ile daha doğru sonuçlara sahiptir.

23. Son derece önemli örneklem büyüklüğünün belirlenmesi (Student's t-tablosu kullanılarak).

Örnekleme teorisindeki bilimsel ilkelerden biri yeterli sayıda birimin seçilmesini sağlamaktır. Teorik olarak bu prensibe uymanın son derece önemi, olasılık teorisindeki limit teoremlerinin kanıtlarında sunulmaktadır; bu, yeterli olması ve numunenin temsil edilebilirliğini sağlamak için popülasyondan hangi hacimde birimlerin seçilmesi gerektiğini belirlemeyi mümkün kılar.

Standart örnekleme hatasındaki bir azalma ve dolayısıyla tahminin doğruluğundaki bir artış, her zaman örneklem büyüklüğündeki bir artışla ilişkilidir, bu nedenle, zaten bir örneklem gözlemi düzenleme aşamasında, büyüklüğün ne olduğuna karar vermek gerekir; gözlem sonuçlarının gerekli doğruluğunu sağlamak amacıyla örneklem popülasyonunun belirlenmesi gerekmektedir. Son derece önemli numune hacminin hesaplanması, belirli bir türe ve seçim yöntemine karşılık gelen maksimum numune alma hatalarına (A) ilişkin formüllerden türetilen formüller kullanılarak oluşturulur. Yani, rastgele tekrarlanan bir örneklem büyüklüğü (n) için elimizde:

Bu formülün özü, son derece önemli sayıların rastgele tekrarlanan örneklemesi ile örneklem büyüklüğünün güven katsayısının karesiyle doğru orantılı olmasıdır. (t2) ve varyasyon karakteristiğinin varyansı (?2) ve maksimum örnekleme hatasının (?2) karesiyle ters orantılıdır. Özellikle, maksimum hatanın iki kat artması durumunda, gerekli örneklem büyüklüğünün dört kat azaltılması gerekmektedir. Üç parametreden ikisi (t ve?) araştırmacı tarafından belirlenir. Aynı zamanda araştırmacı, amaç doğrultusunda

ve örnek bir anketin sorunları şu soruyu çözmelidir: optimal seçeneği sağlamak için bu parametreleri hangi niceliksel kombinasyona dahil etmek daha iyidir? Bir durumda, doğruluk ölçüsünden (?) ziyade elde edilen sonuçların güvenilirliğinden (t) daha memnun olabilir, diğer durumda ise tam tersi olabilir. Maksimum örnekleme hatasının değeri ile ilgili sorunu çözmek daha zordur, çünkü araştırmacı örnek gözlemi tasarlama aşamasında bu göstergeye sahip değildir, bu nedenle pratikte maksimum örnekleme hatasının değerini ayarlamak gelenekseldir; genellikle özelliğin beklenen ortalama düzeyinin %10'u dahilindedir. Tahmini ortalamanın belirlenmesine farklı şekillerde yaklaşılabilir: daha önce yürütülen benzer anketlerden elde edilen verileri kullanmak veya örnekleme çerçevesinden elde edilen verileri kullanmak ve küçük bir pilot örneklem yürütmek.

Bir örnek gözlem tasarlarken belirlenmesi en zor şey formül (5.2)'deki üçüncü parametredir - örnek popülasyonun varyansı. Bu durumda, daha önce yapılan benzer ve pilot araştırmalarda elde edilen, araştırmacının kullanımına sunulan tüm bilgilerin kullanılması son derece önemlidir.

Örneklem araştırması örnekleme birimlerinin çeşitli özelliklerinin incelenmesini içeriyorsa, son derece önemli örneklem büyüklüğünün belirlenmesi sorunu daha karmaşık hale gelir. Bu durumda, her bir özelliğin ortalama seviyeleri ve varyasyonları kural olarak farklıdır ve bu bağlamda hangi özelliklerin hangi varyansının tercih edileceğine karar vermek ancak amaç ve hedefler dikkate alınarak mümkündür. anketin.

Bir örnek gözlem tasarlarken, belirli bir çalışmanın hedeflerine ve gözlem sonuçlarına dayalı sonuçların olasılığına uygun olarak izin verilen örnekleme hatasının önceden belirlenmiş bir değeri varsayılır.

Genel olarak numune ortalamasının maksimum hatasına ilişkin formül şunları belirlememize olanak tanır:

‣‣‣ genel nüfus göstergelerinin örnek nüfus göstergelerinden olası sapmalarının büyüklüğü;

‣‣‣ Olası hata sınırlarının belirli bir değeri aşmadığı, gerekli doğruluğu sağlamak için gerekli numune boyutu;

‣‣‣ Örnekteki hatanın belirli bir sınıra sahip olma olasılığı.

Öğrenci dağılımı olasılık teorisinde, kesinlikle sürekli dağılımların tek parametreli bir ailesidir.

24. Dinamik seriler (aralık, moment), kapanış dinamik serileri.

Dinamik serisi- bunlar belirli bir kronolojik sırayla sunulan istatistiksel göstergelerin değerleridir.

Her zaman serisi iki bileşen içerir:

1) zaman aralıklarının göstergeleri(yıllar, çeyrekler, aylar, günler veya tarihler);

2) incelenen nesneyi karakterize eden göstergeler zaman dilimleri için veya bunlara karşılık gelen tarihler için seri seviyeleri.

Seri seviyeleri hem mutlak hem de ortalama veya göreceli değerlerle ifade edilir. Göstergelerin doğasına bağımlılık dikkate alınarak mutlak, göreceli ve ortalama değerlerin dinamik serileri oluşturulur. Dinamik göreceli ve ortalama değer serileri, türetilmiş mutlak değer serileri temel alınarak oluşturulur. Dinamiklerin aralık ve moment serileri vardır.

Dinamik aralık serisi belirli zaman aralıklarına ait göstergelerin değerlerini içerir. Bir aralık serisinde, daha uzun bir süre boyunca olgunun hacmi veya birikmiş toplamlar elde edilerek seviyeler toplanabilir.

Dinamik an serisi göstergelerin değerlerini belirli bir zaman noktasında (tarih) yansıtır. Moment serilerinde araştırmacı yalnızca serinin belirli tarihler arasındaki düzeyindeki değişimi yansıtan olgulardaki farkla ilgilenebilir, çünkü buradaki düzeylerin toplamı gerçek bir içeriğe sahip değildir. Kümülatif toplamlar burada hesaplanmaz.

Zaman serilerinin doğru oluşturulması için en önemli koşul, seri seviyelerinin karşılaştırılabilirliği farklı dönemlere aittir. Düzeyler homojen miktarlarda sunulmalı ve olgunun farklı bölümlerinin kapsamı eşit derecede eksiksiz olmalıdır.

Gerçek dinamiklerin bozulmasını önlemek için istatistiksel araştırmalarda, zaman serilerinin istatistiksel analizinden önce ön hesaplamalar yapılır (dinamik serilerin kapatılması). Altında dinamik seriyi kapatıyorum Seviyeleri farklı metodoloji kullanılarak hesaplanan veya bölgesel sınırlara vb. karşılık gelmeyen, iki veya daha fazla seriden oluşan bir serinin birleşimini anlamak genel olarak kabul edilir. Dinamik serilerin kapatılması aynı zamanda dinamik serilerin mutlak seviyelerinin ortak bir temele getirilmesi anlamına da gelebilir, bu da dinamik serilerin seviyelerinin karşılaştırılamazlığını etkisiz hale getirir.

25. Dinamik serilerin, katsayıların, büyüme ve büyüme oranlarının karşılaştırılabilirliği kavramı.

Dinamik serisi- bunlar doğal ve sosyal olayların zaman içindeki gelişimini karakterize eden bir dizi istatistiksel göstergedir. Rusya Devlet İstatistik Komitesi tarafından yayınlanan istatistik koleksiyonları, tablo halinde çok sayıda dinamik seri içermektedir. Dinamik seriler, incelenen olgunun gelişim kalıplarını tanımlamayı mümkün kılar.

Dynamics serisi iki tür gösterge içerir. Zaman göstergeleri(yıllar, üç aylık dönemler, aylar vb.) veya zaman içindeki noktalar (yılın başında, her ayın başında vb.). Satır düzeyi göstergeleri. Dinamik serilerin seviyelerinin göstergeleri mutlak değerler (ton veya ruble cinsinden ürün üretimi), göreceli değerler (% olarak kentsel nüfusun payı) ve ortalama değerler (sanayi çalışanlarının yıllara göre ortalama maaşı) olarak ifade edilebilir. , vesaire.). Tablo biçiminde bir zaman serisi iki sütun veya iki satır içerir.

Zaman serilerinin doğru şekilde oluşturulması bir dizi gereksinimin yerine getirilmesini gerektirir:

  1. bir dizi dinamiğin tüm göstergeleri bilimsel olarak doğrulanmış ve güvenilir olmalıdır;
  2. bir dizi dinamiğin göstergeleri zaman içinde karşılaştırılabilir olmalıdır, ᴛ.ᴇ. aynı dönemler için veya aynı tarihlerde hesaplanmalıdır;
  3. bir dizi dinamiğe ilişkin göstergeler bölge genelinde karşılaştırılabilir olmalıdır;
  4. bir dizi dinamiğin göstergeleri içerik açısından karşılaştırılabilir olmalıdır, ᴛ.ᴇ. aynı şekilde tek bir metodolojiye göre hesaplanır;
  5. Bir dizi dinamiğin göstergeleri, dikkate alınan çiftlikler arasında karşılaştırılabilir olmalıdır. Bir dizi dinamiğin tüm göstergeleri aynı ölçüm birimlerinde verilmelidir.

İstatistiksel göstergeler ya belirli bir süre boyunca incelenen sürecin sonuçlarını ya da incelenen olgunun zamanın belirli bir noktasındaki durumunu karakterize edebilir. göstergeler aralıklı (periyodik) ve anlık olabilir. Buna göre başlangıçta dinamik seriler ya aralık ya da momenttir. Moment dinamiği serileri ise eşit ve eşit olmayan zaman aralıklarıyla gelir.

Orijinal dinamik seriler, bir dizi ortalama değere ve bir dizi göreceli değere (zincir ve temel) dönüştürülebilir. Bu tür zaman serilerine türetilmiş zaman serileri denir.

Dinamik serilerdeki ortalama seviyenin hesaplanmasına yönelik metodoloji, dinamik serinin türüne bağlı olarak farklıdır. Örnekleri kullanarak, ortalama seviyeyi hesaplamak için dinamik seri türlerini ve formülleri ele alacağız.

Mutlak artışlar (Δy) serinin sonraki seviyesinin bir öncekine (gr. 3. - zincir mutlak artışları) veya başlangıç ​​seviyesine (gr. 4. - temel mutlak artışlara) göre kaç birim değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Serinin mutlak değerleri azaldığında sırasıyla “azalma” veya “azalma” meydana gelecektir.

Mutlak büyüme göstergeleri, örneğin 1998'de bunu gösteriyor. "A" ürününün üretimi 1997 yılına göre arttı. 4 bin ton arttı ve 1994'e göre ᴦ. - 34 bin ton; diğer yıllar için tabloya bakınız. 11,5 gr.
ref.rf'de yayınlandı
3 ve 4.

Büyüme oranı serinin seviyesinin bir öncekine (gr. 5 - zincir büyüme veya düşüş katsayıları) veya başlangıç ​​seviyesine (gr. 6 - temel büyüme veya düşüş katsayıları) kıyasla kaç kez değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Büyüme oranı serinin bir sonraki seviyesinin bir öncekiyle (gr. 7 - zincir büyüme oranları) veya başlangıç ​​seviyesiyle (gr. 8 - temel büyüme oranları) yüzde kaçını karşılaştırdığını gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Mesela 1997'de. 1996 yılına kıyasla "A" ürününün üretim hacmi ᴦ. %105,5 olarak gerçekleşti (

Büyüme oranı raporlama dönemi seviyesinin bir öncekine (sütun 9 - zincirleme büyüme oranları) veya başlangıç ​​​​seviyesine (sütun 10 - temel büyüme oranları) kıyasla yüzde kaç oranında arttığını gösterin. Hesaplama formülleri aşağıdaki gibi yazılabilir:

T pr = T r - %100 veya T pr = mutlak büyüme / önceki dönemin seviyesi * %100

Mesela 1996'da. 1995'e kıyasla. "A" ürünü, 1994 yılına kıyasla %3,8 (%103,8 - %100) veya (8:210)x%100 oranında daha fazla üretildi. - %9 oranında (%109 - %100).

Serideki mutlak seviyelerin azalması durumunda oran %100'den az olacak ve buna bağlı olarak azalma oranı (eksi işaretli artış oranı) olacaktır.

%1 artışın mutlak değeri(gr.
ref.rf'de yayınlandı
Şekil 11) bir önceki dönemin seviyesinin %1 artması için belirli bir dönemde kaç adet üretilmesi gerektiğini göstermektedir. Örneğimizde, 1995'te ᴦ. 2,0 bin ton üretmek gerekiyordu ve 1998'de ᴦ. - 2,3 bin ton, yani. çok daha fazlası.

%1 büyümenin mutlak değeri iki şekilde belirlenebilir:

§ önceki dönemin seviyesinin 100'e bölünmesi;

§ Zincirdeki mutlak artışlar karşılık gelen zincir büyüme oranlarına bölünür.

%1 artışın mutlak değeri =

Dinamiklerde, özellikle uzun bir süre boyunca, büyüme oranının her yüzde artış veya azalışın içeriğiyle ortak analizi önemlidir.

Zaman serilerini analiz etmek için dikkate alınan metodolojinin, hem seviyeleri mutlak değerlerle (t, bin ruble, çalışan sayısı vb.) İfade edilen zaman serileri için hem de seviyeleri olan zaman serileri için geçerli olduğunu unutmayın. göreceli göstergeler (kusurların yüzdesi, kömürün kül içeriği yüzdesi vb.) veya ortalama değerler (c/ha cinsinden ortalama verim, ortalama maaş vb.) ile ifade edilir.

Dinamik serileri analiz ederken, her yıl için bir önceki veya başlangıç ​​seviyesine kıyasla hesaplanan dikkate alınan analitik göstergelerin yanı sıra, döneme ait ortalama analitik göstergelerin hesaplanması da son derece önemlidir: serinin ortalama seviyesi, ortalama yıllık mutlak artış (azalış) ve yıllık ortalama büyüme hızı ve büyüme hızı.

Bir dizi dinamiğin ortalama seviyesini hesaplama yöntemleri yukarıda tartışılmıştır. İncelediğimiz aralık dinamiği serisinde serinin ortalama seviyesi basit aritmetik ortalama formülü kullanılarak hesaplanır:

Ürünün 1994-1998 yılları için ortalama yıllık üretim hacmi. 218,4 bin ton olarak gerçekleşti.

Ortalama yıllık mutlak büyüme de aritmetik ortalama formülü kullanılarak hesaplanır.

Standart sapma - kavram ve türleri. "Ortalama kare sapma" kategorisinin sınıflandırılması ve özellikleri 2017, 2018.

X ben - rastgele (güncel) değişkenler;

X numune için rastgele değişkenlerin ortalama değeri aşağıdaki formül kullanılarak hesaplanır:

Bu yüzden, varyans sapmaların ortalama karesidir . Yani önce ortalama değer hesaplanır, sonra alınır. her orijinal değer ile ortalama değer arasındaki farkın karesi alınır , eklenir ve daha sonra verilen popülasyondaki değer sayısına bölünür.

Bireysel değer ile ortalama arasındaki fark, sapmanın ölçüsünü yansıtır. Tüm sapmaların yalnızca pozitif sayılar haline gelmesi ve toplanırken pozitif ve negatif sapmaların karşılıklı olarak yok edilmesini önlemek için kareleri alınır. Daha sonra, sapmaların kareleri verildiğinde, basitçe aritmetik ortalamayı hesaplarız.

Sihirli "dağılım" kelimesinin cevabı yalnızca şu üç kelimede yatmaktadır: ortalama - kare - sapmalar.

Standart sapma (MSD)

Varyansın karekökünü alarak “” ifadesini elde ederiz. standart sapma".İsimler var "standart sapma" veya "sigma" (Yunanca harfin adından σ .). Standart sapmanın formülü şöyledir:

Bu yüzden, dağılım sigma kare veya standart sapmanın karesidir.

Standart sapma, elbette, veri dağılımının ölçüsünü de karakterize eder, ancak artık (dağılımın aksine) aynı ölçüm birimlerine sahip oldukları için orijinal verilerle karşılaştırılabilir (bu, hesaplama formülünden açıktır). Değişim aralığı uç değerler arasındaki farktır. Belirsizliğin bir ölçüsü olarak standart sapma birçok istatistiksel hesaplamada da yer almaktadır. Yardımı ile çeşitli tahmin ve tahminlerin doğruluk derecesi belirlenir. Eğer varyasyon çok büyükse, standart sapma da büyük olacaktır ve dolayısıyla tahmin hatalı olacaktır; bu da örneğin çok geniş güven aralıklarında ifade edilecektir.

Bu nedenle, gayrimenkul değerlemelerinde istatistiksel veri işleme yöntemlerinde, görevin gerekli doğruluğuna bağlı olarak iki veya üç sigma kuralı kullanılmaktadır.

İki sigma kuralını ve üç sigma kuralını karşılaştırmak için Laplace formülünü kullanırız:

F-F,

burada Ф(x) Laplace fonksiyonudur;



Minimum değer

β = maksimum değer

s = sigma değeri (standart sapma)

a = ortalama

Bu durumda, X rastgele değişkeninin değerlerinin a ve β sınırları, a = M(X) dağılımının merkezinden belirli bir d değeri kadar eşit aralıklarla yerleştirildiğinde, Laplace formülünün belirli bir biçimi kullanılır: a = a-d, b = a+d. Veya (1) Formül (1), M(X) = a matematiksel beklentisinden normal dağılım yasasıyla bir X rastgele değişkeninin belirli bir d sapmasının olasılığını belirler.

Formül (1)'de d = 2s ve d = 3s'yi sırayla alırsak, şunu elde ederiz: (2), (3).

İki sigma kuralı

İki sigma kuralını geometrik olarak gösterelim. Şek. Şekil 6, dağıtım merkezi a olan bir Gauss eğrisini göstermektedir. Eğrinin tamamı ve Ox ekseni tarafından sınırlanan alan 1'e (%100) eşittir ve iki sigma kuralına göre apsis a–2s ve a+2s arasındaki eğrisel yamuğun alanı eşittir 0,954'e (toplam alanın %95,4'ü). Gölgeli alanların alanı 1-0,954 = 0,046'dır (toplam alanın »%5'i). Bu alanlara rastgele değişkenin kritik bölgesi denir. Rastgele bir değişkenin kritik bölgeye düşen değerleri olası değildir ve pratikte geleneksel olarak imkansız olarak kabul edilir.

Koşullu olarak imkansız değerlerin olasılığına rastgele bir değişkenin anlamlılık düzeyi denir. Anlamlılık düzeyi aşağıdaki formülle güven olasılığıyla ilişkilidir:

burada q, yüzde olarak ifade edilen anlamlılık düzeyidir.

Üç sigma kuralı

Daha fazla güvenilirlik gerektiren sorunları çözerken, güven olasılığı (Pd) 0,997'ye (daha doğrusu 0,9973) eşit alındığında, formül (3)'e göre iki sigma kuralı yerine kural kullanılır. üç sigma



Buna göre üç sigma kuralı 0,9973 güven olasılığı ile kritik alan, aralığın (a-3s, a+3s) dışındaki nitelik değerlerinin alanı olacaktır. Anlamlılık düzeyi %0,27'dir.

Başka bir deyişle, sapmanın mutlak değerinin standart sapmanın üç katını aşma olasılığı çok küçüktür, yani 0,0027 = 1-0,9973. Bu, vakaların yalnızca %0,27'sinde bunun gerçekleşeceği anlamına gelir. Olasılık dışı olayların imkansızlığı ilkesine dayanan bu tür olaylar, pratik olarak imkansız kabul edilebilir. Onlar. örnekleme son derece doğrudur.

Üç sigma kuralının özü budur:

Rastgele bir değişken normal olarak dağıtılıyorsa, matematiksel beklentiden sapmasının mutlak değeri standart sapmanın (MSD) üç katını aşmaz.

Pratikte üç sigma kuralı şu şekilde uygulanır: Eğer incelenen rastgele değişkenin dağılımı bilinmiyorsa ancak yukarıdaki kuralda belirtilen koşul karşılanıyorsa, incelenen değişkenin normal dağıldığını varsaymak için bir neden vardır. ; aksi halde normal dağılım göstermez.

Önem düzeyi, izin verilen risk derecesine ve eldeki göreve bağlı olarak alınır. Gayrimenkul değerlemesi için genellikle iki sigma kuralına göre daha az kesin bir örnek benimsenir.