Seçeneklere ne denir? Varyasyon serisi

Belirli bir deney veya gözlemde incelenen parametrenin değere göre sıralanan (artış veya azalış) değerleri kümesine varyasyon serisi denir.

Diyelim ki ölçtük tansiyon on hastada bir üst kan basıncı eşiği elde etmek için: sistolik basınç, yani. sadece bir numara.

10 gözlemde arteriyel sistolik basınca ilişkin bir dizi gözlemin (istatistik kümesi) elde edildiğini hayal edelim. sonraki görünüm(Tablo 1):

Tablo 1

Bir varyasyon serisinin bileşenlerine varyantlar denir. Seçenekler, incelenen özelliğin sayısal değerini temsil eder.

İnşaat istatistiksel nüfus Bir varyasyon serisinin gözlemlenmesi, tüm popülasyonun özelliklerini anlama yolunda yalnızca ilk adımdır. Daha sonra belirlemeniz gerekir orta seviye incelenen niceliksel özellik (ortalama kan protein düzeyi, hastaların ortalama ağırlığı, anestezinin ortalama başlangıç ​​süresi vb.)

Ortalama seviye, ortalama adı verilen kriterler kullanılarak ölçülür. Ortalama değer, niteliksel olarak homojen değerlerin genelleştirici bir sayısal özelliğidir ve bir kritere göre tüm istatistiksel popülasyonu bir sayı ile karakterize eder. Ortalama değer, belirli bir gözlem kümesindeki bir karakteristikte ortak olanı ifade eder.

Yaygın olarak kullanılan üç tür ortalama vardır: mod (), medyan () ve ortalama. aritmetik miktar ().

Herhangi bir ortalama değeri belirlemek için, bireysel gözlemlerin sonuçlarını bir varyasyon serisi şeklinde kaydederek kullanmak gerekir (Tablo 2).

Moda- Bir dizi gözlemde en sık ortaya çıkan değer. Örneğimizde mod = 120. Eğer varyasyon serisinde tekrar eden değerler yoksa mod yok diyorlar. Birkaç değer aynı sayıda tekrarlanırsa mod olarak bunlardan en küçüğü alınır.

Medyan- bir dağılımı iki eşit parçaya bölen bir değer; artan veya azalan sırada sıralanan bir dizi gözlemin merkezi veya ortanca değeri. Yani, bir varyasyon serisinde 5 değer varsa, o zaman medyanı varyasyon serisinin üçüncü terimine eşittir; seride çift sayıda terim varsa, o zaman medyan, ikisinin aritmetik ortalamasıdır. merkezi gözlemler, yani bir seride 10 gözlem varsa, medyan 5 ve 6 numaralı gözlemlerin aritmetik ortalamasına eşittir. Örneğimizde.

Not önemli özellik modlar ve medyanlar: değerleri etkilenmez sayısal değerler aşırı seçenek.

Aritmetik ortalama formülle hesaplanır:

-'inci gözlemde gözlenen değer nerede ve gözlem sayısıdır. Bizim durumumuz için.

Aritmetik ortalamanın üç özelliği vardır:

Ortalama, varyasyon serisinde orta sırayı işgal eder. Kesinlikle simetrik bir sırada.

Ortalama genelleştirici bir değerdir ve bireysel verilerdeki rastgele dalgalanmalar ve farklılıklar ortalamanın arkasında görülmez. Tüm popülasyonun tipik özelliklerini yansıtır.

Tüm seçeneklerin ortalamadan sapmalarının toplamı sıfırdır: . Seçeneğin ortalamadan sapması gösterilir.

Varyasyon serisi, varyantlardan ve bunlara karşılık gelen frekanslardan oluşur. Elde edilen on değerden 120 sayısı 6 defa, 115 - 3 defa, 125 - 1 defa meydana geldi. Sıklık () - toplamdaki bireysel değişkenlerin mutlak sayısı; bunun kaç kez gerçekleştiğini gösterir bu seçenek varyasyon serisinde.

Varyasyon serileri basit olabilir (frekanslar = 1) veya gruplandırılmış ve 3-5 seçenekli kısaltılmış olabilir. Basit bir seri, gruplandırılmış az sayıda gözlem () olduğunda kullanılır - ne zaman büyük sayı gözlemler().

Bu bölümde uzmanlaşmanın bir sonucu olarak öğrenci: Bilmek

  • varyasyon göstergeleri ve ilişkileri;
  • özelliklerin dağılımının temel yasaları;
  • rıza kriterlerinin özü; yapabilmek
  • varyasyon indekslerini ve uyum iyiliği kriterlerini hesaplamak;
  • dağıtım özelliklerini belirlemek;
  • ana değerlendir sayısal özellikler istatistiksel dağılım serileri;

sahip olmak

  • yöntemler istatistiksel analiz dağıtım satırları;
  • temel bilgiler varyans analizi;
  • İstatistiksel dağılım serilerinin temel dağıtım yasalarına uygunluğunu kontrol etme teknikleri.

Değişim göstergeleri

Şu tarihte: istatistiksel araştırmaçeşitli istatistiksel kümelerin özellikleri, bireysel özelliklerin çeşitliliğinin incelenmesi istatistiksel birimler toplamın yanı sıra birimlerin bu esasa göre dağılımının niteliği. Varyasyon - bunlar, incelenen popülasyonun birimleri arasındaki bir özelliğin bireysel değerlerindeki farklılıklardır. Varyasyon araştırması geniş bir alana sahiptir. pratik önemi. Çeşitliliğin derecesine göre, bir özelliğin varyasyonunun sınırları, belirli bir özellik için popülasyonun homojenliği, ortalamanın tipikliği ve varyasyonu belirleyen faktörlerin ilişkisi değerlendirilebilir. Varyasyon göstergeleri istatistiksel popülasyonları karakterize etmek ve düzenlemek için kullanılır.

Materyallerin özeti ve gruplandırılması sonuçları istatistiksel gözlemİstatistiksel dağılım serileri şeklinde tasarlanan , incelenen popülasyon birimlerinin gruplama (değişen) özelliklerine göre gruplara ayrılmış düzenli bir dağılımını temsil eder. Gruplandırma için niteliksel bir özellik esas alınırsa, böyle bir dağılım serisine denir. niteliksel(meslek, cinsiyet, renk vb. göre dağılım). Bir dağılım serisi niceliksel olarak oluşturulmuşsa, böyle bir seriye denir. varyasyonel(boy, kilo, bedene göre dağılım ücretler vesaire.). Bir varyasyon serisi oluşturmak, popülasyon birimlerinin niceliksel dağılımını karakteristik değerlere göre düzenlemek, bu değerlere (frekans) sahip popülasyon birimlerinin sayısını saymak ve sonuçları bir tablo halinde düzenlemek anlamına gelir.

Bir değişkenin frekansı yerine, frekans (göreceli frekans) adı verilen toplam gözlem hacmine oranını kullanmak mümkündür.

İki tür varyasyon serisi vardır: kesikli ve aralıklı. Ayrık seri- Bu, yapısı süreksiz değişikliklere (ayrık özellikler) sahip özelliklere dayanan bir varyasyon serisidir. İkincisi, işletmedeki çalışan sayısını, tarife kategorisini, ailedeki çocuk sayısını vb. içerir. Ayrık bir varyasyon serisi, iki sütundan oluşan bir tabloyu temsil eder. İlk sütun şunu gösterir: özel anlam karakteristik ve ikincisinde - nüfusun birim sayısı belli bir değer imza. Bir özelliğin sürekli bir değişimi varsa (belirli sınırlar dahilinde herhangi bir değer alabilen gelir miktarı, hizmet süresi, işletmenin sabit varlıklarının maliyeti vb.), o zaman bu özellik için inşa etmek mümkündür. aralık varyasyon serisi. Bir aralık varyasyon serisi oluştururken tablonun ayrıca iki sütunu vardır. Birincisi, özelliğin “başlangıç ​​- bitiş” aralığındaki değerini (seçenekler), ikincisi ise aralığa dahil edilen birim sayısını (frekans) gösterir. Frekans (tekrarlama sıklığı) - belirli bir özellik değerleri değişkeninin tekrar sayısı. Aralıklar kapalı veya açık olabilir. Kapalı aralıklar her iki tarafta da sınırlıdır; hem alt (“başlangıç”) hem de üst (“bitiş”) sınırına sahiptir. Açık aralıklar tek bir sınırı vardır: üst veya alt. Seçenekler artan veya azalan sırada düzenlenmişse satırlar çağrılır. sıralanmıştır.

Varyasyon serileri için iki tür seçenek vardır frekans özellikleri: birikmiş frekans ve birikmiş frekans. Birikmiş frekans, karakteristik değerinin kaç gözlemde belirtilen değerden daha düşük değerler aldığını gösterir. Birikmiş frekans, belirli bir grup için bir özelliğin frekans değerlerinin önceki grupların tüm frekanslarıyla toplanmasıyla belirlenir. Birikmiş frekans karakterize eder özgül ağırlık karakteristik değerlerin veri grubunun üst sınırını aşmadığı gözlem birimleri. Böylece, birikmiş frekans, toplamdaki, verilenden daha büyük olmayan bir değere sahip olan seçeneklerin oranını gösterir. Frekans, frekans, mutlak ve bağıl yoğunluklar, birikmiş frekans ve frekans, varyantın büyüklüğünün özellikleridir.

Nüfusun istatistiksel birimlerinin özelliklerindeki farklılıklar ve dağılımın doğası, serinin ortalama seviyesini, ortalama doğrusal sapmayı, standart sapmayı, dağılımı içeren varyasyon serisinin göstergeleri ve özellikleri kullanılarak incelenir. , salınım katsayıları, varyasyon, asimetri, basıklık vb.

Dağıtım merkezini karakterize etmek için ortalama değerler kullanılır. Ortalama, genelleştirici bir istatistiksel özelliktir. niceliksel ifade incelenen popülasyonun üyelerinin sahip olduğu bir özelliğin tipik seviyesi. Ancak aritmetik ortalamaların çakıştığı durumlar da olabilir. farklı karakter dağıtım, dolayısıyla istatistiksel özellikler varyasyon serileri, sözde yapısal ortalamalar hesaplanır - mod, medyan ve dağıtım serisini eşit parçalara (çeyrekler, ondalıklar, yüzdelikler vb.) bölen nicelikler.

Moda - Bu, bir özelliğin dağılım serisinde diğer değerlerinden daha sık ortaya çıkan değeridir. Ayrık seriler için bu, en yüksek frekansa sahip seçenektir. Aralık değişim serilerinde modu belirlemek için öncelikle modal aralık olarak adlandırılan aralığın belirlenmesi gerekir. Eşit aralıklara sahip bir varyasyon serisinde modal aralık, eşit olmayan aralıklara sahip serilerde en yüksek frekansa göre belirlenir - ancak en yüksek yoğunluk dağıtımlar. Formül daha sonra modu eşit aralıklarla satırlar halinde belirlemek için kullanılır.

burada Mo moda değeridir; xMo - modal aralığın alt sınırı; H- modal aralık genişliği; / Mo - modal aralığın frekansı; / Mo j premodal aralığın frekansıdır; / Mo+1 post-modal aralığın frekansıdır ve bu hesaplama formülünde aralıkları eşit olmayan bir seri için / Mo, / Mo, / Mo frekansları yerine dağılım yoğunlukları kullanılmalıdır. Akıl 0 _| , Akıl 0> UMO+"

Tek bir mod varsa, rastgele değişkenin olasılık dağılımına tek modlu denir; birden fazla mod varsa, iki mod durumunda buna multimodal (polimodal, multimodal) denir - bimodal. Kural olarak çok modluluk, incelenen dağılımın yasaya uymadığını gösterir. normal dağılım. Homojen popülasyonlar, kural olarak, tek tepe dağılımlarıyla karakterize edilir. Multivertex ayrıca incelenen popülasyonun heterojenliğini de gösterir. İki veya daha fazla köşenin ortaya çıkması, daha homojen grupların tanımlanması için verilerin yeniden gruplandırılmasını gerekli kılar.

Bir aralık varyasyon serisinde mod, bir histogram kullanılarak grafiksel olarak belirlenebilir. Bunu yapmak için histogramın en yüksek sütununun üst noktalarından iki bitişik sütunun üst noktalarına kadar kesişen iki çizgi çizin. Daha sonra kesiştikleri noktadan apsis eksenine bir dik indirilir. Özelliğin x ekseni üzerindeki dikliğe karşılık gelen değeri moddur. Çoğu durumda, bir popülasyonu genelleştirilmiş bir gösterge olarak karakterize ederken, aritmetik ortalama yerine mod tercih edilir.

Medyan - Bu merkezi önem karakteristik, sıralanmış dağıtım serisinin merkezi üyesi tarafından sahip olunmaktadır. İÇİNDE ayrık seri Medyanın değerini bulmak için önce sıra numarası belirlenir. Değilse bunu yapmak için çift ​​sayı birimler, tüm frekansların toplamına bir eklenir, sayı ikiye bölünür. Bir satırda çift sayıda birim varsa, iki ortanca birim olacaktır, dolayısıyla bu durumda ortanca, iki ortanca birimin değerlerinin ortalaması olarak tanımlanır. Dolayısıyla ayrık bir varyasyon serisindeki medyan, seriyi aşağıdakileri içeren iki parçaya bölen değerdir: aynı numara seçenekler.

Aralık serilerinde, medyanın seri numarası belirlendikten sonra, biriken frekanslar (frekanslar) kullanılarak orta aralık bulunur ve ardından ortancayı hesaplama formülü kullanılarak ortancanın değeri belirlenir:

burada Me medyan değerdir; x Ben - medyan aralığın alt sınırı; H- medyan aralığın genişliği; - dağıtım serisinin frekanslarının toplamı; /D - medyan öncesi aralığın birikmiş frekansı; / Me - medyan aralığın frekansı.

Medyan, bir kümülasyon kullanılarak grafiksel olarak bulunabilir. Bunu yapmak için, birikmiş frekanslar (frekanslar) ölçeğinde, karşılık gelen noktadan kümülasyon yapılır. seri numarası medyan, düz bir çizgi çizilir eksene paralel abscissa, kümülatla kesişene kadar. Daha sonra belirtilen çizginin kümülat ile kesiştiği noktadan itibaren apsis eksenine bir dik indirilir. Özniteliğin x ekseni üzerinde çizilen ordinat (dik) değerine karşılık gelen değeri medyandır.

Medyan aşağıdaki özelliklerle karakterize edilir.

  • 1. Her iki tarafında bulunan özellik değerlerine bağlı değildir.
  • 2. Minimalite özelliğine sahiptir; bu, nitelik değerlerinin medyandan mutlak sapmalarının toplamının, nitelik değerlerinin başka herhangi bir değerden sapmasına kıyasla minimum bir değeri temsil ettiği anlamına gelir.
  • 3. İki dağılımı bilinen medyanlarla birleştirirken, yeni dağılımın medyanının değerini önceden tahmin etmek imkansızdır.

Medyanın bu özellikleri nokta konumlarının tasarlanmasında yaygın olarak kullanılmaktadır. sıraya girme- okullar, klinikler, benzin istasyonları, su giriş kolonları vb. Örneğin şehrin belirli bir bloğuna klinik yapılması planlanıyorsa, bunu blokta bloğun uzunluğunu değil, sakin sayısını yarıya indirecek bir noktaya yerleştirmek daha doğru olacaktır.

Mod, medyan ve aritmetik ortalamanın oranı, özelliğin toplamdaki dağılımının doğasını gösterir ve dağılımın simetrisini değerlendirmemizi sağlar. Eğer x O zaman serinin sağ tarafında bir asimetrisi var. Normal dağılımlı X - Hafıza.

K. Pearson bazlı hizalama çeşitli türler eğriler, orta derecede asimetrik dağılımlar için aritmetik ortalama, medyan ve mod arasında aşağıdaki yaklaşık ilişkilerin geçerli olduğunu belirledi:

burada Me medyan değerdir; Mo - modanın anlamı; x aritmi - aritmetik ortalamanın değeri.

Varyasyon serisinin yapısını daha ayrıntılı olarak incelemeye ihtiyaç varsa, medyana benzer karakteristik değerleri hesaplayın. Bu tür karakteristik değerler, tüm dağıtım birimlerini eşit sayılara böler; bunlara nicelikler veya gradyanlar denir. Nicelikler çeyreklere, ondalık dilimlere, yüzdelik dilimlere vb. bölünmüştür.

Çeyrekler nüfusu dört eşit parçaya böler. İlk çeyrek, daha önce ilk üç aylık aralığı belirledikten sonra, ilk çeyreği hesaplamak için kullanılan formül kullanılarak medyana benzer şekilde hesaplanır:

burada Qi ilk çeyreğin değeridir; xQ^- birinci çeyrek aralığının alt sınırı; H- ilk çeyrek aralığının genişliği; /, - aralık serisinin frekansları;

Birinci çeyrek aralığından önceki aralıktaki kümülatif frekans; Jq ( - ilk çeyrek aralığının frekansı.

İlk çeyrek, nüfus birimlerinin %25'inin değerinden az, %75'inin ise fazla olduğunu göstermektedir. İkinci çeyrek medyana eşittir, yani. S2 = Ben.

Benzer şekilde, üçüncü çeyrek, ilk önce üçüncü üç aylık aralığı bulduktan sonra hesaplanır:

üçüncü çeyrek aralığının alt sınırı nerede; H- üçüncü çeyrek aralığının genişliği; /, - aralık serisinin frekansları; /X" -önceki aralıkta birikmiş frekans

G

üçüncü çeyrek aralığı; Jq üçüncü çeyrek aralığının frekansıdır.

Üçüncü çeyrek, nüfus birimlerinin %75'inin değerinden az, %25'inin ise fazla olduğunu göstermektedir.

Üçüncü ve birinci çeyrekler arasındaki fark çeyrekler arası aralıktır:

burada Aq çeyrekler arası aralığın değeridir; S 3 -üçüncü çeyrek değeri; Q, ilk çeyreğin değeridir.

Ondalıklar nüfusu 10'a böler eşit parçalar. Ondalık, bir dağılım serisinde popülasyon büyüklüğünün onda birine karşılık gelen bir özelliğin değeridir. Çeyrek dilimlere benzer şekilde, ilk ondalık dilim nüfus birimlerinin %10'unun değerinden az, %90'ının büyük olduğunu gösterirken, dokuzuncu ondalık dilim nüfus birimlerinin %90'ının değerinden az, %10'unun ise değerinden az olduğunu gösterir. daha büyük. Dokuzuncu ve ilk ondalık dilimlerin oranı, yani. Ondalık katsayı, en varlıklı %10 ile en az varlıklı nüfusun %10'unun gelir düzeylerinin oranını ölçmek için gelir farklılaşması çalışmasında yaygın olarak kullanılır. Yüzdelikler sıralanan nüfusu 100 eşit parçaya böler. Yüzdelik dilimlerin hesaplanması, anlamı ve uygulanması ondalık dilimlere benzer.

Çeyrekler, ondalıklar ve diğerleri yapısal özellikler kümülatlar kullanılarak medyana benzetilerek grafiksel olarak belirlenebilir.

Değişimin boyutunu ölçmek için aşağıdaki göstergeler kullanılır: varyasyon aralığı, ortalama doğrusal sapma, standart sapma, dağılım. Değişim aralığının büyüklüğü tamamen serinin uç üyelerinin dağılımının rastgeleliğine bağlıdır. Bu gösterge, bir özelliğin değerlerindeki dalgalanmaların büyüklüğünün ne olduğunu bilmenin önemli olduğu durumlarda ilgi çekicidir:

Nerede R- varyasyon aralığının değeri; x pekala - maksimum değer imza; x tt - minimum değer imza.

Değişim aralığı hesaplanırken seri üyelerinin büyük çoğunluğunun değeri dikkate alınmazken, varyasyon seri üyesinin her değeriyle ilişkilendirilir. Bir özelliğin bireysel değerlerinin ortalama değerlerinden sapmalarından elde edilen ortalamalar olan göstergeler bu dezavantaja sahip değildir: ortalama doğrusal sapma ve standart sapma. Ortalamadan bireysel sapmalar ile belirli bir özelliğin değişkenliği arasında doğrudan bir ilişki vardır. Dalgalanma ne kadar güçlü olursa, ortalamadan sapmaların mutlak boyutu da o kadar büyük olur.

Ortalama doğrusal sapma, bireysel seçeneklerin ortalama değerlerinden sapmalarının mutlak değerlerinin aritmetik ortalamasıdır.

Gruplandırılmamış Veriler için Ortalama Doğrusal Sapma

burada /pr ortalamanın değeridir doğrusal sapma; x, - özelliğin değeridir; X - P - Popülasyondaki birim sayısı.

Gruplandırılmış serilerin ortalama doğrusal sapması

nerede / vz - ortalama doğrusal sapmanın değeri; x, özelliğin değeridir; X - incelenen popülasyon için özelliğin ortalama değeri; / - ayrı bir gruptaki nüfus birimlerinin sayısı.

Sapma belirtileri bu durumda göz ardı edilir aksi takdirde tüm sapmaların toplamı sıfıra eşit olacaktır. Analiz edilen verilerin gruplandırılmasına bağlı olarak ortalama doğrusal sapma şu şekilde hesaplanır: çeşitli formüller: Gruplanmış ve gruplanmamış veriler için. Koşulluluğu nedeniyle ortalama doğrusal sapma, diğer değişkenlik göstergelerinden ayrı olarak pratikte nispeten nadiren kullanılır (özellikle teslimatın tekdüzeliği için sözleşmeden doğan yükümlülüklerin yerine getirilmesini karakterize etmek için; ciro analizinde) dış ticaret, işçilerin bileşimi, üretim ritmi, üretimin teknolojik özellikleri dikkate alınarak ürün kalitesi vb.).

Standart sapma, ortalama sapmanın ne kadar olduğunu karakterize eder bireysel değerler incelenen özelliğin popülasyonun ortalama değerinden elde edilmesi ve incelenen özelliğin ölçüm birimleriyle ifade edilmesi. Ana varyasyon ölçümlerinden biri olan standart sapma, homojen bir popülasyondaki bir özelliğin varyasyon sınırlarının değerlendirilmesinde, normal bir dağılım eğrisinin ordinat değerlerinin belirlenmesinde ve ayrıca aşağıdakilerle ilgili hesaplamalarda yaygın olarak kullanılır: organizasyon örnek gözlem ve doğruluğunun belirlenmesi örnek özellikler. Gruplandırılmamış verilerin standart sapması aşağıdaki algoritma kullanılarak hesaplanır: ortalamadan her sapmanın karesi alınır, tüm kareler toplanır, ardından karelerin toplamı serinin terim sayısına bölünür ve karekök elde edilir. bölüm:

burada bir Iip ortalamanın değeridir kare sapma; Xj-özellik değeri; X- incelenen popülasyona ilişkin özelliğin ortalama değeri; P - Popülasyondaki birim sayısı.

Gruplandırılmış analiz edilen veriler için, verilerin standart sapması ağırlıklı formül kullanılarak hesaplanır.

Nerede - standart sapma değeri; Xj-özellik değeri; X - incelenen popülasyon için özelliğin ortalama değeri; f x - Belirli bir gruptaki nüfus birimlerinin sayısı.

Her iki durumda da kökün altındaki ifadeye varyans denir. Böylece dağılım, nitelik değerlerinin ortalama değerlerinden sapmalarının ortalama karesi olarak hesaplanır. Ağırlıklandırılmamış (basit) nitelik değerleri için varyans aşağıdaki şekilde belirlenir:

Ağırlıklandırılmış karakteristik değerler için

Varyansı hesaplamak için özel, basitleştirilmiş bir yöntem de vardır: genel olarak

ağırlıklandırılmamış (basit) karakteristik değerler için ağırlıklı karakteristik değerler için
sıfır tabanlı yöntemi kullanarak

burada a 2 dağılım değeridir; x, - özelliğin değeridir; X -özelliğin ortalama değeri, H- grup aralığı değeri, t 1 - ağırlık (A =

Dağılımın istatistiklerde kendine has bir ifadesi vardır ve varyasyonun en önemli göstergelerinden biridir. İncelenen özelliğin ölçüm birimlerinin karesine karşılık gelen birimlerle ölçülür.

Dispersiyon aşağıdaki özelliklere sahiptir.

  • 1. Farklılık sabit değer sıfıra eşittir.
  • 2. Bir özelliğin tüm değerlerinin aynı A değeri kadar azaltılması, dağılımın değerini değiştirmez. Bu, sapmaların ortalama karesinin şu şekilde hesaplanamayacağı anlamına gelir: verilen değerler işareti, ancak bazı sabit sayıdan sapmalarıyla.
  • 3. Herhangi bir karakteristik değerin azaltılması k kez dağılımı azaltır k 2 kez ve standart sapma k kez, yani tüm özellik değerleri bazılarına bölünebilir sabit sayı(diyelim ki seri aralığının değerine göre), standart sapmayı hesaplayın ve ardından bunu sabit bir sayıyla çarpın.
  • 4. Herhangi bir değerden sapmaların ortalama karesini hesaplarsak Ve aritmetik ortalamadan bir dereceye kadar farklıysa, her zaman aritmetik ortalamadan hesaplanan sapmaların ortalama karesinden daha büyük olacaktır. Orta kare bu durumda, ortalama ile geleneksel olarak alınan bu değer arasındaki farkın karesi kadar çok belirli bir miktarda daha fazla sapma olacaktır.

Alternatif bir özelliğin varyasyonu, popülasyon birimlerinde incelenen özelliğin varlığı veya yokluğundan oluşur. Niceliksel olarak, alternatif bir niteliğin değişimi iki değerle ifade edilir: incelenen özelliğin bir biriminin varlığı bir (1) ile ve yokluğu sıfır (0) ile gösterilir. İncelenen özelliğe sahip birimlerin oranı P ile, bu özelliğe sahip olmayan birimlerin oranı ise ile gösterilir. G. Dolayısıyla, alternatif bir özelliğin varyansı, bu özelliğe (P) sahip olan birimlerin oranının, bu özelliğe sahip olmayan birimlerin oranına eşittir. (G). Popülasyondaki en büyük çeşitlilik, popülasyonun toplam hacminin %50'sini oluşturan popülasyonun bir kısmının bir özelliğe sahip olduğu ve yine %50'ye eşit olan popülasyonun diğer bir kısmının bu özelliğe sahip olmadığı durumlarda elde edilir, ve dağılım maksimum 0,25 değerine ulaşır, t.e. P = 0,5, g= 1 - P = 1 - 0,5 = 0,5 ve o2 = 0,5 0,5 = 0,25. Bu göstergenin alt sınırı sıfır olup, toplamda herhangi bir değişimin olmadığı bir duruma karşılık gelmektedir. Pratik Uygulama alternatif bir özelliğin varyansı oluşturmayı içerir güven aralıklarıÖrnek gözlem yaparken.

Nasıl daha az değer varyans ve standart sapma, popülasyon ne kadar homojen ve ortalama o kadar tipik olacaktır. İstatistik uygulamalarında sıklıkla varyasyonları karşılaştırmaya ihtiyaç duyulur. çeşitli işaretler. Örneğin, işçilerin yaşı ve nitelikleri, hizmet süresi ve ücretler, maliyet ve kâr, hizmet süresi ve işgücü verimliliği vb. değişkenleri karşılaştırmak ilginç olacaktır. Bu tür karşılaştırmalar için, özelliklerin mutlak değişkenliğine ilişkin göstergeler uygun değildir: Yıllar olarak ifade edilen iş deneyimi değişkenliğini, ruble cinsinden ifade edilen ücretlerdeki değişiklikle karşılaştırmak imkansızdır. Bu tür karşılaştırmaların yanı sıra, farklı aritmetik ortalamalara sahip çeşitli popülasyonlarda aynı özelliğin değişkenliğinin karşılaştırılması için varyasyon göstergeleri kullanılır - salınım katsayısı, doğrusal katsayı uç değerlerin ortalama etrafında ne kadar dalgalandığını gösteren varyasyonlar ve varyasyon katsayısı.

Salınım katsayısı:

Nerede VR- salınım katsayısı değeri; R- varyasyon aralığının değeri; X -

Doğrusal varyasyon katsayısı".

Nerede Vj- doğrusal varyasyon katsayısının değeri; BEN - ortalama doğrusal sapmanın değeri; X - incelenen popülasyon için özelliğin ortalama değeri.

Değişim katsayısı:

Nerede Va - varyasyon değeri katsayısı; a standart sapmanın değeridir; X - incelenen popülasyon için özelliğin ortalama değeri.

Salınım katsayısı yüzde varyasyon aralığının incelenen özelliğin ortalama değerine oranı ve doğrusal varyasyon katsayısı, ortalama doğrusal sapmanın, incelenen özelliğin ortalama değerine oranıdır ve yüzde olarak ifade edilir. Değişim katsayısı, incelenen özelliğin standart sapmasının ortalama değerine oranıdır. Yüzde olarak ifade edilen göreceli bir değer olarak varyasyon katsayısı, çeşitli özelliklerin varyasyon derecesini karşılaştırmak için kullanılır. Varyasyon katsayısı kullanılarak istatistiksel bir popülasyonun homojenliği değerlendirilir. Varyasyon katsayısı %33'ten azsa, incelenen popülasyon homojendir ve varyasyon zayıftır. Varyasyon katsayısı %33'ün üzerindeyse, incelenen popülasyon heterojendir, varyasyon güçlüdür ve ortalama değer atipiktir ve bu popülasyon için genel bir gösterge olarak kullanılamaz. Ek olarak varyasyon katsayıları, farklı popülasyonlardaki bir özelliğin değişkenliğini karşılaştırmak için kullanılır. Örneğin, iki işletmedeki işçilerin hizmet süresindeki farklılığı değerlendirmek. Nasıl daha fazla değer katsayısı ne kadar önemli olursa, karakteristikteki değişim o kadar anlamlı olur.

Hesaplanan çeyreklere dayanarak, aşağıdaki formülü kullanarak üç aylık değişimin göreceli göstergesini hesaplamak da mümkündür.

nerede Q 2 Ve

Çeyrekler arası aralık formülle belirlenir

Aşırı değerlerin kullanılmasıyla ilgili dezavantajları önlemek için varyasyon aralığı yerine çeyreklik sapma kullanılır:

Eşit olmayan aralıklı değişim serileri için dağılım yoğunluğu da hesaplanır. Karşılık gelen frekansın veya frekansın aralığın değerine bölümü olarak tanımlanır. Eşit olmayan aralık serilerinde mutlak ve bağıl dağılım yoğunlukları kullanılır. Mutlak yoğunluk dağılım, aralığın birim uzunluğu başına frekanstır. Bağıl dağıtım yoğunluğu - birim aralık uzunluğu başına frekans.

Yukarıdakilerin tümü, dağıtım yasası iyi tanımlanmış olan dağıtım serileri için doğrudur. normal hukuk dağıtım veya ona yakın.

İstatistiksel dağılım serileri en basit biçim gruplar.

İstatistiksel dağılım serisi- bu, nüfus birimlerinin düzenli bir niceliksel dağılımıdır. homojen gruplar değişen (niteliksel veya niceliksel) bir temelde.

İşarete bağlı olarak, Grupların oluşumunun temelinde, niteliksel ve değişken dağılım serileri arasında bir ayrım yapılır.

Nitelikli niteliksel özelliklere göre oluşturulan dağıtım serileri denir, yani. olmayan işaretler sayısal ifade. Nitelik dağılım serisine bir örnek, Rusya Federasyonu'nun ekonomik olarak aktif nüfusunun 2010 yılında cinsiyete göre dağılımıdır (Tablo 3.10).

Tablo 3.10. 2010 yılında Rusya Federasyonu'nun ekonomik olarak aktif nüfusunun cinsiyete göre dağılımı

Varyasyonel niceliksel temele dayalı dağıtım serileri denir, yani. Sayısal ifadeye sahip bir işaret.

Değişken dağılım serisi iki unsurdan oluşur: seçenekler ve frekanslar.

Seçenekler Bir varyasyon serisinde aldığı bir özelliğin bireysel değerlerini adlandırın.

Frekanslar bireysel varyantların veya varyasyon serisinin her grubunun sayısıdır. Frekanslar, incelenen popülasyonda bir özelliğin belirli değerlerinin ne sıklıkla oluştuğunu gösterir. Tüm frekansların toplamı, tüm popülasyonun büyüklüğünü, hacmini belirler.

Frekanslar Bir birimin kesirleri veya toplamın yüzdesi olarak ifade edilen frekanslara denir. Buna göre frekansların toplamı 1'e yani %100'e eşittir.

Özelliğin varyasyonunun doğasına bağlı olarak kesikli ve aralıklı değişim dağılım serilerini ayırt eder.

Ayrık varyasyon serisi dağılımı - Bu, grupların süreksiz olarak değişen bir özelliğe göre oluşturulduğu bir dağılım dizisidir; başından sonuna kadar belirli sayı birimlerdir ve yalnızca tamsayı değerleri kabul eder. Örneğin yerleşik daire sayısının dağılımı Rusya Federasyonu içlerindeki oda sayısına göre ben! 2010 (Tablo 3.11).

Tablo 3.11. 2010 yılında Rusya Federasyonu'nda inşa edilen daire sayısının oda sayısına göre dağılımı.

Aralıklı değişim serisi dağılımı - Bu, grubun temelini oluşturan gruplama özelliğinin, aralıkta birbirinden keyfi olarak küçük bir miktarda farklılık gösteren herhangi bir değeri alabildiği bir dağılım serisidir.

Aralıklı değişim serilerinin oluşturulması, öncelikle bir özelliğin sürekli değişimi için (Tablo 3.12) ve ayrıca bir özelliğin ayrık değişimi geniş bir aralıkta kendini gösteriyorsa (Tablo 3.13), yani; ayrı bir özelliğin varyantlarının sayısı oldukça fazladır.

Tablo 3.12. Güney konularının dağılımı federal bölge 1 Ocak 2011 itibarıyla bölgelere göre Rusya Federasyonu

Tablo 3.13. Rusya Federasyonu Merkezi Federal Bölgesi konularının sayıya göre dağılımı belediye kurumları 1 Ocak 2011 itibarıyla eğitim

Dağıtım serilerini oluşturma kuralları, gruplama oluşturma kurallarına benzer.

Dağıtım serilerinin analizi, özelliklerine göre açıkça gerçekleştirilebilir. grafik görüntü. Bu amaçla bir çokgen, bir histogram ve dağılımlar oluşturulur.

Çokgen ayrık varyasyon dağılım serilerini tasvir ederken kullanılır. Bunu inşa etmek için dikdörtgen sistem Aynı ölçekte apsis ekseni boyunca koordinatlar, değişen karakteristiklerin sıralanmış değerlerini çizer ve ordinat ekseni boyunca frekansların büyüklüğünü ifade etmek için bir ölçek çizilir. Apsis ekseninin kesişme noktasında elde edilir (X) ve ordinat eksenleri (Y) düz çizgilerle bağlanır, bu da kırık çizgi, frekans poligonu olarak adlandırılır.

Histogram Bir aralık varyasyon serisini tasvir etmek için kullanılır. Bir histogram oluştururken aralıkların değerleri apsis eksenine çizilir ve frekanslar karşılık gelen aralıklar üzerine inşa edilen dikdörtgenler ile gösterilir. Sütunların yüksekliği frekanslarla orantılı olmalıdır.

Bir histogram, dikdörtgenlerin üst kenarlarının orta noktalarının düz çizgilerle birleştirilmesiyle bir dağıtım poligonuna dönüştürülebilir.

Eşit olmayan aralıklarla bir varyasyon serisinin dağılımının histogramını oluştururken, ordinat ekseni boyunca çizilen frekanslar değil, ilgili aralıklardaki karakteristik dağılımının yoğunluğudur. Dağıtım yoğunluğu - birim aralık genişliği başına hesaplanan frekanstır,

onlar. aralık değeri birimi başına her grupta kaç birim vardır.

Değişim dağılım serisini grafiksel olarak görüntülemek için kümülatif bir eğri kullanılabilir. Kullanarak biriken bir dizi birikmiş frekansı tasvir eder. Birikmiş frekanslar, gruplar halinde frekansların sıralı toplamı ile belirlenir.

Apsis ekseni boyunca aralık varyasyon serisinin kümülatlarını oluştururken (X) serinin varyantları çizilir ve ordinat (Y) ekseni boyunca, grafik alanında apsis eksenine dik olarak çizilen birikmiş frekanslar bulunur. üst sınırlar aralıklar. Daha sonra bu dikmeler birleştirilir ve kesikli bir çizgi elde edilir, yani. biriktirin.

Eksenin kümülatları biçimindeki değişken bir dağılım serisini grafiksel olarak gösterirken X ve yer değiştiriyorsun, öyle görünüyor Ogiva.

Satırlar oluşturuldu niceliksel olarak, denir varyasyonel.

Dağıtım serisi şunlardan oluşur: seçenekler(karakteristik değerler) ve frekanslar(grup sayısı). Frekanslar şu şekilde ifade edilir: göreceli değerler(hisseler, yüzde) denir frekanslar. Tüm frekansların toplamına dağıtım serisinin hacmi denir.

Türe göre dağıtım serisi aşağıdakilere ayrılmıştır: ayrık(karakteristiğin süreksiz değerlerine göre inşa edilmiştir) ve aralık(üzerine inşa edilmiş sürekli değerler imza).

Varyasyon serisi iki sütunu (veya satırı) temsil eder; bunlardan biri, değişkenler olarak adlandırılan ve X ile gösterilen, değişen bir karakteristiğin bireysel değerlerini sağlar; ve diğerinde - mutlak sayılar, her seçeneğin kaç kez (ne sıklıkta) gerçekleştiğini gösterir. İkinci sütundaki göstergelere frekanslar denir ve geleneksel olarak f ile gösterilir. İkinci sütunda her ikisinin de olduğunu bir kez daha belirtelim. göreceli göstergeler bireysel değişkenlerin sıklığının payını karakterize eden toplam tutar sıklık Bu göreceli göstergelere frekanslar denir ve geleneksel olarak ω ile gösterilir. Bu durumda tüm frekansların toplamı bire eşittir. Ancak frekanslar yüzde olarak da ifade edilebilir ve bu durumda tüm frekansların toplamı %100'ü verir.

Varyasyon serisinin varyantları şu şekilde ifade edilirse ayrık miktarlar, o zaman böyle bir varyasyon serisi denir ayrık.

Sürekli özellikler için varyasyon serileri şu şekilde oluşturulur: aralık yani özniteliğin içlerindeki değerleri “...'den...'e” olarak ifade edilir. Bu durumda, böyle bir aralıktaki özelliğin minimum değerlerine aralığın alt sınırı ve maksimum üst sınırı denir.

Aralıklı değişim serileri aynı zamanda farklı özelliklerde değişen ayrık özellikler için de oluşturulur. geniş aralık. Aralık serisi birlikte olabilir eşit Ve eşit olmayan aralıklarla.

Eşit aralıkların değerinin nasıl belirlendiğini düşünelim. Aşağıdaki gösterimi tanıtalım:

Ben– aralık boyutu;

- popülasyon birimleri için özelliğin maksimum değeri;

– popülasyon birimleri için özelliğin minimum değeri;

N - tahsis edilen grup sayısı.

n biliniyorsa.

Tanımlanacak grup sayısının önceden belirlenmesi zorsa, yeterli popülasyon büyüklüğüyle optimal aralık boyutunu hesaplamak için Sturgess'in 1926'da önerdiği formül önerilebilir:

n = 1+ 3,322 log N; burada N, toplamdaki birim sayısıdır.

Eşit olmayan aralıkların boyutu, çalışma nesnesinin özellikleri dikkate alınarak her bir durumda belirlenir.

İstatistiksel örnek dağılımı seçeneklerin bir listesini ve bunlara karşılık gelen frekansları (veya göreceli frekansları) çağırın.

Numunenin istatistiksel dağılımı, seçeneklerin bulunduğu ilk sütunda ve ikincisinde bu seçeneklere karşılık gelen frekanslarda bir tablo şeklinde belirtilebilir. hayır veya göreceli frekanslar Pi .

Örneklemin istatistiksel dağılımı

Aralık serileri, oluşumlarının altında yatan özelliklerin değerlerinin belirli sınırlar (aralıklar) dahilinde ifade edildiği varyasyon serileridir. Bu durumda frekanslar şunlarla ilgili değildir: bireysel değerler karakteristik, ancak tüm aralığa kadar.

Aralıklı dağılım serileri, sürekli niceliksel özelliklerin yanı sıra önemli sınırlar içinde değişen ayrık özelliklere dayalı olarak oluşturulur.

Bir aralık serisi, aralıkları ve bunlara karşılık gelen frekansları gösteren bir örneğin istatistiksel dağılımı ile temsil edilebilir. Bu durumda bu aralığa giren varyantların frekanslarının toplamı aralığın frekansı olarak alınır.

Niceliksel sürekli özelliklere göre gruplama yaparken aralığın boyutunu belirlemek önemlidir.

Örnek ortalaması ve örnek varyansına ek olarak varyasyon serisinin diğer özellikleri de kullanılır.

Moda Frekansı en yüksek olan varyant denir.

    İncelenen popülasyonda meydana gelen, incelenen mülkün tüm değerlerine özelliğin değeri (seçenek, varyant) adı verilir ve bu değerdeki değişiklik değiştirerek. Seçenekler, grubun seri numarasına karşılık gelen endekslerle Latin alfabesinin küçük harfleriyle belirtilmiştir - X Ben .

    İncelenen popülasyonda her bir karakteristik değerin kaç kez oluştuğunu gösteren bir sayı sıklık ve f'yi belirtin Ben .

    Serinin tüm frekanslarının toplamı, incelenen popülasyonun hacmine eşittir. Çok sık saymanız gerekirbirikmiş frekans (). S Her bir karakteristik değer için birikmiş frekans, popülasyonun kaç biriminin karakteristik değere sahip olduğunu gösterir. verilen değer

. Birikmiş frekans, aşağıdaki nitelik değerlerinin, frekans işaretinin ilk değerinin frekansına sırayla eklenmesiyle hesaplanır:

Birikmiş frekans, özelliğin ilk değerinden itibaren hesaplanmaya başlar

Frekansların toplamı her zaman bire veya %100'e eşittir. Frekansları frekanslarla değiştirmek, varyasyon serilerini farklı sayıda gözlemle karşılaştırmaya olanak tanır.

Bazı durumlarda serinin frekansları (fi) frekanslar (ω i) ile değiştirilebilir.

    Değişim serisi eşit olmayan aralıklarla veriliyorsa, dağılımın doğası hakkında doğru bir fikir edinmek için dağılımın mutlak veya bağıl yoğunluğunu hesaplamak gerekir. Mutlak dağıtım yoğunluğu (p ) F birim aralık boyutu başına frekans değerini temsil eder ayrı grup

sıra: Mutlak dağıtım yoğunluğu (p = Mutlak dağıtım yoğunluğu (p/ R

    Ben. ω ) Bağıl dağıtım yoğunluğu (p

sıra: ω = ω / R

serinin ayrı bir grubunun aralığının birim boyutu başına frekans değerini temsil eder:

    Eşit olmayan aralıklara sahip seriler için, yalnızca bu özellikler dağılımın doğası hakkında frekans ve frekanstan daha doğru bir fikir verir. İstatistiksel örnek dağılımı Seçeneklerin bir listesini (işaret değerleri) ve bunlara karşılık gelen frekansları veya dağıtım yoğunluklarını, göreceli frekansları veya bağıl yoğunluklar

dağıtımlar.

Farklı dağıtım serileri, farklı frekans özellikleriyle karakterize edilir:

minimal – nitelik serisi (frekans, frekans),

ayrık olanlar için dört karakteristik kullanılır (frekans, frekans, birikmiş frekans, birikmiş frekans),

  1. aralıklı olanlar için – beşinin tümü (frekans, frekans, birikmiş frekans, birikmiş frekans, mutlak ve bağıl dağılım yoğunlukları).

  1. Aralık varyasyon serisi oluşturma kuralları

Bir varyasyon serisini incelemenin ilk aşaması onun grafiksel görüntüsünü oluşturmaktır. Varyasyon serilerinin grafiksel gösterimi analizlerini kolaylaştırır ve dağılımın şekli hakkında karar verilmesine olanak tanır. İstatistikteki bir varyasyon serisini grafiksel olarak temsil etmek için bir histogram, çokgen ve birikimli dağılım oluşturulur.

Ayrı bir varyasyon serisi, frekans poligonu adı verilen bir şekilde tasvir edilir.

Bir aralık serisini görüntülemek için bir frekans dağıtım poligonu ve bir frekans histogramı kullanılır.

Grafikler dikdörtgen koordinat sisteminde oluşturulmuştur.