Jenis siri variasi. V

Mari kita panggil nilai sampel yang berbeza pilihan siri nilai dan menandakan: X 1 , X 2,…. Pertama sekali kami akan menghasilkan berkisar pilihan, i.e. susunan mereka dalam susunan menaik atau menurun. Bagi setiap pilihan, beratnya sendiri ditunjukkan, i.e. nombor yang mencirikan sumbangan pilihan yang diberikan kepada jumlah penduduk. Frekuensi atau frekuensi bertindak sebagai pemberat.

Kekerapan n i pilihan x i ialah nombor yang menunjukkan bilangan kali pilihan yang diberikan berlaku dalam populasi sampel yang sedang dipertimbangkan.

Kekerapan atau kekerapan relatif w i pilihan x i ialah nombor yang sama dengan nisbah kekerapan varian kepada hasil tambah frekuensi semua varian. Kekerapan menunjukkan bahagian unit dalam populasi sampel yang mempunyai varian tertentu.

Urutan pilihan dengan pemberat (frekuensi atau frekuensi) yang sepadan, ditulis dalam susunan menaik (atau menurun), dipanggil siri variasi.

Siri variasi adalah diskret dan selang.

Untuk siri variasi diskret, nilai titik ciri ditentukan, untuk siri selang, nilai ciri dinyatakan dalam bentuk selang. Siri variasi boleh menunjukkan taburan frekuensi atau frekuensi relatif (frekuensi), bergantung pada nilai yang ditunjukkan untuk setiap pilihan - frekuensi atau kekerapan.

Siri variasi diskret taburan kekerapan mempunyai bentuk:

Frekuensi didapati dengan formula, i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Contoh 4.1. Untuk set nombor yang diberikan

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

bina siri variasi diskret taburan kekerapan dan kekerapan.

Penyelesaian . Isipadu penduduk adalah sama dengan n= 10. Siri taburan frekuensi diskret mempunyai bentuk

Siri selang mempunyai bentuk rakaman yang serupa.

Siri variasi selang taburan kekerapan ditulis sebagai:

Jumlah semua frekuensi adalah sama dengan jumlah bilangan cerapan, i.e. jumlah volum: n = n 1 +n 2 + … + n m.

Siri variasi selang taburan frekuensi relatif (frekuensi) mempunyai bentuk:

Kekerapan didapati dengan formula, i = 1, 2, …, m.

Jumlah semua frekuensi adalah sama dengan satu: w 1 +w 2 + … + w m = 1.

Siri selang paling kerap digunakan dalam amalan. Sekiranya terdapat banyak data sampel statistik dan nilainya berbeza antara satu sama lain dengan jumlah yang kecil secara sewenang-wenangnya, maka siri diskret untuk data ini akan menjadi agak rumit dan menyusahkan untuk penyelidikan lanjut. Dalam kes ini, pengumpulan data digunakan, i.e. Selang yang mengandungi semua nilai atribut dibahagikan kepada beberapa selang separa dan, dengan mengira kekerapan untuk setiap selang, siri selang diperoleh. Mari kita tulis dengan lebih terperinci skema untuk membina siri selang, dengan mengandaikan bahawa panjang selang separa adalah sama.

2.2 Pembinaan siri jeda

Untuk membina siri selang yang anda perlukan:

Tentukan bilangan selang;

Tentukan panjang selang;

Tentukan lokasi selang pada paksi.

Untuk menentukan bilangan selang k Terdapat formula Sturges, mengikut mana

,

di mana n- isipadu keseluruhan agregat.

Sebagai contoh, jika terdapat 100 nilai ciri (varian), maka disyorkan untuk mengambil bilangan selang yang sama dengan selang untuk membina siri selang.

Walau bagaimanapun, selalunya dalam praktiknya bilangan selang dipilih oleh penyelidik sendiri, dengan mengambil kira bahawa bilangan ini tidak boleh terlalu besar supaya sirinya tidak menyusahkan, tetapi juga tidak terlalu kecil supaya tidak kehilangan beberapa sifat pengedaran.

Panjang selang h ditentukan oleh formula berikut:

,

di mana x maks dan x min ialah nilai terbesar dan terkecil daripada pilihan, masing-masing.

Saiz dipanggil skop barisan.

Untuk membina selang itu sendiri, mereka meneruskan dengan cara yang berbeza. Salah satu cara yang paling mudah adalah seperti berikut. Permulaan selang pertama diambil sebagai
. Kemudian baki sempadan selang ditemui oleh formula. Jelas sekali, penghujung selang terakhir a m+1 mesti memenuhi syarat

Selepas semua sempadan selang telah ditemui, frekuensi (atau frekuensi) selang ini ditentukan. Untuk menyelesaikan masalah ini, lihat semua pilihan dan tentukan bilangan pilihan yang jatuh ke dalam selang waktu tertentu. Mari kita lihat pembinaan lengkap siri selang menggunakan contoh.

Contoh 4.2. Untuk data statistik berikut, direkodkan dalam tertib menaik, bina satu siri selang dengan bilangan selang yang sama dengan 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Penyelesaian. Jumlah n=50 nilai varian.

Bilangan selang ditentukan dalam pernyataan masalah, i.e. k=5.

Panjang selang adalah
.

Mari kita tentukan sempadan selang:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Untuk menentukan kekerapan selang, kami mengira bilangan pilihan yang jatuh ke dalam selang tertentu. Sebagai contoh, selang pertama dari 2.5 hingga 19.5 termasuk pilihan 11, 12, 12, 14, 14, 15. Nombornya ialah 6, oleh itu, kekerapan selang pertama ialah n 1 =6. Kekerapan selang pertama ialah . Selang kedua dari 19.5 hingga 36.5 termasuk pilihan 21, 21, 22, 23, 25, bilangannya ialah 5. Oleh itu, kekerapan selang kedua ialah n 2 =5, dan kekerapan . Setelah menemui frekuensi dan frekuensi untuk semua selang dengan cara yang sama, kami memperoleh siri selang berikut.

Siri selang taburan kekerapan mempunyai bentuk:

Jumlah frekuensi ialah 6+5+9+11+8+11=50.

Siri selang taburan kekerapan mempunyai bentuk:

Jumlah frekuensi ialah 0.12+0.1+0.18+0.22+0.16+0.22=1. ■

Apabila membina siri selang, bergantung kepada keadaan khusus masalah yang sedang dipertimbangkan, peraturan lain boleh digunakan, iaitu

1. Siri variasi selang boleh terdiri daripada selang separa dengan panjang yang berbeza. Panjang selang yang tidak sama membolehkan untuk menyerlahkan sifat populasi statistik dengan taburan ciri yang tidak sekata. Sebagai contoh, jika sempadan selang menentukan bilangan penduduk di bandar, maka adalah dinasihatkan dalam masalah ini untuk menggunakan selang yang tidak sama panjang. Jelas sekali, bagi bandar-bandar kecil perbezaan kecil dalam bilangan penduduk adalah penting, tetapi bagi bandar-bandar besar perbezaan berpuluh-puluh atau beratus-ratus penduduk adalah tidak ketara. Siri selang dengan panjang separa separa yang tidak sama dikaji terutamanya dalam teori umum statistik dan pertimbangannya adalah di luar skop manual ini.

2. Dalam statistik matematik, siri selang kadangkala dipertimbangkan, yang mana sempadan kiri selang pertama diandaikan sama dengan –∞, dan sempadan kanan selang terakhir +∞. Ini dilakukan untuk mendekatkan taburan statistik kepada teori.

3. Apabila membina siri selang, ia mungkin ternyata bahawa nilai beberapa pilihan bertepatan tepat dengan sempadan selang. Perkara terbaik untuk dilakukan dalam kes ini adalah seperti berikut. Sekiranya terdapat hanya satu kebetulan sedemikian, maka pertimbangkan bahawa pilihan yang sedang dipertimbangkan dengan kekerapannya jatuh ke dalam selang yang terletak lebih dekat ke tengah siri selang itu jika terdapat beberapa pilihan sedemikian, maka sama ada kesemuanya ditetapkan pada selang untuk sebelah kanan pilihan ini, atau kesemuanya ditetapkan di sebelah kiri.

4. Selepas menentukan bilangan selang dan panjangnya, susunan selang boleh dilakukan dengan cara lain. Cari min aritmetik semua nilai pilihan yang dipertimbangkan X Rabu dan bina selang pertama dengan cara yang purata sampel ini berada dalam beberapa selang. Oleh itu, kita mendapat selang dari X Rabu – 0.5 h kepada X purata.. + 0.5 h. Kemudian ke kiri dan ke kanan, sambil menambah panjang selang, kami membina selang yang tinggal sehingga x min dan x max tidak akan jatuh ke dalam selang pertama dan terakhir, masing-masing.

5. Siri selang dengan bilangan selang yang banyak ditulis secara menegak dengan mudah, i.e. tulis selang bukan dalam baris pertama, tetapi dalam lajur pertama, dan frekuensi (atau frekuensi) dalam lajur kedua.

Data sampel boleh dianggap sebagai nilai beberapa pembolehubah rawak X. Pembolehubah rawak mempunyai hukum taburannya sendiri. Daripada teori kebarangkalian diketahui bahawa undang-undang taburan pembolehubah rawak diskret boleh ditentukan dalam bentuk siri taburan, dan untuk yang berterusan - menggunakan fungsi ketumpatan taburan. Walau bagaimanapun, terdapat undang-undang taburan sejagat yang memegang kedua-dua pembolehubah rawak diskret dan berterusan. Undang-undang pengagihan ini diberikan sebagai fungsi pengagihan F(x) = P(X<x). Untuk data sampel, anda boleh menentukan analog bagi fungsi pengedaran - fungsi pengedaran empirikal.


Maklumat berkaitan.


Set nilai parameter yang dikaji dalam eksperimen atau pemerhatian tertentu, disusun mengikut nilai (kenaikan atau penurunan) dipanggil siri variasi.

Katakan kita mengukur tekanan darah sepuluh pesakit untuk mendapatkan ambang atas tekanan darah: tekanan sistolik, i.e. hanya satu nombor.

Mari kita bayangkan bahawa satu siri pemerhatian (jumlah statistik) tekanan sistolik arteri dalam 10 pemerhatian mempunyai bentuk berikut (Jadual 1):

Jadual 1

Komponen siri variasi dipanggil varian. Pilihan mewakili nilai berangka bagi ciri yang sedang dikaji.

Membina siri variasi daripada set statistik pemerhatian hanyalah langkah pertama ke arah memahami ciri-ciri keseluruhan set. Seterusnya, adalah perlu untuk menentukan tahap purata sifat kuantitatif yang sedang dikaji (purata tahap protein darah, purata berat pesakit, purata masa permulaan anestesia, dll.)

Tahap purata diukur menggunakan kriteria yang dipanggil purata. Nilai purata ialah ciri berangka generalisasi bagi nilai homogen secara kualitatif, mencirikan dengan satu nombor keseluruhan populasi statistik mengikut satu kriteria. Nilai purata menyatakan apa yang biasa kepada ciri dalam set pemerhatian tertentu.

Terdapat tiga jenis purata yang biasa digunakan: mod (), median () dan min aritmetik ().

Untuk menentukan sebarang nilai purata, adalah perlu untuk menggunakan hasil pemerhatian individu, merekodkannya dalam bentuk siri variasi (Jadual 2).

Fesyen- nilai yang paling kerap berlaku dalam satu siri pemerhatian. Dalam contoh kami, mod = 120. Jika tiada nilai berulang dalam siri variasi, maka mereka mengatakan bahawa tiada mod. Jika beberapa nilai diulang bilangan kali yang sama, maka yang terkecil daripada mereka diambil sebagai mod.

Median- nilai yang membahagikan taburan kepada dua bahagian yang sama, nilai pusat atau median bagi satu siri cerapan yang tertib dalam tertib menaik atau menurun. Jadi, jika terdapat 5 nilai dalam siri variasi, maka mediannya adalah sama dengan sebutan ketiga siri variasi itu; pemerhatian pusat, i.e. jika terdapat 10 cerapan dalam satu siri, maka median adalah sama dengan min aritmetik cerapan ke-5 dan ke-6. Dalam contoh kita.

Mari kita perhatikan ciri penting mod dan median: nilai mereka tidak dipengaruhi oleh nilai berangka varian yang melampau.

Aritmetik min dikira dengan formula:

di mana adalah nilai yang diperhatikan dalam pemerhatian -th, dan ialah bilangan pemerhatian. Untuk kes kami.

Purata aritmetik mempunyai tiga sifat:

Purata menduduki kedudukan tengah dalam siri variasi. Dalam barisan simetri yang ketat.

Purata ialah nilai umum dan turun naik rawak dan perbezaan dalam data individu tidak kelihatan di belakang purata. Ia mencerminkan ciri-ciri keseluruhan penduduk.

Jumlah sisihan semua pilihan daripada purata ialah sifar: . Sisihan pilihan daripada purata ditunjukkan.

Siri variasi terdiri daripada varian dan frekuensi yang sepadan. Daripada sepuluh nilai yang diperoleh, angka 120 berlaku 6 kali, 115 - 3 kali, 125 - 1 kali. Kekerapan () - bilangan mutlak varian individu dalam agregat, menunjukkan bilangan kali variasi tertentu berlaku dalam siri variasi.

Siri variasi boleh menjadi mudah (frekuensi = 1) atau dikumpulkan dan dipendekkan, dengan pilihan 3-5. Siri ringkas digunakan untuk sebilangan kecil pemerhatian (), siri berkumpulan digunakan untuk sebilangan besar pemerhatian ().

Siri variasi – siri yang dibandingkan (mengikut tahap peningkatan atau penurunan) pilihan dan sepadan frekuensi

Pilihan ialah ungkapan kuantitatif individu bagi sesuatu ciri. Ditandakan dengan huruf Latin V . Pemahaman klasik tentang istilah "varian" mengandaikan bahawa setiap nilai unik ciri dipanggil varian, tanpa mengambil kira bilangan ulangan.

Sebagai contoh, dalam siri variasi penunjuk tekanan darah sistolik yang diukur dalam sepuluh pesakit:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Terdapat hanya 6 nilai yang tersedia:

110, 120, 130, 140, 160, 170.

Kekerapan ialah nombor yang menunjukkan berapa kali pilihan diulang. Ditandakan dengan huruf Latin P . Jumlah semua frekuensi (yang, sudah tentu, adalah sama dengan bilangan semua yang dikaji) dilambangkan sebagai n.

    Dalam contoh kami, frekuensi akan mengambil nilai berikut:
  • untuk pilihan 110 kekerapan P = 1 (nilai 110 berlaku dalam satu pesakit),
  • untuk pilihan 120, kekerapan P = 2 (nilai 120 berlaku dalam dua pesakit),
  • untuk pilihan 130 kekerapan P = 3 (nilai 130 berlaku dalam tiga pesakit),
  • untuk pilihan 140 kekerapan P = 2 (nilai 140 berlaku dalam dua pesakit),
  • untuk pilihan 160 kekerapan P = 1 (nilai 160 berlaku dalam satu pesakit),
  • untuk pilihan 170 kekerapan P = 1 (nilai 170 berlaku dalam satu pesakit),

Jenis siri variasi:

  1. ringkas- ini adalah siri di mana setiap pilihan berlaku sekali sahaja (semua frekuensi adalah sama dengan 1);
  2. digantung- siri di mana satu atau lebih pilihan muncul lebih daripada sekali.

Siri variasi digunakan untuk menerangkan tatasusunan nombor yang besar; dalam bentuk inilah data terkumpul kebanyakan kajian perubatan dipersembahkan pada mulanya. Untuk mencirikan siri variasi, penunjuk khas dikira, termasuk nilai purata, penunjuk kebolehubahan (yang dipanggil serakan), dan penunjuk keterwakilan data sampel.

Penunjuk siri variasi

1) Min aritmetik ialah penunjuk umum yang mencirikan saiz ciri yang dikaji. Min aritmetik dilambangkan sebagai M , ialah jenis purata yang paling biasa. Min aritmetik dikira sebagai nisbah jumlah nilai penunjuk semua unit cerapan kepada bilangan semua subjek yang dipelajari. Kaedah untuk mengira min aritmetik berbeza untuk siri variasi mudah dan wajaran.

Formula untuk pengiraan purata aritmetik mudah:

Formula untuk pengiraan purata aritmetik berwajaran:

M = Σ(V * P)/ n

​ 2) Mod ialah satu lagi nilai purata siri variasi, sepadan dengan pilihan yang paling kerap diulang. Atau, dengan kata lain, ini ialah pilihan yang sepadan dengan frekuensi tertinggi. Ditandakan sebagai Mo . Mod dikira hanya untuk siri wajaran, kerana dalam siri ringkas tiada pilihan diulang dan semua frekuensi adalah sama dengan satu.

Contohnya, dalam siri variasi nilai kadar denyutan jantung:

80, 84, 84, 86, 86, 86, 90, 94;

nilai mod ialah 86, kerana pilihan ini berlaku 3 kali, oleh itu kekerapannya adalah yang tertinggi.

3) Median - nilai pilihan membahagikan siri variasi kepada separuh: pada kedua-dua belahnya terdapat bilangan pilihan yang sama. Median, seperti min dan mod aritmetik, merujuk kepada nilai purata. Ditandakan sebagai saya

4) Sisihan piawai (sinonim: sisihan piawai, sisihan sigma, sigma) - ukuran kebolehubahan siri variasi. Ia adalah penunjuk penting yang menggabungkan semua kes sisihan daripada purata. Malah, ia menjawab soalan: sejauh mana dan kekerapan variasi tersebar daripada min aritmetik. Ditandakan dengan huruf Yunani σ ("sigma").

Jika saiz populasi lebih daripada 30 unit, sisihan piawai dikira menggunakan formula berikut:

Untuk populasi kecil - 30 unit cerapan atau kurang - sisihan piawai dikira menggunakan formula yang berbeza:

Hasil daripada penguasaan bab ini, pelajar mesti: tahu

  • penunjuk variasi dan hubungannya;
  • undang-undang asas pengagihan ciri;
  • intipati kriteria persetujuan; dapat
  • mengira indeks variasi dan kriteria kesesuaian;
  • menentukan ciri pengedaran;
  • menilai ciri berangka utama siri taburan statistik;

sendiri

  • kaedah analisis statistik siri pengedaran;
  • asas analisis varians;
  • teknik untuk menyemak siri pengedaran statistik untuk pematuhan undang-undang asas pengedaran.

Penunjuk variasi

Dalam kajian statistik ciri pelbagai populasi statistik, adalah sangat menarik untuk mengkaji variasi ciri unit statistik individu populasi, serta sifat taburan unit mengikut ciri ini. Variasi - ini adalah perbezaan nilai individu bagi satu ciri di antara unit populasi yang dikaji. Kajian tentang variasi adalah amat penting secara praktikal. Mengikut tahap variasi, seseorang boleh menilai had variasi ciri, kehomogenan populasi untuk ciri tertentu, tipikal purata, dan hubungan faktor yang menentukan variasi. Penunjuk variasi digunakan untuk mencirikan dan menyusun populasi statistik.

Hasil rumusan dan pengelompokan bahan pemerhatian statistik, dipersembahkan dalam bentuk siri taburan statistik, mewakili taburan teratur unit populasi yang dikaji ke dalam kumpulan mengikut kriteria pengelompokan (variing). Sekiranya ciri kualitatif diambil sebagai asas untuk pengelompokan, maka siri pengedaran sedemikian dipanggil bersifat atributif(pengedaran mengikut profesion, jantina, warna, dll.). Jika siri pengedaran dibina secara kuantitatif, maka siri sedemikian dipanggil variasi(agihan mengikut ketinggian, berat, gaji, dll.). Untuk membina siri variasi bermaksud menyusun taburan kuantitatif unit populasi mengikut nilai ciri, mengira bilangan unit populasi dengan nilai ini (kekerapan), dan menyusun keputusan dalam jadual.

Daripada kekerapan varian, adalah mungkin untuk menggunakan nisbahnya kepada jumlah isipadu pemerhatian, yang dipanggil frekuensi (frekuensi relatif).

Terdapat dua jenis siri variasi: diskret dan selang. Siri diskret- Ini adalah siri variasi, pembinaannya berdasarkan ciri dengan perubahan tak selanjar (ciri diskret). Yang terakhir termasuk bilangan pekerja di perusahaan, kategori tarif, bilangan anak dalam keluarga, dsb. Siri variasi diskret mewakili jadual yang terdiri daripada dua lajur. Lajur pertama menunjukkan nilai khusus atribut, dan lajur kedua menunjukkan bilangan unit dalam populasi dengan nilai khusus atribut. Sekiranya ciri mempunyai perubahan berterusan (jumlah pendapatan, tempoh perkhidmatan, kos aset tetap perusahaan, dll., yang dalam had tertentu boleh mengambil sebarang nilai), maka untuk ciri ini adalah mungkin untuk membina siri variasi selang. Apabila membina siri variasi selang, jadual juga mempunyai dua lajur. Yang pertama menunjukkan nilai atribut dalam selang "dari - hingga" (pilihan), yang kedua menunjukkan bilangan unit yang termasuk dalam selang (frekuensi). Kekerapan (kekerapan pengulangan) - bilangan ulangan bagi varian tertentu nilai atribut. Selang boleh ditutup atau terbuka. Selang tertutup adalah terhad pada kedua-dua belah pihak, i.e. mempunyai kedua-dua sempadan bawah (“dari”) dan atas (“ke”). Selang terbuka mempunyai satu sempadan: sama ada atas atau bawah. Jika pilihan disusun dalam susunan menaik atau menurun, maka baris dipanggil berperingkat.

Untuk siri variasi, terdapat dua jenis pilihan tindak balas frekuensi: kekerapan terkumpul dan kekerapan terkumpul. Kekerapan terkumpul menunjukkan berapa banyak pemerhatian nilai ciri mengambil nilai kurang daripada nilai yang ditentukan. Kekerapan terkumpul ditentukan dengan menjumlahkan nilai kekerapan ciri untuk kumpulan tertentu dengan semua frekuensi kumpulan sebelumnya. Kekerapan terkumpul mencirikan bahagian unit pemerhatian yang nilai atributnya tidak melebihi had atas kumpulan tertentu. Oleh itu, kekerapan terkumpul menunjukkan bahagian pilihan dalam jumlah yang mempunyai nilai tidak lebih besar daripada yang diberikan. Kekerapan, kekerapan, ketumpatan mutlak dan relatif, kekerapan terkumpul dan kekerapan adalah ciri-ciri magnitud varian.

Variasi dalam ciri unit statistik populasi, serta sifat taburan, dikaji menggunakan penunjuk dan ciri siri variasi, yang merangkumi tahap purata siri, sisihan linear purata, sisihan piawai, serakan , pekali ayunan, variasi, asimetri, kurtosis, dsb.

Nilai purata digunakan untuk mencirikan pusat pengedaran. Purata adalah ciri statistik generalisasi di mana tahap tipikal ciri yang dimiliki oleh ahli populasi yang dikaji dikira. Walau bagaimanapun, kes-kes kebetulan cara aritmetik dengan corak pengedaran yang berbeza adalah mungkin, oleh itu, sebagai ciri statistik siri variasi, cara struktur yang dipanggil dikira - mod, median, serta kuantil, yang membahagikan siri pengedaran kepada bahagian yang sama. (kuartil, desil, persentil, dll. ).

Fesyen - Ini ialah nilai ciri yang berlaku dalam siri pengedaran lebih kerap daripada nilainya yang lain. Untuk siri diskret, ini ialah pilihan dengan kekerapan tertinggi. Dalam siri variasi selang, untuk menentukan mod, perlu terlebih dahulu menentukan selang di mana ia berada, selang modal yang dipanggil. Dalam siri variasi dengan selang yang sama, selang modal ditentukan oleh frekuensi tertinggi, dalam siri dengan selang yang tidak sama - tetapi oleh ketumpatan taburan tertinggi. Formula itu kemudiannya digunakan untuk menentukan mod dalam baris pada selang waktu yang sama

di mana Mo ialah nilai fesyen; xMo - had bawah selang modal; h- lebar selang modal; / Mo - kekerapan selang modal; / Mo j ialah kekerapan selang pramodal; / Mo+1 ialah kekerapan selang pascamodal, dan untuk siri dengan selang yang tidak sama dalam formula pengiraan ini, bukannya frekuensi / Mo, / Mo, / Mo, ketumpatan taburan harus digunakan Fikiran 0 _| , Fikiran 0> UMO+"

Jika terdapat satu mod, maka taburan kebarangkalian pembolehubah rawak dipanggil unimodal; jika terdapat lebih daripada satu mod, ia dipanggil multimodal (polymodal, multimodal), dalam kes dua mod - bimodal. Sebagai peraturan, multimodaliti menunjukkan bahawa taburan yang dikaji tidak mematuhi undang-undang taburan normal. Populasi homogen, sebagai peraturan, dicirikan oleh taburan satu puncak. Multivertex juga menunjukkan heterogeniti populasi yang dikaji. Kemunculan dua atau lebih bucu menjadikannya perlu untuk mengumpulkan semula data untuk mengenal pasti kumpulan yang lebih homogen.

Dalam siri variasi selang waktu, mod boleh ditentukan secara grafik menggunakan histogram. Untuk melakukan ini, lukis dua garisan bersilang dari titik atas lajur tertinggi histogram ke titik atas dua lajur bersebelahan. Kemudian, dari titik persilangan mereka, serenjang diturunkan ke paksi absis. Nilai ciri pada paksi-x yang sepadan dengan serenjang ialah mod. Dalam kebanyakan kes, apabila mencirikan populasi sebagai penunjuk umum, keutamaan diberikan kepada mod dan bukannya min aritmetik.

Median - Ini ialah nilai pusat atribut yang dimiliki oleh ahli pusat siri pengedaran. Dalam siri diskret, untuk mencari nilai median, nombor sirinya ditentukan terlebih dahulu. Untuk melakukan ini, jika bilangan unit adalah ganjil, satu ditambah kepada jumlah semua frekuensi, dan nombor itu dibahagikan dengan dua. Jika terdapat bilangan unit genap dalam satu baris, akan ada dua unit median, jadi dalam kes ini median ditakrifkan sebagai purata nilai dua unit median. Oleh itu, median dalam siri variasi diskret ialah nilai yang membahagikan siri kepada dua bahagian yang mengandungi bilangan pilihan yang sama.

Dalam siri selang, selepas menentukan nombor siri median, selang medial didapati menggunakan frekuensi terkumpul (frekuensi), dan kemudian menggunakan formula untuk mengira median, nilai median itu sendiri ditentukan:

di mana Me ialah nilai median; x Saya - had bawah selang median; h- lebar selang median; - jumlah frekuensi siri pengedaran; /D - kekerapan terkumpul selang pra-median; /Me - kekerapan selang median.

Median boleh didapati secara grafik menggunakan terkumpul. Untuk melakukan ini, pada skala frekuensi terkumpul (frekuensi) terkumpul, dari titik yang sepadan dengan nombor ordinal median, garis lurus dilukis selari dengan paksi absis sehingga ia bersilang dengan terkumpul. Seterusnya, dari titik persilangan garis yang ditunjukkan dengan terkumpul, serenjang diturunkan ke paksi absis. Nilai atribut pada paksi-x yang sepadan dengan ordinat yang dilukis (berserenjang) ialah median.

Median dicirikan oleh sifat berikut.

  • 1. Ia tidak bergantung pada nilai atribut yang terletak di kedua-dua belahnya.
  • 2. Ia mempunyai sifat minima, yang bermaksud bahawa jumlah sisihan mutlak nilai atribut daripada median mewakili nilai minimum berbanding sisihan nilai atribut daripada sebarang nilai lain.
  • 3. Apabila menggabungkan dua taburan dengan median yang diketahui, adalah mustahil untuk meramalkan terlebih dahulu nilai median taburan baharu.

Sifat median ini digunakan secara meluas apabila mereka bentuk lokasi titik perkhidmatan awam - sekolah, klinik, stesen minyak, pam air, dll. Sebagai contoh, jika ia dirancang untuk membina sebuah klinik di blok tertentu di bandar, maka adalah lebih sesuai untuk mencarinya pada satu titik dalam blok yang bukan separuh panjang blok itu, tetapi bilangan penduduk.

Nisbah mod, median dan min aritmetik menunjukkan sifat taburan ciri dalam agregat dan membolehkan kita menilai simetri taburan. Jika x Saya maka terdapat asimetri sebelah kanan siri itu. Dengan taburan normal X - Saya - Mo.

K. Pearson, berdasarkan penjajaran pelbagai jenis lengkung, menentukan bahawa untuk taburan tidak simetri sederhana, perhubungan anggaran berikut antara min aritmetik, median dan mod adalah sah:

di mana Me ialah nilai median; Mo - maksud fesyen; x aritma - nilai min aritmetik.

Sekiranya terdapat keperluan untuk mengkaji struktur siri variasi dengan lebih terperinci, kemudian hitung nilai ciri yang serupa dengan median. Nilai ciri sedemikian membahagikan semua unit pengedaran kepada nombor yang sama; ia dipanggil kuantil atau kecerunan. Kuantil dibahagikan kepada kuartil, desil, persentil, dll.

Kuartil membahagikan populasi kepada empat bahagian yang sama. Kuartil pertama dikira sama dengan median menggunakan formula untuk mengira kuartil pertama, setelah sebelumnya menentukan selang suku tahunan pertama:

di mana Qi ialah nilai kuartil pertama; xQ^- had bawah julat kuartil pertama; h- lebar selang suku pertama; /, - frekuensi siri selang;

Kekerapan kumulatif dalam selang sebelum selang kuartil pertama; Jq ( - kekerapan selang kuartil pertama.

Kuartil pertama menunjukkan bahawa 25% daripada unit populasi adalah kurang daripada nilainya, dan 75% adalah lebih. Kuartil kedua adalah sama dengan median, i.e. Q 2 = saya.

Dengan analogi, kuartil ketiga dikira, setelah pertama kali menemui selang suku ketiga:

di manakah had bawah julat kuartil ketiga; h- lebar selang kuartil ketiga; /, - frekuensi siri selang; /X" - kekerapan terkumpul dalam selang sebelumnya

G

selang kuartil ketiga; Jq ialah kekerapan bagi selang kuartil ketiga.

Kuartil ketiga menunjukkan bahawa 75% daripada unit populasi adalah kurang daripada nilainya, dan 25% lebih banyak.

Perbezaan antara kuartil ketiga dan pertama ialah julat antara kuartil:

di mana Aq ialah nilai julat antara kuartil; S 3 - nilai kuartil ketiga; Q, ialah nilai kuartil pertama.

Desil membahagikan populasi kepada 10 bahagian yang sama banyak. Desil ialah nilai ciri dalam siri taburan yang sepadan dengan persepuluh daripada saiz populasi. Dengan analogi dengan kuartil, desil pertama menunjukkan bahawa 10% daripada unit populasi adalah kurang daripada nilainya, dan 90% adalah lebih besar, dan desil kesembilan mendedahkan bahawa 90% daripada unit populasi adalah kurang daripada nilainya, dan 10% adalah lebih besar. Nisbah desil kesembilan dan pertama, i.e. Pekali desil digunakan secara meluas dalam kajian pembezaan pendapatan untuk mengukur nisbah tahap pendapatan bagi 10% penduduk paling mewah dan 10% daripada penduduk paling kurang berkemampuan. Persentil membahagikan populasi yang diberi kedudukan kepada 100 bahagian yang sama. Pengiraan, makna, dan penggunaan persentil adalah serupa dengan desil.

Kuartil, desil dan ciri-ciri struktur lain boleh ditentukan secara grafik dengan analogi dengan median menggunakan kumulasi.

Untuk mengukur saiz variasi, penunjuk berikut digunakan: julat variasi, sisihan linear purata, sisihan piawai, serakan. Magnitud julat variasi bergantung sepenuhnya pada rawak taburan ahli ekstrem siri. Penunjuk ini menarik minat dalam kes yang penting untuk mengetahui amplitud turun naik dalam nilai ciri:

di mana R- nilai julat variasi; x max - nilai maksimum atribut; x tt - nilai minimum atribut.

Apabila mengira julat variasi, nilai sebahagian besar ahli siri tidak diambil kira, manakala variasi dikaitkan dengan setiap nilai ahli siri. Penunjuk yang merupakan purata yang diperoleh daripada sisihan nilai individu ciri daripada nilai purata mereka tidak mempunyai kelemahan ini: sisihan linear purata dan sisihan piawai. Terdapat hubungan langsung antara sisihan individu daripada purata dan kebolehubahan sifat tertentu. Lebih kuat turun naik, lebih besar saiz mutlak sisihan daripada purata.

Sisihan linear purata ialah min aritmetik bagi nilai mutlak sisihan pilihan individu daripada nilai puratanya.

Sisihan Linear Purata untuk Data Tidak Berkumpulan

di mana /pr ialah nilai sisihan linear purata; x, - ialah nilai atribut; X - p - bilangan unit dalam populasi.

Sisihan linear purata bagi siri terkumpul

di mana / vz - nilai sisihan linear purata; x, ialah nilai atribut; X - nilai purata ciri bagi populasi yang dikaji; / - bilangan unit populasi dalam kumpulan yang berasingan.

Dalam kes ini, tanda-tanda penyelewengan diabaikan, jika tidak, jumlah semua sisihan akan sama dengan sifar. Purata sisihan linear, bergantung pada pengumpulan data yang dianalisis, dikira menggunakan pelbagai formula: untuk data terkumpul dan tidak terkumpul. Disebabkan oleh konvensyennya, sisihan linear purata, secara berasingan daripada penunjuk variasi lain, digunakan dalam amalan agak jarang (khususnya, untuk mencirikan pemenuhan kewajipan kontrak mengenai keseragaman penghantaran; dalam analisis pusing ganti perdagangan asing, komposisi pekerja, irama pengeluaran, kualiti produk, dengan mengambil kira ciri-ciri teknologi pengeluaran dan lain-lain).

Sisihan piawai mencirikan berapa banyak secara purata nilai individu bagi ciri yang dikaji menyimpang daripada nilai purata populasi, dan dinyatakan dalam unit ukuran ciri yang dikaji. Sisihan piawai, sebagai salah satu ukuran utama variasi, digunakan secara meluas dalam menilai had variasi ciri dalam populasi homogen, dalam menentukan nilai ordinat lengkung taburan normal, serta dalam pengiraan yang berkaitan dengan organisasi pemerhatian sampel dan mewujudkan ketepatan ciri sampel. Sisihan piawai bagi data tidak terkumpul dikira menggunakan algoritma berikut: setiap sisihan daripada min adalah kuasa dua, semua kuasa dua dijumlahkan, selepas itu jumlah kuasa dua dibahagikan dengan bilangan sebutan siri dan punca kuasa dua diekstrak daripada quotient:

di mana Iip ialah nilai sisihan piawai; Xj- nilai atribut; X- nilai purata ciri untuk populasi yang dikaji; p - bilangan unit dalam populasi.

Untuk data yang dianalisis berkumpulan, sisihan piawai data dikira menggunakan formula berwajaran

di mana - nilai sisihan piawai; Xj- nilai atribut; X - nilai purata ciri bagi populasi yang dikaji; f x - bilangan unit penduduk dalam kumpulan tertentu.

Ungkapan di bawah akar dalam kedua-dua kes dipanggil varians. Oleh itu, serakan dikira sebagai kuasa dua purata sisihan nilai atribut daripada nilai puratanya. Untuk nilai atribut tidak berwajaran (mudah), varians ditentukan seperti berikut:

Untuk nilai ciri wajaran

Terdapat juga kaedah ringkas khas untuk mengira varians: secara umum

untuk nilai ciri tidak berwajaran (mudah). untuk nilai ciri wajaran
menggunakan kaedah berasaskan sifar

di mana a 2 ialah nilai serakan; x, - ialah nilai atribut; X - nilai purata ciri, h- nilai selang kumpulan, t 1 - berat (A =

Serakan mempunyai ekspresi tersendiri dalam statistik dan merupakan salah satu penunjuk variasi yang paling penting. Ia diukur dalam unit yang sepadan dengan kuasa dua unit ukuran ciri yang sedang dikaji.

Penyerakan mempunyai sifat berikut.

  • 1. Varians nilai malar ialah sifar.
  • 2. Mengurangkan semua nilai ciri dengan nilai A yang sama tidak mengubah nilai serakan. Ini bermakna bahawa purata kuasa dua sisihan boleh dikira bukan dari nilai tertentu ciri, tetapi dari sisihan mereka dari beberapa nombor tetap.
  • 3. Mengurangkan sebarang nilai ciri dalam k kali mengurangkan penyebaran dengan k 2 kali, dan sisihan piawai berada dalam k kali, i.e. semua nilai atribut boleh dibahagikan dengan beberapa nombor malar (katakan, dengan nilai selang siri), sisihan piawai boleh dikira, dan kemudian didarab dengan nombor malar.
  • 4. Jika kita mengira purata kuasa dua sisihan daripada sebarang nilai Dan berbeza pada satu darjah atau yang lain daripada min aritmetik, maka ia akan sentiasa lebih besar daripada purata kuasa dua sisihan yang dikira daripada min aritmetik. Kuasa dua purata sisihan akan lebih besar dengan jumlah yang sangat tertentu - dengan kuasa dua perbezaan antara purata dan nilai yang diambil secara konvensional ini.

Variasi ciri alternatif terdiri daripada ada atau tiada harta yang dikaji dalam unit populasi. Secara kuantitatif, variasi atribut alternatif dinyatakan dengan dua nilai: kehadiran unit sifat yang dikaji dilambangkan dengan satu (1), dan ketiadaannya dengan sifar (0). Perkadaran unit yang mempunyai sifat yang sedang dikaji dilambangkan dengan P, dan bahagian unit yang tidak mempunyai sifat ini dilambangkan dengan G. Oleh itu, varians atribut alternatif adalah sama dengan hasil perkadaran unit yang memiliki sifat ini (P) dengan perkadaran unit yang tidak memiliki sifat ini. (G). Variasi terbesar populasi dicapai dalam kes di mana sebahagian daripada populasi, yang membentuk 50% daripada jumlah keseluruhan populasi, mempunyai ciri, dan sebahagian lagi populasi, juga sama dengan 50%, tidak mempunyai ciri ini, dan serakan mencapai nilai maksimum 0.25, t .e. P = 0.5, G= 1 - P = 1 - 0.5 = 0.5 dan o 2 = 0.5 0.5 = 0.25. Had bawah penunjuk ini ialah sifar, yang sepadan dengan situasi di mana tiada variasi dalam agregat. Aplikasi praktikal bagi varians ciri alternatif adalah untuk membina selang keyakinan semasa menjalankan pemerhatian sampel.

Lebih kecil varians dan sisihan piawai, lebih homogen populasi dan lebih tipikal puratanya. Dalam amalan statistik, selalunya terdapat keperluan untuk membandingkan variasi pelbagai ciri. Sebagai contoh, adalah menarik untuk membandingkan variasi dalam umur pekerja dan kelayakan mereka, tempoh perkhidmatan dan gaji, kos dan keuntungan, tempoh perkhidmatan dan produktiviti buruh, dsb. Untuk perbandingan sedemikian, penunjuk kebolehubahan mutlak ciri adalah tidak sesuai: adalah mustahil untuk membandingkan kebolehubahan pengalaman kerja, dinyatakan dalam tahun, dengan variasi upah, dinyatakan dalam rubel. Untuk menjalankan perbandingan sedemikian, serta perbandingan kebolehubahan ciri yang sama dalam beberapa populasi dengan cara aritmetik yang berbeza, penunjuk variasi digunakan - pekali ayunan, pekali variasi linear dan pekali variasi, yang menunjukkan ukuran turun naik nilai ekstrem di sekitar purata.

Pekali ayunan:

di mana V R - nilai pekali ayunan; R- nilai julat variasi; X -

Pekali variasi linear".

di mana Vj- nilai pekali variasi linear; saya - nilai sisihan linear purata; X - nilai purata ciri bagi populasi yang dikaji.

Pekali variasi:

di mana V a - pekali nilai variasi; a ialah nilai sisihan piawai; X - nilai purata ciri bagi populasi yang dikaji.

Pekali ayunan ialah nisbah peratusan julat variasi kepada nilai purata ciri yang dikaji, dan pekali variasi linear ialah nisbah sisihan linear purata kepada nilai purata ciri yang sedang dikaji, dinyatakan sebagai peratusan. Pekali variasi ialah peratusan sisihan piawai kepada nilai purata ciri yang dikaji. Sebagai nilai relatif, dinyatakan sebagai peratusan, pekali variasi digunakan untuk membandingkan darjah variasi pelbagai ciri. Dengan menggunakan pekali variasi, kehomogenan populasi statistik dinilai. Sekiranya pekali variasi kurang daripada 33%, maka populasi yang dikaji adalah homogen dan variasi adalah lemah. Jika pekali variasi adalah lebih daripada 33%, maka populasi yang dikaji adalah heterogen, variasi adalah kuat, dan nilai purata adalah tidak tipikal dan tidak boleh digunakan sebagai penunjuk umum populasi ini. Selain itu, pekali variasi digunakan untuk membandingkan kebolehubahan satu sifat dalam populasi yang berbeza. Sebagai contoh, untuk menilai variasi dalam tempoh perkhidmatan pekerja di dua perusahaan. Semakin tinggi nilai pekali, semakin ketara variasi ciri.

Berdasarkan kuartil yang dikira, ia juga mungkin untuk mengira penunjuk relatif variasi suku tahunan menggunakan formula

di mana Q 2 Dan

Julat antara kuartil ditentukan oleh formula

Sisihan kuartil digunakan dan bukannya julat variasi untuk mengelakkan keburukan yang berkaitan dengan penggunaan nilai ekstrem:

Untuk siri variasi selang yang tidak sama, ketumpatan taburan juga dikira. Ia ditakrifkan sebagai hasil bagi frekuensi atau kekerapan yang sepadan dibahagikan dengan nilai selang. Dalam siri selang yang tidak sama, ketumpatan taburan mutlak dan relatif digunakan. Ketumpatan taburan mutlak ialah kekerapan per unit panjang selang. Ketumpatan taburan relatif - kekerapan per unit panjang selang.

Semua perkara di atas adalah benar untuk siri taburan yang undang-undang taburannya diterangkan dengan baik oleh undang-undang taburan normal atau hampir dengannya.

Kaedah pengumpulan juga membolehkan anda mengukur variasi(kebolehubahan, turun naik) tanda. Apabila bilangan unit dalam populasi agak kecil, variasi diukur berdasarkan bilangan unit terperingkat yang membentuk populasi. Siri itu dipanggil berpangkat, jika unit disusun dalam susunan menaik (menurun) ciri.

Walau bagaimanapun, siri kedudukan agak menunjukkan apabila ciri perbandingan variasi diperlukan. Di samping itu, dalam banyak kes kita perlu berurusan dengan populasi statistik yang terdiri daripada sejumlah besar unit, yang boleh dikatakan sukar untuk diwakili dalam bentuk siri tertentu. Dalam hal ini, untuk kenalan am awal dengan data statistik dan terutamanya untuk memudahkan kajian variasi dalam ciri, fenomena dan proses yang dikaji biasanya digabungkan ke dalam kumpulan, dan keputusan pengelompokan dibentangkan dalam bentuk jadual kumpulan.

Jika jadual kumpulan hanya mempunyai dua lajur - kumpulan mengikut ciri (pilihan) yang dipilih dan bilangan kumpulan (frekuensi atau kekerapan), ia dipanggil berhampiran pengedaran.

Julat pengedaran - jenis kumpulan struktur yang paling mudah mengikut satu ciri, dipaparkan dalam jadual kumpulan dengan dua lajur yang mengandungi variasi dan frekuensi ciri tersebut. Dalam banyak kes, dengan pengelompokan struktur sedemikian, i.e. Dengan penyusunan siri pengedaran, kajian bahan statistik awal bermula.

Kumpulan struktur dalam bentuk siri pengedaran boleh ditukar menjadi kumpulan struktur tulen jika kumpulan yang dipilih dicirikan bukan sahaja oleh frekuensi, tetapi juga oleh penunjuk statistik lain. Tujuan utama siri pengedaran adalah untuk mengkaji variasi ciri. Teori siri taburan dibangunkan secara terperinci oleh statistik matematik.

Siri pengedaran dibahagikan kepada bersifat atributif(pengumpulan mengikut ciri atribut, contohnya, membahagikan penduduk mengikut jantina, kewarganegaraan, status perkahwinan, dsb.) dan variasi(kumpulan mengikut ciri kuantitatif).

Siri variasi ialah jadual kumpulan yang mengandungi dua lajur: pengelompokan unit mengikut satu ciri kuantitatif dan bilangan unit dalam setiap kumpulan. Selang dalam siri variasi biasanya dibentuk sama dan tertutup. Siri variasi ialah kumpulan berikut bagi penduduk Rusia mengikut purata pendapatan monetari per kapita (Jadual 3.10).

Jadual 3.10

Taburan penduduk Rusia dengan purata pendapatan per kapita pada 2004-2009.

Kumpulan penduduk mengikut purata pendapatan tunai per kapita, gosok/bulan

Populasi dalam kumpulan, % daripada jumlah keseluruhan

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Lebih 25,000.0

Seluruh penduduk

Siri variasi pula dibahagikan kepada diskret dan selang. diskret siri variasi menggabungkan varian ciri diskret yang berbeza dalam had sempit. Contoh siri variasi diskret ialah pengagihan keluarga Rusia mengikut bilangan anak yang mereka ada.

Selang waktu Siri variasi menggabungkan varian sama ada ciri berterusan atau ciri diskret yang berbeza-beza dalam julat yang luas. Selang ialah siri variasi taburan penduduk Rusia mengikut nilai purata pendapatan monetari per kapita.

Siri variasi diskret tidak digunakan dengan kerap dalam amalan. Sementara itu, menyusunnya tidak sukar, kerana komposisi kumpulan ditentukan oleh varian khusus yang sebenarnya dimiliki oleh ciri kumpulan yang dikaji.

Siri variasi selang lebih meluas. Apabila menyusunnya, persoalan yang sukar timbul tentang bilangan kumpulan, serta saiz selang yang perlu ditetapkan.

Prinsip untuk menyelesaikan isu ini dinyatakan dalam bab tentang metodologi untuk membina kumpulan statistik (lihat perenggan 3.3).

Siri variasi ialah satu cara untuk meruntuhkan atau memampatkan maklumat yang pelbagai ke dalam bentuk yang padat daripada mereka seseorang boleh membuat pertimbangan yang agak jelas tentang sifat variasi, dan mengkaji perbezaan ciri-ciri fenomena yang termasuk dalam set yang dikaji. Tetapi kepentingan siri variasi yang paling penting ialah berdasarkan ciri-ciri generalisasi khas variasi dikira (lihat Bab 7).