Min aritmetik bagi sisihan kuasa dua. Kaedah dan kaedah untuk membentuk populasi sampel

Menurut tinjauan sampel, pendeposit dikumpulkan mengikut saiz deposit mereka di Sberbank bandar:

takrifkan:

1) skop variasi;

2) saiz deposit purata;

3) sisihan linear purata;

4) penyebaran;

5) sisihan piawai;

6) pekali variasi sumbangan.

Penyelesaian:

Siri pengedaran ini mengandungi selang terbuka. Dalam siri sedemikian, nilai selang kumpulan pertama secara konvensional diandaikan sama dengan nilai selang kumpulan seterusnya, dan nilai selang kumpulan terakhir adalah sama dengan nilai selang yang sebelumnya.

Nilai selang kumpulan kedua adalah sama dengan 200, oleh itu, nilai kumpulan pertama juga sama dengan 200. Nilai selang kumpulan kedua terakhir adalah sama dengan 200, yang bermaksud selang terakhir juga akan mempunyai nilai 200.

1) Mari kita takrifkan julat variasi sebagai perbezaan antara nilai terbesar dan terkecil atribut:

Julat variasi dalam saiz deposit ialah 1000 rubel.

2) Saiz purata sumbangan akan ditentukan menggunakan formula purata aritmetik berwajaran.

Mari kita tentukan nilai diskret atribut dalam setiap selang. Untuk melakukan ini, menggunakan rumus min aritmetik mudah, kita mencari titik tengah selang.

Nilai purata selang pertama ialah:

yang kedua - 500, dsb.

Mari masukkan hasil pengiraan dalam jadual:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Jumlah 400 - 312000

Deposit purata di Sberbank bandar ialah 780 rubel:

3) Purata sisihan linear ialah min aritmetik bagi sisihan mutlak nilai individu bagi suatu ciri daripada purata keseluruhan:

Prosedur untuk mengira sisihan linear purata dalam siri taburan selang adalah seperti berikut:

1. Purata aritmetik berwajaran dikira, seperti yang ditunjukkan dalam perenggan 2).

2. Sisihan mutlak daripada purata ditentukan:

3. Sisihan yang terhasil didarab dengan frekuensi:

4. Cari jumlah sisihan berwajaran tanpa mengambil kira tanda:

5. Jumlah sisihan berwajaran dibahagikan dengan jumlah frekuensi:

Ia adalah mudah untuk menggunakan jadual data pengiraan:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Jumlah 400 - - - 81280

Purata sisihan linear saiz deposit pelanggan Sberbank ialah 203.2 rubel.

4) Serakan ialah min aritmetik bagi sisihan kuasa dua bagi setiap nilai atribut daripada min aritmetik.

Pengiraan varians dalam siri taburan selang dijalankan menggunakan formula:

Prosedur untuk mengira varians dalam kes ini adalah seperti berikut:

1. Tentukan min aritmetik berwajaran, seperti yang ditunjukkan dalam perenggan 2).

2. Cari sisihan daripada purata:

3. Kuadratkan sisihan setiap pilihan daripada purata:

4. Darabkan kuasa dua sisihan dengan pemberat (frekuensi):

5. Jumlahkan produk yang terhasil:

6. Jumlah yang terhasil dibahagikan dengan jumlah pemberat (frekuensi):

Mari letakkan pengiraan dalam jadual:

Jumlah deposit, gosok.Bilangan pendeposit, fTengah selang, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Jumlah 400 - - - 23040000

Program Excel sangat dihargai oleh kedua-dua profesional dan amatur, kerana pengguna dari mana-mana tahap kemahiran boleh bekerja dengannya. Sebagai contoh, sesiapa yang mempunyai kemahiran "komunikasi" minimum dalam Excel boleh melukis graf mudah, membuat plat yang baik, dsb.

Pada masa yang sama, program ini juga membolehkan anda melakukan pelbagai jenis pengiraan, sebagai contoh, pengiraan, tetapi ini memerlukan tahap latihan yang sedikit berbeza. Walau bagaimanapun, jika anda baru mula mengenali program ini dan berminat dengan segala-galanya yang akan membantu anda menjadi pengguna yang lebih maju, artikel ini adalah untuk anda. Hari ini saya akan memberitahu anda apakah formula sisihan piawai dalam Excel, mengapa ia diperlukan sama sekali dan, secara tegasnya, apabila ia digunakan. jom pergi!

Apa itu

Mari kita mulakan dengan teori. Sisihan piawai biasanya dipanggil punca kuasa dua yang diperoleh daripada min aritmetik semua perbezaan kuasa dua antara nilai yang ada, serta min aritmetiknya.

Dengan cara ini, nilai ini biasanya dipanggil huruf Yunani "sigma". Sisihan piawai dikira menggunakan formula STANDARDEVAL dengan sewajarnya, program melakukan ini untuk pengguna itu sendiri.

Intipati konsep ini adalah untuk mengenal pasti tahap kebolehubahan sesuatu instrumen, iaitu, dengan cara tersendiri, penunjuk yang diperoleh daripada statistik deskriptif. Ia mengenal pasti perubahan dalam turun naik instrumen dalam sebarang tempoh masa. Rumus STDEV boleh digunakan untuk menganggar sisihan piawai sampel, mengabaikan nilai Boolean dan teks.

Formula

Formula yang disediakan secara automatik dalam Excel membantu mengira sisihan piawai dalam Excel. Untuk mencarinya, anda perlu mencari bahagian formula dalam Excel, dan kemudian pilih yang dipanggil STANDARDEVAL, jadi ia sangat mudah.

Tidak dinafikan, formula dan pengiraan matematik adalah isu yang agak rumit, dan tidak semua pengguna dapat mengatasinya dengan segera. Namun, jika anda mendalami sedikit dan melihat isu tersebut dengan lebih terperinci, ternyata tidak semuanya begitu menyedihkan. Saya harap anda yakin dengan ini menggunakan contoh pengiraan sisihan piawai.

Video untuk membantu

Perlu diingat bahawa pengiraan varians ini mempunyai kelemahan - ternyata berat sebelah, i.e. jangkaan matematiknya tidak sama dengan nilai sebenar varians. Baca lebih lanjut tentang ini. Pada masa yang sama, tidak semuanya begitu buruk. Apabila saiz sampel bertambah, ia masih mendekati analog teorinya, i.e. adalah tidak berat sebelah secara asymptotically. Oleh itu, apabila bekerja dengan saiz sampel yang besar, anda boleh menggunakan formula di atas.

Ia berguna untuk menterjemah bahasa tanda ke dalam bahasa perkataan. Ternyata varians ialah purata kuasa dua sisihan. Iaitu, nilai purata pertama dikira, kemudian perbezaan antara setiap nilai asal dan purata diambil, kuasa dua, ditambah, dan kemudian dibahagikan dengan bilangan nilai dalam populasi. Perbezaan antara nilai individu dan purata mencerminkan ukuran sisihan. Ia adalah kuasa dua supaya semua sisihan menjadi nombor positif secara eksklusif dan untuk mengelakkan pemusnahan bersama sisihan positif dan negatif apabila menjumlahkan mereka. Kemudian, memandangkan sisihan kuasa dua, kita hanya mengira min aritmetik. Purata - segi empat sama - sisihan. Sisihan adalah kuasa dua dan purata dikira. Penyelesaiannya terletak hanya dalam tiga perkataan.

Walau bagaimanapun, dalam bentuk tulennya, seperti min aritmetik, atau indeks, serakan tidak digunakan. Ia adalah penunjuk tambahan dan perantaraan yang diperlukan untuk jenis analisis statistik yang lain. Ia tidak mempunyai unit ukuran biasa. Berdasarkan formula, ini ialah kuasa dua unit ukuran data asal. Tanpa botol, seperti yang mereka katakan, anda tidak boleh memikirkannya.

(modul 111)

Untuk mengembalikan varians kepada realiti, iaitu, untuk menggunakannya untuk tujuan yang lebih biasa, punca kuasa dua diekstrak daripadanya. Ternyata apa yang dipanggil sisihan piawai (RMS). Terdapat nama "sisihan piawai" atau "sigma" (dari nama huruf Yunani). Formula sisihan piawai ialah:

Untuk mendapatkan penunjuk ini untuk sampel, gunakan formula:

Seperti varians, terdapat pilihan pengiraan yang sedikit berbeza. Tetapi apabila sampel bertambah, perbezaannya hilang.

Sisihan piawai, jelas, juga mencirikan ukuran penyebaran data, tetapi sekarang (tidak seperti penyebaran) ia boleh dibandingkan dengan data asal, kerana ia mempunyai unit ukuran yang sama (ini jelas daripada formula pengiraan). Tetapi penunjuk ini dalam bentuk tulennya tidak begitu bermaklumat, kerana ia mengandungi terlalu banyak pengiraan perantaraan yang mengelirukan (sisihan, kuasa dua, jumlah, purata, punca). Walau bagaimanapun, sudah mungkin untuk bekerja secara langsung dengan sisihan piawai, kerana sifat penunjuk ini dikaji dan diketahui dengan baik. Sebagai contoh, ada ini peraturan tiga sigma, yang menyatakan bahawa data mempunyai 997 nilai daripada 1000 dalam ±3 sigma min aritmetik. Sisihan piawai, sebagai ukuran ketidakpastian, juga terlibat dalam banyak pengiraan statistik. Dengan bantuannya, tahap ketepatan pelbagai anggaran dan ramalan ditentukan. Jika variasi adalah sangat besar, maka sisihan piawai juga akan menjadi besar, dan oleh itu ramalan akan menjadi tidak tepat, yang akan dinyatakan, sebagai contoh, dalam selang keyakinan yang sangat luas.

Pekali variasi

Sisihan piawai memberikan anggaran mutlak ukuran serakan. Oleh itu, untuk memahami betapa besar taburan adalah relatif kepada nilai itu sendiri (iaitu, tanpa mengira skalanya), penunjuk relatif diperlukan. Penunjuk ini dipanggil pekali variasi dan dikira menggunakan formula berikut:

Pekali variasi diukur sebagai peratusan (jika didarab dengan 100%). Menggunakan penunjuk ini, anda boleh membandingkan pelbagai fenomena, tanpa mengira skala dan unit ukurannya. Fakta inilah yang menjadikan pekali variasi begitu popular.

Dalam statistik, diterima bahawa jika nilai pekali variasi kurang daripada 33%, maka populasi dianggap homogen jika lebih daripada 33%, maka ia adalah heterogen. Sukar untuk saya mengulas apa-apa di sini. Saya tidak tahu siapa yang mentakrifkan ini dan mengapa, tetapi ia dianggap sebagai aksiom.

Saya rasa saya terbawa-bawa dengan teori kering dan perlu membawa sesuatu yang visual dan kiasan. Sebaliknya, semua penunjuk variasi menerangkan lebih kurang perkara yang sama, cuma ia dikira secara berbeza. Oleh itu, sukar untuk menunjukkan pelbagai contoh Hanya nilai penunjuk boleh berbeza, tetapi bukan intipatinya. Jadi mari kita bandingkan bagaimana nilai penunjuk variasi berbeza berbeza untuk set data yang sama. Mari kita ambil contoh pengiraan sisihan linear purata (daripada ). Berikut adalah data sumber:

Dan jadual untuk mengingatkan anda.

Menggunakan data ini, kami mengira pelbagai penunjuk variasi.

Nilai purata ialah min aritmetik biasa.

Julat variasi ialah perbezaan antara maksimum dan minimum:

Purata sisihan linear dikira menggunakan formula:

Sisihan Piawai:

Mari kita ringkaskan pengiraan dalam jadual.

Seperti yang dapat dilihat, min linear dan sisihan piawai memberikan nilai yang sama untuk tahap variasi data. Varians adalah kuasa dua sigma, jadi ia akan sentiasa menjadi nombor yang agak besar, yang, sebenarnya, tidak bermakna apa-apa. Julat variasi ialah perbezaan antara nilai ekstrem dan boleh bercakap jumlah.

Mari kita ringkaskan beberapa keputusan.

Variasi penunjuk mencerminkan kebolehubahan proses atau fenomena. Darjahnya boleh diukur menggunakan beberapa penunjuk.

1. Julat variasi - perbezaan antara maksimum dan minimum. Mencerminkan julat nilai yang mungkin.
2. Purata sisihan linear – mencerminkan purata sisihan mutlak (modulo) semua nilai populasi yang dianalisis daripada nilai puratanya.
3. Serakan - purata kuasa dua sisihan.
4. Sisihan piawai ialah punca serakan (min kuasa dua sisihan).
5. Pekali variasi ialah penunjuk paling universal, mencerminkan tahap taburan nilai, tanpa mengira skala dan unit ukurannya. Pekali variasi diukur sebagai peratusan dan boleh digunakan untuk membandingkan variasi proses dan fenomena yang berbeza.

Oleh itu, dalam analisis statistik terdapat sistem penunjuk yang mencerminkan kehomogenan fenomena dan kestabilan proses. Selalunya, penunjuk variasi tidak mempunyai makna bebas dan digunakan untuk analisis data lanjut (pengiraan selang keyakinan

Menjalankan sebarang analisis statistik adalah tidak dapat difikirkan tanpa pengiraan. Dalam artikel ini kita akan melihat cara mengira varians, sisihan piawai, pekali variasi dan penunjuk statistik lain dalam Excel.

Nilai maksimum dan minimum

Sisihan linear purata

Purata sisihan linear ialah purata sisihan mutlak (modulo) daripada dalam set data yang dianalisis. Formula matematiknya ialah:

a– sisihan linear purata,

X– penunjuk yang dianalisis,

Xᅳ– nilai purata penunjuk,

n

Dalam Excel fungsi ini dipanggil SROTCL.

Selepas memilih fungsi SROTCL, kami menunjukkan julat data di mana pengiraan harus berlaku. Klik "OK".

Penyerakan

(modul 111)

Mungkin tidak semua orang tahu apa , jadi saya akan terangkan, ini adalah ukuran yang mencirikan penyebaran data di sekitar jangkaan matematik. Walau bagaimanapun, biasanya hanya sampel yang tersedia, jadi formula varians berikut digunakan:

s 2– varians sampel dikira daripada data pemerhatian,

X- nilai individu,

Xᅳ– min aritmetik bagi sampel,

n– bilangan nilai dalam set data yang dianalisis.

Fungsi Excel yang sepadan ialah DISP.G. Apabila menganalisis sampel yang agak kecil (sehingga kira-kira 30 pemerhatian), anda harus menggunakan , yang dikira menggunakan formula berikut.

Perbezaan, seperti yang anda lihat, hanya dalam penyebut. Excel mempunyai fungsi untuk mengira varians tidak berat sebelah sampel DISP.B.

Pilih pilihan yang dikehendaki (umum atau selektif), nyatakan julat, dan klik butang "OK". Nilai yang terhasil mungkin sangat besar disebabkan oleh kuasa dua awal sisihan. Penyerakan dalam statistik adalah penunjuk yang sangat penting, tetapi ia biasanya digunakan bukan dalam bentuk tulen, tetapi untuk pengiraan selanjutnya.

Sisihan piawai

Sisihan piawai (RMS) ialah punca varians. Penunjuk ini juga dipanggil sisihan piawai dan dikira menggunakan formula:

oleh penduduk umum

mengikut sampel

Anda hanya boleh mengambil punca varians, tetapi Excel mempunyai fungsi sedia untuk sisihan piawai: STDEV.G Dan STDEV.V(untuk populasi umum dan sampel, masing-masing).

Sisihan piawai dan piawai, saya ulangi, adalah sinonim.

Seterusnya, seperti biasa, nyatakan julat yang dikehendaki dan klik pada "OK". Sisihan piawai mempunyai unit ukuran yang sama seperti penunjuk yang dianalisis, dan oleh itu adalah setanding dengan data asal. Lebih lanjut mengenai perkara ini di bawah.

Pekali variasi

Semua penunjuk yang dibincangkan di atas terikat pada skala data sumber dan tidak membenarkan seseorang memperoleh idea kiasan tentang variasi populasi yang dianalisis. Untuk mendapatkan ukuran relatif penyebaran data, gunakan pekali variasi, yang dikira dengan membahagi sisihan piawai pada min aritmetik. Formula untuk pekali variasi adalah mudah:

Tiada fungsi sedia untuk mengira pekali variasi dalam Excel, yang bukan masalah besar. Pengiraan boleh dibuat dengan hanya membahagikan sisihan piawai dengan min. Untuk melakukan ini, tulis dalam bar formula:

STANDARDEV.G()/PURATA()

Julat data ditunjukkan dalam kurungan. Jika perlu, gunakan sisihan piawai sampel (STDEV.V).

Pekali variasi biasanya dinyatakan sebagai peratusan, jadi anda boleh membingkai sel dengan formula dalam format peratusan. Butang yang diperlukan terletak pada reben pada tab "Rumah":

Anda juga boleh menukar format dengan memilih daripada menu konteks selepas menyerlahkan sel yang dikehendaki dan klik kanan.

Pekali variasi, tidak seperti penunjuk lain bagi serakan nilai, digunakan sebagai penunjuk bebas dan sangat bermaklumat bagi variasi data. Dalam statistik, secara umum diterima bahawa jika pekali variasi kurang daripada 33%, maka set data adalah homogen, jika lebih daripada 33%, maka ia adalah heterogen. Maklumat ini boleh berguna untuk pencirian awal data dan untuk mengenal pasti peluang untuk analisis lanjut. Di samping itu, pekali variasi, diukur sebagai peratusan, membolehkan anda membandingkan tahap serakan data yang berbeza, tanpa mengira skala dan unit ukurannya. Harta yang berguna.

Pekali ayunan

Satu lagi penunjuk penyebaran data hari ini ialah pekali ayunan. Ini ialah nisbah julat variasi (perbezaan antara nilai maksimum dan minimum) kepada purata. Tiada formula Excel sedia dibuat, jadi anda perlu menggabungkan tiga fungsi: MAX, MIN, AVERAGE.

Pekali ayunan menunjukkan tahap variasi relatif kepada min, yang juga boleh digunakan untuk membandingkan set data yang berbeza.

Secara umum, menggunakan Excel, banyak penunjuk statistik dikira dengan sangat mudah. Jika ada yang tidak jelas, anda sentiasa boleh menggunakan kotak carian dalam sisipan fungsi. Nah, Google sedia membantu.

Salah satu alat utama analisis statistik ialah pengiraan sisihan piawai. Penunjuk ini membolehkan anda menganggar sisihan piawai untuk sampel atau untuk populasi. Mari belajar cara menggunakan formula sisihan piawai dalam Excel.

Mari kita tentukan dengan segera apa sisihan piawai dan rupa formulanya. Kuantiti ini ialah punca kuasa dua bagi min aritmetik bagi kuasa dua perbezaan antara semua kuantiti dalam siri dan min aritmetiknya. Terdapat nama yang sama untuk penunjuk ini - sisihan piawai. Kedua-dua nama adalah setara sepenuhnya.

Tetapi, secara semula jadi, dalam Excel pengguna tidak perlu mengira ini, kerana program melakukan segala-galanya untuknya. Mari belajar cara mengira sisihan piawai dalam Excel.

Pengiraan dalam Excel

Anda boleh mengira nilai yang ditentukan dalam Excel menggunakan dua fungsi khas STDEV.V(berdasarkan populasi sampel) dan STDEV.G(berdasarkan populasi umum). Prinsip operasi mereka sama sekali, tetapi mereka boleh dipanggil dalam tiga cara, yang akan kita bincangkan di bawah.

Kaedah 1: Wizard Fungsi


Kaedah 2: Tab Formula


Kaedah 3: Memasukkan formula secara manual

Terdapat juga cara di mana anda tidak perlu memanggil tetingkap argumen sama sekali. Untuk melakukan ini, anda mesti memasukkan formula secara manual.


Seperti yang anda lihat, mekanisme untuk mengira sisihan piawai dalam Excel adalah sangat mudah. Pengguna hanya perlu memasukkan nombor daripada populasi atau rujukan kepada sel yang mengandunginya. Semua pengiraan dilakukan oleh program itu sendiri. Adalah lebih sukar untuk memahami apakah penunjuk yang dikira dan bagaimana keputusan pengiraan boleh digunakan dalam amalan. Tetapi memahami perkara ini lebih berkaitan dengan bidang statistik daripada belajar bekerja dengan perisian.