ประชากรทางสถิติเป็นแบบทั่วไปและกลุ่มตัวอย่าง ประชากรและกลุ่มตัวอย่าง

การกระจาย ตัวแปรสุ่มมีข้อมูลทั้งหมดเกี่ยวกับคุณสมบัติทางสถิติ คุณจำเป็นต้องรู้ค่าของตัวแปรสุ่มกี่ค่าเพื่อสร้างการกระจายตัวของมัน? เมื่อต้องการทำเช่นนี้ คุณต้องสำรวจมัน ประชากรทั่วไป.

ประชากรคือชุดของค่าทั้งหมดที่ตัวแปรสุ่มที่กำหนดสามารถรับได้

จำนวนหน่วยใน ประชากรเรียกว่าปริมาตรของมัน เอ็น- ค่านี้สามารถมีขอบเขตหรือไม่มีที่สิ้นสุด ตัวอย่างเช่น หากศึกษาการเติบโตของผู้อยู่อาศัยในเมืองใดเมืองหนึ่ง ขนาดของประชากรก็จะเป็น เท่ากับจำนวนชาวเมือง ถ้ามี การทดลองทางกายภาพแล้วปริมาตรของประชากรทั่วไปจะไม่มีที่สิ้นสุดเพราะว่า จำนวนทั้งหมด ค่าที่เป็นไปได้ใดๆ พารามิเตอร์ทางกายภาพเท่ากับอนันต์

การศึกษาประชากรทั่วไปอาจไม่สามารถทำได้หรือแนะนำให้เลือกเสมอไป เป็นไปไม่ได้ถ้าจำนวนประชากรมีไม่จำกัด แต่ถึงแม้จะมีปริมาณจำกัดก็ตาม การวิจัยเต็มรูปแบบไม่ได้เป็นสิ่งที่สมเหตุสมผลเสมอไป เพราะมันจำเป็น ต้นทุนสูงเวลาและแรงงานและ ความแม่นยำแน่นอนมักจะไม่ต้องการผลลัพธ์ ผลลัพธ์ที่แม่นยำน้อยลง แต่ใช้ความพยายามและเงินน้อยลงอย่างมาก สามารถได้รับโดยการศึกษาเพียงส่วนหนึ่งของประชากรทั่วไป การศึกษาดังกล่าวเรียกว่าการสุ่มตัวอย่าง

การศึกษาทางสถิติที่ดำเนินการเฉพาะบางส่วนของประชากรเรียกว่าการสุ่มตัวอย่าง และส่วนหนึ่งของประชากรที่กำลังศึกษาเรียกว่าตัวอย่าง

รูปที่ 7.2 แสดงประชากรและตัวอย่างเป็นเซตและเซตย่อยในเชิงสัญลักษณ์

รูปที่ 7.2 ประชากรและกลุ่มตัวอย่าง

เมื่อทำงานกับกลุ่มย่อยบางส่วนของประชากรที่กำหนด ซึ่งมักจะเป็นส่วนที่ไม่มีนัยสำคัญ เราได้รับผลลัพธ์ที่ค่อนข้างน่าพอใจในด้านความแม่นยำสำหรับวัตถุประสงค์ในทางปฏิบัติ การศึกษาประชากรส่วนใหญ่จะเพิ่มความแม่นยำเท่านั้น แต่จะไม่เปลี่ยนสาระสำคัญของผลลัพธ์ หากเก็บตัวอย่างอย่างถูกต้องจากมุมมองทางสถิติ

เพื่อให้ตัวอย่างสะท้อนคุณสมบัติของประชากรและผลลัพธ์มีความน่าเชื่อถือ จะต้องเป็นเช่นนั้น ตัวแทน(ตัวแทน).

สำหรับประชากรทั่วไปบางส่วน ส่วนใดส่วนหนึ่งเป็นตัวแทนเนื่องจากธรรมชาติของพวกมัน อย่างไรก็ตาม ในกรณีส่วนใหญ่ ต้องใช้มาตรการพิเศษเพื่อให้แน่ใจว่าตัวอย่างที่เป็นตัวแทน

หนึ่งหนึ่งในความสำเร็จที่สำคัญของสมัยใหม่ สถิติทางคณิตศาสตร์ถือเป็นการพัฒนาทฤษฎีและการปฏิบัติของวิธีการสุ่มตัวอย่างเพื่อให้มั่นใจถึงความเป็นตัวแทนของการเลือกข้อมูล

การศึกษาตัวอย่างมักจะมีความแม่นยำน้อยกว่าการศึกษาในประชากรทั้งหมดเสมอ อย่างไรก็ตาม เรื่องนี้สามารถกระทบยอดได้หากทราบขนาดของข้อผิดพลาด แน่นอนว่า ยิ่งขนาดตัวอย่างใกล้เคียงกับขนาดประชากรมากเท่าไร ข้อผิดพลาดก็จะยิ่งน้อยลงเท่านั้น เป็นที่ชัดเจนว่าปัญหาของการอนุมานทางสถิติมีความเกี่ยวข้องโดยเฉพาะเมื่อทำงานกับตัวอย่างขนาดเล็ก ( เอ็น ? 10-50).

ประชากร - กลุ่มคนที่นักสังคมวิทยาพยายามรับข้อมูลในการวิจัยของเขา ประชากรก็จะกว้างพอๆ กัน ขึ้นอยู่กับว่าหัวข้อวิจัยกว้างแค่ไหน

ประชากรตัวอย่าง – รูปแบบประชากรที่ลดลง; บรรดาผู้ที่นักสังคมวิทยาแจกจ่ายแบบสอบถามให้ซึ่งเรียกว่าผู้ตอบแบบสอบถามซึ่งท้ายที่สุดแล้วก็เป็นเป้าหมายของการวิจัยทางสังคมวิทยา

ผู้ที่รวมอยู่ในประชากรทั่วไปจะถูกกำหนดโดยวัตถุประสงค์ของการศึกษา และผู้ที่รวมอยู่ในประชากรตัวอย่างจะถูกตัดสินใจ วิธีการทางคณิตศาสตร์- หากนักสังคมวิทยาตั้งใจที่จะมองสงครามอัฟกานิสถานผ่านสายตาของผู้เข้าร่วม ประชากรทั่วไปจะรวมถึงทหารอัฟกานิสถานทั้งหมด แต่เขาจะต้องสัมภาษณ์ส่วนเล็กๆ นั่นคือประชากรตัวอย่าง เพื่อให้กลุ่มตัวอย่างสะท้อนถึงประชากรทั่วไปได้อย่างถูกต้อง นักสังคมวิทยาจึงปฏิบัติตามกฎ: ทหารอัฟกานิสถานคนใดก็ตาม โดยไม่คำนึงถึงที่อยู่อาศัย สถานที่ทำงาน สถานะสุขภาพ และสถานการณ์อื่น ๆ จะต้องมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง ประชากร.

เมื่อนักสังคมวิทยาได้ตัดสินใจว่าใครที่เขาต้องการสัมภาษณ์ เขาก็เป็นผู้กำหนด กรอบตัวอย่าง- จากนั้นจึงตัดสินใจเลือกประเภทของการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสามกลุ่มใหญ่:

ก) แข็ง(สำมะโน, การลงประชามติ). มีการสำรวจทุกหน่วยจากประชากร

ข) สุ่ม;

วี) ไม่สุ่ม

การสุ่มตัวอย่างแบบสุ่มและแบบไม่สุ่มจะแบ่งออกเป็นหลายประเภท

สุ่มได้แก่:

1) ความน่าจะเป็น;

2) เป็นระบบ;

3) แบ่งเขต (แบ่งชั้น);

4) การทำรัง

สิ่งที่ไม่สุ่มได้แก่:

1) "เกิดขึ้นเอง";

2) โควต้า;

3) วิธีการ "อาร์เรย์หลัก"

รายการหน่วยที่สมบูรณ์และถูกต้องในรูปแบบประชากรตัวอย่าง กรอบตัวอย่าง . องค์ประกอบที่มีไว้สำหรับการเลือกเรียกว่า หน่วยคัดเลือก - หน่วยเก็บตัวอย่างอาจจะเหมือนกับหน่วยสังเกตเพราะว่า หน่วยสังเกตการณ์ ถือเป็นองค์ประกอบของประชากรทั่วไปที่รวบรวมข้อมูลโดยตรง โดยทั่วไปหน่วยของการสังเกตคือปัจเจกบุคคล การเลือกจากรายการทำได้ดีที่สุดโดยการกำหนดหมายเลขหน่วยและใช้ตารางตัวเลขสุ่ม แม้ว่ามักใช้วิธีสุ่มเสมือนก็ตาม เมื่อองค์ประกอบที่ n ทุกตัวนำมาจากรายการแบบง่าย

หากกรอบการสุ่มตัวอย่างมีรายการหน่วยการสุ่มตัวอย่าง โครงสร้างการสุ่มตัวอย่างจะหมายถึงการจัดกลุ่มตามคุณลักษณะที่สำคัญบางประการ เช่น การกระจายตัวของบุคคลตามอาชีพ คุณสมบัติ เพศ หรืออายุ ตัวอย่างเช่น หากในประชากรทั่วไป มีคนหนุ่มสาว 30% วัยกลางคน 50% และผู้สูงอายุ 20% ดังนั้นจะต้องสังเกตสัดส่วนร้อยละที่เท่ากันของทั้งสามวัยในประชากรตัวอย่าง คุณสามารถเพิ่มชั้นเรียน เพศ สัญชาติ ฯลฯ ลงในอายุได้ สำหรับแต่ละสัดส่วน เปอร์เซ็นต์จะถูกกำหนดขึ้นในประชากรทั่วไปและประชากรตัวอย่าง ดังนั้น, กรอบตัวอย่าง – สัดส่วนเปอร์เซ็นต์ของคุณลักษณะของวัตถุ โดยขึ้นอยู่กับการรวบรวมประชากรตัวอย่าง

หากประเภทตัวอย่างบอกเราว่าผู้คนเข้ามาในกลุ่มตัวอย่างได้อย่างไร ขนาดตัวอย่างจะบอกเราว่ามีกี่คนเข้ามาในกลุ่มตัวอย่าง

ขนาดตัวอย่าง – จำนวนหน่วยในประชากรตัวอย่าง เนื่องจากประชากรตัวอย่างเป็นส่วนหนึ่งของประชากรทั่วไปที่เลือกโดยใช้วิธีพิเศษ ปริมาตรจึงน้อยกว่าปริมาตรของประชากรทั่วไปเสมอ ดังนั้นจึงเป็นเรื่องสำคัญมากที่ส่วนนั้นจะต้องไม่บิดเบือนความคิดโดยรวมนั่นคือมันเป็นตัวแทนของมัน

ความน่าเชื่อถือของข้อมูลไม่ได้รับอิทธิพลจากลักษณะเชิงปริมาณของประชากรตัวอย่าง (ปริมาตร) แต่ขึ้นอยู่กับลักษณะเชิงคุณภาพของประชากรทั่วไป - ระดับความเป็นเนื้อเดียวกัน เรียกว่าความแตกต่างระหว่างประชากรทั่วไปและประชากรตัวอย่าง ข้อผิดพลาดในการเป็นตัวแทน , ค่าเบี่ยงเบนที่อนุญาต – 5%

ต่อไปนี้เป็นวิธีหลีกเลี่ยงข้อผิดพลาด:

แต่ละหน่วยในประชากรจะต้องมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในกลุ่มตัวอย่าง

ขอแนะนำให้เลือกจากประชากรที่เป็นเนื้อเดียวกัน

คุณจำเป็นต้องรู้ลักษณะของประชากร

เมื่อรวบรวมประชากรตัวอย่าง จะต้องคำนึงถึงข้อผิดพลาดแบบสุ่มและเป็นระบบด้วย

หากวาดประชากรตัวอย่าง (ตัวอย่าง) อย่างถูกต้องนักสังคมวิทยาจะได้ผลลัพธ์ที่เชื่อถือได้ซึ่งเป็นลักษณะของประชากรทั้งหมด

หลักๆมีอะไรบ้าง วิธีการสุ่มตัวอย่าง?

วิธีการสุ่มตัวอย่างทางกลเมื่อจาก รายการทั่วไปของประชากรทั่วไป จำนวนผู้ตอบแบบสอบถามที่ต้องการจะถูกเลือกเป็นระยะๆ (เช่น ทุกๆ 10)

วิธีการสุ่มตัวอย่างแบบอนุกรม- ในกรณีนี้ ประชากรทั่วไปจะถูกแบ่งออกเป็นส่วนที่เป็นเนื้อเดียวกันและหน่วยการวิเคราะห์จะถูกเลือกตามสัดส่วนจากแต่ละส่วน (เช่น 20% ของชายและหญิงในสถานประกอบการ)

วิธีการสุ่มตัวอย่างแบบคลัสเตอร์- หน่วยการคัดเลือกไม่ใช่ผู้ตอบแบบสำรวจรายบุคคล แต่เป็นกลุ่มที่มีการวิจัยอย่างต่อเนื่องในภายหลัง ตัวอย่างนี้จะเป็นตัวแทนหากองค์ประกอบของกลุ่มมีความคล้ายคลึงกัน (เช่น กลุ่มนักศึกษาหนึ่งกลุ่มจากแต่ละสายงานของแผนกมหาวิทยาลัย)

วิธีอาร์เรย์หลัก– การสำรวจ 60–70% ของประชากรทั่วไป

วิธีการสุ่มตัวอย่างโควต้า- ที่สุด วิธีการที่ซับซ้อนโดยต้องมีการกำหนดลักษณะอย่างน้อยสี่ประการในการเลือกผู้ตอบแบบสอบถาม มักใช้กับประชากรจำนวนมาก

ชุดของวัตถุที่เลือกไว้ซึ่งอาจมีความแตกต่างกันในมูลค่าของลักษณะเฉพาะบางอย่างเรียกว่าประชากรทั่วไป

จำนวนองค์ประกอบในประชากรเรียกว่าปริมาตร

ส่วนหนึ่งของประชากร สุ่มที่เลือกไว้เพื่อการสังเกต เรียกว่า การสุ่มตัวอย่าง หรือเรียกสั้นๆ ว่าตัวอย่าง

จำนวนองค์ประกอบตัวอย่างเรียกว่าขนาดของมัน

ดังนั้น หากยาบางชนิด (ประชากรทั่วไป) มีการเลือกบรรจุภัณฑ์ (ตัวอย่าง) หนึ่งร้อยบรรจุภัณฑ์เพื่อการควบคุมคุณภาพ ปริมาณของประชากรคือ 100,000 และขนาดตัวอย่างคือ 100

คุณสมบัติของประชากรตัวอย่างจะสะท้อนถึงคุณสมบัติที่สอดคล้องกันของประชากรทั่วไปได้ดีขึ้น ยิ่งวัตถุในประชากรตัวอย่างนี้มีมากขึ้น (นั่นคือ ยิ่งปริมาตรมากขึ้น) ตัวอย่างเช่น หากเราสนใจความเข้มข้นของสารบางชนิดในแท็บเล็ตที่ผลิตโดยใช้อุปกรณ์ที่มีการออกแบบบางอย่าง ยิ่งเราตรวจสอบแท็บเล็ตที่ได้รับการสุ่มเลือกมากเท่าไร ข้อมูลที่เชื่อถือได้เราจะได้รับมัน

เนื่องจากเราจะนับด้วย วิธีการทางสถิติทำการตัดสินบางประการเกี่ยวกับคุณสมบัติของประชากรทั่วไปโดยพิจารณาจากคุณสมบัติของตัวอย่างจากนั้นจะต้องเป็นตัวแทนเช่น ควรจัดในลักษณะที่จะสะท้อนถึงคุณสมบัติทั้งหมดของประชากรทั่วไปที่เราสนใจหากเป็นไปได้

เช่น เมื่อตรวจสอบความก้าวหน้าของนักศึกษาในด้านสรีรวิทยา มหาวิทยาลัยการแพทย์ A, B และ C จำนวนนักศึกษา 500, 200 และ 300 คน ตามลำดับ ควรสุ่มขนาดกลุ่มตัวอย่างจำนวน 100 คน โดยสุ่มเลือกนักศึกษาจากมหาวิทยาลัย A จำนวน 50 คน นักศึกษาจากมหาวิทยาลัย B จำนวน 20 คน และนักศึกษาจากมหาวิทยาลัย C จำนวน 30 คน โดยสัดส่วนในกลุ่มตัวอย่าง ควรสอดคล้องกับสัดส่วนของประชากรทั่วไป

เพื่อให้มั่นใจถึงความเป็นตัวแทน กลุ่มตัวอย่างต้องมีขนาดใหญ่พอที่จะครอบคลุมประชากรทั้งหมด และดำเนินการอย่างเป็นกลางโดยสัมพันธ์กับแต่ละส่วน
การสุ่มตัวอย่างซ้ำคือตัวอย่างที่วัตถุที่เลือก (ก่อนที่จะเลือกรายการถัดไป) จะถูกส่งกลับไปยังประชากร การสุ่มตัวอย่างแบบไม่ทำซ้ำคือตัวอย่างที่วัตถุที่เลือกไม่ได้ถูกส่งกลับไปยังประชากร ในทางปฏิบัติ มักใช้การสุ่มตัวอย่างแบบไม่ทำซ้ำ

ในทางปฏิบัติจะใช้ วิธีต่างๆการเลือก วิธีการบังคับแบ่งได้เป็น 2 ประเภท คือ
I. การคัดเลือกที่ไม่ต้องแบ่งประชากรทั่วไปออกเป็นส่วนๆ ได้แก่
ก) การเลือกแบบสุ่มโดยไม่ซ้ำกันอย่างง่าย
b) การเลือกสุ่มซ้ำอย่างง่าย
ครั้งที่สอง การคัดเลือกโดยแบ่งประชากรออกเป็นส่วนๆ ได้แก่
ก) การเลือกโดยทั่วไป
b) การเลือกทางกล
c) การเลือกอนุกรม

การเลือกแบบสุ่มอย่างง่ายคือการเลือกโดยเลือกวัตถุทีละรายการจากประชากรทั้งหมด หากการ์ดที่ถูกถอดออกไม่ถูกส่งกลับไปยังซอง การเลือกจะเป็นการสุ่มแบบธรรมดาโดยไม่มีการทำซ้ำ

การเลือกโดยทั่วไปเรียกว่าการเลือกซึ่งวัตถุจะถูกเลือกไม่ใช่จากประชากรทั้งหมด แต่จากแต่ละส่วนที่ "ทั่วไป"

การเลือกทางกลเรียกว่าการเลือก โดยที่ประชากรจะถูกแบ่งออกเป็น "ทางกลไก" ออกเป็นหลายกลุ่มตามจำนวนวัตถุที่จะรวมไว้ในตัวอย่าง และเลือกหนึ่งวัตถุจากแต่ละกลุ่ม
การเลือกแบบอนุกรมคือการเลือกที่วัตถุจะถูกเลือกจากประชากรทั่วไปไม่ใช่ทีละรายการ แต่เป็น "อนุกรม" ที่ต้องได้รับการตรวจสอบอย่างต่อเนื่อง

ประชากร– ชุดขององค์ประกอบที่ตอบสนองบางอย่าง เงื่อนไขที่กำหนด- เรียกอีกอย่างว่าประชากรที่ศึกษา ประชากรทั่วไป (จักรวาล) - ชุดวัตถุ (วิชา) ทั้งชุดของการวิจัยซึ่งมีการเลือกวัตถุ (วิชา) (สามารถเลือกได้) สำหรับการสำรวจ (แบบสำรวจ)

ตัวอย่างหรือ ประชากรตัวอย่าง(ตัวอย่าง) คือชุดของวัตถุ (วิชา) ที่เลือกมาเป็นพิเศษเพื่อทำการสำรวจ (สำรวจ) ข้อมูลใดๆ ที่ได้รับจากการสำรวจตัวอย่าง (แบบสำรวจ) มีความน่าจะเป็นโดยธรรมชาติ ในทางปฏิบัตินี่หมายความว่าการศึกษาไม่ได้กำหนด ความหมายเฉพาะและช่วงเวลาที่ค่าที่กำหนดอยู่

ลักษณะตัวอย่าง:

ลักษณะเชิงคุณภาพของตัวอย่าง - สิ่งที่เราเลือกอย่างแน่นอนและวิธีการสุ่มตัวอย่างที่เราใช้สำหรับสิ่งนี้

ลักษณะเชิงปริมาณตัวอย่าง - เราเลือกจำนวนกรณีหรืออีกนัยหนึ่งคือขนาดตัวอย่าง

ความต้องการในการสุ่มตัวอย่าง:

วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก เช่น ผู้บริโภคสินค้า บริษัทระดับโลก– ตลาดที่กระจัดกระจายทางภูมิศาสตร์จำนวนมาก

มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญคือการพึ่งพากัน หากสามารถสร้างคู่โฮโมมอร์ฟิกได้ (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และความสัมพันธ์พื้นฐานนี้มีความสำคัญสำหรับลักษณะที่จะวัด ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่า ขึ้นอยู่กับ.

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างตัวอย่าง จะมีการพิจารณาตัวอย่างเหล่านี้ เป็นอิสระ.

ประเภทของการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

ความน่าจะเป็น;

ไม่น่าจะเป็น;

ตัวอย่างตัวแทน- ประชากรตัวอย่างที่มีลักษณะหลักตรงกับลักษณะของประชากรทั่วไป เฉพาะตัวอย่างประเภทนี้เท่านั้นที่สามารถขยายผลการสำรวจบางหน่วย (วัตถุ) ไปยังประชากรทั้งหมดได้ ข้อกำหนดเบื้องต้นที่จะสร้าง ตัวอย่างตัวแทน- ความพร้อมของข้อมูลเกี่ยวกับประชากรทั่วไป เช่น หรือ รายการทั้งหมดหน่วย (วิชา) ของประชากรทั่วไปหรือข้อมูลเกี่ยวกับโครงสร้างตามลักษณะที่มีอิทธิพลต่อทัศนคติต่อเรื่องวิจัยอย่างมีนัยสำคัญ

17. ไม่ต่อเนื่อง ซีรีย์การเปลี่ยนแปลง, การจัดอันดับ, ความถี่, ความเฉพาะเจาะจง

ซีรี่ส์รูปแบบต่างๆ (ปิดทางสถิติ) – คือลำดับของตัวเลือกที่เขียนโดยเรียงลำดับจากน้อยไปหามากและน้ำหนักที่สอดคล้องกัน

ซีรีย์รูปแบบสามารถ ไม่ต่อเนื่อง(การสุ่มตัวอย่างค่าของตัวแปรสุ่มแบบต่อเนื่อง) และแบบต่อเนื่อง (ช่วง) (การสุ่มตัวอย่างค่าของตัวแปรสุ่มแบบต่อเนื่อง)

ซีรี่ส์รูปแบบที่ไม่ต่อเนื่องมีรูปแบบ:

ค่าที่สังเกตได้ของตัวแปรสุ่ม x1, x2, ..., xk เรียกว่า ตัวเลือกและเรียกว่าการเปลี่ยนแปลงค่าเหล่านี้ ตามรูปแบบ

ตัวอย่าง(ตัวอย่าง) – ชุดของการสังเกตที่เลือกโดยการสุ่มจากประชากร

จำนวนการสังเกตในประชากรหนึ่งๆ เรียกว่าปริมาตร

เอ็น– ปริมาณประชากรทั่วไป

n– ขนาดตัวอย่าง (ผลรวมของความถี่ทั้งหมดของอนุกรม)

ความถี่ตัวเลือก xi เรียกว่าตัวเลข ni (i=1,...,k) ซึ่งแสดงว่าตัวเลือกนี้เกิดขึ้นในตัวอย่างกี่ครั้ง

ความถี่(ความถี่สัมพัทธ์, ส่วนแบ่ง) ของตัวแปร xi (i=1,…,k) คืออัตราส่วนของความถี่ ni ต่อขนาดตัวอย่าง n
ว ฉัน=น ฉัน/n

การจัดอันดับข้อมูลการทดลอง- การดำเนินการที่ประกอบด้วยความจริงที่ว่าผลลัพธ์ของการสังเกตตัวแปรสุ่มเช่นค่าที่สังเกตได้ของตัวแปรสุ่มนั้นถูกจัดเรียงตามลำดับที่ไม่ลดลง

ไม่ต่อเนื่อง ซีรีย์การเปลี่ยนแปลง การแจกแจงเป็นชุดอันดับของตัวเลือก xi พร้อมด้วยความถี่หรือรายละเอียดที่สอดคล้องกัน

ประชากรทางสถิติ- ชุดของหน่วยที่มีลักษณะเฉพาะของมวล ลักษณะทั่วไป ความสม่ำเสมอในเชิงคุณภาพ และการมีอยู่ของการเปลี่ยนแปลง

ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างมีนัยสำคัญ (พนักงาน องค์กร ประเทศ ภูมิภาค) เป็นวัตถุ

หน่วยของประชากร— แต่ละหน่วยเฉพาะของประชากรทางสถิติ

ประชากรทางสถิติเดียวกันสามารถมีลักษณะเป็นเนื้อเดียวกันได้ในลักษณะหนึ่งและต่างกันในลักษณะอื่นได้

ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรในบางพื้นฐานและความแตกต่างจากหน่วยอื่น ๆ ทั้งหมด

ในประชากรทางสถิติ ความแตกต่างระหว่างหน่วยประชากรหนึ่งกับอีกหน่วยหนึ่งมักจะมากกว่า ธรรมชาติเชิงปริมาณ- การเปลี่ยนแปลงเชิงปริมาณในค่าลักษณะเฉพาะ หน่วยที่แตกต่างกันมวลรวมเรียกว่าการแปรผัน

การเปลี่ยนแปลงของลักษณะ — การเปลี่ยนแปลงเชิงปริมาณลักษณะเฉพาะ (สำหรับลักษณะเชิงปริมาณ) เมื่อย้ายจากหน่วยประชากรหนึ่งไปยังอีกหน่วยหนึ่ง

เข้าสู่ระบบ- นี่คือทรัพย์สิน คุณลักษณะเฉพาะหรือลักษณะอื่นของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของลักษณะเฉพาะในแต่ละหน่วยของประชากรเรียกว่า การเปลี่ยนแปลง.

ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถแสดงเป็นตัวเลขได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมี นิพจน์ตัวเลข(องค์ประกอบของประชากรตามอายุ)

ตัวบ่งชี้- นี่เป็นลักษณะทั่วไปเชิงปริมาณและคุณภาพของทรัพย์สินใดๆ ของหน่วยหรือมวลรวมโดยรวมภายใต้เงื่อนไขเฉพาะของเวลาและสถานที่

ดัชนีชี้วัดคือชุดตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม

ตัวอย่างเช่น มีการศึกษาเงินเดือน:

เข้าสู่ระบบ - ค่าจ้าง
ประชากรทางสถิติ-พนักงานทุกคน
หน่วยประชากรคือพนักงานแต่ละคน
ความสม่ำเสมอเชิงคุณภาพ - ค่าจ้างสะสม
การเปลี่ยนแปลงของเครื่องหมาย - ชุดตัวเลข

ประชากรและกลุ่มตัวอย่างจากนั้น

พื้นฐานคือชุดของข้อมูลที่ได้รับจากการวัดคุณลักษณะตั้งแต่หนึ่งรายการขึ้นไป ชุดของวัตถุที่สังเกตได้อย่างแท้จริง ซึ่งแสดงทางสถิติด้วยการสังเกตตัวแปรสุ่มจำนวนหนึ่งคือ การสุ่มตัวอย่างและที่มีอยู่ตามสมมุติฐาน (การคาดเดา) - ประชากรทั่วไป- ประชากรอาจมีจำกัด (จำนวนการสังเกต N = ค่าคงที่) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และตัวอย่างจากประชากรจะเป็นผลมาจากการสังเกตในจำนวนที่จำกัดเสมอ เรียกว่าจำนวนการสังเกตที่ก่อตัวเป็นตัวอย่าง ขนาดตัวอย่าง- หากขนาดตัวอย่างใหญ่พอ ( n → ∞) พิจารณาตัวอย่างแล้ว ใหญ่, วี มิฉะนั้นมันเรียกว่าการสุ่มตัวอย่าง ปริมาณจำกัด- โดยจะพิจารณาตัวอย่าง เล็กหากเมื่อทำการวัดตัวแปรสุ่มหนึ่งมิติขนาดตัวอย่างจะต้องไม่เกิน 30 ( n<= 30 ) และเมื่อทำการวัดหลายรายการพร้อมกัน ( เค) คุณลักษณะในปริภูมิความสัมพันธ์หลายมิติ nถึง เคไม่เกิน 10 (ไม่ระบุ< 10) - แบบฟอร์มตัวอย่าง ซีรีย์การเปลี่ยนแปลงถ้ามีสมาชิกอยู่ สถิติลำดับคือค่าตัวอย่างของตัวแปรสุ่ม เอ็กซ์ถูกเรียงลำดับจากน้อยไปมาก (จัดอันดับ) ค่าของคุณลักษณะจะถูกเรียกว่า ตัวเลือก.

ตัวอย่าง- ชุดวัตถุที่สุ่มเลือกมาเกือบจะเหมือนกัน - ธนาคารพาณิชย์ของเขตบริหารหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทุกแห่งในมอสโก ตลอดจนตัวอย่างจากธนาคารพาณิชย์ของประเทศ เป็นต้น

วิธีการพื้นฐานในการจัดการเก็บตัวอย่าง

ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ความสมบูรณ์และเพียงพอของการเป็นตัวแทนของคุณสมบัติของประชากรทั่วไปซึ่งสัมพันธ์กับตัวอย่างนี้สามารถถือว่าเป็นตัวแทนได้ การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้สองวิธี: การใช้ อย่างต่อเนื่องและ ไม่ต่อเนื่อง การสังเกตอย่างต่อเนื่องจัดให้มีการตรวจสอบทั้งหมด หน่วยศึกษา จำนวนทั้งสิ้น, ก การสังเกตบางส่วน (เลือก)- เพียงบางส่วนเท่านั้น

มีห้าวิธีหลักในการจัดการการสังเกตตัวอย่าง:

1. สุ่มเลือกอย่างง่ายซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรของวัตถุ (เช่น การใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) โดยแต่ละตัวอย่างที่เป็นไปได้มีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;

2. การเลือกอย่างง่ายโดยใช้ขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษร ฯลฯ) และตัวอย่างที่ได้รับในลักษณะนี้เรียกว่า เครื่องกล;

3. แบ่งชั้นการคัดเลือกประกอบด้วยข้อเท็จจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นประชากรย่อยหรือชั้น (ชั้น) ของปริมาตร ดังนั้น ชั้นเป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (เช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจตามอุตสาหกรรม) ในกรณีนี้จะมีการเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, โดยทั่วไป, แบ่งเขต);

4.วิธีการ อนุกรมการคัดเลือกถูกนำมาใช้เพื่อสร้าง อนุกรมหรือ ตัวอย่างรัง- สะดวกหากจำเป็นต้องสำรวจ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น ชุดสินค้า ผลิตภัณฑ์ของชุดใดชุดหนึ่ง หรือจำนวนประชากรของเขตการปกครองและอาณาเขตของประเทศ) การเลือกซีรี่ส์สามารถทำได้ทั้งแบบสุ่มหรือโดยกลไก ในกรณีนี้จะมีการตรวจสอบสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือบล็อก) โดยสมบูรณ์

5. รวมกันการเลือก (แบบขั้นบันได) สามารถรวมวิธีการเลือกได้หลายวิธีพร้อมกัน (เช่น แบบแบ่งชั้นและสุ่ม หรือสุ่มและเชิงกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.

ประเภทของการเลือก

โดย จิตใจการคัดเลือกรายบุคคล กลุ่ม และแบบรวมมีความโดดเด่น ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปจะถูกเลือกให้เป็นประชากรตัวอย่างด้วย การเลือกกลุ่ม- กลุ่มหน่วยที่เป็นเนื้อเดียวกัน (อนุกรม) ในเชิงคุณภาพ และ การเลือกแบบรวมเกี่ยวข้องกับการรวมประเภทที่หนึ่งและสองเข้าด้วยกัน

โดย วิธีการคัดเลือกมีความโดดเด่น ซ้ำและไม่ซ้ำซ้อนตัวอย่าง.

ทำซ้ำๆเรียกว่าการคัดเลือกโดยหน่วยที่รวมอยู่ในกลุ่มตัวอย่างจะไม่กลับคืนสู่ประชากรเดิมและไม่มีส่วนร่วมในการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นจะลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำแล้วซ้ำเล่าการเลือก จับได้ในกลุ่มตัวอย่าง หน่วยหนึ่งหลังจากการลงทะเบียนจะถูกส่งกลับไปยังประชากรทั่วไป และด้วยเหตุนี้จึงยังคงมีโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ ที่จะใช้ในขั้นตอนการคัดเลือกเพิ่มเติม ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยมีการใช้ในการวิจัยทางเศรษฐกิจและสังคม) แต่ด้วยความใหญ่โต ยังไม่มีข้อความ (ยังไม่มี → ∞)สูตรสำหรับ ทำซ้ำได้การคัดเลือกเข้าใกล้ผู้ที่ ซ้ำแล้วซ้ำเล่าการเลือกและอันหลังมักใช้บ่อยกว่า ( N = ค่าคงที่).

ลักษณะพื้นฐานของพารามิเตอร์ของประชากรทั่วไปและประชากรตัวอย่าง

ข้อสรุปทางสถิติของการศึกษานี้ขึ้นอยู่กับการแจกแจงของตัวแปรสุ่มและค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่าการรับรู้ตัวแปรสุ่ม เอ็กซ์(n คือขนาดตัวอย่าง) การแจกแจงของตัวแปรสุ่มในประชากรทั่วไปมีลักษณะทางทฤษฎีและเป็นอุดมคติ และมีลักษณะคล้ายคลึงกับตัวอย่าง เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างมีการระบุไว้ในเชิงวิเคราะห์ เช่น ของพวกเขา พารามิเตอร์กำหนดค่าของฟังก์ชันการแจกแจงในแต่ละจุดในปริภูมิของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่าง ฟังก์ชันการกระจายจึงเป็นเรื่องยากและบางครั้งก็ไม่สามารถระบุได้ พารามิเตอร์ถูกประมาณจากข้อมูลเชิงประจักษ์ จากนั้นจึงแทนที่เป็นนิพจน์เชิงวิเคราะห์ที่อธิบายการกระจายตัวทางทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงอาจมีความถูกต้องทางสถิติหรือผิดพลาดก็ได้ แต่ไม่ว่าในกรณีใด การกระจายตัวเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะของจริงโดยคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ ความคาดหวังทางคณิตศาสตร์และความแปรปรวน

โดยธรรมชาติแล้วจะมีการแจกแจง อย่างต่อเนื่องและ ไม่ต่อเนื่อง- การกระจายตัวต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ- ตัวอย่างของพารามิเตอร์ที่คล้ายคลึงกันได้แก่: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดางานวิจัยที่ไม่ต่อเนื่องในการวิจัยทางเศรษฐกิจและสังคม มีการใช้บ่อยที่สุด ทางเลือก (ขั้ว)การกระจาย. พารามิเตอร์ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้จะแสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีลักษณะที่กำลังศึกษา (ระบุด้วยตัวอักษร) สัดส่วนของประชากรที่ไม่มีลักษณะนี้จะแสดงด้วยตัวอักษร คิว (คิว = 1 - พี)- ความแปรปรวนของการแจกแจงแบบทางเลือกยังมีการเปรียบเทียบเชิงประจักษ์ด้วย

ขึ้นอยู่กับประเภทของการแจกแจงและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การแจกแจงจะถูกคำนวณแตกต่างกัน หลักสำหรับการแจกแจงทางทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง 9.1.

ตัวอย่างเศษส่วน k nอัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไปเรียกว่า:

kn = ไม่มี/ไม่มี.

ตัวอย่างเศษส่วน wคืออัตราส่วนของหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา xถึงขนาดตัวอย่าง n:

w = n n / n.

ตัวอย่าง.ในชุดสินค้าที่มีจำนวน 1,000 หน่วย โดยมีตัวอย่าง 5% แบ่งปันตัวอย่าง k nมูลค่าสัมบูรณ์คือ 50 หน่วย (เอ็น = น*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้แสดงว่า อัตราข้อบกพร่องตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)

เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.

ตารางที่ 9.1 พารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่าง

ไม่ว่าในกรณีใด (ต่อเนื่องและเลือก) อาจเกิดข้อผิดพลาดสองประเภท: การลงทะเบียนและการเป็นตัวแทน ข้อผิดพลาด การลงทะเบียนอาจมี สุ่มและ อย่างเป็นระบบอักขระ. สุ่มข้อผิดพลาดประกอบด้วยสาเหตุที่ควบคุมไม่ได้หลายประการ โดยไม่ได้ตั้งใจและมักจะเกิดความสมดุลระหว่างกัน (เช่น การเปลี่ยนแปลงประสิทธิภาพของอุปกรณ์เนื่องจากความผันผวนของอุณหภูมิในห้อง)

อย่างเป็นระบบข้อผิดพลาดมีอคติเนื่องจากละเมิดกฎในการเลือกวัตถุสำหรับตัวอย่าง (เช่น ความเบี่ยงเบนในการวัดเมื่อเปลี่ยนการตั้งค่าของอุปกรณ์วัด)

ตัวอย่าง.เพื่อประเมินสถานการณ์ทางสังคมของประชากรในเมือง มีการวางแผนที่จะสำรวจ 25% ของครอบครัว หากการเลือกอพาร์ทเมนต์ที่สี่ทุกแห่งขึ้นอยู่กับจำนวนก็อาจมีความเสี่ยงในการเลือกอพาร์ทเมนท์ทั้งหมดที่มีประเภทเดียวเท่านั้น (เช่นอพาร์ทเมนต์แบบหนึ่งห้อง) ซึ่งจะทำให้เกิดข้อผิดพลาดอย่างเป็นระบบและบิดเบือนผลลัพธ์ การเลือกหมายเลขอพาร์ทเมนต์ตามล็อตจะดีกว่าเนื่องจากข้อผิดพลาดจะเป็นแบบสุ่ม

ข้อผิดพลาดในการเป็นตัวแทนมีอยู่ในการสังเกตตัวอย่างเท่านั้น ไม่สามารถหลีกเลี่ยงได้ และเกิดขึ้นเนื่องจากการที่ประชากรตัวอย่างไม่ได้แพร่พันธุ์ประชากรทั่วไปได้อย่างสมบูรณ์ ค่าของตัวบ่งชี้ที่ได้จากตัวอย่างแตกต่างจากตัวบ่งชี้ของค่าเดียวกันในประชากรทั่วไป (หรือได้จากการสังเกตอย่างต่อเนื่อง)

อคติในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าพารามิเตอร์ในประชากรและค่าตัวอย่าง สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณจะเท่ากับ: และสำหรับส่วนแบ่ง (คุณลักษณะทางเลือก) -

ข้อผิดพลาดในการสุ่มตัวอย่างมีอยู่ในการสังเกตตัวอย่างเท่านั้น ยิ่งข้อผิดพลาดเหล่านี้มากเท่าใด การกระจายเชิงประจักษ์ก็จะยิ่งแตกต่างจากการกระจายทางทฤษฎีมากขึ้นเท่านั้น พารามิเตอร์ของการแจกแจงเชิงประจักษ์เป็นตัวแปรสุ่ม ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างก็เป็นตัวแปรสุ่มเช่นกัน พวกเขาสามารถใช้ค่าที่แตกต่างกันสำหรับตัวอย่างที่แตกต่างกัน ดังนั้นจึงเป็นเรื่องปกติที่จะคำนวณ ข้อผิดพลาดโดยเฉลี่ย.

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยคือปริมาณที่แสดงค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างจากค่าคาดหวังทางคณิตศาสตร์ ค่านี้ขึ้นอยู่กับหลักการของการเลือกแบบสุ่ม ขึ้นอยู่กับขนาดตัวอย่างและระดับความแปรผันของคุณลักษณะเป็นหลัก: ยิ่งความแปรผันของคุณลักษณะมากหรือน้อย (และด้วยเหตุนี้ค่า) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง . ความสัมพันธ์ระหว่างความแปรปรวนของประชากรทั่วไปและประชากรตัวอย่างแสดงโดยสูตร:

เหล่านั้น. เมื่อใหญ่พอเราก็สรุปได้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยแสดงให้เห็นความเบี่ยงเบนที่เป็นไปได้ของพารามิเตอร์ประชากรตัวอย่างจากพารามิเตอร์ประชากรทั่วไป ในตาราง ตารางที่ 9.2 แสดงนิพจน์สำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการต่างๆ ในการจัดการสังเกตการณ์

ตารางที่ 9.2 ค่าคลาดเคลื่อนเฉลี่ย (m) ของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับตัวอย่างประเภทต่างๆ

โดยที่ค่าเฉลี่ยของความแปรปรวนตัวอย่างภายในกลุ่มสำหรับแอตทริบิวต์ต่อเนื่อง

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มของสัดส่วน

— จำนวนซีรีส์ที่เลือก — จำนวนซีรีส์ทั้งหมด

ค่าเฉลี่ยของซีรีย์นั้นอยู่ที่ไหน

- ค่าเฉลี่ยโดยรวมของประชากรตัวอย่างทั้งหมดสำหรับลักษณะเฉพาะต่อเนื่อง

ส่วนแบ่งของคุณลักษณะในซีรีส์ th อยู่ที่ไหน

— ส่วนแบ่งรวมของลักษณะเฉพาะในประชากรตัวอย่างทั้งหมด

อย่างไรก็ตาม ขนาดของข้อผิดพลาดโดยเฉลี่ยสามารถตัดสินได้ด้วยความน่าจะเป็น P (P ≤ 1) เท่านั้น Lyapunov A.M. พิสูจน์ว่าการกระจายตัวของค่าเฉลี่ยตัวอย่าง และการเบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปในจำนวนที่มากพอสมควร เป็นไปตามกฎการกระจายแบบปกติ โดยมีเงื่อนไขว่าประชากรทั่วไปมีค่าเฉลี่ยจำกัดและมีความแปรปรวนจำกัด

ในทางคณิตศาสตร์ ข้อความสำหรับค่าเฉลี่ยนี้แสดงเป็น:

และสำหรับการแบ่งใช้ นิพจน์ (1) จะอยู่ในรูปแบบ:

ที่ไหน - มี ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อยซึ่งเป็นผลคูณของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย , และค่าสัมประสิทธิ์หลายหลากคือแบบทดสอบของนักเรียน ("ค่าสัมประสิทธิ์ความมั่นใจ") ที่เสนอโดย W.S. Gosset (นามแฝง "นักเรียน"); ค่าสำหรับขนาดตัวอย่างที่แตกต่างกันจะถูกเก็บไว้ในตารางพิเศษ

ค่าของฟังก์ชัน Ф(t) สำหรับค่าบางค่าของ t เท่ากับ:

ดังนั้นนิพจน์ (3) จึงสามารถอ่านได้ดังนี้: ด้วยความน่าจะเป็น พี = 0.683 (68.3%)อาจเป็นที่ถกเถียงกันอยู่ว่าความแตกต่างระหว่างตัวอย่างและค่าเฉลี่ยทั่วไปจะไม่เกินหนึ่งค่าของข้อผิดพลาดโดยเฉลี่ย ม.(t=1)ด้วยความน่าจะเป็น พี = 0.954 (95.4%)- ว่าจะไม่เกินค่าของข้อผิดพลาดเฉลี่ยสองครั้ง ม. (เสื้อ = 2) ,ด้วยความน่าจะเป็น พี = 0.997 (99.7%)- จะไม่เกินสามค่า ม. (เสื้อ = 3) .ดังนั้นความน่าจะเป็นที่ความแตกต่างนี้จะเกินสามเท่าของข้อผิดพลาดโดยเฉลี่ยจึงถูกกำหนดโดย ระดับข้อผิดพลาดและไม่มีจำนวนอีกต่อไป 0,3% .

ในตาราง 9.3 แสดงสูตรคำนวณค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด

ตารางที่ 9.3 ความคลาดเคลื่อนส่วนเพิ่ม (D) ของตัวอย่างสำหรับค่าเฉลี่ยและสัดส่วน (p) สำหรับการสังเกตตัวอย่างประเภทต่างๆ

ลักษณะทั่วไปของผลลัพธ์ตัวอย่างต่อประชากร

เป้าหมายสูงสุดของการสังเกตตัวอย่างคือการจำแนกลักษณะของประชากรทั่วไป ด้วยขนาดตัวอย่างที่น้อย การประมาณค่าเชิงประจักษ์ของพารามิเตอร์ ( และ ) อาจเบี่ยงเบนไปจากค่าที่แท้จริง ( และ ) อย่างมีนัยสำคัญ ดังนั้นจึงจำเป็นต้องสร้างขอบเขตที่ค่าจริง ( และ ) อยู่สำหรับค่าตัวอย่างของพารามิเตอร์ ( และ )

ช่วงความเชื่อมั่นของพารามิเตอร์ใด ๆ θ ของประชากรทั่วไปคือช่วงสุ่มของค่าของพารามิเตอร์นี้ซึ่งมีความน่าจะเป็นใกล้กับ 1 ( ความน่าเชื่อถือ) มีค่าจริงของพารามิเตอร์นี้

ข้อผิดพลาดเล็กน้อยตัวอย่าง Δ ช่วยให้คุณกำหนดค่าที่ จำกัด ของลักษณะของประชากรทั่วไปและค่าของพวกเขา ช่วงความมั่นใจซึ่งเท่ากัน:

ขีดจำกัดล่าง ช่วงความมั่นใจได้จากการลบ ข้อผิดพลาดสูงสุดจากค่าเฉลี่ยตัวอย่าง (ส่วนแบ่ง) และค่าบนโดยบวกเข้าไป

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยจะใช้ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด และสำหรับระดับความเชื่อมั่นที่กำหนดจะถูกกำหนดโดยสูตร:

ซึ่งหมายความว่าด้วยความน่าจะเป็นที่กำหนด รซึ่งเรียกว่าระดับความเชื่อมั่นและถูกกำหนดโดยค่าโดยไม่ซ้ำกัน ทีอาจเป็นที่ถกเถียงกันอยู่ว่ามูลค่าที่แท้จริงของค่าเฉลี่ยอยู่ในช่วงตั้งแต่ และมูลค่าที่แท้จริงของหุ้นอยู่ในช่วงตั้งแต่

เมื่อคำนวณช่วงความเชื่อมั่นสำหรับระดับความเชื่อมั่นมาตรฐานสามระดับ P = 95%, P = 99% และ P = 99.9%ค่าจะถูกเลือกโดย การสมัครขึ้นอยู่กับจำนวนองศาอิสระ หากขนาดตัวอย่างใหญ่พอ ค่าที่สอดคล้องกับความน่าจะเป็นเหล่านี้ ทีเท่าเทียมกัน: 1,96, 2,58 และ 3,29 - ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มทำให้สามารถกำหนดค่าที่ จำกัด ของลักษณะของประชากรและช่วงความเชื่อมั่น:

การขยายผลการสังเกตตัวอย่างไปยังประชากรทั่วไปในการวิจัยทางเศรษฐกิจและสังคมมีลักษณะเฉพาะของตนเอง เนื่องจากต้องมีการนำเสนอประเภทและกลุ่มทั้งหมดอย่างสมบูรณ์ พื้นฐานสำหรับความเป็นไปได้ของการกระจายดังกล่าวคือการคำนวณ ข้อผิดพลาดที่เกี่ยวข้อง:

ที่ไหน Δ % - ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสัมพัทธ์ -

มีสองวิธีหลักในการขยายการสังเกตตัวอย่างไปยังประชากร: วิธีการคำนวณใหม่และค่าสัมประสิทธิ์โดยตรง.

เอสเซ้นส์ การแปลงโดยตรงประกอบด้วยการคูณค่าเฉลี่ยตัวอย่าง!!\overline(x) ด้วยขนาดของประชากร

ตัวอย่าง- ให้ประมาณจำนวนเด็กวัยหัดเดินโดยเฉลี่ยในเมืองด้วยวิธีสุ่มตัวอย่างและจำนวนเป็นหนึ่งคน หากมีครอบครัวเล็ก 1,000 ครอบครัวในเมือง จำนวนสถานที่ที่ต้องการในสถานรับเลี้ยงเด็กเทศบาลจะได้มาโดยการคูณค่าเฉลี่ยนี้ด้วยขนาดของประชากรทั่วไป N = 1,000 เช่น จะมีที่นั่ง 1,200 ที่นั่ง

วิธีการต่อรองขอแนะนำให้ใช้ในกรณีที่ดำเนินการสังเกตแบบเลือกเพื่อชี้แจงข้อมูลของการสังเกตอย่างต่อเนื่อง

ใช้สูตรต่อไปนี้:

โดยที่ตัวแปรทั้งหมดคือขนาดประชากร:

ขนาดตัวอย่างที่ต้องการ

ตารางที่ 9.4 ขนาดตัวอย่างที่ต้องการ (n) สำหรับองค์กรสังเกตการณ์ตัวอย่างประเภทต่างๆ

เมื่อวางแผนการสังเกตตัวอย่างด้วยค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาต จำเป็นต้องประมาณค่าที่จำเป็นอย่างถูกต้อง ขนาดตัวอย่าง- ปริมาตรนี้สามารถกำหนดได้บนพื้นฐานของข้อผิดพลาดที่อนุญาตในระหว่างการสังเกตตัวอย่าง โดยขึ้นอยู่กับความน่าจะเป็นที่กำหนดซึ่งรับประกันค่าที่อนุญาตของระดับข้อผิดพลาด (โดยคำนึงถึงวิธีการจัดระเบียบการสังเกต) สูตรสำหรับกำหนดขนาดตัวอย่างที่ต้องการ n สามารถรับได้โดยตรงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ดังนั้นจากการแสดงออกของข้อผิดพลาดเล็กน้อย:

ขนาดตัวอย่างจะถูกกำหนดโดยตรง n:

สูตรนี้แสดงว่าเมื่อข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดลดลง Δ ขนาดตัวอย่างที่ต้องการจะเพิ่มขึ้นอย่างมาก ซึ่งเป็นสัดส่วนกับความแปรปรวนและกำลังสองของการทดสอบของนักเรียน

สำหรับวิธีการเฉพาะในการจัดการสังเกตการณ์ ขนาดตัวอย่างที่ต้องการจะคำนวณตามสูตรที่ให้ไว้ในตาราง 9.4.

ตัวอย่างการคำนวณเชิงปฏิบัติ

ตัวอย่างที่ 1 การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะเชิงปริมาณต่อเนื่อง

เพื่อประเมินความรวดเร็วในการชำระหนี้กับเจ้าหนี้ ธนาคารจึงสุ่มตัวอย่างเอกสารการชำระเงิน 10 ฉบับ ค่าของพวกเขาเท่ากัน (เป็นวัน): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

จำเป็นด้วยความน่าจะเป็น พ = 0.954กำหนดข้อผิดพลาดเล็กน้อย Δ ค่าเฉลี่ยตัวอย่างและขีดจำกัดความเชื่อมั่นของเวลาในการคำนวณเฉลี่ย

สารละลาย.ค่าเฉลี่ยคำนวณโดยใช้สูตรจากตาราง 9.1 สำหรับประชากรตัวอย่าง

ความแปรปรวนคำนวณโดยใช้สูตรจากตาราง 9.1.

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของวัน

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตร:

เหล่านั้น. ค่าเฉลี่ยคือ x ± m = 12.0 ± 2.3 วัน.

ความน่าเชื่อถือของค่าเฉลี่ยก็คือ

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างซ้ำ เนื่องจากไม่ทราบขนาดประชากร และสำหรับ พ = 0.954ระดับความมั่นใจ

ดังนั้น ค่าเฉลี่ยคือ `x ± D = `x ± 2m = 12.0 ± 4.6 กล่าวคือ มูลค่าที่แท้จริงอยู่ในช่วง 7.4 ถึง 16.6 วัน

การใช้โต๊ะนักเรียน แอปพลิเคชันช่วยให้เราสรุปได้ว่าสำหรับ n = 10 - 1 = 9 องศาอิสระ ค่าที่ได้รับมีความน่าเชื่อถือโดยมีระดับนัยสำคัญเท่ากับ 0.001 ปอนด์ เช่น ค่าเฉลี่ยผลลัพธ์จะแตกต่างอย่างมากจาก 0

ตัวอย่างที่ 2 การประมาณค่าความน่าจะเป็น (ส่วนแบ่งทั่วไป) น.

ในระหว่างวิธีการสุ่มตัวอย่างเชิงกลเพื่อสำรวจสถานะทางสังคมของ 1,000 ครอบครัว พบว่าสัดส่วนของครอบครัวที่มีรายได้น้อยคือ ก = 0.3 (30%)(ตัวอย่างคือ 2% , เช่น. ไม่มี/ไม่มี = 0.02- จำเป็นด้วยระดับความมั่นใจ พี = 0.997กำหนดตัวบ่งชี้ รครอบครัวผู้มีรายได้น้อยทั่วทั้งภูมิภาค

สารละลาย.ขึ้นอยู่กับค่าฟังก์ชันที่นำเสนอ เอฟ(ที)ค้นหาระดับความมั่นใจที่กำหนด พ = 0.997ความหมาย เสื้อ = 3(ดูสูตร 3) ความคลาดเคลื่อนเล็กน้อยของเศษส่วน วกำหนดโดยสูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างแบบไม่ทำซ้ำ (การสุ่มตัวอย่างเชิงกลจะไม่ทำซ้ำเสมอ):

ข้อผิดพลาดในการสุ่มตัวอย่างสัมพัทธ์สูงสุดใน % จะเป็น:

ความน่าจะเป็น (ส่วนแบ่งทั่วไป) ของครอบครัวที่มีรายได้น้อยในภูมิภาคจะเป็น р=w±Δwและขีดจำกัดความเชื่อมั่น p คำนวณจากอสมการสองเท่า:

w — Δ w ≤ p ≤ w — Δ w, เช่น. มูลค่าที่แท้จริงของ p อยู่ภายใน:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

ดังนั้นด้วยความน่าจะเป็นที่ 0.997 จึงระบุได้ว่าส่วนแบ่งของครอบครัวที่มีรายได้น้อยในทุกครอบครัวในภูมิภาคมีตั้งแต่ 28.6% ถึง 31.4%

ตัวอย่างที่ 3การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะที่ไม่ต่อเนื่องที่ระบุโดยชุดช่วง

ในตาราง 9.5. มีการระบุการกระจายแอปพลิเคชันสำหรับการผลิตคำสั่งซื้อตามเวลาที่องค์กรดำเนินการ

ตารางที่ 9.5 การกระจายการสังเกตตามเวลาที่ปรากฏ

สารละลาย. เวลาเฉลี่ยในการดำเนินการตามคำสั่งซื้อให้เสร็จสมบูรณ์คำนวณโดยใช้สูตร:

ระยะเวลาเฉลี่ยจะเป็น:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 เดือน

เราจะได้คำตอบเดียวกันหากเราใช้ข้อมูลบน p i จากคอลัมน์สุดท้ายของตาราง 9.5 โดยใช้สูตร:

โปรดทราบว่าจุดกึ่งกลางของช่วงเวลาสำหรับการไล่สีครั้งสุดท้ายนั้นพบได้โดยการเสริมด้วยความกว้างของช่วงเวลาของการไล่ระดับก่อนหน้าอย่างเทียมเท่ากับ 60 - 36 = 24 เดือน

ความแปรปรวนคำนวณโดยใช้สูตร

ที่ไหน x ฉัน- ช่วงกลางของอนุกรมช่วงเวลา

ดังนั้น!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตรรายเดือนเช่น ค่าเฉลี่ยคือ!!\overline(x) ± m = 23.1 ± 13.4

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการคัดเลือกซ้ำ เนื่องจากไม่ทราบขนาดประชากร สำหรับระดับความเชื่อมั่น 0.954:

ดังนั้นค่าเฉลี่ยคือ:

เหล่านั้น. มูลค่าที่แท้จริงของมันอยู่ในช่วงตั้งแต่ 0 ถึง 50 เดือน

ตัวอย่างที่ 4เพื่อกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ของบริษัท N = 500 บริษัท ในธนาคารพาณิชย์ จำเป็นต้องทำการศึกษาตัวอย่างโดยใช้วิธีการสุ่มแบบไม่ซ้ำกัน จงหาขนาดตัวอย่างที่ต้องการ n โดยความน่าจะเป็น P = 0.954 ค่าคลาดเคลื่อนของค่าเฉลี่ยตัวอย่างจะไม่เกิน 3 วัน หากค่าประมาณการทดลองพบว่าค่าเบี่ยงเบนมาตรฐาน s คือ 10 วัน

สารละลาย- เพื่อกำหนดจำนวนการศึกษาที่จำเป็น n เราจะใช้สูตรสำหรับการเลือกแบบไม่ซ้ำกันจากตาราง 9.4:

ในนั้นค่า t ถูกกำหนดจากระดับความเชื่อมั่นที่ P = 0.954 มีค่าเท่ากับ 2 ค่ากำลังสองเฉลี่ยคือ s = 10 ขนาดประชากรคือ N = 500 และค่าคลาดเคลื่อนสูงสุดของค่าเฉลี่ยคือ Δ x = 3 เมื่อแทนค่าเหล่านี้ลงในสูตรเราจะได้:

เหล่านั้น. ก็เพียงพอที่จะรวบรวมตัวอย่าง 41 องค์กรเพื่อประเมินพารามิเตอร์ที่ต้องการ - ความเร็วของการชำระหนี้กับเจ้าหนี้