ชุดข้อมูลช่วงเวลาคืออะไร? การสร้างอนุกรมความแปรผันตามช่วงเวลาสำหรับข้อมูลเชิงปริมาณต่อเนื่อง

สถิติทางคณิตศาสตร์- สาขาวิชาคณิตศาสตร์ที่อุทิศให้กับวิธีทางคณิตศาสตร์ในการประมวลผล การจัดระบบ และการใช้ข้อมูลทางสถิติเพื่อการสรุปทางวิทยาศาสตร์และการปฏิบัติ

3.1. แนวคิดพื้นฐานของสถิติทางคณิตศาสตร์

ในปัญหาทางการแพทย์และชีววิทยา มักจำเป็นต้องศึกษาการกระจายตัวของลักษณะเฉพาะสำหรับบุคคลจำนวนมาก ลักษณะนี้มีความหมายที่แตกต่างกันสำหรับบุคคลที่แตกต่างกัน ดังนั้นจึงเป็นตัวแปรสุ่ม ตัวอย่างเช่น ยารักษาโรคใดๆ มีประสิทธิผลแตกต่างกันเมื่อนำไปใช้กับผู้ป่วยที่แตกต่างกัน อย่างไรก็ตามเพื่อที่จะได้ทราบถึงประสิทธิภาพของยานี้ ก็ไม่จำเป็นที่จะต้องนำไปใช้กับมัน ทุกคนป่วย. สามารถติดตามผลลัพธ์ของการใช้ยากับผู้ป่วยกลุ่มเล็ก ๆ และระบุคุณสมบัติที่สำคัญ (ประสิทธิภาพ, ข้อห้าม) ของกระบวนการรักษาตามข้อมูลที่ได้รับ

ประชากร- ชุดขององค์ประกอบที่เป็นเนื้อเดียวกันซึ่งมีคุณลักษณะบางอย่างที่ต้องศึกษา ป้ายนี้คือ อย่างต่อเนื่องตัวแปรสุ่มที่มีความหนาแน่นของการแจกแจง ฉ(x)

ตัวอย่างเช่น หากเราสนใจความชุกของโรคในภูมิภาคใดภูมิภาคหนึ่ง ประชากรทั่วไปก็คือประชากรทั้งหมดของภูมิภาคนั้น หากเราต้องการค้นหาความอ่อนแอของชายและหญิงต่อโรคนี้แยกกัน เราควรพิจารณาประชากรทั่วไปสองกลุ่ม

เพื่อศึกษาคุณสมบัติของประชากรทั่วไปจะมีการเลือกองค์ประกอบบางส่วนไว้

ตัวอย่าง- ส่วนหนึ่งของประชากรทั่วไปที่ได้รับเลือกให้เข้ารับการตรวจ (การรักษา)

หากไม่ทำให้เกิดความสับสน ตัวอย่างจะถูกเรียกว่า as ชุดของวัตถุเลือกสำหรับการสำรวจและ จำนวนทั้งสิ้น

ค่านิยมลักษณะการศึกษาที่ได้รับระหว่างการตรวจ ค่าเหล่านี้สามารถแสดงได้หลายวิธี

อนุกรมทางสถิติอย่างง่าย -ค่าของคุณลักษณะที่กำลังศึกษาบันทึกตามลำดับที่ได้รับ

ตัวอย่างของชุดทางสถิติอย่างง่ายที่ได้จากการวัดความเร็วคลื่นพื้นผิว (m/s) ในผิวหนังหน้าผากในผู้ป่วย 20 รายแสดงไว้ในตารางที่ 1 3.1.

ตารางที่ 3.1.ชุดสถิติอย่างง่าย

ชุดสถิติอย่างง่ายเป็นวิธีหลักและสมบูรณ์ที่สุดในการบันทึกผลการสำรวจ สามารถมีองค์ประกอบได้หลายร้อยรายการ เป็นการยากมากที่จะมองภาพรวมทั้งหมดเพียงแวบเดียว ดังนั้นตัวอย่างขนาดใหญ่จึงมักถูกแบ่งออกเป็นกลุ่ม เมื่อต้องการทำเช่นนี้ พื้นที่ของการเปลี่ยนแปลงในลักษณะจะแบ่งออกเป็นหลาย ๆ (N) ช่วงเวลาความกว้างเท่ากัน และคำนวณความถี่สัมพัทธ์ (n/n) ของคุณลักษณะที่อยู่ในช่วงเหล่านี้ ความกว้างของแต่ละช่วงคือ:

ขอบเขตช่วงมีความหมายดังต่อไปนี้:

ถ้าองค์ประกอบตัวอย่างใดๆ เป็นขอบเขตระหว่างสองช่วงเวลาที่ติดกัน องค์ประกอบนั้นจะถูกจัดประเภทเป็น ซ้ายช่วงเวลา ข้อมูลที่จัดกลุ่มในลักษณะนี้เรียกว่า อนุกรมสถิติช่วงเวลา

เป็นตารางที่แสดงช่วงเวลาของค่าแอตทริบิวต์และความถี่สัมพัทธ์ของการเกิดขึ้นของแอตทริบิวต์ภายในช่วงเวลาเหล่านี้

ในกรณีของเรา เราสามารถสร้างชุดข้อมูลทางสถิติตามช่วงเวลาต่อไปนี้ (N = 5 = 4) ตาราง 3.2.

ตารางที่ 3.2.ชุดสถิติช่วง

ที่นี่ช่วง 28-32 มีสองค่าเท่ากับ 28 (ตารางที่ 3.1) และช่วง 32-36 รวมค่า 32, 33, 34 และ 35

ชุดสถิติช่วงเวลาสามารถแสดงเป็นภาพกราฟิกได้ เมื่อต้องการทำเช่นนี้ ช่วงของค่าแอตทริบิวต์จะถูกพล็อตตามแกน Abscissa และในแต่ละช่วงนั้น สี่เหลี่ยมจะถูกสร้างขึ้นโดยมีความสูงเท่ากับความถี่สัมพัทธ์บนฐาน เรียกว่าแผนภูมิแท่งผลลัพธ์ ฮิสโตแกรม

ข้าว. 3.1.ฮิสโตแกรม

ในฮิสโตแกรม รูปแบบทางสถิติของการกระจายตัวของลักษณะจะมองเห็นได้ค่อนข้างชัดเจน

ด้วยขนาดตัวอย่างขนาดใหญ่ (หลายพัน) และความกว้างของคอลัมน์เล็ก รูปร่างของฮิสโตแกรมจึงใกล้เคียงกับรูปร่างของกราฟ ความหนาแน่นของการกระจายเข้าสู่ระบบ.

สามารถเลือกจำนวนคอลัมน์ฮิสโตแกรมได้โดยใช้สูตรต่อไปนี้:

การสร้างฮิสโตแกรมด้วยตนเองเป็นกระบวนการที่ใช้เวลานาน ดังนั้นจึงมีการพัฒนาโปรแกรมคอมพิวเตอร์ให้สร้างขึ้นโดยอัตโนมัติ

3.2. ลักษณะเชิงตัวเลขของอนุกรมทางสถิติ

ขั้นตอนทางสถิติจำนวนมากใช้การประมาณการตัวอย่างสำหรับความคาดหวังและความแปรปรวนของประชากร (หรือ MSE)

ค่าเฉลี่ยตัวอย่าง(X) คือค่าเฉลี่ยเลขคณิตขององค์ประกอบทั้งหมดของอนุกรมทางสถิติอย่างง่าย:

สำหรับตัวอย่างของเรา เอ็กซ์= 37.05 (เมตร/วินาที)

ค่าเฉลี่ยตัวอย่างคือที่สุดการประมาณค่าเฉลี่ยทั่วไปม.

ความแปรปรวนตัวอย่าง s 2เท่ากับผลรวมของการเบี่ยงเบนกำลังสองขององค์ประกอบจากค่าเฉลี่ยตัวอย่าง หารด้วย n- 1:

ในตัวอย่างของเรา s 2 = 25.2 (m/s) 2

โปรดทราบว่าเมื่อคำนวณความแปรปรวนตัวอย่าง ตัวส่วนของสูตรไม่ใช่ขนาดตัวอย่าง n แต่เป็น n-1 นี่เป็นเพราะความจริงที่ว่าเมื่อคำนวณความเบี่ยงเบนในสูตร (3.3) แทนที่จะใช้การคาดการณ์ทางคณิตศาสตร์ที่ไม่รู้จัก ระบบจะใช้การประมาณค่า - ค่าเฉลี่ยตัวอย่าง

ความแปรปรวนตัวอย่างคือ ที่สุดการประมาณค่าความแปรปรวนทั่วไป (σ 2)

ตัวอย่างค่าเบี่ยงเบนมาตรฐาน(s) คือรากที่สองของความแปรปรวนตัวอย่าง:

สำหรับตัวอย่างของเรา = 5.02 (เมตร/วินาที)

คัดเลือก รากหมายถึงกำลังสองค่าเบี่ยงเบนคือค่าประมาณที่ดีที่สุดของค่าเบี่ยงเบนมาตรฐานทั่วไป (σ)

ด้วยขนาดตัวอย่างที่เพิ่มขึ้นอย่างไม่จำกัด ลักษณะเฉพาะของกลุ่มตัวอย่างทั้งหมดจึงมีแนวโน้มที่จะสอดคล้องกับลักษณะเฉพาะของประชากรทั่วไป

สูตรคอมพิวเตอร์ใช้ในการคำนวณลักษณะตัวอย่าง ใน Excel การคำนวณเหล่านี้ใช้ฟังก์ชันทางสถิติ AVERAGE, VARIANCE ส่วนเบี่ยงเบนมาตรฐาน

3.3. การประเมินช่วงเวลา

ลักษณะตัวอย่างทั้งหมดได้แก่ ตัวแปรสุ่มซึ่งหมายความว่าสำหรับตัวอย่างอื่นที่มีขนาดเท่ากันค่าของคุณลักษณะตัวอย่างจะแตกต่างกัน เลยเลือกสรร

ลักษณะเฉพาะเท่านั้น การประมาณการลักษณะที่เกี่ยวข้องของประชากร

ข้อเสียของการประเมินแบบคัดเลือกจะได้รับการชดเชยด้วย การประมาณช่วงเป็นตัวแทน ช่วงตัวเลขภายในซึ่งมีความน่าจะเป็นที่กำหนด ร.ดพบค่าที่แท้จริงของพารามิเตอร์โดยประมาณ

อนุญาต คุณ r - พารามิเตอร์บางตัวของประชากรทั่วไป (ค่าเฉลี่ยทั่วไป ความแปรปรวนทั่วไป ฯลฯ)

การประมาณช่วงพารามิเตอร์ U r เรียกว่าช่วงเวลา (คุณ 1, คุณ 2)เป็นไปตามเงื่อนไข:

พี(ยู < Ur < U2) = Рд. (3.5)

ความน่าจะเป็น ร.ดเรียกว่า ความน่าจะเป็นของความมั่นใจ

ความน่าจะเป็นของความเชื่อมั่น ป - ความน่าจะเป็นที่มูลค่าที่แท้จริงของปริมาณโดยประมาณคือ ข้างในช่วงเวลาที่กำหนด

ในกรณีนี้คือช่วงเวลา (คุณ 1, คุณ 2)เรียกว่า ช่วงความมั่นใจสำหรับพารามิเตอร์ที่กำลังประมาณ

บ่อยครั้งแทนที่จะใช้ความน่าจะเป็นของความเชื่อมั่น ค่าที่เกี่ยวข้อง α = 1 - Р d ถูกนำมาใช้ซึ่งเรียกว่า ระดับความสำคัญ

ระดับความสำคัญคือความน่าจะเป็นที่ค่าจริงของพารามิเตอร์ที่ประมาณไว้จะเป็น ข้างนอกช่วงความมั่นใจ

บางครั้ง α และ P d จะแสดงเป็นเปอร์เซ็นต์ เช่น 5% แทนที่จะเป็น 0.05 และ 95% แทนที่จะเป็น 0.95

ในการประมาณค่าช่วงเวลา ให้เลือกสิ่งที่เหมาะสมก่อน ความน่าจะเป็นของความมั่นใจ(ปกติคือ 0.95 หรือ 0.99) จากนั้นค้นหาช่วงเวลาที่สอดคล้องกันของค่าของพารามิเตอร์โดยประมาณ

ให้เราสังเกตคุณสมบัติทั่วไปบางประการของการประมาณค่าช่วงเวลา

1. ยิ่งระดับนัยสำคัญยิ่งต่ำ (ยิ่งมาก) ร ง)ยิ่งการประมาณช่วงกว้างขึ้น ดังนั้น หากที่ระดับนัยสำคัญ 0.05 การประมาณช่วงของค่าเฉลี่ยทั่วไปคือ 34.7< < 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < < 40,25.

2. ยิ่งขนาดตัวอย่างใหญ่ขึ้น เอ็น,ยิ่งการประมาณช่วงเวลาแคบลงตามระดับนัยสำคัญที่เลือก ตัวอย่างเช่น ให้ 5 เป็นการประมาณเปอร์เซ็นต์ของค่าเฉลี่ยทั่วไป (β = 0.05) ที่ได้มาจากตัวอย่างที่มี 20 องค์ประกอบ จากนั้น 34.7< < 39,4.

เมื่อเพิ่มขนาดตัวอย่างเป็น 80 เราจะได้ค่าประมาณที่แม่นยำยิ่งขึ้นที่ระดับนัยสำคัญเท่าเดิม: 35.5< < 38,6.

โดยทั่วไป การสร้างการประมาณการความเชื่อมั่นที่เชื่อถือได้ต้องอาศัยความรู้เกี่ยวกับกฎหมายตามการกระจายคุณลักษณะสุ่มโดยประมาณในประชากร มาดูกันว่าการประมาณช่วงเวลาถูกสร้างขึ้นอย่างไร ค่าเฉลี่ยทั่วไปลักษณะที่กระจายอยู่ในประชากรตาม ปกติกฎ.

3.4. การประมาณช่วงของค่าเฉลี่ยทั่วไปสำหรับกฎหมายการกระจายแบบปกติ

การสร้างค่าประมาณช่วงเวลาของค่าเฉลี่ย M ทั่วไปสำหรับประชากรที่มีกฎการแจกแจงแบบปกติจะขึ้นอยู่กับคุณสมบัติต่อไปนี้ สำหรับปริมาณตัวอย่าง nทัศนคติ

ปฏิบัติตามการแจกแจงของนักเรียนด้วยจำนวนองศาอิสระ ν = n- 1.

ที่นี่ เอ็กซ์- ค่าเฉลี่ยตัวอย่าง และ - ส่วนเบี่ยงเบนมาตรฐานแบบเลือกสรร

เมื่อใช้ตารางการแจกแจงของนักเรียนหรือคอมพิวเตอร์อะนาล็อก คุณจะพบค่าขอบเขตที่เมื่อได้รับความน่าจะเป็นของความเชื่อมั่น ค่าอสมการต่อไปนี้ก็จะคงอยู่:

ความไม่เท่าเทียมกันนี้สอดคล้องกับความไม่เท่าเทียมกันของ M:

ที่ไหน ε - ครึ่งหนึ่งของช่วงความมั่นใจ

ดังนั้น การสร้างช่วงความเชื่อมั่นสำหรับ M จึงดำเนินการตามลำดับต่อไปนี้

1. เลือกความน่าจะเป็นของความเชื่อมั่น Р d (ปกติ 0.95 หรือ 0.99) และสำหรับมันโดยใช้ตารางการแจกแจงของนักเรียนค้นหาพารามิเตอร์ t

2. คำนวณความกว้างครึ่งหนึ่งของช่วงความมั่นใจ ε:

3. รับการประมาณช่วงของค่าเฉลี่ยทั่วไปด้วยความน่าจะเป็นของความเชื่อมั่นที่เลือก:

เขียนโดยย่อดังนี้

ขั้นตอนทางคอมพิวเตอร์ได้รับการพัฒนาเพื่อค้นหาการประมาณช่วงเวลา

ให้เราอธิบายวิธีใช้ตารางการแจกแจงนักเรียน ตารางนี้มี "ทางเข้า" สองช่อง: คอลัมน์ด้านซ้ายเรียกว่าจำนวนองศาอิสระ ν = n- 1 และบรรทัดบนสุดคือระดับนัยสำคัญ α ที่จุดตัดของแถวและคอลัมน์ที่เกี่ยวข้อง ให้หาค่าสัมประสิทธิ์นักเรียน ที

ลองใช้วิธีนี้กับตัวอย่างของเรา ส่วนของตารางการแจกแจงนักเรียนมีดังต่อไปนี้

ตารางที่ 3.3. ส่วนของตารางการแจกแจงนักเรียน

ชุดสถิติอย่างง่ายสำหรับกลุ่มตัวอย่าง 20 คน (น= 20, ν =19) แสดงอยู่ในตาราง 3.1. สำหรับชุดนี้ การคำนวณโดยใช้สูตร (3.1-3.3) ให้: เอ็กซ์= 37,05; = 5,02.

มาเลือกกัน α = 0.05 (Р d = 0.95) เราพบจุดตัดของแถว "19" และคอลัมน์ "0.05" ที= 2,09.

ให้เราคำนวณความแม่นยำของการประมาณค่าโดยใช้สูตร (3.6): ε = 2.09?5.02/แล /20 = 2.34

มาสร้างการประมาณช่วงเวลากัน: ด้วยความน่าจะเป็น 95% ค่าเฉลี่ยทั่วไปที่ไม่ทราบจะเป็นไปตามความไม่เท่าเทียมกัน:

37,05 - 2,34 < < 37,05 + 2,34, или = 37.05 ± 2.34 (เมตร/วินาที), R d = 0.95

3.5. วิธีทดสอบสมมติฐานทางสถิติ

สมมติฐานทางสถิติ

ก่อนที่จะกำหนดว่าสมมติฐานทางสถิติคืออะไร ให้พิจารณาตัวอย่างต่อไปนี้

เพื่อเปรียบเทียบสองวิธีในการรักษาโรคบางชนิด ผู้ป่วยสองกลุ่ม กลุ่มละ 20 คนได้รับการคัดเลือกและรักษาโดยใช้วิธีการเหล่านี้ มันถูกบันทึกไว้สำหรับผู้ป่วยแต่ละราย จำนวนขั้นตอนหลังจากนั้นก็ได้รับผลเชิงบวก จากข้อมูลเหล่านี้ ค่าเฉลี่ยตัวอย่าง (X) พบความแปรปรวนตัวอย่างสำหรับแต่ละกลุ่ม (ส 2)และค่าเบี่ยงเบนมาตรฐานตัวอย่าง (s)

ผลลัพธ์แสดงไว้ในตาราง 3.4.

ตารางที่ 3.4

จำนวนขั้นตอนที่จำเป็นเพื่อให้ได้ผลเชิงบวกคือตัวแปรสุ่ม ข้อมูลทั้งหมดที่มีอยู่ในตัวอย่างที่กำหนดในปัจจุบัน

จากโต๊ะ 3.4 แสดงว่าค่าเฉลี่ยตัวอย่างในกลุ่มแรกน้อยกว่ากลุ่มที่สอง< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает นี่หมายความว่าความสัมพันธ์เดียวกันนี้ถือเป็นค่าเฉลี่ยทั่วไปหรือไม่: M 1

การทดสอบสมมติฐานทางสถิติ- สมมติฐานทางสถิติ

เป็นการสันนิษฐานเกี่ยวกับคุณสมบัติของประชากร เราจะพิจารณาสมมติฐานเกี่ยวกับคุณสมบัติสอง

ประชากรทั่วไป ถ้าประชากรมีมีชื่อเสียงเหมือนกัน การกระจายมูลค่าที่ประมาณการ และข้อสมมติเกี่ยวข้องกับมูลค่าพารามิเตอร์บางอย่าง ของการแจกแจงนี้จึงเรียกว่าสมมุติฐานพารามิเตอร์ เช่น สุ่มตัวอย่างจากประชากรที่มีกฎหมายปกติ การกระจายตัวและความแปรปรวนที่เท่ากัน จำเป็นต้องค้นหาพวกเขาเหมือนกันหรือเปล่า

ค่าเฉลี่ยทั่วไปของประชากรเหล่านี้ หากไม่มีความรู้เกี่ยวกับกฎการกระจายตัวของประชากรทั่วไป ก็จะมีการเรียกสมมติฐานเกี่ยวกับคุณสมบัติของพวกมันไม่ใช่พารามิเตอร์ การกระจายตัวและความแปรปรวนที่เท่ากัน จำเป็นต้องค้นหาตัวอย่างเช่น,

กฎการกระจายตัวของประชากรที่ใช้สุ่มตัวอย่าง

สมมติฐานว่างและทางเลือก

ภารกิจทดสอบสมมติฐาน ระดับความสำคัญ

มาทำความรู้จักกับคำศัพท์ที่ใช้ในการทดสอบสมมติฐานกันดีกว่า H 0 - สมมติฐานว่าง (สมมติฐานของผู้ขี้ระแวง) คือสมมติฐานเกี่ยวกับการขาดความแตกต่าง

ระหว่างตัวอย่างที่เปรียบเทียบ ผู้สงสัยเชื่อว่าความแตกต่างระหว่างการประมาณการตัวอย่างที่ได้จากผลการวิจัยนั้นเป็นแบบสุ่ม- สมมติฐานทางเลือก (สมมติฐานในแง่ดี) เป็นสมมติฐานเกี่ยวกับการมีความแตกต่างระหว่างกลุ่มตัวอย่างที่เปรียบเทียบ ผู้มองโลกในแง่ดีเชื่อว่าความแตกต่างระหว่างการประมาณค่าตัวอย่างมีสาเหตุจากเหตุผลที่เป็นกลาง และสอดคล้องกับความแตกต่างในประชากรทั่วไป

การทดสอบสมมติฐานทางสถิติจะเป็นไปได้ก็ต่อเมื่อเป็นไปได้ที่จะสร้างขึ้นมาบางส่วนเท่านั้น ขนาด(หลักเกณฑ์) กฎหมายว่าด้วยการจำหน่ายซึ่งในกรณีเพื่อความเป็นธรรม เอช 0เป็นที่รู้จัก. จากนั้นสำหรับปริมาณนี้เราสามารถระบุได้ ช่วงความมั่นใจซึ่งมีความน่าจะเป็นที่กำหนด ร.ดค่าของมันตก ช่วงเวลานี้เรียกว่า พื้นที่วิกฤติหากค่าเกณฑ์ตกอยู่ในบริเวณวิกฤติ สมมติฐานนั้นก็จะได้รับการยอมรับ ยังไม่มี 0มิฉะนั้นจะยอมรับสมมติฐาน H 1

ในการวิจัยทางการแพทย์ใช้ P d = 0.95 หรือ P d = 0.99 ค่าเหล่านี้สอดคล้องกัน ระดับนัยสำคัญα = 0.05 หรือ α = 0.01

เมื่อทดสอบสมมติฐานทางสถิติระดับความสำคัญ(α) คือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างเมื่อเป็นจริง

โปรดทราบว่าโดยแก่นแท้แล้ว ขั้นตอนการทดสอบสมมติฐานมุ่งเป้าไปที่ การตรวจจับความแตกต่างและไม่ยืนยันว่าตนไม่อยู่ เมื่อค่าเกณฑ์เกินขอบเขตวิกฤตเราสามารถพูดกับ "ผู้ขี้ระแวง" ด้วยใจบริสุทธิ์ - คุณต้องการอะไรอีก! หากไม่มีความแตกต่าง ความน่าจะเป็น 95% (หรือ 99%) ค่าที่คำนวณได้จะอยู่ภายในขีดจำกัดที่ระบุ แต่ไม่!..

ถ้าค่าของเกณฑ์ตกอยู่ในบริเวณวิกฤติ ก็ไม่มีเหตุผลที่จะเชื่อว่าสมมติฐาน H 0 ถูกต้อง นี่น่าจะชี้ไปที่หนึ่งในสองเหตุผลที่เป็นไปได้

1. ขนาดตัวอย่างไม่ใหญ่พอที่จะตรวจจับความแตกต่างได้ มีแนวโน้มว่าการทดลองอย่างต่อเนื่องจะนำมาซึ่งความสำเร็จ

2.มีความแตกต่าง แต่มีขนาดเล็กมากจนไม่มีความสำคัญในทางปฏิบัติ ในกรณีนี้ การทดลองต่อไปไม่สมเหตุสมผล

มาดูสมมติฐานทางสถิติที่ใช้ในการวิจัยทางการแพทย์กันดีกว่า

3.6. การทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของความแปรปรวน เกณฑ์ F ของฟิชเชอร์

ในการศึกษาทางคลินิกบางเรื่อง ผลเชิงบวกนั้นไม่ชัดเจนมากนัก ขนาดของพารามิเตอร์ที่กำลังศึกษาอยู่เท่าใด เสถียรภาพ,ลดความผันผวน ในกรณีนี้ คำถามเกิดขึ้นเกี่ยวกับการเปรียบเทียบความแปรปรวนทั่วไปสองค่าโดยอิงจากผลการสำรวจตัวอย่าง ปัญหานี้สามารถแก้ไขได้โดยใช้ การทดสอบของฟิชเชอร์

คำชี้แจงของปัญหา

เช่น สุ่มตัวอย่างจากประชากรที่มีการแจกแจง ขนาดตัวอย่าง -

หมายเลข 1และ n2,ผลต่างตัวอย่างเท่ากัน ส 1 และ ส 2 2 ความแปรปรวนทั่วไป

สมมติฐานที่ทดสอบได้:

เอช 0- ความแปรปรวนทั่วไป เหมือนกัน;

เอช 1- ความแปรปรวนทั่วไป แตกต่างกัน

แสดงว่าสุ่มตัวอย่างมาจากประชากรด้วย เช่น สุ่มตัวอย่างจากประชากรที่มีการกระจายตัว แล้วถ้าสมมุติฐานเป็นจริง เอช 0อัตราส่วนของความแปรปรวนตัวอย่างเป็นไปตามการแจกแจงของฟิชเชอร์ เพื่อเป็นหลักเกณฑ์ในการตรวจสอบความเป็นธรรม เอช 0ค่าจะถูกนำไปใช้ คำนวณโดยสูตร:

ที่ไหน s 1 และ s 2 คือความแปรปรวนตัวอย่าง

อัตราส่วนนี้เป็นไปตามการแจกแจงของฟิชเชอร์ด้วยจำนวนดีกรีอิสระของตัวเศษ ν 1 = หมายเลข 1- 1 และจำนวนองศาอิสระของตัวส่วน ν 2 = n 2 - 1 ขอบเขตของขอบเขตวิกฤติพบได้โดยใช้ตารางการแจกแจงของฟิชเชอร์ หรือใช้ฟังก์ชันคอมพิวเตอร์ BRASPOBR

สำหรับตัวอย่างที่นำเสนอในตาราง 3.4 เราได้รับ: ν 1 = ν 2 = 20 - 1 = 19; เอฟ= 2.16/4.05 = 0.53 ที่ α = 0.05 ขอบเขตของบริเวณวิกฤตจะเป็นดังนี้: = 0.40, = 2.53

ค่าเกณฑ์ตกอยู่ในขอบเขตวิกฤติ ดังนั้นจึงยอมรับสมมติฐาน ฮ 0:ความแปรปรวนตัวอย่างทั่วไป เหมือนกัน

3.7. การทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของค่าเฉลี่ย หลักเกณฑ์ของนักเรียน

งานเปรียบเทียบ เฉลี่ยประชากรทั่วไปสองคนเกิดขึ้นเมื่อความสำคัญเชิงปฏิบัติชัดเจน ขนาดลักษณะที่กำลังศึกษาอยู่ เช่น เมื่อเปรียบเทียบระยะเวลาการรักษากับ 2 วิธีที่แตกต่างกัน หรือจำนวนภาวะแทรกซ้อนที่เกิดจากการใช้ ในกรณีนี้ คุณสามารถใช้แบบทดสอบของนักเรียนได้

คำชี้แจงของปัญหา

ได้รับสองตัวอย่าง (X 1) และ (X 2) สกัดจากประชากรทั่วไปด้วย เช่น สุ่มตัวอย่างจากประชากรที่มีการกระจายสินค้าและ ความแปรปรวนเดียวกันขนาดตัวอย่าง - n 1 และ n 2 หมายถึงตัวอย่างเท่ากับ X 1 และ X 2 และ ผลต่างตัวอย่าง- ส 1 2 และ ส 2 2ตามลำดับ จำเป็นต้องเปรียบเทียบ ค่าเฉลี่ยทั่วไป

สมมติฐานที่ทดสอบได้:

เอช 0- ค่าเฉลี่ยทั่วไป เหมือนกัน;

เอช 1- ค่าเฉลี่ยทั่วไป แตกต่างกัน

แสดงว่าถ้าสมมุติฐานเป็นจริง เอช 0เสื้อ ค่าคำนวณโดยสูตร:

กระจายตามกฎของนักเรียนด้วยจำนวนองศาอิสระ ν = ν 1 + + ν2 - 2

ที่นี่โดยที่ ν 1 = n 1 - 1 - จำนวนองศาอิสระสำหรับตัวอย่างแรก ν 2 = n 2 - 1 - จำนวนองศาอิสระสำหรับตัวอย่างที่สอง

ขอบเขตของขอบเขตวิกฤติพบได้โดยใช้ตารางการแจกแจงแบบ t หรือใช้ฟังก์ชันคอมพิวเตอร์ STUDRIST การแจกแจงของนักเรียนมีความสมมาตรประมาณศูนย์ ดังนั้นขอบเขตด้านซ้ายและขวาของบริเวณวิกฤตจึงมีขนาดเท่ากันและมีเครื่องหมายตรงกันข้าม: -และ

สำหรับตัวอย่างที่นำเสนอในตาราง 3.4 เราได้รับ:

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, ที= -2.51. ที่ α = 0.05 = 2.02

ค่าเกณฑ์อยู่เลยขอบเขตด้านซ้ายของบริเวณวิกฤต ดังนั้นเราจึงยอมรับสมมติฐาน ฮ 1:ค่าเฉลี่ยทั่วไป แตกต่างกันขณะเดียวกันประชากรก็เฉลี่ย ตัวอย่างแรกน้อย.

การบังคับใช้การทดสอบ t ของนักเรียน

การทดสอบของนักเรียนใช้ได้กับตัวอย่างจากเท่านั้น ปกติรวมกับ ความแปรปรวนทั่วไปที่เหมือนกันหากมีการละเมิดเงื่อนไขอย่างน้อยหนึ่งข้อ การบังคับใช้เกณฑ์ดังกล่าวจะเป็นที่น่าสงสัย ความต้องการความเป็นปกติของประชากรทั่วไปมักถูกละเลยทฤษฎีบทขีดจำกัดกลาง

อันที่จริง ความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างในตัวเศษ (3.10) สามารถพิจารณาการแจกแจงแบบปกติสำหรับ ν > 30 แต่คำถามเกี่ยวกับความเท่าเทียมกันของความแปรปรวนไม่สามารถตรวจสอบได้ และการอ้างอิงถึงข้อเท็จจริงที่ว่าการทดสอบฟิชเชอร์ตรวจไม่พบความแตกต่างนั้นไม่สามารถทำได้ เข้าบัญชี อย่างไรก็ตาม การทดสอบทีถูกนำมาใช้อย่างกว้างขวางเพื่อตรวจหาความแตกต่างในค่าเฉลี่ยประชากร แม้ว่าจะไม่มีหลักฐานเพียงพอก็ตาม ด้านล่างมีการกล่าวถึงเกณฑ์ที่ไม่ใช่พารามิเตอร์ ซึ่งนำไปใช้ได้สำเร็จตามจุดประสงค์เดียวกันและไม่ต้องใช้อะไรเลยความปกติ, ไม่ใช่ทั้งสองอย่าง

ความเท่าเทียมกันของความแปรปรวน

3.8. การเปรียบเทียบแบบไม่อิงพารามิเตอร์ของสองตัวอย่าง: เกณฑ์ของแมนน์-วิทนีย์ การทดสอบแบบไม่อิงพารามิเตอร์ได้รับการออกแบบมาเพื่อตรวจจับความแตกต่างในกฎการกระจายตัวของประชากรทั้งสอง เกณฑ์ที่อ่อนไหวต่อความแตกต่างโดยทั่วไปเฉลี่ย, เรียกว่าเกณฑ์กะ เกณฑ์ที่อ่อนไหวต่อความแตกต่างโดยทั่วไปเฉลี่ย, การกระจายตัว,มาตราส่วน. การทดสอบ Mann-Whitney อ้างอิงถึงเกณฑ์กะ และใช้ในการตรวจจับความแตกต่างในค่าเฉลี่ยของประชากรสองกลุ่ม ซึ่งเป็นตัวอย่างที่นำเสนอระดับการจัดอันดับ คุณลักษณะที่วัดได้จะอยู่ในมาตราส่วนนี้โดยเรียงจากน้อยไปหามากแล้วกำหนดหมายเลขด้วยจำนวนเต็ม 1, 2... ตัวเลขเหล่านี้เรียกว่าอันดับ ปริมาณที่เท่ากันจะได้รับการจัดอันดับที่เท่ากัน ไม่ใช่คุณค่าของคุณลักษณะเท่านั้นที่สำคัญสถานที่ลำดับ

ซึ่งจัดอยู่ในอันดับต้นๆ ของปริมาณอื่นๆ

ในตาราง 3.5. กลุ่มแรกจากตาราง 3.4 แสดงในรูปแบบขยาย (บรรทัดที่ 1) การจัดอันดับ (บรรทัดที่ 2) จากนั้นอันดับของค่าที่เหมือนกันจะถูกแทนที่ด้วยค่าเฉลี่ยเลขคณิต ตัวอย่างเช่นรายการที่ 4 และ 4 ในแถวแรกได้รับอันดับ 2 และ 3 ซึ่งถูกแทนที่ด้วยค่าเดียวกันคือ 2.5

คำชี้แจงของปัญหา

ตารางที่ 3.5 ตัวอย่างอิสระและ (X1)(เอ็กซ์ 2) หมายเลข 1และ สกัดจากประชากรทั่วไปที่มีกฎหมายการกระจายไม่ทราบ ขนาดตัวอย่างหมายเลข 2 และใช้ในการตรวจจับความแตกต่างในค่าเฉลี่ยของประชากรสองกลุ่ม ซึ่งเป็นตัวอย่างที่นำเสนอตามลำดับ ค่าขององค์ประกอบตัวอย่างจะแสดงอยู่ใน

สมมติฐานที่ทดสอบได้:

เอช 0จำเป็นต้องตรวจสอบว่าประชากรทั่วไปเหล่านี้แตกต่างกันหรือไม่? เอช 1- ตัวอย่างเป็นของประชากรทั่วไปที่แตกต่างกัน

เพื่อทดสอบสมมติฐานดังกล่าว ให้ใช้การทดสอบ (/-การทดสอบแมนน์-วิทนีย์

ขั้นแรก ตัวอย่างที่รวมกัน (X) จะถูกรวบรวมจากตัวอย่างทั้งสอง ซึ่งมีองค์ประกอบที่ได้รับการจัดอันดับ จากนั้นจะพบผลรวมของอันดับที่สอดคล้องกับองค์ประกอบของตัวอย่างแรก จำนวนนี้เป็นเกณฑ์ในการทดสอบสมมติฐาน

คุณ= ผลรวมอันดับของกลุ่มตัวอย่างแรก (3.11)

สำหรับตัวอย่างอิสระที่มีปริมาตรมากกว่า 20 จะเป็นค่า คุณเป็นไปตามการแจกแจงแบบปกติ ความคาดหวังทางคณิตศาสตร์และส่วนเบี่ยงเบนมาตรฐานที่เท่ากัน:

ดังนั้นขอบเขตของบริเวณวิกฤติจึงถูกพบตามตารางการแจกแจงแบบปกติ

สำหรับตัวอย่างที่นำเสนอในตาราง 3.4 เราได้รับ: ν 1 = ν 2 = 20 - 1 = 19 คุณ= 339, μ = 410, σ = 37 สำหรับ α = 0.05 เราได้: ซ้าย = 338 และขวา = 482

ค่าของเกณฑ์อยู่เลยขอบเขตด้านซ้ายของบริเวณวิกฤต ดังนั้นจึงยอมรับสมมติฐาน H 1: ประชากรทั่วไปมีกฎการกระจายที่แตกต่างกัน ขณะเดียวกันประชากรก็เฉลี่ย ตัวอย่างแรกน้อย.

เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา คำถามสามข้อได้รับการแก้ไข:

  • 1. ควรเว้นช่วงกี่ช่วง?
  • 2. ระยะห่างเป็นเท่าใด?
  • 3. ขั้นตอนการรวมหน่วยประชากรภายในขอบเขตของช่วงเป็นอย่างไร
  • 1. จำนวนช่วงเวลาสามารถกำหนดได้โดย สูตรสเตอร์เจส:

2. ความยาวช่วงหรือขั้นตอนช่วงมักจะถูกกำหนดโดยสูตร

ที่ไหน ร-ช่วงของการเปลี่ยนแปลง

3. ลำดับการรวมหน่วยประชากรภายในขอบเขตของช่วงเวลา

อาจแตกต่างกัน แต่เมื่อสร้างอนุกรมช่วงเวลา จะต้องกำหนดการแจกแจงอย่างเคร่งครัด

ตัวอย่างเช่น สิ่งนี้: [) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของลำดับอันดับด้วย

ขอบเขตของช่วงเวลาคือ:

  • ปิด - ด้วยค่าแอตทริบิวต์สุดขั้วสองค่า
  • เปิด - ด้วยค่าแอตทริบิวต์ที่มากสุดหนึ่งค่า (ถึงดังกล่าวและจำนวนดังกล่าวหรือ เกินดังกล่าวและจำนวนดังกล่าว)

เพื่อที่จะซึมซับเนื้อหาทางทฤษฎี เราจึงขอแนะนำ ข้อมูลความเป็นมาที่จะแก้ปัญหา งานจากต้นทางถึงปลายทาง

มีข้อมูลแบบมีเงื่อนไขเกี่ยวกับจำนวนผู้จัดการฝ่ายขายโดยเฉลี่ย ปริมาณของสินค้าที่คล้ายกันที่ขาย ราคาตลาดแต่ละรายการสำหรับผลิตภัณฑ์นี้ รวมถึงปริมาณการขายของ 30 บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในครั้งแรก ไตรมาสของปีรายงาน (ตาราง 2.1)

ตารางที่ 2.1

ข้อมูลเบื้องต้นสำหรับงานตัดขวาง

ตัวเลข

ผู้จัดการ

ราคาพันรูเบิล

ปริมาณการขายล้านรูเบิล

ตัวเลข

ผู้จัดการ

จำนวนสินค้าที่ขาย ชิ้น

ราคาพันรูเบิล

ปริมาณการขายล้านรูเบิล

เราจะจัดเตรียมงานแต่ละงานตามข้อมูลเบื้องต้นตลอดจนข้อมูลเพิ่มเติม จากนั้นเราจะนำเสนอวิธีการในการแก้ปัญหาและวิธีแก้ปัญหาด้วยตนเอง

งานตัดขวาง งาน 2.1

การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 จำเป็นสร้างชุดการกระจายของบริษัทแยกตามปริมาณสินค้าที่ขาย (ตารางที่ 2.2)

สารละลาย:

ตารางที่ 2.2

การกระจายตัวของ บริษัท แบบแยกส่วนตามปริมาณสินค้าที่ขายในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

งานตัดขวาง งาน 2.2

ที่จำเป็นสร้างบริษัทที่ได้รับการจัดอันดับ 30 บริษัทตามจำนวนผู้จัดการโดยเฉลี่ย

สารละลาย:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

งานตัดขวาง งาน 2.3

การใช้ข้อมูลเบื้องต้นจากตาราง 2.1, ที่จำเป็น:

  • 1. สร้างชุดการกระจายของบริษัทตามจำนวนผู้จัดการ
  • 2. คำนวณความถี่ของชุดการจำหน่ายของบริษัท
  • 3. วาดข้อสรุป

สารละลาย:

ลองคำนวณโดยใช้สูตรสเตอเจส (2.5) จำนวนช่วงเวลา:

ดังนั้นเราจึงใช้เวลา 6 ช่วง (กลุ่ม)

ความยาวช่วง, หรือ ขั้นตอนช่วงเวลาให้คำนวณโดยใช้สูตร

บันทึก.ลำดับการรวมหน่วยประชากรในขอบเขตของช่วงมีดังนี้: I) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย I ] ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของซีรีส์การจัดอันดับด้วย

เราสร้างอนุกรมช่วงเวลา (ตารางที่ 2.3)

การกระจายตัวของ บริษัท และจำนวนผู้จัดการโดยเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงไตรมาสแรกของปีที่รายงาน

บทสรุป.กลุ่มบริษัทที่ใหญ่ที่สุดคือกลุ่มที่มีจำนวนผู้จัดการโดยเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดซึ่งมีผู้จัดการโดยเฉลี่ย 40-45 คน มีเพียงบริษัทเดียวเท่านั้น (3%)

การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 เช่นเดียวกับชุดการกระจายของ บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างการจัดกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างลักษณะเหล่านี้

สารละลาย:

การจัดกลุ่มการวิเคราะห์ขึ้นอยู่กับลักษณะของปัจจัย ในปัญหาของเรา ลักษณะปัจจัย (x) คือจำนวนผู้จัดการ และลักษณะผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)

มาสร้างกันเลย การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)

บทสรุป.จากข้อมูลของการจัดกลุ่มการวิเคราะห์ที่สร้างขึ้น เราสามารถพูดได้ว่าเมื่อจำนวนผู้จัดการฝ่ายขายเพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งบอกถึงความเชื่อมโยงโดยตรงระหว่างลักษณะเหล่านี้

ตารางที่ 2.4

ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์

จำนวนผู้จัดการ คน

หมายเลขบริษัท

ปริมาณการขายล้านรูเบิล y

" = 59 ฉ = 9.97

ฉัน-™ 4 -ย.22

74'25 1PY1

ยู4 = 7 = 10,61

ที่ = ’ =10,31 30

ตารางที่ 2.5

การพึ่งพาปริมาณการขายกับจำนวนผู้จัดการบริษัทในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

คำถามทดสอบ
  • 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
  • 2. ตั้งชื่อขั้นตอนการสังเกตทางสถิติ
  • 3. รูปแบบการสังเกตทางสถิติขององค์กรมีรูปแบบใดบ้าง?
  • 4. ตั้งชื่อประเภทการสังเกตทางสถิติ
  • 5. สรุปทางสถิติคืออะไร?
  • 6. ตั้งชื่อประเภทของรายงานทางสถิติ
  • 7. การจัดกลุ่มทางสถิติคืออะไร?
  • 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
  • 9. ซีรีย์การจัดจำหน่ายคืออะไร?
  • 10. ตั้งชื่อองค์ประกอบโครงสร้างของแถวการแจกจ่าย
  • 11. ขั้นตอนการสร้างซีรีย์การจัดจำหน่ายมีขั้นตอนอย่างไร?

การมีข้อมูลการสังเกตทางสถิติที่มีอยู่ซึ่งแสดงถึงปรากฏการณ์เฉพาะ ประการแรกจำเป็นต้องจัดระเบียบข้อมูลเหล่านั้น เช่น ให้มีลักษณะที่เป็นระบบ

นักสถิติชาวอังกฤษ UJReichman กล่าวเป็นรูปเป็นร่างเกี่ยวกับการสะสมที่ไม่เป็นระเบียบซึ่งการเผชิญหน้ากับข้อมูลที่ไม่ทั่วไปจำนวนมากนั้นเทียบเท่ากับสถานการณ์ที่บุคคลถูกโยนเข้าไปในพุ่มไม้โดยไม่มีเข็มทิศ การจัดระบบข้อมูลทางสถิติในรูปแบบของอนุกรมการแจกแจงคืออะไร?

ชุดการแจกแจงทางสถิติเรียงลำดับตามผลรวมทางสถิติ (ตารางที่ 17) อนุกรมการแจกแจงทางสถิติประเภทที่ง่ายที่สุดคืออนุกรมการจัดอันดับ เช่น ชุดตัวเลขเรียงจากน้อยไปหามากหรือมากไปหาน้อย ซึ่งมีลักษณะแตกต่างกันไป ชุดข้อมูลดังกล่าวไม่อนุญาตให้ตัดสินรูปแบบที่มีอยู่ในข้อมูลที่กระจาย: ค่าใดที่มีตัวบ่งชี้ส่วนใหญ่จัดกลุ่มไว้ ค่าเบี่ยงเบนใดจากค่านี้ รวมไปถึงภาพการแจกแจงทั่วไป เพื่อจุดประสงค์นี้ ข้อมูลจะถูกจัดกลุ่ม โดยแสดงให้เห็นว่าการสังเกตแต่ละครั้งเกิดขึ้นในจำนวนทั้งหมดบ่อยเพียงใด (Scheme 1a 1)

- ตารางที่ 17

- มุมมองทั่วไปของชุดการแจกแจงทางสถิติ

- โครงการที่ 1 โครงการทางสถิติชุดการจัดจำหน่าย

การกระจายหน่วยประชากรตามลักษณะที่ไม่มีการแสดงออกเชิงปริมาณเรียกว่า ซีรีย์ประกอบ(เช่น การกระจายวิสาหกิจตามพื้นที่การผลิต)

ชุดการกระจายตัวของหน่วยประชากรตามลักษณะเฉพาะมีการแสดงออกเชิงปริมาณเรียกว่า ซีรีย์การเปลี่ยนแปลง- ในชุดข้อมูลดังกล่าว ค่าของคุณลักษณะ (ตัวเลือก) จะเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อย

ในชุดการแจกแจงแบบแปรผัน มีองค์ประกอบ 2 ประการที่แยกความแตกต่าง: แบบแปรผันและความถี่ - ตัวเลือก- นี่คือความหมายแยกต่างหากของลักษณะการจัดกลุ่ม ความถี่- ตัวเลขที่แสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้น

ในสถิติทางคณิตศาสตร์ จะมีการคำนวณอีกหนึ่งองค์ประกอบของชุดรูปแบบต่างๆ - บางส่วน- ส่วนหลังถูกกำหนดให้เป็นอัตราส่วนของความถี่ของกรณีในช่วงเวลาที่กำหนดต่อผลรวมของความถี่ ส่วนจะถูกกำหนดเป็นเศษส่วนของหน่วย เปอร์เซ็นต์ (%) ในหน่วย ppm (% o)

ดังนั้น ซีรีส์การกระจายรูปแบบคือซีรีส์ที่มีการจัดเรียงตัวเลือกจากน้อยไปหามากหรือจากมากไปหาน้อย และความถี่หรือความถี่ของตัวเลือกต่างๆ จะถูกระบุ อนุกรมรูปแบบเป็นแบบแยกกัน (ช่วง) และช่วงอื่นๆ (ต่อเนื่อง)

- ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง- สิ่งเหล่านี้คืออนุกรมการแจกแจงซึ่งตัวแปรเป็นค่าของคุณลักษณะเชิงปริมาณสามารถรับได้เฉพาะค่าที่แน่นอนเท่านั้น ตัวเลือกจะแตกต่างกันไปตามหน่วยตั้งแต่หนึ่งหน่วยขึ้นไป

ดังนั้น จำนวนชิ้นส่วนที่ผลิตต่อกะโดยพนักงานคนใดคนหนึ่งสามารถแสดงได้ด้วยตัวเลขเฉพาะตัวเดียวเท่านั้น (6, 10, 12 ฯลฯ) ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องอาจเป็นการกระจายตัวของคนงานตามจำนวนชิ้นส่วนที่ผลิต (ตารางที่ 18 18)

- ตารางที่ 18

- การกระจายชุดแบบไม่ต่อเนื่อง _

- ซีรีย์การเปลี่ยนแปลงช่วง (ต่อเนื่อง)- ซีรีย์การแจกแจงดังกล่าวซึ่งค่าของตัวเลือกจะได้รับในรูปแบบของช่วงเวลาเช่น ค่าของคุณสมบัติอาจแตกต่างกันเล็กน้อยโดยพลการ เมื่อสร้างชุดความผันแปรของคุณลักษณะรอบตัวแปร NEP เป็นไปไม่ได้ที่จะระบุแต่ละค่าของตัวแปร ดังนั้นประชากรจึงถูกกระจายไปตามช่วงเวลา อย่างหลังอาจเท่ากันหรือไม่เท่ากันก็ได้ สำหรับแต่ละความถี่จะมีการระบุความถี่ (ตารางที่ 1 9 19)

ในอนุกรมการแจกแจงตามช่วงเวลาซึ่งมีช่วงเวลาที่ไม่เท่ากัน คุณลักษณะทางคณิตศาสตร์ เช่น ความหนาแน่นของการแจกแจง และความหนาแน่นของการแจกแจงสัมพัทธ์ในช่วงเวลาที่กำหนดจะถูกคำนวณ ลักษณะแรกถูกกำหนดโดยอัตราส่วนของความถี่ต่อค่าของช่วงเวลาเดียวกัน ลักษณะที่สอง - โดยอัตราส่วนของความถี่ต่อค่าของช่วงเวลาเดียวกัน จากตัวอย่างข้างต้น ความหนาแน่นของการแจกแจงในช่วงแรกจะเป็น 3: 5 = 0.6 และความหนาแน่นสัมพัทธ์ในช่วงนี้คือ 7.5: 5 = 1.55%

- ตารางที่ 19

- ชุดการกระจายช่วง _

ซีรีส์รูปแบบที่ไม่ต่อเนื่องถูกสร้างขึ้นสำหรับคุณลักษณะที่ไม่ต่อเนื่อง

ในการสร้างอนุกรมความแปรผันที่แยกจากกัน คุณต้องดำเนินการตามขั้นตอนต่อไปนี้: 1) จัดเรียงหน่วยการสังเกตตามลำดับที่เพิ่มขึ้นของค่าที่ศึกษาของคุณลักษณะ

2) กำหนดค่าที่เป็นไปได้ทั้งหมดของคุณลักษณะ x i เรียงลำดับจากน้อยไปหามาก

ค่าของแอตทริบิวต์ ฉัน .

ความถี่ของค่าแอตทริบิวต์ และแสดงถึง ฉัน . ผลรวมของความถี่ทั้งหมดของอนุกรมหนึ่งๆ เท่ากับจำนวนองค์ประกอบในประชากรที่กำลังศึกษา

ตัวอย่างที่ 1 .

รายชื่อคะแนนที่นักเรียนได้รับในการสอบ: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

นี่คือหมายเลข เอ็กซ์ - ระดับเป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง และผลลัพธ์ของการประมาณค่าคือข้อมูลทางสถิติ (สังเกตได้) .

    จัดเรียงหน่วยการสังเกตตามลำดับค่าคุณลักษณะที่ศึกษาจากน้อยไปหามาก:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) กำหนดค่าที่เป็นไปได้ทั้งหมดของคุณลักษณะ x i เรียงลำดับจากน้อยไปหามาก:

ในตัวอย่างนี้ การประมาณการทั้งหมดสามารถแบ่งออกเป็นสี่กลุ่มโดยมีค่าต่อไปนี้: 2; 3; 4; 5.

ค่าของตัวแปรสุ่มที่สอดคล้องกับกลุ่มข้อมูลที่สังเกตได้นั้นเรียกว่า ค่าของแอตทริบิวต์ ตัวเลือก (ตัวเลือก) และกำหนด x ฉัน .

ตัวเลขที่แสดงจำนวนครั้งที่เรียกค่าที่สอดคล้องกันของลักษณะเฉพาะที่เกิดขึ้นในการสังเกตจำนวนหนึ่ง ความถี่ของค่าแอตทริบิวต์ และแสดงถึง ฉัน .

สำหรับตัวอย่างของเรา

คะแนน 2 เกิดขึ้น - 8 ครั้ง

คะแนน 3 เกิดขึ้น - 12 ครั้ง

คะแนน 4 เกิดขึ้น - 23 ครั้ง

คะแนน 5 เกิดขึ้น - 17 ครั้ง

มีทั้งหมด 60 คะแนน

4) เขียนข้อมูลที่ได้รับลงในตารางสองแถว (คอลัมน์) - x i และ f i

จากข้อมูลเหล่านี้ เป็นไปได้ที่จะสร้างชุดรูปแบบที่แยกจากกัน

ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง – นี่คือตารางที่ระบุค่าที่เกิดขึ้นของลักษณะที่กำลังศึกษาเป็นค่าแต่ละค่าตามลำดับจากน้อยไปหามากและความถี่

  1. การสร้างอนุกรมความแปรผันตามช่วงเวลา

นอกเหนือจากอนุกรมความแปรผันแบบแยกส่วนแล้ว ยังมักพบวิธีการจัดกลุ่มข้อมูล เช่น อนุกรมความแปรผันตามช่วงเวลา

อนุกรมช่วงเวลาจะถูกสร้างขึ้นหาก:

    เครื่องหมายมีลักษณะการเปลี่ยนแปลงอย่างต่อเนื่อง

    มีค่าไม่ต่อเนื่องกันมาก (มากกว่า 10)

    ความถี่ของค่าที่ไม่ต่อเนื่องมีขนาดเล็กมาก (ไม่เกิน 1-3 โดยมีหน่วยการสังเกตค่อนข้างมาก)

    ค่าที่ไม่ต่อเนื่องหลายค่าของคุณลักษณะที่มีความถี่เดียวกัน

ซีรีส์การเปลี่ยนแปลงช่วงเวลาเป็นวิธีการจัดกลุ่มข้อมูลในรูปแบบของตารางที่มีสองคอลัมน์ (ค่าของลักษณะเฉพาะในรูปแบบของช่วงเวลาของค่าและความถี่ของแต่ละช่วงเวลา)

ต่างจากซีรีย์ที่ไม่ต่อเนื่อง ค่าของลักษณะของซีรีย์ช่วงเวลานั้นไม่ได้แสดงด้วยค่าแต่ละค่า แต่ด้วยช่วงเวลาของค่า (“จาก - ถึง”)

หมายเลขที่แสดงจำนวนหน่วยการสังเกตที่อยู่ในแต่ละช่วงเวลาที่เลือกเรียกว่า ความถี่ของค่าแอตทริบิวต์ และแสดงถึง ฉัน . ผลรวมของความถี่ทั้งหมดของอนุกรมหนึ่งๆ เท่ากับจำนวนองค์ประกอบ (หน่วยการสังเกต) ในประชากรที่กำลังศึกษา

หากหน่วยมีค่าลักษณะเฉพาะเท่ากับขีดจำกัดบนของช่วงเวลา ควรกำหนดหน่วยนั้นให้กับช่วงเวลาถัดไป

ตัวอย่างเช่น เด็กที่มีส่วนสูง 100 ซม. จะตกอยู่ในช่วงที่ 2 ไม่ใช่ในช่วงแรก และเด็กที่มีส่วนสูง 130 ซม. จะตกอยู่ในช่วงสุดท้ายไม่ใช่ในช่วงที่สาม

จากข้อมูลเหล่านี้ สามารถสร้างอนุกรมความแปรผันตามช่วงเวลาได้

แต่ละช่วงมีขีดจำกัดล่าง (xn) ขีดจำกัดบน (xv) และความกว้างของช่วง ( ฉัน).

ขอบเขตของช่วงเวลาคือค่าของคุณลักษณะที่อยู่บนเส้นขอบของสองช่วงเวลา

ส่วนสูงของเด็ก (ซม.)

ส่วนสูงของเด็ก (ซม.)

จำนวนเด็ก

มากกว่า 130

หากช่วงมีขอบเขตบนและล่าง จะถูกเรียก ช่วงเวลาปิด- หากช่วงเวลามีเพียงขอบเขตล่างหรือบนเท่านั้น ก็จะเป็น - ช่วงเวลาเปิดสามารถเปิดได้เฉพาะช่วงแรกหรือช่วงสุดท้ายเท่านั้น ในตัวอย่างข้างต้น ช่วงสุดท้ายเปิดอยู่

ความกว้างช่วง (ฉัน) – ความแตกต่างระหว่างขีดจำกัดบนและล่าง

ฉัน = xn - x นิ้ว

ความกว้างของช่วงเปิดจะถือว่าเท่ากับความกว้างของช่วงปิดที่อยู่ติดกัน

ส่วนสูงของเด็ก (ซม.)

จำนวนเด็ก

ความกว้างช่วง (i)

สำหรับการคำนวณ 130+20=150

20 (เนื่องจากความกว้างของช่วงปิดที่อยู่ติดกันคือ 20)

อนุกรมช่วงเวลาทั้งหมดแบ่งออกเป็นอนุกรมช่วงเวลาที่มีช่วงเวลาที่เท่ากัน และอนุกรมช่วงเวลาที่มีช่วงเวลาที่ไม่เท่ากัน - ในแถวที่มีระยะห่างเท่ากัน ความกว้างของช่วงทั้งหมดจะเท่ากัน ในชุดช่วงเวลาที่มีช่วงเวลาที่ไม่เท่ากัน ความกว้างของช่วงเวลาจะแตกต่างกัน

ในตัวอย่างที่อยู่ระหว่างการพิจารณา - อนุกรมช่วงเวลาที่มีช่วงเวลาไม่เท่ากัน

งานห้องปฏิบัติการหมายเลข 1

ตามสถิติทางคณิตศาสตร์

หัวข้อ: การประมวลผลข้อมูลการทดลองเบื้องต้น

3. คะแนนเป็นคะแนน 1

5. คำถามทดสอบ.. 2

6. ระเบียบวิธีการปฏิบัติงานในห้องปฏิบัติการ.. 3

วัตถุประสงค์ของการทำงาน

การได้รับทักษะในการประมวลผลข้อมูลเชิงประจักษ์เบื้องต้นโดยใช้วิธีสถิติทางคณิตศาสตร์

ขึ้นอยู่กับจำนวนรวมของข้อมูลการทดลอง ให้ทำงานต่อไปนี้ให้เสร็จสิ้น:

ภารกิจที่ 1สร้างอนุกรมการแจกแจงความแปรผันตามช่วงเวลา

ภารกิจที่ 2สร้างฮิสโตแกรมความถี่ของอนุกรมการแปรผันช่วง

ภารกิจที่ 3สร้างฟังก์ชันการแจกแจงเชิงประจักษ์และเขียนกราฟ

ก) โหมดและค่ามัธยฐาน;

b) ช่วงเวลาเริ่มต้นที่มีเงื่อนไข;

c) ค่าเฉลี่ยตัวอย่าง;

ง) ความแปรปรวนตัวอย่าง ความแปรปรวนประชากรที่แก้ไข ค่าเบี่ยงเบนมาตรฐานที่แก้ไขแล้ว

จ) สัมประสิทธิ์ของการแปรผัน;

ฉ) ความไม่สมดุล;

g) ความโด่ง;

ภารกิจที่ 5กำหนดขอบเขตของค่าที่แท้จริงของลักษณะตัวเลขของตัวแปรสุ่มที่กำลังศึกษาด้วยความน่าเชื่อถือที่กำหนด

ภารกิจที่ 6การตีความผลลัพธ์ของการประมวลผลหลักตามเนื้อหาตามเงื่อนไขของงาน

คะแนนเป็นคะแนน

ภารกิจที่ 1-56 คะแนน

ภารกิจที่ 62 คะแนน

การป้องกันงานห้องปฏิบัติการ(สัมภาษณ์ปากเปล่าเกี่ยวกับคำถามทดสอบและงานห้องปฏิบัติการ) - 2 คะแนน

จะต้องส่งงานเป็นลายลักษณ์อักษรบนแผ่น A4 และรวมถึง:

1) หน้าชื่อเรื่อง (ภาคผนวก 1)

2) ข้อมูลเริ่มต้น

3) การส่งงานตามตัวอย่างที่กำหนด

4) ผลการคำนวณ (ทำด้วยตนเองและ/หรือใช้ MS Excel) ตามลำดับที่กำหนด

5) ข้อสรุป - การตีความผลลัพธ์ของการประมวลผลหลักตามเงื่อนไขของงานอย่างมีความหมาย

6) การสัมภาษณ์แบบปากเปล่าเกี่ยวกับงานและคำถามควบคุม



5. คำถามเพื่อความปลอดภัย


ระเบียบวิธีการปฏิบัติงานในห้องปฏิบัติการ

ภารกิจที่ 1 สร้างชุดการแจกแจงแบบแปรผันตามช่วงเวลา

ในการนำเสนอข้อมูลทางสถิติในรูปแบบของชุดรูปแบบที่มีตัวเลือกระยะห่างเท่ากัน จำเป็น:

1.ในตารางข้อมูลต้นฉบับ ให้ค้นหาค่าที่น้อยที่สุดและมากที่สุด

2.กำหนด ช่วงของการเปลี่ยนแปลง :

3. กำหนดความยาวของช่วงเวลา h หากตัวอย่างมีข้อมูลมากถึง 1,000 ข้อมูล ให้ใช้สูตร: โดยที่ n – ขนาดตัวอย่าง – จำนวนข้อมูลในกลุ่มตัวอย่าง สำหรับการคำนวณให้ใช้ lgn)

อัตราส่วนที่คำนวณได้จะถูกปัดเศษเป็น ค่าจำนวนเต็มที่สะดวก .

4. เพื่อกำหนดจุดเริ่มต้นของช่วงเวลาแรกสำหรับช่วงเวลาจำนวนคู่ ขอแนะนำให้ใช้ค่า ; และสำหรับช่วงจำนวนคี่

5. เขียนช่วงเวลาการจัดกลุ่มและจัดเรียงขอบเขตจากน้อยไปหามาก

, ,………., ,

โดยที่ขีดจำกัดล่างของช่วงแรกอยู่ที่ไหน ใช้ตัวเลขที่สะดวกซึ่งไม่เกิน ขีดจำกัดบนของช่วงสุดท้ายไม่ควรน้อยกว่า ขอแนะนำให้ช่วงต่างๆ มีค่าเริ่มต้นของตัวแปรสุ่มและแยกออกจากกัน 5 ถึง 20ช่วงเวลา

6. เขียนข้อมูลเบื้องต้นตามช่วงเวลาการจัดกลุ่ม เช่น คำนวณจากตารางแหล่งที่มาจำนวนค่าตัวแปรสุ่มที่อยู่ภายในช่วงเวลาที่กำหนด หากค่าบางค่าตรงกับขอบเขตของช่วงเวลา จากนั้นจะนำมาประกอบกับช่วงก่อนหน้าหรือช่วงต่อๆ ไปเท่านั้น

หมายเหตุ 1.ช่วงเวลาไม่จำเป็นต้องมีความยาวเท่ากัน ในพื้นที่ที่มีค่าหนาแน่นมากขึ้น จะสะดวกกว่าถ้าใช้ช่วงเวลาสั้น ๆ ที่สั้นลง และในกรณีที่มีช่วงเวลาไม่บ่อยนักก็ให้มีขนาดใหญ่ขึ้น

หมายเหตุ 2. หากได้รับค่า "ศูนย์" หรือค่าความถี่ต่ำบางค่าก็จำเป็นต้องจัดกลุ่มข้อมูลใหม่โดยขยายช่วงเวลา (เพิ่มขั้นตอน)