ลองเรียกค่าตัวอย่างต่างๆ กัน ตัวเลือกชุดของค่าและแสดงว่า: เอ็กซ์ 1 , เอ็กซ์ 2,…. ก่อนอื่นเราจะผลิต ตั้งแต่ตัวเลือกเช่น การจัดเรียงตามลำดับจากน้อยไปหามากหรือจากมากไปน้อย สำหรับแต่ละตัวเลือกจะมีการระบุน้ำหนักของตัวเองเช่น ตัวเลขที่แสดงถึงการมีส่วนร่วมของตัวเลือกที่กำหนดต่อประชากรทั้งหมด ความถี่หรือความถี่ทำหน้าที่เป็นน้ำหนัก
ความถี่ ฉัน ตัวเลือก x ฉันคือตัวเลขที่แสดงจำนวนครั้งที่ตัวเลือกที่กำหนดเกิดขึ้นในประชากรตัวอย่างที่กำลังพิจารณา
ความถี่หรือความถี่สัมพัทธ์ ฉัน ตัวเลือก x ฉันคือตัวเลขที่เท่ากับอัตราส่วนของความถี่ของตัวแปรหนึ่งต่อผลรวมของความถี่ของตัวแปรทั้งหมด ความถี่แสดงสัดส่วนของหน่วยในประชากรตัวอย่างที่มีตัวแปรที่กำหนด
เรียกว่าลำดับของตัวเลือกที่มีน้ำหนักที่สอดคล้องกัน (ความถี่หรือความถี่) ซึ่งเขียนตามลำดับจากน้อยไปมาก (หรือจากมากไปหาน้อย) ซีรีย์การเปลี่ยนแปลง.
อนุกรมรูปแบบไม่ต่อเนื่องและเป็นช่วง
สำหรับอนุกรมความแปรผันแบบแยกส่วน ค่าจุดของคุณลักษณะจะถูกระบุ สำหรับอนุกรมช่วงเวลา ค่าคุณลักษณะจะถูกระบุในรูปแบบของช่วงเวลา ชุดรูปแบบสามารถแสดงการกระจายของความถี่หรือความถี่สัมพัทธ์ (ความถี่) ขึ้นอยู่กับค่าที่ระบุสำหรับแต่ละตัวเลือก - ความถี่หรือความถี่
ชุดการกระจายความถี่แบบแยกส่วนมีรูปแบบ:
พบความถี่ตามสูตร i = 1, 2, …, ม.
ว 1 +ว 2 + … + วม. = 1.
ตัวอย่าง 4.1. สำหรับชุดตัวเลขที่กำหนด
4, 6, 6, 3, 4, 9, 6, 4, 6, 6
สร้างชุดการแปรผันแบบไม่ต่อเนื่องของการแจกแจงความถี่และความถี่
สารละลาย . ปริมาณประชากรก็เท่ากับ n= 10 อนุกรมการแจกแจงความถี่ไม่ต่อเนื่องมีรูปแบบ
ซีรีส์ Interval มีรูปแบบการบันทึกที่คล้ายกัน
ชุดการแปรผันช่วงของการแจกแจงความถี่เขียนเป็น:
ผลรวมของความถี่ทั้งหมดเท่ากับจำนวนการสังเกตทั้งหมด เช่น ปริมาณรวม: n = n 1 +n 2 + … + nม.
ชุดการแปรผันช่วงของการกระจายความถี่สัมพัทธ์ (ความถี่)มีรูปแบบ:
ความถี่พบได้จากสูตร i = 1, 2, …, ม.
ผลรวมของความถี่ทั้งหมดเท่ากับหนึ่ง: ว 1 +ว 2 + … + วม. = 1.
ซีรีย์ Interval มักใช้ในทางปฏิบัติ หากมีข้อมูลตัวอย่างทางสถิติจำนวนมากและค่าของพวกมันแตกต่างกันด้วยจำนวนที่น้อยโดยพลการ ซีรีส์ที่แยกจากกันสำหรับข้อมูลเหล่านี้จะค่อนข้างยุ่งยากและไม่สะดวกสำหรับการวิจัยเพิ่มเติม ในกรณีนี้จะใช้การจัดกลุ่มข้อมูลเช่น ช่วงเวลาที่มีค่าทั้งหมดของแอตทริบิวต์จะถูกแบ่งออกเป็นช่วงเวลาบางส่วนและโดยการคำนวณความถี่สำหรับแต่ละช่วงเวลาจะได้อนุกรมช่วงเวลา ให้เราเขียนรายละเอียดเพิ่มเติมเกี่ยวกับโครงร่างสำหรับการสร้างอนุกรมช่วงเวลาโดยสมมติว่าความยาวของช่วงเวลาบางส่วนจะเท่ากัน
2.2 การสร้างอนุกรมช่วงเวลา
ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:
กำหนดจำนวนช่วงเวลา
กำหนดความยาวของช่วงเวลา
กำหนดตำแหน่งของช่วงเวลาบนแกน
เพื่อกำหนด จำนวนช่วงเวลา เค มีสูตรของสเตอเจสตามนั้น
,
ที่ไหน n- ปริมาตรของมวลรวมทั้งหมด
ตัวอย่างเช่นหากมี 100 ค่าของคุณลักษณะ (ตัวแปร) แนะนำให้ใช้จำนวนช่วงเวลาเท่ากับช่วงเวลาเพื่อสร้างอนุกรมช่วงเวลา
อย่างไรก็ตามในทางปฏิบัติบ่อยครั้งที่นักวิจัยเลือกจำนวนช่วงเวลาโดยคำนึงถึงว่าตัวเลขนี้ไม่ควรใหญ่มากเพื่อให้ชุดข้อมูลไม่ยุ่งยาก แต่ก็ไม่เล็กมากเพื่อไม่ให้สูญเสียคุณสมบัติบางอย่างของ การกระจาย.
ความยาวช่วง ชม. กำหนดโดยสูตรต่อไปนี้:
,
ที่ไหน xสูงสุดและ x min คือค่าที่ใหญ่ที่สุดและเล็กที่สุดของตัวเลือกตามลำดับ
ขนาด เรียกว่า ขอบเขตแถว.
ในการสร้างช่วงเวลานั้นเอง พวกเขาดำเนินการด้วยวิธีที่ต่างกัน หนึ่งในวิธีที่ง่ายที่สุดมีดังนี้ จุดเริ่มต้นของช่วงแรกจะถูกนำไปเป็น
- จากนั้นสูตรจะพบขอบเขตที่เหลือของช่วงเวลา แน่นอนว่าสิ้นสุดช่วงสุดท้ายแล้ว ก m+1 ต้องเป็นไปตามเงื่อนไข
หลังจากที่ค้นพบขอบเขตของช่วงเวลาทั้งหมดแล้ว ความถี่ (หรือความถี่) ของช่วงเวลาเหล่านี้จะถูกกำหนด ในการแก้ปัญหานี้ ให้ดูตัวเลือกทั้งหมดและกำหนดจำนวนตัวเลือกที่อยู่ในช่วงเวลาหนึ่งๆ ลองดูที่การสร้างอนุกรมช่วงเวลาโดยสมบูรณ์โดยใช้ตัวอย่าง
ตัวอย่าง 4.2. สำหรับข้อมูลทางสถิติต่อไปนี้ บันทึกตามลำดับจากน้อยไปหามาก ให้สร้างอนุกรมช่วงเวลาโดยมีจำนวนช่วงเวลาเท่ากับ 5:
11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.
สารละลาย. ทั้งหมด n=50 ค่าตัวแปร
จำนวนช่วงเวลาระบุไว้ในคำชี้แจงปัญหาเช่น เค=5.
ความยาวของช่วงเวลาคือ
.
มากำหนดขอบเขตของช่วงเวลากัน:
ก 1 = 11 − 8,5 = 2,5; ก 2 = 2,5 + 17 = 19,5; ก 3 = 19,5 + 17 = 36,5;
ก 4 = 36,5 + 17 = 53,5; ก 5 = 53,5 + 17 = 70,5; ก 6 = 70,5 + 17 = 87,5;
ก 7 = 87,5 +17 = 104,5.
ในการกำหนดความถี่ของช่วงเวลา เราจะนับจำนวนตัวเลือกที่อยู่ในช่วงเวลาที่กำหนด ตัวอย่างเช่น ช่วงแรกตั้งแต่ 2.5 ถึง 19.5 จะรวมตัวเลือก 11, 12, 12, 14, 14, 15 ด้วย จำนวนของพวกเขาคือ 6 ดังนั้น ความถี่ของช่วงแรกคือ n 1 = 6 ความถี่ของช่วงแรกคือ - ช่วงที่สองจาก 19.5 ถึง 36.5 รวมถึงตัวเลือก 21, 21, 22, 23, 25 ซึ่งจำนวนคือ 5 ดังนั้นความถี่ของช่วงที่สองคือ n 2 =5 และความถี่ - เมื่อพบความถี่และความถี่ของทุกช่วงเวลาในลักษณะเดียวกันแล้ว เราจะได้อนุกรมช่วงเวลาต่อไปนี้
อนุกรมช่วงเวลาของการแจกแจงความถี่มีรูปแบบ:
ผลรวมของความถี่คือ 6+5+9+11+8+11=50
อนุกรมช่วงเวลาของการแจกแจงความถี่มีรูปแบบ:
ผลรวมของความถี่คือ 0.12+0.1+0.18+0.22+0.16+0.22=1
เมื่อสร้างอนุกรมช่วงเวลา ขึ้นอยู่กับเงื่อนไขเฉพาะของปัญหาที่กำลังพิจารณา สามารถใช้กฎอื่นๆ ได้ กล่าวคือ
1. อนุกรมความแปรผันของช่วงอาจประกอบด้วยช่วงบางส่วนที่มีความยาวต่างกัน ช่วงเวลาที่มีความยาวไม่เท่ากันทำให้สามารถเน้นคุณสมบัติของประชากรทางสถิติโดยมีการกระจายลักษณะที่ไม่สม่ำเสมอ ตัวอย่างเช่น หากขอบเขตของช่วงเวลากำหนดจำนวนผู้อยู่อาศัยในเมือง แนะนำให้ใช้ช่วงเวลาที่มีความยาวไม่เท่ากันในปัญหานี้ แน่นอนว่าสำหรับเมืองเล็กๆ จำนวนประชากรที่แตกต่างกันเล็กน้อยเป็นสิ่งสำคัญ แต่สำหรับเมืองใหญ่ ความแตกต่างของจำนวนประชากรหลายสิบหรือหลายร้อยคนนั้นไม่มีนัยสำคัญ อนุกรมช่วงที่มีความยาวไม่เท่ากันของช่วงบางส่วนมีการศึกษาในทฤษฎีสถิติทั่วไปเป็นหลัก และการพิจารณาอยู่นอกเหนือขอบเขตของคู่มือเล่มนี้
2. ในสถิติทางคณิตศาสตร์ บางครั้งการพิจารณาอนุกรมช่วงเวลา โดยถือว่าขอบเขตด้านซ้ายของช่วงแรกเท่ากับ –∞ และขอบเขตด้านขวาของช่วงสุดท้าย +∞ การทำเช่นนี้เพื่อให้การกระจายตัวทางสถิติใกล้เคียงกับค่าทางทฤษฎีมากขึ้น
3. เมื่อสร้างอนุกรมช่วงเวลา อาจกลายเป็นว่าค่าของตัวเลือกบางตัวเกิดขึ้นตรงกับขอบเขตของช่วงเวลานั้นทุกประการ สิ่งที่ดีที่สุดที่ควรทำในกรณีนี้มีดังนี้ หากมีเหตุบังเอิญเพียงครั้งเดียวให้พิจารณาว่าตัวเลือกที่พิจารณาโดยมีความถี่นั้นตกอยู่ในช่วงเวลาที่ใกล้กับช่วงกลางของอนุกรมช่วงเวลามากขึ้น หากมีหลายตัวเลือกดังกล่าว ตัวเลือกทั้งหมดจะถูกกำหนดให้กับช่วงเวลานั้น ทางด้านขวาของตัวเลือกเหล่านี้ หรือทั้งหมดถูกกำหนดไว้ทางด้านซ้าย
4. หลังจากกำหนดจำนวนช่วงเวลาและความยาวแล้ว การจัดเรียงช่วงเวลาสามารถทำได้ในอีกทางหนึ่ง ค้นหาค่าเฉลี่ยเลขคณิตของค่าที่พิจารณาทั้งหมดของตัวเลือก เอ็กซ์พ และสร้างช่วงแรกในลักษณะที่ค่าเฉลี่ยตัวอย่างนี้จะอยู่ภายในช่วงหนึ่ง ดังนั้นเราจึงได้ช่วงเวลาจาก เอ็กซ์พ – 0.5 ชม.ถึง เอ็กซ์เฉลี่ย.. + 0.5 ชม.- จากนั้นไปทางซ้ายและขวาโดยเพิ่มความยาวของช่วงเวลาเราสร้างช่วงเวลาที่เหลือจนกระทั่ง xนาทีและ xค่าสูงสุดจะไม่อยู่ในช่วงแรกและช่วงสุดท้ายตามลำดับ
5. อนุกรมช่วงเวลาที่มีช่วงเวลาจำนวนมากจะถูกเขียนในแนวตั้งอย่างสะดวก เช่น เขียนช่วงเวลาไม่อยู่ในแถวแรก แต่อยู่ในคอลัมน์แรก และความถี่ (หรือความถี่) ในคอลัมน์ที่สอง
ข้อมูลตัวอย่างถือได้ว่าเป็นค่าของตัวแปรสุ่มบางตัว เอ็กซ์- ตัวแปรสุ่มมีกฎการแจกแจงของตัวเอง จากทฤษฎีความน่าจะเป็นเป็นที่ทราบกันว่ากฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถระบุได้ในรูปแบบของอนุกรมการแจกแจง และสำหรับกฎการแจกแจงต่อเนื่อง - โดยใช้ฟังก์ชันความหนาแน่นของการแจกแจง อย่างไรก็ตาม มีกฎการแจกแจงแบบสากลที่ใช้กับตัวแปรสุ่มทั้งแบบไม่ต่อเนื่องและต่อเนื่อง กฎหมายการกระจายนี้กำหนดให้เป็นฟังก์ชันการกระจาย เอฟ(x) = ป(เอ็กซ์<x- สำหรับข้อมูลตัวอย่าง คุณสามารถระบุฟังก์ชันการแจกแจงแบบอะนาล็อกได้ - ฟังก์ชันการแจกแจงเชิงประจักษ์
ข้อมูลที่เกี่ยวข้อง.
ชุดค่าของพารามิเตอร์ที่ศึกษาในการทดลองหรือการสังเกตที่กำหนดซึ่งจัดอันดับตามค่า (เพิ่มหรือลด) เรียกว่าชุดรูปแบบ
สมมติว่าเราวัดความดันโลหิตของผู้ป่วยสิบรายเพื่อให้ได้ค่าความดันโลหิตสูงสุด: ความดันซิสโตลิก เช่น มีเพียงหมายเลขเดียวเท่านั้น
ลองจินตนาการว่าชุดของการสังเกต (ผลรวมทางสถิติ) ของความดันซิสโตลิกของหลอดเลือดแดงในการสังเกต 10 ครั้งมีรูปแบบดังต่อไปนี้ (ตารางที่ 1):
ตารางที่ 1
ส่วนประกอบของชุดรูปแบบต่างๆ เรียกว่า ชุดรูปแบบต่างๆ ตัวเลือกนี้แสดงถึงค่าตัวเลขของคุณลักษณะที่กำลังศึกษา
การสร้างชุดความแปรผันจากชุดการสังเกตทางสถิติเป็นเพียงก้าวแรกในการทำความเข้าใจคุณลักษณะของชุดทั้งชุด ต่อไป จำเป็นต้องกำหนดระดับเฉลี่ยของลักษณะเชิงปริมาณที่กำลังศึกษา (ระดับโปรตีนในเลือดเฉลี่ย น้ำหนักเฉลี่ยของผู้ป่วย เวลาเฉลี่ยในการดมยาสลบ ฯลฯ)
ระดับเฉลี่ยวัดโดยใช้เกณฑ์ที่เรียกว่าค่าเฉลี่ย ค่าเฉลี่ยเป็นคุณลักษณะเชิงตัวเลขทั่วไปของค่าที่เป็นเนื้อเดียวกันในเชิงคุณภาพ โดยแสดงลักษณะเฉพาะของประชากรทางสถิติทั้งหมดด้วยตัวเลขหนึ่งตัวตามเกณฑ์เดียว ค่าเฉลี่ยแสดงถึงสิ่งที่เหมือนกันกับคุณลักษณะในชุดการสังเกตที่กำหนด
ค่าเฉลี่ยที่ใช้ทั่วไปมีสามประเภท: โหมด (), ค่ามัธยฐาน () และค่าเฉลี่ยเลขคณิต ()
ในการหาค่าเฉลี่ยใดๆ จำเป็นต้องใช้ผลลัพธ์ของการสังเกตแต่ละรายการ โดยบันทึกไว้ในรูปแบบของชุดรูปแบบต่างๆ (ตารางที่ 2)
แฟชั่น- ค่าที่เกิดขึ้นบ่อยที่สุดในชุดการสังเกต ในตัวอย่างของเรา โหมด = 120 หากไม่มีค่าซ้ำในชุดรูปแบบ แสดงว่าไม่มีโหมด หากมีการทำซ้ำหลายค่าในจำนวนครั้งเท่ากัน ค่าที่น้อยที่สุดจะถูกใช้เป็นโหมด
ค่ามัธยฐาน- ค่าที่แบ่งการแจกแจงออกเป็นสองส่วนเท่าๆ กัน คือค่ากลางหรือค่ามัธยฐานของชุดการสังเกตโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อย ดังนั้น หากมี 5 ค่าในชุดรูปแบบ ค่ามัธยฐานจะเท่ากับพจน์ที่สามของชุดรูปแบบนั้น หากมีพจน์เป็นจำนวนคู่ ค่ามัธยฐานจะเป็นค่าเฉลี่ยเลขคณิตของทั้งสอง การสังเกตจากส่วนกลาง เช่น หากมีการสังเกต 10 ครั้งในอนุกรมหนึ่ง ค่ามัธยฐานจะเท่ากับค่าเฉลี่ยเลขคณิตของการสังเกตครั้งที่ 5 และ 6 ในตัวอย่างของเรา
ให้เราสังเกตคุณสมบัติที่สำคัญของโหมดและค่ามัธยฐาน: ค่าของพวกมันไม่ได้รับอิทธิพลจากค่าตัวเลขของตัวแปรที่รุนแรง
ค่าเฉลี่ยเลขคณิตคำนวณโดยสูตร:
โดยที่ค่าที่สังเกตได้ในการสังเกตครั้งที่ - คือจำนวนการสังเกต สำหรับกรณีของเรา
ค่าเฉลี่ยเลขคณิตมีคุณสมบัติสามประการ:
ค่าเฉลี่ยครองตำแหน่งตรงกลางในชุดรูปแบบต่างๆ ในแถวที่สมมาตรอย่างเคร่งครัด
ค่าเฉลี่ยเป็นค่าทั่วไป และความผันผวนแบบสุ่มและความแตกต่างของข้อมูลแต่ละรายการจะไม่สามารถมองเห็นได้หลังค่าเฉลี่ย มันสะท้อนให้เห็นถึงสิ่งที่เป็นเรื่องปกติของประชากรทั้งหมด
ผลรวมของการเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยคือศูนย์: ระบุความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย
ซีรีส์รูปแบบต่างๆ ประกอบด้วยรูปแบบต่างๆ และความถี่ที่สอดคล้องกัน จากสิบค่าที่ได้นั้น มีเลข 120 เกิดขึ้น 6 ครั้ง 115 - 3 ครั้ง 125 - 1 ครั้ง ความถี่ () - จำนวนสัมบูรณ์ของตัวแปรแต่ละรายการในผลรวม ซึ่งระบุจำนวนครั้งที่ตัวแปรที่กำหนดเกิดขึ้นในซีรีส์ของรูปแบบต่างๆ
ซีรีย์รูปแบบอาจเป็นแบบง่าย (ความถี่ = 1) หรือจัดกลุ่มและย่อให้สั้นลง โดยมี 3-5 ตัวเลือก ชุดข้อมูลแบบง่ายใช้สำหรับการสังเกตจำนวนเล็กน้อย () ชุดข้อมูลแบบจัดกลุ่มใช้สำหรับการสังเกตจำนวนมาก ()
Variation series - ซีรีส์ที่มีการเปรียบเทียบ (ตามระดับการเพิ่มขึ้นหรือลดลง) ตัวเลือกและสอดคล้องกัน ความถี่
ตัวเลือกคือการแสดงออกเชิงปริมาณส่วนบุคคลของคุณลักษณะ ระบุด้วยตัวอักษรละติน วี - ความเข้าใจแบบดั้งเดิมของคำว่า "ตัวแปร" ถือว่าแต่ละค่าที่ไม่ซ้ำกันของคุณลักษณะเรียกว่าตัวแปร โดยไม่คำนึงถึงจำนวนการทำซ้ำ
ตัวอย่างเช่น ในชุดการเปลี่ยนแปลงของตัวบ่งชี้ความดันโลหิตซิสโตลิกที่วัดในผู้ป่วย 10 ราย:
110, 120, 120, 130, 130, 130, 140, 140, 160, 170;
มีเพียง 6 ค่าเท่านั้น:
110, 120, 130, 140, 160, 170.
ความถี่คือตัวเลขที่ระบุจำนวนครั้งที่ตัวเลือกนั้นถูกทำซ้ำ เขียนแทนด้วยอักษรละติน ป - ผลรวมของความถี่ทั้งหมด (ซึ่งแน่นอนว่าเท่ากับจำนวนความถี่ทั้งหมดที่ศึกษา) แสดงว่า n.
- ในตัวอย่างของเรา ความถี่จะใช้ค่าต่อไปนี้:
- สำหรับตัวเลือก 110 ความถี่ P = 1 (ค่า 110 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 120 ความถี่ P = 2 (ค่า 120 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 130 ความถี่ P = 3 (ค่า 130 เกิดขึ้นในผู้ป่วย 3 ราย)
- สำหรับตัวเลือก 140 ความถี่ P = 2 (ค่า 140 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 160 ความถี่ P = 1 (ค่า 160 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 170 ความถี่ P = 1 (ค่า 170 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
ประเภทของซีรี่ส์รูปแบบ:
- เรียบง่าย- นี่คืออนุกรมที่แต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว (ความถี่ทั้งหมดเท่ากับ 1)
- ถูกระงับ- ซีรีส์ที่มีตัวเลือกตั้งแต่หนึ่งรายการขึ้นไปปรากฏขึ้นมากกว่าหนึ่งครั้ง
ซีรี่ส์รูปแบบต่างๆ ใช้เพื่ออธิบายอาร์เรย์จำนวนมาก ในรูปแบบนี้ข้อมูลที่รวบรวมได้จากการศึกษาทางการแพทย์ส่วนใหญ่จะถูกนำเสนอในขั้นต้น เพื่อกำหนดลักษณะเฉพาะของชุดรูปแบบต่างๆ จะมีการคำนวณตัวบ่งชี้พิเศษ ซึ่งรวมถึงค่าเฉลี่ย ตัวบ่งชี้ความแปรปรวน (ที่เรียกว่าการกระจายตัว) และตัวบ่งชี้ความเป็นตัวแทนของข้อมูลตัวอย่าง
ตัวบ่งชี้ชุดรูปแบบต่างๆ
1) ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะของขนาดของคุณลักษณะที่กำลังศึกษา ค่าเฉลี่ยเลขคณิตแสดงเป็น ม เป็นค่าเฉลี่ยประเภทหนึ่งที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าตัวบ่งชี้ของหน่วยการสังเกตทั้งหมดต่อจำนวนวิชาทั้งหมดที่ศึกษา วิธีการคำนวณค่าเฉลี่ยเลขคณิตจะแตกต่างกันไปสำหรับอนุกรมการแปรผันแบบง่ายและแบบถ่วงน้ำหนัก
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตอย่างง่าย:
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
M = Σ(V * P)/n
2) โหมดเป็นค่าเฉลี่ยอีกค่าหนึ่งของอนุกรมรูปแบบ ซึ่งสอดคล้องกับตัวเลือกที่เกิดซ้ำบ่อยที่สุด หรือพูดอีกอย่างคือนี่คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด แสดงว่า โม - โหมดนี้คำนวณสำหรับอนุกรมแบบถ่วงน้ำหนักเท่านั้น เนื่องจากในชุดแบบธรรมดาไม่มีตัวเลือกใดซ้ำกันและความถี่ทั้งหมดจะเท่ากับหนึ่ง
ตัวอย่างเช่น ในชุดรูปแบบต่างๆ ของค่าอัตราการเต้นของหัวใจ:
80, 84, 84, 86, 86, 86, 90, 94;
ค่าโหมดคือ 86 เนื่องจากตัวเลือกนี้เกิดขึ้น 3 ครั้ง ดังนั้นความถี่จึงสูงที่สุด
3) ค่ามัธยฐาน - ค่าของตัวเลือกที่แบ่งซีรี่ส์รูปแบบออกเป็นครึ่งหนึ่ง: ทั้งสองด้านมีตัวเลือกจำนวนเท่ากัน ค่ามัธยฐาน เช่นเดียวกับค่าเฉลี่ยเลขคณิตและโหมด หมายถึงค่าเฉลี่ย แสดงว่า ฉัน
4) ส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนซิกมา ซิกมา) - การวัดความแปรปรวนของอนุกรมความแปรผัน เป็นตัวบ่งชี้สำคัญที่รวมทุกกรณีของการเบี่ยงเบนจากค่าเฉลี่ย ในความเป็นจริง มันตอบคำถามว่าตัวแปรต่างๆ กระจายจากค่าเฉลี่ยเลขคณิตไปไกลแค่ไหนและบ่อยแค่ไหน เขียนแทนด้วยอักษรกรีก σ ("ซิกมา").
หากขนาดประชากรมากกว่า 30 หน่วย ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรต่อไปนี้
สำหรับประชากรขนาดเล็ก - 30 หน่วยการสังเกตหรือน้อยกว่า - ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรอื่น:
จากการเรียนรู้บทนี้ นักเรียนจะต้อง: ทราบ
- ตัวชี้วัดความแปรปรวนและความสัมพันธ์
- กฎพื้นฐานของการกระจายลักษณะ
- สาระสำคัญของเกณฑ์ความยินยอม สามารถ
- คำนวณดัชนีความแปรปรวนและเกณฑ์ความดีเหมาะสม
- กำหนดลักษณะการกระจาย
- ประเมินลักษณะเชิงตัวเลขหลักของอนุกรมการแจกแจงทางสถิติ
เป็นเจ้าของ
- วิธีการวิเคราะห์ทางสถิติของอนุกรมการแจกแจง
- พื้นฐานของการวิเคราะห์ความแปรปรวน
- เทคนิคการตรวจสอบอนุกรมการแจกแจงทางสถิติให้เป็นไปตามกฎพื้นฐานของการแจกแจง
ตัวชี้วัดการเปลี่ยนแปลง
ในการศึกษาทางสถิติเกี่ยวกับลักษณะของประชากรทางสถิติต่างๆ เป็นเรื่องที่น่าสนใจอย่างยิ่งที่จะศึกษาความแปรผันของลักษณะของหน่วยสถิติแต่ละหน่วยของประชากร ตลอดจนลักษณะของการกระจายหน่วยตามลักษณะนี้ การเปลี่ยนแปลง -นี่คือความแตกต่างในคุณค่าส่วนบุคคลของลักษณะเฉพาะในหน่วยของประชากรที่กำลังศึกษา การศึกษาความแปรผันมีความสำคัญอย่างยิ่งในทางปฏิบัติ จากระดับความแปรผัน เราสามารถตัดสินขีดจำกัดของการแปรผันของคุณลักษณะ ความสม่ำเสมอของประชากรสำหรับคุณลักษณะที่กำหนด ลักษณะทั่วไปของค่าเฉลี่ย และความสัมพันธ์ของปัจจัยที่กำหนดความแปรผัน ตัวบ่งชี้การเปลี่ยนแปลงใช้เพื่อระบุลักษณะและจัดระเบียบประชากรทางสถิติ
ผลลัพธ์ของการสรุปและการจัดกลุ่มวัสดุสังเกตทางสถิติที่นำเสนอในรูปแบบของชุดการแจกแจงทางสถิติ แสดงถึงการกระจายตามลำดับของหน่วยประชากรที่กำลังศึกษาออกเป็นกลุ่มตามเกณฑ์การจัดกลุ่ม (แปรผัน) หากใช้คุณลักษณะเชิงคุณภาพเป็นพื้นฐานสำหรับการจัดกลุ่มก็จะเรียกชุดการแจกจ่ายดังกล่าว เนื่องมาจาก(แบ่งตามอาชีพ เพศ สีผิว ฯลฯ) หากซีรีย์การจัดจำหน่ายถูกสร้างขึ้นบนพื้นฐานเชิงปริมาณ ซีรีย์ดังกล่าวจะถูกเรียก แปรผัน(กระจายตามส่วนสูง น้ำหนัก เงินเดือน ฯลฯ) การสร้างอนุกรมความแปรผันหมายถึงการจัดการการกระจายเชิงปริมาณของหน่วยประชากรตามค่าลักษณะเฉพาะ นับจำนวนหน่วยประชากรด้วยค่าเหล่านี้ (ความถี่) และจัดเรียงผลลัพธ์ในตาราง
แทนที่จะเป็นความถี่ของตัวแปร คุณสามารถใช้อัตราส่วนกับปริมาตรรวมของการสังเกต ซึ่งเรียกว่าความถี่ (ความถี่สัมพัทธ์)
ซีรีย์รูปแบบมีสองประเภท: แบบแยกและแบบช่วงเวลา ซีรีส์แยก- นี่คือซีรีส์รูปแบบต่างๆ ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (ลักษณะเฉพาะที่ไม่ต่อเนื่อง) หลังรวมถึงจำนวนพนักงานในองค์กร ประเภทภาษี จำนวนเด็กในครอบครัว ฯลฯ ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์ หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งภายในขอบเขตที่กำหนดสามารถใช้ค่าใด ๆ ก็ได้) ดังนั้นสำหรับคุณลักษณะนี้จึงสามารถสร้างได้ อนุกรมการเปลี่ยนแปลงช่วงเวลาเมื่อสร้างอนุกรมการเปลี่ยนแปลงช่วงเวลา ตารางจะมีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่) ความถี่ (ความถี่การทำซ้ำ) - จำนวนการทำซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ ช่วงเวลาสามารถปิดหรือเปิดได้ ช่วงเวลาปิดจะถูกจำกัดทั้งสองด้าน กล่าวคือ มีทั้งขอบเขตล่าง (“จาก”) และขอบเขตบน (“ถึง”) ช่วงเปิดจะมีขอบเขตเดียว: บนหรือล่าง หากตัวเลือกจัดเรียงตามลำดับจากน้อยไปหามากหรือจากมากไปน้อย แถวต่างๆ จะถูกเรียก จัดอันดับ
สำหรับซีรีย์รูปแบบต่างๆ มีตัวเลือกการตอบสนองความถี่สองประเภท: ความถี่สะสม และความถี่สะสม ความถี่สะสมแสดงจำนวนการสังเกตค่าของลักษณะเฉพาะที่รับค่าน้อยกว่าค่าที่กำหนด ความถี่สะสมถูกกำหนดโดยการรวมค่าความถี่ของคุณลักษณะสำหรับกลุ่มที่กำหนดกับความถี่ทั้งหมดของกลุ่มก่อนหน้า ความถี่สะสมจะแสดงลักษณะของสัดส่วนของหน่วยการสังเกตที่มีค่าแอตทริบิวต์ไม่เกินขีดจำกัดบนของกลุ่มที่กำหนด ดังนั้นความถี่สะสมจึงแสดงสัดส่วนของตัวเลือกในผลรวมซึ่งมีค่าไม่มากกว่าค่าที่กำหนด ความถี่ ความถี่ ความหนาแน่นสัมบูรณ์และสัมพัทธ์ ความถี่และความถี่สะสมเป็นคุณลักษณะของขนาดของตัวแปร
มีการศึกษาความแปรผันในลักษณะหน่วยทางสถิติของประชากรตลอดจนลักษณะของการกระจาย โดยใช้ตัวบ่งชี้และลักษณะของชุดข้อมูลรูปแบบต่างๆ ซึ่งรวมถึงระดับเฉลี่ยของชุดข้อมูล ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว , สัมประสิทธิ์การแกว่ง, การแปรผัน, ความไม่สมมาตร, ความโด่ง ฯลฯ
ค่าเฉลี่ยใช้เพื่อกำหนดลักษณะของศูนย์กระจายสินค้า ค่าเฉลี่ยเป็นคุณลักษณะทางสถิติทั่วไป โดยจะวัดปริมาณระดับทั่วไปของคุณลักษณะที่สมาชิกของประชากรที่กำลังศึกษาครอบครองอยู่ อย่างไรก็ตาม กรณีที่มีความบังเอิญของค่าเฉลี่ยเลขคณิตที่มีรูปแบบการแจกแจงที่แตกต่างกันจึงเป็นไปได้ ดังนั้น เนื่องจากลักษณะทางสถิติของชุดการแปรผัน จึงคำนวณสิ่งที่เรียกว่าวิธีโครงสร้าง - โหมด ค่ามัธยฐาน และควอนไทล์ ซึ่งแบ่งชุดการแจกแจงออกเป็นส่วนเท่า ๆ กัน (ควอไทล์ เดซิล เปอร์เซ็นไทล์ ฯลฯ )
แฟชั่น -นี่คือค่าของลักษณะเฉพาะที่เกิดขึ้นในชุดการแจกแจงบ่อยกว่าค่าอื่นๆ สำหรับซีรีย์แยก นี่คือตัวเลือกที่มีความถี่สูงสุด ในซีรีย์การเปลี่ยนแปลงช่วงเวลา เพื่อกำหนดโหมด จำเป็นต้องกำหนดช่วงเวลาที่โหมดนั้นตั้งอยู่ก่อน ซึ่งเรียกว่าช่วงโมดอล ในอนุกรมรูปแบบที่มีช่วงเวลาเท่ากัน ช่วงโมดอลจะถูกกำหนดโดยความถี่สูงสุด ในอนุกรมที่มีช่วงเวลาที่ไม่เท่ากัน - แต่โดยความหนาแน่นของการแจกแจงสูงสุด จากนั้นจะใช้สูตรเพื่อกำหนดโหมดในแถวในช่วงเวลาที่เท่ากัน
โดยที่ Mo คือมูลค่าแฟชั่น xMo - ขีดจำกัดล่างของช่วงเวลาโมดอล ชม-ความกว้างช่วงกิริยา; / Mo - ความถี่ของช่วงเวลาโมดอล; / Mo j คือความถี่ของช่วงพรีโมดัล / Mo+1 คือความถี่ของช่วงหลังโมดอล และสำหรับชุดข้อมูลที่มีช่วงเวลาไม่เท่ากันในสูตรการคำนวณนี้ แทนที่จะใช้ความถี่ / Mo, / Mo, / Mo ควรใช้ความหนาแน่นของการแจกแจง จิตใจ 0 _| , จิตใจ 0> ยูโม่+"
หากมีโหมดเดียว การแจกแจงความน่าจะเป็นของตัวแปรสุ่มจะเรียกว่ายูนิโมดัล หากมีมากกว่าหนึ่งโหมดจะเรียกว่า multimodal (polymodal, multimodal) ในกรณีของสองโหมด - bimodal ตามกฎแล้ว multimodality บ่งชี้ว่าการแจกแจงภายใต้การศึกษาไม่เป็นไปตามกฎการแจกแจงแบบปกติ ตามกฎแล้ว ประชากรที่เป็นเนื้อเดียวกันมีลักษณะเฉพาะด้วยการแจกแจงจุดยอดเดี่ยว Multivertex ยังบ่งบอกถึงความหลากหลายของประชากรที่กำลังศึกษาอีกด้วย การปรากฏตัวของจุดยอดตั้งแต่สองจุดขึ้นไปทำให้จำเป็นต้องจัดกลุ่มข้อมูลใหม่เพื่อระบุกลุ่มที่เป็นเนื้อเดียวกันมากขึ้น
ในชุดความแปรผันตามช่วงเวลา สามารถกำหนดโหมดได้เป็นกราฟิกโดยใช้ฮิสโตแกรม เมื่อต้องการทำเช่นนี้ ให้ลากเส้นสองเส้นที่ตัดกันจากด้านบนของคอลัมน์ที่สูงที่สุดของฮิสโตแกรมไปยังด้านบนของคอลัมน์สองคอลัมน์ที่อยู่ติดกัน จากนั้น จากจุดตัดกัน เส้นตั้งฉากจะลดลงไปบนแกนแอบซิสซา ค่าของคุณลักษณะบนแกน x ที่สอดคล้องกับแนวตั้งฉากคือโหมด ในหลายกรณี เมื่อระบุลักษณะประชากร การตั้งค่าจะถูกกำหนดให้กับโหมดมากกว่าค่าเฉลี่ยเลขคณิตเพื่อเป็นตัวบ่งชี้ทั่วไป
ค่ามัธยฐาน -นี่คือค่าส่วนกลางของแอ็ตทริบิวต์ ซึ่งถูกครอบครองโดยสมาชิกศูนย์กลางของซีรีย์อันดับของการแจกแจง ในอนุกรมแบบแยกกัน หากต้องการหาค่ามัธยฐาน จะต้องพิจารณาหมายเลขซีเรียลของมันก่อน เมื่อต้องการทำเช่นนี้ หากจำนวนหน่วยเป็นเลขคี่ หน่วยหนึ่งจะถูกบวกเข้ากับผลรวมของความถี่ทั้งหมด และจำนวนจะถูกหารด้วยสอง หากมีหน่วยเป็นจำนวนคู่ติดต่อกันก็จะมีหน่วยมัธยฐานสองหน่วย ดังนั้นในกรณีนี้ ค่ามัธยฐานจึงถูกกำหนดให้เป็นค่าเฉลี่ยของค่ามัธยฐานทั้งสองหน่วย ดังนั้น ค่ามัธยฐานของอนุกรมความแปรผันแบบไม่ต่อเนื่องคือค่าที่แบ่งอนุกรมออกเป็นสองส่วนซึ่งมีจำนวนตัวเลือกเท่ากัน
ในอนุกรมช่วงเวลาหลังจากกำหนดหมายเลขซีเรียลของค่ามัธยฐานแล้ว จะพบช่วงค่ามัธยฐานโดยใช้ความถี่สะสม (ความถี่) จากนั้นใช้สูตรในการคำนวณค่ามัธยฐานค่าของค่ามัธยฐานจะถูกกำหนด:
โดยที่ Me คือค่ามัธยฐาน x ฉัน -ขีดจำกัดล่างของช่วงค่ามัธยฐาน ชม-ความกว้างของช่วงค่ามัธยฐาน - ผลรวมของความถี่ของอนุกรมการแจกแจง /D - ความถี่สะสมของช่วงก่อนมัธยฐาน / Me - ความถี่ของช่วงค่ามัธยฐาน
ค่ามัธยฐานสามารถพบได้แบบกราฟิกโดยใช้การสะสม เมื่อต้องการทำเช่นนี้ ในระดับความถี่สะสม (ความถี่) ของการสะสม จากจุดที่สอดคล้องกับเลขลำดับของค่ามัธยฐาน เส้นตรงจะถูกลากขนานกับแกน abscissa จนกระทั่งตัดกับค่าสะสม ถัดไปจากจุดตัดของเส้นที่ระบุพร้อมกับการสะสม ตั้งฉากจะลดลงไปที่แกน abscissa ค่าของคุณลักษณะบนแกน x ที่สอดคล้องกับพิกัดที่วาด (ตั้งฉาก) คือค่ามัธยฐาน
ค่ามัธยฐานมีคุณสมบัติดังต่อไปนี้
- 1. มันไม่ได้ขึ้นอยู่กับค่าแอตทริบิวต์เหล่านั้นที่อยู่ด้านใดด้านหนึ่งของมัน
- 2. มีคุณสมบัติของความน้อยที่สุดซึ่งหมายความว่าผลรวมของการเบี่ยงเบนสัมบูรณ์ของค่าแอตทริบิวต์จากค่ามัธยฐานแสดงถึงค่าต่ำสุดเมื่อเทียบกับค่าเบี่ยงเบนของค่าแอตทริบิวต์จากค่าอื่น ๆ
- 3. เมื่อรวมการแจกแจงสองค่าเข้ากับค่ามัธยฐานที่ทราบ เป็นไปไม่ได้ที่จะทำนายค่ามัธยฐานของการแจกแจงใหม่ล่วงหน้าได้
คุณสมบัติค่ามัธยฐานเหล่านี้ใช้กันอย่างแพร่หลายในการออกแบบที่ตั้งจุดบริการสาธารณะ เช่น โรงเรียน คลินิก ปั๊มน้ำมัน ปั๊มน้ำ เป็นต้น ตัวอย่างเช่น หากมีการวางแผนที่จะสร้างคลินิกในบล็อกหนึ่งของเมือง ก็จะเป็นการสะดวกกว่าที่จะตั้งอยู่ในจุดหนึ่งในบล็อกที่ไม่ลดความยาวของบล็อกลงครึ่งหนึ่ง แต่ลดจำนวนผู้อยู่อาศัยลงครึ่งหนึ่ง
อัตราส่วนของโหมด ค่ามัธยฐาน และค่าเฉลี่ยเลขคณิตบ่งชี้ถึงลักษณะของการกระจายตัวของคุณลักษณะโดยรวม และช่วยให้เราประเมินความสมมาตรของการแจกแจงได้ ถ้า x ฉัน แล้วอนุกรมนี้จะมีความไม่สมมาตรทางด้านขวา โดยมีการกระจายแบบปกติ เอ็กซ์ -ฉัน-โม
K. Pearson จากการจัดตำแหน่งของเส้นโค้งประเภทต่างๆ พบว่าสำหรับการแจกแจงแบบอสมมาตรปานกลาง ความสัมพันธ์โดยประมาณระหว่างค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และแบบวิธีต่อไปนี้ใช้ได้:
โดยที่ Me คือค่ามัธยฐาน โม - ความหมายของแฟชั่น x เลขคณิต - ค่าของค่าเฉลี่ยเลขคณิต
หากจำเป็นต้องศึกษาโครงสร้างของซีรีย์รูปแบบต่างๆ ให้ละเอียดยิ่งขึ้น ให้คำนวณค่าลักษณะเฉพาะที่คล้ายกับค่ามัธยฐาน ค่าคุณลักษณะดังกล่าวแบ่งหน่วยการแจกแจงทั้งหมดออกเป็นจำนวนเท่ากัน เรียกว่าควอนไทล์หรือการไล่ระดับสี ควอไทล์แบ่งออกเป็นควอร์ไทล์ เดซิล เปอร์เซ็นไทล์ ฯลฯ
ควอไทล์แบ่งประชากรออกเป็นสี่ส่วนเท่า ๆ กัน ควอร์ไทล์แรกคำนวณคล้ายกับค่ามัธยฐานโดยใช้สูตรในการคำนวณควอไทล์แรกโดยกำหนดช่วงไตรมาสแรกไว้ก่อนหน้านี้:
โดยที่ Qi คือค่าของควอไทล์ที่หนึ่ง เอ็กซ์คิว^-ขีดจำกัดล่างของช่วงควอไทล์แรก ชม.- ความกว้างของช่วงไตรมาสแรก /, - ความถี่ของอนุกรมช่วงเวลา;
ความถี่สะสมในช่วงก่อนช่วงควอไทล์แรก Jq ( - ความถี่ของช่วงควอไทล์แรก
ควอไทล์ที่ 1 แสดงว่า 25% ของหน่วยประชากรน้อยกว่ามูลค่าของมัน และ 75% มีค่ามากกว่า ควอร์ไทล์ที่สองมีค่าเท่ากับค่ามัธยฐานนั่นคือ คำถามที่ 2 =ฉัน.
โดยการเปรียบเทียบ ควอไทล์ที่สามจะถูกคำนวณ โดยพบช่วงไตรมาสที่สามเป็นครั้งแรก:
โดยที่ขีด จำกัด ล่างของช่วงควอไทล์ที่สามคือ ชม.- ความกว้างของช่วงควอไทล์ที่สาม /, - ความถี่ของอนุกรมช่วงเวลา; /เอ็กซ์" -ความถี่สะสมในช่วงเวลาก่อนหน้า
ช
ช่วงควอไทล์ที่สาม Jq คือความถี่ของช่วงควอไทล์ที่สาม
ควอไทล์ที่สามแสดงให้เห็นว่า 75% ของหน่วยประชากรน้อยกว่ามูลค่าของมัน และมากกว่า 25%
ความแตกต่างระหว่างควอไทล์ที่สามและควอร์ไทล์ที่หนึ่งคือช่วงระหว่างควอไทล์:
โดยที่ Aq คือค่าของพิสัยระหว่างควอไทล์ คำถามที่ 3 -ค่าควอไทล์ที่สาม Q คือค่าของควอไทล์ที่หนึ่ง
Deciles แบ่งประชากรออกเป็น 10 ส่วนเท่า ๆ กัน เดไซล์คือค่าของลักษณะเฉพาะในชุดการแจกแจงที่สอดคล้องกับหนึ่งในสิบของขนาดประชากร จากการเปรียบเทียบกับควอร์ไทล์ เดไซล์ที่ 1 แสดงว่า 10% ของหน่วยประชากรมีค่าน้อยกว่าค่าของมัน และ 90% มีค่ามากกว่า และเดไซล์ที่ 9 แสดงว่า 90% ของหน่วยประชากรมีค่าน้อยกว่าค่าของมัน และ 10% คือ มากขึ้น อัตราส่วนของเดซิลที่เก้าและเดซิลแรกคือ ค่าสัมประสิทธิ์เดไซล์ถูกนำมาใช้กันอย่างแพร่หลายในการศึกษาความแตกต่างของรายได้ เพื่อวัดอัตราส่วนของระดับรายได้ของผู้ร่ำรวยที่สุด 10% และ 10% ของประชากรที่ร่ำรวยน้อยที่สุด เปอร์เซ็นต์ไทล์แบ่งประชากรอันดับออกเป็น 100 ส่วนเท่าๆ กัน การคำนวณ ความหมาย และการประยุกต์เปอร์เซ็นไทล์จะคล้ายกับเดซิล
ควอไทล์ เดซิล และคุณลักษณะทางโครงสร้างอื่นๆ สามารถกำหนดได้ในรูปแบบกราฟิกโดยการเปรียบเทียบกับค่ามัธยฐานโดยใช้การสะสม
ในการวัดขนาดของความแปรผัน มีการใช้ตัวบ่งชี้ต่อไปนี้: ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ขนาดของช่วงการเปลี่ยนแปลงขึ้นอยู่กับการสุ่มของการกระจายตัวของสมาชิกสุดขั้วของซีรีส์ทั้งหมด ตัวบ่งชี้นี้เป็นที่สนใจในกรณีที่สิ่งสำคัญคือต้องรู้ว่าค่าความผันผวนของค่าคุณลักษณะคือเท่าใด:
ที่ไหน ร-ค่าของช่วงของการแปรผัน x max - ค่าสูงสุดของแอตทริบิวต์ เอ็กซ์ ที -ค่าต่ำสุดของแอตทริบิวต์
เมื่อคำนวณช่วงของการแปรผัน ค่าของสมาชิกซีรีส์ส่วนใหญ่จะไม่ถูกนำมาพิจารณา ในขณะที่ความแปรผันจะสัมพันธ์กับค่าแต่ละค่าของสมาชิกซีรีส์ ตัวบ่งชี้ที่เป็นค่าเฉลี่ยที่ได้จากการเบี่ยงเบนของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยไม่มีข้อเสียเปรียบนี้: ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน มีความสัมพันธ์โดยตรงระหว่างการเบี่ยงเบนส่วนบุคคลจากค่าเฉลี่ยและความแปรปรวนของลักษณะเฉพาะ ยิ่งความผันผวนรุนแรงเท่าใด ขนาดสัมบูรณ์ของการเบี่ยงเบนจากค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือค่าเฉลี่ยเลขคณิตของค่าสัมบูรณ์ของการเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยสำหรับข้อมูลที่ไม่ได้จัดกลุ่ม
โดยที่ /pr คือค่าของค่าเบี่ยงเบนเชิงเส้นเฉลี่ย x, - คือค่าของแอตทริบิวต์; เอ็กซ์ - พี -จำนวนหน่วยในประชากร
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยของอนุกรมที่จัดกลุ่ม
โดยที่ / vz - ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย x คือค่าของแอตทริบิวต์ เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา / - จำนวนหน่วยประชากรในกลุ่มแยก
ในกรณีนี้ สัญญาณของการเบี่ยงเบนจะถูกละเว้น มิฉะนั้นผลรวมของการเบี่ยงเบนทั้งหมดจะเท่ากับศูนย์ ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ขึ้นอยู่กับการจัดกลุ่มข้อมูลที่วิเคราะห์ คำนวณโดยใช้สูตรต่างๆ: สำหรับข้อมูลที่จัดกลุ่มและไม่ได้จัดกลุ่ม เนื่องจากแบบแผน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยซึ่งแยกจากตัวบ่งชี้การเปลี่ยนแปลงอื่น ๆ ถูกนำมาใช้ในทางปฏิบัติค่อนข้างน้อย (โดยเฉพาะอย่างยิ่งเพื่อระบุลักษณะการปฏิบัติตามภาระผูกพันตามสัญญาเกี่ยวกับความสม่ำเสมอของการส่งมอบ ในการวิเคราะห์มูลค่าการซื้อขายการค้าต่างประเทศ องค์ประกอบ ของพนักงาน จังหวะการผลิต คุณภาพผลิตภัณฑ์ โดยคำนึงถึงคุณลักษณะทางเทคโนโลยีของการผลิต และอื่นๆ)
ค่าเบี่ยงเบนมาตรฐานแสดงลักษณะค่าเฉลี่ยของแต่ละค่าของคุณลักษณะที่กำลังศึกษาซึ่งเบี่ยงเบนไปจากค่าเฉลี่ยของประชากรและแสดงเป็นหน่วยการวัดคุณลักษณะที่กำลังศึกษา ค่าเบี่ยงเบนมาตรฐานซึ่งเป็นหนึ่งในมาตรการหลักของการแปรผันนั้นใช้กันอย่างแพร่หลายในการประเมินขีด จำกัด ของการเปลี่ยนแปลงของลักษณะเฉพาะในประชากรที่เป็นเนื้อเดียวกันในการกำหนดค่าพิกัดของเส้นโค้งการแจกแจงแบบปกติตลอดจนในการคำนวณที่เกี่ยวข้องกับ องค์กรของการสังเกตตัวอย่างและการสร้างความแม่นยำของลักษณะตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่ได้จัดกลุ่มคำนวณโดยใช้อัลกอริทึมต่อไปนี้ ค่าเบี่ยงเบนแต่ละค่าจากค่าเฉลี่ยจะถูกยกกำลังสอง กำลังสองทั้งหมดจะถูกรวมเข้าด้วยกัน หลังจากนั้นผลรวมของกำลังสองจะถูกหารด้วยจำนวนเทอมของอนุกรม และรากที่สองจะถูกแยกออกจาก ความฉลาดทาง:
โดยที่ Iip คือค่าของส่วนเบี่ยงเบนมาตรฐาน Xj-ค่าแอตทริบิวต์ เอ็กซ์- ค่าเฉลี่ยของลักษณะประชากรที่กำลังศึกษา พี -จำนวนหน่วยในประชากร
สำหรับข้อมูลที่วิเคราะห์แบบกลุ่ม ค่าเบี่ยงเบนมาตรฐานของข้อมูลจะคำนวณโดยใช้สูตรถ่วงน้ำหนัก
ที่ไหน - ค่าเบี่ยงเบนมาตรฐาน Xj-ค่าแอตทริบิวต์ เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา ฉx -จำนวนหน่วยประชากรในกลุ่มใดกลุ่มหนึ่ง
การแสดงออกภายใต้รูทในทั้งสองกรณีเรียกว่าความแปรปรวน ดังนั้นการกระจายตัวจึงคำนวณเป็นกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าคุณลักษณะจากค่าเฉลี่ย สำหรับค่าแอตทริบิวต์ที่ไม่ถ่วงน้ำหนัก (แบบง่าย) ความแปรปรวนจะถูกกำหนดดังนี้:
สำหรับค่าคุณลักษณะแบบถ่วงน้ำหนัก
นอกจากนี้ยังมีวิธีที่ง่ายเป็นพิเศษในการคำนวณความแปรปรวน: โดยทั่วไป
สำหรับค่าคุณลักษณะที่ไม่ถ่วงน้ำหนัก (แบบง่าย) สำหรับค่าคุณลักษณะแบบถ่วงน้ำหนัก
โดยใช้วิธีแบบศูนย์
โดยที่ 2 คือค่าการกระจายตัว x, - คือค่าของแอตทริบิวต์; เอ็กซ์ -ค่าเฉลี่ยของลักษณะ ชม-ค่าช่วงกลุ่ม เสื้อ 1 -น้ำหนัก (A =
การกระจายตัวมีการแสดงออกทางสถิติเป็นของตัวเอง และเป็นหนึ่งในตัวชี้วัดที่สำคัญที่สุดของการเปลี่ยนแปลง มีการวัดเป็นหน่วยที่สอดคล้องกับกำลังสองของหน่วยการวัดคุณลักษณะที่กำลังศึกษา
การกระจายตัวมีคุณสมบัติดังนี้
- 1. ความแปรปรวนของค่าคงที่เป็นศูนย์
- 2. การลดค่าทั้งหมดของคุณลักษณะด้วยค่า A เดียวกันจะไม่เปลี่ยนค่าการกระจายตัว ซึ่งหมายความว่ากำลังสองเฉลี่ยของการเบี่ยงเบนไม่สามารถคำนวณได้จากค่าที่กำหนดของลักษณะเฉพาะ แต่จากการเบี่ยงเบนจากจำนวนคงที่บางส่วน
- 3. การลดค่าลักษณะใด ๆ ใน เคครั้งจะช่วยลดการกระจายตัวโดย เค 2 ครั้ง แล้วค่าเบี่ยงเบนมาตรฐานอยู่ใน เคครั้งเช่น ค่าทั้งหมดของแอตทริบิวต์สามารถหารด้วยจำนวนคงที่ (เช่นด้วยค่าของช่วงอนุกรม) สามารถคำนวณค่าเบี่ยงเบนมาตรฐานแล้วคูณด้วยจำนวนคงที่
- 4. หากเราคำนวณกำลังสองเฉลี่ยของการเบี่ยงเบนจากค่าใดๆ และแตกต่างไปจากค่าเฉลี่ยเลขคณิตหนึ่งหรืออย่างอื่น มันจะมากกว่าค่าเฉลี่ยกำลังสองของการเบี่ยงเบนที่คำนวณจากค่าเฉลี่ยเลขคณิตเสมอ กำลังสองเฉลี่ยของการเบี่ยงเบนจะมากขึ้นตามจำนวนที่แน่นอน - โดยกำลังสองของความแตกต่างระหว่างค่าเฉลี่ยและค่าที่รับตามอัตภาพ
การแปรผันของคุณลักษณะทางเลือกประกอบด้วยการมีอยู่หรือไม่มีทรัพย์สินที่ศึกษาในหน่วยของประชากร ในเชิงปริมาณ การแปรผันของคุณลักษณะทางเลือกจะแสดงด้วยค่าสองค่า: การมีอยู่ของหน่วยของทรัพย์สินที่ศึกษาจะแสดงด้วยหนึ่ง (1) และการไม่มีจะแสดงด้วยศูนย์ (0) สัดส่วนของหน่วยที่มีคุณสมบัติที่กำลังศึกษาแสดงด้วย P และสัดส่วนของหน่วยที่ไม่มีคุณสมบัตินี้แสดงโดย ช.ดังนั้น ความแปรปรวนของคุณลักษณะทางเลือกจะเท่ากับผลคูณของสัดส่วนของหน่วยที่ครอบครองคุณสมบัตินี้ (P) ด้วยสัดส่วนของหน่วยที่ไม่มีคุณสมบัตินี้ (ช)ความแปรผันสูงสุดของประชากรเกิดขึ้นได้ในกรณีที่ส่วนหนึ่งของประชากรซึ่งคิดเป็น 50% ของปริมาตรรวมของประชากร มีลักษณะเฉพาะ และอีกส่วนหนึ่งของประชากรซึ่งเท่ากับ 50% ก็ไม่มีลักษณะนี้ และการกระจายตัวถึงค่าสูงสุด 0.25, t .e พ = 0.5, ก= 1 - P = 1 - 0.5 = 0.5 และ o 2 = 0.5 0.5 = 0.25 ขีดจำกัดล่างของตัวบ่งชี้นี้คือศูนย์ ซึ่งสอดคล้องกับสถานการณ์ที่ไม่มีการเปลี่ยนแปลงในผลรวม การประยุกต์ใช้ความแปรปรวนของคุณลักษณะทางเลือกในทางปฏิบัติคือการสร้างช่วงความเชื่อมั่นเมื่อทำการสังเกตตัวอย่าง
ยิ่งความแปรปรวนและค่าเบี่ยงเบนมาตรฐานน้อยลง ประชากรก็จะมีความเป็นเนื้อเดียวกันมากขึ้น และค่าเฉลี่ยโดยทั่วไปก็จะมากขึ้นตามไปด้วย ในทางปฏิบัติด้านสถิติ มักจำเป็นต้องเปรียบเทียบความแปรผันของคุณลักษณะต่างๆ ตัวอย่างเช่น การเปรียบเทียบความแปรผันของอายุของคนงานและคุณสมบัติ ระยะเวลาในการให้บริการและค่าจ้าง ต้นทุนและกำไร ระยะเวลาในการให้บริการและผลิตภาพแรงงาน เป็นต้น เป็นที่น่าสนใจ สำหรับการเปรียบเทียบดังกล่าว ตัวบ่งชี้ความแปรปรวนสัมบูรณ์ของลักษณะไม่เหมาะสม: เป็นไปไม่ได้ที่จะเปรียบเทียบความแปรปรวนของประสบการณ์การทำงานซึ่งแสดงเป็นปีกับการเปลี่ยนแปลงของค่าจ้างซึ่งแสดงเป็นรูเบิล ในการดำเนินการเปรียบเทียบดังกล่าวตลอดจนการเปรียบเทียบความแปรปรวนของลักษณะเดียวกันในประชากรหลาย ๆ กลุ่มที่มีวิธีทางคณิตศาสตร์ที่แตกต่างกัน จะใช้ตัวบ่งชี้การเปลี่ยนแปลง - ค่าสัมประสิทธิ์การแกว่ง ค่าสัมประสิทธิ์เชิงเส้นของการแปรผัน และค่าสัมประสิทธิ์ของการแปรผันซึ่งแสดงการวัด ของความผันผวนของค่าสุดขั้วรอบค่าเฉลี่ย
ค่าสัมประสิทธิ์การสั่น:
ที่ไหน วี อาร์ -ค่าสัมประสิทธิ์การสั่น ร- ค่าของช่วงของการแปรผัน เอ็กซ์ -
ค่าสัมประสิทธิ์เชิงเส้นของการแปรผัน"
ที่ไหน วีเจ-ค่าของสัมประสิทธิ์เชิงเส้นของการแปรผัน ฉัน -ค่าของค่าเบี่ยงเบนเชิงเส้นเฉลี่ย เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา
ค่าสัมประสิทธิ์ของการแปรผัน:
ที่ไหน วี อา -สัมประสิทธิ์ของค่าความแปรผัน a คือค่าของส่วนเบี่ยงเบนมาตรฐาน เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา
ค่าสัมประสิทธิ์การแกว่งคืออัตราส่วนเปอร์เซ็นต์ของช่วงของการแปรผันต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา และค่าสัมประสิทธิ์เชิงเส้นของการแปรผันคืออัตราส่วนของค่าเบี่ยงเบนเชิงเส้นเฉลี่ยต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา ซึ่งแสดงเป็น เปอร์เซ็นต์ ค่าสัมประสิทธิ์ของการแปรผันคือเปอร์เซ็นต์ของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา ค่าสัมพัทธ์ซึ่งแสดงเป็นเปอร์เซ็นต์จะใช้ค่าสัมประสิทธิ์ความแปรผันเพื่อเปรียบเทียบระดับความแปรผันของคุณลักษณะต่างๆ โดยใช้ค่าสัมประสิทธิ์ของการแปรผัน เพื่อประเมินความเป็นเนื้อเดียวกันของประชากรทางสถิติ หากค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% แสดงว่าประชากรที่ศึกษาอยู่เป็นเนื้อเดียวกันและความแปรผันมีค่าน้อย หากค่าสัมประสิทธิ์ของการแปรผันมากกว่า 33% แสดงว่าประชากรที่อยู่ระหว่างการศึกษามีความหลากหลาย ความแปรผันมีสูง และค่าเฉลี่ยไม่ปกติและไม่สามารถใช้เป็นตัวบ่งชี้ทั่วไปของประชากรกลุ่มนี้ได้ นอกจากนี้ ค่าสัมประสิทธิ์ของการแปรผันยังใช้เพื่อเปรียบเทียบความแปรปรวนของลักษณะหนึ่งในกลุ่มประชากรต่างๆ ตัวอย่างเช่น เพื่อประเมินความผันแปรในระยะเวลาการให้บริการของคนงานในสถานประกอบการสองแห่ง ยิ่งค่าสัมประสิทธิ์ยิ่งสูง ความแปรผันของคุณลักษณะก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น
จากควอไทล์ที่คำนวณได้ ยังเป็นไปได้ที่จะคำนวณตัวบ่งชี้สัมพัทธ์ของการเปลี่ยนแปลงรายไตรมาสโดยใช้สูตร
ที่ไหน Q 2 และ
ช่วงระหว่างควอไทล์ถูกกำหนดโดยสูตร
ค่าเบี่ยงเบนควอไทล์ถูกใช้แทนช่วงของการแปรผัน เพื่อหลีกเลี่ยงข้อเสียที่เกี่ยวข้องกับการใช้ค่าที่มากเกินไป:
สำหรับอนุกรมการแปรผันช่วงเวลาที่ไม่เท่ากัน ความหนาแน่นของการแจกแจงก็จะถูกคำนวณด้วย มันถูกกำหนดให้เป็นผลหารของความถี่หรือความถี่ที่สอดคล้องกันหารด้วยค่าของช่วงเวลา ในอนุกรมช่วงเวลาที่ไม่เท่ากัน จะใช้ความหนาแน่นของการแจกแจงแบบสัมบูรณ์และแบบสัมพัทธ์ ความหนาแน่นของการแจกแจงแบบสัมบูรณ์คือความถี่ต่อความยาวหน่วยของช่วงเวลา ความหนาแน่นของการแจกแจงสัมพัทธ์คือความถี่ต่อความยาวหน่วยของช่วงเวลา
ทั้งหมดข้างต้นเป็นจริงสำหรับซีรี่ส์การจัดจำหน่ายซึ่งมีกฎการแจกจ่ายอธิบายไว้อย่างดีโดยกฎการแจกแจงแบบปกติหรือใกล้เคียงกัน
วิธีการจัดกลุ่มยังช่วยให้คุณวัดผลได้ การเปลี่ยนแปลง(ความแปรปรวน, ความผันผวน) ของสัญญาณ เมื่อจำนวนหน่วยในประชากรมีขนาดค่อนข้างน้อย ความแปรผันจะถูกวัดตามจำนวนหน่วยจัดอันดับที่ประกอบเป็นประชากร ซีรีส์นี้มีชื่อว่า จัดอันดับ,ถ้าหน่วยถูกจัดเรียงจากน้อยไปหามาก (มากไปหาน้อย) ของลักษณะเฉพาะ
อย่างไรก็ตาม ซีรีส์จัดอันดับค่อนข้างบ่งชี้เมื่อจำเป็นต้องมีคุณลักษณะเปรียบเทียบของรูปแบบต่างๆ นอกจากนี้ ในหลายกรณี เราต้องจัดการกับประชากรทางสถิติที่ประกอบด้วยหน่วยจำนวนมาก ซึ่งในทางปฏิบัติยากที่จะแสดงในรูปแบบของชุดข้อมูลเฉพาะ ในเรื่องนี้ สำหรับการทำความรู้จักทั่วไปเบื้องต้นกับข้อมูลทางสถิติและโดยเฉพาะอย่างยิ่งเพื่ออำนวยความสะดวกในการศึกษาความแปรผันของลักษณะ ปรากฏการณ์และกระบวนการภายใต้การศึกษามักจะรวมกันเป็นกลุ่มและผลการจัดกลุ่มจะแสดงในรูปแบบของตารางกลุ่ม
หากตารางกลุ่มมีเพียงสองคอลัมน์ - กลุ่มตามคุณลักษณะที่เลือก (ตัวเลือก) และจำนวนกลุ่ม (ความถี่หรือความถี่) จะเรียกว่า ใกล้กระจาย.
ช่วงการจัดจำหน่าย -การจัดกลุ่มโครงสร้างประเภทที่ง่ายที่สุดตามคุณลักษณะเดียว แสดงในตารางกลุ่มที่มีสองคอลัมน์ที่มีตัวแปรและความถี่ของคุณลักษณะ ในหลายกรณี ด้วยการจัดกลุ่มโครงสร้างดังกล่าว เช่น ด้วยการรวบรวมชุดการแจกแจง การศึกษาเนื้อหาทางสถิติเบื้องต้นจึงเริ่มต้นขึ้น
การจัดกลุ่มโครงสร้างในรูปแบบของชุดการกระจายสามารถเปลี่ยนเป็นการจัดกลุ่มโครงสร้างที่แท้จริงได้ หากกลุ่มที่เลือกไม่เพียงแต่มีลักษณะเฉพาะตามความถี่เท่านั้น แต่ยังรวมถึงตัวบ่งชี้ทางสถิติอื่นๆ ด้วย วัตถุประสงค์หลักของชุดการจัดจำหน่ายคือเพื่อศึกษาความแปรผันของคุณลักษณะ ทฤษฎีอนุกรมการแจกแจงได้รับการพัฒนาโดยละเอียดโดยใช้สถิติทางคณิตศาสตร์
ชุดการจัดจำหน่ายแบ่งออกเป็น เนื่องมาจาก(จัดกลุ่มตามคุณลักษณะ เช่น แบ่งประชากรตามเพศ สัญชาติ สถานภาพการสมรส เป็นต้น) และ แปรผัน(จัดกลุ่มตามลักษณะเชิงปริมาณ)
ซีรี่ส์รูปแบบต่างๆเป็นตารางกลุ่มที่มี 2 คอลัมน์ คือ การจัดกลุ่มหน่วยตามลักษณะเชิงปริมาณหนึ่งลักษณะและจำนวนหน่วยในแต่ละกลุ่ม ช่วงเวลาในชุดรูปแบบมักจะเท่ากันและปิด ซีรี่ส์รูปแบบต่างๆ คือการจัดกลุ่มประชากรรัสเซียตามรายได้ทางการเงินต่อหัวโดยเฉลี่ย (ตารางที่ 3.10)
ตารางที่ 3.10
การกระจายตัวของประชากรรัสเซียโดยรายได้ต่อหัวเฉลี่ยในปี 2547-2552
กลุ่มประชากรโดยรายได้เงินสดต่อหัวโดยเฉลี่ย rub./เดือน |
ประชากรในกลุ่ม % ของทั้งหมด |
|||||
8 000,1-10 000,0 |
||||||
10 000,1-15 000,0 |
||||||
15 000,1-25 000,0 |
||||||
มากกว่า 25,000.0 |
||||||
ประชากรทั้งหมด |
ในทางกลับกัน ซีรีส์การเปลี่ยนแปลงจะแบ่งออกเป็นแบบไม่ต่อเนื่องและช่วงเวลา ไม่ต่อเนื่องซีรีส์รูปแบบต่างๆ ผสมผสานลักษณะเฉพาะที่แตกต่างกันซึ่งแปรผันภายในขอบเขตแคบๆ ตัวอย่างของซีรีส์รูปแบบที่ไม่ต่อเนื่องคือการกระจายของครอบครัวรัสเซียตามจำนวนลูกที่พวกเขามี
ช่วงเวลาชุดรูปแบบต่างๆ ผสมผสานรูปแบบต่างๆ ของคุณลักษณะต่อเนื่องหรือคุณลักษณะที่ไม่ต่อเนื่องซึ่งแปรผันในช่วงกว้าง Interval คือชุดการเปลี่ยนแปลงของการกระจายตัวของประชากรรัสเซียตามมูลค่ารายได้ทางการเงินเฉลี่ยต่อหัว
ซีรี่ส์รูปแบบที่ไม่ต่อเนื่องไม่ได้ใช้บ่อยนักในทางปฏิบัติ ในขณะเดียวกันการรวบรวมพวกมันก็ไม่ใช่เรื่องยาก เนื่องจากองค์ประกอบของกลุ่มถูกกำหนดโดยตัวแปรเฉพาะที่มีลักษณะการจัดกลุ่มที่ศึกษามีอยู่จริง
ซีรีย์รูปแบบช่วงเวลานั้นแพร่หลายมากขึ้น เมื่อรวบรวมคำถามที่ยากเกิดขึ้นเกี่ยวกับจำนวนกลุ่มตลอดจนขนาดของช่วงเวลาที่ควรกำหนด
หลักการในการแก้ปัญหานี้ได้อธิบายไว้ในบทเกี่ยวกับวิธีการสร้างการจัดกลุ่มทางสถิติ (ดูย่อหน้าที่ 3.3)
ชุดรูปแบบเป็นวิธีการยุบหรือบีบอัดข้อมูลที่หลากหลายให้อยู่ในรูปแบบที่กะทัดรัด จากนั้นเราสามารถตัดสินได้อย่างชัดเจนเกี่ยวกับธรรมชาติของรูปแบบ และศึกษาความแตกต่างในลักษณะของปรากฏการณ์ที่รวมอยู่ในชุดที่กำลังศึกษาอยู่ แต่ความสำคัญที่สำคัญที่สุดของอนุกรมความผันแปรก็คือ คุณลักษณะทั่วไปพิเศษของความแปรผันจะถูกคำนวณบนพื้นฐานของสิ่งเหล่านั้น (ดูบทที่ 7)