ประเภทของซีรีย์รูปแบบต่างๆ วี

ลองเรียกค่าตัวอย่างต่างๆ กัน ตัวเลือกชุดของค่าและแสดงว่า: เอ็กซ์ 1 , เอ็กซ์ 2,…. ก่อนอื่นเราจะผลิต ตั้งแต่ตัวเลือกเช่น การจัดเรียงตามลำดับจากน้อยไปหามากหรือจากมากไปน้อย สำหรับแต่ละตัวเลือกจะมีการระบุน้ำหนักของตัวเองเช่น ตัวเลขที่แสดงถึงการมีส่วนร่วมของตัวเลือกที่กำหนดต่อประชากรทั้งหมด ความถี่หรือความถี่ทำหน้าที่เป็นน้ำหนัก

ความถี่ ฉัน ตัวเลือก x ฉันคือตัวเลขที่แสดงจำนวนครั้งที่ตัวเลือกที่กำหนดเกิดขึ้นในประชากรตัวอย่างที่กำลังพิจารณา

ความถี่หรือความถี่สัมพัทธ์ ฉัน ตัวเลือก x ฉันคือตัวเลขที่เท่ากับอัตราส่วนของความถี่ของตัวแปรหนึ่งต่อผลรวมของความถี่ของตัวแปรทั้งหมด ความถี่แสดงสัดส่วนของหน่วยในประชากรตัวอย่างที่มีตัวแปรที่กำหนด

เรียกว่าลำดับของตัวเลือกที่มีน้ำหนักที่สอดคล้องกัน (ความถี่หรือความถี่) ซึ่งเขียนตามลำดับจากน้อยไปมาก (หรือจากมากไปหาน้อย) ซีรีย์การเปลี่ยนแปลง.

อนุกรมรูปแบบไม่ต่อเนื่องและเป็นช่วง

สำหรับอนุกรมความแปรผันแบบแยกส่วน ค่าจุดของคุณลักษณะจะถูกระบุ สำหรับอนุกรมช่วงเวลา ค่าคุณลักษณะจะถูกระบุในรูปแบบของช่วงเวลา ชุดรูปแบบสามารถแสดงการกระจายของความถี่หรือความถี่สัมพัทธ์ (ความถี่) ขึ้นอยู่กับค่าที่ระบุสำหรับแต่ละตัวเลือก - ความถี่หรือความถี่

ชุดการกระจายความถี่แบบแยกส่วนมีรูปแบบ:

พบความถี่ตามสูตร i = 1, 2, …, .

1 + 2 + … + ม. = 1.

ตัวอย่าง 4.1. สำหรับชุดตัวเลขที่กำหนด

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

สร้างชุดการแปรผันแบบไม่ต่อเนื่องของการแจกแจงความถี่และความถี่

สารละลาย . ปริมาณประชากรก็เท่ากับ n= 10 อนุกรมการแจกแจงความถี่ไม่ต่อเนื่องมีรูปแบบ

ซีรีส์ Interval มีรูปแบบการบันทึกที่คล้ายกัน

ชุดการแปรผันช่วงของการแจกแจงความถี่เขียนเป็น:

ผลรวมของความถี่ทั้งหมดเท่ากับจำนวนการสังเกตทั้งหมด เช่น ปริมาณรวม: n = n 1 +n 2 + … + nม.

ชุดการแปรผันช่วงของการกระจายความถี่สัมพัทธ์ (ความถี่)มีรูปแบบ:

ความถี่พบได้จากสูตร i = 1, 2, …, .

ผลรวมของความถี่ทั้งหมดเท่ากับหนึ่ง: 1 + 2 + … + ม. = 1.

ซีรีย์ Interval มักใช้ในทางปฏิบัติ หากมีข้อมูลตัวอย่างทางสถิติจำนวนมากและค่าของพวกมันแตกต่างกันด้วยจำนวนที่น้อยโดยพลการ ซีรีส์ที่แยกจากกันสำหรับข้อมูลเหล่านี้จะค่อนข้างยุ่งยากและไม่สะดวกสำหรับการวิจัยเพิ่มเติม ในกรณีนี้จะใช้การจัดกลุ่มข้อมูลเช่น ช่วงเวลาที่มีค่าทั้งหมดของแอตทริบิวต์จะถูกแบ่งออกเป็นช่วงเวลาบางส่วนและโดยการคำนวณความถี่สำหรับแต่ละช่วงเวลาจะได้อนุกรมช่วงเวลา ให้เราเขียนรายละเอียดเพิ่มเติมเกี่ยวกับโครงร่างสำหรับการสร้างอนุกรมช่วงเวลาโดยสมมติว่าความยาวของช่วงเวลาบางส่วนจะเท่ากัน

2.2 การสร้างอนุกรมช่วงเวลา

ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:

กำหนดจำนวนช่วงเวลา

กำหนดความยาวของช่วงเวลา

กำหนดตำแหน่งของช่วงเวลาบนแกน

เพื่อกำหนด จำนวนช่วงเวลา เค มีสูตรของสเตอเจสตามนั้น

,

ที่ไหน n- ปริมาตรของมวลรวมทั้งหมด

ตัวอย่างเช่นหากมี 100 ค่าของคุณลักษณะ (ตัวแปร) แนะนำให้ใช้จำนวนช่วงเวลาเท่ากับช่วงเวลาเพื่อสร้างอนุกรมช่วงเวลา

อย่างไรก็ตามในทางปฏิบัติบ่อยครั้งที่นักวิจัยเลือกจำนวนช่วงเวลาโดยคำนึงถึงว่าตัวเลขนี้ไม่ควรใหญ่มากเพื่อให้ชุดข้อมูลไม่ยุ่งยาก แต่ก็ไม่เล็กมากเพื่อไม่ให้สูญเสียคุณสมบัติบางอย่างของ การกระจาย.

ความยาวช่วง ชม. กำหนดโดยสูตรต่อไปนี้:

,

ที่ไหน xสูงสุดและ x min คือค่าที่ใหญ่ที่สุดและเล็กที่สุดของตัวเลือกตามลำดับ

ขนาด เรียกว่า ขอบเขตแถว.

ในการสร้างช่วงเวลานั้นเอง พวกเขาดำเนินการด้วยวิธีที่ต่างกัน หนึ่งในวิธีที่ง่ายที่สุดมีดังนี้ จุดเริ่มต้นของช่วงแรกจะถูกนำไปเป็น
- จากนั้นสูตรจะพบขอบเขตที่เหลือของช่วงเวลา แน่นอนว่าสิ้นสุดช่วงสุดท้ายแล้ว m+1 ต้องเป็นไปตามเงื่อนไข

หลังจากที่ค้นพบขอบเขตของช่วงเวลาทั้งหมดแล้ว ความถี่ (หรือความถี่) ของช่วงเวลาเหล่านี้จะถูกกำหนด ในการแก้ปัญหานี้ ให้ดูตัวเลือกทั้งหมดและกำหนดจำนวนตัวเลือกที่อยู่ในช่วงเวลาหนึ่งๆ ลองดูที่การสร้างอนุกรมช่วงเวลาโดยสมบูรณ์โดยใช้ตัวอย่าง

ตัวอย่าง 4.2. สำหรับข้อมูลทางสถิติต่อไปนี้ บันทึกตามลำดับจากน้อยไปหามาก ให้สร้างอนุกรมช่วงเวลาโดยมีจำนวนช่วงเวลาเท่ากับ 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

สารละลาย. ทั้งหมด n=50 ค่าตัวแปร

จำนวนช่วงเวลาระบุไว้ในคำชี้แจงปัญหาเช่น เค=5.

ความยาวของช่วงเวลาคือ
.

มากำหนดขอบเขตของช่วงเวลากัน:

1 = 11 − 8,5 = 2,5; 2 = 2,5 + 17 = 19,5; 3 = 19,5 + 17 = 36,5;

4 = 36,5 + 17 = 53,5; 5 = 53,5 + 17 = 70,5; 6 = 70,5 + 17 = 87,5;

7 = 87,5 +17 = 104,5.

ในการกำหนดความถี่ของช่วงเวลา เราจะนับจำนวนตัวเลือกที่อยู่ในช่วงเวลาที่กำหนด ตัวอย่างเช่น ช่วงแรกตั้งแต่ 2.5 ถึง 19.5 จะรวมตัวเลือก 11, 12, 12, 14, 14, 15 ด้วย จำนวนของพวกเขาคือ 6 ดังนั้น ความถี่ของช่วงแรกคือ n 1 = 6 ความถี่ของช่วงแรกคือ - ช่วงที่สองจาก 19.5 ถึง 36.5 รวมถึงตัวเลือก 21, 21, 22, 23, 25 ซึ่งจำนวนคือ 5 ดังนั้นความถี่ของช่วงที่สองคือ n 2 =5 และความถี่ - เมื่อพบความถี่และความถี่ของทุกช่วงเวลาในลักษณะเดียวกันแล้ว เราจะได้อนุกรมช่วงเวลาต่อไปนี้

อนุกรมช่วงเวลาของการแจกแจงความถี่มีรูปแบบ:

ผลรวมของความถี่คือ 6+5+9+11+8+11=50

อนุกรมช่วงเวลาของการแจกแจงความถี่มีรูปแบบ:

ผลรวมของความถี่คือ 0.12+0.1+0.18+0.22+0.16+0.22=1

เมื่อสร้างอนุกรมช่วงเวลา ขึ้นอยู่กับเงื่อนไขเฉพาะของปัญหาที่กำลังพิจารณา สามารถใช้กฎอื่นๆ ได้ กล่าวคือ

1. อนุกรมความแปรผันของช่วงอาจประกอบด้วยช่วงบางส่วนที่มีความยาวต่างกัน ช่วงเวลาที่มีความยาวไม่เท่ากันทำให้สามารถเน้นคุณสมบัติของประชากรทางสถิติโดยมีการกระจายลักษณะที่ไม่สม่ำเสมอ ตัวอย่างเช่น หากขอบเขตของช่วงเวลากำหนดจำนวนผู้อยู่อาศัยในเมือง แนะนำให้ใช้ช่วงเวลาที่มีความยาวไม่เท่ากันในปัญหานี้ แน่นอนว่าสำหรับเมืองเล็กๆ จำนวนประชากรที่แตกต่างกันเล็กน้อยเป็นสิ่งสำคัญ แต่สำหรับเมืองใหญ่ ความแตกต่างของจำนวนประชากรหลายสิบหรือหลายร้อยคนนั้นไม่มีนัยสำคัญ อนุกรมช่วงที่มีความยาวไม่เท่ากันของช่วงบางส่วนมีการศึกษาในทฤษฎีสถิติทั่วไปเป็นหลัก และการพิจารณาอยู่นอกเหนือขอบเขตของคู่มือเล่มนี้

2. ในสถิติทางคณิตศาสตร์ บางครั้งการพิจารณาอนุกรมช่วงเวลา โดยถือว่าขอบเขตด้านซ้ายของช่วงแรกเท่ากับ –∞ และขอบเขตด้านขวาของช่วงสุดท้าย +∞ การทำเช่นนี้เพื่อให้การกระจายตัวทางสถิติใกล้เคียงกับค่าทางทฤษฎีมากขึ้น

3. เมื่อสร้างอนุกรมช่วงเวลา อาจกลายเป็นว่าค่าของตัวเลือกบางตัวเกิดขึ้นตรงกับขอบเขตของช่วงเวลานั้นทุกประการ สิ่งที่ดีที่สุดที่ควรทำในกรณีนี้มีดังนี้ หากมีเหตุบังเอิญเพียงครั้งเดียวให้พิจารณาว่าตัวเลือกที่พิจารณาโดยมีความถี่นั้นตกอยู่ในช่วงเวลาที่ใกล้กับช่วงกลางของอนุกรมช่วงเวลามากขึ้น หากมีหลายตัวเลือกดังกล่าว ตัวเลือกทั้งหมดจะถูกกำหนดให้กับช่วงเวลานั้น ทางด้านขวาของตัวเลือกเหล่านี้ หรือทั้งหมดถูกกำหนดไว้ทางด้านซ้าย

4. หลังจากกำหนดจำนวนช่วงเวลาและความยาวแล้ว การจัดเรียงช่วงเวลาสามารถทำได้ในอีกทางหนึ่ง ค้นหาค่าเฉลี่ยเลขคณิตของค่าที่พิจารณาทั้งหมดของตัวเลือก เอ็กซ์พ และสร้างช่วงแรกในลักษณะที่ค่าเฉลี่ยตัวอย่างนี้จะอยู่ภายในช่วงหนึ่ง ดังนั้นเราจึงได้ช่วงเวลาจาก เอ็กซ์พ – 0.5 ชม.ถึง เอ็กซ์เฉลี่ย.. + 0.5 ชม.- จากนั้นไปทางซ้ายและขวาโดยเพิ่มความยาวของช่วงเวลาเราสร้างช่วงเวลาที่เหลือจนกระทั่ง xนาทีและ xค่าสูงสุดจะไม่อยู่ในช่วงแรกและช่วงสุดท้ายตามลำดับ

5. อนุกรมช่วงเวลาที่มีช่วงเวลาจำนวนมากจะถูกเขียนในแนวตั้งอย่างสะดวก เช่น เขียนช่วงเวลาไม่อยู่ในแถวแรก แต่อยู่ในคอลัมน์แรก และความถี่ (หรือความถี่) ในคอลัมน์ที่สอง

ข้อมูลตัวอย่างถือได้ว่าเป็นค่าของตัวแปรสุ่มบางตัว เอ็กซ์- ตัวแปรสุ่มมีกฎการแจกแจงของตัวเอง จากทฤษฎีความน่าจะเป็นเป็นที่ทราบกันว่ากฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถระบุได้ในรูปแบบของอนุกรมการแจกแจง และสำหรับกฎการแจกแจงต่อเนื่อง - โดยใช้ฟังก์ชันความหนาแน่นของการแจกแจง อย่างไรก็ตาม มีกฎการแจกแจงแบบสากลที่ใช้กับตัวแปรสุ่มทั้งแบบไม่ต่อเนื่องและต่อเนื่อง กฎหมายการกระจายนี้กำหนดให้เป็นฟังก์ชันการกระจาย เอฟ(x) = (เอ็กซ์<x- สำหรับข้อมูลตัวอย่าง คุณสามารถระบุฟังก์ชันการแจกแจงแบบอะนาล็อกได้ - ฟังก์ชันการแจกแจงเชิงประจักษ์


ข้อมูลที่เกี่ยวข้อง.


ชุดค่าของพารามิเตอร์ที่ศึกษาในการทดลองหรือการสังเกตที่กำหนดซึ่งจัดอันดับตามค่า (เพิ่มหรือลด) เรียกว่าชุดรูปแบบ

สมมติว่าเราวัดความดันโลหิตของผู้ป่วยสิบรายเพื่อให้ได้ค่าความดันโลหิตสูงสุด: ความดันซิสโตลิก เช่น มีเพียงหมายเลขเดียวเท่านั้น

ลองจินตนาการว่าชุดของการสังเกต (ผลรวมทางสถิติ) ของความดันซิสโตลิกของหลอดเลือดแดงในการสังเกต 10 ครั้งมีรูปแบบดังต่อไปนี้ (ตารางที่ 1):

ตารางที่ 1

ส่วนประกอบของชุดรูปแบบต่างๆ เรียกว่า ชุดรูปแบบต่างๆ ตัวเลือกนี้แสดงถึงค่าตัวเลขของคุณลักษณะที่กำลังศึกษา

การสร้างชุดความแปรผันจากชุดการสังเกตทางสถิติเป็นเพียงก้าวแรกในการทำความเข้าใจคุณลักษณะของชุดทั้งชุด ต่อไป จำเป็นต้องกำหนดระดับเฉลี่ยของลักษณะเชิงปริมาณที่กำลังศึกษา (ระดับโปรตีนในเลือดเฉลี่ย น้ำหนักเฉลี่ยของผู้ป่วย เวลาเฉลี่ยในการดมยาสลบ ฯลฯ)

ระดับเฉลี่ยวัดโดยใช้เกณฑ์ที่เรียกว่าค่าเฉลี่ย ค่าเฉลี่ยเป็นคุณลักษณะเชิงตัวเลขทั่วไปของค่าที่เป็นเนื้อเดียวกันในเชิงคุณภาพ โดยแสดงลักษณะเฉพาะของประชากรทางสถิติทั้งหมดด้วยตัวเลขหนึ่งตัวตามเกณฑ์เดียว ค่าเฉลี่ยแสดงถึงสิ่งที่เหมือนกันกับคุณลักษณะในชุดการสังเกตที่กำหนด

ค่าเฉลี่ยที่ใช้ทั่วไปมีสามประเภท: โหมด (), ค่ามัธยฐาน () และค่าเฉลี่ยเลขคณิต ()

ในการหาค่าเฉลี่ยใดๆ จำเป็นต้องใช้ผลลัพธ์ของการสังเกตแต่ละรายการ โดยบันทึกไว้ในรูปแบบของชุดรูปแบบต่างๆ (ตารางที่ 2)

แฟชั่น- ค่าที่เกิดขึ้นบ่อยที่สุดในชุดการสังเกต ในตัวอย่างของเรา โหมด = 120 หากไม่มีค่าซ้ำในชุดรูปแบบ แสดงว่าไม่มีโหมด หากมีการทำซ้ำหลายค่าในจำนวนครั้งเท่ากัน ค่าที่น้อยที่สุดจะถูกใช้เป็นโหมด

ค่ามัธยฐาน- ค่าที่แบ่งการแจกแจงออกเป็นสองส่วนเท่าๆ กัน คือค่ากลางหรือค่ามัธยฐานของชุดการสังเกตโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อย ดังนั้น หากมี 5 ค่าในชุดรูปแบบ ค่ามัธยฐานจะเท่ากับพจน์ที่สามของชุดรูปแบบนั้น หากมีพจน์เป็นจำนวนคู่ ค่ามัธยฐานจะเป็นค่าเฉลี่ยเลขคณิตของทั้งสอง การสังเกตจากส่วนกลาง เช่น หากมีการสังเกต 10 ครั้งในอนุกรมหนึ่ง ค่ามัธยฐานจะเท่ากับค่าเฉลี่ยเลขคณิตของการสังเกตครั้งที่ 5 และ 6 ในตัวอย่างของเรา

ให้เราสังเกตคุณสมบัติที่สำคัญของโหมดและค่ามัธยฐาน: ค่าของพวกมันไม่ได้รับอิทธิพลจากค่าตัวเลขของตัวแปรที่รุนแรง

ค่าเฉลี่ยเลขคณิตคำนวณโดยสูตร:

โดยที่ค่าที่สังเกตได้ในการสังเกตครั้งที่ - คือจำนวนการสังเกต สำหรับกรณีของเรา

ค่าเฉลี่ยเลขคณิตมีคุณสมบัติสามประการ:

ค่าเฉลี่ยครองตำแหน่งตรงกลางในชุดรูปแบบต่างๆ ในแถวที่สมมาตรอย่างเคร่งครัด

ค่าเฉลี่ยเป็นค่าทั่วไป และความผันผวนแบบสุ่มและความแตกต่างของข้อมูลแต่ละรายการจะไม่สามารถมองเห็นได้หลังค่าเฉลี่ย มันสะท้อนให้เห็นถึงสิ่งที่เป็นเรื่องปกติของประชากรทั้งหมด

ผลรวมของการเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยคือศูนย์: ระบุความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย

ซีรีส์รูปแบบต่างๆ ประกอบด้วยรูปแบบต่างๆ และความถี่ที่สอดคล้องกัน จากสิบค่าที่ได้นั้น มีเลข 120 เกิดขึ้น 6 ครั้ง 115 - 3 ครั้ง 125 - 1 ครั้ง ความถี่ () - จำนวนสัมบูรณ์ของตัวแปรแต่ละรายการในผลรวม ซึ่งระบุจำนวนครั้งที่ตัวแปรที่กำหนดเกิดขึ้นในซีรีส์ของรูปแบบต่างๆ

ซีรีย์รูปแบบอาจเป็นแบบง่าย (ความถี่ = 1) หรือจัดกลุ่มและย่อให้สั้นลง โดยมี 3-5 ตัวเลือก ชุดข้อมูลแบบง่ายใช้สำหรับการสังเกตจำนวนเล็กน้อย () ชุดข้อมูลแบบจัดกลุ่มใช้สำหรับการสังเกตจำนวนมาก ()

​ Variation series - ซีรีส์ที่มีการเปรียบเทียบ (ตามระดับการเพิ่มขึ้นหรือลดลง) ตัวเลือกและสอดคล้องกัน ความถี่

ตัวเลือกคือการแสดงออกเชิงปริมาณส่วนบุคคลของคุณลักษณะ ระบุด้วยตัวอักษรละติน วี - ความเข้าใจแบบดั้งเดิมของคำว่า "ตัวแปร" ถือว่าแต่ละค่าที่ไม่ซ้ำกันของคุณลักษณะเรียกว่าตัวแปร โดยไม่คำนึงถึงจำนวนการทำซ้ำ

ตัวอย่างเช่น ในชุดการเปลี่ยนแปลงของตัวบ่งชี้ความดันโลหิตซิสโตลิกที่วัดในผู้ป่วย 10 ราย:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

มีเพียง 6 ค่าเท่านั้น:

110, 120, 130, 140, 160, 170.

​ความถี่คือตัวเลขที่ระบุจำนวนครั้งที่ตัวเลือกนั้นถูกทำซ้ำ เขียนแทนด้วยอักษรละติน - ผลรวมของความถี่ทั้งหมด (ซึ่งแน่นอนว่าเท่ากับจำนวนความถี่ทั้งหมดที่ศึกษา) แสดงว่า n.

    ในตัวอย่างของเรา ความถี่จะใช้ค่าต่อไปนี้:
  • สำหรับตัวเลือก 110 ความถี่ P = 1 (ค่า 110 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
  • สำหรับตัวเลือก 120 ความถี่ P = 2 (ค่า 120 เกิดขึ้นในผู้ป่วยสองราย)
  • สำหรับตัวเลือก 130 ความถี่ P = 3 (ค่า 130 เกิดขึ้นในผู้ป่วย 3 ราย)
  • สำหรับตัวเลือก 140 ความถี่ P = 2 (ค่า 140 เกิดขึ้นในผู้ป่วยสองราย)
  • สำหรับตัวเลือก 160 ความถี่ P = 1 (ค่า 160 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
  • สำหรับตัวเลือก 170 ความถี่ P = 1 (ค่า 170 เกิดขึ้นในผู้ป่วยรายหนึ่ง)

ประเภทของซีรี่ส์รูปแบบ:

  1. เรียบง่าย- นี่คืออนุกรมที่แต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว (ความถี่ทั้งหมดเท่ากับ 1)
  2. ถูกระงับ- ซีรีส์ที่มีตัวเลือกตั้งแต่หนึ่งรายการขึ้นไปปรากฏขึ้นมากกว่าหนึ่งครั้ง

ซีรี่ส์รูปแบบต่างๆ ใช้เพื่ออธิบายอาร์เรย์จำนวนมาก ในรูปแบบนี้ข้อมูลที่รวบรวมได้จากการศึกษาทางการแพทย์ส่วนใหญ่จะถูกนำเสนอในขั้นต้น เพื่อกำหนดลักษณะเฉพาะของชุดรูปแบบต่างๆ จะมีการคำนวณตัวบ่งชี้พิเศษ ซึ่งรวมถึงค่าเฉลี่ย ตัวบ่งชี้ความแปรปรวน (ที่เรียกว่าการกระจายตัว) และตัวบ่งชี้ความเป็นตัวแทนของข้อมูลตัวอย่าง

ตัวบ่งชี้ชุดรูปแบบต่างๆ

1) ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะของขนาดของคุณลักษณะที่กำลังศึกษา ค่าเฉลี่ยเลขคณิตแสดงเป็น เป็นค่าเฉลี่ยประเภทหนึ่งที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าตัวบ่งชี้ของหน่วยการสังเกตทั้งหมดต่อจำนวนวิชาทั้งหมดที่ศึกษา วิธีการคำนวณค่าเฉลี่ยเลขคณิตจะแตกต่างกันไปสำหรับอนุกรมการแปรผันแบบง่ายและแบบถ่วงน้ำหนัก

สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตอย่างง่าย:

สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

M = Σ(V * P)/n

​ 2) โหมดเป็นค่าเฉลี่ยอีกค่าหนึ่งของอนุกรมรูปแบบ ซึ่งสอดคล้องกับตัวเลือกที่เกิดซ้ำบ่อยที่สุด หรือพูดอีกอย่างคือนี่คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด แสดงว่า โม - โหมดนี้คำนวณสำหรับอนุกรมแบบถ่วงน้ำหนักเท่านั้น เนื่องจากในชุดแบบธรรมดาไม่มีตัวเลือกใดซ้ำกันและความถี่ทั้งหมดจะเท่ากับหนึ่ง

ตัวอย่างเช่น ในชุดรูปแบบต่างๆ ของค่าอัตราการเต้นของหัวใจ:

80, 84, 84, 86, 86, 86, 90, 94;

ค่าโหมดคือ 86 เนื่องจากตัวเลือกนี้เกิดขึ้น 3 ครั้ง ดังนั้นความถี่จึงสูงที่สุด

3) ค่ามัธยฐาน - ค่าของตัวเลือกที่แบ่งซีรี่ส์รูปแบบออกเป็นครึ่งหนึ่ง: ทั้งสองด้านมีตัวเลือกจำนวนเท่ากัน ค่ามัธยฐาน เช่นเดียวกับค่าเฉลี่ยเลขคณิตและโหมด หมายถึงค่าเฉลี่ย แสดงว่า ฉัน

4) ส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนซิกมา ซิกมา) - การวัดความแปรปรวนของอนุกรมความแปรผัน เป็นตัวบ่งชี้สำคัญที่รวมทุกกรณีของการเบี่ยงเบนจากค่าเฉลี่ย ในความเป็นจริง มันตอบคำถามว่าตัวแปรต่างๆ กระจายจากค่าเฉลี่ยเลขคณิตไปไกลแค่ไหนและบ่อยแค่ไหน เขียนแทนด้วยอักษรกรีก σ ("ซิกมา").

หากขนาดประชากรมากกว่า 30 หน่วย ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรต่อไปนี้

สำหรับประชากรขนาดเล็ก - 30 หน่วยการสังเกตหรือน้อยกว่า - ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรอื่น:

จากการเรียนรู้บทนี้ นักเรียนจะต้อง: ทราบ

  • ตัวชี้วัดความแปรปรวนและความสัมพันธ์
  • กฎพื้นฐานของการกระจายลักษณะ
  • สาระสำคัญของเกณฑ์ความยินยอม สามารถ
  • คำนวณดัชนีความแปรปรวนและเกณฑ์ความดีเหมาะสม
  • กำหนดลักษณะการกระจาย
  • ประเมินลักษณะเชิงตัวเลขหลักของอนุกรมการแจกแจงทางสถิติ

เป็นเจ้าของ

  • วิธีการวิเคราะห์ทางสถิติของอนุกรมการแจกแจง
  • พื้นฐานของการวิเคราะห์ความแปรปรวน
  • เทคนิคการตรวจสอบอนุกรมการแจกแจงทางสถิติให้เป็นไปตามกฎพื้นฐานของการแจกแจง

ตัวชี้วัดการเปลี่ยนแปลง

ในการศึกษาทางสถิติเกี่ยวกับลักษณะของประชากรทางสถิติต่างๆ เป็นเรื่องที่น่าสนใจอย่างยิ่งที่จะศึกษาความแปรผันของลักษณะของหน่วยสถิติแต่ละหน่วยของประชากร ตลอดจนลักษณะของการกระจายหน่วยตามลักษณะนี้ การเปลี่ยนแปลง -นี่คือความแตกต่างในคุณค่าส่วนบุคคลของลักษณะเฉพาะในหน่วยของประชากรที่กำลังศึกษา การศึกษาความแปรผันมีความสำคัญอย่างยิ่งในทางปฏิบัติ จากระดับความแปรผัน เราสามารถตัดสินขีดจำกัดของการแปรผันของคุณลักษณะ ความสม่ำเสมอของประชากรสำหรับคุณลักษณะที่กำหนด ลักษณะทั่วไปของค่าเฉลี่ย และความสัมพันธ์ของปัจจัยที่กำหนดความแปรผัน ตัวบ่งชี้การเปลี่ยนแปลงใช้เพื่อระบุลักษณะและจัดระเบียบประชากรทางสถิติ

ผลลัพธ์ของการสรุปและการจัดกลุ่มวัสดุสังเกตทางสถิติที่นำเสนอในรูปแบบของชุดการแจกแจงทางสถิติ แสดงถึงการกระจายตามลำดับของหน่วยประชากรที่กำลังศึกษาออกเป็นกลุ่มตามเกณฑ์การจัดกลุ่ม (แปรผัน) หากใช้คุณลักษณะเชิงคุณภาพเป็นพื้นฐานสำหรับการจัดกลุ่มก็จะเรียกชุดการแจกจ่ายดังกล่าว เนื่องมาจาก(แบ่งตามอาชีพ เพศ สีผิว ฯลฯ) หากซีรีย์การจัดจำหน่ายถูกสร้างขึ้นบนพื้นฐานเชิงปริมาณ ซีรีย์ดังกล่าวจะถูกเรียก แปรผัน(กระจายตามส่วนสูง น้ำหนัก เงินเดือน ฯลฯ) การสร้างอนุกรมความแปรผันหมายถึงการจัดการการกระจายเชิงปริมาณของหน่วยประชากรตามค่าลักษณะเฉพาะ นับจำนวนหน่วยประชากรด้วยค่าเหล่านี้ (ความถี่) และจัดเรียงผลลัพธ์ในตาราง

แทนที่จะเป็นความถี่ของตัวแปร คุณสามารถใช้อัตราส่วนกับปริมาตรรวมของการสังเกต ซึ่งเรียกว่าความถี่ (ความถี่สัมพัทธ์)

ซีรีย์รูปแบบมีสองประเภท: แบบแยกและแบบช่วงเวลา ซีรีส์แยก- นี่คือซีรีส์รูปแบบต่างๆ ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (ลักษณะเฉพาะที่ไม่ต่อเนื่อง) หลังรวมถึงจำนวนพนักงานในองค์กร ประเภทภาษี จำนวนเด็กในครอบครัว ฯลฯ ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์ หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งภายในขอบเขตที่กำหนดสามารถใช้ค่าใด ๆ ก็ได้) ดังนั้นสำหรับคุณลักษณะนี้จึงสามารถสร้างได้ อนุกรมการเปลี่ยนแปลงช่วงเวลาเมื่อสร้างอนุกรมการเปลี่ยนแปลงช่วงเวลา ตารางจะมีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่) ความถี่ (ความถี่การทำซ้ำ) - จำนวนการทำซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ ช่วงเวลาสามารถปิดหรือเปิดได้ ช่วงเวลาปิดจะถูกจำกัดทั้งสองด้าน กล่าวคือ มีทั้งขอบเขตล่าง (“จาก”) และขอบเขตบน (“ถึง”) ช่วงเปิดจะมีขอบเขตเดียว: บนหรือล่าง หากตัวเลือกจัดเรียงตามลำดับจากน้อยไปหามากหรือจากมากไปน้อย แถวต่างๆ จะถูกเรียก จัดอันดับ

สำหรับซีรีย์รูปแบบต่างๆ มีตัวเลือกการตอบสนองความถี่สองประเภท: ความถี่สะสม และความถี่สะสม ความถี่สะสมแสดงจำนวนการสังเกตค่าของลักษณะเฉพาะที่รับค่าน้อยกว่าค่าที่กำหนด ความถี่สะสมถูกกำหนดโดยการรวมค่าความถี่ของคุณลักษณะสำหรับกลุ่มที่กำหนดกับความถี่ทั้งหมดของกลุ่มก่อนหน้า ความถี่สะสมจะแสดงลักษณะของสัดส่วนของหน่วยการสังเกตที่มีค่าแอตทริบิวต์ไม่เกินขีดจำกัดบนของกลุ่มที่กำหนด ดังนั้นความถี่สะสมจึงแสดงสัดส่วนของตัวเลือกในผลรวมซึ่งมีค่าไม่มากกว่าค่าที่กำหนด ความถี่ ความถี่ ความหนาแน่นสัมบูรณ์และสัมพัทธ์ ความถี่และความถี่สะสมเป็นคุณลักษณะของขนาดของตัวแปร

มีการศึกษาความแปรผันในลักษณะหน่วยทางสถิติของประชากรตลอดจนลักษณะของการกระจาย โดยใช้ตัวบ่งชี้และลักษณะของชุดข้อมูลรูปแบบต่างๆ ซึ่งรวมถึงระดับเฉลี่ยของชุดข้อมูล ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว , สัมประสิทธิ์การแกว่ง, การแปรผัน, ความไม่สมมาตร, ความโด่ง ฯลฯ

ค่าเฉลี่ยใช้เพื่อกำหนดลักษณะของศูนย์กระจายสินค้า ค่าเฉลี่ยเป็นคุณลักษณะทางสถิติทั่วไป โดยจะวัดปริมาณระดับทั่วไปของคุณลักษณะที่สมาชิกของประชากรที่กำลังศึกษาครอบครองอยู่ อย่างไรก็ตาม กรณีที่มีความบังเอิญของค่าเฉลี่ยเลขคณิตที่มีรูปแบบการแจกแจงที่แตกต่างกันจึงเป็นไปได้ ดังนั้น เนื่องจากลักษณะทางสถิติของชุดการแปรผัน จึงคำนวณสิ่งที่เรียกว่าวิธีโครงสร้าง - โหมด ค่ามัธยฐาน และควอนไทล์ ซึ่งแบ่งชุดการแจกแจงออกเป็นส่วนเท่า ๆ กัน (ควอไทล์ เดซิล เปอร์เซ็นไทล์ ฯลฯ )

แฟชั่น -นี่คือค่าของลักษณะเฉพาะที่เกิดขึ้นในชุดการแจกแจงบ่อยกว่าค่าอื่นๆ สำหรับซีรีย์แยก นี่คือตัวเลือกที่มีความถี่สูงสุด ในซีรีย์การเปลี่ยนแปลงช่วงเวลา เพื่อกำหนดโหมด จำเป็นต้องกำหนดช่วงเวลาที่โหมดนั้นตั้งอยู่ก่อน ซึ่งเรียกว่าช่วงโมดอล ในอนุกรมรูปแบบที่มีช่วงเวลาเท่ากัน ช่วงโมดอลจะถูกกำหนดโดยความถี่สูงสุด ในอนุกรมที่มีช่วงเวลาที่ไม่เท่ากัน - แต่โดยความหนาแน่นของการแจกแจงสูงสุด จากนั้นจะใช้สูตรเพื่อกำหนดโหมดในแถวในช่วงเวลาที่เท่ากัน

โดยที่ Mo คือมูลค่าแฟชั่น xMo - ขีดจำกัดล่างของช่วงเวลาโมดอล ชม-ความกว้างช่วงกิริยา; / Mo - ความถี่ของช่วงเวลาโมดอล; / Mo j คือความถี่ของช่วงพรีโมดัล / Mo+1 คือความถี่ของช่วงหลังโมดอล และสำหรับชุดข้อมูลที่มีช่วงเวลาไม่เท่ากันในสูตรการคำนวณนี้ แทนที่จะใช้ความถี่ / Mo, / Mo, / Mo ควรใช้ความหนาแน่นของการแจกแจง จิตใจ 0 _| , จิตใจ 0> ยูโม่+"

หากมีโหมดเดียว การแจกแจงความน่าจะเป็นของตัวแปรสุ่มจะเรียกว่ายูนิโมดัล หากมีมากกว่าหนึ่งโหมดจะเรียกว่า multimodal (polymodal, multimodal) ในกรณีของสองโหมด - bimodal ตามกฎแล้ว multimodality บ่งชี้ว่าการแจกแจงภายใต้การศึกษาไม่เป็นไปตามกฎการแจกแจงแบบปกติ ตามกฎแล้ว ประชากรที่เป็นเนื้อเดียวกันมีลักษณะเฉพาะด้วยการแจกแจงจุดยอดเดี่ยว Multivertex ยังบ่งบอกถึงความหลากหลายของประชากรที่กำลังศึกษาอีกด้วย การปรากฏตัวของจุดยอดตั้งแต่สองจุดขึ้นไปทำให้จำเป็นต้องจัดกลุ่มข้อมูลใหม่เพื่อระบุกลุ่มที่เป็นเนื้อเดียวกันมากขึ้น

ในชุดความแปรผันตามช่วงเวลา สามารถกำหนดโหมดได้เป็นกราฟิกโดยใช้ฮิสโตแกรม เมื่อต้องการทำเช่นนี้ ให้ลากเส้นสองเส้นที่ตัดกันจากด้านบนของคอลัมน์ที่สูงที่สุดของฮิสโตแกรมไปยังด้านบนของคอลัมน์สองคอลัมน์ที่อยู่ติดกัน จากนั้น จากจุดตัดกัน เส้นตั้งฉากจะลดลงไปบนแกนแอบซิสซา ค่าของคุณลักษณะบนแกน x ที่สอดคล้องกับแนวตั้งฉากคือโหมด ในหลายกรณี เมื่อระบุลักษณะประชากร การตั้งค่าจะถูกกำหนดให้กับโหมดมากกว่าค่าเฉลี่ยเลขคณิตเพื่อเป็นตัวบ่งชี้ทั่วไป

ค่ามัธยฐาน -นี่คือค่าส่วนกลางของแอ็ตทริบิวต์ ซึ่งถูกครอบครองโดยสมาชิกศูนย์กลางของซีรีย์อันดับของการแจกแจง ในอนุกรมแบบแยกกัน หากต้องการหาค่ามัธยฐาน จะต้องพิจารณาหมายเลขซีเรียลของมันก่อน เมื่อต้องการทำเช่นนี้ หากจำนวนหน่วยเป็นเลขคี่ หน่วยหนึ่งจะถูกบวกเข้ากับผลรวมของความถี่ทั้งหมด และจำนวนจะถูกหารด้วยสอง หากมีหน่วยเป็นจำนวนคู่ติดต่อกันก็จะมีหน่วยมัธยฐานสองหน่วย ดังนั้นในกรณีนี้ ค่ามัธยฐานจึงถูกกำหนดให้เป็นค่าเฉลี่ยของค่ามัธยฐานทั้งสองหน่วย ดังนั้น ค่ามัธยฐานของอนุกรมความแปรผันแบบไม่ต่อเนื่องคือค่าที่แบ่งอนุกรมออกเป็นสองส่วนซึ่งมีจำนวนตัวเลือกเท่ากัน

ในอนุกรมช่วงเวลาหลังจากกำหนดหมายเลขซีเรียลของค่ามัธยฐานแล้ว จะพบช่วงค่ามัธยฐานโดยใช้ความถี่สะสม (ความถี่) จากนั้นใช้สูตรในการคำนวณค่ามัธยฐานค่าของค่ามัธยฐานจะถูกกำหนด:

โดยที่ Me คือค่ามัธยฐาน x ฉัน -ขีดจำกัดล่างของช่วงค่ามัธยฐาน ชม-ความกว้างของช่วงค่ามัธยฐาน - ผลรวมของความถี่ของอนุกรมการแจกแจง /D - ความถี่สะสมของช่วงก่อนมัธยฐาน / Me - ความถี่ของช่วงค่ามัธยฐาน

ค่ามัธยฐานสามารถพบได้แบบกราฟิกโดยใช้การสะสม เมื่อต้องการทำเช่นนี้ ในระดับความถี่สะสม (ความถี่) ของการสะสม จากจุดที่สอดคล้องกับเลขลำดับของค่ามัธยฐาน เส้นตรงจะถูกลากขนานกับแกน abscissa จนกระทั่งตัดกับค่าสะสม ถัดไปจากจุดตัดของเส้นที่ระบุพร้อมกับการสะสม ตั้งฉากจะลดลงไปที่แกน abscissa ค่าของคุณลักษณะบนแกน x ที่สอดคล้องกับพิกัดที่วาด (ตั้งฉาก) คือค่ามัธยฐาน

ค่ามัธยฐานมีคุณสมบัติดังต่อไปนี้

  • 1. มันไม่ได้ขึ้นอยู่กับค่าแอตทริบิวต์เหล่านั้นที่อยู่ด้านใดด้านหนึ่งของมัน
  • 2. มีคุณสมบัติของความน้อยที่สุดซึ่งหมายความว่าผลรวมของการเบี่ยงเบนสัมบูรณ์ของค่าแอตทริบิวต์จากค่ามัธยฐานแสดงถึงค่าต่ำสุดเมื่อเทียบกับค่าเบี่ยงเบนของค่าแอตทริบิวต์จากค่าอื่น ๆ
  • 3. เมื่อรวมการแจกแจงสองค่าเข้ากับค่ามัธยฐานที่ทราบ เป็นไปไม่ได้ที่จะทำนายค่ามัธยฐานของการแจกแจงใหม่ล่วงหน้าได้

คุณสมบัติค่ามัธยฐานเหล่านี้ใช้กันอย่างแพร่หลายในการออกแบบที่ตั้งจุดบริการสาธารณะ เช่น โรงเรียน คลินิก ปั๊มน้ำมัน ปั๊มน้ำ เป็นต้น ตัวอย่างเช่น หากมีการวางแผนที่จะสร้างคลินิกในบล็อกหนึ่งของเมือง ก็จะเป็นการสะดวกกว่าที่จะตั้งอยู่ในจุดหนึ่งในบล็อกที่ไม่ลดความยาวของบล็อกลงครึ่งหนึ่ง แต่ลดจำนวนผู้อยู่อาศัยลงครึ่งหนึ่ง

อัตราส่วนของโหมด ค่ามัธยฐาน และค่าเฉลี่ยเลขคณิตบ่งชี้ถึงลักษณะของการกระจายตัวของคุณลักษณะโดยรวม และช่วยให้เราประเมินความสมมาตรของการแจกแจงได้ ถ้า x ฉัน แล้วอนุกรมนี้จะมีความไม่สมมาตรทางด้านขวา โดยมีการกระจายแบบปกติ เอ็กซ์ -ฉัน-โม

K. Pearson จากการจัดตำแหน่งของเส้นโค้งประเภทต่างๆ พบว่าสำหรับการแจกแจงแบบอสมมาตรปานกลาง ความสัมพันธ์โดยประมาณระหว่างค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และแบบวิธีต่อไปนี้ใช้ได้:

โดยที่ Me คือค่ามัธยฐาน โม - ความหมายของแฟชั่น x เลขคณิต - ค่าของค่าเฉลี่ยเลขคณิต

หากจำเป็นต้องศึกษาโครงสร้างของซีรีย์รูปแบบต่างๆ ให้ละเอียดยิ่งขึ้น ให้คำนวณค่าลักษณะเฉพาะที่คล้ายกับค่ามัธยฐาน ค่าคุณลักษณะดังกล่าวแบ่งหน่วยการแจกแจงทั้งหมดออกเป็นจำนวนเท่ากัน เรียกว่าควอนไทล์หรือการไล่ระดับสี ควอไทล์แบ่งออกเป็นควอร์ไทล์ เดซิล เปอร์เซ็นไทล์ ฯลฯ

ควอไทล์แบ่งประชากรออกเป็นสี่ส่วนเท่า ๆ กัน ควอร์ไทล์แรกคำนวณคล้ายกับค่ามัธยฐานโดยใช้สูตรในการคำนวณควอไทล์แรกโดยกำหนดช่วงไตรมาสแรกไว้ก่อนหน้านี้:

โดยที่ Qi คือค่าของควอไทล์ที่หนึ่ง เอ็กซ์คิว^-ขีดจำกัดล่างของช่วงควอไทล์แรก ชม.- ความกว้างของช่วงไตรมาสแรก /, - ความถี่ของอนุกรมช่วงเวลา;

ความถี่สะสมในช่วงก่อนช่วงควอไทล์แรก Jq ( - ความถี่ของช่วงควอไทล์แรก

ควอไทล์ที่ 1 แสดงว่า 25% ของหน่วยประชากรน้อยกว่ามูลค่าของมัน และ 75% มีค่ามากกว่า ควอร์ไทล์ที่สองมีค่าเท่ากับค่ามัธยฐานนั่นคือ คำถามที่ 2 =ฉัน.

โดยการเปรียบเทียบ ควอไทล์ที่สามจะถูกคำนวณ โดยพบช่วงไตรมาสที่สามเป็นครั้งแรก:

โดยที่ขีด จำกัด ล่างของช่วงควอไทล์ที่สามคือ ชม.- ความกว้างของช่วงควอไทล์ที่สาม /, - ความถี่ของอนุกรมช่วงเวลา; /เอ็กซ์" -ความถี่สะสมในช่วงเวลาก่อนหน้า

ช่วงควอไทล์ที่สาม Jq คือความถี่ของช่วงควอไทล์ที่สาม

ควอไทล์ที่สามแสดงให้เห็นว่า 75% ของหน่วยประชากรน้อยกว่ามูลค่าของมัน และมากกว่า 25%

ความแตกต่างระหว่างควอไทล์ที่สามและควอร์ไทล์ที่หนึ่งคือช่วงระหว่างควอไทล์:

โดยที่ Aq คือค่าของพิสัยระหว่างควอไทล์ คำถามที่ 3 -ค่าควอไทล์ที่สาม Q คือค่าของควอไทล์ที่หนึ่ง

Deciles แบ่งประชากรออกเป็น 10 ส่วนเท่า ๆ กัน เดไซล์คือค่าของลักษณะเฉพาะในชุดการแจกแจงที่สอดคล้องกับหนึ่งในสิบของขนาดประชากร จากการเปรียบเทียบกับควอร์ไทล์ เดไซล์ที่ 1 แสดงว่า 10% ของหน่วยประชากรมีค่าน้อยกว่าค่าของมัน และ 90% มีค่ามากกว่า และเดไซล์ที่ 9 แสดงว่า 90% ของหน่วยประชากรมีค่าน้อยกว่าค่าของมัน และ 10% คือ มากขึ้น อัตราส่วนของเดซิลที่เก้าและเดซิลแรกคือ ค่าสัมประสิทธิ์เดไซล์ถูกนำมาใช้กันอย่างแพร่หลายในการศึกษาความแตกต่างของรายได้ เพื่อวัดอัตราส่วนของระดับรายได้ของผู้ร่ำรวยที่สุด 10% และ 10% ของประชากรที่ร่ำรวยน้อยที่สุด เปอร์เซ็นต์ไทล์แบ่งประชากรอันดับออกเป็น 100 ส่วนเท่าๆ กัน การคำนวณ ความหมาย และการประยุกต์เปอร์เซ็นไทล์จะคล้ายกับเดซิล

ควอไทล์ เดซิล และคุณลักษณะทางโครงสร้างอื่นๆ สามารถกำหนดได้ในรูปแบบกราฟิกโดยการเปรียบเทียบกับค่ามัธยฐานโดยใช้การสะสม

ในการวัดขนาดของความแปรผัน มีการใช้ตัวบ่งชี้ต่อไปนี้: ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ขนาดของช่วงการเปลี่ยนแปลงขึ้นอยู่กับการสุ่มของการกระจายตัวของสมาชิกสุดขั้วของซีรีส์ทั้งหมด ตัวบ่งชี้นี้เป็นที่สนใจในกรณีที่สิ่งสำคัญคือต้องรู้ว่าค่าความผันผวนของค่าคุณลักษณะคือเท่าใด:

ที่ไหน ร-ค่าของช่วงของการแปรผัน x max - ค่าสูงสุดของแอตทริบิวต์ เอ็กซ์ ที -ค่าต่ำสุดของแอตทริบิวต์

เมื่อคำนวณช่วงของการแปรผัน ค่าของสมาชิกซีรีส์ส่วนใหญ่จะไม่ถูกนำมาพิจารณา ในขณะที่ความแปรผันจะสัมพันธ์กับค่าแต่ละค่าของสมาชิกซีรีส์ ตัวบ่งชี้ที่เป็นค่าเฉลี่ยที่ได้จากการเบี่ยงเบนของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยไม่มีข้อเสียเปรียบนี้: ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน มีความสัมพันธ์โดยตรงระหว่างการเบี่ยงเบนส่วนบุคคลจากค่าเฉลี่ยและความแปรปรวนของลักษณะเฉพาะ ยิ่งความผันผวนรุนแรงเท่าใด ขนาดสัมบูรณ์ของการเบี่ยงเบนจากค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคือค่าเฉลี่ยเลขคณิตของค่าสัมบูรณ์ของการเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยสำหรับข้อมูลที่ไม่ได้จัดกลุ่ม

โดยที่ /pr คือค่าของค่าเบี่ยงเบนเชิงเส้นเฉลี่ย x, - คือค่าของแอตทริบิวต์; เอ็กซ์ - พี -จำนวนหน่วยในประชากร

ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยของอนุกรมที่จัดกลุ่ม

โดยที่ / vz - ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย x คือค่าของแอตทริบิวต์ เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา / - จำนวนหน่วยประชากรในกลุ่มแยก

ในกรณีนี้ สัญญาณของการเบี่ยงเบนจะถูกละเว้น มิฉะนั้นผลรวมของการเบี่ยงเบนทั้งหมดจะเท่ากับศูนย์ ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ขึ้นอยู่กับการจัดกลุ่มข้อมูลที่วิเคราะห์ คำนวณโดยใช้สูตรต่างๆ: สำหรับข้อมูลที่จัดกลุ่มและไม่ได้จัดกลุ่ม เนื่องจากแบบแผน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยซึ่งแยกจากตัวบ่งชี้การเปลี่ยนแปลงอื่น ๆ ถูกนำมาใช้ในทางปฏิบัติค่อนข้างน้อย (โดยเฉพาะอย่างยิ่งเพื่อระบุลักษณะการปฏิบัติตามภาระผูกพันตามสัญญาเกี่ยวกับความสม่ำเสมอของการส่งมอบ ในการวิเคราะห์มูลค่าการซื้อขายการค้าต่างประเทศ องค์ประกอบ ของพนักงาน จังหวะการผลิต คุณภาพผลิตภัณฑ์ โดยคำนึงถึงคุณลักษณะทางเทคโนโลยีของการผลิต และอื่นๆ)

ค่าเบี่ยงเบนมาตรฐานแสดงลักษณะค่าเฉลี่ยของแต่ละค่าของคุณลักษณะที่กำลังศึกษาซึ่งเบี่ยงเบนไปจากค่าเฉลี่ยของประชากรและแสดงเป็นหน่วยการวัดคุณลักษณะที่กำลังศึกษา ค่าเบี่ยงเบนมาตรฐานซึ่งเป็นหนึ่งในมาตรการหลักของการแปรผันนั้นใช้กันอย่างแพร่หลายในการประเมินขีด จำกัด ของการเปลี่ยนแปลงของลักษณะเฉพาะในประชากรที่เป็นเนื้อเดียวกันในการกำหนดค่าพิกัดของเส้นโค้งการแจกแจงแบบปกติตลอดจนในการคำนวณที่เกี่ยวข้องกับ องค์กรของการสังเกตตัวอย่างและการสร้างความแม่นยำของลักษณะตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่ได้จัดกลุ่มคำนวณโดยใช้อัลกอริทึมต่อไปนี้ ค่าเบี่ยงเบนแต่ละค่าจากค่าเฉลี่ยจะถูกยกกำลังสอง กำลังสองทั้งหมดจะถูกรวมเข้าด้วยกัน หลังจากนั้นผลรวมของกำลังสองจะถูกหารด้วยจำนวนเทอมของอนุกรม และรากที่สองจะถูกแยกออกจาก ความฉลาดทาง:

โดยที่ Iip คือค่าของส่วนเบี่ยงเบนมาตรฐาน Xj-ค่าแอตทริบิวต์ เอ็กซ์- ค่าเฉลี่ยของลักษณะประชากรที่กำลังศึกษา พี -จำนวนหน่วยในประชากร

สำหรับข้อมูลที่วิเคราะห์แบบกลุ่ม ค่าเบี่ยงเบนมาตรฐานของข้อมูลจะคำนวณโดยใช้สูตรถ่วงน้ำหนัก

ที่ไหน - ค่าเบี่ยงเบนมาตรฐาน Xj-ค่าแอตทริบิวต์ เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา ฉx -จำนวนหน่วยประชากรในกลุ่มใดกลุ่มหนึ่ง

การแสดงออกภายใต้รูทในทั้งสองกรณีเรียกว่าความแปรปรวน ดังนั้นการกระจายตัวจึงคำนวณเป็นกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าคุณลักษณะจากค่าเฉลี่ย สำหรับค่าแอตทริบิวต์ที่ไม่ถ่วงน้ำหนัก (แบบง่าย) ความแปรปรวนจะถูกกำหนดดังนี้:

สำหรับค่าคุณลักษณะแบบถ่วงน้ำหนัก

นอกจากนี้ยังมีวิธีที่ง่ายเป็นพิเศษในการคำนวณความแปรปรวน: โดยทั่วไป

สำหรับค่าคุณลักษณะที่ไม่ถ่วงน้ำหนัก (แบบง่าย) สำหรับค่าคุณลักษณะแบบถ่วงน้ำหนัก
โดยใช้วิธีแบบศูนย์

โดยที่ 2 คือค่าการกระจายตัว x, - คือค่าของแอตทริบิวต์; เอ็กซ์ -ค่าเฉลี่ยของลักษณะ ชม-ค่าช่วงกลุ่ม เสื้อ 1 -น้ำหนัก (A =

การกระจายตัวมีการแสดงออกทางสถิติเป็นของตัวเอง และเป็นหนึ่งในตัวชี้วัดที่สำคัญที่สุดของการเปลี่ยนแปลง มีการวัดเป็นหน่วยที่สอดคล้องกับกำลังสองของหน่วยการวัดคุณลักษณะที่กำลังศึกษา

การกระจายตัวมีคุณสมบัติดังนี้

  • 1. ความแปรปรวนของค่าคงที่เป็นศูนย์
  • 2. การลดค่าทั้งหมดของคุณลักษณะด้วยค่า A เดียวกันจะไม่เปลี่ยนค่าการกระจายตัว ซึ่งหมายความว่ากำลังสองเฉลี่ยของการเบี่ยงเบนไม่สามารถคำนวณได้จากค่าที่กำหนดของลักษณะเฉพาะ แต่จากการเบี่ยงเบนจากจำนวนคงที่บางส่วน
  • 3. การลดค่าลักษณะใด ๆ ใน เคครั้งจะช่วยลดการกระจายตัวโดย เค 2 ครั้ง แล้วค่าเบี่ยงเบนมาตรฐานอยู่ใน เคครั้งเช่น ค่าทั้งหมดของแอตทริบิวต์สามารถหารด้วยจำนวนคงที่ (เช่นด้วยค่าของช่วงอนุกรม) สามารถคำนวณค่าเบี่ยงเบนมาตรฐานแล้วคูณด้วยจำนวนคงที่
  • 4. หากเราคำนวณกำลังสองเฉลี่ยของการเบี่ยงเบนจากค่าใดๆ และแตกต่างไปจากค่าเฉลี่ยเลขคณิตหนึ่งหรืออย่างอื่น มันจะมากกว่าค่าเฉลี่ยกำลังสองของการเบี่ยงเบนที่คำนวณจากค่าเฉลี่ยเลขคณิตเสมอ กำลังสองเฉลี่ยของการเบี่ยงเบนจะมากขึ้นตามจำนวนที่แน่นอน - โดยกำลังสองของความแตกต่างระหว่างค่าเฉลี่ยและค่าที่รับตามอัตภาพ

การแปรผันของคุณลักษณะทางเลือกประกอบด้วยการมีอยู่หรือไม่มีทรัพย์สินที่ศึกษาในหน่วยของประชากร ในเชิงปริมาณ การแปรผันของคุณลักษณะทางเลือกจะแสดงด้วยค่าสองค่า: การมีอยู่ของหน่วยของทรัพย์สินที่ศึกษาจะแสดงด้วยหนึ่ง (1) และการไม่มีจะแสดงด้วยศูนย์ (0) สัดส่วนของหน่วยที่มีคุณสมบัติที่กำลังศึกษาแสดงด้วย P และสัดส่วนของหน่วยที่ไม่มีคุณสมบัตินี้แสดงโดย ช.ดังนั้น ความแปรปรวนของคุณลักษณะทางเลือกจะเท่ากับผลคูณของสัดส่วนของหน่วยที่ครอบครองคุณสมบัตินี้ (P) ด้วยสัดส่วนของหน่วยที่ไม่มีคุณสมบัตินี้ (ช)ความแปรผันสูงสุดของประชากรเกิดขึ้นได้ในกรณีที่ส่วนหนึ่งของประชากรซึ่งคิดเป็น 50% ของปริมาตรรวมของประชากร มีลักษณะเฉพาะ และอีกส่วนหนึ่งของประชากรซึ่งเท่ากับ 50% ก็ไม่มีลักษณะนี้ และการกระจายตัวถึงค่าสูงสุด 0.25, t .e พ = 0.5, ก= 1 - P = 1 - 0.5 = 0.5 และ o 2 = 0.5 0.5 = 0.25 ขีดจำกัดล่างของตัวบ่งชี้นี้คือศูนย์ ซึ่งสอดคล้องกับสถานการณ์ที่ไม่มีการเปลี่ยนแปลงในผลรวม การประยุกต์ใช้ความแปรปรวนของคุณลักษณะทางเลือกในทางปฏิบัติคือการสร้างช่วงความเชื่อมั่นเมื่อทำการสังเกตตัวอย่าง

ยิ่งความแปรปรวนและค่าเบี่ยงเบนมาตรฐานน้อยลง ประชากรก็จะมีความเป็นเนื้อเดียวกันมากขึ้น และค่าเฉลี่ยโดยทั่วไปก็จะมากขึ้นตามไปด้วย ในทางปฏิบัติด้านสถิติ มักจำเป็นต้องเปรียบเทียบความแปรผันของคุณลักษณะต่างๆ ตัวอย่างเช่น การเปรียบเทียบความแปรผันของอายุของคนงานและคุณสมบัติ ระยะเวลาในการให้บริการและค่าจ้าง ต้นทุนและกำไร ระยะเวลาในการให้บริการและผลิตภาพแรงงาน เป็นต้น เป็นที่น่าสนใจ สำหรับการเปรียบเทียบดังกล่าว ตัวบ่งชี้ความแปรปรวนสัมบูรณ์ของลักษณะไม่เหมาะสม: เป็นไปไม่ได้ที่จะเปรียบเทียบความแปรปรวนของประสบการณ์การทำงานซึ่งแสดงเป็นปีกับการเปลี่ยนแปลงของค่าจ้างซึ่งแสดงเป็นรูเบิล ในการดำเนินการเปรียบเทียบดังกล่าวตลอดจนการเปรียบเทียบความแปรปรวนของลักษณะเดียวกันในประชากรหลาย ๆ กลุ่มที่มีวิธีทางคณิตศาสตร์ที่แตกต่างกัน จะใช้ตัวบ่งชี้การเปลี่ยนแปลง - ค่าสัมประสิทธิ์การแกว่ง ค่าสัมประสิทธิ์เชิงเส้นของการแปรผัน และค่าสัมประสิทธิ์ของการแปรผันซึ่งแสดงการวัด ของความผันผวนของค่าสุดขั้วรอบค่าเฉลี่ย

ค่าสัมประสิทธิ์การสั่น:

ที่ไหน วี อาร์ -ค่าสัมประสิทธิ์การสั่น - ค่าของช่วงของการแปรผัน เอ็กซ์ -

ค่าสัมประสิทธิ์เชิงเส้นของการแปรผัน"

ที่ไหน วีเจ-ค่าของสัมประสิทธิ์เชิงเส้นของการแปรผัน ฉัน -ค่าของค่าเบี่ยงเบนเชิงเส้นเฉลี่ย เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา

ค่าสัมประสิทธิ์ของการแปรผัน:

ที่ไหน วี อา -สัมประสิทธิ์ของค่าความแปรผัน a คือค่าของส่วนเบี่ยงเบนมาตรฐาน เอ็กซ์ -ค่าเฉลี่ยของลักษณะเฉพาะของประชากรที่กำลังศึกษา

ค่าสัมประสิทธิ์การแกว่งคืออัตราส่วนเปอร์เซ็นต์ของช่วงของการแปรผันต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา และค่าสัมประสิทธิ์เชิงเส้นของการแปรผันคืออัตราส่วนของค่าเบี่ยงเบนเชิงเส้นเฉลี่ยต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา ซึ่งแสดงเป็น เปอร์เซ็นต์ ค่าสัมประสิทธิ์ของการแปรผันคือเปอร์เซ็นต์ของส่วนเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยของคุณลักษณะที่กำลังศึกษา ค่าสัมพัทธ์ซึ่งแสดงเป็นเปอร์เซ็นต์จะใช้ค่าสัมประสิทธิ์ความแปรผันเพื่อเปรียบเทียบระดับความแปรผันของคุณลักษณะต่างๆ โดยใช้ค่าสัมประสิทธิ์ของการแปรผัน เพื่อประเมินความเป็นเนื้อเดียวกันของประชากรทางสถิติ หากค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% แสดงว่าประชากรที่ศึกษาอยู่เป็นเนื้อเดียวกันและความแปรผันมีค่าน้อย หากค่าสัมประสิทธิ์ของการแปรผันมากกว่า 33% แสดงว่าประชากรที่อยู่ระหว่างการศึกษามีความหลากหลาย ความแปรผันมีสูง และค่าเฉลี่ยไม่ปกติและไม่สามารถใช้เป็นตัวบ่งชี้ทั่วไปของประชากรกลุ่มนี้ได้ นอกจากนี้ ค่าสัมประสิทธิ์ของการแปรผันยังใช้เพื่อเปรียบเทียบความแปรปรวนของลักษณะหนึ่งในกลุ่มประชากรต่างๆ ตัวอย่างเช่น เพื่อประเมินความผันแปรในระยะเวลาการให้บริการของคนงานในสถานประกอบการสองแห่ง ยิ่งค่าสัมประสิทธิ์ยิ่งสูง ความแปรผันของคุณลักษณะก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น

จากควอไทล์ที่คำนวณได้ ยังเป็นไปได้ที่จะคำนวณตัวบ่งชี้สัมพัทธ์ของการเปลี่ยนแปลงรายไตรมาสโดยใช้สูตร

ที่ไหน Q 2 และ

ช่วงระหว่างควอไทล์ถูกกำหนดโดยสูตร

ค่าเบี่ยงเบนควอไทล์ถูกใช้แทนช่วงของการแปรผัน เพื่อหลีกเลี่ยงข้อเสียที่เกี่ยวข้องกับการใช้ค่าที่มากเกินไป:

สำหรับอนุกรมการแปรผันช่วงเวลาที่ไม่เท่ากัน ความหนาแน่นของการแจกแจงก็จะถูกคำนวณด้วย มันถูกกำหนดให้เป็นผลหารของความถี่หรือความถี่ที่สอดคล้องกันหารด้วยค่าของช่วงเวลา ในอนุกรมช่วงเวลาที่ไม่เท่ากัน จะใช้ความหนาแน่นของการแจกแจงแบบสัมบูรณ์และแบบสัมพัทธ์ ความหนาแน่นของการแจกแจงแบบสัมบูรณ์คือความถี่ต่อความยาวหน่วยของช่วงเวลา ความหนาแน่นของการแจกแจงสัมพัทธ์คือความถี่ต่อความยาวหน่วยของช่วงเวลา

ทั้งหมดข้างต้นเป็นจริงสำหรับซีรี่ส์การจัดจำหน่ายซึ่งมีกฎการแจกจ่ายอธิบายไว้อย่างดีโดยกฎการแจกแจงแบบปกติหรือใกล้เคียงกัน

วิธีการจัดกลุ่มยังช่วยให้คุณวัดผลได้ การเปลี่ยนแปลง(ความแปรปรวน, ความผันผวน) ของสัญญาณ เมื่อจำนวนหน่วยในประชากรมีขนาดค่อนข้างน้อย ความแปรผันจะถูกวัดตามจำนวนหน่วยจัดอันดับที่ประกอบเป็นประชากร ซีรีส์นี้มีชื่อว่า จัดอันดับ,ถ้าหน่วยถูกจัดเรียงจากน้อยไปหามาก (มากไปหาน้อย) ของลักษณะเฉพาะ

อย่างไรก็ตาม ซีรีส์จัดอันดับค่อนข้างบ่งชี้เมื่อจำเป็นต้องมีคุณลักษณะเปรียบเทียบของรูปแบบต่างๆ นอกจากนี้ ในหลายกรณี เราต้องจัดการกับประชากรทางสถิติที่ประกอบด้วยหน่วยจำนวนมาก ซึ่งในทางปฏิบัติยากที่จะแสดงในรูปแบบของชุดข้อมูลเฉพาะ ในเรื่องนี้ สำหรับการทำความรู้จักทั่วไปเบื้องต้นกับข้อมูลทางสถิติและโดยเฉพาะอย่างยิ่งเพื่ออำนวยความสะดวกในการศึกษาความแปรผันของลักษณะ ปรากฏการณ์และกระบวนการภายใต้การศึกษามักจะรวมกันเป็นกลุ่มและผลการจัดกลุ่มจะแสดงในรูปแบบของตารางกลุ่ม

หากตารางกลุ่มมีเพียงสองคอลัมน์ - กลุ่มตามคุณลักษณะที่เลือก (ตัวเลือก) และจำนวนกลุ่ม (ความถี่หรือความถี่) จะเรียกว่า ใกล้กระจาย.

ช่วงการจัดจำหน่าย -การจัดกลุ่มโครงสร้างประเภทที่ง่ายที่สุดตามคุณลักษณะเดียว แสดงในตารางกลุ่มที่มีสองคอลัมน์ที่มีตัวแปรและความถี่ของคุณลักษณะ ในหลายกรณี ด้วยการจัดกลุ่มโครงสร้างดังกล่าว เช่น ด้วยการรวบรวมชุดการแจกแจง การศึกษาเนื้อหาทางสถิติเบื้องต้นจึงเริ่มต้นขึ้น

การจัดกลุ่มโครงสร้างในรูปแบบของชุดการกระจายสามารถเปลี่ยนเป็นการจัดกลุ่มโครงสร้างที่แท้จริงได้ หากกลุ่มที่เลือกไม่เพียงแต่มีลักษณะเฉพาะตามความถี่เท่านั้น แต่ยังรวมถึงตัวบ่งชี้ทางสถิติอื่นๆ ด้วย วัตถุประสงค์หลักของชุดการจัดจำหน่ายคือเพื่อศึกษาความแปรผันของคุณลักษณะ ทฤษฎีอนุกรมการแจกแจงได้รับการพัฒนาโดยละเอียดโดยใช้สถิติทางคณิตศาสตร์

ชุดการจัดจำหน่ายแบ่งออกเป็น เนื่องมาจาก(จัดกลุ่มตามคุณลักษณะ เช่น แบ่งประชากรตามเพศ สัญชาติ สถานภาพการสมรส เป็นต้น) และ แปรผัน(จัดกลุ่มตามลักษณะเชิงปริมาณ)

ซีรี่ส์รูปแบบต่างๆเป็นตารางกลุ่มที่มี 2 คอลัมน์ คือ การจัดกลุ่มหน่วยตามลักษณะเชิงปริมาณหนึ่งลักษณะและจำนวนหน่วยในแต่ละกลุ่ม ช่วงเวลาในชุดรูปแบบมักจะเท่ากันและปิด ซีรี่ส์รูปแบบต่างๆ คือการจัดกลุ่มประชากรรัสเซียตามรายได้ทางการเงินต่อหัวโดยเฉลี่ย (ตารางที่ 3.10)

ตารางที่ 3.10

การกระจายตัวของประชากรรัสเซียโดยรายได้ต่อหัวเฉลี่ยในปี 2547-2552

กลุ่มประชากรโดยรายได้เงินสดต่อหัวโดยเฉลี่ย rub./เดือน

ประชากรในกลุ่ม % ของทั้งหมด

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

มากกว่า 25,000.0

ประชากรทั้งหมด

ในทางกลับกัน ซีรีส์การเปลี่ยนแปลงจะแบ่งออกเป็นแบบไม่ต่อเนื่องและช่วงเวลา ไม่ต่อเนื่องซีรีส์รูปแบบต่างๆ ผสมผสานลักษณะเฉพาะที่แตกต่างกันซึ่งแปรผันภายในขอบเขตแคบๆ ตัวอย่างของซีรีส์รูปแบบที่ไม่ต่อเนื่องคือการกระจายของครอบครัวรัสเซียตามจำนวนลูกที่พวกเขามี

ช่วงเวลาชุดรูปแบบต่างๆ ผสมผสานรูปแบบต่างๆ ของคุณลักษณะต่อเนื่องหรือคุณลักษณะที่ไม่ต่อเนื่องซึ่งแปรผันในช่วงกว้าง Interval คือชุดการเปลี่ยนแปลงของการกระจายตัวของประชากรรัสเซียตามมูลค่ารายได้ทางการเงินเฉลี่ยต่อหัว

ซีรี่ส์รูปแบบที่ไม่ต่อเนื่องไม่ได้ใช้บ่อยนักในทางปฏิบัติ ในขณะเดียวกันการรวบรวมพวกมันก็ไม่ใช่เรื่องยาก เนื่องจากองค์ประกอบของกลุ่มถูกกำหนดโดยตัวแปรเฉพาะที่มีลักษณะการจัดกลุ่มที่ศึกษามีอยู่จริง

ซีรีย์รูปแบบช่วงเวลานั้นแพร่หลายมากขึ้น เมื่อรวบรวมคำถามที่ยากเกิดขึ้นเกี่ยวกับจำนวนกลุ่มตลอดจนขนาดของช่วงเวลาที่ควรกำหนด

หลักการในการแก้ปัญหานี้ได้อธิบายไว้ในบทเกี่ยวกับวิธีการสร้างการจัดกลุ่มทางสถิติ (ดูย่อหน้าที่ 3.3)

ชุดรูปแบบเป็นวิธีการยุบหรือบีบอัดข้อมูลที่หลากหลายให้อยู่ในรูปแบบที่กะทัดรัด จากนั้นเราสามารถตัดสินได้อย่างชัดเจนเกี่ยวกับธรรมชาติของรูปแบบ และศึกษาความแตกต่างในลักษณะของปรากฏการณ์ที่รวมอยู่ในชุดที่กำลังศึกษาอยู่ แต่ความสำคัญที่สำคัญที่สุดของอนุกรมความผันแปรก็คือ คุณลักษณะทั่วไปพิเศษของความแปรผันจะถูกคำนวณบนพื้นฐานของสิ่งเหล่านั้น (ดูบทที่ 7)