ما تسمى الخيارات؟ العناصر الأساسية لسلسلة الاختلاف

يتم تقديمها في شكل سلسلة توزيع ويتم تقديمها في النموذج.

سلسلة التوزيع هي أحد أنواع المجموعات.

نطاق التوزيع- يمثل توزيعًا منظمًا لوحدات السكان التي تتم دراستها إلى مجموعات وفقًا لخصائص مختلفة معينة.

اعتمادا على الخاصية الكامنة وراء تشكيل سلسلة التوزيع، يتم تمييزها المنسوبة والمتغيرةصفوف التوزيع:

  • عزوي- تسمى سلاسل التوزيع التي تم إنشاؤها وفقًا للخصائص النوعية.
  • تسمى سلاسل التوزيع المبنية بترتيب تصاعدي أو تنازلي لقيم الخاصية الكمية متغير.
تتكون سلسلة تباين التوزيع من عمودين:

يحتوي العمود الأول القيم الكميةسمة متغيرة، والتي تسمى خياراتويتم تعيينها. خيار منفصل - يتم التعبير عنه كعدد صحيح. يتراوح خيار الفاصل الزمني من وإلى. اعتمادًا على نوع الخيارات، يمكنك إنشاء سلسلة تباينات منفصلة أو بفاصل زمني.
يحتوي العمود الثاني عدد الخيارات المحددة، معبراً عنها بالترددات أو الترددات:

الترددات- هذا أرقام مطلقة، يوضح عدد مرات حدوثها بشكل تراكمي قيمة معينةالعلامات التي تدل . يجب أن يكون مجموع جميع التكرارات مساوياً لعدد الوحدات في إجمالي عدد السكان.

الترددات() يتم التعبير عن التكرارات كنسبة مئوية من الإجمالي. يجب أن يكون مجموع جميع التكرارات المعبر عنها كنسب مئوية مساوياً لـ 100% في كسور الواحد.

التمثيل البياني لسلسلة التوزيع

يتم عرض سلسلة التوزيع بشكل مرئي باستخدام الصور الرسومية.

يتم تصوير سلسلة التوزيع على النحو التالي:
  • مضلع
  • الرسوم البيانية
  • يتراكم
  • الزيتون

مضلع

عند إنشاء مضلع، يتم رسم قيم الخاصية المتغيرة على المحور الأفقي (محور الإحداثي السيني)، وعلى محور رأسي(المحور الصادي) - الترددات أو الترددات.

المضلع في الشكل 6.1 يعتمد على بيانات التعداد الجزئي لسكان روسيا في عام 1994.

6.1. توزيع حجم الأسرة

حالة: تتوفر بيانات عن توزيع 25 عاملاً بإحدى المنشآت حسب فئات التعرفة:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
مهمة: إنشاء سلسلة تباينات منفصلة وتصويرها بيانياً كمضلع توزيع.
حل:
في هذا المثال، الخيارات هي درجة أجر الموظف. لتحديد الترددات، من الضروري حساب عدد الموظفين ذوي فئة التعريفة المقابلة.

يتم استخدام المضلع لسلسلة التباين المنفصلة.

لإنشاء مضلع التوزيع (الشكل 1)، نرسم القيم الكمية للخصائص المتغيرة - الخيارات - على محور الإحداثي السيني (X)، والترددات أو الترددات على المحور الإحداثي.

إذا تم التعبير عن قيم الخاصية في شكل فواصل زمنية، فإن هذه السلسلة تسمى الفاصل الزمني.
سلسلة الفاصلة يتم تصوير التوزيعات بيانياً على شكل رسم بياني أو تراكمي أو ogive.

الجدول الإحصائي

حالة: البيانات المتعلقة بحجم الودائع مذكورة بـ 20 فرادىفي بنك واحد (ألف روبل) 60؛ 25؛ 12؛ 10؛ 68؛ 35؛ 2؛ 17؛ 51؛ 9؛ 3؛ 130؛ 24؛ 85؛ 100؛ 152؛ 6؛ 18؛ 7؛ 42.
مهمة: أنشئ سلسلة تباين بفواصل زمنية متساوية.
حل:

  1. يتكون السكان الأولي من 20 وحدة (ن = 20).
  2. باستخدام صيغة Sturgess، نحدد المبلغ المطلوبالمجموعات المستخدمة: n=1+3,322*lg20=5
  3. لنحسب قيمة الفترة المتساوية: i=(152 - 2) /5 = 30 ألف روبل
  4. دعونا نقسم السكان الأوليين إلى 5 مجموعات بفاصل 30 ألف روبل.
  5. نعرض نتائج التجميع في الجدول:

مع مثل هذا التسجيل للخاصية المستمرة، عندما تحدث نفس القيمة مرتين (كالحد الأعلى لفاصل زمني واحد والحد الأدنى لفاصل زمني آخر)، فإن هذه القيمة تنتمي إلى المجموعة التي تعمل فيها هذه القيمة كحد أعلى.

شريط الرسم البياني

لإنشاء رسم بياني، تتم الإشارة إلى قيم حدود الفواصل الزمنية على طول محور الإحداثي السيني، وبناءً عليها، يتم إنشاء مستطيلات يتناسب ارتفاعها مع الترددات (أو الترددات).

في التين. 6.2. يُظهر رسمًا بيانيًا لتوزيع السكان الروس في عام 1997 حسب الفئة العمرية.

أرز. 6.2. توزيع السكان الروس حسب الفئات العمرية

حالة: يتم توزيع 30 موظف بالشركة على الراتب الشهري

مهمة: عرض سلسلة تباين الفاصل الزمني بيانياً على شكل رسم بياني وتراكمي.
حل:

  1. يتم تحديد الحدود غير المعروفة للفاصل الزمني المفتوح (الأول) بقيمة الفاصل الزمني الثاني: 7000 - 5000 = 2000 روبل. وبنفس القيمة نجد الحد الأدنى للفاصل الزمني الأول: 5000 - 2000 = 3000 روبل.
  2. لبناء الرسم البياني في نظام مستطيلالإحداثيات على طول محور الإحداثي السيني نقوم برسم المقاطع التي تتوافق قيمها مع فترات سلسلة الدوالي.
    تعمل هذه الأجزاء بمثابة القاعدة السفلية، ويكون التردد (التردد) المقابل بمثابة ارتفاع المستطيلات المشكلة.
  3. دعونا نبني الرسم البياني:

لبناء التراكمات، من الضروري حساب الترددات المتراكمة (الترددات). يتم تحديدها من خلال الجمع التسلسلي للترددات (الترددات) للفترات السابقة ويتم تحديدها بـ S. توضح الترددات المتراكمة عدد وحدات السكان التي لها قيمة مميزة لا تزيد عن تلك قيد النظر.

يتراكم

يتم تصوير توزيع الخاصية في سلسلة التباين على الترددات المتراكمة (الترددات) باستخدام التراكم.

يتراكمأو يتم إنشاء منحنى تراكمي، على عكس المضلع، من الترددات أو الترددات المتراكمة. في هذه الحالة، يتم وضع قيم الخاصية على محور الإحداثي، ويتم وضع الترددات أو الترددات المتراكمة على المحور الإحداثي (الشكل 6.3).

أرز. 6.3. يتراكم توزيع حجم الأسرة

4. دعونا نحسب التكرارات المتراكمة:
يتم حساب التكرار التراكمي للفاصل الزمني الأول بالطريقة الآتية: 0 + 4 = 4، للثانية: 4 + 12 = 16؛ والثالث: 4 + 12 + 8 = 24، إلخ.

عند إنشاء تراكم، يتم تعيين التردد (التردد) المتراكم للفاصل الزمني المقابل إلى الحد الأعلى:

أوجيفا

أوجيفاتم إنشاؤه بشكل مشابه للتراكم مع الاختلاف الوحيد وهو أن الترددات المتراكمة يتم وضعها على محور الإحداثي، ويتم وضع القيم المميزة على المحور الإحداثي.

أحد أنواع التراكمات هو منحنى التركيز أو مؤامرة لورنتز. لبناء منحنى التركيز، يتم رسم مقياس مقياس بالنسب المئوية من 0 إلى 100 على محوري نظام الإحداثيات المستطيل، وفي الوقت نفسه، يتم الإشارة إلى الترددات المتراكمة على محور الإحداثيات، والقيم المتراكمة للحصة. (في المئة) من حجم الخاصية يشار إليها على المحور الإحداثي.

يتوافق التوزيع الموحد للخاصية مع قطري المربع على الرسم البياني (الشكل 6.4). وفي حالة التوزيع غير المتساوي، يمثل الرسم البياني منحنى مقعرًا اعتمادًا على مستوى تركيز السمة.

6.4. منحنى التركيز

(تعريف سلسلة التباين؛ مكونات سلسلة التباين؛ ثلاثة أشكال لسلسلة التباين؛ جدوى بناء سلسلة فاصلة؛ الاستنتاجات التي يمكن استخلاصها من السلسلة المبنية)

سلسلة التباين هي تسلسل جميع عناصر العينة مرتبة بترتيب غير تنازلي. تتكرر العناصر المتطابقة

السلاسل المتغيرة هي سلاسل مبنية على أساس كمي.

تتكون سلسلة التوزيع المتغير من عنصرين: الخيارات والترددات:

الخيارات هي القيم الرقميةالخصائص الكمية في سلسلة الاختلاف للتوزيع. يمكن أن تكون إيجابية وسلبية، مطلقة ونسبية. وهكذا عند تجميع المؤسسات حسب النتائج النشاط الاقتصاديالخيارات الإيجابية تعني الربح، و أرقام سلبية- هذه خسارة.

الترددات هي أعداد الخيارات الفردية أو كل مجموعة من سلسلة التباين، أي. هذه أرقام توضح عدد مرات ظهور خيارات معينة في سلسلة التوزيع. يُطلق على مجموع جميع الترددات اسم حجم السكان ويتم تحديده من خلال عدد عناصر المجتمع بأكمله.

الترددات هي ترددات يتم التعبير عنها كـ القيم النسبية(كسور الوحدات أو النسب المئوية). مجموع التكرارات يساوي واحد أو 100%. استبدال الترددات بالترددات يسمح للمرء بمقارنة سلسلة التباين بها أرقام مختلفةالملاحظات.

هناك ثلاثة أشكال من سلسلة الاختلاف:المتسلسلة المرتبة والمتسلسلة المنفصلة والمتسلسلة الفاصلة.

السلسلة المرتبة هي توزيع الوحدات الفردية للسكان بترتيب تصاعدي أو تنازلي للخاصية التي تتم دراستها. يتيح لك الترتيب تقسيم البيانات الكمية بسهولة إلى مجموعات، والكشف الفوري عن أصغرها و أعلى قيمةمميزة، وتسليط الضوء على القيم التي تتكرر في أغلب الأحيان.

الأشكال الأخرى لسلسلة التباين هي جداول جماعية يتم تجميعها حسب طبيعة التباين في قيم الخاصية محل الدراسة. وفقا لطبيعة الاختلاف، يتم التمييز بين الخصائص المنفصلة (المتقطعة) والمستمرة.

سلسلة منفصلة- هذه سلسلة متغيرة يعتمد بنائها على خصائص ذات تغيير متقطع (خصائص منفصلة). وتشمل الأخيرة فئة التعريفة، وعدد الأطفال في الأسرة، وعدد الموظفين في المؤسسة، وما إلى ذلك. لا يمكن إلا أن تؤخذ هذه العلامات الرقم النهائيقيم معينة.

تمثل سلسلة التباين المنفصلة جدولًا يتكون من عمودين. ويشير العمود الأول معنى محددمميزة، وفي الثانية - عدد وحدات السكان قيمة معينةلافتة.

إذا كانت الخاصية لها تغيير مستمر (مبلغ الدخل، ومدة الخدمة، وتكلفة الأصول الثابتة للمؤسسة، وما إلى ذلك، والتي يمكن أن تأخذ أي قيم ضمن حدود معينة)، فمن الضروري لهذه الخاصية بناء سلسلة الاختلافات الفاصلة.



يحتوي جدول المجموعة هنا أيضًا على عمودين. يشير الأول إلى قيمة السمة في الفاصل الزمني "من - إلى" (الخيارات)، ويشير الثاني إلى عدد الوحدات المضمنة في الفاصل الزمني (التكرار).

التردد (تكرار التكرار) - يُشار إلى عدد التكرارات لمتغير معين من قيم السمات، ويُشار إليه بمجموع التكرارات المساوية لحجم السكان قيد الدراسة

حيث k هو عدد الخيارات لقيم السمات

في كثير من الأحيان، يتم استكمال الجدول بعمود يتم فيه حساب التكرارات المتراكمة S، والتي توضح عدد الوحدات في السكان التي لها قيمة مميزة لا تزيد عن هذه القيمة.

سلسلة التوزيع التبايني المنفصلة هي سلسلة تتكون فيها المجموعات وفقًا لخاصية تتغير بشكل منفصل وتأخذ قيمًا صحيحة فقط.

سلسلة التوزيع المتغير بفاصل زمني هي سلسلة يمكن فيها لخاصية التجميع التي تشكل أساس التجميع أن تأخذ أي قيم، بما في ذلك القيم الكسرية، في فاصل زمني معين.

فاصلة سلسلة الاختلافهي مجموعة مرتبة من الفواصل الزمنية المتغيرة لقيم المتغير العشوائي مع التكرارات المقابلة أو ترددات قيم القيمة التي تقع في كل منها.

من المستحسن إنشاء سلسلة توزيع فاصلة، أولاً وقبل كل شيء، مع تباين مستمر للخاصية، وأيضًا إذا ظهر تباين منفصل على نطاق واسع، أي. عدد المتغيرات الخاصة بالخاصية المنفصلة كبير جدًا.

ويمكن بالفعل استخلاص عدة استنتاجات من هذه السلسلة. على سبيل المثال، يمكن أن يكون العنصر الأوسط في سلسلة التباين (الوسيط) بمثابة تقدير لنتيجة القياس الأكثر احتمالية. العنصر الأول والأخير في سلسلة التباين (أي الحد الأدنى و العنصر الأقصىالعينات) تظهر انتشار عناصر العينة. في بعض الأحيان، إذا كان العنصر الأول أو الأخير مختلفًا تمامًا عن بقية عناصر العينة، يتم استبعاده من نتائج القياس، على اعتبار أن هذه القيم تم الحصول عليها نتيجة لنوع من الفشل الفادح، على سبيل المثال، التكنولوجيا.

تسمى مجموعة قيم المعلمة التي تمت دراستها في تجربة أو ملاحظة معينة، مرتبة حسب القيمة (زيادة أو نقصان)، بسلسلة التباين.

لنفترض أننا قمنا بقياس الضغط الشريانيفي عشرة مرضى من أجل الحصول على عتبة ضغط الدم العليا: الضغط الانقباضي، أي. رقم واحد فقط.

لنتخيل أن سلسلة من الملاحظات (المجموعة الإحصائية) للضغط الانقباضي الشرياني في 10 ملاحظات قد تم العرض التالي(الجدول 1):

الجدول 1

تسمى مكونات سلسلة التباين بالمتغيرات. تمثل الخيارات القيمة العددية للخاصية التي تتم دراستها.

إن إنشاء سلسلة تباين من مجموعة إحصائية من الملاحظات ليس سوى الخطوة الأولى نحو فهم خصائص المجموعة بأكملها. القادمة تحتاج إلى تحديد مستوى متوسطالخاصية الكمية محل الدراسة (متوسط ​​مستوى البروتين في الدم، متوسط ​​وزن المرضى، متوسط ​​وقت بدء التخدير، وما إلى ذلك)

ويتم قياس المستوى المتوسط ​​باستخدام معايير تسمى المتوسطات. القيمة المتوسطة - التعميم خاصية عدديةكميات متجانسة نوعيا، وتتميز برقم واحد كامل السكان الإحصائيينوفقا لعلامة واحدة. تعبر القيمة المتوسطة عن ما هو مشترك بين خاصية معينة في مجموعة معينة من الملاحظات.

هناك ثلاثة أنواع من المتوسطات شائعة الاستخدام: الوضع () والوسيط () والمتوسط. الكمية الحسابية ().

لتحديد أي حجم متوسطمن الضروري استخدام نتائج الملاحظات الفردية وتسجيلها في شكل سلسلة متغيرة (الجدول 2).

موضة- القيمة التي تحدث بشكل متكرر في سلسلة من الملاحظات. في مثالنا، الوضع = 120. إذا لم تكن هناك قيم متكررة في سلسلة التباين، فسيقولون أنه لا يوجد وضع. إذا تكررت عدة قيم بنفس العدد من المرات، فسيتم أخذ أصغرها كوضع.

الوسيط- قيمة تقسم التوزيع إلى جزأين متساويين، القيمة المركزية أو المتوسطة لسلسلة من الملاحظات مرتبة بترتيب تصاعدي أو تنازلي. لذلك، إذا كان هناك 5 قيم في سلسلة التباين، فإن متوسطها يساوي الحد الثالث من سلسلة التباين؛ وإذا كان هناك عدد زوجي من الحدود في السلسلة، فإن الوسيط هو الوسط الحسابي لاثنين منها الملاحظات المركزية، أي. إذا كان هناك 10 ملاحظات في سلسلة، فإن الوسيط يساوي المتوسط ​​الحسابي للملاحظات الخامسة والسادسة. في مثالنا.

ملحوظة ميزة مهمةالأوضاع والوسيطات: لا تتأثر قيمها بالقيم العددية للخيارات المتطرفة.

المتوسط ​​الحسابيتحسب بواسطة الصيغة:

أين هي القيمة المرصودة في الملاحظة -th، وهو عدد الملاحظات. لحالتنا.

للوسط الحسابي ثلاث خصائص:

يحتل المتوسط ​​المركز الأوسط في سلسلة التباين. في صف متماثل تمامًا.

المتوسط ​​هو قيمة عامة ولا تظهر التقلبات والاختلافات العشوائية في البيانات الفردية خلف المتوسط. إنه يعكس ما هو نموذجي لجميع السكان.

مجموع انحرافات جميع الخيارات عن المتوسط ​​هو صفر: . يشار إلى انحراف الخيار عن المتوسط.

تتكون سلسلة الاختلافات من المتغيرات والترددات المقابلة لها. من بين القيم العشر التي تم الحصول عليها، حدث الرقم 120 6 مرات، 115 - 3 مرات، 125 - 1 مرة. التردد () - العدد المطلق للمتغيرات الفردية في المجموع، مع الإشارة إلى عدد مرات حدوث ذلك هذا الخيارفي سلسلة الاختلاف.

يمكن أن تكون سلسلة الاختلافات بسيطة (التكرارات = 1) أو مجمعة ومختصرة، مع الخيارات 3-5. يتم استخدام سلسلة بسيطة عندما يكون هناك عدد صغير من الملاحظات ()، مجمعة - متى عدد كبيرالملاحظات ().

السلسلة الإحصائيةتمثل التوزيعات ابسط شكلمجموعات.

سلسلة التوزيع الإحصائي- هذا توزيع كمي مرتب للوحدات السكانية مجموعات متجانسةعلى أساس متفاوت (نسبي أو كمي).

اعتمادا على علامة،في إطار تكوين المجموعات، يتم التمييز بين سلسلة التوزيع المنسوبة والمتغيرة.

عزوي تسمى سلاسل التوزيع التي تم إنشاؤها وفقًا للخصائص النوعية، أي. العلامات التي لا تملك التعبير العددي. مثال على سلسلة توزيع السمات هو توزيع السكان النشطين اقتصاديًا في الاتحاد الروسي حسب الجنس في عام 2010 (الجدول 3.10).

الجدول 3.10. توزيع السكان النشطين اقتصاديًا في الاتحاد الروسي حسب الجنس في عام 2010

متغير وتسمى سلسلة التوزيع المبنية على أساس كمي، أي. علامة لها تعبير عددي.

تتكون سلسلة التوزيع المتغير من عنصرين: الخيارات والترددات.

خيارات قم بتسمية القيم الفردية للخاصية التي تأخذها في سلسلة التباين.

الترددات هي أعداد المتغيرات الفردية أو كل مجموعة من سلسلة الاختلافات. توضح الترددات عدد المرات التي تحدث فيها قيم معينة لخاصية ما في السكان قيد الدراسة. يحدد مجموع جميع الترددات حجم السكان بأكمله وحجمه.

الترددات تسمى الترددات المعبر عنها بكسور الوحدة أو كنسبة مئوية من الإجمالي. وبناء على ذلك، فإن مجموع التكرارات يساوي 1، أو 100٪.

اعتمادا على طبيعة الاختلاف في السمةالتمييز بين سلسلة التوزيع التبايني المنفصلة والفاصلة.

توزيع سلسلة الاختلاف المنفصلة - وهي سلسلة توزيعية تتكون فيها المجموعات طبقا لخاصية تتغير بشكل متقطع، أي: خلال عدد معينالوحدات، ويقبل القيم الصحيحة فقط. على سبيل المثال، توزيع عدد الشقق المبنية الاتحاد الروسيمن خلال عدد الغرف فيها أنا! 2010 (الجدول 3.11).

الجدول 3.11. توزيع عدد الشقق المبنية في الاتحاد الروسي حسب عدد الغرف فيها في عام 2010.

توزيع سلسلة الاختلاف الفاصل - هذه عبارة عن سلسلة توزيع يمكن أن تأخذ فيها خاصية التجميع التي تشكل أساس التجميع أي قيم في الفاصل الزمني تختلف عن بعضها البعض بمقدار صغير بشكل تعسفي.

يُنصح ببناء سلسلة تباين الفاصل في المقام الأول للتغير المستمر للخاصية (الجدول 3.12)، وكذلك إذا كان التباين المنفصل للخاصية يظهر نفسه على نطاق واسع (الجدول 3.13)، أي. عدد المتغيرات الخاصة بالخاصية المنفصلة كبير جدًا.

الجدول 3.12. توزيع رعايا الجنوب المنطقة الفيدراليةالاتحاد الروسي حسب المنطقة اعتبارًا من 1 يناير 2011

الجدول 3.13. توزيع موضوعات المنطقة الفيدرالية المركزية للاتحاد الروسي حسب العدد المؤسسات البلديةالتعليم اعتبارا من 1 يناير 2011

تشبه قواعد إنشاء سلسلة التوزيع قواعد إنشاء المجموعات.

يمكن إجراء تحليل سلاسل التوزيع بشكل مرئي على أساس تمثيلها الرسومي. ولهذا الغرض يتم بناء المضلع والرسم البياني والتوزيعات.

مضلعتستخدم عند تصوير سلسلة توزيع التباين المنفصلة. ولبنائه، في نظام إحداثي مستطيل، يتم رسم القيم المرتبة للخاصية المتغيرة على طول محور الإحداثيات على نفس المقياس، ويتم رسم مقياس للتعبير عن حجم الترددات على طول المحور الإحداثي. تم الحصول عليها عند تقاطع محور الإحداثي السيني (X) وترتبط المحاور الإحداثية (Y) بخطوط مستقيمة، مما يؤدي إلى خط متقطع، ويسمى مضلع التردد.

الرسم البيانيتستخدم لتصوير سلسلة تباين الفاصل الزمني. عند إنشاء الرسم البياني، يتم رسم قيم الفواصل الزمنية على محور الإحداثي السيني، ويتم تصوير الترددات بواسطة مستطيلات مبنية على الفواصل الزمنية المقابلة. يجب أن يكون ارتفاع الأعمدة متناسبًا مع الترددات.

يمكن تحويل الرسم البياني إلى مضلع توزيع عن طريق ربط نقاط منتصف الجوانب العلوية للمستطيلات بخطوط مستقيمة.

عند إنشاء رسم بياني لتوزيع سلسلة التباين بفواصل زمنية غير متساوية، فليست الترددات هي التي يتم رسمها على طول المحور الإحداثي، ولكن كثافة توزيع الخاصية في الفواصل الزمنية المقابلة. كثافة التوزيع - هو التردد المحسوب لكل وحدة عرض الفاصل الزمني،

أولئك. كم عدد الوحدات في كل مجموعة لكل وحدة قيمة الفاصل.

يمكن استخدام المنحنى التراكمي لعرض سلسلة توزيع التباين بيانياً. باستخدام يتراكمتصور سلسلة من الترددات المتراكمة. يتم تحديد الترددات المتراكمة عن طريق الجمع المتسلسل للترددات في المجموعات.

عند بناء تراكمات سلسلة تباين الفاصل الزمني على طول محور الإحداثي السيني (X) يتم رسم متغيرات السلسلة، وعلى طول المحور الإحداثي (Y) توجد الترددات المتراكمة، والتي يتم رسمها على حقل الرسم البياني في شكل عمودي على محور الإحداثي السيني عند الحدود العليا للفواصل الزمنية. ثم يتم توصيل هذه المتعامدين ويتم الحصول على خط متقطع، أي. تتراكم.

إذا، عند تصوير سلسلة متباينة من التوزيعات بيانيًا في شكل تراكمات للمحور X واتضح أن U تتبادل الأماكن ogiva.

بنيت الصفوف على أساس كمي، وتسمى متغير.

تتكون سلسلة التوزيع من خيارات(القيم المميزة) و الترددات(عدد المجموعات). يتم استدعاء الترددات المعبر عنها بالقيم النسبية (الكسور والنسب المئوية). الترددات. ويسمى مجموع جميع الترددات حجم سلسلة التوزيع.

حسب النوع، يتم تقسيم سلسلة التوزيع إلى منفصلة(مبني على قيم متقطعة للخاصية) و فاصلة(مبني على القيم المستمرةلافتة).

سلسلة الاختلافيمثل عمودين (أو صفين)؛ يوفر أحدها قيمًا فردية ذات خاصية مختلفة، تسمى المتغيرات ويشار إليها بـ X؛ وفي الآخر - أرقام مطلقة توضح عدد المرات (كم مرة) يحدث كل خيار. تسمى المؤشرات الموجودة في العمود الثاني بالترددات ويُشار إليها تقليديًا بالرمز f. دعونا نلاحظ مرة أخرى أنه في العمود الثاني على حد سواء المؤشرات النسبية، التي تميز حصة تكرار المتغيرات الفردية في المبلغ الإجماليتكرار تسمى هذه المؤشرات النسبية بالترددات ويُشار إليها تقليديًا بـ ω، مجموع جميع الترددات في هذه الحالة يساوي واحدًا. ومع ذلك، يمكن أيضًا التعبير عن التكرارات كنسب مئوية، ومن ثم فإن مجموع كل التكرارات يعطي 100%.

إذا تم التعبير عن متغيرات سلسلة الاختلاف في النموذج كميات منفصلة، ثم يتم استدعاء سلسلة التباين هذه منفصلة.

بالنسبة للخصائص المستمرة، يتم إنشاء سلسلة الاختلاف على النحو التالي: فاصلةأي يتم التعبير عن قيم السمة فيها "من ... إلى ...". في هذه الحالة، يتم استدعاء الحد الأدنى من قيم الخاصية في مثل هذا الفاصل الزمني الحد الأدنىالفاصل الزمني، والحد الأقصى هو الحد الأعلى.

يتم أيضًا إنشاء سلسلة تباين الفواصل الزمنية لخصائص منفصلة تختلف في مجموعة كبيرة. يمكن أن تكون سلسلة الفاصل الزمني مع متساويو غير متكافئعلى فترات.

لنفكر في كيفية تحديد قيمة الفترات المتساوية. دعونا نقدم التدوين التالي:

أنا- حجم الفاصل الزمني؛

- القيمة القصوىسمة الوحدات السكانية.

الحد الأدنى للقيمةسمة الوحدات السكانية.

ن -عدد المجموعات المخصصة.

، إذا كان n معروفًا.

إذا كان من الصعب تحديد عدد المجموعات التي سيتم تمييزها مسبقًا، فمن أجل حساب القيمة المثلى للفاصل الزمني مع حجم سكاني كافٍ، يمكن التوصية بالصيغة التي اقترحها ستورجيس في عام 1926:

n = 1+ 3.322 log N، حيث N هو عدد الوحدات في المجموع.

يتم تحديد حجم الفترات غير المتساوية في كل حالة على حدة، مع الأخذ بعين الاعتبار خصائص موضوع الدراسة.

توزيع العينات الإحصائيةاستدعاء قائمة الخيارات والترددات المقابلة لها (أو الترددات النسبية).

يمكن تحديد التوزيع الإحصائي للعينة على شكل جدول، في العمود الأول توجد الخيارات منه، وفي الثاني - التكرارات المقابلة لهذه الخيارات نيأو الترددات النسبية باي .

التوزيع الإحصائي للعينة

سلسلة الفترات هي سلسلة تباين يتم فيها التعبير عن قيم الخصائص التي يقوم عليها تكوينها ضمن حدود معينة (فواصل). الترددات في هذه الحالة لا تشير إلى القيم الفرديةمميزة، ولكن إلى الفاصل الزمني بأكمله.

يتم إنشاء سلسلة التوزيع الفاصلة على أساس الخصائص الكمية المستمرة، فضلا عن الخصائص المنفصلة التي تختلف ضمن حدود كبيرة.

يمكن تمثيل سلسلة الفترات بالتوزيع الإحصائي للعينة التي تشير إلى الفترات والترددات المقابلة لها. في هذه الحالة، يتم اعتبار مجموع ترددات المتغيرات التي تقع ضمن هذا الفاصل الزمني بمثابة تردد الفاصل الزمني.

عند التجميع حسب الخصائص الكمية المستمرة، من المهم تحديد حجم الفاصل الزمني.

بالإضافة إلى متوسط ​​العينة وتباين العينة، يتم أيضًا استخدام خصائص أخرى لسلسلة التباين.

موضةيسمى المتغير الذي لديه أعلى تردد.