أنواع سلسلة الاختلاف. V

دعونا نسمي قيم العينة المختلفة خياراتسلسلة من القيم وتدل على: X 1 , X 2،…. بادئ ذي بدء، سوف ننتج تتراوحالخيارات، أي. ترتيبهم تصاعديا أو تنازليا. لكل خيار، يشار إلى وزنه، أي. رقم يميز مساهمة خيار معين في إجمالي عدد السكان. الترددات أو الترددات بمثابة الأوزان.

تكرار ن ط خيار × طهو رقم يوضح عدد المرات التي يحدث فيها خيار معين في العينة قيد النظر.

التردد أو التردد النسبي ث ط خيار × طهو رقم يساوي نسبة تكرار المتغير إلى مجموع ترددات جميع المتغيرات. يوضح التكرار نسبة الوحدات في عينة السكان التي تحتوي على متغير معين.

تسمى سلسلة من الخيارات مع الأوزان المقابلة لها (الترددات أو التكرارات)، مكتوبة بترتيب تصاعدي (أو تنازلي)، سلسلة الاختلاف.

سلسلة التباين منفصلة وفاصلة.

بالنسبة لسلسلة التباين المنفصلة، ​​يتم تحديد القيم النقطية للخاصية، وبالنسبة لسلسلة الفاصل الزمني، يتم تحديد القيم المميزة في شكل فواصل زمنية. يمكن أن تظهر سلسلة التباين توزيع الترددات أو الترددات النسبية (الترددات)، اعتمادًا على القيمة المشار إليها لكل خيار - التردد أو التردد.

سلسلة الاختلاف المنفصلة لتوزيع الترددلديه النموذج:

تم العثور على الترددات بالصيغة i = 1، 2، …، م.

ث 1 +ث 2 + … + ثم = 1.

مثال 4.1. لمجموعة معينة من الأرقام

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

بناء سلسلة تباين منفصلة من الترددات وتوزيعات التردد.

حل . حجم السكان يساوي ن= 10. سلسلة توزيع التردد المنفصلة لها الشكل

سلسلة الفاصل الزمني لها شكل مماثل من التسجيل.

سلسلة الاختلاف الفاصل لتوزيع الترددمكتوب على النحو التالي:

مجموع كل الترددات يساوي العدد الإجمالي للملاحظات، أي. الحجم الإجمالي: ن = ن 1 +ن 2 + … + نم.

سلسلة التباين الفاصل لتوزيع الترددات النسبية (الترددات)لديه النموذج:

تم العثور على التردد بالصيغة i = 1، 2، …، م.

مجموع كل الترددات يساوي واحد: ث 1 +ث 2 + … + ثم = 1.

غالبًا ما يتم استخدام سلسلة الفترات في الممارسة العملية. إذا كان هناك الكثير من بيانات العينات الإحصائية وتختلف قيمها عن بعضها البعض بمقدار صغير بشكل تعسفي، فإن السلسلة المنفصلة لهذه البيانات ستكون مرهقة للغاية وغير مريحة لمزيد من البحث. في هذه الحالة، يتم استخدام تجميع البيانات، أي. يتم تقسيم الفاصل الزمني الذي يحتوي على جميع قيم السمة إلى عدة فترات جزئية، ومن خلال حساب التكرار لكل فاصل زمني، يتم الحصول على سلسلة الفاصل الزمني. دعونا نكتب بمزيد من التفصيل مخطط إنشاء سلسلة فواصل زمنية، على افتراض أن أطوال الفترات الجزئية ستكون هي نفسها.

2.2 بناء سلسلة الفاصلة

لبناء سلسلة فاصلة تحتاج إلى:

تحديد عدد الفواصل الزمنية؛

تحديد طول الفواصل الزمنية؛

تحديد موقع الفواصل الزمنية على المحور.

لتحديد عدد الفواصل الزمنية ك هناك صيغة ستورجيس، والتي بموجبها

,

أين ن- حجم المجموع الكلي.

على سبيل المثال، إذا كان هناك 100 قيمة لخاصية (متغير)، فمن المستحسن أخذ عدد الفواصل الزمنية المساوية للفواصل الزمنية لإنشاء سلسلة فواصل زمنية.

ومع ذلك، في كثير من الأحيان من الناحية العملية، يتم اختيار عدد الفواصل من قبل الباحث نفسه، مع الأخذ في الاعتبار أن هذا العدد لا ينبغي أن يكون كبيرًا جدًا حتى لا تكون السلسلة مرهقة، ولكن أيضًا ليست صغيرة جدًا حتى لا تفقد بعض خصائص السلسلة. توزيع.

طول الفاصل الزمني ح تحددها الصيغة التالية:

,

أين سماكس و س min هي القيم الأكبر والأصغر للخيارات، على التوالي.

مقاس مُسَمًّى نِطَاقصف.

ولإنشاء الفواصل الزمنية نفسها، فإنها تمضي بطرق مختلفة. واحدة من أبسط الطرق هي على النحو التالي. تعتبر بداية الفاصل الزمني الأول
. ثم يتم العثور على الحدود المتبقية للفترات بواسطة الصيغة. ومن الواضح أن نهاية الفترة الأخيرة أيجب أن يستوفي m+1 الشرط

بعد العثور على جميع حدود الفواصل الزمنية، يتم تحديد ترددات (أو ترددات) هذه الفترات. لحل هذه المشكلة، ابحث في جميع الخيارات وحدد عدد الخيارات التي تقع ضمن فترة زمنية معينة. دعونا نلقي نظرة على البناء الكامل لسلسلة فاصلة باستخدام مثال.

مثال 4.2. بالنسبة للبيانات الإحصائية التالية، المسجلة بترتيب تصاعدي، قم ببناء سلسلة فواصل زمنية يكون عدد الفواصل فيها 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

حل. المجموع ن= 50 قيمة متغيرة.

يتم تحديد عدد الفواصل الزمنية في بيان المشكلة، أي. ك=5.

طول الفترات هو
.

دعونا نحدد حدود الفترات:

أ 1 = 11 − 8,5 = 2,5; أ 2 = 2,5 + 17 = 19,5; أ 3 = 19,5 + 17 = 36,5;

أ 4 = 36,5 + 17 = 53,5; أ 5 = 53,5 + 17 = 70,5; أ 6 = 70,5 + 17 = 87,5;

أ 7 = 87,5 +17 = 104,5.

لتحديد تكرار الفترات، نحسب عدد الخيارات التي تقع ضمن فترة زمنية معينة. على سبيل المثال، الفترة الأولى من 2.5 إلى 19.5 تتضمن الخيارات 11، 12، 12، 14، 14، 15. عددها هو 6، وبالتالي فإن تكرار الفترة الأولى هو ن 1 =6. تردد الفترة الأولى هو . الفترة الثانية من 19.5 إلى 36.5 تتضمن الخيارات 21، 21، 22، 23، 25، وعددها 5. وبالتالي فإن تكرار الفترة الثانية هو ن 2 =5، والتردد . بعد إيجاد التكرارات والترددات لجميع الفترات بطريقة مماثلة، نحصل على سلسلة الفترات التالية.

السلسلة الفاصلة لتوزيع التردد لها الشكل:

مجموع الترددات هو 6+5+9+11+8+11=50.

السلسلة الفاصلة لتوزيع التردد لها الشكل:

مجموع الترددات هو 0.12+0.1+0.18+0.22+0.16+0.22=1. ■

عند إنشاء سلسلة فواصل زمنية، اعتمادًا على الظروف المحددة للمشكلة قيد النظر، يمكن تطبيق قواعد أخرى، وهي

1. يمكن أن تتكون سلسلة تباين الفترات من فترات جزئية ذات أطوال مختلفة. تتيح الأطوال غير المتساوية للفواصل الزمنية تسليط الضوء على خصائص مجموعة إحصائية ذات توزيع غير متساوٍ للخاصية. على سبيل المثال، إذا كانت حدود الفترات تحدد عدد السكان في المدن، فمن المستحسن في هذه المشكلة استخدام فترات غير متساوية الطول. من الواضح أنه بالنسبة للمدن الصغيرة، يعد الفارق البسيط في عدد السكان أمرًا مهمًا، ولكن بالنسبة للمدن الكبيرة، فإن الفارق الذي يبلغ عشرات أو مئات السكان ليس مهمًا. تتم دراسة سلاسل الفترات ذات الأطوال غير المتساوية للفواصل الجزئية بشكل أساسي في النظرية العامة للإحصاء ويعتبرها خارج نطاق هذا الدليل.

2. في الإحصاء الرياضي، يتم أخذ سلسلة الفترات في الاعتبار أحيانًا، حيث يُفترض أن الحد الأيسر للفاصل الزمني الأول يساوي –∞، والحد الأيمن للفاصل الزمني الأخير +∞. يتم ذلك من أجل تقريب التوزيع الإحصائي من التوزيع النظري.

3. عند إنشاء سلسلة الفاصل الزمني، قد يتبين أن قيمة بعض الخيارات تتطابق تمامًا مع حدود الفاصل الزمني. أفضل ما يمكنك فعله في هذه الحالة هو كما يلي. إذا كانت هناك صدفة واحدة فقط، فاعتبر أن الخيار قيد النظر مع تردده يقع في الفاصل الزمني الموجود بالقرب من منتصف سلسلة الفاصل الزمني، إذا كان هناك العديد من هذه الخيارات، فسيتم تعيينها جميعا على الفواصل الزمنية ل يمين هذه الخيارات، أو يتم تعيينها كلها إلى اليسار.

4. بعد تحديد عدد الفترات وطولها يمكن ترتيب الفترات بطريقة أخرى. أوجد الوسط الحسابي لجميع القيم المعتبرة للخيارات Xتزوج وقم ببناء الفاصل الزمني الأول بحيث يكون متوسط ​​العينة هذا داخل فترة ما. وهكذا نحصل على الفاصل الزمني من Xتزوج – 0.5 حل Xالمتوسط.. + 0.5 ح. ثم إلى اليسار واليمين، بإضافة طول الفاصل الزمني، نبني الفترات المتبقية حتى سدقيقة و سلن يقع الحد الأقصى في الفواصل الزمنية الأولى والأخيرة، على التوالي.

5. تتم كتابة سلسلة الفواصل الزمنية التي تحتوي على عدد كبير من الفواصل الزمنية بشكل مريح عموديًا، أي. اكتب الفواصل الزمنية ليس في الصف الأول، ولكن في العمود الأول، والترددات (أو الترددات) في العمود الثاني.

يمكن اعتبار بيانات العينة كقيم لبعض المتغيرات العشوائية X. المتغير العشوائي له قانون التوزيع الخاص به. من المعروف من نظرية الاحتمالات أنه يمكن تحديد قانون التوزيع للمتغير العشوائي المنفصل في شكل سلسلة توزيع، وللمستمر - باستخدام دالة كثافة التوزيع. ومع ذلك، هناك قانون التوزيع العالمي الذي ينطبق على المتغيرات العشوائية المنفصلة والمستمرة. يتم إعطاء قانون التوزيع هذا كوظيفة توزيع ف(س) = ص(X<س). بالنسبة لعينة البيانات، يمكنك تحديد نظير لوظيفة التوزيع - دالة التوزيع التجريبية.


المعلومات ذات الصلة.


تسمى مجموعة قيم المعلمة التي تمت دراستها في تجربة أو ملاحظة معينة، مرتبة حسب القيمة (زيادة أو نقصان)، بسلسلة التباين.

لنفترض أننا قمنا بقياس ضغط الدم لعشرة مرضى من أجل الحصول على العتبة العليا لضغط الدم: الضغط الانقباضي، أي الضغط الانقباضي. رقم واحد فقط.

لنتخيل أن سلسلة من الملاحظات (الإجمالية الإحصائية) للضغط الانقباضي الشرياني في 10 ملاحظات لها الشكل التالي (الجدول 1):

الجدول 1

تسمى مكونات سلسلة التباين بالمتغيرات. تمثل الخيارات القيمة العددية للخاصية التي تتم دراستها.

إن إنشاء سلسلة تباين من مجموعة إحصائية من الملاحظات ليس سوى الخطوة الأولى نحو فهم خصائص المجموعة بأكملها. بعد ذلك، من الضروري تحديد المستوى المتوسط ​​للصفة الكمية التي تتم دراستها (متوسط ​​مستوى البروتين في الدم، متوسط ​​وزن المرضى، متوسط ​​وقت بدء التخدير، وما إلى ذلك)

ويتم قياس المستوى المتوسط ​​باستخدام معايير تسمى المتوسطات. القيمة المتوسطة هي خاصية عددية عامة لقيم متجانسة نوعيا، تميز برقم واحد كامل السكان الإحصائيين وفقا لمعيار واحد. تعبر القيمة المتوسطة عن ما هو مشترك بين خاصية معينة في مجموعة معينة من الملاحظات.

هناك ثلاثة أنواع من المتوسطات شائعة الاستخدام: الوضع () والوسيط () والمتوسط ​​الحسابي ().

لتحديد أي قيمة متوسطة، من الضروري استخدام نتائج الملاحظات الفردية، وتسجيلها في شكل سلسلة تباين (الجدول 2).

موضة- القيمة التي تحدث بشكل متكرر في سلسلة من الملاحظات. في مثالنا، الوضع = 120. إذا لم تكن هناك قيم متكررة في سلسلة التباين، فسيقولون أنه لا يوجد وضع. إذا تكررت عدة قيم بنفس العدد من المرات، فسيتم أخذ أصغرها كوضع.

متوسط- قيمة تقسم التوزيع إلى جزأين متساويين، القيمة المركزية أو المتوسطة لسلسلة من الملاحظات مرتبة بترتيب تصاعدي أو تنازلي. لذلك، إذا كان هناك 5 قيم في سلسلة التباين، فإن متوسطها يساوي الحد الثالث من سلسلة التباين؛ وإذا كان هناك عدد زوجي من الحدود في السلسلة، فإن الوسيط هو الوسط الحسابي لاثنين منها الملاحظات المركزية، أي. إذا كان هناك 10 ملاحظات في سلسلة، فإن الوسيط يساوي المتوسط ​​الحسابي للملاحظات 5 و6. في مثالنا.

دعونا نلاحظ ميزة مهمة للوضع والوسيط: لا تتأثر قيمهما بالقيم العددية للمتغيرات المتطرفة.

المتوسط ​​الحسابيتحسب بواسطة الصيغة:

أين هي القيمة المرصودة في الملاحظة -th، وهو عدد الملاحظات. لحالتنا.

للوسط الحسابي ثلاث خصائص:

يحتل المتوسط ​​المركز الأوسط في سلسلة التباين. في صف متماثل تمامًا.

المتوسط ​​هو قيمة عامة ولا تظهر التقلبات والاختلافات العشوائية في البيانات الفردية خلف المتوسط. إنه يعكس ما هو نموذجي لجميع السكان.

مجموع انحرافات جميع الخيارات عن المتوسط ​​هو صفر: . يشار إلى انحراف الخيار عن المتوسط.

تتكون سلسلة الاختلافات من المتغيرات والترددات المقابلة لها. من بين القيم العشر التي تم الحصول عليها، حدث الرقم 120 6 مرات، 115 - 3 مرات، 125 - 1 مرة. التردد () - العدد المطلق للمتغيرات الفردية في المجموع، مما يشير إلى عدد المرات التي يحدث فيها متغير معين في سلسلة المتغيرات.

يمكن أن تكون سلسلة الاختلافات بسيطة (التكرارات = 1) أو مجمعة ومختصرة، مع 3-5 خيارات. يتم استخدام سلسلة بسيطة لعدد صغير من الملاحظات ()، وتستخدم سلسلة مجمعة لعدد كبير من الملاحظات ().

سلسلة التباين - سلسلة تتم فيها المقارنة (بدرجة الزيادة أو النقصان) خياراتوالمقابلة الترددات

الخيارات هي تعبيرات كمية فردية لخاصية ما. يشار إليها بحرف لاتيني V . يفترض الفهم الكلاسيكي لمصطلح "المتغير" أن كل قيمة فريدة من الخصائص تسمى متغيرًا، دون الأخذ في الاعتبار عدد التكرارات.

على سبيل المثال، في سلسلة تباين مؤشرات ضغط الدم الانقباضي التي تم قياسها لدى عشرة مرضى:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

لا يوجد سوى 6 قيم متاحة:

110, 120, 130, 140, 160, 170.

التردد هو رقم يشير إلى عدد مرات تكرار الخيار. يُشار إليه بحرف لاتيني ص . يُشار إلى مجموع جميع التكرارات (والذي يساوي بالطبع عدد جميع الذين تمت دراستهم) على النحو التالي ن.

    في مثالنا، سوف تأخذ الترددات القيم التالية:
  • للخيار 110 التردد P = 1 (القيمة 110 تحدث في مريض واحد)،
  • للخيار 120 التردد P = 2 (القيمة 120 تحدث في مريضين)،
  • للخيار 130 التردد P = 3 (القيمة 130 تحدث في ثلاثة مرضى)،
  • للخيار 140 التردد P = 2 (القيمة 140 تحدث في مريضين)،
  • للخيار 160 التردد P = 1 (القيمة 160 تحدث في مريض واحد)،
  • للخيار 170 التردد P = 1 (القيمة 170 تحدث في مريض واحد)،

أنواع سلسلة الاختلاف:

  1. بسيط- هذه سلسلة يحدث فيها كل خيار مرة واحدة فقط (جميع الترددات تساوي 1)؛
  2. معلق- سلسلة يظهر فيها خيار واحد أو أكثر أكثر من مرة.

تُستخدم سلسلة الاختلاف لوصف صفائف كبيرة من الأرقام؛ وبهذا الشكل يتم عرض البيانات المجمعة لمعظم الدراسات الطبية في البداية. ومن أجل توصيف سلسلة التباين، يتم حساب مؤشرات خاصة، بما في ذلك القيم المتوسطة، ومؤشرات التباين (ما يسمى بالتشتت)، ومؤشرات تمثيل بيانات العينة.

مؤشرات سلسلة التباين

1) المتوسط ​​الحسابي هو مؤشر عام يوضح حجم السمة محل الدراسة. ويشار إلى الوسط الحسابي كما م ، هو النوع الأكثر شيوعا من المتوسط. يتم حساب الوسط الحسابي على أنه نسبة مجموع قيم المؤشرات لجميع وحدات المراقبة إلى عدد جميع المواد المدروسة. تختلف طريقة حساب الوسط الحسابي بالنسبة لسلسلة التباين البسيطة والمرجحة.

صيغة للحساب المتوسط ​​الحسابي البسيط :

صيغة للحساب المتوسط ​​الحسابي المرجح:

م = Σ(الخامس * ف)/ ن

​ 2) الوضع هو قيمة متوسطة أخرى لسلسلة التباين، تتوافق مع الخيار الأكثر تكرارًا. أو بعبارة أخرى، هذا هو الخيار الذي يتوافق مع أعلى تردد. يشار إليها باسم شهر . يتم حساب الوضع فقط للسلسلة الموزونة، لأنه في السلسلة البسيطة لا يتكرر أي من الخيارات وجميع الترددات تساوي واحدًا.

على سبيل المثال، في سلسلة التباين لقيم معدل ضربات القلب:

80, 84, 84, 86, 86, 86, 90, 94;

قيمة الوضع هي 86، حيث أن هذا الخيار يحدث 3 مرات، وبالتالي فإن تردده هو الأعلى.

3) الوسيط - قيمة الخيار الذي يقسم سلسلة التباين إلى النصف: يوجد على جانبيها عدد متساوٍ من الخيارات. يشير الوسيط، مثل الوسط الحسابي والوضع، إلى القيم المتوسطة. يشار إليها باسم أنا

4) الانحراف المعياري (مرادفات: الانحراف المعياري، انحراف سيجما، سيجما) - مقياس لتباين سلسلة التباين. وهو مؤشر متكامل يجمع كافة حالات الانحراف عن المتوسط. في الواقع، فهو يجيب على السؤال: إلى أي مدى وكم مرة تنتشر المتغيرات من المتوسط ​​الحسابي. يُشار إليه بحرف يوناني σ ("سيجما").

إذا كان حجم السكان أكثر من 30 وحدة، يتم حساب الانحراف المعياري باستخدام الصيغة التالية:

بالنسبة للتجمعات السكانية الصغيرة - 30 وحدة مراقبة أو أقل - يتم حساب الانحراف المعياري باستخدام صيغة مختلفة:

نتيجة لإتقان هذا الفصل يجب على الطالب أن: يعرف

  • مؤشرات التباين وعلاقتها؛
  • القوانين الأساسية لتوزيع الخصائص؛
  • جوهر معايير الموافقة؛ تكون قادرة على
  • حساب مؤشرات التباين ومعايير جودة الملاءمة؛
  • تحديد خصائص التوزيع.
  • تقييم الخصائص العددية الرئيسية لسلسلة التوزيع الإحصائي؛

ملك

  • طرق التحليل الإحصائي لسلسلة التوزيع.
  • أساسيات تحليل التباين.
  • تقنيات للتحقق من سلسلة التوزيع الإحصائي للامتثال للقوانين الأساسية للتوزيع.

مؤشرات التباين

في الدراسة الإحصائية لخصائص المجموعات الإحصائية المختلفة، من المهم جدًا دراسة التباين في خاصية الوحدات الإحصائية الفردية للسكان، وكذلك طبيعة توزيع الوحدات وفقًا لهذه الخاصية. تفاوت -هذه هي الاختلافات في القيم الفردية للخاصية بين وحدات السكان قيد الدراسة. تعتبر دراسة التباين ذات أهمية عملية كبيرة. ومن خلال درجة التباين، يمكن الحكم على حدود تباين إحدى الخصائص، وتجانس المجتمع لخاصية معينة، ونموذجية المتوسط، والعلاقة بين العوامل التي تحدد التباين. تُستخدم مؤشرات التباين لتوصيف وتنظيم المجموعات الإحصائية.

تمثل نتائج ملخص وتجميع مواد المراقبة الإحصائية، المقدمة في شكل سلسلة توزيع إحصائية، توزيعًا منظمًا لوحدات السكان قيد الدراسة إلى مجموعات وفقًا لمعايير التجميع (المتغيرة). إذا تم أخذ خاصية نوعية كأساس للتجميع، فسيتم استدعاء سلسلة التوزيع هذه عزوي(التوزيع حسب المهنة والجنس واللون وما إلى ذلك). إذا تم بناء سلسلة التوزيع على أساس كمي، تسمى هذه السلسلة متغير(التوزيع حسب الطول والوزن والراتب وما إلى ذلك). إن بناء سلسلة تباين يعني تنظيم التوزيع الكمي للوحدات السكانية حسب القيم المميزة، وحساب عدد الوحدات السكانية بهذه القيم (التكرار)، وترتيب النتائج في جدول.

بدلاً من تكرار المتغير، من الممكن استخدام نسبته إلى الحجم الإجمالي للملاحظات، وهو ما يسمى التردد (التردد النسبي).

هناك نوعان من سلسلة التباين: منفصلة وفاصلة. سلسلة منفصلة- هذه سلسلة متغيرة، يعتمد بنائها على خصائص ذات تغير متقطع (خصائص منفصلة). يشمل الأخير عدد الموظفين في المؤسسة وفئة التعريفة وعدد الأطفال في الأسرة وما إلى ذلك. تمثل سلسلة التباين المنفصلة جدولًا يتكون من عمودين. يشير العمود الأول إلى القيمة المحددة للسمة، ويشير العمود الثاني إلى عدد الوحدات في المجتمع بقيمة محددة للسمة. إذا كانت الخاصية لها تغيير مستمر (مبلغ الدخل، ومدة الخدمة، وتكلفة الأصول الثابتة للمؤسسة، وما إلى ذلك، والتي يمكن أن تأخذ أي قيم ضمن حدود معينة)، فمن الممكن بناء هذه الخاصية سلسلة الاختلافات الفاصلة.عند إنشاء سلسلة تباين الفاصل الزمني، يحتوي الجدول أيضًا على عمودين. يشير الأول إلى قيمة السمة في الفاصل الزمني "من - إلى" (الخيارات)، ويشير الثاني إلى عدد الوحدات المضمنة في الفاصل الزمني (التكرار). التردد (تكرار التكرار) - عدد التكرارات لمتغير معين من قيم السمات. يمكن أن تكون الفترات مغلقة أو مفتوحة. الفترات المغلقة محدودة من كلا الجانبين، أي. لها حدود سفلية ("من") وحدود عليا ("إلى"). الفترات المفتوحة لها حدود واحدة: إما حد علوي أو سفلي. إذا تم ترتيب الخيارات بترتيب تصاعدي أو تنازلي، فسيتم استدعاء الصفوف مرتبة.

بالنسبة لسلسلة التباين، هناك نوعان من خيارات استجابة التردد: التردد المتراكم والتردد المتراكم. يوضح التكرار المتراكم عدد الملاحظات التي أخذت فيها قيمة الخاصية قيمًا أقل من القيمة المحددة. يتم تحديد التردد التراكمي من خلال جمع القيم التكرارية لخاصية معينة لمجموعة معينة مع جميع ترددات المجموعات السابقة. يميز التردد المتراكم نسبة وحدات المراقبة التي لا تتجاوز قيم خصائصها الحد الأعلى للمجموعة المحددة. وبالتالي، فإن التكرار المتراكم يوضح نسبة الخيارات في المجموع التي لا تزيد قيمتها عن القيمة المعطاة. التردد والتردد والكثافة المطلقة والنسبية والتكرار المتراكم والتردد هي خصائص حجم المتغير.

تتم دراسة التباينات في خصائص الوحدات الإحصائية للسكان وكذلك طبيعة التوزيع باستخدام مؤشرات وخصائص سلسلة التباين والتي تشمل متوسط ​​مستوى السلسلة، متوسط ​​الانحراف الخطي، الانحراف المعياري، التشتت ، معاملات التذبذب، الاختلاف، عدم التماثل، التفرطح، الخ.

يتم استخدام القيم المتوسطة لوصف مركز التوزيع. المتوسط ​​هو خاصية إحصائية عامة يتم من خلالها تحديد المستوى النموذجي للخاصية التي يمتلكها أفراد المجتمع قيد الدراسة. ومع ذلك، فإن حالات مصادفة الوسائل الحسابية مع أنماط التوزيع المختلفة ممكنة، لذلك، كخصائص إحصائية لسلسلة التباين، يتم حساب ما يسمى بالوسائل الهيكلية - الوضع والوسيط وكذلك الكميات التي تقسم سلسلة التوزيع إلى أجزاء متساوية (الربعيات، العشريات، النسب المئوية، الخ).

موضة -هذه هي قيمة الخاصية التي تحدث في سلسلة التوزيع أكثر من قيمها الأخرى. بالنسبة للسلسلة المنفصلة، ​​هذا هو الخيار ذو التردد الأعلى. في سلسلة تباين الفاصل الزمني، من أجل تحديد الوضع، من الضروري أولاً تحديد الفاصل الزمني الذي يقع فيه، ما يسمى بالفاصل المشروط. في سلسلة متغيرة بفواصل زمنية متساوية، يتم تحديد الفاصل الزمني المشروط بأعلى تردد، في سلسلة بفواصل زمنية غير متساوية - ولكن بأعلى كثافة توزيع. يتم بعد ذلك استخدام الصيغة لتحديد الوضع في الصفوف على فترات زمنية متساوية

حيث Mo هي قيمة الموضة؛ xMo - الحد الأدنى للفاصل الزمني المشروط؛ ح-عرض الفاصل الزمني المشروط؛ / مو - تردد الفاصل الزمني. / Mo j هو تردد الفاصل الزمني الأولي؛ / Mo+1 هو تكرار الفاصل الزمني بعد الوسائط، وبالنسبة لسلسلة ذات فترات زمنية غير متساوية في صيغة الحساب هذه، بدلاً من الترددات / Mo، / Mo، / Mo، يجب استخدام كثافات التوزيع عقل 0 _| , عقل 0> أومو+"

إذا كان هناك وضع واحد، فإن التوزيع الاحتمالي للمتغير العشوائي يسمى أحادي الواسطة؛ إذا كان هناك أكثر من وضع واحد، فإنه يسمى متعدد الوسائط (متعدد الوسائط، متعدد الوسائط)، في حالة وضعين - ثنائي الوسائط. وكقاعدة عامة، تشير تعدد الوسائط إلى أن التوزيع قيد الدراسة لا يخضع لقانون التوزيع الطبيعي. تتميز المجموعات المتجانسة، كقاعدة عامة، بتوزيعات أحادية الرأس. يشير Multivertex أيضًا إلى عدم تجانس السكان قيد الدراسة. إن ظهور رأسين أو أكثر يجعل من الضروري إعادة تجميع البيانات من أجل تحديد مجموعات أكثر تجانساً.

في سلسلة تباين الفاصل الزمني، يمكن تحديد الوضع بيانيًا باستخدام الرسم البياني. للقيام بذلك، ارسم خطين متقاطعين من النقاط العليا لأعلى عمود في الرسم البياني إلى النقاط العليا في عمودين متجاورين. ثم، من نقطة تقاطعهما، يتم إنزال عمودي على محور الإحداثي السيني. قيمة الميزة على المحور السيني المقابل للخط المتعامد هي الوضع. في كثير من الحالات، عند وصف مجموعة سكانية، يتم إعطاء الأفضلية للوضع بدلاً من المتوسط ​​الحسابي كمؤشر معمم.

الوسيط -هذه هي القيمة المركزية للسمة التي يمتلكها العضو المركزي في سلسلة التوزيع المرتبة. في السلسلة المنفصلة، ​​للعثور على قيمة الوسيط، يتم تحديد رقمه التسلسلي أولاً. للقيام بذلك، إذا كان عدد الوحدات فرديًا، تتم إضافة وحدة واحدة إلى مجموع جميع التكرارات، ويتم تقسيم الرقم على اثنين. إذا كان هناك عدد زوجي من الوحدات في صف واحد، فسيكون هناك وحدتان متوسطتان، لذلك في هذه الحالة يتم تعريف الوسيط على أنه متوسط ​​قيم الوحدتين الوسيطتين. وبالتالي، فإن الوسيط في سلسلة التباين المنفصلة هو القيمة التي تقسم السلسلة إلى جزأين يحتويان على نفس عدد الخيارات.

في سلسلة الفترات، بعد تحديد الرقم التسلسلي للوسيط، يتم العثور على الفاصل الزمني المتوسط ​​باستخدام التكرارات المتراكمة (الترددات)، ثم باستخدام صيغة حساب الوسيط، يتم تحديد قيمة الوسيط نفسه:

حيث Me هي القيمة المتوسطة؛ × أنا -الحد الأدنى للفاصل الزمني المتوسط؛ ح-عرض الفاصل الزمني المتوسط؛ - مجموع ترددات سلسلة التوزيع؛ /D - التكرار المتراكم للفاصل الزمني المتوسط؛ / أنا - تردد الفاصل الزمني المتوسط.

يمكن العثور على الوسيط بيانياً باستخدام التراكم. للقيام بذلك، على مقياس الترددات المتراكمة (الترددات) من التراكم، من النقطة المقابلة للرقم الترتيبي للوسيط، يتم رسم خط مستقيم بالتوازي مع محور الإحداثي السيني حتى يتقاطع مع التراكم. بعد ذلك، من نقطة تقاطع الخط المشار إليه مع التراكم، يتم تخفيض عمودي على محور الإحداثي السيني. قيمة السمة على المحور السيني المقابل للإحداثي المرسوم (المتعامد) هي الوسيط.

يتميز الوسيط بالخصائص التالية.

  • 1. لا يعتمد على قيم السمات الموجودة على جانبيه.
  • 2. لها خاصية التصغير، مما يعني أن مجموع الانحرافات المطلقة لقيم السمات عن الوسيط يمثل قيمة دنيا مقارنة بانحراف قيم السمات عن أي قيمة أخرى.
  • 3. عند الجمع بين توزيعين بمتوسطات معروفة، من المستحيل التنبؤ مسبقًا بقيمة متوسط ​​التوزيع الجديد.

تُستخدم خصائص الوسيط هذه على نطاق واسع عند تصميم موقع نقاط الخدمة العامة - المدارس والعيادات ومحطات الوقود ومضخات المياه وما إلى ذلك. على سبيل المثال، إذا كان من المخطط بناء عيادة في مبنى معين من المدينة، فسيكون من الأفضل تحديد موقعها في نقطة في المبنى لا تقلل من طول المبنى إلى النصف، بل عدد السكان.

تشير نسبة الوضع والوسيط والمتوسط ​​الحسابي إلى طبيعة توزيع الخاصية في المجموع وتسمح لنا بتقييم تماثل التوزيع. لو x Me ثم هناك عدم تناسق في الجانب الأيمن من السلسلة. مع التوزيع الطبيعي X -انا - مو.

قرر K. Pearson، استنادًا إلى محاذاة أنواع مختلفة من المنحنيات، أنه بالنسبة للتوزيعات غير المتماثلة إلى حد ما، تكون العلاقات التقريبية التالية بين المتوسط ​​الحسابي والوسيط والوضع صالحة:

حيث Me هي القيمة المتوسطة؛ مو - معنى الموضة؛ حساب x - قيمة الوسط الحسابي.

إذا كانت هناك حاجة لدراسة بنية سلسلة التباين بمزيد من التفصيل، فاحسب القيم المميزة المشابهة للوسيط. تقسم هذه القيم المميزة جميع وحدات التوزيع إلى أعداد متساوية، وتسمى الكميات أو التدرجات. يتم تقسيم الكميات إلى ربعيات، عشرية، نسب مئوية، الخ.

تقسم الربعات السكان إلى أربعة أجزاء متساوية. يتم حساب الربع الأول بشكل مشابه للوسيط باستخدام صيغة حساب الربع الأول، بعد تحديد الفاصل الربع سنوي الأول مسبقًا:

حيث Qi هي قيمة الربع الأول؛ سس^-الحد الأدنى لنطاق الربع الأول؛ ح- عرض فترة الربع الأول؛ /، - ترددات السلسلة الفاصلة؛

التكرار التراكمي في الفترة التي تسبق الفاصل الربعي الأول؛ Jq ( - تردد الفاصل الربعي الأول.

ويبين الربع الأول أن 25% من الوحدات السكانية أقل من قيمتها، و75% أكثر. الربع الثاني يساوي الوسيط، أي. س2=أنا.

على سبيل القياس، يتم حساب الربع الثالث، بعد العثور على الفاصل الزمني الربع سنوي الثالث لأول مرة:

أين هو الحد الأدنى لنطاق الربع الثالث؛ ح- عرض الفاصل الربعي الثالث؛ /، - ترددات السلسلة الفاصلة؛ /X" -التردد المتراكم في الفترة السابقة

ز

الفاصل الربعي الثالث؛ Jq هو تكرار الفاصل الربعي الثالث.

ويبين الربع الثالث أن 75% من الوحدات السكانية أقل من قيمتها، و25% أكثر.

الفرق بين الربعين الثالث والأول هو المدى الربيعي:

حيث Aq هي قيمة المدى الربيعي؛ س 3 -القيمة الربعية الثالثة؛ Q هي قيمة الربع الأول.

العشريات تقسم السكان إلى 10 أجزاء متساوية. العشري هو قيمة إحدى الخصائص في سلسلة التوزيع التي تتوافق مع أعشار حجم السكان. وقياساً على الأرباع، يظهر العُشر الأول أن 10% من الوحدات السكانية أقل من قيمتها، و90% أكبر، ويكشف العُشر التاسع أن 90% من الوحدات السكانية أقل من قيمتها، و10% أقل من قيمتها. أكبر. نسبة العشرية التاسعة والأولى، أي. يستخدم المعامل العشري على نطاق واسع في دراسة تمايز الدخل لقياس نسبة مستويات الدخل لـ 10٪ الأكثر ثراء و 10٪ من السكان الأقل ثراءً. تقسم النسب المئوية السكان المصنفين إلى 100 جزء متساوٍ. يشبه حساب النسب المئوية ومعناها وتطبيقها العشيرية.

يمكن تحديد الربعيات والعشريات والخصائص الهيكلية الأخرى بيانياً عن طريق القياس مع الوسيط باستخدام التراكمات.

لقياس حجم التباين يتم استخدام المؤشرات التالية: مدى التباين، متوسط ​​الانحراف الخطي، الانحراف المعياري، التشتت. يعتمد حجم نطاق التباين كليًا على عشوائية توزيع الأعضاء المتطرفين في السلسلة. يعد هذا المؤشر مهمًا في الحالات التي يكون فيها من المهم معرفة مدى التقلبات في قيم الخاصية:

أين ص-قيمة نطاق الاختلاف. x max - الحد الأقصى لقيمة السمة؛ س تي تي -الحد الأدنى لقيمة السمة.

عند حساب نطاق التباين، لا تؤخذ في الاعتبار قيمة الغالبية العظمى من أعضاء السلسلة، بينما يرتبط التباين بكل قيمة لعضو السلسلة. المؤشرات التي تمثل المتوسطات التي تم الحصول عليها من انحرافات القيم الفردية للخاصية عن متوسط ​​قيمتها لا تحتوي على هذا العيب: متوسط ​​الانحراف الخطي والانحراف المعياري. هناك علاقة مباشرة بين الانحرافات الفردية عن المتوسط ​​وتباين سمة معينة. كلما كان التقلب أقوى، كلما زاد الحجم المطلق للانحرافات عن المتوسط.

متوسط ​​الانحراف الخطي هو الوسط الحسابي للقيم المطلقة لانحرافات الخيارات الفردية عن قيمتها المتوسطة.

متوسط ​​الانحراف الخطي للبيانات غير المجمعة

حيث /pr هي قيمة متوسط ​​الانحراف الخطي؛ x، - هي قيمة السمة؛ X - ع -عدد الوحدات في السكان.

متوسط ​​الانحراف الخطي للسلسلة المجمعة

حيث / vz - قيمة متوسط ​​الانحراف الخطي؛ x، هي قيمة السمة؛ X -متوسط ​​قيمة الخاصية للمجتمع الذي تتم دراسته؛ / - عدد الوحدات السكانية في مجموعة منفصلة.

وفي هذه الحالة يتم تجاهل علامات الانحرافات، وإلا فإن مجموع الانحرافات سيكون مساوياً للصفر. يتم حساب متوسط ​​الانحراف الخطي، اعتمادًا على تجميع البيانات التي تم تحليلها، باستخدام صيغ مختلفة: للبيانات المجمعة وغير المجمعة. نظرًا لاتفاقيته، يتم استخدام متوسط ​​الانحراف الخطي، بشكل منفصل عن مؤشرات التباين الأخرى، في الممارسة العملية نادرًا نسبيًا (على وجه الخصوص، لوصف الوفاء بالالتزامات التعاقدية فيما يتعلق بتوحيد التسليم؛ وفي تحليل دوران التجارة الخارجية، يتم تكوين التكوين للموظفين وإيقاع الإنتاج وجودة المنتج مع مراعاة الميزات التكنولوجية للإنتاج وما إلى ذلك).

يميز الانحراف المعياري مدى انحراف القيم الفردية للخاصية التي تتم دراستها في المتوسط ​​عن متوسط ​​قيمة السكان، ويتم التعبير عنه بوحدات قياس الخاصية التي تتم دراستها. الانحراف المعياري، كونه أحد المقاييس الرئيسية للتباين، يستخدم على نطاق واسع في تقييم حدود تباين خاصية ما في مجتمع متجانس، وفي تحديد القيم الإحداثية لمنحنى التوزيع الطبيعي، وكذلك في الحسابات المتعلقة تنظيم مراقبة العينة وتحديد دقة خصائص العينة. يتم حساب الانحراف المعياري للبيانات غير المجمعة باستخدام الخوارزمية التالية: يتم تربيع كل انحراف عن الوسط، ويتم جمع جميع المربعات، وبعد ذلك يتم قسمة مجموع المربعات على عدد حدود السلسلة ويتم استخراج الجذر التربيعي من حاصل:

حيث Iip هي قيمة الانحراف المعياري؛ XJ-قيمة السمة؛ X- متوسط ​​قيمة الخاصية بالنسبة للمجتمع الذي تتم دراسته؛ ع -عدد الوحدات في السكان.

بالنسبة للبيانات المجمعة التي تم تحليلها، يتم حساب الانحراف المعياري للبيانات باستخدام الصيغة المرجحة

أين - قيمة الانحراف المعياري XJ-قيمة السمة؛ X -متوسط ​​قيمة الخاصية للمجتمع الذي تتم دراسته؛ و س -عدد الوحدات السكانية في مجموعة معينة.

ويسمى التعبير الموجود تحت الجذر في كلتا الحالتين بالتباين. وبالتالي، يتم حساب التشتت على أنه متوسط ​​مربع انحرافات قيم السمات عن قيمتها المتوسطة. بالنسبة لقيم السمات غير الموزونة (البسيطة)، يتم تحديد التباين على النحو التالي:

للقيم المميزة المرجحة

هناك أيضًا طريقة مبسطة خاصة لحساب التباين: بشكل عام

للقيم المميزة غير الموزونة (البسيطة). للقيم المميزة المرجحة
باستخدام الطريقة الصفرية

حيث 2 هي قيمة التشتت؛ x، - هي قيمة السمة؛ X -متوسط ​​قيمة الخاصية، ح-قيمة الفاصل الزمني للمجموعة, ر 1 -الوزن (أ=

للتشتت تعبيره الخاص في الإحصائيات وهو أحد أهم مؤشرات التباين. ويتم قياسها بالوحدات المقابلة لمربع وحدات قياس الخاصية محل الدراسة.

التشتت لديه الخصائص التالية.

  • 1. تباين القيمة الثابتة هو صفر.
  • 2. تخفيض جميع قيم الخاصية بنفس القيمة A لا يغير قيمة التشتت. وهذا يعني أنه لا يمكن حساب متوسط ​​مربع الانحرافات من قيم معينة لخاصية معينة، ولكن من انحرافاتها عن بعض الأرقام الثابتة.
  • 3. تقليل أي قيم مميزة في كمرات يقلل التباين بنسبة كمرتين، والانحراف المعياري موجود كمرات، أي. يمكن تقسيم جميع قيم السمة على رقم ثابت (على سبيل المثال، على قيمة الفاصل الزمني للسلسلة)، ويمكن حساب الانحراف المعياري، ثم ضربه في رقم ثابت.
  • 4. إذا قمنا بحساب متوسط ​​مربع الانحرافات عن أي قيمة ويختلف بدرجة أو بأخرى عن الوسط الحسابي، فسيكون دائمًا أكبر من متوسط ​​مربع الانحرافات المحسوبة من الوسط الحسابي. سيكون متوسط ​​مربع الانحرافات أكبر بمقدار معين جدًا - بمربع الفرق بين المتوسط ​​وهذه القيمة المأخوذة تقليديًا.

يتمثل تباين الخاصية البديلة في وجود أو عدم وجود الخاصية المدروسة في وحدات من السكان. من الناحية الكمية، يتم التعبير عن تباين السمة البديلة بقيمتين: يُشار إلى وجود وحدة من الخاصية المدروسة بالواحد (1)، وغيابها بالصفر (0). يُشار إلى نسبة الوحدات التي تمتلك الخاصية محل الدراسة بالرمز P، ويرمز لنسبة الوحدات التي لا تمتلك هذه الخاصية بالرمز P ز.وبالتالي فإن تباين صفة بديلة يساوي حاصل ضرب نسبة الوحدات التي تمتلك هذه الخاصية (P) في نسبة الوحدات التي لا تمتلك هذه الخاصية (ز).ويتحقق أكبر تباين في عدد السكان في الحالات التي يكون فيها جزء من السكان، يشكل 50% من الحجم الإجمالي للسكان، يتمتع بهذه الخاصية، وجزء آخر من السكان، يساوي أيضًا 50%، لا يتمتع بهذه الخاصية، ويصل التشتت إلى قيمة قصوى تبلغ 0.25، t .e. ف = 0.5، ز= 1 - ف = 1 - 0.5 = 0.5 و س 2 = 0.5 0.5 = 0.25. الحد الأدنى لهذا المؤشر هو صفر، وهو ما يتوافق مع الحالة التي لا يوجد فيها اختلاف في المجموع. التطبيق العملي لتباين الخاصية البديلة هو بناء فترات الثقة عند إجراء ملاحظات العينة.

كلما كان التباين والانحراف المعياري أصغر، كلما كان المجتمع أكثر تجانسًا وكان المتوسط ​​أكثر نموذجية. في ممارسة الإحصاء، غالبًا ما تكون هناك حاجة لمقارنة الاختلافات في الخصائص المختلفة. على سبيل المثال، من المثير للاهتمام مقارنة الاختلافات في عمر العمال ومؤهلاتهم، ومدة الخدمة والأجور، والتكلفة والأرباح، وطول الخدمة وإنتاجية العمل، وما إلى ذلك. بالنسبة لمثل هذه المقارنات، فإن مؤشرات التباين المطلق للخصائص غير مناسبة: فمن المستحيل مقارنة تقلب خبرة العمل، المعبر عنها بالسنوات، مع تباين الأجور، المعبر عنها بالروبل. لإجراء مثل هذه المقارنات، وكذلك مقارنات تباين نفس الخاصية في العديد من المجموعات السكانية بوسائل حسابية مختلفة، يتم استخدام مؤشرات التباين - معامل التذبذب، ومعامل التباين الخطي ومعامل التباين، والتي توضح المقياس من تقلبات القيم المتطرفة حول المتوسط.

معامل التذبذب:

أين في آر -قيمة معامل التذبذب ر- قيمة نطاق الاختلاف؛ X -

معامل التباين الخطي".

أين Vj-قيمة المعامل الخطي للاختلاف. أنا -قيمة متوسط ​​الانحراف الخطي. X -متوسط ​​قيمة الخاصية للمجتمع محل الدراسة.

معامل الاختلاف:

أين الخامس أ -معامل قيمة الاختلاف. أ هي قيمة الانحراف المعياري؛ X -متوسط ​​قيمة الخاصية للمجتمع محل الدراسة.

معامل التذبذب هو النسبة المئوية لمدى التباين إلى متوسط ​​قيمة الخاصية محل الدراسة، ومعامل التباين الخطي هو نسبة متوسط ​​الانحراف الخطي إلى متوسط ​​قيمة الخاصية محل الدراسة، ويعبر عنه بـ نسبة مئوية. معامل الاختلاف هو نسبة الانحراف المعياري إلى متوسط ​​قيمة الخاصية محل الدراسة. كقيمة نسبية، يتم التعبير عنها كنسبة مئوية، يتم استخدام معامل التباين لمقارنة درجة التباين في الخصائص المختلفة. باستخدام معامل الاختلاف، يتم تقييم تجانس السكان الإحصائيين. وإذا كان معامل التباين أقل من 33% فإن المجتمع محل الدراسة متجانس والتباين ضعيف. إذا كان معامل التباين أكثر من 33%، فإن المجتمع قيد الدراسة غير متجانس، والتباين قوي، والقيمة المتوسطة غير نمطية ولا يمكن استخدامها كمؤشر عام لهذه السكان. بالإضافة إلى ذلك، يتم استخدام معاملات الاختلاف لمقارنة تباين سمة واحدة في مجموعات سكانية مختلفة. على سبيل المثال، لتقييم التباين في مدة خدمة العمال في مؤسستين. كلما ارتفعت قيمة المعامل، كلما كان التباين في الخاصية أكثر أهمية.

واستنادًا إلى الربعيات المحسوبة، من الممكن أيضًا حساب المؤشر النسبي للتغير ربع السنوي باستخدام الصيغة

حيث س 2 و

يتم تحديد النطاق الربيعي بواسطة الصيغة

يتم استخدام الانحراف الربعي بدلاً من نطاق التباين لتجنب العيوب المرتبطة باستخدام القيم المتطرفة:

بالنسبة لسلسلة تباين الفترات غير المتكافئة، يتم حساب كثافة التوزيع أيضًا. يتم تعريفه على أنه حاصل قسمة التردد أو التردد المقابل على قيمة الفاصل الزمني. في سلسلة الفواصل غير المتساوية، يتم استخدام كثافات التوزيع المطلقة والنسبية. كثافة التوزيع المطلقة هي التكرار لكل وحدة طول الفاصل الزمني. كثافة التوزيع النسبية - التردد لكل وحدة طول الفاصل الزمني.

كل ما سبق ينطبق على سلسلة التوزيع التي يوصف قانون التوزيع بشكل جيد بقانون التوزيع الطبيعي أو قريب منه.

تسمح لك طريقة التجميع أيضًا بالقياس تفاوت(التقلب والتقلب) من العلامات. عندما يكون عدد الوحدات في مجتمع ما صغيرًا نسبيًا، يتم قياس التباين بناءً على العدد المصنف للوحدات التي يتكون منها المجتمع. السلسلة تسمى مرتبة,إذا تم ترتيب الوحدات بترتيب تصاعدي (تنازلي) للخاصية.

ومع ذلك، تعتبر السلاسل المرتبة مؤشرة تمامًا عندما تكون هناك حاجة إلى خاصية مقارنة للتباين. بالإضافة إلى ذلك، يتعين علينا في كثير من الحالات أن نتعامل مع مجموعات إحصائية تتكون من عدد كبير من الوحدات، والتي يصعب عمليًا تمثيلها في شكل سلسلة محددة. في هذا الصدد، من أجل التعرف العام الأولي على البيانات الإحصائية وخاصة لتسهيل دراسة التباين في الخصائص، عادة ما يتم دمج الظواهر والعمليات قيد الدراسة في مجموعات، ويتم عرض نتائج التجميع في شكل جداول جماعية.

إذا كان جدول المجموعة يحتوي على عمودين فقط - مجموعات حسب الخاصية المحددة (الخيارات) وعدد المجموعات (التكرار أو التكرار)، فإنه يسمى بالقرب من التوزيع.

نطاق التوزيع -أبسط نوع من التجميع الهيكلي وفقًا لخاصية واحدة، ويتم عرضه في جدول مجموعات يحتوي على عمودين يحتويان على متغيرات وتكرارات الخاصية. في كثير من الحالات، مع مثل هذا التجمع الهيكلي، أي. ومع تجميع سلسلة التوزيع، تبدأ دراسة المادة الإحصائية الأولية.

يمكن تحويل التجميع الهيكلي في شكل سلسلة توزيع إلى تجميع هيكلي حقيقي إذا كانت المجموعات المختارة تتميز ليس فقط بالتكرارات، ولكن أيضًا بمؤشرات إحصائية أخرى. الغرض الرئيسي من سلسلة التوزيع هو دراسة تباين الخصائص. تم تطوير نظرية سلسلة التوزيع بالتفصيل عن طريق الإحصاء الرياضي.

وتنقسم سلسلة التوزيع إلى عزوي(التجميع وفقًا للخصائص المنسوبة، على سبيل المثال تقسيم السكان حسب الجنس، والجنسية، والحالة الاجتماعية، وما إلى ذلك) و متغير(التجميع حسب الخصائص الكمية).

سلسلة الاختلافهو جدول مجموعات يحتوي على عمودين: تجميع الوحدات حسب خاصية كمية واحدة وعدد الوحدات في كل مجموعة. عادة ما تكون الفواصل الزمنية في سلسلة التباين متساوية ومغلقة. سلسلة الاختلاف هي المجموعة التالية للسكان الروس حسب متوسط ​​​​نصيب الفرد من الدخل النقدي (الجدول 3.10).

الجدول 3.10

توزيع سكان روسيا حسب متوسط ​​دخل الفرد في الفترة 2004-2009.

المجموعات السكانية حسب متوسط ​​دخل الفرد النقدي، فرك/شهر

عدد السكان في المجموعة، % من الإجمالي

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

أكثر من 25,000.0

مجموع السكان

تنقسم سلسلة التباين بدورها إلى منفصلة وفاصلة. منفصلةتجمع سلسلة الاختلافات بين متغيرات الخصائص المنفصلة التي تختلف ضمن حدود ضيقة. مثال على سلسلة التباين المنفصلة هو توزيع الأسر الروسية حسب عدد الأطفال لديهم.

فاصلةتجمع سلسلة التباين بين متغيرات الخصائص المستمرة أو الخصائص المنفصلة التي تختلف على نطاق واسع. الفاصل الزمني هو سلسلة التباين لتوزيع السكان الروس وفقًا لقيمة متوسط ​​​​الدخل النقدي للفرد.

لا يتم استخدام سلسلة التباين المنفصلة في كثير من الأحيان في الممارسة العملية. وفي الوقت نفسه، تجميعها ليس بالأمر الصعب، حيث يتم تحديد تكوين المجموعات من خلال المتغيرات المحددة التي تمتلكها بالفعل خصائص التجميع المدروسة.

تعد سلسلة الاختلافات الفاصلة أكثر انتشارًا. عند تجميعها، ينشأ سؤال صعب حول عدد المجموعات، وكذلك حجم الفواصل الزمنية التي ينبغي تحديدها.

تم توضيح مبادئ حل هذه المشكلة في الفصل الخاص بمنهجية بناء المجموعات الإحصائية (انظر الفقرة 3.3).

تعد سلسلة التباين وسيلة لانهيار أو ضغط المعلومات المتنوعة في شكل مضغوط؛ ومن الممكن إصدار حكم واضح إلى حد ما حول طبيعة التباين، ودراسة الاختلافات في خصائص الظواهر المضمنة في المجموعة قيد الدراسة. لكن الأهمية الأكثر أهمية لسلسلة التباين هي أنه على أساسها يتم حساب الخصائص العامة الخاصة للتباين (انظر الفصل 7).