يتم عرض القيم المتوسطة والجذرية لمتوسط ​​المربعات. الكسور الطبيعية والعشرية

مربع الوسط لعددين غير سالبين a,b هو عدد غير سالب مربعه هو الوسط الحسابي لمربعي العددين a وb، أي الرقم

مسألة 351. يتناول التعريف الوسط الحسابي. ماذا يحدث إذا استبدلته بالوسط الهندسي؟

مسألة 352. أثبت أن المربع المتوسط ​​لعددين أكبر من أو يساوي الوسط الحسابي لهما:

(على سبيل المثال، المتوسط ​​المربع للأرقام 0 و a يساوي ، والمتوسط ​​الحسابي يساوي )

حل. دعونا نقارن المربعات ونثبت ذلك

اضرب في 4 وافتح الأقواس

مرة أخرى، الجانب الأيسر مربع، وبالتالي فهو غير سلبي.

مسألة 353. لماذا يكون المتوسط ​​المربع لـ a وb مساوياً للوسط الحسابي؟

مسألة 354. أثبت أن الوسط الهندسي لا يتجاوز الوسط التربيعي.

يظهر رسم توضيحي هندسي في الشكل. 31. دعونا نرسم رسما بيانيا. لنقم بربط النقاط بالإحداثيات الموجودة عليها بقطعة. سيكون لمنتصف هذا الجزء إحداثيات هي الوسط الحسابي لإحداثيات النهايات، أي.

تحته على الرسم البياني هناك نقطة

وبالتالي، فإن عدم المساواة بين الوسط الحسابي والمربع المتوسط ​​يعني أن الرسم البياني محدب للأسفل (يقع المنحنى أسفل الوتر.

مشكلة 355. من خلال تبديل محوري x و y، نحصل من الرسم البياني على رسم بياني للدالة، التي تقع فوق أي من أوتارها (انظر الشكل 32). ما هو عدم المساواة الذي يتوافق مع هذا؟

نحن نعرف الآن أنه لأي قيمة غير سالبة a وb

لكل نوع من هذه الأنواع الثلاثة من المتوسطات، سنرسم النقاط (أ، ب)، التي لا يتجاوز المتوسط ​​فيها 1 (انظر الشكل 33 أ-ج).

من خلال الجمع بينهما في شكل واحد (الشكل 34)، نرى أنه كلما زاد المتوسط، كلما كانت المساحة المقابلة أصغر.

مسألة 356. إثبات عدم المساواة بين الوسط الحسابي والمربع المتوسط ​​لثلاثة أرقام:

مسألة 357 (أ) مجموع رقمين موجبين هو 2. ما أقل قيمة لمجموع مربعيهما؟

(ب) نفس السؤال بالنسبة لمجموع مربعات ثلاثة أرقام موجبة مجموعها 3.

يتم تعريفها على أنها خاصية عامة لحجم الاختلاف في السمة في المجموع. وهو يساوي الجذر التربيعي لمتوسط ​​الانحراف المربع للقيم الفردية للسمة من الوسط الحسابي، أي. يمكن العثور على جذر مثل هذا:

1. بالنسبة للصف الأساسي:

2. بالنسبة لسلسلة التباين:

تحويل صيغة الانحراف المعياري يجعلها في شكل أكثر ملاءمة للحسابات العملية:

الانحراف المعيارييحدد مدى انحراف الخيارات المحددة في المتوسط ​​عن متوسط ​​قيمتها، وهو أيضًا مقياس مطلق لتغير إحدى الخصائص ويتم التعبير عنه بنفس وحدات الخيارات، وبالتالي يتم تفسيره جيدًا.

أمثلة لإيجاد الانحراف المعياري: ,

بالنسبة للخصائص البديلة، تبدو صيغة الانحراف المعياري كما يلي:

حيث p هي نسبة الوحدات في السكان التي لها خاصية معينة؛

q هي نسبة الوحدات التي لا تمتلك هذه الخاصية.

مفهوم متوسط ​​الانحراف الخطي

متوسط ​​الانحراف الخطييتم تعريفه على أنه الوسط الحسابي للقيم المطلقة لانحرافات الخيارات الفردية عنها.

1. بالنسبة للصف الأساسي:

2. بالنسبة لسلسلة التباين:

حيث يكون المبلغ n مجموع ترددات سلسلة الاختلاف.

مثال لإيجاد متوسط ​​الانحراف الخطي:

إن ميزة متوسط ​​الانحراف المطلق كمقياس للتشتت على مدى التباين واضحة، لأن هذا المقياس يعتمد على مراعاة جميع الانحرافات المحتملة. لكن هذا المؤشر له عيوب كبيرة. يمكن أن يؤدي الرفض التعسفي لعلامات الانحرافات الجبرية إلى حقيقة أن الخصائص الرياضية لهذا المؤشر بعيدة كل البعد عن كونها أولية. وهذا يجعل من الصعب جدًا استخدام متوسط ​​الانحراف المطلق عند حل المشكلات التي تتضمن حسابات احتمالية.

لذلك، نادرًا ما يستخدم متوسط ​​الانحراف الخطي كمقياس لتغير إحدى الخصائص في الممارسة الإحصائية، أي عندما يكون جمع المؤشرات دون مراعاة العلامات أمرًا منطقيًا من الناحية الاقتصادية. وبمساعدتها، على سبيل المثال، يتم تحليل معدل دوران التجارة الخارجية، وتكوين العمال، وإيقاع الإنتاج، وما إلى ذلك.

يعني مربع

تم تطبيق متوسط ​​المربع، على سبيل المثال، لحساب متوسط ​​حجم جوانب المقاطع المربعة n، ومتوسط ​​أقطار الجذوع والأنابيب وما إلى ذلك. وهي مقسمة إلى نوعين.

مربع متوسط ​​بسيط. إذا كان من الضروري، عند استبدال القيم الفردية لخاصية ما بقيمة متوسطة، الحفاظ على مجموع مربعات القيم الأصلية دون تغيير، فسيكون المتوسط ​​قيمة متوسطة تربيعية.

وهو الجذر التربيعي لحاصل قسمة مجموع مربعات قيم السمات الفردية على عددها:

يتم حساب مربع المتوسط ​​​​المرجح باستخدام الصيغة:

حيث f هي علامة الوزن.

مكعب متوسط

ينطبق متوسط ​​مكعبعلى سبيل المثال، عند تحديد متوسط ​​طول الضلع والمكعبات. وهي مقسمة إلى نوعين.
متوسط ​​مكعب بسيط:

عند حساب القيم المتوسطة والتشتت في سلسلة التوزيع الفاصلة، يتم استبدال القيم الحقيقية للسمة بالقيم المركزية للفترات، والتي تختلف عن الوسط الحسابي للقيم المضمنة في الفاصل الزمني. وهذا يؤدي إلى خطأ منهجي عند حساب التباين. ف.ف. قرر شيبارد ذلك خطأ في حساب التباين، الناتج عن استخدام البيانات المجمعة، هو 1/12 من مربع قيمة الفاصل الزمني، سواء في اتجاه الزيادة أو في اتجاه تقليل حجم التشتت.

تعديل شيبارديجب استخدامه إذا كان التوزيع قريبًا من الطبيعي، ويتعلق بخاصية ذات طبيعة تباين مستمرة، ويستند إلى كمية كبيرة من البيانات الأولية (ن > 500). ومع ذلك، استنادا إلى حقيقة أنه في بعض الحالات كلا الخطأين، اللذين يتصرفان في اتجاهات مختلفة، يعوضان بعضهما البعض، فمن الممكن في بعض الأحيان رفض إدخال التصحيحات.

كلما كان التباين والانحراف المعياري أصغر، كلما كان المجتمع أكثر تجانسًا وكان المتوسط ​​أكثر نموذجية.
في ممارسة الإحصاء، غالبًا ما تكون هناك حاجة لمقارنة الاختلافات في الخصائص المختلفة. على سبيل المثال، من المهم جدًا مقارنة الاختلافات في عمر العمال ومؤهلاتهم، ومدة الخدمة والأجور، والتكاليف والأرباح، ومدة الخدمة وإنتاجية العمل، وما إلى ذلك. بالنسبة لمثل هذه المقارنات، فإن مؤشرات التباين المطلق للخصائص غير مناسبة: فمن المستحيل مقارنة تقلب خبرة العمل، المعبر عنها بالسنوات، مع تباين الأجور، المعبر عنها بالروبل.

لإجراء مثل هذه المقارنات، وكذلك مقارنات تباين نفس الخاصية في العديد من المجموعات السكانية ذات المتوسطات الحسابية المختلفة، يتم استخدام مؤشر نسبي للتباين - معامل التباين.

المتوسطات الهيكلية

لتوصيف الاتجاه المركزي في التوزيعات الإحصائية، غالبًا ما يكون من العقلاني استخدام قيمة معينة للخاصية X، جنبًا إلى جنب مع الوسط الحسابي، والتي، بسبب ميزات معينة لموقعها في سلسلة التوزيع، يمكن أن تميز مستواها.

وهذا مهم بشكل خاص عندما تكون القيم المتطرفة للخاصية في سلسلة التوزيع لها حدود غير واضحة. وفي هذا الصدد، عادة ما يكون التحديد الدقيق للوسط الحسابي مستحيلا أو صعبا للغاية. في مثل هذه الحالات، يمكن تحديد المستوى المتوسط ​​من خلال أخذ، على سبيل المثال، قيمة الميزة الموجودة في منتصف سلسلة التردد أو التي تحدث غالبًا في السلسلة الحالية.

وتعتمد هذه القيم فقط على طبيعة الترددات، أي على بنية التوزيع. وهي نموذجية في موقعها في سلسلة من الترددات، ولذلك تعتبر هذه القيم من خصائص مركز التوزيع ولذلك حصلت على تعريف المتوسطات الهيكلية. يتم استخدامها لدراسة البنية الداخلية وبنية سلسلة توزيع قيم السمات. وتشمل هذه المؤشرات ما يلي:

إن الخاصية المثالية للتباين هي متوسط ​​انحراف المربع، والذي يسمى المعيار (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي لمتوسط ​​الانحراف المربع للقيم الفردية للسمة من الوسط الحسابي:

الانحراف المعياري بسيط:

يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

تحدث النسبة التالية بين متوسط ​​الانحرافات المربعة ومتوسط ​​الانحرافات الخطية في ظل ظروف التوزيع الطبيعي: ~ 1.25.

يُستخدم الانحراف المعياري، باعتباره المقياس المطلق الرئيسي للتباين، في تحديد القيم الإحداثية لمنحنى التوزيع الطبيعي، وفي الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة، وكذلك في تقييم حدود الاختلاف في خاصية ما في مجتمع متجانس.

التشتت، أنواعه، الانحراف المعياري.

تباين متغير عشوائي- مقياس لانتشار متغير عشوائي معين، أي انحرافه عن التوقع الرياضي. في الإحصائيات، غالبًا ما يتم استخدام التدوين أو. ويسمى الجذر التربيعي للتباين الانحراف المعياري، أو الانحراف المعياري، أو الانتشار المعياري.

التباين الكلي (σ 2) يقيس تباين السمة بأكملها تحت تأثير جميع العوامل التي تسببت في هذا التباين. وفي الوقت نفسه، وبفضل طريقة التجميع، من الممكن تحديد وقياس التباين الناتج عن خاصية التجميع والتباين الناشئ تحت تأثير العوامل غير المحسوبة.

التباين بين المجموعات (σ 2 م.ج) يميز التباين المنهجي، أي الاختلافات في قيمة الخاصية التي تتم دراستها والتي تنشأ تحت تأثير الخاصية - العامل الذي يشكل أساس المجموعة.

الانحراف المعياري(مرادفات: الانحراف المعياري، الانحراف المعياري، الانحراف المربع؛ مصطلحات ذات صلة: الانحراف المعياري، الانتشار المعياري) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعًا لتشتت قيم المتغير العشوائي بالنسبة لتوقعه الرياضي. مع صفائف محدودة من قيم العينة، يتم استخدام المتوسط ​​الحسابي لمجموعة العينات بدلاً من التوقع الرياضي.

يتم قياس الانحراف المعياري بوحدات المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند بناء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.


الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري للمتغير العشوائي سبالنسبة إلى توقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

أين التشتت؟ — أناالعنصر الرابع من الاختيار؛ - حجم العينة؛ - الوسط الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. ومع ذلك، فإن التقدير المبني على تقدير التباين غير المتحيز ثابت.

جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

بالإضافة إلى متوسطات القوة في الإحصائيات، للتوصيف النسبي لقيمة الخصائص المتغيرة والبنية الداخلية لسلسلة التوزيع، يتم استخدام المتوسطات الهيكلية، والتي يتم تمثيلها بشكل أساسي بواسطة الموضة والوسيط.

موضة- هذا هو الشكل الأكثر شيوعًا في السلسلة. تُستخدم الموضة، على سبيل المثال، في تحديد مقاسات الملابس والأحذية الأكثر طلبًا بين العملاء. وضع السلسلة المنفصلة هو الوضع ذو التردد الأعلى. عند حساب الوضع لسلسلة تباين الفاصل الزمني، يجب عليك أولاً تحديد الفاصل الزمني المشروط (استنادًا إلى الحد الأقصى للتكرار)، ثم قيمة القيمة المشروطة للسمة باستخدام الصيغة:

- - قيمة الموضة

- — الحد الأدنى للفاصل الزمني

- — قيمة الفاصل

- — تردد الفاصل الزمني

- — تردد الفترة التي تسبق الشكل

- — تردد الفترة التي تلي الشكل

الوسيط -هذه هي قيمة السمة التي تكمن وراء السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين.

لتحديد الوسيط في سلسلة منفصلة في وجود ترددات، قم أولاً بحساب نصف مجموع الترددات ثم حدد قيمة المتغير الذي يقع عليه. (إذا كانت السلسلة التي تم فرزها تحتوي على عدد فردي من الميزات، فسيتم حساب الرقم المتوسط ​​باستخدام الصيغة:

M e = (n (إجمالي عدد الميزات) + 1)/2,

وفي حالة وجود عدد زوجي من المعالم، فإن الوسيط سيكون مساوياً لمتوسط ​​المعلمتين الموجودتين في منتصف الصف).

عند الحساب الوسطاءبالنسبة لسلسلة تباين الفاصل الزمني، حدد أولاً الفاصل الزمني المتوسط ​​الذي يقع فيه الوسيط، ثم حدد قيمة الوسيط باستخدام الصيغة:

- - الوسيط المطلوب

- - الحد الأدنى للفاصل الزمني الذي يحتوي على الوسيط

- — قيمة الفاصل

- — مجموع التكرارات أو عدد مصطلحات السلسلة

مجموع التكرارات المتراكمة للفترات التي تسبق الوسيط

- — تردد الفاصل الزمني المتوسط

مثال. العثور على الوضع والوسيط.

حل:
في هذا المثال، يقع الفاصل المشروط ضمن الفئة العمرية 25-30 عامًا، نظرًا لأن هذا الفاصل الزمني له أعلى تكرار (1054).

دعونا نحسب حجم الوضع:

وهذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

دعونا نحسب الوسيط. يقع الفاصل الزمني المتوسط ​​في الفئة العمرية من 25 إلى 30 عامًا، حيث يوجد ضمن هذا الفاصل خيار يقسم السكان إلى جزأين متساويين (Σf i /2 = 3462/2 = 1731). بعد ذلك، نستبدل البيانات الرقمية اللازمة في الصيغة ونحصل على القيمة المتوسطة:

وهذا يعني أن نصف الطلاب أقل من 27.4 عامًا، والنصف الآخر أكبر من 27.4 عامًا.

بالإضافة إلى المنوال والوسيط، يمكن استخدام مؤشرات مثل الربعيات، وتقسيم السلسلة المرتبة إلى 4 أجزاء متساوية، أعشارية- 10 أجزاء ونسب مئوية - لكل 100 جزء.

مفهوم المراقبة الانتقائية ونطاقها.

مراقبة انتقائيةينطبق عند استخدام المراقبة المستمرة مستحيل جسديابسبب كمية كبيرة من البيانات أو غير مجدية اقتصاديا. وتحدث الاستحالة المادية، على سبيل المثال، عند دراسة تدفقات الركاب وأسعار السوق وميزانيات الأسرة. يحدث عدم الجدوى الاقتصادية عند تقييم جودة السلع المرتبطة بتدميرها، على سبيل المثال، التذوق، واختبار الطوب للقوة، وما إلى ذلك.

تشكل الوحدات الإحصائية المختارة للمراقبة إطار أخذ العينات أو العينة، وتشكل مجموعتها بأكملها المجتمع العام (GS). في هذه الحالة، يتم الإشارة إلى عدد الوحدات في العينة بواسطة ن، وفي النظام المنسق بأكمله - ن. سلوك ن / نيسمى الحجم النسبي أو نسبة العينة.

تعتمد جودة نتائج ملاحظة العينة على تمثيلية العينة، أي على مدى تمثيلها في النظام المنسق. لضمان تمثيل العينة، فمن الضروري الامتثال مبدأ الاختيار العشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الصدفة.

موجود 4 طرق للاختيار العشوائيلأخذ عينات:

  1. في الواقع عشوائيةالاختيار أو "طريقة اليانصيب"، عندما يتم تعيين أرقام تسلسلية للكميات الإحصائية، المسجلة على كائنات معينة (على سبيل المثال، البراميل)، والتي يتم بعد ذلك خلطها في بعض الحاويات (على سبيل المثال، في كيس) واختيارها عشوائيًا. ومن الناحية العملية، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائية أو جداول رياضية للأرقام العشوائية.
  2. ميكانيكيةالاختيار وفقا لكل ( لا/ن)-القيمة الرابعة لعامة السكان. على سبيل المثال، إذا كانت تحتوي على 100000 قيمة، وتحتاج إلى تحديد 1000، فسيتم تضمين كل 100000 / 1000 = القيمة رقم 100 في العينة. علاوة على ذلك، إذا لم يتم ترتيبهم، فسيتم اختيار الأول عشوائيًا من المائة الأولى، وستكون أعداد الآخرين أعلى بمائة. فمثلاً، إذا كانت الوحدة الأولى رقم 19، فيجب أن تكون الوحدة التالية رقم 119، ثم رقم 219، ثم رقم 319، وهكذا. وفي حالة ترتيب الوحدات السكانية، يتم اختيار رقم 50 أولاً، ثم رقم 150، ثم رقم 250، وهكذا.
  3. يتم اختيار القيم من مجموعة بيانات غير متجانسة طبقيةالطريقة (الطبقية)، عندما يتم تقسيم السكان أولاً إلى مجموعات متجانسة يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
  4. وهناك طريقة خاصة لأخذ العينات مسلسلالاختيار، حيث لا يختارون بشكل عشوائي أو ميكانيكي القيم الفردية، ولكن سلسلتهم (تسلسلات من رقم ما إلى رقم ما على التوالي)، والتي يتم من خلالها إجراء المراقبة المستمرة.

تعتمد جودة ملاحظات العينة أيضًا على نوع العينة: متكررأو غير قابل للتكرار.

في إعادة الاختياريتم إرجاع القيم الإحصائية أو سلاسلها المتضمنة في العينة إلى عامة السكان بعد استخدامها، مع وجود فرصة لإدراجها في عينة جديدة. علاوة على ذلك، فإن جميع القيم في المجتمع لها نفس احتمالية إدراجها في العينة.

اختيار لا يتكرريعني أن القيم الإحصائية أو سلسلتها المتضمنة في العينة لا تعود إلى عموم السكان بعد الاستخدام، وبالتالي بالنسبة للقيم المتبقية للأخيرة يزداد احتمال إدراجها في العينة التالية.

ويعطي أخذ العينات غير المتكررة نتائج أكثر دقة، لذلك يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب، وطلب المستهلكين، وما إلى ذلك) ثم يتم إجراء الاختيار المتكرر.

الحد الأقصى لخطأ أخذ عينات المراقبة، ومتوسط ​​خطأ أخذ العينات، وإجراءات حسابها.

دعونا نفكر بالتفصيل في طرق تكوين عينة السكان المذكورة أعلاه والأخطاء التي تنشأ عند القيام بذلك. التمثيل .
عشوائية بشكل صحيحتعتمد عملية أخذ العينات على اختيار وحدات من المجتمع بشكل عشوائي دون أي عناصر منهجية. من الناحية الفنية، يتم الاختيار العشوائي الفعلي عن طريق القرعة (على سبيل المثال، اليانصيب) أو باستخدام جدول أرقام عشوائية.

ونادرا ما يستخدم الاختيار العشوائي السليم “في شكله النقي” في ممارسة الملاحظة الانتقائية، ولكنه الأصل بين أنواع الاختيار الأخرى، فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض الأسئلة المتعلقة بنظرية طريقة أخذ العينات وصيغة الخطأ لعينة عشوائية بسيطة.

تحيز أخذ العيناتهو الفرق بين قيمة المعلمة في عموم السكان وقيمتها المحسوبة من نتائج ملاحظة العينة. بالنسبة للخاصية الكمية المتوسطة، يتم تحديد خطأ أخذ العينات بواسطة

ويسمى المؤشر خطأ أخذ العينات الهامشي.
متوسط ​​العينة هو متغير عشوائي يمكن أن يأخذ قيمًا مختلفة اعتمادًا على الوحدات المضمنة في العينة. ولذلك، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ويمكن أن تأخذ قيمًا مختلفة. ولذلك يتم تحديد متوسط ​​الأخطاء المحتملة - متوسط ​​خطأ أخذ العينات، والذي يعتمد على:

حجم العينة: كلما زاد العدد، قل متوسط ​​الخطأ؛

درجة التغير في الخاصية محل الدراسة: كلما كان التغير في الخاصية أصغر، وبالتالي التشتت، كلما قل متوسط ​​خطأ العينة.

في إعادة الاختيار العشوائييتم حساب متوسط ​​الخطأ:
.
ومن الناحية العملية، فإن التباين العام غير معروف بدقة، ولكن في نظرية الاحتمالاتلقد ثبت ذلك
.
وبما أن قيمة n كبيرة بما فيه الكفاية قريبة من 1، يمكننا أن نفترض ذلك. ومن ثم يمكن حساب متوسط ​​خطأ أخذ العينات:
.
ولكن في حالات عينة صغيرة (مع ن<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

في أخذ العينات العشوائية غير التكراريةيتم تعديل الصيغ المعطاة بالقيمة. ومن ثم فإن متوسط ​​خطأ أخذ العينات غير التكراري هو:
و .
لأن دائمًا أقل، فإن المضاعف () دائمًا أقل من 1. وهذا يعني أن متوسط ​​الخطأ أثناء الاختيار غير المتكرر يكون دائمًا أقل منه أثناء الاختيار المتكرر.
أخذ العينات الميكانيكيةيتم استخدامه عندما يتم ترتيب إجمالي عدد السكان بطريقة ما (على سبيل المثال، قوائم الناخبين أبجديًا، وأرقام الهواتف، وأرقام المنازل، وأرقام الشقق). ويتم اختيار الوحدات على فترات زمنية معينة، وهي تساوي معكوس النسبة المئوية لأخذ العينات. لذا، مع عينة 2%، يتم اختيار كل 50 وحدة = 1/0.02، مع عينة 5%، كل 1/0.05 = 20 وحدة من عموم السكان.

يتم تحديد النقطة المرجعية بطرق مختلفة: بشكل عشوائي، من منتصف الفاصل الزمني، مع تغيير النقطة المرجعية. الشيء الرئيسي هو تجنب الخطأ المنهجي. على سبيل المثال، في عينة 5%، إذا كانت الوحدة الأولى هي الثالثة عشر، فإن الوحدات التالية هي 33، 53، 73، إلخ.

من حيث الدقة، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائية الفعلية. ولذلك، لتحديد متوسط ​​الخطأ في أخذ العينات الميكانيكية، يتم استخدام صيغ الاختيار العشوائي المناسبة.

في اختيار نموذجي يتم تقسيم السكان الذين يتم مسحهم بشكل مبدئي إلى مجموعات متجانسة ومتشابهة. على سبيل المثال، عند مسح المؤسسات، يمكن أن تكون هذه الصناعات أو القطاعات الفرعية. عند دراسة السكان، يمكن أن تكون هذه المناطق أو الفئات الاجتماعية أو العمرية. ثم يتم إجراء اختيار مستقل من كل مجموعة بطريقة ميكانيكية أو عشوائية بحتة.

يؤدي أخذ العينات النموذجي إلى نتائج أكثر دقة من الطرق الأخرى. تضمن كتابة المجتمع العام تمثيل كل مجموعة نمطية في العينة، مما يلغي تأثير التباين بين المجموعات على متوسط ​​خطأ أخذ العينات. وبالتالي، عند العثور على خطأ عينة نموذجية وفقا لقاعدة إضافة التباينات ()، من الضروري أن نأخذ في الاعتبار متوسط ​​تباينات المجموعة فقط. ثم متوسط ​​خطأ أخذ العينات هو:
عند إعادة الاختيار
,
مع عدم التكرار في الاختيار
,
أين - متوسط ​​التباينات داخل المجموعة في العينة.

اختيار المسلسل (أو العش). يستخدم عندما يتم تقسيم السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. يمكن أن تكون هذه السلسلة عبارة عن عبوات للمنتجات النهائية ومجموعات الطلاب والفرق. يتم اختيار السلاسل للفحص ميكانيكياً أو عشوائياً بحتاً، وضمن السلاسل يتم إجراء فحص مستمر للوحدات. ولذلك، فإن متوسط ​​خطأ أخذ العينات يعتمد فقط على التباين بين المجموعات (السلاسل البينية)، والذي يتم حسابه باستخدام الصيغة:

حيث r هو عدد السلاسل المحددة؛
- متوسط ​​السلسلة i-th.

يتم حساب متوسط ​​خطأ أخذ العينات التسلسلي:

عند إعادة الاختيار:
,
مع اختيار غير متكرر:
,
حيث R هو العدد الإجمالي للحلقات.

مجموعاختيارهو مزيج من طرق الاختيار المدروسة.

يعتمد متوسط ​​خطأ أخذ العينات لأي طريقة أخذ عينات بشكل أساسي على الحجم المطلق للعينة، وبدرجة أقل، على النسبة المئوية للعينة. لنفترض أنه تم إجراء 225 ملاحظة في الحالة الأولى من عدد سكان يبلغ 4500 وحدة وفي الحالة الثانية من عدد سكان يبلغ 225000 وحدة. التباينات في الحالتين تساوي 25. ففي الحالة الأولى، مع اختيار 5%، سيكون خطأ المعاينة:

في الحالة الثانية، مع اختيار 0.1%، سيكون مساوياً لـ:


هكذاومع انخفاض نسبة أخذ العينات بمقدار 50 مرة، زاد خطأ أخذ العينات بشكل طفيف، حيث لم يتغير حجم العينة.
لنفترض أن حجم العينة قد زاد إلى 625 ملاحظة. وفي هذه الحالة يكون خطأ أخذ العينات كما يلي:

إن زيادة العينة بمقدار 2.8 مرة بنفس حجم السكان يقلل من حجم خطأ العينة بأكثر من 1.6 مرة.

طرق وأساليب تكوين مجتمع العينة.

في الإحصاء، يتم استخدام طرق مختلفة لتشكيل مجتمعات العينة، والتي تحددها أهداف الدراسة وتعتمد على تفاصيل موضوع الدراسة.

الشرط الأساسي لإجراء مسح العينة هو منع حدوث أخطاء منهجية ناشئة عن انتهاك مبدأ تكافؤ الفرص لكل وحدة من عموم السكان المراد تضمينهم في العينة. يتم منع الأخطاء المنهجية من خلال استخدام الأساليب العلمية لتشكيل مجتمع العينة.

هناك الطرق التالية لاختيار الوحدات من السكان:

1) الاختيار الفردي - يتم اختيار الوحدات الفردية للعينة؛

2) اختيار المجموعة - تتضمن العينة مجموعات متجانسة نوعيا أو سلسلة من الوحدات قيد الدراسة؛

3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي.
يتم تحديد طرق الاختيار من خلال قواعد تشكيل عينة السكان.

يمكن أن تكون العينة:

  • عشوائية في الواقعيتمثل في حقيقة أن مجتمع العينة يتكون نتيجة الاختيار العشوائي (غير المقصود) للوحدات الفردية من عامة السكان. وفي هذه الحالة، عادة ما يتم تحديد عدد الوحدات المختارة في مجتمع العينة على أساس نسبة العينة المقبولة. نسبة العينة هي نسبة عدد الوحدات في مجتمع العينة n إلى عدد الوحدات في عموم السكان N، أي.
  • ميكانيكيةيتكون من حقيقة أن اختيار الوحدات في عينة السكان يتم من عامة السكان، مقسمة إلى فترات متساوية (مجموعات). وفي هذه الحالة، يكون حجم الفاصل الزمني في المجتمع يساوي معكوس نسبة العينة. لذلك، مع عينة 2%، يتم اختيار كل وحدة 50 (1:0.02)، مع عينة 5%، كل وحدة 20 (1:0.05)، إلخ. وبالتالي، وفقًا لنسبة الاختيار المقبولة، يتم تقسيم عامة السكان ميكانيكيًا إلى مجموعات متساوية الحجم. ويتم اختيار وحدة واحدة فقط من كل مجموعة للعينة.
  • عادي -حيث يتم تقسيم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. ثم، من كل مجموعة نموذجية، يتم استخدام عينة عشوائية أو ميكانيكية بحتة لاختيار الوحدات بشكل فردي في مجتمع العينة. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في مجتمع العينة؛
  • مسلسل- حيث يتم تقسيم عامة السكان إلى مجموعات متساوية الحجم - سلسلة. يتم اختيار السلسلة في عينة السكان. ضمن السلسلة، يتم إجراء المراقبة المستمرة للوحدات المتضمنة في السلسلة؛
  • مجموع- يمكن أن يكون أخذ العينات على مرحلتين. في هذه الحالة، يتم تقسيم السكان أولاً إلى مجموعات. ثم يتم اختيار المجموعات، وضمن الأخيرة يتم اختيار الوحدات الفردية.

في الإحصاء، يتم تمييز الطرق التالية لاختيار الوحدات في عينة السكان::

  • مرحلة واحدةأخذ العينات - تخضع كل وحدة مختارة للدراسة على الفور وفقا لمعيار معين (أخذ العينات العشوائية والتسلسلية المناسبة)؛
  • متعدد المراحلأخذ العينات - يتم الاختيار من إجمالي عدد السكان للمجموعات الفردية، ويتم اختيار الوحدات الفردية من المجموعات (أخذ عينات نموذجية بطريقة ميكانيكية لاختيار الوحدات في مجتمع العينة).

بالإضافة إلى ذلك، هناك:

  • إعادة الاختيار- حسب مخطط الكرة المرتجعة. في هذه الحالة، يتم إرجاع كل وحدة أو سلسلة مدرجة في العينة إلى عامة السكان، وبالتالي يكون لديها فرصة لإدراجها في العينة مرة أخرى؛
  • كرر الاختيار- حسب مخطط الكرة غير المرتجعة. لديها نتائج أكثر دقة بنفس حجم العينة.

تحديد حجم العينة المطلوبة (باستخدام جدول t الخاص بالطالب).

أحد المبادئ العلمية في نظرية أخذ العينات هو التأكد من اختيار عدد كاف من الوحدات. من الناحية النظرية، يتم عرض الحاجة إلى الامتثال لهذا المبدأ في أدلة نظريات الحد في نظرية الاحتمالات، والتي تجعل من الممكن تحديد حجم الوحدات التي ينبغي اختيارها من السكان بحيث تكون كافية وتضمن تمثيل العينة.

إن الانخفاض في خطأ أخذ العينات المعياري، وبالتالي زيادة دقة التقدير، يرتبط دائمًا بزيادة في حجم العينة، لذلك، بالفعل في مرحلة تنظيم مراقبة العينة، من الضروري تحديد حجم العينة يجب أن يكون مجتمع العينة من أجل ضمان الدقة المطلوبة لنتائج المراقبة. ويتم حساب حجم العينة المطلوب باستخدام صيغ مشتقة من صيغ الحد الأقصى لأخطاء أخذ العينات (A)، التي تتوافق مع نوع معين وطريقة اختيار معينة. لذلك، بالنسبة لحجم العينة العشوائي المتكرر (n) لدينا:

وجوهر هذه الصيغة هو أنه مع الاختيار العشوائي المتكرر للعدد المطلوب يتناسب حجم العينة طرديا مع مربع معامل الثقة (ت2)وتباين الخاصية التباينية (؟2) ويتناسب عكسياً مع مربع الحد الأقصى لخطأ المعاينة (؟2). وعلى وجه الخصوص، مع زيادة الحد الأقصى للخطأ بعامل اثنين، يمكن تقليل حجم العينة المطلوب بعامل أربعة. من بين المعلمات الثلاثة، تم تعيين اثنين (t و؟) من قبل الباحث.

وفي الوقت نفسه، استنادا إلى الباحثمن غرض وأهداف مسح العينة، يجب حل السؤال: في أي مجموعة كمية من الأفضل تضمين هذه المعلمات لضمان الخيار الأمثل؟ في إحدى الحالات، قد يكون راضيًا عن موثوقية النتائج التي تم الحصول عليها (t) أكثر من رضاه عن مقياس الدقة (؟)، وفي حالة أخرى - والعكس صحيح. من الأصعب حل المشكلة المتعلقة بقيمة الحد الأقصى لخطأ المعاينة، حيث أن الباحث لا يملك هذا المؤشر في مرحلة تصميم ملاحظة العينة، لذلك من الناحية العملية جرت العادة على تحديد قيمة الحد الأقصى لخطأ المعاينة، عادة في حدود 10% من متوسط ​​المستوى المتوقع للسمة. يمكن الوصول إلى تحديد المتوسط ​​المقدر بطرق مختلفة: استخدام البيانات من المسوحات السابقة المماثلة، أو استخدام البيانات من إطار أخذ العينات وإجراء عينة تجريبية صغيرة.

إن أصعب ما يمكن تحديده عند تصميم عينة المراقبة هو المعلمة الثالثة في الصيغة (5.2) - تشتت مجتمع العينة. وفي هذه الحالة، من الضروري استخدام جميع المعلومات الموجودة تحت تصرف الباحث، والتي تم الحصول عليها في المسوحات المماثلة والتجريبية التي أجريت سابقًا.

سؤال حول التعريفويصبح حجم العينة المطلوب أكثر تعقيدا إذا كان مسح العينات يتضمن دراسة عدة خصائص لوحدات المعاينة. في هذه الحالة، يكون متوسط ​​مستويات كل من الخصائص وتنوعها، كقاعدة عامة، مختلفًا، وبالتالي، فإن تحديد التباين في أي من الخصائص التي يجب تفضيلها لا يمكن تحقيقه إلا مع مراعاة غرض وأهداف استطلاع.

عند تصميم عينة المراقبة، يتم افتراض قيمة محددة مسبقًا لخطأ العينة المسموح به وفقًا لأهداف دراسة معينة واحتمالية الاستنتاجات بناءً على نتائج الملاحظة.

بشكل عام، تسمح لنا صيغة الحد الأقصى للخطأ في متوسط ​​العينة بتحديد:

حجم الانحرافات المحتملة لمؤشرات عموم السكان عن مؤشرات عينة السكان؛

حجم العينة المطلوب، بما يضمن الدقة المطلوبة، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة معينة محددة؛

احتمال أن يكون للخطأ في العينة حد محدد.

توزيع الطلابفي نظرية الاحتمالات، هي عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

السلسلة الديناميكية (الفاصل الزمني، العزم)، السلسلة الديناميكية الختامية.

سلسلة ديناميات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها بتسلسل زمني معين.

تحتوي كل سلسلة زمنية على عنصرين:

1) مؤشرات الفترات الزمنية (السنوات أو الأرباع أو الأشهر أو الأيام أو التواريخ)؛

2) المؤشرات المميزة للكائن قيد الدراسة لفترات زمنية أو في تواريخ مقابلة والتي تسمى بمستويات السلسلة.

يتم التعبير عن مستويات السلسلةكلا من القيم المطلقة والمتوسطة أو النسبية. اعتمادا على طبيعة المؤشرات، يتم بناء سلاسل زمنية من القيم المطلقة والنسبية والمتوسطة. يتم إنشاء السلسلة الديناميكية من القيم النسبية والمتوسطة على أساس سلسلة مشتقة من القيم المطلقة. هناك سلسلة زمنية ولحظية من الديناميكيات.

سلسلة الفاصل الديناميكييحتوي على قيم المؤشرات لفترات زمنية معينة. وفي سلسلة فواصل زمنية يمكن جمع المستويات للحصول على حجم الظاهرة على مدى فترة أطول، أو ما يسمى بالمجاميع المتراكمة.

سلسلة اللحظات الديناميكيةيعكس قيم المؤشرات في وقت معين (التاريخ الزمني). وفي المتسلسلة العزومية قد يهتم الباحث فقط باختلاف الظواهر التي تعكس التغير في مستوى المتسلسلة بين تواريخ معينة، حيث أن مجموع المستويات هنا ليس له محتوى حقيقي. لا يتم احتساب المجاميع التراكمية هنا.

الشرط الأكثر أهمية للبناء الصحيح للسلاسل الزمنية هو مقارنة مستويات السلسلة التي تنتمي إلى فترات مختلفة. ويجب تقديم المستويات بكميات متجانسة، كما يجب أن يكون هناك اكتمال متساوي لتغطية الأجزاء المختلفة من الظاهرة.

بغرضلتجنب تشويه الديناميكيات الحقيقية، يتم إجراء حسابات أولية في الدراسة الإحصائية (إغلاق سلسلة الديناميكيات)، والتي تسبق التحليل الإحصائي للسلسلة الزمنية. يُفهم إغلاق السلسلة الديناميكية على أنه مزيج من سلسلتين أو أكثر في سلسلة واحدة، يتم حساب مستوياتها باستخدام منهجية مختلفة أو لا تتوافق مع الحدود الإقليمية، وما إلى ذلك. قد يعني إغلاق سلسلة الديناميكيات أيضًا جلب المستويات المطلقة لسلسلة الديناميكيات إلى أساس مشترك، مما يحيد عدم إمكانية المقارنة بين مستويات سلسلة الديناميكيات.

مفهوم المقارنة بين المتسلسلة الديناميكية والمعاملات والنمو ومعدلات النمو.

سلسلة ديناميات- هذه سلسلة من المؤشرات الإحصائية التي تميز تطور الظواهر الطبيعية والاجتماعية مع مرور الوقت. تحتوي المجموعات الإحصائية التي نشرتها لجنة الدولة للإحصاء في روسيا على عدد كبير من سلاسل الديناميكيات في شكل جدول. تتيح السلسلة الديناميكية تحديد أنماط تطور الظواهر قيد الدراسة.

تحتوي سلسلة الديناميكيات على نوعين من المؤشرات. مؤشرات الوقت(سنوات، أرباع، أشهر، إلخ) أو نقاط زمنية (في بداية العام، في بداية كل شهر، إلخ). مؤشرات مستوى الصف. يمكن التعبير عن مؤشرات مستويات سلسلة الديناميكيات بالقيم المطلقة (إنتاج المنتجات بالطن أو الروبل)، والقيم النسبية (نسبة سكان الحضر في المائة) والقيم المتوسطة (متوسط ​​أجور عمال الصناعة حسب السنة ، إلخ.). في شكل جدول، تحتوي السلسلة الزمنية على عمودين أو صفين.

يتطلب البناء الصحيح للسلاسل الزمنية استيفاء عدد من المتطلبات:

  1. يجب أن تكون جميع مؤشرات سلسلة الديناميكيات مبنية على أسس علمية وموثوقة؛
  2. يجب أن تكون مؤشرات سلسلة من الديناميكيات قابلة للمقارنة مع مرور الوقت، أي. يجب أن يتم حسابها لنفس الفترات الزمنية أو في نفس التواريخ؛
  3. ويجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في جميع أنحاء الإقليم؛
  4. يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة في المحتوى، أي. وتحسب وفق منهجية واحدة وبنفس الطريقة؛
  5. وينبغي أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر نطاق المزارع التي تؤخذ في الاعتبار. يجب إعطاء جميع مؤشرات سلسلة الديناميكيات في نفس وحدات القياس.

المؤشرات الإحصائيةيمكن وصف نتائج العملية قيد الدراسة على مدى فترة من الزمن، أو حالة الظاهرة قيد الدراسة في نقطة زمنية معينة، أي. يمكن أن تكون المؤشرات فاصلة (دورية) ولحظية. وبناء على ذلك، في البداية يمكن أن تكون سلسلة الديناميكيات إما فاصلة أو لحظية. يمكن لسلسلة ديناميكيات العزوم بدورها أن تكون ذات فترات زمنية متساوية أو غير متساوية.

يمكن تحويل سلسلة الديناميكيات الأصلية إلى سلسلة من القيم المتوسطة وسلسلة من القيم النسبية (السلسلة والأساسية). تسمى هذه السلاسل الزمنية بالسلاسل الزمنية المشتقة.

تختلف منهجية حساب المستوى المتوسط ​​في السلسلة الديناميكية اعتمادًا على نوع السلسلة الديناميكية. باستخدام الأمثلة، سننظر في أنواع السلاسل الديناميكية والصيغ لحساب المستوى المتوسط.

الزيادات المطلقة (Δy) أظهر عدد الوحدات التي تغير فيها المستوى اللاحق للسلسلة مقارنة بالمستوى السابق (gr. 3. - الزيادات المطلقة للسلسلة) أو مقارنة بالمستوى الأولي (gr. 4. - الزيادات المطلقة الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

عندما تنخفض القيم المطلقة للسلسلة، سيكون هناك "نقصان" أو "نقصان"، على التوالي.

وتشير مؤشرات النمو المطلقة إلى أنه في عام 1998 مثلاً ارتفع إنتاج المنتج "أ" بمقدار 4 آلاف طن مقارنة بعام 1997، وبنحو 34 ألف طن مقارنة بعام 1994؛ لسنوات أخرى، انظر الجدول. 11.5 جرام. 3 و 4.

معدل النمويوضح عدد المرات التي تغير فيها مستوى السلسلة مقارنة بالمستوى السابق (جرام 5 - معاملات السلسلة للنمو أو الانخفاض) أو مقارنة بالمستوى الأولي (جرام 6 - المعاملات الأساسية للنمو أو الانخفاض). يمكن كتابة صيغ الحساب على النحو التالي:

معدل النموأظهر النسبة المئوية للمستوى التالي من السلسلة مقارنة بالمستوى السابق (جرام 7 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (جرام 8 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

لذلك، على سبيل المثال، في عام 1997، كان حجم إنتاج المنتج "أ" مقارنة بعام 1996 هو 105.5% (

معدل النموأظهر النسبة المئوية التي ارتفع بها مستوى الفترة المشمولة بالتقرير مقارنة بالمستوى السابق (العمود 9 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (العمود 10 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

T pr = T r - 100% أو T pr = النمو المطلق / مستوى الفترة السابقة * 100%

لذلك، على سبيل المثال، في عام 1996، مقارنة بعام 1995، تم إنتاج المنتج "أ" بنسبة 3.8٪ (103.8٪ - 100٪) أو (8:210)×100٪ أكثر، ومقارنة بعام 1994 - بنسبة 9٪ (109٪ - 100%).

إذا انخفضت المستويات المطلقة في السلسلة فإن المعدل سيكون أقل من 100%، وبالتالي سيكون هناك معدل الانخفاض (معدل الزيادة بعلامة الطرح).

القيمة المطلقة للزيادة 1%(العمود 11) يوضح عدد الوحدات التي يجب إنتاجها في فترة معينة بحيث يرتفع مستوى الفترة السابقة بنسبة 1%. في مثالنا، في عام 1995، كان من الضروري إنتاج 2.0 ألف طن، وفي عام 1998 - 2.3 ألف طن، أي. أكثر من ذلك بكثير.

يمكن تحديد القيمة المطلقة للنمو بنسبة 1% بطريقتين:

مستوى الفترة السابقة مقسم على 100؛

يتم تقسيم الزيادات المطلقة في السلسلة على معدلات نمو السلسلة المقابلة.

القيمة المطلقة للزيادة 1% =

في الديناميكيات، خاصة على مدى فترة طويلة، من المهم إجراء تحليل مشترك لمعدل النمو مع محتوى كل نسبة زيادة أو نقصان.

لاحظ أن المنهجية المدروسة لتحليل السلاسل الزمنية تنطبق على السلاسل الزمنية، التي يتم التعبير عن مستوياتها بالقيم المطلقة (ر، ألف روبل، عدد الموظفين، وما إلى ذلك)، وعلى السلاسل الزمنية، مستوياتها يتم التعبير عنها بمؤشرات نسبية (% من العيوب، % من محتوى الرماد في الفحم، وما إلى ذلك) أو القيم المتوسطة (متوسط ​​العائد بالسنتيمتر/هكتار، ومتوسط ​​الأجر، وما إلى ذلك).

إلى جانب المؤشرات التحليلية المدروسة، والتي يتم حسابها لكل عام مقارنة بالمستوى السابق أو الأولي، عند تحليل سلسلة الديناميكيات، من الضروري حساب متوسط ​​المؤشرات التحليلية للفترة: متوسط ​​مستوى السلسلة، متوسط ​​الزيادة السنوية المطلقة (النقصان) ومتوسط ​​معدل النمو السنوي ومعدل النمو.

تمت مناقشة طرق حساب المستوى المتوسط ​​لسلسلة من الديناميكيات أعلاه. في سلسلة ديناميكيات الفاصل التي ندرسها، يتم حساب المستوى المتوسط ​​للسلسلة باستخدام صيغة المتوسط ​​الحسابي البسيط:

متوسط ​​حجم الإنتاج السنوي للمنتج للأعوام 1994-1998. بلغت 218.4 ألف طن.

يتم حساب متوسط ​​النمو المطلق السنوي أيضًا باستخدام صيغة المتوسط ​​الحسابي البسيط:

وتراوحت الزيادات المطلقة السنوية على مر السنين من 4 إلى 12 ألف طن (أنظر العمود 3)، ومتوسط ​​الزيادة السنوية في الإنتاج خلال الفترة 1995 - 1998. بلغت 8.5 ألف طن.

تتطلب طرق حساب متوسط ​​معدل النمو ومتوسط ​​معدل النمو دراسة أكثر تفصيلاً. دعونا ننظر فيها باستخدام مثال مؤشرات مستوى السلسلة السنوية الواردة في الجدول.

المستوى المتوسط ​​للسلسلة الديناميكية.

السلسلة الديناميكية (أو السلسلة الزمنية)- هذه هي القيم العددية لمؤشر إحصائي معين في لحظات أو فترات زمنية متتالية (أي مرتبة حسب الترتيب الزمني).

يتم استدعاء القيم العددية لمؤشر إحصائي أو آخر تشكل سلسلة الديناميكيات مستويات السلسلةوعادة ما يتم الإشارة إليه بالحرف ذ. الترم الأول من السلسلة ذ 1يسمى الأولي أو المستوى الأساسي، والأخيرة ذ ن - أخير. يتم تحديد اللحظات أو الفترات الزمنية التي تتعلق بها المستويات ر.

يتم عرض المتسلسلة الديناميكية عادة في شكل جدول أو رسم بياني، ويتم إنشاء مقياس زمني على طول محور الإحداثي السيني روعلى طول الإحداثي - مقياس مستويات السلسلة ذ.

متوسط ​​مؤشرات سلسلة الديناميكيات

يمكن اعتبار كل سلسلة من الديناميكيات بمثابة مجموعة معينة نالمؤشرات المتغيرة بمرور الوقت والتي يمكن تلخيصها كمتوسطات. تعتبر هذه المؤشرات المعممة (المتوسطة) ضرورية بشكل خاص عند مقارنة التغيرات في مؤشر معين خلال فترات مختلفة، في بلدان مختلفة، وما إلى ذلك.

إن الخاصية العامة للسلسلة الديناميكية يمكن أن تخدم، أولاً وقبل كل شيء، مستوى الصف الأوسط. تعتمد طريقة حساب المستوى المتوسط ​​على ما إذا كانت السلسلة لحظية أم فاصلة (دورية).

في حالة فاصلةلسلسلة، يتم تحديد المستوى المتوسط ​​لها من خلال صيغة المتوسط ​​الحسابي البسيط لمستويات السلسلة، أي.

=
إذا كان متاحا لحظةصف يحتوي على نمستويات ( ص1، ص2، …، ص) مع فواصل زمنية متساوية بين التواريخ (الأوقات)، فيمكن تحويل هذه السلسلة بسهولة إلى سلسلة من القيم المتوسطة. وفي هذه الحالة يكون المؤشر (المستوى) في بداية كل فترة هو في نفس الوقت المؤشر في نهاية الفترة السابقة. ومن ثم يمكن حساب متوسط ​​قيمة المؤشر لكل فترة (الفاصل الزمني بين التواريخ) على أنه نصف مجموع القيم فيفي بداية ونهاية الفترة، أي. كيف . سيكون عدد هذه المتوسطات . كما ذكرنا سابقًا، بالنسبة لسلسلة القيم المتوسطة، يتم حساب المستوى المتوسط ​​باستخدام المتوسط ​​الحسابي.

ولذلك يمكننا أن نكتب:
.
بعد تحويل البسط نحصل على:
,

أين Y1و ين— المستويين الأول والأخير من الصف؛ يي- المستويات المتوسطة .

ويعرف هذا المتوسط ​​في الإحصائيات باسم متوسط ​​زمنيلمسلسل لحظة. وقد حصلت على اسمها من كلمة "كرونوس" (الوقت، اللاتينية)، حيث يتم حسابها من المؤشرات التي تتغير مع مرور الوقت.

في حالة عدم المساواةالفواصل الزمنية بين التواريخ، يمكن حساب المتوسط ​​الزمني لسلسلة زمنية على أنه الوسط الحسابي لمتوسط ​​قيم المستويات لكل زوج من اللحظات، مرجحًا بالمسافات (الفواصل الزمنية) بين التواريخ، أي.
.
في هذه الحالةمن المفترض أنه في الفترات الفاصلة بين التواريخ اتخذت المستويات قيمًا مختلفة، ونحن أحد اثنين معروفين ( ييو يي+1) نحدد المتوسطات، ومن ثم نحسب المتوسط ​​الإجمالي للفترة التي تم تحليلها بأكملها.
فإذا افترض أن كل قيمة يييبقى دون تغيير حتى اليوم التالي (ط+ 1)- اللحظة الرابعة، أي. إذا كان التاريخ الدقيق للتغيير في المستويات معروفًا، فيمكن إجراء الحساب باستخدام صيغة المتوسط ​​الحسابي المرجح:
,

أين هو الوقت الذي ظل فيه المستوى دون تغيير.

بالإضافة إلى المستوى المتوسط ​​في سلسلة الديناميكيات، يتم حساب مؤشرات متوسطة أخرى - متوسط ​​التغير في مستويات السلسلة (الطرق الأساسية والسلسلة)، ومتوسط ​​معدل التغيير.

خط الأساس يعني التغيير المطلقهو حاصل قسمة التغيير المطلق الأخير على عدد التغييرات. إنه

السلسلة تعني التغيير المطلق مستويات السلسلة هي حاصل قسمة مجموع كل التغييرات المطلقة للسلسلة على عدد التغييرات، أي

كما تستخدم علامة متوسط ​​التغيرات المطلقة للحكم على طبيعة التغير في ظاهرة ما في المتوسط: النمو أو الانخفاض أو الاستقرار.

من قاعدة التحكم في التغييرات الأساسية والسلسلة المطلقة، يترتب على ذلك أن التغييرات الأساسية ومتوسط ​​السلسلة يجب أن تكون متساوية.

إلى جانب متوسط ​​التغير المطلق، يتم حساب المتوسط ​​النسبي أيضًا باستخدام الطرق الأساسية والمتسلسلة.

متوسط ​​التغير النسبي الأساسيتحددها الصيغة:

سلسلة متوسط ​​التغير النسبيتحددها الصيغة:

ومن الطبيعي أن تكون التغيرات النسبية الأساسية والسلسلة هي نفسها، وبمقارنتها مع القيمة المعيارية 1 يتم التوصل إلى استنتاج حول طبيعة التغير في الظاهرة في المتوسط: نمو أو تراجع أو استقرار.
عن طريق طرح 1 من القاعدة أو متوسط ​​التغير النسبي للسلسلة، يكون المقابل متوسط ​​معدل التغير، من خلال علامتها يمكن للمرء أيضًا الحكم على طبيعة التغيير في الظاهرة قيد الدراسة، والتي تنعكس في هذه السلسلة من الديناميكيات.

التقلبات الموسمية والمؤشرات الموسمية.

التقلبات الموسمية هي تقلبات مستقرة خلال السنة.

المبدأ الأساسي للإدارة للحصول على أقصى قدر من التأثير هو زيادة الدخل وتقليل التكاليف. ومن خلال دراسة التقلبات الموسمية تم حل مشكلة المعادلة القصوى عند كل مستوى من مستويات السنة.

عند دراسة التقلبات الموسمية يتم حل مشكلتين مترابطتين:

1. تحديد تفاصيل تطور الظاهرة في الديناميكيات البينية؛

2. قياس التقلبات الموسمية مع بناء نموذج الموجة الموسمية.

لقياس التباين الموسمي، عادة ما يتم حساب الديوك الرومية الموسمية. بشكل عام، يتم تحديدها من خلال نسبة المعادلات الأولية لسلسلة الديناميكيات إلى المعادلات النظرية، والتي تعمل كأساس للمقارنة.

وبما أن الانحرافات العشوائية يتم فرضها على التقلبات الموسمية، يتم حساب متوسط ​​المؤشرات الموسمية للقضاء عليها.

في هذه الحالة، لكل فترة من الدورة السنوية، يتم تحديد المؤشرات المعممة في شكل متوسط ​​المؤشرات الموسمية:

وتخلو مؤشرات متوسط ​​التقلبات الموسمية من تأثير الانحرافات العشوائية لاتجاه التنمية الرئيسي.

اعتمادًا على طبيعة الاتجاه، يمكن أن تتخذ صيغة متوسط ​​المؤشر الموسمي الأشكال التالية:

1.بالنسبة لسلسلة من الديناميكيات البينية السنوية مع اتجاه رئيسي واضح للتنمية:

2. بالنسبة لسلسلة من الديناميكيات البينية السنوية التي لا يوجد فيها اتجاه متزايد أو متناقص أو تكون غير ذات أهمية:

أين هو المعدل العام؟

طرق تحليل الاتجاه الرئيسي.

يتأثر تطور الظواهر بمرور الوقت بعوامل مختلفة الطبيعة وقوة التأثير. بعضها عشوائي بطبيعته، والبعض الآخر له تأثير ثابت تقريبًا ويشكل اتجاهًا معينًا للتنمية في الديناميكيات.

إحدى المهام المهمة للإحصاءات هي تحديد ديناميكيات الاتجاه المتسلسلة، والتحرر من تأثير العوامل العشوائية المختلفة. ولهذا الغرض، تتم معالجة السلاسل الزمنية بطرق تكبير الفترات والمتوسط ​​المتحرك والتسوية التحليلية وما إلى ذلك.

طريقة توسيع الفاصل الزمنييعتمد على توسيع الفترات الزمنية، والتي تشمل مستويات سلسلة من الديناميكيات، أي. هو استبدال البيانات المتعلقة بفترات زمنية صغيرة ببيانات لفترات أكبر. إنه فعال بشكل خاص عندما تتعلق المستويات الأولية للسلسلة بفترات زمنية قصيرة. على سبيل المثال، يتم استبدال سلسلة المؤشرات المرتبطة بالأحداث اليومية بسلسلة مرتبطة بالأحداث الأسبوعية والشهرية وما إلى ذلك. وهذا سوف يظهر بشكل أكثر وضوحا "محور تطور الظاهرة". ويتيح لنا المتوسط، المحسوب على فترات ممتدة، تحديد اتجاه وطبيعة (تسارع أو تباطؤ النمو) لاتجاه التنمية الرئيسي.

طريقة المتوسط ​​المتحركمشابهة للمستوى السابق، ولكن في هذه الحالة يتم استبدال المستويات الفعلية بمستويات متوسطة محسوبة لفترات زمنية موسعة متحركة (منزلقة) بشكل تسلسلي تغطي ممستويات السلسلة.

على سبيل المثال، إذا قبلنا م = 3،ثم يتم أولاً حساب متوسط ​​المستويات الثلاثة الأولى من السلسلة، ثم - من نفس عدد المستويات، ولكن بدءًا من الثاني، ثم - بدءًا من الثالث، وما إلى ذلك. وبالتالي، فإن متوسط ​​"الشرائح" على طول سلسلة الديناميكيات، يتحرك بمقدار مصطلح واحد. تحسب من مالأعضاء، تشير المتوسطات المتحركة إلى منتصف (وسط) كل فترة.

هذه الطريقة تقضي فقط على التقلبات العشوائية. إذا كانت السلسلة بها موجة موسمية، فإنها ستستمر حتى بعد التجانس باستخدام طريقة المتوسط ​​المتحرك.

المحاذاة التحليلية. من أجل القضاء على التقلبات العشوائية وتحديد الاتجاه، يتم استخدام تسوية مستويات السلسلة باستخدام الصيغ التحليلية (أو التسوية التحليلية). وجوهره هو استبدال المستويات التجريبية (الفعلية) بمستويات نظرية، والتي يتم حسابها باستخدام معادلة معينة معتمدة كنموذج للاتجاه الرياضي، حيث تعتبر المستويات النظرية كدالة للزمن: . وفي هذه الحالة يعتبر كل مستوى فعلي بمثابة مجموع مكونين: حيث هو مكون منهجي ويعبر عنه بمعادلة معينة، وهو متغير عشوائي يسبب تقلبات حول الاتجاه.

تتلخص مهمة المحاذاة التحليلية فيما يلي:

1. التحديد، بناءً على البيانات الفعلية، لنوع الوظيفة الافتراضية التي يمكن أن تعكس بشكل أكثر ملاءمة اتجاه تطور المؤشر قيد الدراسة.

2. إيجاد معلمات الدالة المحددة (المعادلة) من البيانات التجريبية

3. الحساب باستخدام المعادلة الموجودة للمستويات النظرية (المحاذاة).

يتم اختيار وظيفة معينة، كقاعدة عامة، على أساس تمثيل رسومي للبيانات التجريبية.

النماذج عبارة عن معادلات انحدار، يتم حساب معلماتها باستخدام طريقة المربعات الصغرى

فيما يلي معادلات الانحدار الأكثر استخدامًا لمحاذاة السلاسل الزمنية، مع الإشارة إلى اتجاهات التطوير المحددة الأكثر ملاءمة للانعكاس.

للعثور على معلمات المعادلات المذكورة أعلاه، هناك خوارزميات خاصة وبرامج كمبيوتر. على وجه الخصوص، للعثور على معلمات معادلة الخط المستقيم، يمكن استخدام الخوارزمية التالية:

إذا تم ترقيم الفترات أو اللحظات الزمنية بحيث St = 0، فسيتم تبسيط الخوارزميات المذكورة أعلاه بشكل كبير وتتحول إلى

سيتم وضع المستويات المحاذية على الرسم البياني على خط مستقيم واحد، وتمر على أقرب مسافة من المستويات الفعلية لهذه السلسلة الديناميكية. مجموع الانحرافات المربعة هو انعكاس لتأثير العوامل العشوائية.

وباستخدامه نحسب متوسط ​​الخطأ (المعياري) للمعادلة:

هنا n هو عدد الملاحظات، وm هو عدد المعلمات في المعادلة (لدينا اثنان منهم - b 1 و b 0).

يوضح الاتجاه الرئيسي (الاتجاه) كيف تؤثر العوامل المنهجية على مستويات سلسلة من الديناميكيات، ويعمل تقلب المستويات حول الاتجاه () كمقياس لتأثير العوامل المتبقية.

ولتقييم جودة نموذج السلاسل الزمنية المستخدم، يتم استخدامه أيضًا اختبار فيشر F. وهي نسبة التباينين، وهي نسبة التباين الناتج عن الانحدار، أي. العامل محل الدراسة إلى التباين الناتج عن أسباب عشوائية أي التشتت المتبقي:

وبشكل موسع، يمكن تقديم صيغة هذا المعيار على النحو التالي:

حيث n هو عدد الملاحظات، أي. عدد مستويات الصف،

m هو عدد المعلمات في المعادلة، y هو المستوى الفعلي للسلسلة،

مستوى الصف المحاذي - مستوى الصف الأوسط.

إن النموذج الأكثر نجاحًا من النماذج الأخرى قد لا يكون دائمًا مرضيًا بدرجة كافية. ولا يمكن التعرف عليه على هذا النحو إلا في الحالة التي يتجاوز فيها معياره F الحد الحرج المعروف. يتم إنشاء هذه الحدود باستخدام جداول التوزيع F.

جوهر وتصنيف المؤشرات.

في الإحصاء، يُفهم المؤشر على أنه مؤشر نسبي يميز التغير في حجم ظاهرة ما في الزمان أو المكان أو بالمقارنة مع أي معيار.

العنصر الرئيسي لعلاقة الفهرس هو القيمة المفهرسة. تُفهم القيمة المفهرسة على أنها قيمة إحدى خصائص المجتمع الإحصائي، والتي يكون تغييرها هو موضوع الدراسة.

باستخدام الفهارس، يتم حل ثلاث مهام رئيسية:

1) تقييم التغيرات في ظاهرة معقدة؛

2) تحديد تأثير العوامل الفردية على التغيرات في ظاهرة معقدة؛

3) مقارنة حجم ظاهرة ما بحجم الفترة الماضية وحجم إقليم آخر وكذلك بالمعايير والخطط والتنبؤات.

يتم تصنيف المؤشرات وفقًا لثلاثة معايير:

2) حسب درجة تغطية عناصر السكان؛

3) وفقا لطرق حساب المؤشرات العامة.

حسب المحتوىالكميات المفهرسة، وتنقسم المؤشرات إلى مؤشرات المؤشرات الكمية (الحجم) ومؤشرات المؤشرات النوعية. مؤشرات المؤشرات الكمية - مؤشرات الحجم المادي للمنتجات الصناعية، الحجم المادي للمبيعات، عدد الموظفين، إلخ. مؤشرات المؤشرات النوعية - مؤشرات الأسعار، التكاليف، إنتاجية العمل، متوسط ​​الأجور، إلخ.

ووفقا لدرجة تغطية الوحدات السكانية، تنقسم الأرقام القياسية إلى فئتين: فردية وعامة. لتوصيفها، نقدم الاتفاقيات التالية المعتمدة في ممارسة استخدام طريقة الفهرس:

س- الكمية (الحجم) لأي منتج من الناحية المادية ; ص- سعر الوحدة؛ ض- تكلفة وحدة الإنتاج؛ ر— الوقت المستغرق في إنتاج وحدة من المنتج (كثافة العمالة) ; ث- إنتاج المنتجات من حيث القيمة لكل وحدة زمنية؛ ضد- مخرجات الإنتاج من الناحية المادية لكل وحدة زمنية؛ ت- إجمالي الوقت المستغرق أو عدد الموظفين.

من أجل التمييز بين الفترة أو الكائن الذي تنتمي إليه القيم المفهرسة، من المعتاد وضع اشتراكات في أسفل يمين الرمز المقابل. لذلك، على سبيل المثال، في مؤشرات الديناميكيات، كقاعدة عامة، يتم استخدام الرمز 1 للفترات التي تتم مقارنتها (الحالية، التقارير) وللفترات التي تتم المقارنة معها،

المؤشرات الفرديةتعمل على وصف التغيرات في العناصر الفردية لظاهرة معقدة (على سبيل المثال، التغيير في حجم إنتاج نوع واحد من المنتجات). وهي تمثل القيم النسبية للديناميكيات، والوفاء بالالتزامات، ومقارنة القيم المفهرسة.

يتم تحديد المؤشر الفردي للحجم المادي للمنتجات

من وجهة نظر تحليلية، فإن مؤشرات الديناميكيات الفردية المعطاة تشبه معاملات (معدلات) النمو وتميز التغير في القيمة المفهرسة في الفترة الحالية مقارنة بفترة الأساس، أي أنها تظهر عدد مرات الزيادة (النقصان) أو ما هي نسبة النمو (النقصان). يتم التعبير عن قيم الفهرس بالمعاملات أو النسب المئوية.

الفهرس العام (المركب).يعكس التغيرات في جميع عناصر ظاهرة معقدة.

الفهرس الإجماليهو الشكل الأساسي للمؤشر. وسمي ركاماً لأن بسطه ومقامه مجموعة من الركام

المؤشرات المتوسطة وتعريفها.

بالإضافة إلى المؤشرات الإجمالية، يتم استخدام شكل آخر منها في الإحصائيات - مؤشرات المتوسط ​​المرجح. ويتم اللجوء إلى حسابها عندما لا تسمح المعلومات المتوفرة بحساب الرقم القياسي الإجمالي العام. وبالتالي، إذا لم تتوفر بيانات عن الأسعار، ولكن توجد معلومات عن تكلفة المنتجات في الفترة الحالية وأرقام قياسية فردية لكل منتج معروفة، فلا يمكن تحديد الرقم القياسي العام للأسعار كرقم إجمالي، ولكن من الممكن لحسابه كمتوسط ​​للأفراد. وبنفس الطريقة، إذا كانت كميات الأنواع الفردية من المنتجات المنتجة غير معروفة، ولكن المؤشرات الفردية وتكلفة الإنتاج لفترة الأساس معروفة، فيمكن تحديد المؤشر العام للحجم المادي للإنتاج كمتوسط ​​مرجح قيمة.

متوسط ​​المؤشر -هذامؤشر يتم حسابه على أنه متوسط ​​المؤشرات الفردية. المؤشر الإجمالي هو الشكل الأساسي للمؤشر العام، لذا يجب أن يكون المؤشر المتوسط ​​مطابقًا للمؤشر الإجمالي. عند حساب المؤشرات المتوسطة، يتم استخدام شكلين من المتوسطات: الحسابية والتوافقية.

ويكون مؤشر المتوسط ​​الحسابي مطابقا للمؤشر الكلي إذا كانت أوزان المؤشرات الفردية هي مصطلحات مقام المؤشر الكلي. فقط في هذه الحالة، ستكون قيمة المؤشر المحسوبة باستخدام صيغة المتوسط ​​الحسابي مساوية للمؤشر الإجمالي.

في هذا المقال سأتحدث عنه كيفية العثور على الانحراف المعياري. هذه المادة مهمة للغاية لفهم الرياضيات بشكل كامل، لذلك يجب على مدرس الرياضيات تخصيص درس منفصل أو حتى عدة دروس لدراستها. ستجد في هذه المقالة رابطًا لفيديو تعليمي مفصل ومفهوم يشرح ما هو الانحراف المعياري وكيفية العثور عليه.

الانحراف المعيارييجعل من الممكن تقييم انتشار القيم التي تم الحصول عليها نتيجة لقياس معلمة معينة. يشار إليه بالرمز (الحرف اليوناني "سيجما").

صيغة الحساب بسيطة للغاية. للعثور على الانحراف المعياري، عليك أن تأخذ الجذر التربيعي للتباين. والآن عليك أن تسأل: "ما هو التباين؟"

ما هو التباين

تعريف التباين يذهب مثل هذا. التشتت هو الوسط الحسابي لمربعات انحرافات القيم عن المتوسط.

للعثور على التباين، قم بإجراء العمليات الحسابية التالية بالتسلسل:

  • تحديد المتوسط ​​(المتوسط ​​الحسابي البسيط لسلسلة من القيم).
  • ثم اطرح المتوسط ​​من كل قيمة وقم بتربيع الفرق الناتج (تحصل على الفرق التربيعي).
  • الخطوة التالية هي حساب الوسط الحسابي لفروق المربعات الناتجة (يمكنك معرفة سبب المربعات أدناه).

دعونا نلقي نظرة على مثال. لنفترض أنك وأصدقاؤك قررتم قياس ارتفاع كلابك (بالملليمترات). نتيجة للقياسات، حصلت على قياسات الارتفاع التالية (عند الذراعين): 600 مم، 470 مم، 170 مم، 430 مم، 300 مم.

دعونا نحسب المتوسط ​​والتباين والانحراف المعياري.

دعونا أولا العثور على القيمة المتوسطة. كما تعلم بالفعل، للقيام بذلك تحتاج إلى جمع كل القيم المقاسة وتقسيمها على عدد القياسات. تقدم الحساب:

متوسط ​​ملم.

وبذلك يكون المتوسط ​​(الوسط الحسابي) 394 ملم.

الآن نحن بحاجة إلى تحديد انحراف ارتفاع كل كلب عن المتوسط:

أخيراً، لحساب التباين، نقوم بتربيع كل من الفروق الناتجة، ثم نوجد الوسط الحسابي للنتائج التي تم الحصول عليها:

التشتت مم 2 .

وبذلك يكون التشتت 21704 مم2.

كيفية العثور على الانحراف المعياري

فكيف يمكننا الآن حساب الانحراف المعياري مع معرفة التباين؟ وكما نتذكر، خذ الجذر التربيعي له. أي أن الانحراف المعياري يساوي:

مم (مقرب إلى أقرب عدد صحيح بالملليمتر).

وباستخدام هذه الطريقة وجدنا أن بعض الكلاب (مثل الروت وايلر) تكون كلابًا كبيرة جدًا. ولكن هناك أيضًا كلابًا صغيرة جدًا (على سبيل المثال، الكلاب الألمانية، لكن لا يجب أن تخبرهم بذلك).

والشيء الأكثر إثارة للاهتمام هو أن الانحراف المعياري يحمل معلومات مفيدة. يمكننا الآن إظهار أي من نتائج قياس الارتفاع التي تم الحصول عليها تقع ضمن الفاصل الزمني الذي نحصل عليه إذا رسمنا الانحراف المعياري عن المتوسط ​​(على كلا الجانبين).

أي أنه باستخدام الانحراف المعياري نحصل على طريقة "قياسية" تسمح لنا بمعرفة أي من القيم طبيعية (متوسطة إحصائية) وأيها كبيرة بشكل غير عادي أو صغيرة على العكس.

ما هو الانحراف المعياري

لكن... كل شيء سيكون مختلفاً قليلاً إذا قمنا بالتحليل عينةبيانات. في مثالنا نظرنا عامة السكان.أي أن كلابنا الخمسة كانت الكلاب الوحيدة في العالم التي أثارت اهتمامنا.

ولكن إذا كانت البيانات عبارة عن عينة (قيم مختارة من عدد كبير من السكان)، فيجب إجراء الحسابات بشكل مختلف.

إذا كانت هناك قيم، إذن:

ويتم تنفيذ جميع الحسابات الأخرى بالمثل، بما في ذلك تحديد المتوسط.

على سبيل المثال، إذا كانت كلابنا الخمسة مجرد عينة من عدد الكلاب (جميع الكلاب على هذا الكوكب)، فيجب علينا القسمة على 4 وليس 5وهي:

تباين العينة = مم 2.

وفي هذه الحالة يكون الانحراف المعياري للعينة يساوي مم (مقربًا إلى أقرب رقم صحيح).

يمكننا القول أننا قمنا ببعض "التصحيح" في الحالة التي تكون فيها قيمنا مجرد عينة صغيرة.

ملحوظة. لماذا بالضبط الاختلافات التربيعية؟

لكن لماذا نأخذ الفروق المربعة بالضبط عند حساب التباين؟ لنفترض أنه عند قياس بعض المعلمات، تلقيت مجموعة القيم التالية: 4؛ 4؛ -4؛ -4. إذا قمنا ببساطة بجمع الانحرافات المطلقة عن الوسط (الفروق) معًا... فسيتم إلغاء القيم السالبة مع القيم الموجبة:

.

وتبين أن هذا الخيار لا طائل منه. إذن ربما يكون من المفيد تجربة القيم المطلقة للانحرافات (أي وحدات هذه القيم)؟

للوهلة الأولى، اتضح جيدا (القيمة الناتجة، بالمناسبة، تسمى متوسط ​​الانحراف المطلق)، ولكن ليس في جميع الحالات. دعونا نجرب مثالا آخر. دع القياس يؤدي إلى مجموعة القيم التالية: 7؛ 1؛ -6؛ -2. ثم متوسط ​​الانحراف المطلق هو:

رائع! مرة أخرى حصلنا على نتيجة 4، على الرغم من أن الاختلافات لها انتشار أكبر بكثير.

الآن دعونا نرى ما سيحدث إذا قمنا بتربيع الاختلافات (ثم أخذنا الجذر التربيعي لمجموعها).

بالنسبة للمثال الأول سيكون:

.

أما المثال الثاني فيكون:

الآن أصبح الأمر مختلفًا تمامًا! وكلما زادت الفروقات زاد الانحراف المعياري.. وهو ما كنا نهدف إليه.

في الواقع، تستخدم هذه الطريقة نفس الفكرة المستخدمة عند حساب المسافة بين النقاط، ويتم تطبيقها بطريقة مختلفة فقط.

ومن وجهة نظر رياضية، فإن استخدام المربعات والجذور التربيعية يوفر فوائد أكثر مما يمكن أن نحصل عليه من قيم الانحراف المطلق، مما يجعل الانحراف المعياري قابلاً للتطبيق على المشكلات الرياضية الأخرى.

أخبرك سيرجي فاليريفيتش بكيفية العثور على الانحراف المعياري

عند اختيار وحدات المراقبة، تكون أخطاء التحيز ممكنة، أي. مثل هذه الأحداث التي لا يمكن التنبؤ بحدوثها بدقة. وهذه الأخطاء موضوعية وطبيعية. عند تحديد درجة دقة دراسة العينات، يتم تقييم مقدار الخطأ الذي يمكن أن يحدث أثناء عملية أخذ العينات. تسمى هذه الأخطاء عشوائية أخطاء صه العلاقات العامةبدون بشكل مؤقتمع أنت(م)،

ومن الناحية العملية، لتحديد متوسط ​​خطأ العينات عند إجراء الدراسات الإحصائية، يتم استخدام الصيغ التالية:

1) لحساب متوسط ​​الخطأ (m m) للقيمة المتوسطة (M):

، حيث σ هو الانحراف المعياري؛

ن - حجم العينة.

هذا بالنسبة للعينة الكبيرة وللعينة الصغيرة n-1

92 الانحراف المعياري. طريقة الحساب والتطبيق في عمل الطبيب.

الطريقة التقريبية لتقييم تباين سلسلة التباين هي تحديد الحد، أي. القيم الدنيا والقصوى للخاصية الكمية والسعة - أي. الفرق بين خيار القيمة الأكبر والأصغر (Vmax - Vmin). ومع ذلك، فإن الحد والسعة لا يأخذان في الاعتبار القيم المتغيرة داخل السلسلة.

المقياس الرئيسي المقبول عمومًا لتباين الخاصية الكمية ضمن سلسلة التباين هو σ - سيجما).

متوسط ​​مدة العلاج في كلا المستشفيين هو نفسه , ومع ذلك، كان التباين أكبر في المستشفى الثاني.

تتضمن طريقة حساب الانحراف المعياري الخطوات التالية:

2. تحديد انحرافات الخيارات الفردية عن الوسط الحسابي (V-M=d). في الإحصاءات الطبية، يتم تحديد الانحرافات عن المتوسط ​​بـ d (الانحراف). مجموع الانحرافات يساوي صفر (العمود 3 . طاولة 5).

3. قم بتربيع كل انحراف (العمود 4 . طاولة 5).

4. اضرب مربعات الانحرافات في التكرارات المقابلة d2*p (العمود 5، الجدول 5).

5. احسب الانحراف المعياري باستخدام الصيغة:

عندما يكون n أكبر من 30، أو
. عندما يكون n أقل من أو يساوي 30، حيث n هو عدد جميع الخيارات

وترد طريقة حساب الانحراف المعياري في الجدول 5.

يسمح لك الانحراف المعياري بتحديد درجة نموذجية المتوسط , حدود تشتت النطاق، قارن بين تباين صفوف التوزيع المتعددة. , معامل الاختلاف (CV)

الجدول 5

عدد الأيام V

عدد المرضى Ρ

م=20 ن=95 Σ=252

مثال: وفقًا لدراسة خاصة، كان متوسط ​​طول الأولاد البالغين من العمر 7 سنوات في المدينة ن هو 117.7 سم (σ=5) . 1 سم) , ومتوسط ​​الوزن 21.7 كجم (σ = 2.4 كجم). من المستحيل تقييم تباين الطول والوزن من خلال مقارنة الانحرافات المعيارية، حيث يتم تسمية الوزن والطول بكميات. ولذلك، يتم استخدام قيمة نسبية - معامل الاختلاف:

,

تظهر مقارنة معاملات الاختلاف للطول (4.3%) والوزن (11.2%) , هذا الوزن له معامل تباين أعلى، وبالتالي فهو ميزة أقل استقرارًا.

كلما زاد معامل التباين ,

تستخدم القيم المتوسطة على نطاق واسع في العمل اليومي للعاملين في مجال الرعاية الصحية. يتم استخدامها لوصف التطور البدني , الخصائص البشرية الرئيسية: الطول والوزن . محيط الصدر , قياس الدينامومتر ، إلخ. يتم استخدام القيم المتوسطة لتقييم حالة المريض من خلال التحليل الفسيولوجي , التغيرات البيوكيميائية في الجسم: مستويات ضغط الدم , معدل ضربات القلب . درجة حرارة الجسم ومستوى المؤشرات البيوكيميائية , محتوى الهرمونات، وما إلى ذلك. تستخدم القيم المتوسطة على نطاق واسع في تحليل أنشطة المؤسسات الطبية، على سبيل المثال: عند تحليل عمل المستشفيات، مؤشرات متوسط ​​إشغال السرير السنوي، ومتوسط ​​مدة إقامة المريض في السرير، الخ يتم حسابها.

الانحراف المعياري (σ - سيجما)

1. أوجد الوسط الحسابي (م).

تُستخدم قيمة الانحراف المعياري عادةً لمقارنة تباين السلاسل من نفس النوع. إذا تمت مقارنة سلسلتين لهما خصائص مختلفة (الطول والوزن، ومتوسط ​​مدة العلاج في المستشفى، والوفيات في المستشفى، وما إلى ذلك)، فمن المستحيل إجراء مقارنة مباشرة لأحجام سيجما , لأن الانحراف المعياري هو قيمة مسماة يتم التعبير عنها بالأرقام المطلقة. في هذه الحالات استخدم معامل الاختلاف (السيرة الذاتية) وهي قيمة نسبية: النسبة المئوية للانحراف المعياري إلى الوسط الحسابي.

يتم حساب معامل الاختلاف باستخدام الصيغة:

كلما زاد معامل التباين , كلما زاد التباين في هذه السلسلة. ويعتقد أن معامل التباين الذي يزيد عن 30٪ يشير إلى عدم التجانس النوعي للسكان.

81. الانحراف المعياري، طريقة الحساب، التطبيق.

تتمثل الطريقة التقريبية لتقييم تباين سلسلة التباين في تحديد الحد والسعة، ولكن لا يتم أخذ قيم المتغير داخل السلسلة في الاعتبار. المقياس الرئيسي المقبول عمومًا لتباين الخاصية الكمية ضمن سلسلة التباين هو الانحراف المعياري (σ - سيجما). كلما زاد الانحراف المعياري، زادت درجة تقلب هذه السلسلة.

تتضمن طريقة حساب الانحراف المعياري الخطوات التالية:

1. أوجد الوسط الحسابي (م).

2. تحديد انحرافات الخيارات الفردية عن الوسط الحسابي (d=V-M). في الإحصاءات الطبية، يتم تحديد الانحرافات عن المتوسط ​​بـ d (الانحراف). مجموع الانحرافات هو صفر.

3. قم بتربيع كل انحراف d2.

4. اضرب مربعات الانحرافات بالترددات المقابلة d2*p.

5. أوجد مجموع النواتج (d2*p)

6. احسب الانحراف المعياري باستخدام الصيغة:

عندما يكون n أكبر من 30، أو عندما يكون n أقل من أو يساوي 30، حيث n هو عدد جميع الخيارات.

قيمة الانحراف المعياري:

1. يميز الانحراف المعياري انتشار المتغير بالنسبة إلى القيمة المتوسطة (أي تباين سلسلة التباين). كلما زاد سيجما، كلما زادت درجة تنوع هذه السلسلة.

2. يستخدم الانحراف المعياري للتقييم المقارن لدرجة تطابق الوسط الحسابي مع سلسلة التباين التي تم حسابه من أجلها.

تخضع اختلافات الظواهر الجماعية لقانون التوزيع الطبيعي. يبدو المنحنى الذي يمثل هذا التوزيع وكأنه منحنى متماثل سلس على شكل جرس (منحنى غاوسي). وفقا لنظرية الاحتمال، في الظواهر التي تخضع لقانون التوزيع الطبيعي، هناك علاقة رياضية صارمة بين قيم الوسط الحسابي والانحراف المعياري. التوزيع النظري للمتغير في سلسلة تباين متجانسة يخضع لقاعدة ثلاثة سيجما.

إذا تم رسم قيم الخاصية الكمية (المتغيرات) في نظام الإحداثيات المستطيلة على محور الإحداثيات، وتم رسم تكرار حدوث متغير في سلسلة التباين على المحور الإحداثي، ثم المتغيرات ذات الأكبر والأصغر وتقع القيم بالتساوي على جانبي الوسط الحسابي.

لقد ثبت أنه مع التوزيع الطبيعي للصفة:

68.3% من قيم الخيار تقع ضمن M1

95.5% من قيم الخيار تقع ضمن M2

99.7% من قيم الخيار تقع ضمن M3

3. يسمح لك الانحراف المعياري بتحديد قيم طبيعية للمعايير السريرية والبيولوجية. في الطب، عادة ما يتم اعتبار الفاصل الزمني M1 هو النطاق الطبيعي للظاهرة قيد الدراسة. يشير انحراف القيمة المقدرة عن الوسط الحسابي بأكثر من 1 إلى انحراف المعلمة المدروسة عن القاعدة.

4. في الطب، يتم استخدام قاعدة ثلاثة سيجما في طب الأطفال للتقييم الفردي لمستوى النمو البدني للأطفال (طريقة انحراف سيجما)، لتطوير معايير ملابس الأطفال

5. الانحراف المعياري ضروري لتوصيف درجة تنوع الخاصية محل الدراسة وحساب خطأ الوسط الحسابي.

تُستخدم قيمة الانحراف المعياري عادةً لمقارنة تباين السلاسل من نفس النوع. إذا تمت مقارنة سلسلتين لهما خصائص مختلفة (الطول والوزن، ومتوسط ​​مدة العلاج في المستشفى، والوفيات في المستشفى، وما إلى ذلك)، فمن المستحيل إجراء مقارنة مباشرة لأحجام سيجما , لأن الانحراف المعياري هو قيمة مسماة يتم التعبير عنها بالأرقام المطلقة. في هذه الحالات استخدم معامل الاختلاف (السيرة الذاتية) وهي قيمة نسبية: النسبة المئوية للانحراف المعياري إلى الوسط الحسابي.

يتم حساب معامل الاختلاف باستخدام الصيغة:

كلما زاد معامل التباين , كلما زاد التباين في هذه السلسلة. ويعتقد أن معامل التباين الذي يزيد عن 30٪ يشير إلى عدم التجانس النوعي للسكان.

الوسط الحسابي والوسط التوافقي

جوهر ومعنى القيم المتوسطة وأنواعها

الشكل الأكثر شيوعًا للمؤشر الإحصائي هو متوسط ضخامة. يعبر المؤشر على شكل قيمة متوسطة عن المستوى النموذجي للخاصية في المجموع. يتم تفسير الاستخدام الواسع النطاق للقيم المتوسطة من خلال حقيقة أنها تسمح للمرء بمقارنة قيم الخاصية بين الوحدات التي تنتمي إلى مجموعات سكانية مختلفة. على سبيل المثال، يمكنك مقارنة متوسط ​​طول يوم العمل، ومتوسط ​​فئة أجور العمال، ومتوسط ​​مستوى الأجر للمؤسسات المختلفة.

جوهر القيم المتوسطة هو أنها تلغي الانحرافات في قيم الخاصية في الوحدات الفردية من السكان، الناجمة عن عمل العوامل العشوائية. ولذلك، يجب حساب القيم المتوسطة لعدد كبير بما فيه الكفاية من السكان (وفقا لقانون الأعداد الكبيرة). تعتمد موثوقية القيم المتوسطة أيضًا على تباين قيم السمات في المجموع. بشكل عام، كلما كان التباين في إحدى الخصائص أصغر وزاد عدد السكان الذي يتم تحديد متوسط ​​القيمة منه، كلما كانت أكثر موثوقية.

ترتبط أيضًا نموذجية القيمة المتوسطة ارتباطًا مباشرًا بـ تجانس السكان الإحصائيين.سوف يعكس متوسط ​​القيمة فقط المستوى النموذجي للسمة عندما يتم حسابه من مجموعة سكانية متجانسة نوعيًا. وبخلاف ذلك، يتم استخدام الطريقة المتوسطة مع طريقة التجميع. إذا كان السكان غير متجانسين، يتم استبدال المتوسطات العامة أو استكمالها بمتوسطات المجموعة المحسوبة للمجموعات المتجانسة نوعيا.

اختيار نوع المتوسطاتيتم تحديده من خلال المحتوى الاقتصادي للمؤشر قيد الدراسة والبيانات المصدرية. غالبًا ما يتم استخدام الأنواع التالية من المتوسطات في الإحصاء: متوسطات القدرة (الحسابية، التوافقية، الهندسية، التربيعية، التكعيبية، إلخ)، والمتوسط ​​الزمني، والمتوسطات الهيكلية (الوضع والوسيط).

المتوسط ​​الحسابيغالبا ما توجد في البحوث الاجتماعية والاقتصادية. ويستخدم الوسط الحسابي على شكل المتوسط ​​البسيط والمتوسط ​​المرجح.

تم حسابها من بيانات غير مجمعة بناءً على الصيغة (4.1):

أين س- القيم الفردية للخاصية (الخيارات)؛

ن- عدد الوحدات في السكان.

مثال. مطلوب إيجاد متوسط ​​إنتاج العامل في فريق مكون من 15 شخصًا، إذا كان عدد المنتجات التي ينتجها عامل واحد (القطع) معروفًا: 21؛ 20؛ 20؛ 19؛ 21؛ 19؛ 18؛ 22؛ 19؛ 20؛ 21؛ 20؛ 18؛ 19؛ 20.

الوسط الحسابي البسيطمحسوبة من بيانات غير مجمعة بناءً على الصيغة (4.2):

حيث f هو تكرار تكرار القيمة المقابلة للسمة (المتغير)؛

∑f هو العدد الإجمالي للوحدات السكانية (∑f = n).

مثال. بناءً على البيانات المتوفرة حول توزيع العاملين في الفريق حسب عدد المنتجات التي ينتجونها، من الضروري إيجاد متوسط ​​إنتاج العامل في الفريق.

ملاحظة 1.يمكن حساب متوسط ​​​​قيمة الخاصية في المجموع على أساس القيم الفردية للخاصية وعلى أساس متوسطات المجموعة (الخاصة) المحسوبة للأجزاء الفردية من السكان. في هذه الحالة، يتم استخدام صيغة المتوسط ​​المرجح الحسابي، ومتوسطات المجموعة (الجزئية) ( س ي).

مثال.توجد بيانات عن متوسط ​​مدة خدمة العاملين في ورش المصنع. مطلوب تحديد متوسط ​​مدة خدمة العمال للمصنع ككل.

الملاحظة 2.في حالة تحديد قيم الخاصية التي يتم حساب متوسطها على شكل فترات، عند حساب قيمة المتوسط ​​الحسابي، يتم أخذ متوسط ​​قيم هذه الفترات كقيم للخاصية في مجموعات ( X'). وبالتالي، يتم تحويل السلسلة الفاصلة إلى سلسلة منفصلة. في هذه الحالة، فإن قيمة الفواصل الزمنية المفتوحة، إن وجدت (كقاعدة عامة، هذه هي الأولى والأخيرة)، تعادل بشكل مشروط قيمة الفواصل الزمنية المجاورة لها.

مثال. توجد بيانات عن توزيع العاملين في المؤسسات حسب مستوى الأجور.

القيمة المتوسطة التوافقيةهو تعديل للوسط الحسابي. يتم استخدامه في الحالات التي تكون فيها القيم الفردية للخاصية معروفة، أي المتغيرات ( س)، وحاصل ضرب المتغير والتردد (xf = M)، ولكن الترددات نفسها غير معروفة ( و).

يتم حساب الوسط التوافقي المرجح باستخدام الصيغة (4.3):

مثال. يشترط تحديد متوسط ​​أجور العاملين في جمعية مكونة من ثلاث مؤسسات، إذا كان صندوق الأجور ومتوسط ​​أجور الموظفين لكل مؤسسة معروفين.

نادرًا ما يتم استخدام الوسط التوافقي، وهو بسيط في ممارسة الإحصاء. في الحالات التي يكون فيها xf = Mm = const، يتحول الوسط التوافقي المرجح إلى وسط توافقي بسيط (4.4):

مثال. سارت سيارتان على نفس الطريق. وفي الوقت نفسه، كان أحدهما يتحرك بسرعة 60 كم/ساعة، والثاني - بسرعة 80 كم/ساعة. مطلوب تحديد متوسط ​​سرعة السيارات على طول الطريق.

أنواع أخرى من متوسطات الطاقة. متوسط ​​زمني

يتم استخدام الوسط الهندسي لحساب متوسط ​​الديناميكيات. يتم استخدام المتوسط ​​الهندسي في شكل متوسط ​​بسيط (للبيانات غير المجمعة) ومتوسط ​​مرجح (للبيانات المجمعة).

الوسط الهندسي البسيط (4.5):

حيث n هو عدد قيم السمات؛

ف - علامة المنتج.

المتوسط ​​الهندسي المرجح (4.6):

جذر متوسط ​​القيمة المربعةتستخدم عند حساب مؤشرات التباين. يتم استخدامه في شكل بسيط ومرجح.

مربع المتوسط ​​البسيط (4.7):

مربع المتوسط ​​المرجح (4.8):

يتم استخدام المتوسط ​​المكعب لحساب الانحراف والتفرطح. يتم استخدامه في شكل وزن بسيط.

المتوسط ​​المكعب البسيط (4.9): يتم تحديد الوضع بكل بساطة - من خلال الحد الأقصى للتردد. في سلسلة تباين الفاصل الزمني، يتوافق الوضع تقريبًا مع مركز الفاصل الزمني المشروط، أي الفاصل الزمني الذي يحتوي على تردد عالٍ (تردد). تردد الفاصل الزمني بعد مشروط.

الوسيط (Me) هو قيمة السمة الموجودة في منتصف السلسلة المرتبة. نعني بالمرتبة سلسلة مرتبة بترتيب تصاعدي أو تنازلي لقيم السمات. يقسم الوسيط السلسلة المرتبة إلى جزأين، أحدهما له قيم سمات لا تزيد عن المتوسط، والآخر ليس أقل.

بالنسبة للسلسلة المرتبة التي تحتوي على عدد فردي من المصطلحات، يكون الوسيط هو الخيار الموجود في وسط السلسلة. يتم تحديد موضع الوسيط من خلال الرقم التسلسلي لوحدة السلسلة وفقًا للصيغة (4.13):

حيث n هو عدد أعضاء السلسلة المرتبة.

بالنسبة لسلسلة مرتبة ذات عدد زوجي من الأعضاء، يكون الوسيط هو الوسط الحسابي لقيمتين متجاورتين تقعان في وسط السلسلة.

تردد الفاصل الزمني المتوسط.

مثال. فريق عمل مكون من 9الأشخاص، لديهم التعريفات التالية الأرقام: 4؛ 3؛ 4؛ 5؛ 3؛ 3؛ 6؛ 2;6. مطلوب تحديد القيم المشروطة والمتوسطة لفئة التعريفة.

نظرًا لأن هذا اللواء يضم أكبر عدد من عمال الفئة الثالثة، فستكون هذه الفئة مشروطة، أي Mo = 3.

لتحديد الوسيط دعونا نرتب السلسلة الأصلية بترتيب تصاعدي لقيم السمات:

2; 3; 3; 3; 4; 4; 5; 6; 6.

القيمة الخامسة للسمة أساسية في هذه السلسلة. وبناء على ذلك أنا = 4.

مثال. يجب تحديد فئة التعريفة المشروطة والمتوسطة لعمال المصانع بناءً على البيانات الواردة من صف التوزيع التالي.

وبما أن سلسلة التوزيع الأصلية منفصلة، ​​يتم تحديد القيمة المشروطة بواسطة مؤشر التردد الأقصى. في هذا المثال، المصنع به أكبر عدد من العمال من الفئة الثالثة (f max = 30)، أي. هذا التفريغ مشروط (Mo = 3).

دعونا نحدد موقف الوسيط. يتم إنشاء سلسلة التوزيع الأولية على أساس سلسلة مرتبة، مرتبة حسب قيم السمة المتزايدة. يقع منتصف السلسلة بين الأرقام التسلسلية 50 و51 لقيم السمات. دعنا نتعرف على المجموعة التي ينتمي إليها العمال الذين يحملون هذه الأرقام التسلسلية. للقيام بذلك، نحسب الترددات المتراكمة. تشير التكرارات المتراكمة إلى أن القيمة المتوسطة لفئة التعريفة تساوي ثلاثة (Me = 3)، حيث أن قيم الخاصية ذات الأرقام التسلسلية من 39 إلى 68، بما في ذلك 50 و51، تساوي 3.

مثال. مطلوب تحديد الأجور النموذجية والمتوسطة لعمال المصانع بناءً على البيانات الواردة من سلسلة التوزيع التالية.

وبما أن سلسلة التوزيع الأصلية عبارة عن فاصل زمني، يتم حساب القيمة النموذجية للأجور باستخدام الصيغة. في هذه الحالة، الفاصل الزمني المشروط هو 360-420 مع الحد الأقصى للتردد 30.

يتم أيضًا حساب قيمة الراتب المتوسط ​​باستخدام الصيغة. وفي هذه الحالة يكون الوسيط هو الفترة 360-420، وتكرارها المتراكم هو 70، في حين أن التكرار المتراكم للفترة السابقة كان 40 فقط مع إجمالي عدد الوحدات يساوي 100.