متوسط ​​الخطأ النسبي لتقديرات التقريب. تقدير الموثوقية الإحصائية لنتائج نمذجة الانحدار باستخدام اختبار فيشر F

بالنسبة لمناطق المنطقة، يتم توفير بيانات 200X.

رقم المنطقة متوسط ​​الأجر المعيشي للفرد في اليوم لشخص واحد قادر على العمل، فرك، x متوسط ​​الأجر اليومي، فرك، ذ
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

يمارس:

1. قم ببناء مجال الارتباط وصياغة فرضية حول شكل الارتباط.

2. حساب معلمات معادلة الانحدار الخطي

4. باستخدام متوسط ​​معامل المرونة (العامة)، قدم تقييمًا مقارنًا لقوة العلاقة بين العامل والنتيجة.

7. احسب القيمة المتوقعة للنتيجة إذا زادت القيمة المتوقعة للعامل بنسبة 10% عن مستواه المتوسط. تحديد فاصل الثقة للتنبؤ لمستوى الأهمية.

حل:

دعونا نحل هذه المشكلة باستخدام Excel.

1. من خلال مقارنة البيانات المتاحة x وy، على سبيل المثال، وترتيبها بترتيب تصاعدي للعامل x، يمكن ملاحظة وجود علاقة مباشرة بين الخصائص، عندما تؤدي الزيادة في متوسط ​​مستوى الكفاف للفرد إلى زيادة المتوسط ​​اليومي الأجر. وعلى هذا يمكننا أن نفترض أن العلاقة بين الخصائص علاقة مباشرة ويمكن وصفها بمعادلة الخط المستقيم. تم تأكيد نفس الاستنتاج بناءً على التحليل الرسومي.

لإنشاء حقل ارتباط، يمكنك استخدام Excel PPP. أدخل البيانات الأولية بالتسلسل: أولاً x، ثم y.

حدد منطقة الخلايا التي تحتوي على البيانات.

ثم اختر: إدراج / مؤامرة مبعثر / مبعثر مع علاماتكما هو مبين في الشكل 1.

الشكل 1: بناء مجال الارتباط

يُظهر تحليل مجال الارتباط وجود اعتماد قريب من الخط المستقيم، حيث أن النقاط تقع تقريبًا في خط مستقيم.

2. لحساب معلمات معادلة الانحدار الخطي
دعونا نستخدم الوظيفة الإحصائية المضمنة لاينست.

لهذا:

1) فتح ملف موجود يحتوي على البيانات التي تم تحليلها؛
2) حدد مساحة 5 × 2 من الخلايا الفارغة (5 صفوف وعمودين) لعرض نتائج إحصائيات الانحدار.
3) تفعيل معالج الوظائف: في القائمة الرئيسية حدد الصيغ / وظيفة الإدراج.
4) في النافذة فئةأنت تأخذ إحصائية، في نافذة الوظيفة - لاينست. انقر فوق الزر نعمكما هو مبين في الشكل 2؛

الشكل 2: مربع حوار معالج الوظائف

5) املأ وسيطات الوظيفة:

القيم المعروفة ل

القيم المعروفة لـ x

ثابت- قيمة منطقية تشير إلى وجود أو عدم وجود حد حر في المعادلة؛ إذا كان الثابت = 1، فسيتم حساب الحد الحر بالطريقة المعتادة، وإذا كان الثابت = 0، فإن الحد الحر هو 0؛

إحصائيات- قيمة منطقية تشير إلى ما إذا كان سيتم عرض معلومات إضافية حول تحليل الانحدار أم لا. إذا كانت الإحصائيات = 1، فسيتم عرض معلومات إضافية، وإذا كانت الإحصائيات = 0، فسيتم عرض تقديرات معلمات المعادلة فقط.

انقر فوق الزر نعم;

الشكل 3: مربع حوار وسيطات دالة LINEST

6) سيظهر العنصر الأول من الجدول النهائي في الخلية العلوية اليسرى للمنطقة المحددة. لفتح الجدول بأكمله، اضغط على الزر ، ثم إلى مجموعة المفاتيح ++ .

سيتم إخراج إحصائيات الانحدار الإضافية بالترتيب الموضح في الرسم البياني التالي:

قيمة المعامل ب معامل قيمة
الخطأ المعياري ب الخطأ المعياري أ
خطأ قياسي ذ
F-إحصائية
مجموع الانحدار من المربعات

الشكل 4: نتيجة حساب الدالة LINEST

لقد حصلنا على مستوى الانحدار:

نستنتج: مع زيادة متوسط ​​مستوى الكفاف للفرد بمقدار 1 فرك. يزيد متوسط ​​\u200b\u200bالأجر اليومي بمعدل 0.92 روبل.

وهذا يعني أن 52% من التباين في الأجور (y) يتم تفسيره بتغير العامل x - متوسط ​​الأجر المعيشي للفرد، و48% - بفعل عوامل أخرى غير مدرجة في النموذج.

وباستخدام معامل التحديد المحسوب يمكن حساب معامل الارتباط: .

يتم تقييم الاتصال على أنه قريب.

4. باستخدام متوسط ​​معامل المرونة (العامة) نحدد قوة تأثير العامل على النتيجة.

بالنسبة لمعادلة الخط المستقيم، نحدد متوسط ​​معامل المرونة (الإجمالي) باستخدام الصيغة:

سنجد القيم المتوسطة عن طريق تحديد مساحة الخلايا ذات قيم x واختيارها الصيغ / الجمع التلقائي / المتوسطوسنفعل الشيء نفسه مع قيم y.

الشكل 5: حساب متوسط ​​قيم الدالة والوسيطة

وبالتالي، إذا تغير متوسط ​​تكلفة المعيشة للفرد بنسبة 1% عن متوسط ​​قيمته، فإن متوسط ​​الأجر اليومي سيتغير بمعدل 0.51%.

باستخدام أداة تحليل البيانات تراجعمتاح:
- نتائج إحصاءات الانحدار،
- نتائج تحليل التباين،
- نتائج فترات الثقة،
- المخلفات والرسوم البيانية المناسبة لخط الانحدار،
- المخلفات والاحتمال الطبيعي.

الإجراء هو كما يلي:

1) التحقق من الوصول إلى حزمة التحليل. في القائمة الرئيسية اختر: الملف/الخيارات/الإضافات.

2) في القائمة المنسدلة يتحكمحدد العنصر الوظائف الإضافية لبرنامج Excelواضغط على الزر يذهب.

3) في النافذة الإضافاتتفقد الصندوق حزمة التحليلومن ثم انقر فوق الزر نعم.

لو حزمة التحليلليس في قائمة الحقول الإضافات المتاحة، اضغط الزر مراجعةلإجراء بحث.

إذا تلقيت رسالة تشير إلى أن حزمة التحليل غير مثبتة على جهاز الكمبيوتر الخاص بك، فانقر فوق "نعم". نعملتثبيته.

4) في القائمة الرئيسية اختر: البيانات / تحليل البيانات / أدوات التحليل / الانحدارومن ثم انقر فوق الزر نعم.

5) املأ مربع حوار معلمات إدخال وإخراج البيانات:

الفاصل الزمني للإدخال Y- النطاق الذي يحتوي على بيانات السمة الناتجة؛

الفاصل الزمني للإدخال X- النطاق الذي يحتوي على بيانات العامل المميز؛

العلامات- علامة تشير إلى ما إذا كان السطر الأول يحتوي على أسماء الأعمدة أم لا؛

ثابت - صفر- علامة تشير إلى وجود أو عدم وجود حد حر في المعادلة؛

الفاصل الزمني للإخراج- يكفي الإشارة إلى الخلية اليسرى العليا للنطاق المستقبلي؛

6) ورقة عمل جديدة - يمكنك تحديد اسم عشوائي للورقة الجديدة.

ثم انقر فوق الزر نعم.

الشكل 6: مربع حوار لإدخال المعلمات لأداة الانحدار

يتم عرض نتائج تحليل الانحدار لبيانات المشكلة في الشكل 7.

الشكل 7: نتيجة استخدام أداة الانحدار

5. دعونا نقيم جودة المعادلات باستخدام متوسط ​​خطأ التقريب. دعونا نستخدم نتائج تحليل الانحدار الواردة في الشكل 8.

الشكل 8 نتيجة استخدام أداة الانحدار "سحب الباقي"

لنقم بإنشاء جدول جديد كما هو موضح في الشكل 9. في العمود C، نحسب خطأ التقريب النسبي باستخدام الصيغة:

الشكل 9: حساب متوسط ​​خطأ التقريب

يتم حساب متوسط ​​خطأ التقريب باستخدام الصيغة:

تم تقييم جودة النموذج المبني على أنها جيدة، حيث أنها لا تتجاوز 8 - 10٪.

6. من الجدول الذي يحتوي على إحصائيات الانحدار (الشكل 4) نكتب القيمة الفعلية لاختبار فيشر F:

بسبب ال عند مستوى دلالة 5%، يمكننا أن نستنتج أن معادلة الانحدار معنوية (تم إثبات العلاقة).

8. سنقوم بتقييم الأهمية الإحصائية لمعلمات الانحدار باستخدام إحصائيات الطالب وحساب فاصل الثقة لكل مؤشر.

وطرحنا الفرضية H0 حول وجود فرق غير معنوي إحصائيا بين المؤشرات والصفر:

.

بالنسبة لعدد درجات الحرية

يحتوي الشكل 7 على القيم الإحصائية t الفعلية:

ويمكن حساب اختبار t لمعامل الارتباط بطريقتين:

الطريقة الأولى:

أين - الخطأ العشوائي في معامل الارتباط.

سوف نأخذ البيانات للحساب من الجدول في الشكل 7.

الطريقة الثانية:

القيم الإحصائية t الفعلية تتجاوز قيم الجدول:

ولذلك تم رفض الفرضية H0، أي أن معاملات الانحدار ومعامل الارتباط لا تختلف عن الصفر بالصدفة، ولكنها ذات دلالة إحصائية.

يتم تعريف فاصل الثقة للمعلمة a على أنه

بالنسبة للمعلمة أ، كانت حدود 95% كما هو موضح في الشكل 7 هي:

يتم تعريف فاصل الثقة لمعامل الانحدار بأنه

بالنسبة لمعامل الانحدار b، كانت حدود 95% كما هو موضح في الشكل 7 هي:

يؤدي تحليل الحدود العليا والدنيا لفترات الثقة إلى استنتاج مفاده أنه مع الاحتمال المعلمتان a وb، اللتان تقعان ضمن الحدود المحددة، لا تأخذان قيمًا صفرية، أي. ليست ذات دلالة إحصائية وتختلف بشكل كبير عن الصفر.

7. التقديرات التي تم الحصول عليها لمعادلة الانحدار تسمح باستخدامها في التنبؤ. إذا كانت تكلفة المعيشة المتوقعة هي:

ثم القيمة المتوقعة لتكلفة المعيشة ستكون:

نحسب خطأ التنبؤ باستخدام الصيغة:

أين

سنقوم أيضًا بحساب التباين باستخدام Excel PPP. لهذا:

1) تفعيل معالج الوظائف: في القائمة الرئيسية حدد الصيغ / وظيفة الإدراج.

3) املأ النطاق الذي يحتوي على البيانات العددية لخاصية العامل. انقر نعم.

الشكل 10: حساب التباين

لقد حصلنا على قيمة التباين

لحساب التباين المتبقي لكل درجة حرية، سوف نستخدم نتائج تحليل التباين كما هو مبين في الشكل 7.

يتم تحديد فترات الثقة للتنبؤ بالقيم الفردية لـ y باحتمال 0.95 بواسطة التعبير:

الفاصل الزمني واسع جدًا، ويرجع ذلك أساسًا إلى الحجم الصغير للملاحظات. بشكل عام، تبين أن توقعات متوسط ​​الراتب الشهري موثوقة.

بيان المشكلة مأخوذ من: ورشة عمل حول الاقتصاد القياسي: Proc. بدل / أنا. إليسيفا ، إس. كوريشيفا، ن.م. جوردينكو وآخرون؛ إد. أنا. إليسيفا. - م: المالية والإحصاء، 2003. - 192 ص: مريض.

5. باستخدام اختبار F تبين أن معادلة الانحدار المزدوج الناتجة ككل غير ذات دلالة إحصائية ولا تصف بشكل كاف ظاهرة العلاقة المدروسة بين قيمة المعاش الشهري y وتكلفة المعيشة x.

6. تم إنشاء نموذج انحدار خطي متعدد للاقتصاد القياسي، يربط مبلغ صافي دخل شركة مشروطة y مع معدل دوران رأس المال x1 ورأس المال المستخدم x2

7. من خلال حساب معاملات المرونة يتبين أنه عندما يتغير معدل دوران رأس المال بنسبة 1% يتغير مقدار صافي دخل الشركة بنسبة 0.0008%، وعندما يتغير رأس المال المستخدم بنسبة 1% يتغير مقدار صافي دخل الشركة التغييرات بنسبة 0.56٪.

8. باستخدام اختبار t تم تقدير الدلالة الإحصائية لمعاملات الانحدار، وتبين أن المتغير التوضيحي x 1 غير ذو دلالة إحصائية ويمكن استبعاده من معادلة الانحدار، وفي نفس الوقت يكون المتغير التوضيحي x 2 غير ذو دلالة إحصائية. ذات دلالة إحصائية.

9. باستخدام اختبار F تبين أن معادلة الانحدار المزدوج الناتجة ككل ذات دلالة إحصائية، وتصف بشكل كاف الظاهرة المدروسة للعلاقة بين صافي دخل الشركة المشروطة y ودوران رأس المال × 1 ورأس المال المستخدم × 2.

10. تم حساب متوسط ​​خطأ تقريب البيانات الإحصائية بمعادلة الانحدار الخطي المتعدد والذي بلغ 29.8%. ويتبين من خلال الملاحظة في قاعدة البيانات الإحصائية أن حجم هذا الخطأ يتجاوز القيمة المسموح بها.

14. بناء نموذج الانحدار المزدوج دون استخدام برنامج EXCEL.

باستخدام المادة الإحصائية الواردة في الجدول 3.5 من الضروري:

2. تقييم مدى قرب الارتباط باستخدام مؤشرات الارتباط والتحديد.

3.باستخدام معامل المرونة تحديد درجة الارتباط بين العامل المميز والعامل الناتج.

4. تحديد متوسط ​​خطأ التقريب.

5. تقييم الموثوقية الإحصائية للنمذجة باستخدام اختبار فيشر F.

الجدول 3.5. البيانات الأولية.

حصة الدخل النقدي التي تهدف إلى زيادة المدخرات في الودائع والقروض والشهادات وشراء العملات الأجنبية، من إجمالي متوسط ​​نصيب الفرد من الدخل النقدي،٪

متوسط ​​​​الأجور الشهرية المتراكمة، c.u.

كالوزسكايا

كوسترومسكايا

أورلوفسكايا

ريازان

سمولينسكايا

لتحديد المعلمات غير المعروفة b 0 , b 1 لمعادلة الانحدار الخطي المقترنة، نستخدم النظام القياسي للمعادلات العادية، والذي له الشكل

(3.7)

لحل هذا النظام، من الضروري أولاً تحديد قيم Sx 2 وSxy. يتم تحديد هذه القيم من جدول البيانات المصدر، مع استكماله بالأعمدة المناسبة (الجدول 3.6).

الجدول 3.6. نحو حساب معاملات الانحدار.

ثم يأخذ النظام (3.7) النموذج

بالتعبير عن b 0 من المعادلة الأولى واستبدال التعبير الناتج في المعادلة الثانية نحصل على:

وبإجراء عملية الضرب على الحد تلو الآخر وفتح الأقواس نحصل على:

أخيرًا، معادلة الانحدار الخطي المقترنة التي تربط قيمة حصة الدخل النقدي للسكان بهدف زيادة المدخرات y مع متوسط ​​الأجر الشهري المستحق x لها الشكل:

لذلك، عند بناء معادلة الانحدار الخطي المقترن، نحدد معامل الارتباط الخطي حسب الاعتماد:

أين هي قيم الانحرافات المعيارية للمعلمات المقابلة.

لحساب معامل الارتباط الخطي من التبعية (3.9)، نقوم بإجراء حسابات وسيطة.

استبدال قيم المعلمات الموجودة في التعبير (3.9) نحصل عليه

.

تشير القيمة التي تم الحصول عليها لمعامل الارتباط الخطي إلى وجود علاقة إحصائية عكسية ضعيفة بين حصة الدخل النقدي للسكان بهدف زيادة المدخرات y ومبلغ متوسط ​​​​الأجور الشهرية المستحقة x.

ومعامل التحديد هو، مما يعني أن 9.6% فقط يتم تفسيره من خلال انحدار المتغير التوضيحي x على y. وبناء على ذلك، فإن القيمة 1 التي تساوي 90.4% تميز حصة تباين المتغير y الناجم عن تأثير جميع المتغيرات التوضيحية الأخرى التي لم تؤخذ في الاعتبار في النموذج الاقتصادي القياسي.

معامل المرونة هو

وبالتالي، عندما يتغير متوسط ​​الأجر الشهري المستحق بنسبة 1٪، فإن حصة الدخل النقدي للسكان التي تهدف إلى زيادة المدخرات تنخفض أيضًا بنسبة 1٪، ومع زيادة الأجور، هناك انخفاض في حصة الدخل النقدي للسكان السكان تهدف إلى زيادة المدخرات. يتعارض هذا الاستنتاج مع المنطق السليم ولا يمكن تفسيره إلا من خلال عدم صحة النموذج الرياضي الذي تم إنشاؤه.

دعونا نحسب متوسط ​​خطأ التقريب.

الجدول 3.7. نحو حساب متوسط ​​خطأ التقريب.

وتتجاوز القيمة المتحصل عليها (12...15)%، مما يدل على أهمية متوسط ​​انحراف البيانات المحسوبة عن البيانات الفعلية التي بني عليها النموذج الاقتصادي القياسي.

سيتم إجراء موثوقية النمذجة الإحصائية بناءً على اختبار فيشر F. يتم تحديد القيمة النظرية لمعيار فيشر F calc من نسبة قيم العامل والتشتتات المتبقية المحسوبة لدرجة واحدة من الحرية حسب الصيغة

حيث n هو عدد الملاحظات؛

m هو عدد المتغيرات التوضيحية (على سبيل المثال قيد النظر m m =1).

يتم تحديد القيمة الحرجة F Crit من الجداول الإحصائية ولمستوى الأهمية a = 0.05 يساوي 10.13. منذ حساب F

15. بناء نموذج الانحدار المتعدد دون استخدام برنامج EXCEL.

باستخدام المواد الإحصائية الواردة في الجدول 3.8 يجب عليك:

1. بناء معادلة الانحدار الخطي المتعدد وشرح المعنى الاقتصادي لمتغيراتها.

2. إعطاء تقييم مقارن لمدى تقارب العلاقة بين العوامل والسمة الناتجة باستخدام معاملات المرونة المتوسطة (العامة).

3. تقييم الدلالة الإحصائية لمعاملات الانحدار باستخدام اختبار t والفرضية الصفرية حول عدم أهمية المعادلة باستخدام اختبار F.

4. تقييم جودة المعادلة من خلال تحديد متوسط ​​خطأ التقريب.

الجدول 3.8. البيانات الأولية.

صافي الدخل مليون دولار أمريكي

دوران رأس المال، مليون دولار أمريكي

رأس المال المستخدم مليون دولار أمريكي

لتحديد المعلمات غير المعروفة b 0 , b 1 , b 2 لمعادلة الانحدار الخطي المتعدد، نستخدم النظام القياسي للمعادلات العادية، والذي له الشكل

(3.11)

لحل هذا النظام لا بد أولا من تحديد قيم الكميات Sx 1 2، Sx 2 2، Sx 1 y، Sx 2 y، Sx 1 x 2. يتم تحديد هذه القيم من جدول البيانات المصدر، مع استكماله بالأعمدة المناسبة (الجدول 3.9).

الجدول 3.9. نحو حساب معاملات الانحدار.

ثم يأخذ النظام (3.11) النموذج

لحل هذا النظام سنستخدم طريقة غاوس، والتي تتمثل في حذف المجهولات بالتتابع: قسمة المعادلة الأولى للنظام على 10، ثم ضرب المعادلة الناتجة في 370.6 وطرحها من المعادلة الثانية للنظام، ثم ضرب المعادلة المعادلة الناتجة على 158.20 وطرحها من المعادلة الثالثة للنظام. وبتكرار الخوارزمية المحددة للمعادلتين الثانية والثالثة المحولتين للنظام نحصل على:

Þ Þ

Þ .

بعد التحويل لدينا :

ثم يكون الاعتماد النهائي لصافي الدخل على معدل دوران رأس المال ورأس المال المستخدم في شكل معادلة الانحدار الخطي المتعدد بالشكل:

من المعادلة الاقتصادية القياسية الناتجة يمكن ملاحظة أنه مع زيادة رأس المال المستخدم، يزداد صافي الدخل، وعلى العكس من ذلك، مع زيادة معدل دوران رأس المال، ينخفض ​​صافي الدخل. وبالإضافة إلى ذلك، كلما زاد معامل الانحدار، زاد تأثير المتغير التوضيحي على المتغير التابع. في المثال قيد النظر، تكون قيمة معامل الانحدار أكبر من قيمة المعامل، وبالتالي، فإن رأس المال المستخدم له تأثير أكبر بكثير على صافي الدخل من معدل دوران رأس المال. لتحديد هذا الاستنتاج، سوف نحدد معاملات المرونة الجزئية.

ويبين تحليل النتائج أيضا أن رأس المال المستخدم له تأثير أكبر على صافي الدخل. لذلك، على وجه الخصوص، مع زيادة رأس المال المستخدم بنسبة 1٪، يرتفع صافي الدخل بنسبة 1.17٪. وفي الوقت نفسه، مع زيادة معدل دوران رأس المال بنسبة 1٪، ينخفض ​​صافي الدخل بنسبة 0.5٪.

القيمة النظرية لمعيار فيشر F calc.

يتم تحديد قيمة القيمة الحرجة F Crit من الجداول الإحصائية ولمستوى دلالة a = 0.05 يساوي 4.74. نظرًا لأن F calc > F Crit، يتم رفض الفرضية الصفرية ويتم قبول معادلة الانحدار الناتجة باعتبارها ذات دلالة إحصائية.

إن تقييم الدلالة الإحصائية لمعاملات الانحدار ومعيار t يتلخص في مقارنة القيمة العددية لهذه المعاملات مع حجم أخطائها العشوائية ووفقاً للعلاقة:

صيغة العمل لحساب القيمة النظرية لإحصائيات t هي:

, (3.13)

حيث يتم حساب معاملات الارتباط الزوجي ومعامل الارتباط المتعدد من التبعيات:

ثم القيم النظرية (المحسوبة) لإحصائيات t تساوي على التوالي:

بما أن القيمة الحرجة لإحصائيات t، المحددة من الجداول الإحصائية لمستوى الدلالة a = 0.05 تساوي t crit = 2.36، أكبر في القيمة المطلقة من = - 1.798، فلا يتم رفض الفرضية الصفرية والمتغير التوضيحي x 1 غير ذات دلالة إحصائية ويمكن استبعادها من معادلة الانحدار. وعلى العكس من ذلك، بالنسبة لمعامل الانحدار الثاني > t Crit (3.3 > 2.36)، والمتغير التوضيحي x 2 له دلالة إحصائية.

دعونا نحسب متوسط ​​خطأ التقريب.

الجدول 3.10. نحو حساب متوسط ​​خطأ التقريب.

ثم متوسط ​​خطأ التقريب هو

القيمة التي تم الحصول عليها لا تتجاوز الحد المسموح به وهو (12…15)%.

16. تاريخ تطور نظرية القياس

تم تطوير TI لأول مرة كنظرية للقياسات النفسية الفيزيائية. في منشورات ما بعد الحرب، كتب عالم النفس الأمريكي س.س. ركز ستيفنز على مقاييس القياس. في النصف الثاني من القرن العشرين. نطاق تطبيق TI يتوسع بسرعة. أحد مجلدات "موسوعة العلوم النفسية" التي نشرت في الولايات المتحدة في الخمسينيات كان يسمى "القياسات النفسية". قام مؤلفو هذا المنشور بتوسيع نطاق TI من الفيزياء النفسية إلى علم النفس بشكل عام. وفي مقال هذه المجموعة، "أساسيات نظرية القياس"، كان العرض على مستوى رياضي تجريدي، دون الرجوع إلى أي مجال تطبيقي محدد. في ذلك، تم التركيز على "تجانس النظم التجريبية مع العلاقات في العددية" (ليست هناك حاجة للخوض في هذه المصطلحات الرياضية هنا)، وزاد التعقيد الرياضي للعرض التقديمي مقارنة بأعمال S.S. ستيفنز.

في إحدى المقالات المحلية الأولى حول TI (أواخر الستينيات)، ثبت أن النقاط التي يعينها الخبراء عند تقييم كائنات الفحص يتم قياسها، كقاعدة عامة، على مقياس ترتيبي. أدت الأعمال التي ظهرت في أوائل السبعينيات إلى توسع كبير في نطاق استخدام TI. وقد تم تطبيقه على قياس الجودة التربوية (قياس جودة معرفة الطلاب)، في أبحاث النظم، في مختلف مشاكل نظرية تقييمات الخبراء، لتجميع مؤشرات جودة المنتج، في الدراسات الاجتماعية، وما إلى ذلك.

كمشكلتين رئيسيتين في TI، إلى جانب تحديد نوع المقياس لقياس بيانات محددة، تم طرح بحث عن خوارزميات تحليل البيانات، والتي لا تتغير نتيجتها مع أي تحويل مقبول للمقياس (أي ثابت فيما يتعلق (لهذا التحول). والمقاييس الترتيبية في الجغرافيا هي مقياس بوفورت للرياح (“الهادئة”، “الرياح الخفيفة”، “الرياح المعتدلة”، إلخ)، ومقياس قوة الزلازل. من الواضح أنه لا يمكن القول أن زلزالًا بقوة 2 درجة (مصباح يتمايل تحت السقف) أضعف بخمس مرات بالضبط من زلزال بقوة 10 درجات (تدمير كامل لكل شيء على سطح الأرض).

في الطب، المقاييس الترتيبية هي مقياس مراحل ارتفاع ضغط الدم (حسب مياسنيكوف)، ومقياس درجات قصور القلب (حسب ستراجيسكو-فاسيلينكو-لانج)، ومقياس شدة قصور الشريان التاجي (حسب فوغلسون)، وما إلى ذلك . تم بناء جميع هذه المقاييس وفقًا للمخطط التالي: لم يتم اكتشاف أي مرض؛ المرحلة الأولى من المرض. المرحلة الثانية؛ المرحلة الثالثة... في بعض الأحيان يتم تمييز المراحل 1أ و16 وغيرها، ولكل مرحلة خاصية طبية فريدة خاصة بها. عند وصف مجموعات الإعاقة، يتم استخدام الأرقام بالترتيب المعاكس: الأشد هي مجموعة الإعاقة الأولى، ثم الثانية والأخف وزنا هي الثالثة.

يتم أيضًا قياس أرقام المنازل على مقياس ترتيبي - فهي توضح الترتيب الذي تقع به المنازل على طول الشارع. عادةً ما ترتبط أرقام المجلدات في الأعمال المجمعة للكاتب أو أرقام الحالات في أرشيف المؤسسة بالترتيب الزمني لإنشائها.

عند تقييم جودة المنتجات والخدمات، تحظى المقاييس الترتيبية بشعبية فيما يسمى قياس الجودة (الترجمة الحرفية – قياس الجودة). أي أنه يتم تقييم وحدة الإنتاج على أنها مقبولة أو غير صالحة. لإجراء تحليل أكثر شمولاً، يتم استخدام مقياس بثلاثة تدرجات: هناك عيوب كبيرة - توجد عيوب بسيطة فقط - لا توجد عيوب. في بعض الأحيان يتم استخدام أربعة تدرجات: هناك عيوب حرجة (مما يجعل من المستحيل استخدامها) - هناك عيوب كبيرة - توجد عيوب بسيطة فقط - لا توجد عيوب. تصنيف المنتجات له معنى مماثل - ممتاز، درجة أولى، درجة ثانية،...

عند تقييم التأثيرات البيئية، عادة ما يكون التقييم الأول والأكثر عمومية ترتيبيًا، على سبيل المثال: البيئة الطبيعية مستقرة - البيئة الطبيعية مضطهدة (متدهورة). المقياس البيئي الطبي مشابه: لا يوجد تأثير واضح على صحة الإنسان - ويلاحظ تأثير سلبي على الصحة.

يتم استخدام المقياس الترتيبي في مجالات أخرى أيضًا. في الاقتصاد القياسي، هذه هي في المقام الأول طرق مختلفة لتقييمات الخبراء.

تنقسم جميع مقاييس القياس إلى مجموعتين - مقاييس الخصائص النوعية ومقاييس الخصائص الكمية. يعد المقياس الترتيبي ومقياس التسمية المقاييس الرئيسية للصفات النوعية، لذلك في العديد من المجالات المحددة يمكن اعتبار نتائج التحليل النوعي بمثابة قياسات على هذه المقاييس. مقاييس الخصائص الكمية هي مقاييس الفواصل والنسب والاختلافات والمطلقة. باستخدام مقياس الفترات، يتم قياس حجم الطاقة الكامنة أو إحداثيات نقطة على خط مستقيم. وفي هذه الحالات، لا يمكن تحديد الأصل الطبيعي ولا وحدة القياس الطبيعية على المقياس. ويجب على الباحث أن يحدد نقطة البداية ويختار وحدة القياس بنفسه. التحويلات المقبولة في مقياس الفاصل الزمني هي تحويلات خطية متزايدة، أي. وظائف خطية. يرتبط مقياسا درجة الحرارة مئوية وفهرنهايت بهذا الاعتماد بالضبط: درجة مئوية = 5/9 (درجة فهرنهايت - 32)، حيث درجة مئوية هي درجة الحرارة (بالدرجات) على مقياس مئوية، ودرجة فهرنهايت هي درجة الحرارة على مقياس فهرنهايت حجم.

من بين المقاييس الكمية، الأكثر شيوعًا في العلم والممارسة هي المقاييس النسبية. لديهم نقطة مرجعية طبيعية - صفر، أي. غياب الكمية، ولكن لا توجد وحدة قياس طبيعية. يتم قياس معظم الوحدات المادية على مقياس النسبة: كتلة الجسم، الطول، الشحنة، وكذلك الأسعار في الاقتصاد. التحويلات المقبولة في مقياس النسبة متشابهة (تغيير المقياس فقط). بمعنى آخر، تحويلات خطية متزايدة بدون مدة حرة، على سبيل المثال تحويل الأسعار من عملة إلى أخرى بسعر ثابت. لنفترض أننا قارنا الكفاءة الاقتصادية لمشروعين استثماريين باستخدام الأسعار بالروبل. دع المشروع الأول يكون أفضل من الثاني. الآن دعنا ننتقل إلى العملة الصينية - اليوان، باستخدام معدل تحويل ثابت. من الواضح أن المشروع الأول يجب أن يكون مرة أخرى أكثر ربحية من المشروع الثاني. ومع ذلك، لا تضمن خوارزميات الحساب تلقائيًا استيفاء هذا الشرط، ومن الضروري التحقق من استيفاءه. نتائج هذا الاختبار للقيم المتوسطة موضحة أدناه.

يحتوي مقياس الفرق على وحدة قياس طبيعية، ولكن لا توجد نقطة مرجعية طبيعية. ويقاس الوقت على مقياس الفروق إذا اتخذت السنة (أو اليوم - من الظهر إلى الظهر) كوحدة قياس طبيعية، وعلى مقياس الفترات في الحالة العامة. على المستوى الحالي للمعرفة، من المستحيل الإشارة إلى نقطة البداية الطبيعية. يحسب مؤلفون مختلفون تاريخ إنشاء العالم بطرق مختلفة، وكذلك لحظة ميلاد المسيح.

بالنسبة للمقياس المطلق فقط، تكون نتائج القياس عبارة عن أرقام بالمعنى المعتاد للكلمة، على سبيل المثال، عدد الأشخاص في الغرفة. بالنسبة للمقياس المطلق، يُسمح فقط بتغيير الهوية.

في عملية تطوير مجال المعرفة المقابل، قد يتغير نوع المقياس. لذلك، في البداية تم قياس درجة الحرارة على مقياس ترتيبي (أبرد - أكثر دفئا). ثم - حسب الفاصل الزمني (مقياس مئوية، فهرنهايت، ريومور). وأخيرا، بعد اكتشاف الصفر المطلق، يمكن اعتبار درجة الحرارة قابلة للقياس على مقياس النسبة (مقياس كلفن). تجدر الإشارة إلى أنه في بعض الأحيان تكون هناك خلافات بين المتخصصين حول المقاييس التي يجب استخدامها لاعتبار قيم حقيقية معينة يتم قياسها. بمعنى آخر، تتضمن عملية القياس أيضًا تحديد نوع المقياس (مع الأساس المنطقي لاختيار نوع معين من المقياس). بالإضافة إلى الأنواع الستة الرئيسية من المقاييس المذكورة، يتم استخدام موازين أخرى في بعض الأحيان.

17. الخوارزميات الثابتة والقيم المتوسطة.

دعونا نقوم بصياغة المتطلب الرئيسي لخوارزميات تحليل البيانات في TI: يجب ألا تتغير الاستنتاجات المستخلصة على أساس البيانات المقاسة على مقياس من نوع معين عندما يكون مقياس قياس هذه البيانات مسموحًا به. بمعنى آخر، يجب أن تكون الاستدلالات ثابتة في ظل تحويلات المقياس الصحيحة.

وبالتالي فإن أحد الأهداف الرئيسية لنظرية القياس هو محاربة ذاتية الباحث عند إسناد قيم عددية لأشياء حقيقية. وبالتالي، يمكن قياس المسافات بالأقواس، والأمتار، والميكرونات، والأميال، والفرسخ الفلكي ووحدات القياس الأخرى. الكتلة (الوزن) - بالبود والكيلوجرام والجنيه وما إلى ذلك. يمكن الإشارة إلى أسعار السلع والخدمات باليوان والروبل والتنغي والهريفنيا ولاتس والكرونات والماركات والدولار الأمريكي والعملات الأخرى (تخضع لأسعار التحويل المحددة). دعونا نؤكد على حقيقة مهمة جدًا، رغم أنها واضحة تمامًا: اختيار وحدات القياس يعتمد على الباحث، أي. شخصي. يمكن أن تكون الاستنتاجات الإحصائية ملائمة للواقع فقط عندما لا تعتمد على وحدة القياس التي يفضلها الباحث، وعندما تكون ثابتة فيما يتعلق بالتحويل المسموح به للمقياس. من بين العديد من الخوارزميات المستخدمة في تحليل البيانات الاقتصادية القياسية، هناك عدد قليل منها فقط يحقق هذا الشرط. دعونا نظهر ذلك من خلال مقارنة القيم المتوسطة.

دع X 1، X 2،..، X n تكون عينة من الحجم n. وكثيرا ما يستخدم الوسط الحسابي. إن استخدام المتوسط ​​الحسابي شائع جدًا لدرجة أنه غالبًا ما يتم حذف الكلمة الثانية في المصطلح ويتحدث الناس عن متوسط ​​الراتب ومتوسط ​​الدخل ومتوسطات أخرى لبيانات اقتصادية محددة، ويقصدون بـ "المتوسط" المتوسط ​​الحسابي. هذا التقليد يمكن أن يؤدي إلى استنتاجات خاطئة. لنعرض ذلك باستخدام مثال حساب متوسط ​​الراتب (متوسط ​​الدخل) لموظفي مؤسسة افتراضية. ومن بين 100 عامل، هناك 5 فقط لديهم راتب يتجاوز ذلك، وراتب الـ95 الباقين أقل بكثير من المتوسط ​​الحسابي. والسبب واضح - راتب شخص واحد - المدير العام - يفوق راتب 95 عاملاً - من العمال ذوي المهارات المنخفضة والعالية والمهندسين وموظفي المكاتب. ويذكرنا الوضع بما ورد في قصة معروفة عن مستشفى فيه 10 مرضى، 9 منهم درجة حرارتهم 40 درجة مئوية، وواحد يعاني بالفعل، يرقد في المشرحة ودرجة حرارته 0 درجة مئوية. ج. وفي الوقت نفسه، يبلغ متوسط ​​درجة الحرارة في المستشفى 36 درجة مئوية - وهو أمر لا يمكن أن يكون أفضل!

وبالتالي، لا يمكن استخدام المتوسط ​​الحسابي إلا لمجموعات سكانية متجانسة إلى حد ما (بدون قيم متطرفة كبيرة في اتجاه أو آخر). ما هي المتوسطات التي ينبغي استخدامها لوصف الأجور؟ من الطبيعي تمامًا استخدام الوسيط - المتوسط ​​الحسابي للموظفين الخمسين والحادي والخمسين إذا تم ترتيب رواتبهم بترتيب غير تنازلي. تأتي أولاً رواتب 40 عاملاً من ذوي المهارات المتدنية، ثم - من العامل الحادي والأربعين إلى العامل السبعين - رواتب العمال ذوي المهارات العالية. وبالتالي فإن الوسيط يقع عليهم تحديداً ويساوي 200. ولـ 50 عاملاً لا يتجاوز الراتب 200، ولـ 50 - على الأقل 200، فيظهر الوسيط "المركز" الذي يدور حوله الجزء الأكبر من القيم المدروسة ​يتم تجميعها. القيمة المتوسطة الأخرى هي الوضع، وهي القيمة الأكثر تكرارًا. في الحالة قيد النظر، هذه هي أجور العمال ذوي المهارات المنخفضة، أي. 100. وبالتالي، لوصف الراتب لدينا ثلاث قيم متوسطة - الوضع (100 وحدة)، والوسيط (200 وحدة) والوسط الحسابي (400 وحدة).

وبالنسبة لتوزيعات الدخل والأجور التي يتم ملاحظتها في الحياة الواقعية، فإن نفس النمط صحيح: المنوال أقل من الوسيط، والوسيط أقل من المتوسط ​​الحسابي.

لماذا يتم استخدام المتوسطات في الاقتصاد؟ عادةً ما يتم استبدال مجموعة من الأرقام برقم واحد لمقارنة السكان باستخدام المتوسطات. لنفترض، على سبيل المثال، Y 1، Y 2،...، Y n أن تكون مجموعة من تقييمات الخبراء "المعطاة" لموضوع واحد من الخبرة (على سبيل المثال، أحد خيارات التطوير الاستراتيجي لشركة ما)، Z 1 ، Z 2،...، Z n -الثاني (نسخة أخرى من هذا التطوير). كيف يمكن مقارنة هذه المجموعات السكانية؟ من الواضح أن أسهل طريقة هي القيم المتوسطة.

كيفية حساب المتوسطات؟ هناك أنواع مختلفة من المتوسطات: المتوسط ​​الحسابي، الوسيط، المنوال، المتوسط ​​الهندسي، المتوسط ​​التوافقي، المتوسط ​​التربيعي. أذكر أن المفهوم العام للقيمة المتوسطة قدمه عالم رياضيات فرنسي في النصف الأول من القرن التاسع عشر. الأكاديمي O. كوشي. وهي كما يلي: القيمة المتوسطة هي أي دالة Ф(Х 1, Х 2,..., Х n) بحيث لا تقل قيمة هذه الدالة لجميع القيم الممكنة للوسائط عن الحد الأدنى لـ الأرقام X 1, Х 2,... , X n ولا يزيد عن الحد الأقصى لهذه الأرقام. جميع أنواع المتوسطات المذكورة أعلاه هي متوسطات كوشي.

ومع تحول مقياس مقبول، تتغير قيمة المتوسط ​​بشكل واضح. لكن الاستنتاجات حول أي مجموعة سكانية يكون المتوسط ​​أكبر وأيها أقل لا ينبغي أن تتغير (وفقًا لمتطلبات ثبات الاستنتاجات، المقبولة كشرط رئيسي في TI). دعونا نقوم بصياغة المشكلة الرياضية المقابلة للبحث عن نوع القيم المتوسطة، والتي تكون نتيجة مقارنتها مستقرة فيما يتعلق بتحويلات المقياس المسموح بها.

دع Ф(Х 1 Х 2 ,..., Х n) يكون متوسط ​​كوشي. دع المتوسط ​​​​للسكان الأول يكون أقل من المتوسط ​​​​للسكان الثاني: إذن، وفقًا لـ TI، من أجل استقرار نتيجة مقارنة المتوسطات، من الضروري لأي تحويل مقبول g من مجموعة التحولات المقبولة في المقياس المقابل صحيح أن متوسط ​​القيم المحولة من المجموعة الأولى أقل أيضًا من متوسط ​​القيم المحولة للمجموعة الثانية. علاوة على ذلك، يجب أن يكون الشرط المصاغ صحيحًا لأي مجموعتين Y 1، Y 2،...،Y n وZ 1، Z 2،...، Z n، وتذكر أي تحويل مقبول. نحن نسمي القيم المتوسطة التي تستوفي الشرط المصاغ مقبولة (في المقياس المناسب). ووفقا لمنظمة الشفافية الدولية، يمكن استخدام هذه المتوسطات فقط عند تحليل آراء الخبراء والبيانات الأخرى المقاسة على المقياس قيد النظر.

باستخدام النظرية الرياضية التي تم تطويرها في السبعينيات، من الممكن وصف نوع المتوسطات المقبولة على المقاييس الأساسية. من الواضح أنه بالنسبة للبيانات المقاسة على مقياس الأسماء، فإن الوضع الوحيد هو المناسب كمتوسط.

18. القيم المتوسطة على المقياس الترتيبي

دعونا نفكر في معالجة آراء الخبراء المقاسة على مقياس ترتيبي. البيان التالي هو الصحيح.

نظرية1 . من بين جميع متوسطات كوشي، فإن أعضاء سلسلة التباين (الإحصائيات الترتيبية) هم فقط المتوسطات المقبولة على المقياس الترتيبي.

النظرية 1 صالحة بشرط أن يكون المتوسط ​​Ф(Х 1 Х 2 ,..., Х n) دالة مستمرة (على مجموعة المتغيرات) ومتماثلة. ويعني الأخير أنه عند إعادة ترتيب الوسائط، فإن قيمة الدالة Ф(Х 1 Х 2 ,..., Х n) لا تتغير. هذا الشرط طبيعي تمامًا، لأننا نجد القيمة المتوسطة للمجموع (المجموعة)، وليس للتسلسل. لا تتغير المجموعة حسب الترتيب الذي ندرج به عناصرها.

وفقا للنظرية 1، على وجه الخصوص، يمكن استخدام الوسيط كمتوسط ​​للبيانات المقاسة على مقياس ترتيبي (إذا كان حجم العينة فرديا). إذا كان الحجم زوجيًا، فيجب استخدام أحد الحدين المركزيين لسلسلة التباين - كما يطلق عليهم أحيانًا، الوسيط الأيسر أو الوسيط الأيمن. يمكن أيضًا استخدام الموضة - فهي دائمًا عضو في سلسلة الاختلافات. لكن لا يمكنك أبدًا حساب المتوسط ​​الحسابي أو المتوسط ​​الهندسي وما إلى ذلك.

النظرية التالية صحيحة.

النظرية 2. دع Y 1، Y 2،...،Y m تكون متغيرات عشوائية مستقلة وموزعة بشكل متماثل مع دالة التوزيع F(x)، وZ 1، Z 2،...، Zn تكون متغيرات عشوائية مستقلة وموزعة بشكل متماثل مع توزيعات الدالة H(x)، والعينات Y 1، Y 2،...،Y m وZ 1، Z 2،...، Z n مستقلة عن بعضها البعض وMY X > MZ X. لكي يميل احتمال وقوع حدث إلى 1 عند min(m, n) لأي دالة مستمرة متزايدة بشكل صارم g تحقق الشرط |g i |>X من الضروري والكافي أن يتم استيفاء المتباينة F(x) للجميع س< Н(х), причем существовало число х 0 , для которого F(x 0)

ملحوظة.الشرط مع الحد الأعلى هو بحتة داخل الرياضيات في الطبيعة. في الواقع، الدالة g هي تحويل تعسفي مقبول على مقياس ترتيبي.

وفقًا للنظرية 2، يمكن أيضًا استخدام الوسط الحسابي في مقياس ترتيبي إذا تمت مقارنة عينات من توزيعين يحققان عدم المساواة الواردة في النظرية. ببساطة، يجب أن تقع إحدى وظائف التوزيع دائمًا فوق الأخرى. لا يمكن لوظائف التوزيع أن تتقاطع، يُسمح لها فقط بلمس بعضها البعض. يتم استيفاء هذا الشرط، على سبيل المثال، إذا اختلفت وظائف التوزيع في الوردية فقط:

و(س) = ه(س + ∆)

بالنسبة للبعض ∆.

ويتحقق الشرط الأخير إذا تم قياس قيمتين لكمية معينة باستخدام نفس أداة القياس، والتي لا يتغير فيها توزيع الأخطاء عند الانتقال من قياس قيمة واحدة للكمية المعنية إلى قياس أخرى.

المتوسط ​​حسب كولموغوروف

تعميم العديد من المتوسطات المذكورة أعلاه هو متوسط ​​كولموغوروف. بالنسبة للأرقام X 1، X 2،...، X n، يتم حساب متوسط ​​كولموجوروف باستخدام الصيغة

G((F(X ل) + F(X 2)+...F(X n))/n)،

حيث F هي دالة رتيبة تمامًا (أي زيادة أو نقصان صارم)،

G هي الدالة العكسية لـ F.

من بين متوسطات Kolmogorov هناك العديد من الشخصيات المعروفة. لذا، إذا كان F(x) = x، فإن متوسط ​​كولموجوروف هو الوسط الحسابي، وإذا كان F(x) = lnx، فإن المتوسط ​​الهندسي، إذا كان F(x) = 1/x، فإن المتوسط ​​التوافقي، إذا كان F( x) = x 2، ثم المربع المتوسط، وما إلى ذلك. يعد متوسط ​​كولموجوروف حالة خاصة من متوسط ​​كوشي. ومن ناحية أخرى، لا يمكن تمثيل المتوسطات الشائعة مثل الوسيط والمنوال على أنها متوسطات كولموجوروف. تم إثبات العبارات التالية في الدراسة.

نظرية3 . إذا كانت بعض شروط الانتظام داخل الرياضيات صالحة في مقياس الفاصل الزمني، فمن بين جميع وسائل كولموغوروف، يكون الوسط الحسابي فقط هو المقبول. وبالتالي، فإن المتوسط ​​الهندسي أو جذر متوسط ​​مربع درجات الحرارة (بالدرجة المئوية) أو المسافات لا معنى له. ويجب استخدام الوسط الحسابي كمتوسط. يمكنك أيضًا استخدام الوسيط أو الوضع.

النظرية 4. إذا كانت بعض شروط الانتظام داخل الرياضيات في مقياس النسب صالحة، فمن بين جميع متوسطات كولموغوروف، يُسمح فقط بمتوسطات القدرة مع F(x) = x c والمتوسط ​​الهندسي.

تعليق. الوسط الهندسي هو الحد الأقصى لوسائل القدرة لـ c > 0.

هل هناك متوسطات كولموجوروف لا يمكن استخدامها في مقياس النسب؟ بالطبع. على سبيل المثال F(x) = e x.

وعلى غرار القيم المتوسطة، يمكن دراسة الخصائص الإحصائية الأخرى - مؤشرات التشتت، والاتصال، والمسافة، وما إلى ذلك. ليس من الصعب أن نبين، على سبيل المثال، أن معامل الارتباط لا يتغير مع أي تحويل مقبول في وعاء الفترات، تماما مثل نسبة التشتيتات، فإن التشتت لا يتغير في مقياس الاختلافات، ومعامل الاختلاف في مقياس النسب ، إلخ.

تُستخدم النتائج المذكورة أعلاه حول القيم المتوسطة على نطاق واسع، ليس فقط في الاقتصاد أو الإدارة أو نظرية تقييمات الخبراء أو علم الاجتماع، ولكن أيضًا في الهندسة، على سبيل المثال، لتحليل طرق تجميع أجهزة الاستشعار في أنظمة التحكم الآلي في العمليات للأفران العالية. تتمتع TI بأهمية عملية كبيرة في مشاكل التقييس وإدارة الجودة، ولا سيما في قياس الجودة، حيث تم الحصول على نتائج نظرية مثيرة للاهتمام. لذلك، على سبيل المثال، أي تغيير في معاملات الوزن للمؤشرات الفردية لجودة المنتج يؤدي إلى تغيير في ترتيب المنتجات وفقا لمؤشر المتوسط ​​​​المرجح (تم إثبات هذه النظرية من قبل البروفيسور V. V. Podinovsky). وبالتالي، فإن المعلومات الموجزة المذكورة أعلاه حول تقنية المعلومات وأساليبها تجمع، إلى حد ما، بين علوم الاقتصاد وعلم الاجتماع والهندسة، وهي أداة مناسبة لحل المشكلات المعقدة التي لم تكن قابلة للتحليل الفعال في السابق، علاوة على ذلك، فالطريق مفتوح لبناء نماذج واقعية وحل مشكلة التنبؤ.

22. الانحدار الخطي المقترن

دعونا ننتقل الآن إلى دراسة أكثر تفصيلاً لأبسط حالة للانحدار الخطي الزوجي. يوصف الانحدار الخطي بأبسط علاقة وظيفية في شكل معادلة خط مستقيم ويتميز بتفسير شفاف لمعلمات النموذج (معاملات المعادلة). يتيح لنا الجانب الأيمن من المعادلة الحصول على القيم النظرية (المحسوبة) للمتغير الناتج (الموضح) بناءً على القيم المعطاة للارتداد (المتغير التوضيحي). وتسمى هذه القيم أحيانًا أيضًا بالقيمة المتوقعة (بنفس المعنى)، أي. تم الحصول عليها من الصيغ النظرية. ومع ذلك، عند طرح فرضية حول طبيعة الاعتماد، فإن معاملات المعادلة لا تزال مجهولة. بشكل عام، يمكن الحصول على قيم تقريبية لهذه المعاملات باستخدام طرق مختلفة.

لكن أهمها وأوسعها انتشارا هي طريقة المربعات الصغرى (OLS). وهو يعتمد (كما سبق شرحه) على متطلب تقليل مجموع الانحرافات التربيعية للقيم الفعلية للخاصية الناتجة عن القيم المحسوبة (النظرية). بدلًا من القيم النظرية (للحصول عليها)، استبدل الأطراف اليمنى لمعادلة الانحدار بمجموع مربعات الانحرافات، ثم أوجد المشتقات الجزئية لهذه الدالة (مجموع مربعات الانحرافات للقيم الفعلية) للخاصية الناتجة عن تلك النظرية). لا يتم أخذ هذه المشتقات الجزئية فيما يتعلق بالمتغيرين x وy، ولكن فيما يتعلق بالمعلمات a وb. يتم تعيين المشتقات الجزئية على الصفر، وبعد تحويلات بسيطة ولكنها مرهقة، يتم الحصول على نظام من المعادلات العادية لتحديد المعلمات. معامل المتغير x، أي. ب يسمى معامل الانحدار، وهو يوضح متوسط ​​التغير في النتيجة مع تغير العامل بمقدار وحدة واحدة. قد لا يكون للمعلمة تفسير اقتصادي، خاصة إذا كانت إشارة هذا المعامل سالبة.

يستخدم الانحدار الخطي الزوجي لدراسة وظيفة الاستهلاك. يتم استخدام معامل الانحدار في دالة الاستهلاك لحساب المضاعف. دائمًا ما يتم استكمال معادلة الانحدار بمؤشر على مدى قرب الاتصال. بالنسبة لأبسط حالة من الانحدار الخطي، فإن مؤشر قرب الاتصال هو معامل الارتباط الخطي. ولكن بما أن معامل الارتباط الخطي يميز قرب الارتباط بين الميزات في شكل خطي، فإن قرب القيمة المطلقة لمعامل الارتباط الخطي من الصفر لا يعد مؤشرًا على عدم وجود اتصال بين الميزات.

إنه مع اختيار مختلف لمواصفات النموذج، وبالتالي نوع الاعتماد، قد تكون العلاقة الفعلية قريبة جدًا من الوحدة. ولكن يتم تحديد جودة اختيار الدالة الخطية باستخدام مربع معامل الارتباط الخطي - معامل التحديد. وهو يميز نسبة تباين السمة الفعالة y الموضحة بالانحدار في التباين الإجمالي للسمة الفعالة. القيمة التي تكمل معامل التحديد إلى 1 تميز حصة التباين الناتجة عن تأثير العوامل الأخرى التي لم تؤخذ في الاعتبار في النموذج (التباين المتبقي).

يتم تمثيل الانحدار المزدوج بمعادلة تربط بين متغيرين y وx بالشكل التالي:

حيث y هو المتغير التابع (السمة الناتجة)، وx هو المتغير المستقل (متغير توضيحي، أو عامل السمة). هناك الانحدار الخطي والانحدار غير الخطي. يوصف الانحدار الخطي بمعادلة بالشكل:

ص = أ+ بx + .

يمكن أن يكون الانحدار غير الخطي بدوره غير خطي فيما يتعلق بالمتغيرات التوضيحية المضمنة في التحليل، ولكنه خطي فيما يتعلق بالمعلمات المقدرة. أو ربما يكون الانحدار غير خطي من حيث المعلمات التي يتم تقديرها. تتضمن أمثلة الانحدار غير الخطي في المتغيرات التوضيحية، ولكنه خطي في المعلمات المقدرة، تبعيات متعددة الحدود بدرجات مختلفة (متعددة الحدود) والقطع الزائد متساوي الأضلاع.

الانحدار غير الخطي للمعلمات المقدرة هو اعتماد على القوة بالنسبة للمعلمة (المعلمة في الأس)، والاعتماد الأسي، حيث تكون المعلمة عند قاعدة الأس، والاعتماد الأسي، عندما يكون الاعتماد الخطي بالكامل بالكامل في الأس. لاحظ أنه في جميع هذه الحالات الثلاث، يتم تضمين المكون العشوائي (الباقي العشوائي)  في الجانب الأيمن من المعادلة كعامل، وليس كجمع، أي. بشكل مضاعف! يتميز متوسط ​​انحراف القيم المحسوبة للخاصية الناتجة عن القيم الفعلية بمتوسط ​​خطأ التقريب. يتم التعبير عنها كنسبة مئوية ويجب ألا تتجاوز 7-8٪. إن متوسط ​​خطأ التقريب هذا هو ببساطة النسبة المئوية للمتوسط ​​النسبي للاختلافات بين القيم الفعلية والمحسوبة.

إن متوسط ​​معامل المرونة، الذي يعد بمثابة خاصية مهمة للعديد من الظواهر والعمليات الاقتصادية، مهم. يتم حسابه على أنه حاصل ضرب قيمة مشتق علاقة وظيفية معينة ونسبة متوسط ​​قيمة x إلى متوسط ​​قيمة y. يوضح معامل المرونة النسبة المئوية في المتوسط ​​التي ستتغير فيها النتيجة y من متوسط ​​قيمتها عندما يتغير العامل x بنسبة 1% من متوسط ​​قيمته (العامل x).

ترتبط مشاكل تحليل التباين ارتباطًا وثيقًا بالانحدار الزوجي والانحدار المتعدد (عندما يكون هناك العديد من العوامل) والتباين المتبقي. تحليل التباين يفحص تباين المتغير التابع. في هذه الحالة، يتم تقسيم المبلغ الإجمالي للانحرافات التربيعية إلى قسمين. المصطلح الأول هو مجموع الانحرافات التربيعية بسبب الانحدار، أو الموضح (المضروب). المصطلح الثاني هو المجموع المتبقي للانحرافات التربيعية غير المفسرة بانحدار العامل.

تتميز حصة التباين المفسرة بالانحدار في التباين الكلي للخاصية الناتجة y بمعامل (مؤشر) التحديد، وهو ليس أكثر من نسبة مجموع الانحرافات المربعة بسبب الانحدار إلى مجموع الانحرافات المربعة (الفصل الأول للمجموع بأكمله).

عندما يتم تحديد معلمات النموذج (معاملات المجهولين) باستخدام طريقة المربعات الصغرى، فإنه في الأساس يتم العثور على بعض المتغيرات العشوائية (في عملية الحصول على التقديرات). من الأهمية بمكان تقدير معامل الانحدار، وهو شكل خاص من أشكال المتغير العشوائي. وتعتمد خصائص هذا المتغير العشوائي على خصائص الحد المتبقي في المعادلة (في النموذج). بالنسبة لنموذج الانحدار الخطي المقترن، اعتبر المتغير التوضيحي x كمتغير خارجي غير عشوائي. هذا يعني فقط أن قيم المتغير x في جميع الملاحظات يمكن اعتبارها محددة سلفا ولا علاقة لها بأي حال من الأحوال بالتبعية قيد الدراسة. وبالتالي فإن القيمة الفعلية للمتغير الموضح تتكون من مكونين: مكون غير عشوائي ومكون عشوائي (الحد المتبقي).

ومن ناحية أخرى، فإن معامل الانحدار المحدد باستخدام طريقة المربعات الصغرى (OLS) يساوي حاصل قسمة تباين المتغيرين x و y على تباين المتغير x. لذلك فهو يحتوي أيضًا على مكون عشوائي. بعد كل شيء، يعتمد التغاير على قيم المتغير y، حيث تعتمد قيم المتغير y على قيم الحد المتبقي العشوائي . علاوة على ذلك، من السهل إظهار أن تباين المتغيرين x و y يساوي حاصل ضرب معامل الانحدار المقدر بيتا () وتباين المتغير x، بالإضافة إلى تباين المتغيرين x و . وبالتالي فإن تقدير معامل الانحدار بيتا يساوي معامل الانحدار المجهول نفسه مضافاً إلى حاصل قسمة تباين المتغيرين x و  على تباين المتغير x. أولئك. يتم تقديم تقدير معامل الانحدار b الذي تم الحصول عليه من أي عينة كمجموع حدين: قيمة ثابتة تساوي القيمة الحقيقية للمعامل  (بيتا)، ومكون عشوائي يعتمد على تباين المتغيرات x و  .

23. شروط جاوس ماركوف الرياضية وتطبيقاتها.

لكي يؤدي تحليل الانحدار المستند إلى OLS العادي إلى أفضل النتائج، يجب أن يفي المصطلح العشوائي بشروط Gauss-Markov الأربعة.

التوقع الرياضي للمصطلح العشوائي يساوي صفر، أي. إنها غير متحيزة. إذا كانت معادلة الانحدار تتضمن حدًا ثابتًا، فمن الطبيعي اعتبار هذا الشرط متحققًا، حيث أن هذا حد ثابت ويجب أن يأخذ في الاعتبار أي اتجاه منهجي في قيم المتغير y، والذي، على العكس من ذلك، يجب أن عدم احتوائها على المتغيرات التفسيرية لمعادلة الانحدار.

تباين المصطلح العشوائي ثابت لجميع الملاحظات.

يجب أن يكون التباين في قيم المتغيرات العشوائية المكونة للعينة مساوياً للصفر، أي. لا توجد علاقة منهجية بين قيم المدى العشوائي في أي ملاحظتين محددتين. يجب أن يكون الأعضاء العشوائيون مستقلين عن بعضهم البعض.

يجب أن يكون قانون التوزيع للمصطلح العشوائي مستقلاً عن المتغيرات التوضيحية.

علاوة على ذلك، في العديد من التطبيقات، لا تكون المتغيرات التفسيرية عشوائية، أي. لم يكن لديك عنصر عشوائي. يجب اعتبار قيمة أي متغير مستقل في كل ملاحظة خارجية، ويتم تحديدها بالكامل بواسطة أسباب خارجية لا تؤخذ في الاعتبار في معادلة الانحدار.

جنبًا إلى جنب مع شروط غاوس-ماركوف المحددة، يُفترض أيضًا أن المصطلح العشوائي له توزيع طبيعي. إنها صالحة في ظل ظروف واسعة جدًا وتعتمد على ما يسمى بنظرية الحد المركزي (CLT). جوهر هذه النظرية هو أنه إذا كان المتغير العشوائي هو النتيجة الإجمالية لتفاعل عدد كبير من المتغيرات العشوائية الأخرى، وليس لأي منها تأثير سائد على سلوك هذه النتيجة الإجمالية، فسيتم وصف المتغير العشوائي الناتج بالتوزيع الطبيعي تقريباً. هذا القرب من التوزيع الطبيعي يجعل من الممكن استخدام التوزيع الطبيعي وتوزيع الطلاب، وهو إلى حد ما تعميم له، للحصول على تقديرات، والتي تختلف بشكل ملحوظ عن التقدير الطبيعي بشكل رئيسي فيما يسمى "الذيول، " أي. لأحجام العينات الصغيرة. ومن المهم أيضًا أنه إذا تم توزيع الحد العشوائي بشكل طبيعي، فسيتم أيضًا توزيع معاملات الانحدار بشكل طبيعي.

يسمح لنا منحنى الانحدار المحدد (معادلة الانحدار) بحل مشكلة ما يسمى بالتنبؤ بالنقطة. في مثل هذه الحسابات، يتم أخذ قيمة معينة لـ x خارج فترة المراقبة المدروسة واستبدالها في الجانب الأيمن من معادلة الانحدار (إجراء الاستقراء). لأن تقديرات معاملات الانحدار معروفة بالفعل، فمن الممكن حساب قيمة المتغير الموضح y الموافق للقيمة المأخوذة لـ x. بطبيعة الحال، وفقا لمعنى التنبؤ (التنبؤ)، يتم إجراء الحسابات إلى الأمام (في منطقة القيم المستقبلية).

ومع ذلك، بما أن المعاملات تم تحديدها بخطأ معين، فإن ما يهم ليس تقدير النقطة (تنبؤ النقطة) للسمة الناتجة، ولكن معرفة الحدود التي ضمنها، مع احتمال معين، قيم سوف تكمن السمة الناتجة المقابلة للقيمة المأخوذة للعامل x.

للقيام بذلك، يتم حساب الخطأ المعياري (الانحراف المعياري). ويمكن الحصول عليها بروح ما قيل للتو على النحو التالي. يتم استبدال التعبير عن الحد الحر a من التقديرات من خلال القيم المتوسطة في معادلة الانحدار الخطي. ثم يتبين أن الخطأ المعياري يعتمد على خطأ متوسط ​​العامل الفعال y ويضاف إليه خطأ معامل الانحدار b. ببساطة، مربع هذا الخطأ المعياري يساوي مجموع مربع الخطأ لمتوسط ​​القيمة y وحاصل ضرب مربع الخطأ لمعامل الانحدار في مربع انحراف العامل x ووسطه. علاوة على ذلك، فإن الحد الأول، وفقا لقوانين الإحصاء، يساوي حاصل قسمة تباين عموم السكان على حجم (حجم) العينة.

بدلاً من التباين غير المعروف، يتم استخدام تباين العينة كتقدير. وبناء على ذلك، يتم تعريف خطأ معامل الانحدار على أنه حاصل قسمة تباين العينة على تباين العامل x. يمكنك الحصول على الخطأ المعياري (الانحراف المعياري) والاعتبارات الأخرى الأكثر استقلالية عن نموذج الانحدار الخطي. وللقيام بذلك يتم استخدام مفهوم الخطأ المتوسط ​​والخطأ الحدي والعلاقة بينهما.

ولكن حتى بعد الحصول على الخطأ المعياري، يبقى السؤال حول الحدود التي ستقع ضمنها القيمة المتوقعة. بمعنى آخر، فيما يتعلق بالفاصل الزمني لخطأ القياس، في الافتراض الطبيعي في كثير من الحالات أن منتصف هذا الفاصل الزمني يُعطى بالقيمة المحسوبة (المتوسطة) للعامل الفعال y. هنا تأتي نظرية الحد المركزي للإنقاذ، والتي تشير بدقة إلى احتمال وجود الكمية غير المعروفة ضمن فترة الثقة هذه.

في الأساس، صيغة الخطأ القياسية، بغض النظر عن كيفية وبأي شكل يتم الحصول عليها، تميز الخطأ في موضع خط الانحدار. يصل الخطأ المعياري إلى الحد الأدنى عندما تتطابق قيمة العامل x مع القيمة المتوسطة للعامل.

24. الاختبار الإحصائي للفرضيات وتقييم أهمية الانحدار الخطي باستخدام معيار فيشر.

بعد العثور على معادلة الانحدار الخطي، يتم تقييم أهمية المعادلة ككل ومعلماتها الفردية. يمكن تقييم أهمية معادلة الانحدار ككل باستخدام معايير مختلفة. من الشائع والفعال استخدام اختبار فيشر F. وفي هذه الحالة يتم طرح الفرضية الصفرية بأن معامل الانحدار يساوي الصفر، أي. b=0، وبالتالي فإن العامل x ليس له أي تأثير على النتيجة y. يسبق الحساب الفوري لاختبار F تحليل التباين. يحتل المكان المركزي فيه تحليل المجموع الإجمالي للانحرافات التربيعية للمتغير y من القيمة المتوسطة y إلى جزأين - "موضح" و "غير مفسر":

إن المجموع الإجمالي للانحرافات التربيعية للقيم الفردية للخاصية الناتجة y من القيمة المتوسطة y ناتج عن تأثير العديد من العوامل.

دعونا نقسم مجموعة الأسباب بأكملها بشكل مشروط إلى مجموعتين: العامل المدروس x وعوامل أخرى. إذا لم يؤثر العامل على النتيجة، فإن خط الانحدار على الرسم البياني يكون موازيًا لمحور OX وy=y. ثم يكون التباين الكامل للخاصية الناتجة ناتجًا عن تأثير عوامل أخرى وسيتزامن المجموع الإجمالي للانحرافات المربعة مع المتبقي. إذا لم تؤثر العوامل الأخرى على النتيجة، فإن y ترتبط وظيفيًا بـ x ويكون مجموع المربعات المتبقية صفرًا. في هذه الحالة، يكون مجموع الانحرافات المربعة التي يفسرها الانحدار هو نفس مجموع المربعات الإجمالية. وبما أنه لا تقع جميع نقاط مجال الارتباط على خط الانحدار، فإن تشتتها يحدث دائمًا بسبب تأثير العامل x، أي. انحدار y على x، والناجم عن أسباب أخرى (تباين غير مفسر). تعتمد مدى ملاءمة خط الانحدار للتنبؤ على مقدار التباين الإجمالي في السمة y الذي يتم حسابه من خلال التباين الموضح.

من الواضح أنه إذا كان مجموع الانحرافات المربعة بسبب الانحدار أكبر من مجموع المربعات المتبقية، فإن معادلة الانحدار تكون ذات دلالة إحصائية ويكون للعامل x تأثير كبير على النتيجة. وهذا يعادل أن معامل التحديد سيقترب من الوحدة. ويرتبط أي مجموع من الانحرافات المربعة بعدد درجات الحرية، أي. عدد حرية الاختلاف المستقل للخاصية. يرتبط عدد درجات الحرية بعدد وحدات السكان أو بعدد الثوابت المحددة منها. فيما يتعلق بالمشكلة قيد الدراسة، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة المطلوبة من n الممكنة [(y 1 -y), (y 2 -y),...(y n -y)] لتكوين مجموع معين من المربعات. وبالتالي، بالنسبة لمجموع المربعات ∑(y-y sr) 2، (n-1) تكون الانحرافات المستقلة مطلوبة، لأن في مجتمع مكون من وحدات n، بعد حساب المستوى المتوسط، يختلف عدد الانحرافات بحرية (n-1) فقط. عند حساب المجموع الموضح أو العامل للمربعات ∑(y-y avg) 2، يتم استخدام القيم النظرية (المحسوبة) للخاصية الناتجة y*، الموجودة على طول خط الانحدار: y(x)=a+bx.

لنعد الآن إلى توسيع المجموع الإجمالي للانحرافات التربيعية للعامل الفعال عن متوسط ​​هذه القيمة. يحتوي هذا المجموع على جزأين تم تعريفهما بالفعل أعلاه: مجموع الانحرافات المربعة الموضحة بالانحدار ومجموع آخر يسمى المجموع المتبقي للانحرافات المربعة. يرتبط هذا التحليل بتحليل التباين، والذي يجيب بشكل مباشر على السؤال الأساسي: كيفية تقييم أهمية معادلة الانحدار ككل ومعلماتها الفردية؟ كما أنه يحدد إلى حد كبير معنى هذا السؤال. ولتقييم أهمية معادلة الانحدار ككل، يتم استخدام معيار فيشر (اختبار F). وفقا للنهج الذي اقترحه فيشر، تم طرح فرضية العدم: معامل الانحدار يساوي الصفر، أي. القيمة ب=0. وهذا يعني أن العامل X ليس له أي تأثير على النتيجة Y.

دعونا نتذكر أن النقاط التي تم الحصول عليها نتيجة لدراسة إحصائية لا تقع دائمًا على خط الانحدار تمامًا. إنهم متناثرون، وهم بعيدون أكثر أو أقل عن خط الانحدار. ويعود هذا التشتت إلى تأثير عوامل أخرى تختلف عن العامل التفسيري X والتي لا تؤخذ بعين الاعتبار في معادلة الانحدار. عند حساب المجموع الموضح أو العاملي للانحرافات المربعة، يتم استخدام القيم النظرية للخاصية الناتجة الموجودة من خط الانحدار.

بالنسبة لمجموعة معينة من قيم المتغيرات Y وX، فإن القيمة المحسوبة للقيمة المتوسطة Y تكون في الانحدار الخطي دالة لمعلمة واحدة فقط - معامل الانحدار. وفقًا لهذا، فإن مجموع معامل الانحرافات المربعة له عدد من درجات الحرية يساوي 1. وعدد درجات الحرية للمجموع المتبقي من الانحرافات المربعة في الانحدار الخطي هو n-2.

وبالتالي، بتقسيم كل مجموع من الانحرافات المربعة في التوسع الأصلي على عدد درجات الحرية الخاصة به، نحصل على متوسط ​​الانحرافات المربعة (التباين لكل درجة حرية واحدة). بعد ذلك، بقسمة تباين العامل على درجة واحدة من الحرية على التباين المتبقي على درجة واحدة من الحرية، نحصل على معيار لاختبار الفرضية الصفرية، أو ما يسمى بنسبة F، أو المعيار الذي يحمل نفس الاسم. على وجه التحديد، إذا كانت الفرضية الصفرية صحيحة، فإن العامل والتباينات المتبقية متساوية ببساطة مع بعضها البعض.

لرفض الفرضية الصفرية، أي. قبول الفرضية المعاكسة، والتي تعبر عن حقيقة أهمية (وجود) العلاقة محل الدراسة، وليس مجرد صدفة عشوائية لعوامل تحاكي علاقة غير موجودة في الواقع، فلا بد من استخدام جداول القيم الحرجة للعلاقة محل الدراسة. العلاقة المحددة. باستخدام الجداول، يتم تحديد القيمة الحرجة (العتبة) لمعيار فيشر. ويسمى أيضًا نظريًا. ثم يقومون بالتحقق، من خلال مقارنتها بالقيمة التجريبية (الفعلية) المقابلة للمعيار المحسوبة من البيانات الرصدية، مما إذا كانت القيمة الفعلية للنسبة تتجاوز القيمة الحرجة من الجداول.

ويتم ذلك بمزيد من التفصيل مثل هذا. حدد مستوى معينًا من احتمالية وجود فرضية العدم وابحث من الجداول عن القيمة الحرجة للمعيار F، حيث لا يزال من الممكن حدوث تباعد عشوائي للتباينات بمقدار درجة واحدة من الحرية، أي. الحد الأقصى لهذه القيمة. ثم تعتبر القيمة المحسوبة لنسبة F موثوقة (أي تعبر عن الفرق بين التباينات الفعلية والمتبقية) إذا كانت هذه النسبة أكبر من النسبة المجدولة. ومن ثم يتم رفض الفرضية الصفرية (ليس صحيحا أنه لا توجد علامات على وجود اتصال)، وعلى العكس من ذلك، نصل إلى نتيجة مفادها أن هناك اتصال وهو مهم (هو غير عشوائي، مهم).

إذا تبين أن قيمة العلاقة أقل من المجدولة، فإن احتمال الفرضية الصفرية أعلى من المستوى المحدد (الذي تم اختياره في البداية) ولا يمكن رفض الفرضية الصفرية دون وجود خطر ملحوظ الحصول على نتيجة غير صحيحة حول وجود العلاقة. وبناء على ذلك، تعتبر معادلة الانحدار غير ذات أهمية.

ترتبط قيمة المعيار F نفسه بمعامل التحديد. بالإضافة إلى تقييم أهمية معادلة الانحدار ككل، يتم أيضًا تقييم أهمية المعلمات الفردية لمعادلة الانحدار. وفي هذه الحالة يتم تحديد الخطأ المعياري لمعامل الانحدار باستخدام الانحراف المعياري الفعلي التجريبي والتباين التجريبي لكل درجة حرية. يتم بعد ذلك استخدام توزيع الطالب لاختبار أهمية معامل الانحدار لحساب فترات الثقة الخاصة به.

يتم تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب من خلال مقارنة قيم هذه الكميات والخطأ المعياري. يتم تحديد حجم خطأ معلمات الانحدار الخطي ومعامل الارتباط بواسطة الصيغ التالية:

حيث S هو جذر متوسط ​​مربع انحراف العينة المتبقية،

ص ص – معامل الارتباط.

وبناء على ذلك، فإن قيمة الخطأ المعياري الذي تنبأ به خط الانحدار تعطى بالصيغة:

تشكل النسب المقابلة لقيم معاملات الانحدار والارتباط إلى خطأها المعياري ما يسمى بإحصائيات t، كما أن مقارنة القيمة المجدولة (الحرجة) المقابلة وقيمتها الفعلية تسمح بقبول أو رفض العدم فرضية. ولكن بعد ذلك، لحساب فاصل الثقة، يتم العثور على الحد الأقصى للخطأ لكل مؤشر باعتباره حاصل ضرب القيمة الجدولية لإحصاء t في متوسط ​​الخطأ العشوائي للمؤشر المقابل. في الواقع، لقد كتبنا ذلك بشكل مختلف قليلاً أعلاه. ثم يتم الحصول على حدود فترات الثقة: الحد الأدنى يكون بطرح الخطأ الهامشي المقابل من المعاملات المقابلة (في الواقع المتوسط)، والحد الأعلى يكون عن طريق الجمع (الإضافة).

في الانحدار الخطي ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2. من السهل التحقق من ذلك بالرجوع إلى صيغة معامل الارتباط الخطي: r 2 xy = b 2 *σ 2 x /σ 2 y

حيث σ 2 y هو التباين الكلي للسمة y؛

σ 2 x - تشتت الخاصية y بسبب العامل x. وبناء على ذلك، فإن مجموع الانحرافات التربيعية بسبب الانحدار الخطي سيكون:

∑(y x -y متوسط) 2 =b 2 ∑(x-x متوسط) 2 .

نظرًا لأنه بالنسبة لحجم معين من الملاحظات في x وy، فإن مجموع عوامل المربعات في الانحدار الخطي يعتمد على ثابت واحد فقط من معامل الانحدار b، فإن مجموع المربعات هذا يتمتع بدرجة واحدة من الحرية. دعونا ننظر في جانب المحتوى للقيمة المحسوبة للسمة y أي. ذ س. يتم تحديد القيمة y x بواسطة معادلة الانحدار الخطي: y x ​​= a + bx.

يمكن تعريف المعلمة a على أنها a=y-bx. باستبدال تعبير المعلمة a في النموذج الخطي، نحصل على: y x ​​​​=y-bx+bx avg =y-b(x-x avg).

بالنسبة لمجموعة معينة من المتغيرات y وx، فإن القيمة المحسوبة لـ y x في الانحدار الخطي هي دالة لمعلمة واحدة فقط - معامل الانحدار. وبناء على ذلك، فإن مجموع عوامل الانحرافات التربيعية له عدد من درجات الحرية يساوي 1.

هناك مساواة بين عدد درجات الحرية للمجموع والعامل والمجاميع المتبقية للمربعات. عدد درجات الحرية لمجموع المربعات المتبقية في الانحدار الخطي هو (n-2). يتم تحديد عدد درجات الحرية للمجموع الإجمالي للمربعات من خلال عدد الآحاد، وبما أننا نستخدم المتوسط ​​المحسوب من بيانات العينة، فإننا نفقد درجة واحدة من الحرية، أي. (ن-1). إذن، لدينا مساويان: بالنسبة للمبالغ وعدد درجات الحرية. وهذا بدوره يعيدنا إلى التباينات القابلة للمقارنة لكل درجة من الحرية، والتي تعطي نسبتها معيار فيشر.

25. تقييم أهمية المعلمات الفردية لمعادلة الانحدار والمعاملات باستخدام اختبار الطالب.

27. الانحدار الخطي وغير الخطي وطرق دراستهما.

لن يكون الانحدار الخطي وطرق بحثه وتقييمه مهمًا جدًا إذا، بالإضافة إلى هذه الحالة المهمة جدًا، ولكنها لا تزال أبسط حالة، لم نحصل بمساعدتهم على أداة لتحليل التبعيات غير الخطية الأكثر تعقيدًا. يمكن تقسيم الانحدارات غير الخطية إلى فئتين مختلفتين بشكل كبير. الأول والأبسط هو فئة التبعيات غير الخطية التي يوجد فيها عدم خطية فيما يتعلق بالمتغيرات التوضيحية، ولكنها تظل خطية في المعلمات المضمنة فيها وتخضع للتقييم. يتضمن ذلك كثيرات الحدود بدرجات مختلفة والقطع الزائد متساوي الأضلاع.

مثل هذا الانحدار غير الخطي للمتغيرات المضمنة في الشرح عن طريق تحويل (استبدال) المتغيرات يمكن بسهولة اختزاله إلى الانحدار الخطي العادي للمتغيرات الجديدة. ولذلك، يتم تنفيذ تقدير المعلمات في هذه الحالة ببساطة عن طريق المربعات الصغرى، لأن التبعيات خطية في المعلمات. وبالتالي، يلعب الاعتماد غير الخطي دورًا مهمًا في الاقتصاد، والذي وصفه القطع الزائد متساوي الأضلاع:

يتم تقييم معالمها بشكل جيد باستخدام طريقة المربعات الصغرى، وهذا الاعتماد نفسه يميز العلاقة بين التكاليف المحددة للمواد الخام والوقود والمواد وحجم الإنتاج ووقت تداول البضائع وكل هذه العوامل مع حجم التجارة دوران. على سبيل المثال، يصف منحنى فيليبس العلاقة غير الخطية بين معدل البطالة ونسبة نمو الأجور.

يختلف الوضع تمامًا مع الانحدار غير الخطي في المعلمات التي يتم تقديرها، على سبيل المثال، ممثلة بوظيفة قوة، حيث تكون الدرجة نفسها (أسها) معلمة، أو تعتمد على المعلمة. يمكن أن تكون أيضًا دالة أسية، حيث يكون أساس الدرجة عبارة عن معلمة ووظيفة أسية، حيث يحتوي المؤشر مرة أخرى على معلمة أو مجموعة من المعلمات. وتنقسم هذه الفئة بدورها إلى فئتين فرعيتين: إحداهما تشتمل على خط غير خطي خارجيًا، ولكنها في الأساس خطية داخليًا. في هذه الحالة، يمكنك تحويل النموذج إلى شكل خطي باستخدام التحويلات. ومع ذلك، إذا كان النموذج غير خطي داخليًا، فلا يمكن اختزاله إلى دالة خطية.

وبالتالي، فإن النماذج التي تعتبر غير خطية بشكل جوهري في تحليل الانحدار هي فقط التي تعتبر غير خطية حقًا. جميع العناصر الأخرى، التي يمكن اختزالها إلى خطية من خلال التحويلات، لا تعتبر كذلك، وهي التي يتم أخذها في الاعتبار في أغلب الأحيان في دراسات الاقتصاد القياسي. وفي الوقت نفسه، هذا لا يعني أنه من المستحيل دراسة التبعيات غير الخطية بشكل أساسي في الاقتصاد القياسي. إذا كان النموذج غير خطي داخليا في معلماته، يتم استخدام الإجراءات التكرارية لتقدير المعلمات، والتي يعتمد نجاحها على نوع المعادلة لميزات الطريقة التكرارية المستخدمة.

دعنا نعود إلى التبعيات المخفضة إلى الخطية. إذا كانت غير خطية سواء في المعلمات أو في المتغيرات، على سبيل المثال، من النموذج y = a مضروبًا في قوة X، وأسها هو المعلمة -  (بيتا):

من الواضح أن مثل هذه العلاقة يمكن تحويلها بسهولة إلى معادلة خطية باستخدام اللوغاريتم البسيط.

وبعد إدخال متغيرات جديدة تدل على اللوغاريتمات، يتم الحصول على معادلة خطية. يتكون إجراء تقدير الانحدار من حساب متغيرات جديدة لكل ملاحظة عن طريق أخذ لوغاريتمات القيم الأصلية. ثم يتم تقدير اعتماد الانحدار للمتغيرات الجديدة. للانتقال إلى المتغيرات الأصلية، يجب أن تأخذ اللوغاريتم المضاد، أي العودة فعليًا إلى القوى نفسها بدلاً من أسسها (بعد كل شيء، اللوغاريتم هو الأس). يمكن النظر في حالة الدوال الأسية أو الأسية بالمثل.

بالنسبة للانحدار غير الخطي بشكل ملحوظ، ليس من الممكن تطبيق إجراء تقدير الانحدار المعتاد لأنه لا يمكن تحويل العلاقة المقابلة إلى علاقة خطية. المخطط العام للإجراءات هو كما يلي:

1. يتم قبول بعض قيم المعلمات الأولية المعقولة؛

2. يتم حساب قيم Y المتوقعة من قيم X الفعلية باستخدام قيم المعلمات هذه؛

3. يتم حساب البقايا لجميع الملاحظات في العينة ومن ثم مجموع مربعات البقايا.

4. يتم إجراء تغييرات صغيرة على واحد أو أكثر من تقديرات المعلمات؛

5. يتم حساب القيم المتوقعة الجديدة لـ Y والبقايا ومجموع مربعات البقايا؛

6. إذا كان مجموع مربعات البقايا أقل من السابق، فإن تقديرات المعلمات الجديدة أفضل من التقديرات السابقة ويجب استخدامها كنقطة بداية جديدة؛

7. يتم تكرار الخطوات 4 و 5 و 6 مرة أخرى حتى يصبح من المستحيل إجراء مثل هذه التغييرات على تقديرات المعلمات التي من شأنها أن تؤدي إلى تغيير في مجموع المربعات المتبقية؛

8. تم التوصل إلى أن مجموع المربعات المتبقية قد تم تقليله وأن تقديرات المعلمات النهائية هي تقديرات المربعات الصغرى.

من بين الوظائف غير الخطية التي يمكن اختزالها إلى شكل خطي، يتم استخدام دالة الطاقة على نطاق واسع في الاقتصاد القياسي. المعلمة ب لها تفسير واضح، كونها معامل مرونة. في النماذج غير الخطية في المعلمات المقدرة، ولكن يمكن اختزالها إلى شكل خطي، يتم تطبيق المربعات الصغرى على المعادلات المحولة. يكون الاستخدام العملي للوغاريتمات، وبالتالي الأسس، ممكنًا عندما لا تحتوي الإشارة الناتجة على قيم سالبة. عند دراسة العلاقات بين الوظائف باستخدام لوغاريتم السمة الناتجة، تهيمن تبعيات قانون القوة في الاقتصاد القياسي (منحنيات الطلب والعرض، وظائف الإنتاج، منحنيات الامتصاص لتوصيف العلاقة بين كثافة اليد العاملة للمنتجات، وحجم الإنتاج، والاعتماد الدخل القومي الإجمالي على مستوى العمالة، منحنيات إنجل).

28. النموذج العكسي واستخداماته

في بعض الأحيان يتم استخدام ما يسمى بالنموذج العكسي، وهو غير خطي داخليًا، ولكن فيه، على عكس القطع الزائد متساوي الأضلاع، لا يخضع المتغير التوضيحي للتحويل، ولكن السمة الناتجة Y. لذلك، يتحول النموذج العكسي إلى تكون غير خطية داخليًا ولا يتم استيفاء متطلبات OLS للقيم الفعلية للسمة الناتجة Y، ولقيمها العكسية. دراسة الارتباط للانحدار غير الخطي تستحق اهتماما خاصا. في الحالة العامة، القطع المكافئ من الدرجة الثانية، مثل كثيرات الحدود ذات الترتيب الأعلى، عندما تكون خطية، تأخذ شكل معادلة انحدار متعددة. إذا كانت معادلة الانحدار غير الخطية بالنسبة للمتغير الموضح، عندما تكون خطية، تأخذ شكل معادلة انحدار مقترنة خطية، فيمكن استخدام معامل الارتباط الخطي لتقييم مدى قرب العلاقة.

إذا كانت تحويلات معادلة الانحدار إلى الشكل الخطي مرتبطة بالمتغير التابع (الخاصية النتيجةية)، فإن معامل الارتباط الخطي المبني على القيم المحولة للخصائص يعطي فقط تقديرًا تقريبيًا للعلاقة ولا يتطابق عدديًا مع مؤشر الارتباط. يجب أن يؤخذ في الاعتبار أنه عند حساب مؤشر الارتباط، يتم استخدام مجموع الانحرافات التربيعية للخاصية الناتجة Y، وليس اللوغاريتمات الخاصة بها. يتم إجراء تقييم أهمية مؤشر الارتباط بنفس طريقة تقييم موثوقية (أهمية) معامل الارتباط. يتم استخدام مؤشر الارتباط نفسه، مثل مؤشر التحديد، لاختبار الأهمية الإجمالية لمعادلة الانحدار غير الخطية باستخدام اختبار فيشر F.

لاحظ أن إمكانية بناء نماذج غير خطية، سواء عن طريق اختزالها إلى شكل خطي أو باستخدام الانحدار غير الخطي، من ناحية، تزيد من عالمية تحليل الانحدار. ومن ناحية أخرى، فإنه يعقد مهام الباحث بشكل كبير. إذا اقتصرنا على تحليل الانحدار المقترن، فيمكننا رسم الملاحظات Y وX كمخطط مبعثر. غالبًا ما تقوم العديد من الدوال غير الخطية المختلفة بتقريب الملاحظات إذا كانت تقع على منحنى ما. ولكن في حالة تحليل الانحدار المتعدد، لا يمكن إنشاء مثل هذا الرسم البياني.

عند النظر في نماذج بديلة بنفس تعريف المتغير التابع، فإن إجراء الاختيار بسيط نسبيا. يمكن للمرء تقدير الانحدار بناءً على جميع الوظائف المعقولة التي يمكن تخيلها واختيار الوظيفة التي تفسر التغيير في المتغير التابع. من الواضح أنه عندما تفسر الدالة الخطية ما يقرب من 64% من التباين في y، والدالة الزائدية تفسر 99.9%، فمن الواضح أنه يجب اختيار الأخير. ولكن عندما تستخدم النماذج المختلفة أشكالًا وظيفية مختلفة، تصبح مشكلة اختيار النموذج أكثر تعقيدًا بشكل ملحوظ.

29. استخدام اختبار بوكس ​​كوكس.

وبشكل أعم، عند النظر في نماذج بديلة بنفس تعريف المتغير التابع، يكون الاختيار بسيطا. من المعقول جدًا تقدير الانحدار بناءً على جميع الوظائف المعقولة، مع التركيز على الوظيفة التي تفسر التغيير في المتغير التابع. إذا كان معامل التحديد يقيس، في حالة واحدة، نسبة التباين المفسرة بالانحدار، وفي الحالة الأخرى، نسبة التباين في لوغاريتم هذا المتغير التابع المفسرة بالانحدار، يتم الاختيار دون صعوبة. إنها مسألة أخرى عندما تكون هذه القيم لنموذجين متقاربة جدًا وتصبح مشكلة الاختيار أكثر تعقيدًا بشكل ملحوظ.

وينبغي بعد ذلك تطبيق الإجراء القياسي في شكل اختبار Box-Cox. إذا كنت بحاجة فقط إلى مقارنة النماذج باستخدام العامل الفعال ولوغاريتمه في شكل متغير للمتغير التابع، فسيتم استخدام نسخة من اختبار Zarembka. ويقترح تحويل مقياس المراقبة Y، والذي يسمح بإجراء مقارنة مباشرة لجذر متوسط ​​مربع الخطأ (MSE) في النماذج الخطية واللوغاريتمية. يتضمن الإجراء المقابل الخطوات التالية:

    يتم حساب الوسط الهندسي لقيم Y في العينة، والذي يتطابق مع أس الوسط الحسابي للوغاريتم Y؛

    يتم إعادة حساب الملاحظات Y بحيث يتم تقسيمها على القيمة التي تم الحصول عليها في الخطوة الأولى؛

    يتم تقدير الانحدار لنموذج خطي باستخدام قيم Y المقاسة بدلاً من قيم Y الأصلية، ولنموذج لوغاريتمي باستخدام لوغاريتم قيم Y المقاسة، أصبحت قيم RMSE للانحدارين قابلة للمقارنة وبالتالي النموذج الذي يحتوي على مجموع أصغر من الانحرافات المربعة يوفر ملاءمة أفضل للعلاقة الحقيقية للقيم المرصودة؛

    للتحقق من أن أحد النماذج لا يوفر توافقًا أفضل بكثير، يمكن استخدام حاصل ضرب نصف عدد الملاحظات ولوغاريتم نسبة قيم الانحراف المعياري في الانحدارات المعاد حسابها، ثم أخذ القيمة المطلقة لهذه القيمة.

30. مفاهيم الترابط والتعددية الخطية للعوامل.

34. أساسيات الشركات المتعددة الجنسيات وصلاحية تطبيقها.

دعونا ننتقل الآن إلى أساسيات OLS، وصحة تطبيقه (بما في ذلك مشاكل الانحدار المتعددة) وأهم خصائص التقديرات التي تم الحصول عليها باستخدام OLS. لنبدأ بحقيقة أنه إلى جانب الاعتماد التحليلي على الجانب الأيمن من معادلة الانحدار، يلعب المصطلح العشوائي أيضًا دورًا مهمًا. هذا المكون العشوائي هو كمية غير قابلة للملاحظة. وتعتمد الاختبارات الإحصائية لمعلمات الانحدار ومؤشرات الارتباط نفسها على افتراضات غير قابلة للاختبار حول توزيع هذا المكون العشوائي للانحدار المتعدد. هذه الافتراضات أولية فقط. فقط بعد إنشاء معادلة الانحدار يتم التحقق مما إذا كانت تقديرات المخلفات العشوائية (نظائرها التجريبية للمكون العشوائي) لها خصائص مفترضة مسبقًا. بشكل أساسي، عند تقدير معلمات النموذج، يتم حساب الاختلافات بين القيم النظرية والفعلية للسمة الناتجة من أجل تقدير المكون العشوائي نفسه. من المهم أن تضع في اعتبارك أن هذا مجرد نموذج لتطبيق الباقي غير المعروف من معادلة معينة.

معاملات الانحدار التي تم الحصول عليها من نظام المعادلات العادية هي تقديرات عينة لقوة العلاقة. ومن الواضح أن لها أهمية عملية فقط عندما تكون غير متحيزة. دعونا نتذكر أنه في هذه الحالة يكون متوسط ​​القيم المتبقية يساوي صفرًا، أو، وهو نفس الشيء، متوسط ​​التقدير يساوي المعلمة المقدرة نفسها. ثم لن تتراكم البقايا على عدد كبير من تقديرات العينة، ويمكن اعتبار معلمة الانحدار الموجودة نفسها متوسطًا لعدد كبير من التقديرات غير المتحيزة.

بالإضافة إلى ذلك، يجب أن تحتوي التقديرات على أصغر التباين، أي. تكون فعالة ومن ثم يصبح من الممكن الانتقال من تقديرات النقاط غير القابلة للاستخدام عمليًا إلى تقدير الفترات. وأخيرًا، تكون فترات الثقة مفيدة عندما يكون احتمال الحصول على تقدير على مسافة معينة من القيمة الحقيقية (غير المعروفة) للمعلمة قريبًا من الواحد. تسمى هذه التقديرات متسقة وتتميز خاصية الاتساق بزيادة دقتها مع زيادة حجم العينة.

ومع ذلك، لا يتم استيفاء شرط الاتساق تلقائيًا ويعتمد بشكل كبير على استيفاء المتطلبين المهمين التاليين. أولا، يجب أن تكون البقايا نفسها عشوائية مع العشوائية الأكثر وضوحا، أي. يجب تضمين جميع التبعيات الوظيفية بشكل واضح على وجه التحديد في المكون التحليلي للانحدار المتعدد، وبالإضافة إلى ذلك، يجب توزيع قيم البقايا بشكل مستقل عن بعضها البعض لعينات مختلفة (لا يوجد ارتباط تلقائي للبقايا). الشرط الثاني الذي لا يقل أهمية هو أن يكون تباين كل انحراف (المتبقي) متطابقًا لجميع قيم متغيرات X (التماثلية). أولئك. يتم التعبير عن التجانس من خلال ثبات التباين لجميع الملاحظات:

على العكس من ذلك، فإن التغاير هو انتهاك لثبات التباين لملاحظات مختلفة. وفي هذه الحالة فإن الاحتمال القبلي (قبل الملاحظات) للحصول على قيم شديدة الانحراف مع توزيعات نظرية مختلفة للمصطلح العشوائي لملاحظات مختلفة في العينة سيكون مرتفعاً نسبياً.

يتم تحديد الارتباط الذاتي للبقايا، أو وجود ارتباط بين بقايا الملاحظات الحالية والسابقة (اللاحقة)، من خلال قيمة معامل الارتباط الخطي المعتاد. وإذا كانت تختلف بشكل كبير عن الصفر، فإن البقايا تكون مرتبطة ذاتيًا، وبالتالي تعتمد دالة كثافة الاحتمال (توزيع البقايا) على نقطة المراقبة وعلى توزيع القيم المتبقية عند نقاط مراقبة أخرى. من الملائم تحديد الارتباط الذاتي للبقايا باستخدام المعلومات الإحصائية المتاحة إذا كان هناك ترتيب للملاحظات حسب العامل X. ويضمن غياب الارتباط الذاتي للبقايا اتساق وفعالية تقديرات معاملات الانحدار.

35. التجانس والتغاير، الارتباط الذاتي للبقايا، المربعات الصغرى المعممة (GLM).

إن تشابه تباينات القيم المتبقية لجميع قيم المتغيرات X، أو التجانس، ضروري أيضًا للحصول على تقديرات متسقة لمعلمات الانحدار باستخدام OLS. يؤدي الفشل في استيفاء شرط المثلية إلى ما يسمى بالتغايرية. ويمكن أن يؤدي إلى تقديرات متحيزة لمعاملات الانحدار. سوف تؤثر التغايرية بشكل رئيسي على انخفاض كفاءة تقديرات معامل الانحدار. في هذه الحالة، يصبح من الصعب بشكل خاص استخدام صيغة الخطأ المعياري لمعامل الانحدار، والتي يفترض استخدامها تشتتًا منتظمًا للبقايا لأي قيم للعامل. أما بالنسبة لعدم تحيز تقديرات معاملات الانحدار، فيعتمد بالدرجة الأولى على استقلالية البقايا وقيم العوامل نفسها.

تتمثل إحدى الطرق الواضحة إلى حد ما، وإن كانت غير صارمة وتتطلب مهارة لاختبار التماثل، في دراسة طبيعة اعتماد البقايا بيانيًا على متوسط ​​السمة الناتجة المحسوبة (النظرية)، أو مجالات الارتباط المقابلة. تعتبر الطرق التحليلية لدراسة وتقييم التغايرية أكثر صرامة. إذا كان هناك وجود كبير للتغايرية، فمن المستحسن استخدام OLS المعمم (GLM) بدلاً من OLS.

بالإضافة إلى متطلبات الانحدار المتعدد الناشئة عن استخدام OLS، من الضروري أيضًا الالتزام بالشروط الخاصة بالمتغيرات المدرجة في النموذج. وتشمل هذه، أولاً وقبل كل شيء، المتطلبات المتعلقة بعدد عوامل النموذج لحجم معين من الملاحظات (من 1 إلى 7). وبخلاف ذلك، ستكون معلمات الانحدار ذات أهمية إحصائية. من وجهة نظر فعالية تطبيق الأساليب العددية المقابلة عند تنفيذ LSM، من الضروري أن يتجاوز عدد الملاحظات عدد المعلمات المقدرة (في نظام المعادلات، يكون عدد المعادلات أكبر من عدد المطلوب المتغيرات).

إن الإنجاز الأكثر أهمية للاقتصاد القياسي هو التطوير الكبير لطرق تقدير المعلمات غير المعروفة وتحسين معايير تحديد الأهمية الثابتة للتأثيرات قيد النظر. في هذا الصدد، أدت استحالة أو عدم جدوى استخدام خدمات الحياة البرية التقليدية بسبب عدم التجانس الذي تجلى بدرجات متفاوتة إلى تطوير خدمات الحياة المفتوحة المعممة (GLM). في الواقع، يتضمن ذلك تعديل النموذج وتغيير مواصفاته وتحويل البيانات الأصلية لضمان تقديرات غير متحيزة وفعالة ومتسقة لمعاملات الانحدار.

ويفترض أن متوسط ​​البقايا هو صفر، ولكن تشتتها لم يعد ثابتا، بل يتناسب مع قيم K i، حيث تكون هذه القيم عبارة عن معاملات تناسب تختلف باختلاف قيم س عامل. وبالتالي، فإن هذه المعاملات (قيم K i) هي التي تميز عدم تجانس التشتت. وبطبيعة الحال، يعتقد أن مقدار التشتت نفسه، وهو عامل مشترك لمعاملات التناسب هذه، غير معروف.

النموذج الأصلي، بعد إدخال هذه المعاملات في معادلة الانحدار المتعدد، يستمر في البقاء غير متجانس (بتعبير أدق، هذه هي القيم المتبقية للنموذج). دع هذه المخلفات (المخلفات) لا تكون مرتبطة تلقائيًا. دعونا نقدم متغيرات جديدة تم الحصول عليها عن طريق قسمة متغيرات النموذج الأولية المسجلة نتيجة الملاحظة i على الجذر التربيعي لمعاملات التناسب K i . ومن ثم نحصل على معادلة جديدة في المتغيرات المحولة، حيث تكون البقايا متجانسة. المتغيرات الجديدة نفسها هي المتغيرات القديمة (الأصلية) المرجحة.

لذلك، سيتم تخفيض تقدير معلمات المعادلة الجديدة التي تم الحصول عليها بهذه الطريقة مع المخلفات المتجانسة إلى طريقة المربعات الصغرى الموزونة (في جوهرها، هذه هي طريقة OLS). عند استخدامها بدلاً من متغيرات الانحدار نفسها، فإن انحرافاتها عن المتوسطات، تأخذ تعبيرات معاملات الانحدار شكلاً بسيطًا وموحدًا (موحدًا)، يختلف قليلاً عن OLS وOLS بواسطة عامل التصحيح 1/K في البسط والمقام من الكسر الذي يعطي معامل الانحدار.

يجب أن يؤخذ في الاعتبار أن معلمات النموذج المحول (المعدل) تعتمد بشكل كبير على المفهوم المستخدم كأساس لمعاملات التناسب K i. غالبًا ما يُفترض أن البقايا تتناسب ببساطة مع قيم العوامل. ويأخذ النموذج أبسط صوره عندما يتم قبول فرضية أن الأخطاء تتناسب مع قيم العامل الأخير في الترتيب. ثم يتيح OLS زيادة وزن الملاحظات بقيم أصغر للمتغيرات المحولة عند تحديد معلمات الانحدار مقارنة بتشغيل OLS القياسي مع متغيرات المصدر الأصلية. لكن هذه المتغيرات الجديدة تحظى بالفعل بمحتوى اقتصادي مختلف.

قد يكون للفرضية المتعلقة بتناسب البقايا مع حجم العامل أساس حقيقي. دع مجموعة معينة من البيانات غير المتجانسة تتم معالجتها، على سبيل المثال، بما في ذلك المؤسسات الكبيرة والصغيرة في نفس الوقت. ثم يمكن أن تتوافق القيم الحجمية الكبيرة للعامل مع كل من التشتت الكبير للخاصية الناتجة والتشتت الكبير للقيم المتبقية. علاوة على ذلك، فإن استخدام OLS والانتقال المقابل إلى القيم النسبية لا يقلل من تباين العامل فحسب، بل يقلل أيضًا من تباين الخطأ. وبالتالي، فإن أبسط حالة لمراعاة وتصحيح عدم التجانس في نماذج الانحدار تتحقق من خلال استخدام OLS.

يعتبر النهج المذكور أعلاه لتنفيذ عملية شريان الحياة في شكل عملية شريان الحياة المرجحة أمرًا عمليًا تمامًا - فهو يتم تنفيذه ببساطة وله تفسير اقتصادي شفاف. وبطبيعة الحال، هذا ليس النهج الأكثر عمومية، وفي سياق الإحصائيات الرياضية، التي تعمل بمثابة الأساس النظري للاقتصاد القياسي، يُعرض علينا أسلوب أكثر صرامة ينفذ عملية شريان الحياة في الشكل الأكثر عمومية. في ذلك، تحتاج إلى معرفة مصفوفة التغاير لمتجه الخطأ (العمود المتبقي). وهذا عادة ما يكون غير عادل في المواقف العملية، وقد يكون من المستحيل العثور على هذه المصفوفة في حد ذاتها. لذلك، بشكل عام، من الضروري تقدير المصفوفة المطلوبة بطريقة أو بأخرى من أجل استخدام مثل هذا التقدير في الصيغ المقابلة بدلاً من المصفوفة نفسها. وبالتالي، فإن النسخة الموصوفة لتنفيذ OMNC تمثل أحد هذه التقديرات. ويطلق عليها أحيانًا اسم المربعات الصغرى المعممة التي يمكن الوصول إليها.

وينبغي أيضًا أن يؤخذ في الاعتبار أن معامل التحديد لا يمكن أن يكون بمثابة مقياس مرضٍ لجودة الملاءمة عند استخدام OLS. وبالعودة إلى استخدام OLS، نلاحظ أيضًا أن طريقة استخدام الانحرافات المعيارية (الأخطاء المعيارية) بالشكل الأبيض (ما يسمى بالأخطاء المعيارية المتسقة في وجود التغايرية) تتمتع بعمومية كافية. تنطبق هذه الطريقة بشرط أن تكون مصفوفة التغاير لمتجه الخطأ قطريًا. إذا كان هناك ارتباط ذاتي للبواقي (الأخطاء)، وعندما تكون هناك عناصر غير صفرية (معاملات) في مصفوفة التغاير وخارج القطر الرئيسي، فيجب استخدام طريقة خطأ قياسية أكثر عمومية في نموذج Neve West. هناك قيود كبيرة: العناصر غير الصفرية، بالإضافة إلى القطر الرئيسي، توجد فقط في الأقطار المجاورة، متباعدة عن القطر الرئيسي بما لا يزيد عن كمية معينة.

يتضح مما سبق أنه من الضروري أن تكون قادرًا على التحقق من البيانات للتأكد من عدم تجانسها. الاختبارات أدناه تخدم هذا الغرض. وقاموا باختبار الفرضية الرئيسية حول مساواة تباينات البقايا مع الفرضية البديلة (حول عدم تكافؤ هذه الفرضيات). بالإضافة إلى ذلك، هناك قيود هيكلية مسبقة على طبيعة التغايرية. يستخدم اختبار Goldfeld-Quandt عادة الافتراض بأن تباين الخطأ (المتبقي) يعتمد بشكل مباشر على قيمة بعض المتغيرات المستقلة. مخطط استخدام هذا الاختبار هو كما يلي. أولاً، يتم ترتيب البيانات بترتيب تنازلي للمتغير المستقل الذي يشتبه في تغايره. تقوم مجموعة البيانات المرتبة هذه بعد ذلك بحذف متوسط ​​الملاحظات القليلة، حيث تعني كلمة "قليل" حوالي ربع (25٪) العدد الإجمالي لجميع الملاحظات. بعد ذلك، يتم تشغيل اثنين من الانحدارات المستقلة على أول متوسط ​​الملاحظات المتبقية (بعد الحذف) وآخر اثنين من متوسط ​​الملاحظات المتبقية. بعد ذلك، يتم إنشاء اثنين من البقايا المقابلة. أخيرًا، تم تجميع إحصائية Fisher F وإذا كانت الفرضية قيد الدراسة صحيحة، فإن F هو بالفعل توزيع فيشر مع درجات الحرية المناسبة. ومن ثم فإن القيمة الكبيرة لهذه الإحصائية تعني أنه يجب رفض الفرضية التي يتم اختبارها. بدون خطوة الإزالة، يتم تقليل قوة هذا الاختبار.

يتم استخدام اختبار Breusch-Pagan في الحالات التي يفترض فيها مسبقًا أن التباينات تعتمد على بعض المتغيرات الإضافية. أولاً، يتم تنفيذ الانحدار العادي (القياسي) ويتم الحصول على ناقل للبقايا. ثم يتم إنشاء تقدير التباين. بعد ذلك، يتم إجراء انحدار للمتجه التربيعي للبقايا مقسومًا على التباين التجريبي (تقدير التباين). وله (الانحدار) وجد الجزء المفسر من التباين. ولهذا الجزء الموضح من الاختلاف، مقسم إلى النصف، يتم بناء الإحصائيات. إذا كانت الفرضية الصفرية صحيحة (لا يوجد تغايرية صحيحة)، فإن هذه القيمة لها توزيع هه-مربع. إذا كشف الاختبار، على العكس من ذلك، عن عدم تجانس التغاير، فسيتم تحويل النموذج الأصلي عن طريق قسمة مكونات متجه البقايا على المكونات المقابلة لمتجه المتغيرات المستقلة المرصودة.

36. طريقة الانحراف المعياري بالشكل الأبيض.

الاستنتاجات التالية يمكن استخلاصها. إن استخدام OLS في ظل وجود تباين متباين يؤدي إلى تقليل مجموع الانحرافات المربعة الموزونة. ويرتبط استخدام OLS المتاحة بالحاجة إلى وجود عدد كبير من الملاحظات يتجاوز عدد المعلمات المقدرة. الحالة الأكثر ملاءمة لاستخدام OLS هي الحالة التي يكون فيها الخطأ (البقايا) متناسبًا مع أحد المتغيرات المستقلة وتكون التقديرات الناتجة متسقة. ومع ذلك، إذا كان من الضروري في نموذج متغاير عدم استخدام OLS، بل OLS القياسي، فمن أجل الحصول على تقديرات متسقة، يمكن للمرء استخدام تقديرات الخطأ في النموذج الأبيض أو Nevje-West.

عند تحليل السلاسل الزمنية، غالبًا ما يكون من الضروري مراعاة الاعتماد الإحصائي للملاحظات في نقاط زمنية مختلفة. في هذه الحالة، لا يتم استيفاء افتراض الأخطاء غير المرتبطة. دعونا نفكر في نموذج بسيط تشكل فيه الأخطاء عملية انحدار ذاتي من الدرجة الأولى. في هذه الحالة، تفي الأخطاء بعلاقة تكرارية بسيطة، على الجانب الأيمن منها يكون أحد المصطلحات عبارة عن سلسلة من المتغيرات العشوائية المستقلة الموزعة بشكل طبيعي بمتوسط ​​صفر وتباين ثابت. المصطلح الثاني هو حاصل ضرب المعلمة (معامل الانحدار الذاتي) وقيم البقايا عند النقطة الزمنية السابقة. يشكل تسلسل قيم الخطأ (البقايا) في حد ذاته عملية عشوائية ثابتة. تتميز العملية العشوائية الثابتة بثبات خصائصها مع مرور الوقت، على وجه الخصوص، المتوسط ​​والتباين. في هذه الحالة، يمكن بسهولة كتابة مصفوفة التغاير (شروطها) التي تهمنا باستخدام صلاحيات المعلمة.

يتم إجراء تقدير نموذج الانحدار الذاتي لمعلمة معروفة باستخدام OLS. في هذه الحالة، يكفي ببساطة تقليل النموذج الأصلي عن طريق تحويل بسيط إلى نموذج تفي أخطائه بشروط نموذج الانحدار القياسي. إنه نادر جدًا، ولكن لا يزال هناك موقف تكون فيه معلمة الانحدار التلقائي معروفة. لذلك، من الضروري بشكل عام إجراء التقدير باستخدام معلمة انحدار ذاتي غير معروفة. هناك ثلاثة إجراءات شائعة الاستخدام لمثل هذا التقييم. طريقة كوكرين-أوركوت، طريقة هيلدريث-لو، وطريقة دوربين.

بشكل عام، الاستنتاجات التالية صحيحة. يتطلب تحليل السلاسل الزمنية تصحيح عملية OLS التقليدية، حيث أن الأخطاء في هذه الحالة عادة ما تكون مترابطة. غالبًا ما تشكل هذه الأخطاء عملية انحدار ذاتي ثابتة من الدرجة الأولى. مقدرات OLS للانحدار الذاتي من الدرجة الأولى غير متحيزة ومتسقة ولكنها غير فعالة. باستخدام معامل الانحدار الذاتي المعروف، يتم تقليل OLS إلى تحويلات بسيطة (تصحيحات) للنظام الأصلي ثم إلى تطبيق OLS القياسي. إذا كان معامل الانحدار الذاتي غير معروف، كما هو الحال في أغلب الأحيان، فهناك العديد من الإجراءات المتاحة لـ OLS، والتي تتمثل في تقدير المعلمة غير المعروفة (المعامل)، وبعد ذلك يتم تطبيق نفس التحويلات كما في الحالة السابقة للمعامل المعروف معامل.

37. مفهوم اختبار بروش-باغان، اختبار غولدفيلدت-كواندت

ومن بين طرق التنبؤ المختلفة، لا يمكن تجاهل التقريب. بمساعدتها، يمكنك إجراء حسابات تقريبية وحساب المؤشرات المخططة عن طريق استبدال الكائنات الأصلية بأخرى أبسط. في Excel، من الممكن أيضًا استخدام هذه الطريقة للتنبؤ والتحليل. دعونا نلقي نظرة على كيفية تطبيق هذه الطريقة في البرنامج المحدد باستخدام الأدوات المدمجة.

يأتي اسم هذه الطريقة من الكلمة اللاتينية proxima - "الأقرب". وهي عبارة عن تقريب من خلال تبسيط وتنعيم المؤشرات المعروفة، وربطها في اتجاه ما، وهذا هو أساسها. ولكن يمكن استخدام هذه الطريقة ليس فقط للتنبؤ، ولكن أيضًا لدراسة النتائج الحالية. بعد كل شيء، التقريب هو في جوهره تبسيط للبيانات الأصلية، والنسخة المبسطة أسهل في الدراسة.

الأداة الرئيسية التي يتم بها تنفيذ التجانس في Excel هي بناء خط الاتجاه. خلاصة القول هي أنه استنادا إلى المؤشرات الحالية، تم الانتهاء من الرسم البياني الوظيفي للفترات المستقبلية. الغرض الرئيسي من خط الاتجاه، كما قد تتخيل، هو وضع توقعات أو تحديد الاتجاه العام.

ولكن يمكن بناؤها باستخدام واحد من خمسة أنواع من التقريب:

  • خطي؛
  • متسارع؛
  • لوغاريتمي.
  • متعدد الحدود؛
  • قوي.

دعونا نفكر في كل خيار بمزيد من التفصيل بشكل منفصل.

الطريقة الأولى: التجانس الخطي

أولًا، دعونا نلقي نظرة على أبسط نسخة من التقريب، أي استخدام دالة خطية. سنتناولها بمزيد من التفصيل، حيث سنحدد النقاط العامة المميزة للطرق الأخرى، وهي بناء جدول زمني وبعض الفروق الدقيقة الأخرى، والتي لن نتوقف عند النظر في الخيارات اللاحقة.

بادئ ذي بدء، سنقوم ببناء رسم بياني سنقوم على أساسه بإجراء عملية التجانس. لإنشاء رسم بياني، لنأخذ جدولاً يوضح التكلفة الشهرية لكل وحدة إنتاج تنتجها المؤسسة والربح المقابل في فترة معينة. ستعرض الوظيفة الرسومية التي سنقوم بإنشائها اعتماد الزيادة في الربح على انخفاض تكاليف الإنتاج.


يتم وصف التجانس المستخدم في هذه الحالة بالصيغة التالية:

في حالتنا الخاصة، تأخذ الصيغة الشكل التالي:

ص=-0.1156س+72.255

قيمة موثوقية التقريب لدينا تساوي 0,9418 ، وهي نتيجة مقبولة إلى حد ما، وتصف التجانس بأنه موثوق.

الطريقة الثانية: التقريب الأسي

الآن دعونا نلقي نظرة على النوع الأسي للتقريب في Excel.


المظهر العام لوظيفة التنعيم هو كما يلي:

أين ههو أساس اللوغاريتم الطبيعي.

وفي حالتنا الخاصة، اتخذت الصيغة الشكل التالي:

ص=6282.7*ه^(-0.012*س)

الطريقة الثالثة: التجانس اللوغاريتمي

والآن حان دور النظر في طريقة التقريب اللوغاريتمي.


بشكل عام، تبدو صيغة التجانس كما يلي:

أين lnهي قيمة اللوغاريتم الطبيعي. ومن هنا اسم الطريقة.

في حالتنا، تأخذ الصيغة الشكل التالي:

ص=-62.81ln(x)+404.96

الطريقة الرابعة: تجانس كثيرات الحدود

حان الوقت الآن للنظر في طريقة تجانس كثيرات الحدود.


الصيغة التي تصف هذا النوع من التجانس تأخذ الشكل التالي:

ص=8E-08x^6-0.0003x^5+0.3725x^4-269.33x^3+109525x^2-2E+07x+2E+09

الطريقة الخامسة: تجانس الطاقة

وأخيرا، دعونا نلقي نظرة على طريقة تقريب الطاقة في إكسيل.


يتم استخدام هذه الطريقة بشكل فعال في حالات التغييرات المكثفة في بيانات الوظيفة. من المهم ملاحظة أن هذا الخيار لا ينطبق إلا إذا كانت الدالة والوسيطة لا تقبلان القيم السالبة أو الصفرية.

الصيغة العامة التي تصف هذه الطريقة هي كما يلي:

في حالتنا الخاصة، يبدو الأمر كما يلي:

ص = 6E+18x^(-6.512)

كما ترون، عند استخدام البيانات المحددة التي استخدمناها كمثال، تم إظهار أعلى مستوى من الموثوقية من خلال طريقة تقريب كثيرات الحدود مع كثيرة الحدود للأس السادس ( 0,9844 )، الطريقة الخطية لديها أدنى مستوى من الموثوقية ( 0,9418 ). لكن هذا لا يعني على الإطلاق أن نفس الاتجاه سيحدث عند استخدام أمثلة أخرى. لا، قد يختلف مستوى فعالية الطرق المذكورة أعلاه بشكل كبير، اعتمادًا على نوع الوظيفة المحددة التي سيتم إنشاء خط الاتجاه من أجلها. لذلك، إذا كانت الطريقة المختارة هي الأكثر فعالية لهذه الوظيفة، فهذا لا يعني على الإطلاق أنها ستكون مثالية أيضًا في موقف آخر.

إذا لم تتمكن بعد من تحديد نوع التقريب المناسب لحالتك على وجه التحديد، بناءً على التوصيات المذكورة أعلاه، فمن المنطقي تجربة جميع الطرق. بعد إنشاء خط الاتجاه وعرض مستوى الثقة فيه، يمكنك اختيار الخيار الأفضل.

عمل الدورة

في تخصص "الاقتصاد القياسي"

« تحليل شامل للعلاقة بين مؤشرات الأداء المالي والاقتصادي للمؤسسات"

الخيار رقم 12

مكتمل:

طالب المجموعة EET-312

لوجونوف إن يو.

التحقق:

مساعد. إيشخانيان إم.

موسكو 2015

صياغة المشكلة

1. تجميع مصفوفة الارتباط. اختيار العوامل

2. بناء معادلة الانحدار الخطي المتعدد. تفسير معلمات المعادلة

3. معامل التحديد، معامل الارتباط المتعدد

4.تقييم جودة معادلة الانحدار الخطي المتعدد

4.1.متوسط ​​الخطأ النسبي في التقريب

4.2.التحقق من الأهمية الإحصائية لمعادلة الانحدار المتعدد ككل باستخدام اختبار فيشر F

4.3.التحقق من الدلالة الإحصائية لمعلمات معادلة الانحدار المتعدد. تقديرات المعلمة الفاصلة

5.تطبيق نموذج الانحدار

5.1.نقطة التنبؤ

5.2 معاملات المرونة الجزئية ومتوسط ​​معاملات المرونة الجزئية

6. تحليل بقايا نموذج الانحدار (التحقق من مقدمات نظرية جاوس ماركوف)

6.1. تقديرات التوقع الرياضي للبقايا

6.2 التحقق من الارتباط الذاتي في المخلفات

7. معيار جريجوري تشاو

صياغة المشكلة

وتم تحديد قيم 6 مؤشرات تميز النشاط الاقتصادي لـ 53 مؤسسة. مطلوب:

1. إنشاء مصفوفة الارتباط. اضبط مجموعة المتغيرات المستقلة (اختر عاملين).

4.2. اختبار الأهمية الإحصائية لمعادلة الانحدار المتعدد ككل باستخدام اختبار فيشر F. استخلاص النتائج

4.3. التحقق من الأهمية الإحصائية لمعلمات معادلة الانحدار المتعدد. بناء تقديرات الفاصل الزمني للمعلمات. استخلاص النتائج.



5. تطبيق نموذج الانحدار:

5.1. باستخدام المعادلة المبنية، قم بإعطاء توقع بالنقطة. أوجد قيمة المعلمة المدروسة y، إذا كانت قيمة العامل الأول (الأقرب إلى y) تساوي 110% من قيمته المتوسطة، فإن قيمة العامل الثاني تكون 80% من قيمته المتوسطة. إعطاء تفسير اقتصادي للنتيجة.

5.2. أوجد معاملات المرونة الجزئية ومتوسط ​​معاملات المرونة الجزئية. تفسير النتائج. استخلاص النتائج.

6. تحليل بقايا نموذج الانحدار (تحقق من متطلبات نظرية جاوس ماركوف):

6.1. ابحث عن تقديرات التوقع الرياضي للبقايا.

6.2. التحقق من وجود الارتباط التلقائي في المخلفات. استخلاص النتائج.

7. قسم العينة إلى قسمين متساويين. باعتبار الملاحظات الأولى والأخيرة كعينات مستقلة، اختبر الفرضية حول إمكانية دمجها في عينة واحدة باستخدام معيار غريغوري تشاو.

إعداد مصفوفة الارتباط. اختيار العوامل

رقم المؤسسة Y3 X10 X12 X5 X7 X13
13,26 1,45 167,69 0,78 1,37
10,16 1,3 186,1 0,75 1,49
13,72 1,37 220,45 0,68 1,44
12,85 1,65 169,3 0,7 1,42
10,63 1,91 39,53 0,62 1,35
9,12 1,68 40,41 0,76 1,39
25,83 1,94 102,96 0,73 1,16
23,39 1,89 37,02 0,71 1,27
14,68 1,94 45,74 0,69 1,16
10,05 2,06 40,07 0,73 1,25
13,99 1,96 45,44 0,68 1,13
9,68 1,02 41,08 0,74 1,1
10,03 1,85 136,14 0,66 1,15
9,13 0,88 42,39 0,72 1,23
5,37 0,62 37,39 0,68 1,39
9,86 1,09 101,78 0,77 1,38
12,62 1,6 47,55 0,78 1,35
5,02 1,53 32,61 0,78 1,42
21,18 1,4 103,25 0,81 1,37
25,17 2,22 38,95 0,79 1,41
19,4 1,32 81,32 0,77 1,35
1,48 67,26 0,78 1,48
6,57 0,68 59,92 0,72 1,24
14,19 2,3 107,34 0,79 1,40
15,81 1,37 512,6 0,77 1,45
5,23 1,51 53,81 0,8 1,4
7,99 1,43 80,83 0,71 1,28
17,5 1,82 59,42 0,79 1,33
17,16 2,62 36,96 0,76 1,22
14,54 1,75 91,43 0,78 1,28
6,24 1,54 17,16 0,62 1,47
12,08 2,25 27,29 0,75 1,27
9,49 1,07 184,33 0,71 1,51
9,28 1,44 58,42 0,74 1,46
11,42 1,4 59,4 0,65 1,27
10,31 1,31 49,63 0,66 1,43
8,65 1,12 391,27 0,84 1,5
10,94 1,16 258,62 0,74 1,35
9,87 0,88 75,66 0,75 1,41
6,14 1,07 123,68 0,75 1,47
12,93 1,24 37,21 0,79 1,35
9,78 1,49 53,37 0,72 1,4
13,22 2,03 32,87 0,7 1,2
17,29 1,84 45,63 0,66 1,15
7,11 1,22 48,41 0,69 1,09
22,49 1,72 13,58 0,71 1,26
12,14 1,75 63,99 0,73 1,36
15,25 1,46 104,55 0,65 1,15
31,34 1,6 222,11 0,82 1,87
11,56 1,47 25,76 0,8 1,17
30,14 1,38 29,52 0,83 1,61
19,71 1,41 41,99 0,7 1,34
23,56 1,39 78,11 0,74 1,22

1. إنشاء مصفوفة الارتباط. اضبط مجموعة المتغيرات المستقلة (اختر عاملين).

دعونا نفكر في العلامة الناتجة Y3 وخصائص العوامل X10، X12، X5، X7، X13 .

لنقم بإنشاء مصفوفة ارتباط باستخدام خيار "تحليل البيانات → الارتباط" في MS Excel:

Y3 X10 X12 X5 X7 X13
Y3 1,0000 0,3653 0,0185 0,2891 0,1736 0,0828
X10 0,3653 1,0000 -0,2198 -0,0166 -0,2061 -0,0627
X12 0,0185 -0,2198 1,0000 0,2392 0,3796 0,6308
X5 0,2891 -0,0166 0,2392 1,0000 0,4147 0,0883
X7 0,1736 -0,2061 0,3796 0,4147 1,0000 0,1939
X13 0,0828 -0,0627 0,6308 0,0883 0,1939 1,0000

نختار عاملين وفقًا للمعايير:

1) يجب أن يكون الاتصال بين Y وX بحد أقصى

2) يجب أن يكون الاتصال بين Xmi في حده الأدنى

وهكذا، في الفقرات التالية، سيتم العمل مع العوامل X10 , X5.

بناء معادلة الانحدار الخطي المتعدد. تفسير معلمات المعادلة.

2. بناء معادلة الانحدار الخطي المتعدد. إعطاء تفسير لمعلمات المعادلة.

لنقم بإنشاء نموذج انحدار باستخدام حزمة التحليل "تحليل البيانات → الانحدار" في MS Excel:

احتمال
ي -20,7163
× 10 5,7169
× 5 34,9321

ستبدو معادلة الانحدار كما يلي:

ŷ = ب 0 + ب 10 * س 10 + ب 5 * س 5

ŷ = -20.7163-5.7169* × 10 +34.9321* × 5

1) b10 موجب؛

2) b5 موجب؛

معامل التحديد، معامل الارتباط المتعدد

3. أوجد معامل التحديد، معامل الارتباط المتعدد. استخلاص النتائج.

في تحليل الانحدار الذي تم إجراؤه باستخدام حزمة التحليل "تحليل البيانات → الانحدار" في MS Excel، نجد جدول "إحصاءات الانحدار":

اتصال R المتعدد بين Y3 وX10،X5 ضعيف

R-squared-22.05% من التباين في السمة Y يتم تفسيره من خلال التباين في السمات X10 وX5

تقييم جودة معادلة الانحدار الخطي المتعدد

4. تقييم جودة معادلة الانحدار الخطي المتعدد:

متوسط ​​الخطأ النسبي للتقريب

4.1. أوجد متوسط ​​خطأ التقريب النسبي. استخلاص النتائج.

دعونا نحسب القيم المتوقعة لكل ملاحظة أو نستخدم عمود "Y المتوقع" في جدول "المخرجات المتبقية" في تحليل الانحدار الذي يتم إجراؤه باستخدام حزمة تحليل "تحليل البيانات → الانحدار" في MS Excel)

دعونا نحسب الأخطاء النسبية لكل ملاحظة باستخدام الصيغة:

لنحسب متوسط ​​خطأ التقريب النسبي باستخدام الصيغة:

خاتمة: 20% < А < 50%, качество уравнения среднее (удовлетворительное).

مؤشرات الارتباط وتحديد

الانحدار الزوجي الخطي

بناءً على البيانات المساعدة المحسوبة في الجدول. 2، نحسب مؤشر قرب الاتصال.

هذا المؤشر هو نموذج لمعامل الارتباط الخطي، ويتم حسابه باستخدام الصيغة.

وبناء على نتائج حساب معامل الارتباط يمكن أن نستنتج أن العلاقة بين العامل والصفة الناتجة هي علاقة مباشرة وقوية (حسب مقياس تشادوك).

ويسمى مربع معامل الارتباط بمعامل التحديد، وهو يوضح نسبة التباين في الخاصية الناتجة مفسرة بالتباين في خاصية العامل.

عادة، عند تفسير معامل التحديد، يتم التعبير عنه كنسبة مئوية.

R2 = 0.8472 = 0.7181

أولئك. وفي 71.81% من الحالات، يؤدي التغير في خاصية العامل إلى تغير في الخاصية الناتجة. دقة اختيار معادلة الانحدار عالية جدًا. يتم تفسير نسبة 28.19% المتبقية من التغير في Y بعوامل لم تؤخذ في الاعتبار في النموذج.

انحدار زوج الطاقة

نحدد مدى قرب العلاقة بين الخصائص الناتجة والعاملية لانحدار زوج القوة باستخدام معامل الارتباط:

وبالتعويض بالبيانات المعروفة نحصل على:

مؤشر التحديد.

أولئك. وفي 69% من الحالات، يؤدي التغيير في إحدى خصائص العامل إلى تغيير في الخاصية الناتجة. دقة تركيب معادلة الانحدار متوسطة. يتم تفسير نسبة 31٪ المتبقية من التغير في Y بعوامل لم تؤخذ في الاعتبار في النموذج.

متوسط ​​خطأ التقريب

الانحدار الزوجي الخطي

دعونا نقيم جودة معادلة الانحدار باستخدام خطأ التقريب المطلق. متوسط ​​خطأ التقريب - متوسط ​​انحراف القيم المحسوبة عن القيم الفعلية:

انحدار زوج الطاقة

متوسط ​​خطأ التقريب - متوسط ​​انحراف القيم المحسوبة عن القيم الفعلية:

يشير خطأ تقريبي يتراوح بين 5% إلى 7% إلى توافق جيد لمعادلة الانحدار مع البيانات الأصلية.

وبما أن الخطأ يزيد عن 7%، فمن غير المستحسن استخدام هذه المعادلة كانحدار.

تقدير الموثوقية الإحصائية لنتائج نمذجة الانحدار باستخدام اختبار فيشر F

الانحدار الزوجي الخطي

يتم استخدام معامل التحديد R2 لاختبار أهمية معادلة الانحدار الخطي ككل.

يتم اختبار أهمية نموذج الانحدار باستخدام اختبار Fisher's F، والذي يتم العثور على قيمته المحسوبة كنسبة التباين في سلسلة الملاحظات الأصلية للمؤشر قيد الدراسة والتقدير غير المتحيز لتباين التسلسل المتبقي لهذا النموذج.

إذا كانت القيمة المحسوبة بدرجات الحرية k 1 =(m) وk 2 =(n-m-1) أكبر من القيمة المجدولة عند مستوى دلالة معين، فإن النموذج يعتبر مهمًا.

يتم تقييم الأهمية الإحصائية للانحدار الخطي المقترن باستخدام الخوارزمية التالية:

حيث m = 1 للانحدار الزوجي.

منذ القيمة الفعلية لـ F>

انحدار زوج الطاقة

على غرار الانحدار الزوجي الخطي، سوف نقوم بتقدير انحدار زوج القوة

حيث m هو عدد العوامل في النموذج.

1. تم طرح فرضية صفرية مفادها أن المعادلة ككل غير ذات دلالة إحصائية: H 0: R 2 =0 عند مستوى الأهمية b.

2. تحديد القيمة الفعلية للمعيار F:

حيث m = 1 للانحدار الزوجي.

3. يتم تحديد القيمة الجدولية من جداول توزيع فيشر لمستوى دلالة معين مع الأخذ في الاعتبار أن عدد درجات الحرية لمجموع المربعات الكلية (التباين الأكبر) هو 1 وعدد درجات الحرية للمجموع المتبقي مجموع المربعات (التباين الأصغر) في الانحدار الخطي هو n-2 .

جدول F هو أقصى قيمة ممكنة للمعيار تحت تأثير العوامل العشوائية عند درجات معينة من الحرية ومستوى الأهمية ب. مستوى الدلالة ب – احتمال رفض الفرضية الصحيحة بشرط صحتها. عادة ما يؤخذ b يساوي 0.05 أو 0.01.

4. إذا كانت القيمة الفعلية لاختبار F أقل من القيمة الجدولية، فيقولون أنه لا يوجد سبب لرفض الفرضية الصفرية.

وبخلاف ذلك يتم رفض الفرضية الصفرية ومع الاحتمال (1-ب) يتم قبول الفرضية البديلة حول الأهمية الإحصائية للمعادلة ككل.

القيمة الجدولية للمعيار مع درجات الحرية:

ك 1 =1 و ك 2 = 8، جدول F = 5.32

نظرًا لأن القيمة الفعلية F > F من الجدول، فإن معامل التحديد ذو دلالة إحصائية (التقدير الموجود لمعادلة الانحدار موثوق به إحصائيًا).

وبناء على نتائج التحليل نستنتج أن معاملات التحديد لكل من الانحدار الزوجي الخطي وانحدار زوج القوة ذات دلالة إحصائية.

نظرًا لأن الانحدار الزوجي الخطي له معامل تحديد (دلالي) أعلى، فإننا نعتقد أنه يصف العلاقة بين العامل والخاصية الناتجة بشكل مناسب.