تحديد المعاملات باستخدام طريقة المربعات الصغرى. أبسط الحالات الخاصة

طريقة المربعات الصغرى هي إجراء رياضي لبناء معادلة خطية تناسب بشكل أفضل مجموعة من الأزواج المرتبة من خلال إيجاد قيم a وb، المعاملات في معادلة الخط. الهدف من المربعات الصغرى هو تقليل الخطأ التربيعي الإجمالي بين قيم y و ŷ. إذا حددنا الخطأ لكل نقطة ŷ، فإن طريقة المربعات الصغرى تقلل من:

حيث n = عدد الأزواج المرتبة حول الخط. أقرب ما يمكن إلى البيانات.

ويوضح هذا المفهوم في الشكل

استنادا إلى الشكل، فإن الخط الذي يناسب البيانات بشكل أفضل، وهو خط الانحدار، يقلل من إجمالي الخطأ التربيعي للنقاط الأربع على الرسم البياني. سأوضح لك كيفية تحديد ذلك باستخدام المربعات الصغرى من خلال المثال التالي.

تخيل زوجين شابين انتقلا للعيش معًا مؤخرًا ويتشاركان طاولة الزينة في الحمام. بدأ الشاب يلاحظ أن نصف طاولته كان يتقلص بلا هوادة، ويفقد قوته أمام موس الشعر ومجمعات الصويا. خلال الأشهر القليلة الماضية، كان الرجل يراقب عن كثب معدل تزايد عدد الأشياء الموجودة على جانبها من الطاولة. يوضح الجدول أدناه عدد العناصر الموجودة في منضدة حمام الفتاة التي تراكمت خلال الأشهر القليلة الماضية.

وبما أن هدفنا هو معرفة ما إذا كان عدد العناصر يزداد بمرور الوقت، فسيكون "الشهر" هو المتغير المستقل، وسيكون "عدد العناصر" هو المتغير التابع.

باستخدام طريقة المربعات الصغرى، نحدد المعادلة التي تناسب البيانات بشكل أفضل عن طريق حساب قيم a، التقاطع y، و b، ميل الخط:

أ = متوسط ​​ص - متوسط ​​ب س

حيث x avg هو متوسط ​​قيمة x، المتغير المستقل، y avg هو متوسط ​​قيمة y، المتغير المستقل.

ويلخص الجدول أدناه الحسابات المطلوبة لهذه المعادلات.

سيتم إعطاء منحنى التأثير لمثال حوض الاستحمام الخاص بنا بالمعادلة التالية:

نظرًا لأن معادلتنا تحتوي على ميل إيجابي قدره 0.976، فإن الرجل لديه دليل على أن عدد العناصر الموجودة على الطاولة يزداد بمرور الوقت بمعدل متوسط ​​عنصر واحد شهريًا. يوضح الرسم البياني منحنى التأثير مع الأزواج المرتبة.

سيتم حساب التوقع لعدد العناصر خلال الأشهر الستة القادمة (الشهر 16) على النحو التالي:

ŷ = 5.13 + 0.976x = 5.13 + 0.976(16) ~ 20.7 = 21 عنصرًا

لذا، فقد حان الوقت لبطلنا أن يتخذ بعض الإجراءات.

وظيفة TREND في Excel

كما خمنت على الأرجح، يحتوي برنامج Excel على وظيفة لحساب القيم باستخدامها طريقة المربعات الصغرى.هذه الوظيفة تسمى الاتجاه. بناء الجملة الخاص به هو كما يلي:

TREND (قيم Y المعروفة، وقيم X المعروفة، وقيم X الجديدة، والثابت)

قيم Y المعروفة – مجموعة من المتغيرات التابعة، في حالتنا، عدد الكائنات في الجدول

القيم المعروفة X – مجموعة من المتغيرات المستقلة، في حالتنا هذا هو الشهر

قيم X الجديدة - قيم X الجديدة (الأشهر) التي لها وظيفة الاتجاهإرجاع القيمة المتوقعة للمتغيرات التابعة (عدد العناصر)

ثابت - اختياري. قيمة منطقية تحدد ما إذا كان الثابت b مطلوبًا أن يكون 0.

على سبيل المثال، يوضح الشكل الدالة TREND المستخدمة لتحديد العدد المتوقع من العناصر الموجودة على منضدة الحمام للشهر السادس عشر.

طريقة المربع الأصغر

وفي الدرس الأخير من الموضوع سنتعرف على التطبيق الأكثر شهرة فنبوالذي يجد التطبيق الأوسع في مختلف مجالات العلوم والنشاط العملي. يمكن أن يكون هذا الفيزياء، والكيمياء، وعلم الأحياء، والاقتصاد، وعلم الاجتماع، وعلم النفس، وما إلى ذلك. بمشيئة القدر، غالبًا ما أضطر إلى التعامل مع الاقتصاد، ولذلك سأرتب لك اليوم رحلة إلى بلد رائع يسمى الاقتصاد القياسي=) ...كيف لا تريد ذلك؟! إنه أمر جيد جدًا هناك - ما عليك سوى اتخاذ قرارك! ...ولكن ما تريده بالتأكيد هو أن تتعلم كيفية حل المشكلات طريقة المربعات الصغرى. وسيتعلم القراء المجتهدون بشكل خاص حلها ليس بدقة فحسب، بل أيضًا بسرعة كبيرة ؛-) ولكن أولاً بيان عام للمشكلة+ المثال المصاحب:

لنفترض أنه في مجال موضوع معين، تتم دراسة المؤشرات التي لها تعبير كمي. وفي الوقت نفسه، هناك كل الأسباب للاعتقاد بأن المؤشر يعتمد على المؤشر. يمكن أن يكون هذا الافتراض إما فرضية علمية أو مبنيًا على الحس السليم الأساسي. ومع ذلك، دعونا نترك العلم جانبًا، ونستكشف المزيد من المجالات الشهية - وهي متاجر البقالة. دعنا نشير بـ:

- منطقة البيع بالتجزئة لمحل بقالة، متر مربع،
– حجم التداول السنوي لمحل بقالة مليون روبل.

من الواضح تماما أنه كلما كانت مساحة المتجر أكبر، كلما زاد معدل دورانها في معظم الحالات.

لنفترض أنه بعد إجراء الملاحظات/التجارب/الحسابات/الرقصات باستخدام الدف، لدينا بيانات رقمية تحت تصرفنا:

مع محلات البقالة، أعتقد أن كل شيء واضح: - هذه هي مساحة المتجر الأول، - حجم مبيعاتها السنوي، - مساحة المتجر الثاني، - حجم مبيعاتها السنوي، وما إلى ذلك. بالمناسبة، ليس من الضروري على الإطلاق الوصول إلى المواد السرية - يمكن الحصول على تقييم دقيق إلى حد ما لحجم التجارة عن طريق الإحصائيات الرياضية. ومع ذلك، دعونا لا نتشتت انتباهنا، فدورة التجسس التجاري مدفوعة بالفعل =)

يمكن أيضًا كتابة البيانات الجدولية على شكل نقاط وتصويرها بالشكل المألوف النظام الديكارتي .

دعونا نجيب على سؤال مهم: كم عدد النقاط اللازمة للدراسة النوعية؟

الأكبر، كلما كان ذلك أفضل. الحد الأدنى المقبول للمجموعة يتكون من 5-6 نقاط. بالإضافة إلى ذلك، عندما تكون كمية البيانات صغيرة، لا يمكن تضمين النتائج "الشاذة" في العينة. لذلك، على سبيل المثال، يمكن لمتجر النخبة الصغير أن يكسب طلبات ذات حجم أكبر من "زملائه"، وبالتالي يشوه النمط العام الذي تحتاج إلى العثور عليه!



بكل بساطة، نحن بحاجة إلى تحديد وظيفة، جدولالذي يمر أقرب ما يمكن إلى النقاط . هذه الوظيفة تسمى تقريب (تقريب - تقريب)أو الوظيفة النظرية . بشكل عام، يظهر هنا على الفور "منافس" واضح - متعدد الحدود عالي الدرجة، والذي يمر الرسم البياني الخاص به عبر جميع النقاط. لكن هذا الخيار معقد وغالبًا ما يكون غير صحيح. (نظرًا لأن الرسم البياني سوف "يتكرر" طوال الوقت ويعكس الاتجاه الرئيسي بشكل سيئ).

وبالتالي، يجب أن تكون الوظيفة المطلوبة بسيطة جدًا وفي نفس الوقت تعكس التبعية بشكل مناسب. كما قد تتخيل، يتم استدعاء إحدى الطرق للعثور على مثل هذه الوظائف طريقة المربعات الصغرى. أولا، دعونا ننظر إلى جوهرها بشكل عام. دع بعض الوظائف تقريبية للبيانات التجريبية:


كيفية تقييم دقة هذا التقريب؟ دعونا أيضًا نحسب الاختلافات (الانحرافات) بين القيم التجريبية والوظيفية (ندرس الرسم). أول فكرة تتبادر إلى ذهني هي تقدير حجم المبلغ، لكن المشكلة هي أن الاختلافات يمكن أن تكون سلبية (على سبيل المثال، ) والانحرافات نتيجة لهذا الجمع سوف تلغي بعضها البعض. ولذلك، كتقدير لدقة التقريب، فإنه يطرح لأخذ المبلغ وحداتالانحرافات:

أو انهار: (في حالة عدم معرفة أي شخص: هو رمز المبلغ، و - متغير مساعد "عداد" يأخذ القيم من 1 إلى ) .

من خلال تقريب النقاط التجريبية مع دوال مختلفة، سنحصل على قيم مختلفة، ومن الواضح أنه عندما يكون هذا المجموع أصغر، تكون تلك الدالة أكثر دقة.

مثل هذه الطريقة موجودة وتسمى طريقة المعامل الأقل. ومع ذلك، في الممارسة العملية أصبح أكثر انتشارا طريقة المربعات الصغرى، حيث لا يتم التخلص من القيم السلبية المحتملة بواسطة الوحدة، ولكن عن طريق تربيع الانحرافات:



، وبعد ذلك تهدف الجهود إلى اختيار دالة بحيث يكون مجموع الانحرافات المربعة كانت صغيرة قدر الإمكان. في الواقع، هذا هو المكان الذي يأتي منه اسم الطريقة.

والآن نعود إلى نقطة أخرى مهمة: كما ذكرنا أعلاه، يجب أن تكون الوظيفة المحددة بسيطة للغاية - ولكن هناك أيضًا العديد من هذه الوظائف: خطي , القطعي , متسارع , لوغاريتمي , من الدرجة الثانية إلخ. وبالطبع، أود هنا على الفور "تقليل مجال النشاط". ما هي فئة الوظائف التي يجب أن أختارها للبحث؟ تقنية بدائية ولكنها فعالة:

- أسهل طريقة هي تصوير النقاط على الرسم وتحليل موقعهم. إذا كانوا يميلون إلى الركض في خط مستقيم، فعليك أن تبحث عنهم معادلة الخط مع القيم المثلى و. بمعنى آخر، المهمة هي العثور على مثل هذه المعاملات بحيث يكون مجموع الانحرافات المربعة هو الأصغر.

إذا كانت النقاط موجودة، على سبيل المثال، على طول مقارنة مبالغ فيهافمن الواضح أن الدالة الخطية ستعطي تقديرًا تقريبيًا سيئًا. في هذه الحالة، نحن نبحث عن المعاملات الأكثر "أفضل" لمعادلة القطع الزائد - تلك التي تعطي الحد الأدنى من مجموع المربعات .

لاحظ الآن أننا نتحدث في كلتا الحالتين وظائف اثنين من المتغيرات، والتي هي الحجج معلمات التبعية التي تم البحث عنها:

ونحن في الأساس بحاجة إلى حل مشكلة قياسية - البحث الحد الأدنى من وظيفة اثنين من المتغيرات.

دعونا نتذكر مثالنا: لنفترض أن نقاط "المتجر" تميل إلى أن تكون موجودة في خط مستقيم، وهناك كل الأسباب للاعتقاد بوجودها الاعتماد الخطيدوران من مساحات البيع بالتجزئة. دعونا نجد مثل هذه المعاملات "أ" و "تكون" بحيث يكون مجموع الانحرافات المربعة كان الأصغر. كل شيء كالمعتاد - أولاً المشتقات الجزئية من الدرجة الأولى. وفق القاعدة الخطيةيمكنك التمييز مباشرة تحت أيقونة المبلغ:

إذا كنت ترغب في استخدام هذه المعلومات في مقال أو ورقة بحثية، سأكون ممتنًا جدًا للرابط الموجود في قائمة المصادر، وستجد مثل هذه الحسابات التفصيلية في أماكن قليلة:

لنقم بإنشاء نظام قياسي:

نقوم بتبسيط كل معادلة بمقدار "اثنين"، بالإضافة إلى "تقسيم" المجاميع:

ملحوظة : حلل بشكل مستقل سبب إمكانية إزالة "a" و"be" خارج رمز المجموع. بالمناسبة، رسميا يمكن القيام بذلك مع المبلغ

دعونا نعيد كتابة النظام في النموذج "التطبيقي":

وبعد ذلك تبدأ خوارزمية حل مشكلتنا في الظهور:

هل نعرف إحداثيات النقاط؟ نعلم. كميات هل يمكننا العثور عليه؟ بسهولة. دعونا نجعل أبسط نظام من معادلتين خطيتين في مجهولين("أ" و"يكون"). نقوم بحل النظام مثلا طريقة كريمرونتيجة لذلك نحصل على نقطة ثابتة. تدقيق حالة كافية للأقصى، يمكننا التحقق من أن الوظيفة عند هذه النقطة يصل بالضبط الحد الأدنى. يتضمن الفحص حسابات إضافية وبالتالي سنتركه وراء الكواليس (إذا لزم الأمر، يمكن عرض الإطار المفقودهنا ) . نستخلص النتيجة النهائية:

وظيفة أفضل طريقة (على الأقل بالمقارنة مع أي وظيفة خطية أخرى)يجعل النقاط التجريبية أقرب . بشكل تقريبي، يمر الرسم البياني الخاص به بالقرب من هذه النقاط قدر الإمكان. في التقليد الاقتصاد القياسيوتسمى أيضًا وظيفة التقريب الناتجة معادلة الانحدار الخطي المقترنة .

المشكلة قيد النظر لها أهمية عملية كبيرة. في حالة مثالنا، مكافئ. يسمح لك بالتنبؤ بحجم التداول التجاري ("الإغريقي")سيكون للمتجر قيمة أو أخرى من منطقة المبيعات (واحد أو آخر من معنى "x"). نعم، ستكون التوقعات الناتجة مجرد توقعات، ولكن في كثير من الحالات ستكون دقيقة تمامًا.

سأقوم بتحليل مشكلة واحدة فقط بالأرقام "الحقيقية"، حيث لا توجد صعوبات فيها - جميع الحسابات على مستوى المناهج الدراسية للصف السابع إلى الثامن. في 95 بالمائة من الحالات، سيُطلب منك العثور على دالة خطية فقط، ولكن في نهاية المقالة سأوضح أنه لم يعد من الصعب العثور على معادلات القطع الزائد الأمثل والدوال الأسية وبعض الدوال الأخرى.

في الواقع، كل ما تبقى هو توزيع الأشياء الجيدة الموعودة - حتى تتمكن من تعلم كيفية حل هذه الأمثلة ليس فقط بدقة، ولكن أيضًا بسرعة. نحن ندرس المعيار بعناية:

مهمة

ونتيجة لدراسة العلاقة بين مؤشرين تم الحصول على أزواج الأرقام التالية:

باستخدام طريقة المربعات الصغرى، أوجد الدالة الخطية الأقرب للدالة التجريبية (ذوي الخبرة)بيانات. أنشئ رسمًا لبناء النقاط التجريبية ورسمًا بيانيًا للدالة التقريبية في نظام الإحداثيات الديكارتي المستطيل . أوجد مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. اكتشف ما إذا كانت الميزة ستكون أفضل (من وجهة نظر طريقة المربعات الصغرى)تقريب النقاط التجريبية.

يرجى ملاحظة أن معاني "x" طبيعية، وهذا له معنى مميز ذو معنى، والذي سأتحدث عنه بعد قليل؛ لكنها بالطبع يمكن أن تكون كسرية أيضًا. بالإضافة إلى ذلك، اعتمادًا على محتوى مهمة معينة، يمكن أن تكون قيمتي "X" و"اللعبة" سالبة تمامًا أو جزئيًا. حسنًا، لقد تم تكليفنا بمهمة "مجهولة الهوية"، ونحن نبدأها حل:

نجد معاملات الدالة المثلى كحل للنظام:

لغرض تسجيل أكثر إحكاما، يمكن حذف متغير "العداد"، لأنه من الواضح بالفعل أن الجمع يتم من 1 إلى .

من الأنسب حساب المبالغ المطلوبة في شكل جدول:


يمكن إجراء الحسابات على آلة حاسبة صغيرة، ولكن من الأفضل استخدام Excel - بشكل أسرع وبدون أخطاء؛ شاهد فيديو قصير:

وهكذا نحصل على ما يلي نظام:

هنا يمكنك ضرب المعادلة الثانية بـ 3 و اطرح الثاني من حد المعادلة الأول بمصطلح. ولكن هذا هو الحظ - في الممارسة العملية، غالبا ما لا تكون الأنظمة هدية، وفي مثل هذه الحالات يتم حفظها طريقة كريمر:
مما يعني أن النظام لديه حل فريد.

دعونا تحقق. أتفهم أنك لا تريد ذلك، ولكن لماذا تتخطى الأخطاء حيث لا يمكن تفويتها على الإطلاق؟ دعونا نعوض الحل الموجود في الجانب الأيسر من كل معادلة في النظام:

تم الحصول على الطرف الأيمن من المعادلات المقابلة، مما يعني أن النظام قد تم حله بشكل صحيح.

وبالتالي فإن وظيفة التقريب المطلوبة: - من جميع الوظائف الخطيةإنها هي التي تقريب البيانات التجريبية بشكل أفضل.

على عكس مستقيم اعتماد حجم مبيعات المتجر على منطقته، والاعتماد الموجود هو يعكس (مبدأ "كلما كان أكثر، أقل")، وهذه الحقيقة تكشفها السلبية على الفور ميل. وظيفة يخبرنا أنه مع زيادة مؤشر معين بمقدار وحدة واحدة، تنخفض قيمة المؤشر التابع متوسطبنسبة 0.65 وحدة. كما يقولون، كلما ارتفع سعر الحنطة السوداء، قل بيعها.

لرسم الدالة التقريبية، دعونا نوجد قيمتيها:

وتنفيذ الرسم:

يسمى الخط المستقيم المبني خط الاتجاه (أي خط الاتجاه الخطي، أي في الحالة العامة، الاتجاه ليس بالضرورة خطًا مستقيمًا). الجميع على دراية بتعبير "التواجد في الاتجاه"، وأعتقد أن هذا المصطلح لا يحتاج إلى تعليقات إضافية.

دعونا نحسب مجموع الانحرافات التربيعية بين القيم التجريبية والنظرية. هندسيًا، هذا هو مجموع مربعات أطوال شرائح "التوت". (اثنان منها صغيران جدًا بحيث لا يمكن رؤيتهما حتى).

دعونا نلخص الحسابات في الجدول:


مرة أخرى، يمكن القيام بذلك يدويًا، فقط في حالة حدوث ذلك، سأقدم مثالاً للنقطة الأولى:

ولكن من الأكثر فعالية القيام بذلك بالطريقة المعروفة بالفعل:

ونكرر مرة أخرى: ما معنى النتيجة التي تم الحصول عليها؟من جميع الوظائف الخطيةوظيفة ذ المؤشر هو الأصغر، أي أنه في عائلته هو الأفضل تقريبًا. وهنا، بالمناسبة، السؤال الأخير للمشكلة ليس عرضيًا: ماذا لو كانت الدالة الأسية المقترحة هل سيكون من الأفضل تقريب النقاط التجريبية؟

دعونا نجد المبلغ المقابل للانحرافات التربيعية - للتمييز، سأشير إليها بالحرف "إبسيلون". التقنية هي نفسها تمامًا:


ومرة أخرى، فقط في حالة، حسابات النقطة الأولى:

في Excel نستخدم الوظيفة القياسية خبرة (يمكن العثور على بناء الجملة في تعليمات Excel).

خاتمة: مما يعني أن الدالة الأسية تقرب النقاط التجريبية بشكل أسوأ من الخط المستقيم .

ولكن هنا تجدر الإشارة إلى أن "الأسوأ" هو لا يعني بعد، ما الخطأ. لقد قمت الآن ببناء رسم بياني لهذه الدالة الأسية - وهي تمر أيضًا بالقرب من النقاط - لدرجة أنه بدون البحث التحليلي يصعب تحديد الوظيفة الأكثر دقة.

وبهذا ينتهي الحل، وأعود إلى مسألة القيم الطبيعية للحجة. في العديد من الدراسات، الاقتصادية أو الاجتماعية عادةً، تُستخدم علامات "X" الطبيعية لترقيم الأشهر أو السنوات أو فترات زمنية متساوية أخرى. لنأخذ على سبيل المثال المشكلة التالية:

تتوفر البيانات التالية عن حجم مبيعات التجزئة في المتجر للنصف الأول من العام:

باستخدام محاذاة الخط المستقيم التحليلي، حدد حجم التداول لشهر يوليو.

نعم، لا مشكلة: نرقم الأشهر 1، 2، 3، 4، 5، 6 ونستخدم الخوارزمية المعتادة، ونتيجة لذلك نحصل على معادلة - الشيء الوحيد هو أنه عندما يتعلق الأمر بالوقت، فإنهم عادةً ما يستخدمون حرف "تي" (على الرغم من أن هذا ليس بالغ الأهمية). وتظهر المعادلة الناتجة أنه في النصف الأول من العام ارتفع حجم التداول بمعدل 27.74 وحدة. كل شهر. دعونا نحصل على التوقعات لشهر يوليو (الشهر رقم 7): د.

وهناك مهام لا حصر لها مثل هذه. يمكن لأولئك الذين يرغبون في استخدام خدمة إضافية، وهي بلدي حاسبة اكسل (النسخة التجريبية)، أيّ يحل المشكلة التي تم تحليلها على الفور تقريبًا!نسخة العمل من البرنامج متاحة في مقابلأو ل رسوم رمزية.

وفي نهاية الدرس معلومات مختصرة عن إيجاد تبعيات بعض الأنواع الأخرى. في الواقع، ليس هناك الكثير مما يمكن قوله، نظرًا لأن النهج الأساسي وخوارزمية الحل تظل كما هي.

لنفترض أن ترتيب النقاط التجريبية يشبه القطع الزائد. ثم، للعثور على معاملات أفضل القطع الزائد، تحتاج إلى العثور على الحد الأدنى من الدالة - يمكن لأي شخص إجراء حسابات مفصلة والوصول إلى نظام مماثل:

ومن وجهة نظر فنية رسمية، يتم الحصول عليها من نظام "خطي". (دعنا نشير إليها بعلامة النجمة)استبدال "x" بـ . طيب وماذا عن المبالغ؟ احسب ، وبعد ذلك إلى المعاملين الأمثل "أ" و "كن" في متناول اليد.

إذا كان هناك كل الأسباب للاعتقاد بأن هذه النقاط تقع على طول منحنى لوغاريتمي، ثم للعثور على القيم المثلى نجد الحد الأدنى للدالة . رسميًا، في النظام (*) يجب استبداله بما يلي:

عند إجراء العمليات الحسابية في Excel، استخدم الدالة إل إن. أعترف أنه لن يكون من الصعب علي بشكل خاص إنشاء آلات حاسبة لكل حالة من الحالات قيد النظر، ولكن سيكون من الأفضل أن تقوم "ببرمجة" الحسابات بنفسك. مقاطع فيديو تعليمية للمساعدة.

مع الاعتماد الأسي، يكون الوضع أكثر تعقيدًا بعض الشيء. لاختزال الأمر في الحالة الخطية، نأخذ الدالة اللوغاريتمية ونستخدمها خصائص اللوغاريتم:

الآن، بمقارنة الدالة الناتجة مع الدالة الخطية، نتوصل إلى استنتاج مفاده أنه في النظام يجب استبدال (*) بـ و - بـ. للراحة ، دعنا نشير إلى:

يرجى ملاحظة أن النظام قد تم حله فيما يتعلق بـ، وبالتالي، بعد العثور على الجذور، يجب ألا تنسى إيجاد المعامل نفسه.

لتقريب النقاط التجريبية القطع المكافئ الأمثل ، ينبغي العثور عليها الحد الأدنى من وظيفة ثلاثة متغيرات . بعد تنفيذ الإجراءات القياسية، نحصل على "العمل" التالي نظام:

نعم، بالطبع، هناك مبالغ أكثر هنا، ولكن لا توجد صعوبات على الإطلاق عند استخدام التطبيق المفضل لديك. وأخيرًا، سأخبرك بكيفية إجراء فحص سريع باستخدام Excel وإنشاء خط الاتجاه المطلوب: قم بإنشاء مخطط مبعثر، وحدد أي نقطة باستخدام الماوس وانقر بزر الماوس الأيمن على تحديد الخيار "إضافة خط الاتجاه". بعد ذلك، حدد نوع المخطط وعلى علامة التبويب "خيارات"تفعيل الخيار "إظهار المعادلة على الرسم التخطيطي". نعم

كما هو الحال دائمًا، أريد أن أنهي المقال ببعض العبارات الجميلة، وكدت أكتب "كن في الاتجاه!" لكنه غير رأيه في الوقت المناسب. وليس لأنها نمطية. لا أعرف كيف هو الأمر بالنسبة لأي شخص، لكنني لا أريد حقًا اتباع الاتجاه الأمريكي وخاصة الأوروبي الذي يتم الترويج له =) لذلك، أتمنى أن يلتزم كل واحد منكم بخطه الخاص!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

تعد طريقة المربعات الصغرى واحدة من أكثر الطرق شيوعًا وأكثرها تطورًا نظرًا لخصائصها بساطة وكفاءة طرق تقدير معلمات نماذج الاقتصاد القياسي الخطي. في الوقت نفسه، عند استخدامه، يجب مراعاة بعض الحذر، لأن النماذج التي تم إنشاؤها باستخدامها قد لا تفي بعدد من المتطلبات لجودة معلماتها، ونتيجة لذلك، لا تعكس أنماط تطوير العملية "بشكل جيد" كافٍ.

دعونا نفكر في إجراء تقدير معلمات نموذج الاقتصاد القياسي الخطي باستخدام طريقة المربعات الصغرى بمزيد من التفصيل. ويمكن تمثيل هذا النموذج بشكل عام بالمعادلة (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

البيانات الأولية عند تقدير المعلمات a 0 , a 1 ,..., n هي متجه لقيم المتغير التابع ذ= (y 1 , y 2 , ... , y T)" ومصفوفة قيم المتغيرات المستقلة

حيث يتوافق العمود الأول، المكون من الآحاد، مع معامل النموذج.

حصلت طريقة المربعات الصغرى على اسمها بناءً على المبدأ الأساسي الذي يجب أن تفي به تقديرات المعلمات التي يتم الحصول عليها على أساسها: يجب أن يكون مجموع مربعات خطأ النموذج في حده الأدنى.

أمثلة على حل المسائل باستخدام طريقة المربعات الصغرى

مثال 2.1.لدى المؤسسة التجارية شبكة مكونة من 12 متجرًا، وترد في الجدول معلومات عن أنشطتها. 2.1.

ترغب إدارة المؤسسة في معرفة كيف يعتمد حجم المبيعات السنوية على مساحة البيع بالتجزئة في المتجر.

الجدول 2.1

عدد مخزن حجم التداول السنوي مليون روبل. مساحة التجزئة ألف م2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

حل المربعات الصغرى.دعونا نشير إلى حجم المبيعات السنوي للمتجر، مليون روبل؛ - مساحة التجزئة للمحل الألف م2.

الشكل 2.1. مخطط التشتت على سبيل المثال 2.1

لتحديد شكل العلاقة الوظيفية بين المتغيرات سنقوم ببناء مخطط مبعثر (الشكل 2.1).

استنادًا إلى الرسم البياني المبعثر، يمكننا أن نستنتج أن حجم المبيعات السنوي يعتمد بشكل إيجابي على مساحة البيع بالتجزئة (أي، ستزداد مع الزيادة). أنسب شكل من أشكال الاتصال الوظيفي هو خطي.

يتم عرض المعلومات لمزيد من الحسابات في الجدول. 2.2. باستخدام طريقة المربعات الصغرى، نقوم بتقدير معلمات النموذج الاقتصادي القياسي الخطي ذو العامل الواحد

الجدول 2.2

ر ذ ر × 1 طن ي تي 2 × 1 طن 2 × 1 طن و ر
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
س 819,52 10,68 65008,554 11,4058 858,3991
متوسط 68,29 0,89

هكذا،

لذلك، مع زيادة مساحة البيع بالتجزئة بمقدار 1 ألف متر مربع، مع تساوي العوامل الأخرى، يزيد متوسط ​​\u200b\u200bحجم المبيعات السنوي بمقدار 67.8871 مليون روبل.

مثال 2.2.لاحظت إدارة الشركة أن حجم المبيعات السنوي لا يعتمد فقط على مساحة مبيعات المتجر (انظر المثال 2.1)، ولكن أيضًا على متوسط ​​عدد الزوار. يتم عرض المعلومات ذات الصلة في الجدول. 2.3.

الجدول 2.3

حل.دعونا نشير إلى - متوسط ​​عدد زوار المتجر يوميًا ألف شخص.

لتحديد شكل العلاقة الوظيفية بين المتغيرات سنقوم ببناء مخطط مبعثر (الشكل 2.2).

استنادًا إلى مخطط التشتت، يمكننا أن نستنتج أن معدل الدوران السنوي يعتمد بشكل إيجابي على متوسط ​​عدد الزوار يوميًا (أي، سوف يزيد مع الزيادة). شكل الاعتماد الوظيفي خطي.

أرز. 2.2. مخطط التشتت على سبيل المثال 2.2

الجدول 2.4

ر × 2 طن × 2 طن 2 ص × 2t × 1 طن × 2 طن
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
س 127,83 1410,44 9160,9934 118,9728
متوسط 10,65

بشكل عام، من الضروري تحديد معالم النموذج الاقتصادي القياسي ثنائي العامل

y t = أ 0 + أ 1 × 1t + أ 2 × 2t + ε t

يتم عرض المعلومات المطلوبة لمزيد من الحسابات في الجدول. 2.4.

دعونا نقدر معلمات نموذج الاقتصاد القياسي الخطي ثنائي العامل باستخدام طريقة المربعات الصغرى.

هكذا،

يوضح تقدير المعامل =61.6583 أنه، مع تساوي الأمور الأخرى، مع زيادة مساحة البيع بالتجزئة بمقدار ألف م 2، سيزداد حجم المبيعات السنوي بمتوسط ​​61.6583 مليون روبل.

ويبين المعامل التقديري = 2.2748 أنه، مع تساوي الأمور الأخرى، مع زيادة متوسط ​​عدد الزوار لكل ألف شخص. في اليوم، سيزداد حجم المبيعات السنوي بمعدل 2.2748 مليون روبل.

مثال 2.3.باستخدام المعلومات الواردة في الجدول. 2.2 و2.4، تقدير معلمة النموذج الاقتصادي القياسي ذو العامل الواحد

أين هي القيمة المركزية لحجم المبيعات السنوي للمتجر، مليون روبل؛ - القيمة المركزية لمتوسط ​​عدد زوار المتجر اليومي بالألف شخص. (انظر الأمثلة 2.1-2.2).

حل.يتم عرض المعلومات الإضافية المطلوبة للحسابات في الجدول. 2.5.

الجدول 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
كمية 48,4344 431,0566

وباستخدام الصيغة (2.35) نحصل على

هكذا،

http://www.cleverstudents.ru/articles/mnk.html

مثال.

بيانات تجريبية عن قيم المتغيرات Xو فيوترد في الجدول.

ونتيجة لمواءمتها، يتم الحصول على الوظيفة

استخدام طريقة المربعات الصغرى، قم بتقريب هذه البيانات من خلال الاعتماد الخطي ص=الفأس+ب(ابحث عن المعلمات أو ب). اكتشف أي من الخطين أفضل (بمعنى طريقة المربعات الصغرى) يقوم بمحاذاة البيانات التجريبية. جعل الرسم.

حل.

في مثالنا ن = 5. نقوم بملء الجدول لسهولة حساب المبالغ المضمنة في صيغ المعاملات المطلوبة.

يتم الحصول على القيم الموجودة في الصف الرابع من الجدول عن طريق ضرب قيم الصف الثاني في قيم الصف الثالث لكل رقم أنا.

يتم الحصول على القيم الموجودة في الصف الخامس من الجدول عن طريق تربيع القيم الموجودة في الصف الثاني لكل رقم أنا.

القيم الموجودة في العمود الأخير من الجدول هي مجموع القيم عبر الصفوف.

نستخدم صيغ طريقة المربعات الصغرى لإيجاد المعاملات أو ب. نستبدل فيها القيم المقابلة من العمود الأخير من الجدول:

لذلك، ص = 0.165س+2.184- الخط المستقيم التقريبي المطلوب.

يبقى لمعرفة أي من الخطوط ص = 0.165س+2.184أو تقريب البيانات الأصلية بشكل أفضل، أي إجراء تقدير باستخدام طريقة المربعات الصغرى.

دليل.

بحيث عندما وجدت أو بتأخذ الدالة أصغر قيمة، فمن الضروري عند هذه النقطة أن تكون مصفوفة الشكل التربيعي للتفاضل من الدرجة الثانية للدالة كان إيجابيا واضحا. دعونا نظهر ذلك.

التفاضل من الدرجة الثانية له الشكل:

إنه

ومن ثم، فإن المصفوفة ذات الصورة التربيعية لها الصورة

وقيم العناصر لا تعتمد عليها أو ب.

دعونا نبين أن المصفوفة إيجابية محددة. للقيام بذلك، يجب أن تكون القاصرات الزاوية إيجابية.

الدرجة الأولى الزاوي الصغرى . عدم المساواة صارمة، منذ النقاط

100 روبيةمكافأة للطلب الأول

حدد نوع العمل عمل الدبلوم عمل الدورة ملخص أطروحة الماجستير تقرير الممارسة تقرير المقال مراجعة العمل الاختباري دراسة حل المشكلات خطة العمل إجابات على الأسئلة العمل الإبداعي مقال الرسم المقالات ترجمة العروض التقديمية الكتابة أخرى زيادة تفرد النص أطروحة الماجستير العمل المختبري المساعدة عبر الإنترنت

تعرف على السعر

طريقة المربعات الصغرى هي تقنية رياضية (رياضية-إحصائية) تستخدم لمحاذاة السلاسل الزمنية، وتحديد شكل الارتباط بين المتغيرات العشوائية، وما إلى ذلك. وتتكون من حقيقة أن الدالة التي تصف هذه الظاهرة يتم تقريبها بواسطة دالة أبسط. علاوة على ذلك، يتم تحديد الأخير بطريقة يكون فيها الانحراف المعياري (انظر التشتت) للمستويات الفعلية للوظيفة عند النقاط المرصودة من تلك المحاذية هو الأصغر.

على سبيل المثال، وفقا للبيانات المتاحة ( الحادي عشر,يي) (أنا = 1, 2, ..., ن) يتم إنشاء مثل هذا المنحنى ذ = أ + bx، حيث يتم تحقيق الحد الأدنى لمجموع الانحرافات المربعة

أي أنه يتم تصغير دالة تعتمد على معلمتين: أ- الجزء على المحور الإحداثي و ب- منحدر الخط المستقيم.

معادلات تعطي الشروط اللازمة لتصغير الدالة س(أ,ب)، وتسمى المعادلات العادية.كدوال تقريبية، لا يتم استخدام الخطية فقط (المحاذاة على طول خط مستقيم)، ولكن أيضًا التربيعية، والقطع المكافئ، والأسي، وما إلى ذلك للحصول على مثال لمحاذاة سلسلة زمنية على طول خط مستقيم، انظر الشكل. M.2 حيث مجموع المسافات المربعة ( ذ 1 – ج 1)2 + (ذ 2 – ج 2)2 .... هو الأصغر، والخط المستقيم الناتج يعكس بشكل أفضل اتجاه سلسلة ديناميكية من الملاحظات لمؤشر معين مع مرور الوقت.

بالنسبة لتقديرات OLS غير المتحيزة، من الضروري والكافي تحقيق الشرط الأكثر أهمية لتحليل الانحدار: التوقع الرياضي للخطأ العشوائي، المشروط بالعوامل، يجب أن يساوي الصفر. ويتحقق هذا الشرط على وجه الخصوص إذا: 1. كان التوقع الرياضي للأخطاء العشوائية صفراً، و2. كانت العوامل والأخطاء العشوائية متغيرات عشوائية مستقلة. يمكن اعتبار الشرط الأول محققًا دائمًا للنماذج ذات الثابت، حيث أن الثابت يأخذ توقعًا رياضيًا غير صفري للأخطاء. الشرط الثاني – شرط نشوء العوامل الخارجية – هو شرط أساسي. إذا لم يتم استيفاء هذه الخاصية، فيمكننا أن نفترض أن أي تقديرات تقريبًا ستكون غير مرضية للغاية: فهي لن تكون متسقة حتى (أي أنه حتى كمية كبيرة جدًا من البيانات لا تسمح لنا بالحصول على تقديرات عالية الجودة في هذه الحالة ).

الطريقة الأكثر شيوعًا للتقدير الإحصائي لمعلمات معادلات الانحدار هي طريقة المربعات الصغرى. تعتمد هذه الطريقة على عدد من الافتراضات المتعلقة بطبيعة البيانات ونتائج النموذج. أهمها التقسيم الواضح للمتغيرات الأصلية إلى تابعة ومستقلة، وعدم ارتباط العوامل المدرجة في المعادلات، وخطية العلاقة، وغياب الارتباط الذاتي للبقية، ومساواة توقعاتها الرياضية بالصفر والثابت تشتت.

إحدى الفرضيات الرئيسية لـ OLS هي افتراض المساواة في تباينات الانحرافات ei، أي. يجب أن يكون انتشارها حول القيمة المتوسطة (الصفر) للسلسلة قيمة ثابتة. هذه الخاصية تسمى المثلية. من الناحية العملية، غالبًا ما تكون تباينات الانحرافات غير متساوية، أي أنه يتم ملاحظة عدم تجانسها. قد يكون هذا لأسباب مختلفة. على سبيل المثال، قد تكون هناك أخطاء في البيانات المصدر. قد يكون للأخطاء العرضية في معلومات المصدر، مثل الأخطاء في ترتيب الأرقام، تأثير كبير على النتائج. في كثير من الأحيان، يتم ملاحظة انتشار أكبر للانحرافات مع القيم الكبيرة للمتغير التابع (المتغيرات). إذا كانت البيانات تحتوي على خطأ كبير، فمن الطبيعي أن يكون انحراف قيمة النموذج المحسوبة عن البيانات الخاطئة كبيرًا أيضًا. وللتخلص من هذا الخطأ، نحتاج إلى تقليل مساهمة هذه البيانات في نتائج الحساب، وتخصيص وزن أقل لها مقارنة بجميع البيانات الأخرى. يتم تنفيذ هذه الفكرة في OLS المرجح.

طريقة المربع الأصغر

طريقة المربع الأصغر ( OLS، OLS، المربعات الصغرى العادية) - إحدى الطرق الأساسية لتحليل الانحدار لتقدير المعلمات غير المعروفة لنماذج الانحدار باستخدام بيانات العينة. تعتمد الطريقة على تقليل مجموع مربعات بقايا الانحدار.

تجدر الإشارة إلى أن طريقة المربعات الصغرى نفسها يمكن أن تسمى طريقة لحل مشكلة في أي مجال إذا كان الحل يكمن في أو يلبي بعض المعايير لتقليل مجموع مربعات بعض وظائف المتغيرات المطلوبة. لذلك، يمكن أيضًا استخدام طريقة المربعات الصغرى للتمثيل التقريبي (تقريب) لدالة معينة بواسطة دوال أخرى (أبسط)، عند العثور على مجموعة من الكميات التي تحقق المعادلات أو القيود، والتي يزيد عددها عن عدد هذه الكميات ، إلخ.

جوهر الشركات المتعددة الجنسيات

دع بعض النماذج (البارامترية) للعلاقة الاحتمالية (الانحدارية) بين المتغير (الموضح) ذوالعديد من العوامل (المتغيرات التفسيرية) س

أين هو متجه معلمات النموذج غير المعروفة

- خطأ في النموذج العشوائي.

ولتكن هناك أيضًا نماذج من الملاحظات لقيم هذه المتغيرات. ليكن رقم الملاحظة (). ثم هي قيم المتغيرات في الملاحظة. بعد ذلك، بالنسبة لقيم المعلمات b، من الممكن حساب القيم النظرية (النموذجية) للمتغير الموضح y:

حجم البقايا يعتمد على قيم المعلمات ب.

يتمثل جوهر طريقة المربعات الصغرى (العادية والكلاسيكية) في العثور على المعلمات ب التي يكون مجموع مربعات القيم المتبقية فيها (eng. مجموع المربعات المتبقية) سيكون الحد الأدنى:

في الحالة العامة، يمكن حل هذه المشكلة عن طريق طرق التحسين العددي (التقليل). في هذه الحالة يتحدثون عنها المربعات الصغرى غير الخطية(NLS أو NLLS - الإنجليزية) المربعات الصغرى غير الخطية). في كثير من الحالات من الممكن الحصول على حل تحليلي. لحل مشكلة التقليل، من الضروري إيجاد نقاط ثابتة للدالة عن طريق تمييزها فيما يتعلق بالمعلمات غير المعروفة ب، ومساواة المشتقات بالصفر وحل نظام المعادلات الناتج:

إذا كانت الأخطاء العشوائية للنموذج موزعة بشكل طبيعي، ولها نفس التباين، وغير مرتبطة، فإن تقديرات معلمات OLS هي نفس تقديرات الاحتمالية القصوى (MLM).

OLS في حالة النموذج الخطي

دع اعتماد الانحدار يكون خطيًا:

يترك ذهو متجه عمود لملاحظات المتغير الموضح، وهو عبارة عن مصفوفة لملاحظات العامل (صفوف المصفوفة هي متجهات قيم العامل في ملاحظة معينة، الأعمدة هي متجه قيم عامل معين في جميع الملاحظات). تمثيل المصفوفة للنموذج الخطي هو:

عندها سيكون متجه تقديرات المتغير الموضح ومتجه بقايا الانحدار متساويين

وبناء على ذلك، فإن مجموع مربعات بقايا الانحدار سيكون مساوياً لـ

بتفريق هذه الدالة فيما يتعلق بمتجه المعلمات ومساواة المشتقات بالصفر، نحصل على نظام المعادلات (في شكل مصفوفة):

.

يعطي حل نظام المعادلات هذا الصيغة العامة لتقديرات المربعات الصغرى للنموذج الخطي:

ولأغراض تحليلية، فإن التمثيل الأخير لهذه الصيغة مفيد. إذا كانت البيانات في نموذج الانحدار تركزت، فإن المصفوفة الأولى في هذا التمثيل لها معنى مصفوفة التغاير المشترك للعوامل، والثانية هي متجه لتغايرات العوامل مع المتغير التابع. إذا بالإضافة إلى ذلك فإن البيانات أيضا تطبيعإلى MSE (أي في نهاية المطاف موحدة) ، فإن المصفوفة الأولى لها معنى مصفوفة ارتباط العينة للعوامل، والمتجه الثاني - ناقل ارتباطات العينة للعوامل مع المتغير التابع.

خاصية مهمة لتقديرات OLS للنماذج مع ثابت- يمر خط الانحدار المبني عبر مركز ثقل بيانات العينة أي أن المساواة قد تحققت:

على وجه الخصوص، في الحالة القصوى، عندما يكون التراجع الوحيد ثابتًا، نجد أن تقدير OLS للمعلمة الوحيدة (الثابت نفسه) يساوي متوسط ​​قيمة المتغير الموضح. أي أن الوسط الحسابي، المعروف بخصائصه الجيدة من قوانين الأعداد الكبيرة، هو أيضًا تقدير بالمربعات الصغرى - فهو يفي بمعيار الحد الأدنى لمجموع الانحرافات المربعة عنه.

مثال: أبسط الانحدار (الزوجي).

في حالة الانحدار الخطي المقترن، يتم تبسيط صيغ الحساب (يمكنك الاستغناء عن جبر المصفوفات):

خصائص مقدرات OLS

أولا وقبل كل شيء، نلاحظ أنه بالنسبة للنماذج الخطية، فإن تقديرات OLS هي تقديرات خطية، على النحو التالي من الصيغة أعلاه. بالنسبة لتقديرات OLS غير المتحيزة، من الضروري والكافي تحقيق الشرط الأكثر أهمية لتحليل الانحدار: التوقع الرياضي للخطأ العشوائي، المشروط بالعوامل، يجب أن يساوي الصفر. وهذا الشرط، على وجه الخصوص، يتم استيفاءه إذا

  1. التوقع الرياضي للأخطاء العشوائية هو صفر، و
  2. العوامل والأخطاء العشوائية هي متغيرات عشوائية مستقلة.

الشرط الثاني – شرط نشوء العوامل الخارجية – هو شرط أساسي. إذا لم يتم استيفاء هذه الخاصية، فيمكننا أن نفترض أن أي تقديرات تقريبًا ستكون غير مرضية للغاية: فهي لن تكون متسقة (أي أنه حتى كمية كبيرة جدًا من البيانات لا تسمح لنا بالحصول على تقديرات عالية الجودة في هذه الحالة ). في الحالة الكلاسيكية، يتم وضع افتراض أقوى حول حتمية العوامل، بدلاً من الخطأ العشوائي، والذي يعني تلقائيًا أن شرط التولد الخارجي قد تم استيفائه. في الحالة العامة، من أجل اتساق التقديرات، يكفي استيفاء شرط التجانس الخارجي مع تقارب المصفوفة مع مصفوفة غير مفردة مع زيادة حجم العينة إلى ما لا نهاية.

لكي تكون تقديرات المربعات الصغرى (العادية) فعالة أيضًا (الأفضل في فئة التقديرات الخطية غير المتحيزة)، بالإضافة إلى الاتساق وعدم التحيز، يجب استيفاء خصائص إضافية للخطأ العشوائي:

يمكن صياغة هذه الافتراضات لمصفوفة التغاير لمتجه الخطأ العشوائي

يسمى النموذج الخطي الذي يحقق هذه الشروط كلاسيكي. تقديرات OLS للانحدار الخطي الكلاسيكي هي تقديرات غير متحيزة ومتسقة وأكثر فعالية في فئة جميع التقديرات الخطية غير المتحيزة (في الأدبيات الإنجليزية، يُستخدم الاختصار أحيانًا أزرق (أفضل مقدر خطي غير مقيد) - أفضل تقدير خطي غير متحيز؛ في الأدب الروسي يتم الاستشهاد بنظرية غاوس ماركوف في كثير من الأحيان). كما هو واضح، فإن مصفوفة التغاير لمتجه تقديرات المعامل ستكون مساوية لما يلي:

عملية شريان الحياة المعممة

تسمح طريقة المربعات الصغرى بالتعميم على نطاق واسع. بدلاً من تقليل مجموع مربعات البقايا، يمكن للمرء تقليل بعض الأشكال التربيعية المحددة الإيجابية لمتجه البقايا، حيث توجد مصفوفة وزن محددة إيجابية متماثلة. تعتبر المربعات الصغرى التقليدية حالة خاصة لهذا النهج، حيث تتناسب مصفوفة الوزن مع مصفوفة الهوية. كما هو معروف من نظرية المصفوفات المتماثلة (أو العوامل)، لمثل هذه المصفوفات هناك تحلل. وبالتالي، يمكن تمثيل الدالة المحددة على النحو التالي، أي أنه يمكن تمثيل هذه الدالة كمجموع مربعات بعض "البقايا" المحولة. وهكذا، يمكننا التمييز بين فئة من أساليب المربعات الصغرى - أساليب LS (المربعات الصغرى).

لقد ثبت (نظرية آيتكين) أنه بالنسبة لنموذج الانحدار الخطي المعمم (الذي لا يتم فيه فرض أي قيود على مصفوفة التغاير للأخطاء العشوائية)، فإن الأكثر فعالية (في فئة التقديرات الخطية غير المتحيزة) هي ما يسمى بالتقديرات. المربعات الصغرى المعممة (GLS - المربعات الصغرى المعممة)- طريقة LS بمصفوفة وزنية تساوي مصفوفة التغاير العكسي للأخطاء العشوائية : .

يمكن إثبات أن صيغة تقديرات GLS لمعلمات النموذج الخطي لها الشكل

وبالتالي فإن مصفوفة التغاير لهذه التقديرات ستكون مساوية لـ

في الواقع، يكمن جوهر OLS في تحويل (خطي) معين (P) للبيانات الأصلية وتطبيق OLS العادي على البيانات المحولة. والغرض من هذا التحويل هو أنه بالنسبة للبيانات المحولة، فإن الأخطاء العشوائية تلبي بالفعل الافتراضات الكلاسيكية.

OLS المرجح

في حالة مصفوفة الوزن القطرية (وبالتالي مصفوفة التغاير للأخطاء العشوائية)، لدينا ما يسمى بالمربعات الصغرى الموزونة (WLS). في هذه الحالة، يتم تقليل المجموع المرجح لمربعات بقايا النموذج، أي أن كل ملاحظة تتلقى "وزنًا" يتناسب عكسيًا مع تباين الخطأ العشوائي في هذه الملاحظة: . في الواقع، يتم تحويل البيانات عن طريق ترجيح الملاحظات (القسمة على مقدار يتناسب مع الانحراف المعياري المقدر للأخطاء العشوائية)، ويتم تطبيق عملية OLS العادية على البيانات المرجحة.

بعض الحالات الخاصة لاستخدام MNC في الممارسة العملية

تقريب الاعتماد الخطي

دعونا ننظر في الحالة عندما، نتيجة لدراسة اعتماد كمية عددية معينة على كمية عددية معينة (قد يكون هذا، على سبيل المثال، اعتماد الجهد على القوة الحالية: حيث تكون القيمة الثابتة، مقاومة الموصل)، وتم إجراء قياسات لهذه الكميات، ونتيجة لذلك تم تحديد القيم والقيم المقابلة لها. ويجب تسجيل بيانات القياس في جدول.

طاولة. نتائج القياس.

رقم القياس
1
2
3
4
5
6

والسؤال هو: ما هي قيمة المعامل التي يمكن اختيارها لوصف التبعية بشكل أفضل؟ وفقا لطريقة المربعات الصغرى، يجب أن تكون هذه القيمة بحيث يكون مجموع الانحرافات التربيعية للقيم من القيم

كان الحد الأدنى

مجموع الانحرافات التربيعية له حد أقصى واحد - وهو الحد الأدنى، مما يسمح لنا باستخدام هذه الصيغة. دعونا نجد من هذه الصيغة قيمة المعامل. للقيام بذلك، نقوم بتحويل جانبه الأيسر على النحو التالي:

الصيغة الأخيرة تسمح لنا بإيجاد قيمة المعامل، وهو ما هو مطلوب في المسألة.

قصة

حتى بداية القرن التاسع عشر. ولم يكن لدى العلماء قواعد معينة لحل نظام المعادلات الذي يكون فيه عدد المجهولين أقل من عدد المعادلات؛ حتى ذلك الوقت، تم استخدام تقنيات خاصة تعتمد على نوع المعادلات وعلى ذكاء الآلات الحاسبة، وبالتالي توصلت الآلات الحاسبة المختلفة، بناءً على نفس بيانات المراقبة، إلى استنتاجات مختلفة. كان غاوس (1795) أول من استخدم الطريقة، واكتشفها ليجيندر (1805) بشكل مستقل ونشرها تحت اسمها الحديث (فرنسي. طريقة المحاجر ) . ربط لابلاس الطريقة بنظرية الاحتمالات، ونظر عالم الرياضيات الأمريكي أدريان (1808) في تطبيقاتها النظرية الاحتمالية. وقد انتشرت هذه الطريقة على نطاق واسع وتم تحسينها من خلال المزيد من الأبحاث التي أجراها إنكي، وبيسل، وهانسن وآخرون.

الاستخدامات البديلة لـ OLS

يمكن أيضًا استخدام فكرة طريقة المربعات الصغرى في حالات أخرى لا تتعلق مباشرة بتحليل الانحدار. الحقيقة هي أن مجموع المربعات هو أحد مقاييس القرب الأكثر شيوعًا للمتجهات (القياس الإقليدي في المساحات محدودة الأبعاد).

أحد التطبيقات هو "حل" أنظمة المعادلات الخطية التي يكون فيها عدد المعادلات أكبر من عدد المتغيرات

حيث المصفوفة ليست مربعة، بل مستطيلة الحجم.

مثل هذا النظام من المعادلات، في الحالة العامة، ليس له حل (إذا كانت المرتبة في الواقع أكبر من عدد المتغيرات). لذلك، لا يمكن "حل" هذا النظام إلا بمعنى اختيار مثل هذا المتجه لتقليل "المسافة" بين المتجهات و. للقيام بذلك، يمكنك تطبيق معيار تقليل مجموع مربعات الاختلافات بين الجانبين الأيسر والأيمن لمعادلات النظام، أي. من السهل توضيح أن حل مشكلة التصغير هذه يؤدي إلى حل نظام المعادلات التالي

إذا كانت كمية فيزيائية معينة تعتمد على كمية أخرى، فيمكن دراسة هذا الاعتماد عن طريق قياس y عند قيم مختلفة لـ x. ونتيجة للقياسات يتم الحصول على عدد من القيم:

س 1، س 2، ...، س ط، ...، س ن؛

ذ 1 , ص 2 , ..., ذ ط , ... , ذ ن .

بناءً على بيانات مثل هذه التجربة، من الممكن إنشاء رسم بياني للاعتماد y = ƒ(x). يتيح المنحنى الناتج الحكم على شكل الدالة ƒ(x). ومع ذلك، فإن المعاملات الثابتة التي تدخل في هذه الدالة تظل مجهولة. ويمكن تحديدها باستخدام طريقة المربعات الصغرى. النقاط التجريبية، كقاعدة عامة، لا تقع بالضبط على المنحنى. تتطلب طريقة المربعات الصغرى أن يكون مجموع مربعات انحرافات النقاط التجريبية عن المنحنى، أي 2 كان الأصغر.

من الناحية العملية، يتم استخدام هذه الطريقة في أغلب الأحيان (وببساطة) في حالة العلاقة الخطية، أي. متى

ص = ك سأو ص = أ + ب س.

الاعتماد الخطي واسع الانتشار في الفيزياء. وحتى عندما تكون العلاقة غير خطية، فإنهم عادةً ما يحاولون إنشاء رسم بياني للحصول على خط مستقيم. على سبيل المثال، إذا افترض أن معامل انكسار الزجاج n يرتبط بالطول الموجي للضوء α بالعلاقة n = a + b/lect 2، فسيتم رسم اعتماد n على lect -2 على الرسم البياني.

النظر في التبعية ص = ك س(خط مستقيم يمر بنقطة الأصل). لنقم بتكوين القيمة φ مجموع مربعات انحرافات نقاطنا عن الخط المستقيم

قيمة φ تكون دائمًا موجبة وتتبين أنها أصغر كلما اقتربت نقاطنا من الخط المستقيم. تنص طريقة المربعات الصغرى على أنه يجب اختيار قيمة k بحيث يكون لـ φ حد أدنى


أو
(19)

يظهر الحساب أن خطأ الجذر التربيعي في تحديد قيمة k يساوي

, (20)
حيث n هو عدد القياسات.

دعونا الآن نفكر في حالة أكثر صعوبة بعض الشيء، عندما يجب أن تلبي النقاط الصيغة ص = أ + ب س(خط مستقيم لا يمر بنقطة الأصل).

وتتمثل المهمة في العثور على أفضل قيم a و b من مجموعة القيم المتوفرة x i, y i.

دعونا مرة أخرى نشكل الصيغة التربيعية φ، التي تساوي مجموع الانحرافات المربعة للنقاط x i، y i من الخط المستقيم

وابحث عن قيم a و b التي يوجد لـ φ حد أدنى لها

;

.

.

الحل المشترك لهذه المعادلات يعطي

(21)

جذر متوسط ​​الأخطاء المربعة لتحديد a وb متساويان

(23)

.  (24)

عند معالجة نتائج القياس باستخدام هذه الطريقة، يكون من المناسب تلخيص جميع البيانات في جدول يتم فيه حساب جميع المبالغ المضمنة في الصيغ (19)(24) بشكل مبدئي. وترد أشكال هذه الجداول في الأمثلة أدناه.

مثال 1.تمت دراسة المعادلة الأساسية لديناميات الحركة الدورانية ε = M/J (خط مستقيم يمر عبر نقطة الأصل). عند قيم مختلفة للحظة M، تم قياس التسارع الزاوي ε لجسم معين. مطلوب تحديد لحظة القصور الذاتي لهذا الجسم. يتم سرد نتائج قياس لحظة القوة والتسارع الزاوي في العمودين الثاني والثالث الجدول 5.

الجدول 5
ن م، ن م ε، ق -1 م 2 م ε ε - كم (ε - كم) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

باستخدام الصيغة (19) نحدد:

.

لتحديد جذر متوسط ​​مربع الخطأ، نستخدم الصيغة (20)

0.005775كلغ-1 · م -2 .

وفقا للصيغة (18) لدينا

; .

SJ = (2.996 0.005775)/0.3337 = 0.05185 كجم م 2.

بعد ضبط الموثوقية P = 0.95، باستخدام جدول معاملات الطالب لـ n = 5، نجد t = 2.78 ونحدد الخطأ المطلق ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 كجم م 2.

لنكتب النتائج في النموذج:

ي = (3.0 ± 0.2) كجم م 2;


مثال 2.دعونا نحسب معامل درجة الحرارة لمقاومة المعدن باستخدام طريقة المربعات الصغرى. المقاومة تعتمد خطيا على درجة الحرارة

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

يحدد الحد الحر المقاومة R 0 عند درجة حرارة 0 درجة مئوية، ومعامل الانحدار هو حاصل ضرب معامل درجة الحرارة α والمقاومة R 0 .

وترد نتائج القياسات والحسابات في الجدول ( انظر الجدول 6).

الجدول 6
ن ر°، ق ص، أوم ر-¯ر (ر-¯ر) 2 (ر-¯ر)ص ص - بت - أ (ص - ب - أ) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/ن 85.83333 1.4005 – – – – –

باستخدام الصيغ (21)، (22) نحدد

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 أوم.

دعونا نجد خطأ في تعريف α. وبما أن ، وفقا للصيغة (18) لدينا:

.

باستخدام الصيغ (23)، (24) لدينا

;

0.014126 أوم.

بعد ضبط الموثوقية على P = 0.95، باستخدام جدول معاملات الطالب لـ n = 6، نجد t = 2.57 ونحدد الخطأ المطلق Δα = 2.57 0.000132 = 0.000338 درجة -1.

α = (23 ± 4) 10 -4 يشيد-1 عند P = 0.95.


مثال 3.مطلوب تحديد نصف قطر انحناء العدسة باستخدام حلقات نيوتن. تم قياس نصف قطر حلقات نيوتن r m وتم تحديد أعداد هذه الحلقات m. يرتبط نصف قطر حلقات نيوتن بنصف قطر انحناء العدسة R ورقم الحلقة بالمعادلة

ص 2 م = م LAR - 2 د 0 ر،

حيث d 0 سمك الفجوة بين العدسة واللوحة المتوازية (أو تشوه العدسة)،

 الطول الموجي للضوء الساقط.

ν = (600 ± 6) نانومتر؛
ص 2 م = ص؛
م = س؛
αR = ب؛
-2د 0 ر = أ،

ثم المعادلة سوف تأخذ الشكل ص = أ + ب س.

.

يتم إدخال نتائج القياسات والحسابات الجدول 7.

الجدول 7
ن س = م ص = ص 2، 10 -2 مم 2 مم (م -¯م) 2 (م -¯ م)ذ ص - ب س - أ، 10 -4 (ص - ب س - أ) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/ن 3.5 20.8548333 – – – – –