المربعات الصغرى للأخطاء المطلقة تقريب البيانات التجريبية

دعونا نقرب الدالة بواسطة متعددة الحدود من الدرجة 2. للقيام بذلك، نحسب معاملات النظام العادي للمعادلات:

, ,

لنقم بإنشاء نظام عادي للمربعات الصغرى، والذي يحتوي على النموذج:

من السهل العثور على حل النظام:،،، .

وهكذا تم العثور على كثيرة الحدود من الدرجة الثانية: .

المعلومات النظرية

العودة إلى الصفحة<Введение в вычислительную математику. Примеры>

مثال 2. العثور على الدرجة المثلى لكثيرة الحدود.

العودة إلى الصفحة<Введение в вычислительную математику. Примеры>

مثال 3. اشتقاق نظام عادي من المعادلات لإيجاد معلمات الاعتماد التجريبي.

دعونا نشتق نظام المعادلات لتحديد المعاملات والوظائف ، الذي ينفذ تقريب الجذر المتوسط ​​لدالة معينة بالنقاط. دعونا نؤلف دالة واكتب الشرط الأقصى اللازم لذلك:

ثم سيأخذ النظام العادي الشكل:

لقد حصلنا على نظام خطي من المعادلات لمعلمات غير معروفة، ويمكن حله بسهولة.

المعلومات النظرية

العودة إلى الصفحة<Введение в вычислительную математику. Примеры>

مثال.

بيانات تجريبية عن قيم المتغيرات Xو فيوترد في الجدول.

ونتيجة لمواءمتها، يتم الحصول على الوظيفة

استخدام طريقة المربعات الصغرى، قم بتقريب هذه البيانات من خلال الاعتماد الخطي ص=الفأس+ب(ابحث عن المعلمات أو ب). اكتشف أي من الخطين أفضل (بمعنى طريقة المربعات الصغرى) يقوم بمحاذاة البيانات التجريبية. جعل الرسم.

جوهر طريقة المربعات الصغرى (LSM).

وتتمثل المهمة في العثور على معاملات الاعتماد الخطية التي تكون فيها وظيفة متغيرين أو بيأخذ أصغر قيمة. وهذا هو، نظرا أو بسيكون مجموع الانحرافات التربيعية للبيانات التجريبية عن الخط المستقيم الموجود هو الأصغر. هذا هو بيت القصيد من طريقة المربعات الصغرى.

وبالتالي، فإن حل المثال يتلخص في إيجاد الحد الأقصى لدالة لمتغيرين.

اشتقاق الصيغ لإيجاد المعاملات.

تم تجميع وحل نظام من معادلتين بمجهولين. إيجاد المشتقات الجزئية للدالة بواسطة المتغيرات أو ب، نحن نساوي هذه المشتقات بالصفر.

نقوم بحل نظام المعادلات الناتج باستخدام أي طريقة (على سبيل المثال عن طريق طريقة الاستبدالأو طريقة كرامر) والحصول على صيغ لإيجاد المعاملات باستخدام طريقة المربعات الصغرى (LSM).

منح أو بوظيفة يأخذ أصغر قيمة. ويرد الدليل على هذه الحقيقة أدناه في النص الموجود في نهاية الصفحة.

هذه هي الطريقة الكاملة للمربعات الصغرى. صيغة للعثور على المعلمة أيحتوي على المبالغ و و و المعلمة ن- كمية البيانات التجريبية. نوصي بحساب قيم هذه المبالغ بشكل منفصل.

معامل في الرياضيات او درجة بوجدت بعد الحساب أ.

حان الوقت لتذكر المثال الأصلي.

حل.

في مثالنا ن = 5. نقوم بملء الجدول لسهولة حساب المبالغ المضمنة في صيغ المعاملات المطلوبة.

يتم الحصول على القيم الموجودة في الصف الرابع من الجدول عن طريق ضرب قيم الصف الثاني في قيم الصف الثالث لكل رقم أنا.

يتم الحصول على القيم الموجودة في الصف الخامس من الجدول عن طريق تربيع القيم الموجودة في الصف الثاني لكل رقم أنا.

القيم الموجودة في العمود الأخير من الجدول هي مجموع القيم عبر الصفوف.

نستخدم صيغ طريقة المربعات الصغرى لإيجاد المعاملات أو ب. نستبدل فيها القيم المقابلة من العمود الأخير من الجدول:

لذلك، ص = 0.165س+2.184- الخط المستقيم التقريبي المطلوب.

يبقى لمعرفة أي من الخطوط ص = 0.165س+2.184أو تقريب البيانات الأصلية بشكل أفضل، أي إجراء تقدير باستخدام طريقة المربعات الصغرى.

تقدير الخطأ لطريقة المربعات الصغرى.

للقيام بذلك، تحتاج إلى حساب مجموع الانحرافات التربيعية للبيانات الأصلية من هذه الخطوط و ، تتوافق القيمة الأصغر مع السطر الذي يقترب بشكل أفضل من البيانات الأصلية بمعنى طريقة المربعات الصغرى.

منذ , ثم على التوالي ص = 0.165س+2.184تقريب البيانات الأصلية بشكل أفضل.

رسم توضيحي لطريقة المربعات الصغرى (LS).

كل شيء واضح للعيان على الرسوم البيانية. الخط الأحمر هو الخط المستقيم الموجود ص = 0.165س+2.184، الخط الأزرق هو النقاط الوردية هي البيانات الأصلية.

لماذا هذا مطلوب، لماذا كل هذه التقديرات؟

أنا شخصياً أستخدمه لحل مشكلات تجانس البيانات والاستيفاء والاستقراء (في المثال الأصلي قد يُطلب منهم العثور على قيمة القيمة المرصودة ذفي س = 3أو متى س=6باستخدام طريقة المربعات الصغرى). لكننا سنتحدث أكثر عن هذا لاحقًا في قسم آخر من الموقع.

أعلى الصفحة

دليل.

بحيث عندما وجدت أو بتأخذ الدالة أصغر قيمة، فمن الضروري عند هذه النقطة أن تكون مصفوفة الشكل التربيعي للتفاضل من الدرجة الثانية للدالة كان إيجابيا واضحا. دعونا نظهر ذلك.

التفاضل من الدرجة الثانية له الشكل:

إنه

ومن ثم، فإن المصفوفة ذات الصورة التربيعية لها الصورة

وقيم العناصر لا تعتمد عليها أو ب.

دعونا نبين أن المصفوفة إيجابية محددة. للقيام بذلك، يجب أن تكون القاصرات الزاوية إيجابية.

الزاوي قاصر من الدرجة الأولى . عدم المساواة صارم لأن النقاط لا تتطابق. وفي ما يلي سوف نشير إلى ذلك.

الدرجة الثانية الزاوي الصغرى

دعونا نثبت ذلك بواسطة طريقة الاستقراء الرياضي.

خاتمة: القيم الموجودة أو بتتوافق مع أصغر قيمة للوظيفة وبالتالي، هي المعلمات المطلوبة لطريقة المربعات الصغرى.

لا وقت لمعرفة ذلك؟
اطلب الحل

أعلى الصفحة

تطوير التنبؤ باستخدام طريقة المربعات الصغرى. مثال على حل المشكلة

استقراء هي طريقة للبحث العلمي تعتمد على نشر الاتجاهات والأنماط والارتباطات الماضية والحالية بالتطور المستقبلي لكائن التنبؤ. وتشمل طرق الاستقراء طريقة المتوسط ​​المتحرك، طريقة التجانس الأسي، طريقة المربعات الصغرى.

جوهر طريقة المربعات الصغرى يتكون من تقليل مجموع الانحرافات المربعة بين القيم المرصودة والمحسوبة. تم العثور على القيم المحسوبة باستخدام المعادلة المحددة - معادلة الانحدار. كلما كانت المسافة بين القيم الفعلية والقيم المحسوبة أصغر، كلما كان التنبؤ أكثر دقة بناءً على معادلة الانحدار.

إن التحليل النظري لجوهر الظاهرة قيد الدراسة، والذي ينعكس التغيير فيه من خلال سلسلة زمنية، هو بمثابة الأساس لاختيار المنحنى. في بعض الأحيان يتم أخذ الاعتبارات المتعلقة بطبيعة الزيادة في مستويات السلسلة بعين الاعتبار. وبالتالي، إذا كان نمو الإنتاج متوقعًا في تقدم حسابي، فسيتم تنفيذ التجانس في خط مستقيم. إذا اتضح أن النمو في تقدم هندسي، فيجب أن يتم التجانس باستخدام دالة أسية.

صيغة العمل لطريقة المربعات الصغرى : ص ر+1 = أ*س + بحيث t + 1 – فترة التنبؤ؛ Уt+1 – مؤشر متوقع؛ a و b معاملات؛ X هو رمز الوقت.

يتم حساب المعاملات a و b باستخدام الصيغ التالية:

حيث Uf - القيم الفعلية لسلسلة الديناميكيات؛ ن - عدد مستويات السلاسل الزمنية؛

إن تجانس السلاسل الزمنية باستخدام طريقة المربعات الصغرى يعمل على عكس نمط تطور الظاهرة قيد الدراسة. في التعبير التحليلي للاتجاه، يعتبر الزمن متغيرا مستقلا، وتعمل مستويات السلسلة كدالة لهذا المتغير المستقل.

إن تطور ظاهرة ما لا يعتمد على عدد السنوات التي مرت منذ نقطة البداية، بل على العوامل التي أثرت في تطورها، وفي أي اتجاه وبأي شدة. ومن هنا يتبين أن تطور الظاهرة مع مرور الزمن هو نتيجة لفعل هذه العوامل.

يعد تحديد نوع المنحنى بشكل صحيح ونوع الاعتماد التحليلي على الوقت أحد أصعب مهام التحليل التنبئي .

إن اختيار نوع الدالة التي تصف الاتجاه، والتي يتم تحديد معالمها بطريقة المربعات الصغرى، يتم في معظم الحالات تجريبيا، من خلال بناء عدد من الدوال ومقارنتها مع بعضها البعض وفقا لقيمة الدالة. متوسط ​​مربع الخطأ، محسوبًا بالصيغة:

حيث الأشعة فوق البنفسجية هي القيم الفعلية لسلسلة الديناميكيات؛ أور - القيم المحسوبة (الملساء) لسلسلة الديناميكيات؛ n – عدد مستويات السلاسل الزمنية؛ p - عدد المعلمات المحددة في الصيغ التي تصف الاتجاه (اتجاه التنمية).

عيوب طريقة المربعات الصغرى :

  • عند محاولة وصف الظاهرة الاقتصادية قيد الدراسة باستخدام معادلة رياضية، ستكون التوقعات دقيقة لفترة قصيرة من الزمن ويجب إعادة حساب معادلة الانحدار عند توفر معلومات جديدة؛
  • مدى تعقيد اختيار معادلة الانحدار القابلة للحل باستخدام برامج الكمبيوتر القياسية.

مثال على استخدام طريقة المربعات الصغرى لتطوير التنبؤ

مهمة . وتوجد بيانات تحدد نسبة البطالة في المنطقة بنسبة %

  • قم ببناء تنبؤ بمعدل البطالة في المنطقة لشهر نوفمبر، ديسمبر، يناير باستخدام الطرق التالية: المتوسط ​​المتحرك، التجانس الأسي، المربعات الصغرى.
  • احسب الأخطاء في التوقعات الناتجة باستخدام كل طريقة.
  • قارن النتائج واستخلص النتائج.

حل المربعات الصغرى

لحل هذه المشكلة، سنقوم بإعداد جدول سنقوم فيه بإجراء الحسابات اللازمة:

ε = 28.63/10 = 2.86% دقة التنبؤعالي.

خاتمة : مقارنة النتائج التي تم الحصول عليها من الحسابات طريقة المتوسط ​​المتحرك , طريقة التجانس الأسي وطريقة المربعات الصغرى، يمكننا القول أن متوسط ​​الخطأ النسبي عند الحساب باستخدام طريقة التجانس الأسي يقع في حدود 20-50%. وهذا يعني أن دقة التوقعات في هذه الحالة مرضية فقط.

وفي الحالتين الأولى والثالثة تكون دقة التنبؤ عالية، حيث أن متوسط ​​الخطأ النسبي أقل من 10%. لكن طريقة المتوسط ​​​​المتحرك جعلت من الممكن الحصول على نتائج أكثر موثوقية (توقعات نوفمبر - 1.52٪، توقعات ديسمبر - 1.53٪، توقعات يناير - 1.49٪)، نظرًا لأن متوسط ​​الخطأ النسبي عند استخدام هذه الطريقة هو الأصغر - 1 13%.

طريقة المربع الأصغر

مقالات أخرى حول هذا الموضوع:

قائمة المصادر المستخدمة

  1. توصيات علمية ومنهجية بشأن تشخيص المخاطر الاجتماعية والتنبؤ بالتحديات والتهديدات والعواقب الاجتماعية. الجامعة الاجتماعية الحكومية الروسية. موسكو. 2010;
  2. فلاديميروفا ل.ب. التنبؤ والتخطيط في ظروف السوق: كتاب مدرسي. مخصص. م: دار النشر "داشكوف وشركاه"، 2001؛
  3. نوفيكوفا إن.في.، بوزديفا أو.جي. التنبؤ بالاقتصاد الوطني: دليل تربوي ومنهجي. يكاترينبورغ: دار النشر الأورال. ولاية اقتصادي. جامعة.، 2007؛
  4. سلوتسكين إل.إن. دورة ماجستير إدارة الأعمال في التنبؤ بالأعمال. م: كتب ألبينا للأعمال، 2006.

برنامج الشركات المتعددة الجنسيات

أدخل البيانات

البيانات والتقريب ص = أ + ب س

أنا- عدد النقاط التجريبية؛
× ط- قيمة المعلمة الثابتة عند نقطة ما أنا;
ذ ط- قيمة المعلمة المقاسة عند نقطة ما أنا;
ωi- قياس الوزن عند نقطة ما أنا;
ذ أنا، احسب.- الفرق بين القيمة المقاسة والقيمة المحسوبة للانحدار ذعند هذه النقطة أنا;
س س ط (س ط)- تقدير الخطأ × طعند القياس ذعند هذه النقطة أنا.

البيانات والتقريب ص = ك س

أنا × ط ذ ط ωi ذ أنا، احسب. Δy ط س س ط (س ط)

انقر على الرسم البياني

دليل المستخدم لبرنامج MNC عبر الإنترنت.

في حقل البيانات، أدخل في كل سطر منفصل قيم `x` و`y` عند نقطة تجريبية واحدة. يجب أن يتم فصل القيم بحرف مسافة بيضاء (مسافة أو علامة تبويب).

القيمة الثالثة يمكن أن تكون وزن النقطة `w`. وإذا لم يتم تحديد وزن نقطة، فهي تساوي واحدًا. في الغالبية العظمى من الحالات تكون أوزان النقاط التجريبية غير معروفة أو غير محسوبة، أي أنها غير معروفة. تعتبر جميع البيانات التجريبية متكافئة. في بعض الأحيان تكون الأوزان في نطاق القيم المدروسة غير متكافئة على الإطلاق ويمكن حسابها نظريًا. على سبيل المثال، في القياس الطيفي، يمكن حساب الأوزان باستخدام صيغ بسيطة، على الرغم من إهمال ذلك في الغالب لتقليل تكاليف العمالة.

يمكن لصق البيانات عبر الحافظة من جدول بيانات في مجموعة مكتبية مثل Excel من Microsoft Office أو Calc من Open Office. للقيام بذلك، في جدول البيانات، حدد نطاق البيانات المراد نسخها، وانسخها إلى الحافظة، ثم الصق البيانات في حقل البيانات في هذه الصفحة.

للحساب باستخدام طريقة المربعات الصغرى، هناك حاجة إلى نقطتين على الأقل لتحديد معاملين `b` - ظل زاوية ميل الخط و`a` - القيمة التي يعترضها الخط على المحور `y`.

لتقدير خطأ معاملات الانحدار المحسوبة، تحتاج إلى ضبط عدد النقاط التجريبية على أكثر من نقطتين.

طريقة المربعات الصغرى (LSM).

كلما زاد عدد النقاط التجريبية، كلما كان التقييم الإحصائي للمعاملات أكثر دقة (بسبب انخفاض معامل الطالب) وكان التقدير أقرب إلى تقدير العينة العامة.

غالبًا ما يرتبط الحصول على القيم في كل نقطة تجريبية بتكاليف عمالة كبيرة، لذلك غالبًا ما يتم إجراء عدد وسط من التجارب التي تعطي تقديرًا يمكن التحكم فيه ولا تؤدي إلى تكاليف عمالة مفرطة. كقاعدة عامة، يتم تحديد عدد النقاط التجريبية لاعتماد المربعات الصغرى الخطية بمعاملين في منطقة 5-7 نقاط.

نظرية موجزة عن المربعات الصغرى للعلاقات الخطية

لنفترض أن لدينا مجموعة من البيانات التجريبية على شكل أزواج من القيم [`y_i`، `x_i`]، حيث `i` هو رقم القياس التجريبي الواحد من 1 إلى `n`؛ `y_i` - قيمة الكمية المقاسة عند النقطة `i`؛ `x_i` - قيمة المعلمة التي وضعناها عند النقطة `i`.

على سبيل المثال، النظر في تشغيل قانون أوم. من خلال تغيير الجهد (فرق الجهد) بين أقسام الدائرة الكهربائية، نقوم بقياس كمية التيار المار عبر هذا القسم. تمنحنا الفيزياء اعتماداً تم العثور عليه تجريبيًا:

`أنا = ش/ر`،
حيث `I` هي القوة الحالية؛ `R` - المقاومة؛ "U" - الجهد.

في هذه الحالة، `y_i` هي القيمة الحالية التي يتم قياسها، و`x_i` هي قيمة الجهد.

وكمثال آخر، فكر في امتصاص الضوء بواسطة محلول مادة في المحلول. الكيمياء تعطينا الصيغة:

`أ = ε ل ج`،
حيث `A` هي الكثافة البصرية للحل؛ `ε` - نفاذية المذاب. `l` - طول المسار عندما يمر الضوء عبر كفيت بمحلول؛ "C" هو تركيز المادة المذابة.

في هذه الحالة، `y_i` هي القيمة المقاسة للكثافة الضوئية `A`، و`x_i` هي قيمة تركيز المادة التي نحددها.

سننظر في الحالة التي يكون فيها الخطأ النسبي في المواصفات `x_i` أقل بكثير من الخطأ النسبي في القياس `y_i`. سنفترض أيضًا أن جميع القيم المقاسة `y_i` عشوائية وموزعة بشكل طبيعي، أي. الالتزام بقانون التوزيع الطبيعي.

في حالة الاعتماد الخطي لـ `y` على `x` يمكننا كتابة الاعتماد النظري:
`ص = أ + ب س`.

من وجهة نظر هندسية، يشير المعامل `b` إلى ظل زاوية ميل الخط إلى المحور `x`، والمعامل `a` - قيمة `y` عند نقطة تقاطع الخط مع المحور `y` (عند `x = 0`).

العثور على معلمات خط الانحدار.

في إحدى التجارب، لا يمكن للقيم المقاسة لـ `y_i` أن تقع تمامًا على الخط المستقيم النظري بسبب أخطاء القياس، والتي تكون دائمًا متأصلة في الحياة الواقعية. ولذلك، يجب تمثيل المعادلة الخطية بنظام المعادلات:
`y_i = أ + ب x_i + ε_i` (1)،
حيث `ε_i` هو خطأ القياس غير المعروف لـ `y` في تجربة `i`-th.

وتسمى أيضا التبعية (1). تراجع، أي. اعتماد كميتين على بعضهما البعض مع دلالة إحصائية.

مهمة استعادة التبعية هي إيجاد المعاملين `a` و `b` من النقاط التجريبية [`y_i`، `x_i`].

للعثور على المعاملين `a` و`b` يتم استخدامهما عادة طريقة المربعات الصغرى(الشركات المتعددة الجنسيات). إنها حالة خاصة لمبدأ الاحتمال الأقصى.

لنعيد كتابة (1) بالشكل `ε_i = y_i - a - b x_i`.

ثم سيكون مجموع الأخطاء التربيعية
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

مبدأ المربعات الصغرى (المربعات الصغرى) هو تقليل المجموع (2) فيما يتعلق بالمعلمتين `a` و`b`.

يتم تحقيق الحد الأدنى عندما تكون المشتقات الجزئية للمجموع (2) بالنسبة للمعاملين "أ" و "ب" تساوي صفرًا:
`فارك(جزئي Φ)(جزئي أ) = فارك(مجموع جزئي_(i=1)^(n) (y_i - a - b x_i)^2)(جزئي a) = 0`
`فارك(جزئي Φ)(جزئي ب) = فارك(مجموع جزئي_(i=1)^(n) (y_i - a - b x_i)^2)(جزئي b) = 0`

بتوسيع المشتقات، نحصل على نظام من معادلتين مع مجهولين:
`sum_(i=1)^(n) (2a + 2bx_i — 2y_i) = sum_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

نفتح الأقواس وننقل المجاميع المستقلة عن المعاملات المطلوبة إلى النصف الآخر فنحصل على نظام المعادلات الخطية:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

وبحل النظام الناتج، نجد صيغًا للمعاملين `a` و`b`:

`a = فارك(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 — sum_(i=1)^(n) x_i sum_(i=1)^(n) ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = فارك(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (ن) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.2)

تحتوي هذه الصيغ على حلول عندما يكون `n > 1` (يمكن إنشاء الخط باستخدام نقطتين على الأقل) وعندما يكون المحدد `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1) )^(n) x_i)^2 != 0`، أي عندما تكون نقاط `x_i` في التجربة مختلفة (أي عندما لا يكون الخط عموديًا).

تقدير أخطاء معاملات خط الانحدار

للحصول على تقييم أكثر دقة للخطأ في حساب المعاملين `a` و`b`، من المستحسن وجود عدد كبير من النقاط التجريبية. عندما يكون `n = 2`، فإنه من المستحيل تقدير خطأ المعاملات، لأن سوف يمر الخط التقريبي بشكل فريد عبر نقطتين.

تم تحديد خطأ المتغير العشوائي `V` قانون تراكم الأخطاء
`S_V^2 = sum_(i=1)^p (frac(جزئي f)(جزئي z_i))^2 S_(z_i)^2`,
حيث `p` هو عدد المعلمات `z_i` التي بها خطأ `S_(z_i)`، والتي تؤثر على الخطأ `S_V`؛
`f` هي دالة لاعتماد `V` على `z_i`.

دعونا نكتب قانون تراكم الأخطاء لخطأ المعاملات "أ" و "ب".
`S_a^2 = sum_(i=1)^(n)(frac(جزئي a)(جزئي y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(جزئي a )(جزئي x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(جزئي أ)(جزئي y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(جزئي b)(جزئي y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(جزئي b )(جزئي x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(جزئي b)(جزئي y_i))^2 `,
لأن `S_(x_i)^2 = 0` (سبق أن حجزنا أن الخطأ `x` لا يكاد يذكر).

`S_y^2 = S_(y_i)^2` - خطأ (التباين، مربع الانحراف المعياري) في قياس `y`، بافتراض أن الخطأ موحد لجميع قيم `y`.

استبدال الصيغ لحساب `a` و`b` في التعبيرات الناتجة التي نحصل عليها

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 فارك(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

في معظم التجارب الحقيقية، لا يتم قياس قيمة `Sy`. للقيام بذلك، من الضروري إجراء عدة قياسات متوازية (تجارب) في نقطة واحدة أو عدة نقاط في الخطة، مما يزيد من الوقت (وربما التكلفة) للتجربة. لذلك، يُفترض عادةً أن انحراف `y` عن خط الانحدار يمكن اعتباره عشوائيًا. يتم حساب تقدير التباين `y` في هذه الحالة باستخدام الصيغة.

`S_y^2 = S_(y، الباقي)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

يظهر المقسوم عليه `n-2` لأن عدد درجات الحرية لدينا قد انخفض بسبب حساب معاملين باستخدام نفس عينة البيانات التجريبية.

ويسمى هذا التقدير أيضًا التباين المتبقي بالنسبة إلى خط الانحدار `S_(y, Rest)^2`.

يتم تقييم أهمية المعاملات باستخدام اختبار الطالب

`t_a = فارك(|a|) (S_a)`، `t_b = فارك(|b|) (S_b)`

إذا كانت المعايير المحسوبة `t_a`، `t_b` أقل من المعايير المجدولة `t(P, n-2)`، فيُعتبر أن المعامل المقابل لا يختلف بشكل كبير عن الصفر مع احتمال معين `P`.

لتقييم جودة وصف العلاقة الخطية، يمكنك مقارنة `S_(y, Rest)^2` و`S_(bar y)` بالنسبة إلى المتوسط ​​باستخدام معيار فيشر.

`S_(شريط y) = فارك(sum_(i=1)^n (y_i — شريط y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - تقدير العينة للتباين `y` بالنسبة إلى المتوسط.

ولتقييم فعالية معادلة الانحدار لوصف الاعتماد، يتم حساب معامل فيشر
`F = S_(شريط y) / S_(y، بقية)^2`,
والتي تتم مقارنتها بمعامل فيشر الجدولي `F(p, n-1, n-2)`.

إذا كان `F > F(P, n-1, n-2)`، فإن الفرق بين وصف العلاقة `y = f(x)` باستخدام معادلة الانحدار والوصف باستخدام المتوسط ​​يعتبر ذا دلالة إحصائية مع احتمالية "ص". أولئك. يصف الانحدار الاعتماد بشكل أفضل من انتشار `y` حول المتوسط.

انقر على الرسم البياني
لإضافة قيم إلى الجدول

طريقة المربع الأصغر. طريقة المربعات الصغرى تعني تحديد المعلمات غير المعروفة أ، ب، ج، والاعتماد الوظيفي المقبول

تشير طريقة المربعات الصغرى إلى تحديد المعلمات غير المعروفة أ، ب، ج،…الاعتماد الوظيفي المقبول

ص = و(س،أ،ب،ج،...),

والتي من شأنها أن توفر الحد الأدنى من متوسط ​​مربع (التباين) للخطأ

, (24)

حيث x i, y i عبارة عن مجموعة من أزواج الأرقام التي تم الحصول عليها من التجربة.

بما أن شرط الحد الأقصى لدالة ذات عدة متغيرات هو شرط أن تكون مشتقاتها الجزئية تساوي صفراً، فإن المعلمات أ، ب، ج،…يتم تحديدها من نظام المعادلات:

; ; ; … (25)

يجب أن نتذكر أنه يتم استخدام طريقة المربعات الصغرى لتحديد المعلمات بعد نوع الوظيفة ص = و(س)مُعرف

إذا لم يكن من الممكن، من خلال الاعتبارات النظرية، استخلاص استنتاجات حول الشكل الذي ينبغي أن تكون عليه الصيغة التجريبية، فيجب على المرء أن يسترشد بالتمثيلات المرئية، في المقام الأول من خلال التمثيلات الرسومية للبيانات المرصودة.

من الناحية العملية، غالبًا ما تقتصر على الأنواع التالية من الوظائف:

1) خطية ;

2) التربيعية أ.

طريقة المربع الأصغر

طريقة المربع الأصغر ( OLS، OLS، المربعات الصغرى العادية) - إحدى الطرق الأساسية لتحليل الانحدار لتقدير المعلمات غير المعروفة لنماذج الانحدار باستخدام بيانات العينة. تعتمد الطريقة على تقليل مجموع مربعات بقايا الانحدار.

تجدر الإشارة إلى أن طريقة المربعات الصغرى نفسها يمكن أن تسمى طريقة لحل مشكلة في أي مجال إذا كان الحل يكمن في أو يلبي بعض المعايير لتقليل مجموع مربعات بعض وظائف المتغيرات المطلوبة. لذلك، يمكن أيضًا استخدام طريقة المربعات الصغرى للتمثيل التقريبي (تقريب) لدالة معينة بواسطة دوال أخرى (أبسط)، عند العثور على مجموعة من الكميات التي تحقق المعادلات أو القيود، والتي يزيد عددها عن عدد هذه الكميات ، إلخ.

جوهر الشركات المتعددة الجنسيات

دع بعض النماذج (البارامترية) للعلاقة الاحتمالية (الانحدارية) بين المتغير (الموضح) ذوالعديد من العوامل (المتغيرات التفسيرية) س

أين هو متجه معلمات النموذج غير المعروفة

- خطأ في النموذج العشوائي.

ولتكن هناك أيضًا نماذج من الملاحظات لقيم هذه المتغيرات. ليكن رقم الملاحظة (). ثم هي قيم المتغيرات في الملاحظة. بعد ذلك، بالنسبة لقيم المعلمات b، من الممكن حساب القيم النظرية (النموذجية) للمتغير الموضح y:

حجم البقايا يعتمد على قيم المعلمات ب.

إن جوهر طريقة المربعات الصغرى (العادية والكلاسيكية) هو إيجاد مثل هذه المعلمات ب التي يكون مجموع مربعات البقايا فيها (eng. مجموع المربعات المتبقية) سيكون الحد الأدنى:

في الحالة العامة، يمكن حل هذه المشكلة عن طريق طرق التحسين العددي (التقليل). في هذه الحالة نتحدث عنها المربعات الصغرى غير الخطية(NLS أو NLLS - الإنجليزية) المربعات الصغرى غير الخطية). في كثير من الحالات من الممكن الحصول على حل تحليلي. لحل مشكلة التقليل، من الضروري إيجاد نقاط ثابتة للدالة عن طريق تمييزها فيما يتعلق بالمعلمات غير المعروفة ب، ومساواة المشتقات بالصفر وحل نظام المعادلات الناتج:

إذا كانت الأخطاء العشوائية للنموذج موزعة بشكل طبيعي، ولها نفس التباين، وغير مرتبطة، فإن تقديرات معلمات OLS هي نفس تقديرات الاحتمالية القصوى (MLM).

OLS في حالة النموذج الخطي

دع اعتماد الانحدار يكون خطيًا:

يترك ذهو متجه عمود لملاحظات المتغير الموضح، وهو عبارة عن مصفوفة لملاحظات العامل (صفوف المصفوفة هي متجهات قيم العامل في ملاحظة معينة، الأعمدة هي متجه قيم عامل معين في جميع الملاحظات). تمثيل المصفوفة للنموذج الخطي هو:

عندها سيكون متجه تقديرات المتغير الموضح ومتجه بقايا الانحدار متساويين

وبناء على ذلك، فإن مجموع مربعات بقايا الانحدار سيكون مساوياً لـ

بتفريق هذه الدالة فيما يتعلق بمتجه المعلمات ومساواة المشتقات بالصفر، نحصل على نظام المعادلات (في شكل مصفوفة):

.

يعطي حل نظام المعادلات هذا الصيغة العامة لتقديرات المربعات الصغرى للنموذج الخطي:

ولأغراض تحليلية، فإن التمثيل الأخير لهذه الصيغة مفيد. إذا كانت البيانات في نموذج الانحدار تركزت، فإن المصفوفة الأولى في هذا التمثيل لها معنى مصفوفة التغاير المشترك للعوامل، والثانية هي متجه لتغايرات العوامل مع المتغير التابع. إذا بالإضافة إلى ذلك فإن البيانات أيضا تطبيعإلى MSE (وهذا هو، في نهاية المطاف موحدة) ، فإن المصفوفة الأولى لها معنى مصفوفة ارتباط العينة للعوامل، والمتجه الثاني - ناقل ارتباطات العينة للعوامل مع المتغير التابع.

خاصية مهمة لتقديرات OLS للنماذج مع ثابت- يمر خط الانحدار المبني عبر مركز ثقل بيانات العينة أي أن المساواة قد تحققت:

على وجه الخصوص، في الحالة القصوى، عندما يكون التراجع الوحيد ثابتًا، نجد أن تقدير OLS للمعلمة الوحيدة (الثابت نفسه) يساوي متوسط ​​قيمة المتغير الموضح. أي أن الوسط الحسابي، المعروف بخصائصه الجيدة من قوانين الأعداد الكبيرة، هو أيضًا تقدير بالمربعات الصغرى - فهو يفي بمعيار الحد الأدنى لمجموع الانحرافات المربعة عنه.

مثال: أبسط الانحدار (الزوجي).

في حالة الانحدار الخطي المقترن، يتم تبسيط صيغ الحساب (يمكنك الاستغناء عن جبر المصفوفات):

خصائص مقدرات OLS

أولا وقبل كل شيء، نلاحظ أنه بالنسبة للنماذج الخطية، فإن تقديرات OLS هي تقديرات خطية، على النحو التالي من الصيغة أعلاه. بالنسبة لتقديرات OLS غير المتحيزة، من الضروري والكافي تحقيق الشرط الأكثر أهمية لتحليل الانحدار: التوقع الرياضي للخطأ العشوائي، المشروط بالعوامل، يجب أن يساوي الصفر. وهذا الشرط، على وجه الخصوص، يتم استيفاءه إذا

  1. التوقع الرياضي للأخطاء العشوائية هو صفر، و
  2. العوامل والأخطاء العشوائية هي متغيرات عشوائية مستقلة.

الشرط الثاني – شرط نشوء العوامل الخارجية – هو شرط أساسي. إذا لم يتم استيفاء هذه الخاصية، فيمكننا أن نفترض أن أي تقديرات تقريبًا ستكون غير مرضية للغاية: فهي لن تكون متسقة حتى (أي أنه حتى كمية كبيرة جدًا من البيانات لا تسمح لنا بالحصول على تقديرات عالية الجودة في هذه الحالة ). في الحالة الكلاسيكية، يتم وضع افتراض أقوى حول حتمية العوامل، بدلاً من الخطأ العشوائي، والذي يعني تلقائيًا أن شرط التولد الخارجي قد تم استيفائه. في الحالة العامة، من أجل اتساق التقديرات، يكفي استيفاء شرط التجانس الخارجي مع تقارب المصفوفة مع مصفوفة غير مفردة مع زيادة حجم العينة إلى ما لا نهاية.

لكي تكون تقديرات المربعات الصغرى (العادية) فعالة أيضًا (الأفضل في فئة التقديرات الخطية غير المتحيزة)، بالإضافة إلى الاتساق وعدم التحيز، يجب استيفاء خصائص إضافية للخطأ العشوائي:

يمكن صياغة هذه الافتراضات لمصفوفة التغاير لمتجه الخطأ العشوائي

يسمى النموذج الخطي الذي يحقق هذه الشروط كلاسيكي. تقديرات OLS للانحدار الخطي الكلاسيكي هي تقديرات غير متحيزة ومتسقة وأكثر فعالية في فئة جميع التقديرات الخطية غير المتحيزة (في الأدبيات الإنجليزية، يُستخدم الاختصار أحيانًا أزرق (أفضل مقدر خطي غير مقيد) - أفضل تقدير خطي غير متحيز؛ في الأدب الروسي يتم الاستشهاد بنظرية غاوس ماركوف في كثير من الأحيان). كما هو واضح، فإن مصفوفة التغاير لمتجه تقديرات المعامل ستكون مساوية لما يلي:

عملية شريان الحياة المعممة

تسمح طريقة المربعات الصغرى بالتعميم على نطاق واسع. بدلاً من تقليل مجموع مربعات البقايا، يمكن للمرء تقليل بعض الأشكال التربيعية المحددة الإيجابية لمتجه البقايا، حيث توجد مصفوفة وزن محددة إيجابية متماثلة. تعتبر المربعات الصغرى التقليدية حالة خاصة لهذا النهج، حيث تتناسب مصفوفة الوزن مع مصفوفة الهوية. كما هو معروف من نظرية المصفوفات المتماثلة (أو العوامل)، لمثل هذه المصفوفات هناك تحلل. وبالتالي، يمكن تمثيل الدالة المحددة على النحو التالي، أي أنه يمكن تمثيل هذه الدالة كمجموع مربعات بعض "البقايا" المحولة. وهكذا، يمكننا التمييز بين فئة من أساليب المربعات الصغرى - أساليب LS (المربعات الصغرى).

لقد ثبت (نظرية آيتكين) أنه بالنسبة لنموذج الانحدار الخطي المعمم (الذي لا يتم فيه فرض أي قيود على مصفوفة التغاير للأخطاء العشوائية)، فإن الأكثر فعالية (في فئة التقديرات الخطية غير المتحيزة) هي ما يسمى بالتقديرات. المربعات الصغرى المعممة (GLS - المربعات الصغرى المعممة)- طريقة LS بمصفوفة وزنية تساوي مصفوفة التغاير العكسي للأخطاء العشوائية : .

يمكن إثبات أن صيغة تقديرات GLS لمعلمات النموذج الخطي لها الشكل

وبالتالي فإن مصفوفة التغاير لهذه التقديرات ستكون مساوية لـ

في الواقع، يكمن جوهر OLS في تحويل (خطي) معين (P) للبيانات الأصلية وتطبيق OLS العادي على البيانات المحولة. والغرض من هذا التحويل هو أنه بالنسبة للبيانات المحولة، فإن الأخطاء العشوائية تلبي بالفعل الافتراضات الكلاسيكية.

OLS المرجح

في حالة مصفوفة الوزن القطرية (وبالتالي مصفوفة التغاير للأخطاء العشوائية)، لدينا ما يسمى بالمربعات الصغرى الموزونة (WLS). في هذه الحالة، يتم تقليل المجموع المرجح لمربعات بقايا النموذج، أي أن كل ملاحظة تتلقى "وزنًا" يتناسب عكسيًا مع تباين الخطأ العشوائي في هذه الملاحظة: . في الواقع، يتم تحويل البيانات عن طريق ترجيح الملاحظات (القسمة على مقدار يتناسب مع الانحراف المعياري المقدر للأخطاء العشوائية)، ويتم تطبيق عملية OLS العادية على البيانات المرجحة.

بعض الحالات الخاصة لاستخدام MNC في الممارسة العملية

تقريب الاعتماد الخطي

دعونا ننظر في الحالة عندما، نتيجة لدراسة اعتماد كمية عددية معينة على كمية عددية معينة (قد يكون هذا، على سبيل المثال، اعتماد الجهد على القوة الحالية: حيث تكون القيمة الثابتة، مقاومة الموصل)، وتم إجراء قياسات لهذه الكميات، ونتيجة لذلك تم تحديد القيم والقيم المقابلة لها. ويجب تسجيل بيانات القياس في جدول.

طاولة. نتائج القياس.

رقم القياس
1
2
3
4
5
6

والسؤال هو: ما هي قيمة المعامل التي يمكن اختيارها لوصف التبعية بشكل أفضل؟ وفقا لطريقة المربعات الصغرى، يجب أن تكون هذه القيمة بحيث يكون مجموع الانحرافات التربيعية للقيم من القيم

كان الحد الأدنى

مجموع الانحرافات التربيعية له حد أقصى واحد - وهو الحد الأدنى، مما يسمح لنا باستخدام هذه الصيغة. دعونا نجد من هذه الصيغة قيمة المعامل. للقيام بذلك، نقوم بتحويل جانبه الأيسر على النحو التالي:

الصيغة الأخيرة تسمح لنا بإيجاد قيمة المعامل، وهو ما هو مطلوب في المسألة.

قصة

حتى بداية القرن التاسع عشر. ولم يكن لدى العلماء قواعد معينة لحل نظام المعادلات الذي يكون فيه عدد المجهولين أقل من عدد المعادلات؛ حتى ذلك الوقت، تم استخدام تقنيات خاصة تعتمد على نوع المعادلات وعلى ذكاء الآلات الحاسبة، وبالتالي توصلت الآلات الحاسبة المختلفة، بناءً على نفس بيانات المراقبة، إلى استنتاجات مختلفة. كان غاوس (1795) أول من استخدم الطريقة، واكتشفها ليجيندر (1805) بشكل مستقل ونشرها تحت اسمها الحديث (فرنسي. طريقة المحاجر ) . ربط لابلاس الطريقة بنظرية الاحتمالات، ونظر عالم الرياضيات الأمريكي أدريان (1808) في تطبيقاتها النظرية الاحتمالية. وقد انتشرت هذه الطريقة على نطاق واسع وتم تحسينها من خلال المزيد من الأبحاث التي أجراها إنكي، وبيسل، وهانسن وآخرون.

الاستخدامات البديلة لـ OLS

يمكن أيضًا استخدام فكرة طريقة المربعات الصغرى في حالات أخرى لا تتعلق مباشرة بتحليل الانحدار. الحقيقة هي أن مجموع المربعات هو أحد مقاييس القرب الأكثر شيوعًا للمتجهات (القياس الإقليدي في المساحات محدودة الأبعاد).

أحد التطبيقات هو "حل" أنظمة المعادلات الخطية التي يكون فيها عدد المعادلات أكبر من عدد المتغيرات

حيث المصفوفة ليست مربعة، بل مستطيلة الحجم.

مثل هذا النظام من المعادلات، في الحالة العامة، ليس له حل (إذا كانت المرتبة في الواقع أكبر من عدد المتغيرات). ولذلك، لا يمكن "حل" هذا النظام إلا بمعنى اختيار مثل هذا المتجه لتقليل "المسافة" بين المتجهات و. للقيام بذلك، يمكنك تطبيق معيار تقليل مجموع مربعات الاختلافات بين الجانبين الأيسر والأيمن لمعادلات النظام، أي. من السهل توضيح أن حل مشكلة التصغير هذه يؤدي إلى حل نظام المعادلات التالي

بعد التسوية نحصل على دالة بالشكل التالي: g (x) = x + 1 3 + 1 .

يمكننا تقريب هذه البيانات باستخدام العلاقة الخطية y = a x + b عن طريق حساب المعلمات المقابلة. للقيام بذلك، سنحتاج إلى تطبيق طريقة المربعات الصغرى. ستحتاج أيضًا إلى رسم رسم للتحقق من الخط الذي سيتوافق بشكل أفضل مع البيانات التجريبية.

Yandex.RTB RA-A-339285-1

ما هو OLS (طريقة المربعات الصغرى)

الشيء الرئيسي الذي يتعين علينا القيام به هو إيجاد معاملات الاعتماد الخطي التي تكون عندها قيمة دالة متغيرين F ​​(a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 هي القيمة الأصغر. بمعنى آخر، بالنسبة لقيم معينة لـ a وb، سيكون لمجموع الانحرافات المربعة للبيانات المقدمة من الخط المستقيم الناتج قيمة دنيا. وهذا هو معنى طريقة المربعات الصغرى. كل ما علينا فعله لحل المثال هو إيجاد الحد الأقصى لدالة متغيرين.

كيفية استخلاص الصيغ لحساب المعاملات

من أجل استخلاص صيغ لحساب المعاملات، تحتاج إلى إنشاء وحل نظام من المعادلات بمتغيرين. للقيام بذلك، نحسب المشتقات الجزئية للتعبير F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 بالنسبة لـ a وb ونساويهم بـ 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

لحل نظام المعادلات، يمكنك استخدام أي طرق، على سبيل المثال، الاستبدال أو طريقة كرامر. ونتيجة لذلك، يجب أن تكون لدينا صيغ يمكن استخدامها لحساب المعاملات باستخدام طريقة المربعات الصغرى.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - أ ∑ i = 1 n x i n

لقد قمنا بحساب قيم المتغيرات التي تكون فيها الدالة
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 سوف يأخذ القيمة الدنيا. وفي الفقرة الثالثة سوف نثبت لماذا الأمر هكذا بالضبط.

وهذا هو تطبيق طريقة المربعات الصغرى عملياً. تتضمن صيغتها، التي تُستخدم للعثور على المعلمة a، ∑ i = 1 n x i، ∑ i = 1 n y i، ∑ i = 1 n x i y i، ∑ i = 1 n x i 2، بالإضافة إلى المعلمة
ن - يدل على كمية البيانات التجريبية. ننصحك بحساب كل مبلغ على حدة. يتم حساب قيمة المعامل b مباشرة بعد a.

دعنا نعود إلى المثال الأصلي.

مثال 1

لدينا هنا n يساوي خمسة. لتسهيل حساب المبالغ المطلوبة المضمنة في صيغ المعاملات، فلنملأ الجدول.

ط = 1 أنا = 2 ط = 3 ط = 4 أنا = 5 ∑ ط = 1 5
× ط 0 1 2 4 5 12
ذ ط 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
س ط ص ط 0 2 , 4 5 , 2 11 , 2 15 33 , 8
س ط 2 0 1 4 16 25 46

حل

يتضمن الصف الرابع البيانات التي تم الحصول عليها عن طريق ضرب القيم من الصف الثاني بقيم الثالث لكل فرد أي. يحتوي السطر الخامس على البيانات من المربع الثاني. يعرض العمود الأخير مجموع قيم الصفوف الفردية.

دعونا نستخدم طريقة المربعات الصغرى لحساب المعاملين a وb اللذين نحتاجهما. للقيام بذلك، استبدل القيم المطلوبة من العمود الأخير واحسب المبالغ:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - أ ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 ب = 12, 9 - أ 12 5 ⇒ أ ≈ 0, 165 ب ≈ 2, 184

اتضح أن الخط المستقيم التقريبي المطلوب سيبدو كما يلي: y = 0, 165 x + 2, 184. نحتاج الآن إلى تحديد الخط الذي سيقرب البيانات بشكل أفضل - g (x) = x + 1 3 + 1 أو 0,165 x + 2,184. دعونا نقدر باستخدام طريقة المربعات الصغرى.

لحساب الخطأ، نحتاج إلى إيجاد مجموع الانحرافات التربيعية للبيانات من الخطوط المستقيمة σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 و σ 2 = ∑ i = 1 n (y i - g (x i)) 2، ستتوافق القيمة الدنيا مع خط أكثر ملاءمة.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0.096

إجابة:منذ σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
ص = 0.165 س + 2.184.

تظهر طريقة المربعات الصغرى بوضوح في الرسم التوضيحي. الخط الأحمر يمثل الخط المستقيم g (x) = x + 1 3 + 1، والخط الأزرق يمثل y = 0, 165 x + 2, 184. تتم الإشارة إلى البيانات الأصلية بالنقاط الوردية.

دعونا نوضح سبب الحاجة إلى تقديرات تقريبية من هذا النوع بالضبط.

ويمكن استخدامها في المهام التي تتطلب تجانس البيانات، وكذلك في المهام التي يجب فيها استيفاء البيانات أو استقراءها. على سبيل المثال، في المشكلة التي تمت مناقشتها أعلاه، يمكن للمرء إيجاد قيمة الكمية المرصودة y عند x = 3 أو عند x = 6. لقد خصصنا مقالة منفصلة لمثل هذه الأمثلة.

إثبات طريقة OLS

لكي تأخذ الدالة قيمة دنيا عند حساب a وb، من الضروري عند نقطة معينة أن تكون مصفوفة الشكل التربيعي لتفاضل الدالة بالشكل F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 موجب محدد. دعونا نظهر لك كيف ينبغي أن تبدو.

مثال 2

لدينا تفاضل من الدرجة الثانية على الشكل التالي:

د 2 F (أ ; ب) = δ 2 F (أ ; ب) δ أ 2 د 2 أ + 2 δ 2 F (أ ; ب) δ أ δ ب د أ د ب + δ 2 F (أ ; ب) δ ب 2 د 2 ب

حل

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + ب)) δ ب = 2 ∑ أنا = 1 ن (1) = 2 ن

بمعنى آخر، يمكننا كتابتها هكذا: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

لقد حصلنا على مصفوفة من الدرجة الثانية M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

في هذه الحالة، لن تتغير قيم العناصر الفردية اعتمادًا على a و b . هل هذه المصفوفة إيجابية محددة؟ للإجابة على هذا السؤال، دعونا نتحقق مما إذا كانت صغراته الزاوية موجبة.

نحسب الزاوية الصغرى من الدرجة الأولى: 2 ∑ i = 1 n (x i) 2 > 0 . نظرًا لأن النقاط x i غير متطابقة، فإن عدم المساواة صارم. وسنضع ذلك في الاعتبار في حسابات أخرى.

نحسب الدرجة الثانية الزاوية الصغرى:

د ه t (م) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

بعد ذلك، ننتقل إلى إثبات المتباينة n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 باستخدام الاستقراء الرياضي.

  1. دعونا نتحقق مما إذا كانت عدم المساواة هذه صالحة لـ n التعسفي. لنأخذ 2 ونحسب:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = س 1 + س 2 2 > 0

لقد حصلنا على المساواة الصحيحة (إذا كانت القيمتين x 1 و x 2 غير متطابقتين).

  1. دعونا نفترض أن هذا عدم المساواة سيكون صحيحا ل ن، أي. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 - صحيح.
  2. الآن سوف نثبت صحة n + 1، أي. أن (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0، إذا n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

نحسب:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 س 2 + س 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - س 2) 2 + . . . + (س ن - 1 - س ن) 2 > 0

سيكون التعبير المحاط بالأقواس المتعرجة أكبر من 0 (استنادًا إلى ما افترضناه في الخطوة 2)، وستكون الحدود المتبقية أكبر من 0، نظرًا لأنها كلها مربعات أرقام. لقد أثبتنا عدم المساواة.

إجابة:سوف تتوافق a وb التي تم العثور عليها مع أصغر قيمة للدالة F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2، مما يعني أنها المعلمات المطلوبة لطريقة المربعات الصغرى (إل إس إم).

إذا لاحظت وجود خطأ في النص، فيرجى تحديده والضغط على Ctrl+Enter

إذا كانت كمية فيزيائية معينة تعتمد على كمية أخرى، فيمكن دراسة هذا الاعتماد عن طريق قياس y عند قيم مختلفة لـ x. ونتيجة للقياسات يتم الحصول على عدد من القيم:

س 1، س 2، ...، س ط، ...، س ن؛

ذ 1 , ص 2 , ..., ذ ط , ... , ذ ن .

بناءً على بيانات مثل هذه التجربة، من الممكن إنشاء رسم بياني للاعتماد y = ƒ(x). يتيح المنحنى الناتج الحكم على شكل الدالة ƒ(x). ومع ذلك، فإن المعاملات الثابتة التي تدخل في هذه الدالة تظل مجهولة. ويمكن تحديدها باستخدام طريقة المربعات الصغرى. النقاط التجريبية، كقاعدة عامة، لا تقع بالضبط على المنحنى. تتطلب طريقة المربعات الصغرى أن يكون مجموع مربعات انحرافات النقاط التجريبية عن المنحنى، أي 2 كان الأصغر.

من الناحية العملية، يتم استخدام هذه الطريقة في أغلب الأحيان (وببساطة) في حالة العلاقة الخطية، أي. متى

ص = ك سأو ص = أ + ب س.

الاعتماد الخطي واسع الانتشار في الفيزياء. وحتى عندما تكون العلاقة غير خطية، فإنهم عادةً ما يحاولون إنشاء رسم بياني للحصول على خط مستقيم. على سبيل المثال، إذا افترض أن معامل انكسار الزجاج n يرتبط بالطول الموجي للضوء α بالعلاقة n = a + b/lect 2، فسيتم رسم اعتماد n على lect -2 على الرسم البياني.

النظر في التبعية ص = ك س(خط مستقيم يمر بنقطة الأصل). لنقم بتكوين القيمة φ مجموع مربعات انحرافات نقاطنا عن الخط المستقيم

قيمة φ تكون دائمًا موجبة وتتبين أنها أصغر كلما اقتربت نقاطنا من الخط المستقيم. تنص طريقة المربعات الصغرى على أنه يجب اختيار قيمة k بحيث يكون لـ φ حد أدنى


أو
(19)

يظهر الحساب أن خطأ الجذر التربيعي في تحديد قيمة k يساوي

, (20)
حيث n هو عدد القياسات.

دعونا الآن نفكر في حالة أكثر صعوبة بعض الشيء، عندما يجب أن تلبي النقاط الصيغة ص = أ + ب س(خط مستقيم لا يمر بأصل الأصل).

وتتمثل المهمة في العثور على أفضل قيم a و b من مجموعة القيم المتوفرة x i, y i.

دعونا مرة أخرى نشكل الصيغة التربيعية φ، التي تساوي مجموع الانحرافات التربيعية للنقاط x i، y i من الخط المستقيم

وابحث عن قيم a وb التي يوجد لـ φ حد أدنى لها

;

.

.

الحل المشترك لهذه المعادلات يعطي

(21)

جذر متوسط ​​الأخطاء المربعة لتحديد a وb متساويان

(23)

.  (24)

عند معالجة نتائج القياس باستخدام هذه الطريقة، يكون من المناسب تلخيص جميع البيانات في جدول يتم فيه حساب جميع المبالغ المضمنة في الصيغ (19)(24) بشكل مبدئي. وترد أشكال هذه الجداول في الأمثلة أدناه.

مثال 1.تمت دراسة المعادلة الأساسية لديناميات الحركة الدورانية ε = M/J (خط مستقيم يمر عبر نقطة الأصل). عند قيم مختلفة للحظة M، تم قياس التسارع الزاوي ε لجسم معين. مطلوب تحديد لحظة القصور الذاتي لهذا الجسم. يتم سرد نتائج قياسات لحظة القوة والتسارع الزاوي في العمودين الثاني والثالث الجدول 5.

الجدول 5
ن م، ن م ε، ق -1 م 2 م ε ε - كم (ε - كم) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

باستخدام الصيغة (19) نحدد:

.

لتحديد جذر متوسط ​​مربع الخطأ، نستخدم الصيغة (20)

0.005775كلغ-1 · م -2 .

وفقا للصيغة (18) لدينا

; .

SJ = (2.996 0.005775)/0.3337 = 0.05185 كجم م 2.

بعد ضبط الموثوقية P = 0.95، باستخدام جدول معاملات الطالب لـ n = 5، نجد t = 2.78 ونحدد الخطأ المطلق ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 كجم م 2.

لنكتب النتائج في النموذج:

ي = (3.0 ± 0.2) كجم م 2;


مثال 2.دعونا نحسب معامل درجة الحرارة لمقاومة المعدن باستخدام طريقة المربعات الصغرى. المقاومة تعتمد خطيا على درجة الحرارة

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

يحدد الحد الحر المقاومة R 0 عند درجة حرارة 0 درجة مئوية، ومعامل الانحدار هو حاصل ضرب معامل درجة الحرارة α والمقاومة R 0 .

وترد نتائج القياسات والحسابات في الجدول ( انظر الجدول 6).

الجدول 6
ن ر°، ق ص، أوم ر-¯ر (ر-¯ر) 2 (ر-¯ر)ص ص - بت - أ (ص - ب - أ) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/ن 85.83333 1.4005 – – – – –

باستخدام الصيغ (21)، (22) نحدد

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 أوم.

دعونا نجد خطأ في تعريف α. وبما أن ، وفقا للصيغة (18) لدينا:

.

باستخدام الصيغ (23)، (24) لدينا

;

0.014126 أوم.

بعد ضبط الموثوقية على P = 0.95، باستخدام جدول معاملات الطالب لـ n = 6، نجد t = 2.57 ونحدد الخطأ المطلق Δα = 2.57 0.000132 = 0.000338 درجة -1.

α = (23 ± 4) 10 -4 يشيد-1 عند P = 0.95.


مثال 3.مطلوب تحديد نصف قطر انحناء العدسة باستخدام حلقات نيوتن. تم قياس نصف قطر حلقات نيوتن r m وتم تحديد أعداد هذه الحلقات m. يرتبط نصف قطر حلقات نيوتن بنصف قطر انحناء العدسة R ورقم الحلقة بالمعادلة

ص 2 م = م LAR - 2 د 0 ر،

حيث d 0 سمك الفجوة بين العدسة واللوحة المتوازية (أو تشوه العدسة)،

 الطول الموجي للضوء الساقط.

ν = (600 ± 6) نانومتر؛
ص 2 م = ص؛
م = س؛
αR = ب؛
-2د 0 ر = أ،

ثم المعادلة سوف تأخذ الشكل ص = أ + ب س.

.

يتم إدخال نتائج القياسات والحسابات الجدول 7.

الجدول 7
ن س = م ص = ص 2، 10 -2 مم 2 مم (م -¯م) 2 (م -¯ م)ذ ص - ب س - أ، 10 -4 (ص - ب س - أ) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/ن 3.5 20.8548333 – – – – –