يتم استخدام طريقة المربعات الصغرى للتقدير. أبسط الحالات الخاصة

مثال.

بيانات تجريبية عن قيم المتغيرات Xو فيوترد في الجدول.

ونتيجة لمواءمتها، يتم الحصول على الوظيفة

استخدام طريقة المربعات الصغرى، قم بتقريب هذه البيانات من خلال الاعتماد الخطي ص=الفأس+ب(ابحث عن المعلمات أو ب). اكتشف أي من الخطين أفضل (بمعنى طريقة المربعات الصغرى) يقوم بمحاذاة البيانات التجريبية. جعل الرسم.

جوهر طريقة المربعات الصغرى (LSM).

وتتمثل المهمة في العثور على معاملات الاعتماد الخطية التي تكون فيها وظيفة متغيرين أو ب يأخذ أصغر قيمة. وهذا هو، نظرا أو بسيكون مجموع الانحرافات التربيعية للبيانات التجريبية عن الخط المستقيم الموجود هو الأصغر. هذا هو بيت القصيد من طريقة المربعات الصغرى.

وبالتالي، فإن حل المثال يتلخص في إيجاد الحد الأقصى لدالة لمتغيرين.

اشتقاق الصيغ لإيجاد المعاملات.

تم تجميع وحل نظام من معادلتين بمجهولين. إيجاد المشتقات الجزئية للدالة بالنسبة للمتغيرات أو ب، نحن نساوي هذه المشتقات بالصفر.

نقوم بحل نظام المعادلات الناتج باستخدام أي طريقة (على سبيل المثال عن طريق طريقة الاستبدالأو ) واحصل على صيغ لإيجاد المعاملات باستخدام طريقة المربعات الصغرى (LSM).

منح أو بوظيفة يأخذ أصغر قيمة. تم تقديم الدليل على هذه الحقيقة.

هذه هي الطريقة الكاملة للمربعات الصغرى. صيغة للعثور على المعلمة أيحتوي على المبالغ و و و المعلمة ن- كمية البيانات التجريبية. نوصي بحساب قيم هذه المبالغ بشكل منفصل. معامل في الرياضيات او درجة بوجدت بعد الحساب أ.

حان الوقت لتذكر المثال الأصلي.

حل.

في مثالنا ن = 5. نقوم بملء الجدول لسهولة حساب المبالغ المضمنة في صيغ المعاملات المطلوبة.

يتم الحصول على القيم الموجودة في الصف الرابع من الجدول عن طريق ضرب قيم الصف الثاني في قيم الصف الثالث لكل رقم أنا.

يتم الحصول على القيم الموجودة في الصف الخامس من الجدول عن طريق تربيع القيم الموجودة في الصف الثاني لكل رقم أنا.

القيم الموجودة في العمود الأخير من الجدول هي مجموع القيم عبر الصفوف.

نستخدم صيغ طريقة المربعات الصغرى لإيجاد المعاملات أو ب. نستبدل فيها القيم المقابلة من العمود الأخير من الجدول:

لذلك، ص = 0.165س+2.184- الخط المستقيم التقريبي المطلوب.

يبقى لمعرفة أي من الخطوط ص = 0.165س+2.184أو تقريب البيانات الأصلية بشكل أفضل، أي إجراء تقدير باستخدام طريقة المربعات الصغرى.

تقدير الخطأ لطريقة المربعات الصغرى.

للقيام بذلك، تحتاج إلى حساب مجموع الانحرافات التربيعية للبيانات الأصلية من هذه الخطوط و ، تتوافق القيمة الأصغر مع السطر الذي يقترب بشكل أفضل من البيانات الأصلية بمعنى طريقة المربعات الصغرى.

منذ , ثم على التوالي ص = 0.165س+2.184تقريب البيانات الأصلية بشكل أفضل.

رسم توضيحي لطريقة المربعات الصغرى (LS).

كل شيء واضح للعيان على الرسوم البيانية. الخط الأحمر هو الخط المستقيم الموجود ص = 0.165س+2.184، الخط الأزرق هو النقاط الوردية هي البيانات الأصلية.

لماذا هذا مطلوب، لماذا كل هذه التقديرات؟

أنا شخصياً أستخدمه لحل مشكلات تجانس البيانات والاستيفاء والاستقراء (في المثال الأصلي قد يُطلب منهم العثور على قيمة القيمة المرصودة ذفي س = 3أو متى س=6باستخدام طريقة المربعات الصغرى). لكننا سنتحدث أكثر عن هذا لاحقًا في قسم آخر من الموقع.

دليل.

بحيث عندما وجدت أو بتأخذ الدالة أصغر قيمة، فمن الضروري عند هذه النقطة أن تكون مصفوفة الشكل التربيعي للتفاضل من الدرجة الثانية للدالة كان إيجابيا واضحا. دعونا نظهر ذلك.

جوهر طريقة المربعات الصغرى هو في العثور على معلمات نموذج الاتجاه الذي يصف بشكل أفضل ميل تطور أي ظاهرة عشوائية في الزمان أو المكان (الاتجاه هو الخط الذي يميز ميل هذا التطور). تتمثل مهمة طريقة المربعات الصغرى (LSM) في العثور ليس فقط على بعض نماذج الاتجاه، ولكن أيضًا في العثور على النموذج الأفضل أو الأمثل. سيكون هذا النموذج هو الأمثل إذا كان مجموع الانحرافات المربعة بين القيم الفعلية المرصودة وقيم الاتجاه المحسوبة المقابلة ضئيلًا (الأصغر):

أين هو الانحراف المربع بين القيمة الفعلية المرصودة

وقيمة الاتجاه المحسوبة المقابلة،

القيمة الفعلية (المرصودة) للظاهرة محل الدراسة،

القيمة المحسوبة لنموذج الاتجاه،

عدد مشاهدات الظاهرة محل الدراسة.

نادرًا ما يتم استخدام MNC بمفرده. كقاعدة عامة، يتم استخدامه في أغلب الأحيان فقط كتقنية فنية ضرورية في دراسات الارتباط. يجب أن نتذكر أن أساس معلومات OLS لا يمكن أن يكون إلا سلسلة إحصائية موثوقة، ويجب ألا يقل عدد الملاحظات عن 4، وإلا فإن إجراءات تجانس OLS قد تفقد المنطق السليم.

تتلخص مجموعة أدوات MNC في الإجراءات التالية:

الإجراء الأول. اتضح ما إذا كان هناك أي ميل على الإطلاق لتغيير السمة الناتجة عندما تتغير وسيطة العامل المحدد، أو بمعنى آخر، هل هناك علاقة بين "" في " و " X ».

الإجراء الثاني. ويتم تحديد الخط (المسار) الذي يمكنه وصف هذا الاتجاه أو وصفه بشكل أفضل.

الإجراء الثالث.

مثال. لنفترض أن لدينا معلومات حول متوسط ​​إنتاجية عباد الشمس للمزرعة قيد الدراسة (الجدول 9.1).

الجدول 9.1

رقم الملاحظة

الإنتاجية، ج/هك

نظرًا لأن مستوى التكنولوجيا في إنتاج عباد الشمس في بلدنا ظل دون تغيير تقريبًا على مدار السنوات العشر الماضية، فهذا يعني، على ما يبدو، أن التقلبات في الإنتاج خلال الفترة التي تم تحليلها كانت تعتمد إلى حد كبير على التقلبات في الطقس والظروف المناخية. هل هذا صحيح حقا؟

إجراء OLS الأول. تم اختبار الفرضية القائلة بوجود اتجاه في تغيرات محصول زهرة الشمس اعتمادا على التغيرات في الطقس والظروف المناخية خلال السنوات العشر التي تم تحليلها.

في هذا المثال ل" ذ "ينصح بأخذ محصول عباد الشمس، و" س » – رقم السنة المرصودة في الفترة التي تم تحليلها. اختبار الفرضية حول وجود أي علاقة بين " س " و " ذ "يمكن القيام بذلك بطريقتين: يدويًا وباستخدام برامج الكمبيوتر. وبطبيعة الحال، مع توفر تكنولوجيا الكمبيوتر، يمكن حل هذه المشكلة من تلقاء نفسها. ولكن من أجل فهم أدوات MNC بشكل أفضل، فمن المستحسن اختبار الفرضية حول وجود علاقة بين " س " و " ذ » يدويًا، عندما لا يكون في متناول اليد سوى قلم وآلة حاسبة عادية. في مثل هذه الحالات، من الأفضل التحقق من فرضية وجود الاتجاه بصريًا من خلال موقع الصورة الرسومية لسلسلة الديناميكيات التي تم تحليلها - مجال الارتباط:

يقع حقل الارتباط في مثالنا حول خط يتزايد ببطء. وهذا في حد ذاته يدل على وجود اتجاه معين في التغيرات في محصول زهرة الشمس. من المستحيل التحدث عن وجود أي اتجاه فقط عندما يبدو مجال الارتباط وكأنه دائرة أو دائرة أو سحابة رأسية أو أفقية تمامًا أو تتكون من نقاط متناثرة بشكل فوضوي. وفي جميع الحالات الأخرى فإن الفرضية حول وجود علاقة بين “ س " و " ذ "، ومواصلة البحث.

إجراء OLS الثاني. يتم تحديد الخط (المسار) الذي يمكن أن يصف أو يصف بشكل أفضل اتجاه التغيرات في محصول عباد الشمس خلال الفترة التي تم تحليلها.

إذا كان لديك تكنولوجيا الكمبيوتر، فسيتم اختيار الاتجاه الأمثل تلقائيا. في المعالجة "اليدوية"، يتم اختيار الوظيفة المثالية، كقاعدة عامة، بصريًا - حسب موقع حقل الارتباط. أي أنه بناءً على نوع الرسم البياني، يتم تحديد معادلة الخط الذي يناسب الاتجاه التجريبي (المسار الفعلي) بشكل أفضل.

كما هو معروف، يوجد في الطبيعة مجموعة كبيرة ومتنوعة من التبعيات الوظيفية، لذلك من الصعب للغاية تحليل جزء صغير منها بصريًا. لحسن الحظ، في الممارسة الاقتصادية الحقيقية، يمكن وصف معظم العلاقات بدقة تامة إما عن طريق القطع المكافئ، أو القطع الزائد، أو الخط المستقيم. في هذا الصدد، مع الخيار "اليدوي" لاختيار أفضل وظيفة، يمكنك قصر نفسك على هذه النماذج الثلاثة فقط.

القطع الزائد:

القطع المكافئ من الدرجة الثانية: :

من السهل أن نرى أنه في مثالنا، فإن أفضل وصف للاتجاه في تغيرات إنتاجية عباد الشمس على مدى السنوات العشر التي تم تحليلها هو الخط المستقيم، وبالتالي فإن معادلة الانحدار ستكون معادلة الخط المستقيم.

الإجراء الثالث. ويتم حساب معاملات معادلة الانحدار التي تميز هذا الخط، أو بمعنى آخر يتم تحديد صيغة تحليلية تصف أفضل نموذج للاتجاه.

العثور على قيم معلمات معادلة الانحدار، في حالتنا المعلمات و، هو جوهر OLS. تهدف هذه العملية إلى حل نظام من المعادلات العادية.

(9.2)

يمكن حل نظام المعادلات هذا بسهولة تامة باستخدام طريقة غاوس. دعونا نتذكر أنه نتيجة للحل، في مثالنا، تم العثور على قيم المعلمات. وبالتالي فإن معادلة الانحدار التي تم العثور عليها سيكون لها الشكل التالي:

  • درس تعليمي

مقدمة

أنا عالم رياضيات ومبرمج. أكبر قفزة قمت بها في مسيرتي كانت عندما تعلمت أن أقول: "أنا لا أفهم شيئا!"الآن أنا لا أخجل من أن أقول لنجم العلم أنه يلقي محاضرة لي، وأنني لا أفهم ما يقوله لي، وهو النجم. وهذا صعب للغاية. نعم الاعتراف بجهلك أمر صعب ومحرج. من يحب أن يعترف بأنه لا يعرف أساسيات شيء ما؟ بحكم مهنتي، لا بد لي من حضور عدد كبير من العروض والمحاضرات، حيث أعترف أنه في الغالبية العظمى من الحالات أريد النوم لأنني لا أفهم أي شيء. لكنني لا أفهم لأن المشكلة الكبيرة في الوضع الحالي للعلوم تكمن في الرياضيات. يفترض أن جميع المستمعين على دراية بجميع مجالات الرياضيات (وهو أمر سخيف). إن الاعتراف بأنك لا تعرف ما هو المشتق (سنتحدث عنه بعد قليل) أمر مخز.

لكنني تعلمت أن أقول إنني لا أعرف ما هو الضرب. نعم، لا أعرف ما هو الجبر الفرعي فوق جبر الكذب. نعم، لا أعرف لماذا هناك حاجة إلى المعادلات التربيعية في الحياة. بالمناسبة، إذا كنت متأكدًا من أنك تعرف، فلدينا شيء نتحدث عنه! الرياضيات هي سلسلة من الحيل. يحاول علماء الرياضيات إرباك وترهيب الجمهور؛ حيث لا يوجد ارتباك ولا سمعة ولا سلطة. نعم، إنه لأمر مرموق أن نتحدث بلغة مجردة قدر الإمكان، وهذا محض هراء.

هل تعرف ما هو المشتق؟ على الأرجح ستخبرني عن حد نسبة الفرق. في السنة الأولى من الرياضيات والميكانيكا في جامعة ولاية سانت بطرسبرغ، أخبرني فيكتور بتروفيتش خافين عازمالمشتق هو معامل الحد الأول من سلسلة تايلور للدالة عند نقطة ما (كانت هذه جمبازًا منفصلاً لتحديد سلسلة تايلور بدون مشتقات). لقد ضحكت على هذا التعريف لفترة طويلة حتى فهمت أخيرًا ما يدور حوله. المشتق ليس أكثر من مجرد مقياس بسيط لمدى تشابه الدالة التي نفرقها مع الدالة y=x, y=x^2, y=x^3.

ويشرفني الآن إلقاء المحاضرات على الطلاب الذين خائفالرياضيات. إذا كنت تخاف من الرياضيات، فنحن نسير على نفس الطريق. بمجرد أن تحاول قراءة بعض النصوص ويبدو لك أنها معقدة للغاية، فاعلم أنها مكتوبة بشكل سيء. أؤكد أنه لا يوجد مجال واحد في الرياضيات لا يمكن مناقشته "على الأصابع" دون فقدان الدقة.

مهمة للمستقبل القريب: كلفت طلابي بفهم ما هو المنظم التربيعي الخطي. لا تخجل، اقض ثلاث دقائق من حياتك واتبع الرابط. إذا لم تفهم أي شيء، فنحن على نفس الطريق. أنا (عالم رياضيات ومبرمج محترف) لم أفهم شيئًا أيضًا. وأنا أؤكد لك أنه يمكنك معرفة ذلك "على أصابعك". في الوقت الحالي، لا أعرف ما هو، لكنني أؤكد لك أننا سنكون قادرين على اكتشافه.

لذا، فإن المحاضرة الأولى التي سألقيها لطلابي بعد أن يأتوا إلي في حالة رعب ويقولون إن المنظم الخطي التربيعي هو شيء فظيع لن تتقنه أبدًا في حياتك طرق المربعات الصغرى. هل يمكنك حل المعادلات الخطية؟ إذا كنت تقرأ هذا النص، فعلى الأرجح لا.

لذا، بمعلومية النقطتين (x0، y0)، (x1، y1)، على سبيل المثال، (1,1) و (3,2)، فإن المهمة هي إيجاد معادلة الخط المستقيم الذي يمر عبر هاتين النقطتين:

توضيح

يجب أن يكون لهذا الخط معادلة مثل ما يلي:

هنا ألفا وبيتا غير معروفين لنا، لكن نقطتين من هذا الخط معروفتان:

يمكننا كتابة هذه المعادلة على شكل مصفوفة:

هنا يجب أن نقوم باستطراد غنائي: ما هي المصفوفة؟ المصفوفة ليست أكثر من مصفوفة ثنائية الأبعاد. هذه طريقة لتخزين البيانات، ولا ينبغي إرفاق أي معاني أخرى بها. يعتمد علينا بالضبط كيفية تفسير مصفوفة معينة. سأفسرها بشكل دوري على أنها رسم خرائط خطي، وبشكل دوري على أنها شكل تربيعي، وأحيانًا ببساطة على أنها مجموعة من المتجهات. سيتم توضيح كل هذا في السياق.

لنستبدل المصفوفات الملموسة بتمثيلها الرمزي:

ثم يمكن العثور على (alpha، beta) بسهولة:

وبشكل أكثر تحديدًا لبياناتنا السابقة:

مما يؤدي إلى المعادلة التالية للخط الذي يمر بالنقطتين (1،1) و (3،2):

حسنًا، كل شيء واضح هنا. دعونا نجد معادلة الخط المار ثلاثةالنقاط: (x0,y0)، (x1,y1) و (x2,y2):

أوه أوه أوه، ولكن لدينا ثلاث معادلات لمجهولين! سيقول عالم الرياضيات القياسي أنه لا يوجد حل. ماذا سيقول المبرمج؟ وسيقوم أولاً بإعادة كتابة نظام المعادلات السابق بالشكل التالي:

في حالتنا، تكون المتجهات i، j، b ثلاثية الأبعاد، لذلك (في الحالة العامة) لا يوجد حل لهذا النظام. يقع أي متجه (alpha\*i + beta\*j) في المستوى الممتد بواسطة المتجهات (i, j). إذا كان b لا ينتمي إلى هذا المستوى، فلا يوجد حل (لا يمكن تحقيق المساواة في المعادلة). ما يجب القيام به؟ دعونا نبحث عن حل وسط. دعنا نشير بـ ه (ألفا، بيتا)بالضبط إلى أي مدى لم نحقق المساواة:

وسنحاول تقليل هذا الخطأ:

لماذا مربع؟

نحن لا نبحث فقط عن الحد الأدنى من القاعدة، بل عن الحد الأدنى من مربع القاعدة. لماذا؟ النقطة الدنيا نفسها تتطابق، والمربع يعطي دالة سلسة (دالة تربيعية للوسائط (ألفا، بيتا))، في حين أن الطول ببساطة يعطي دالة مخروطية الشكل، غير قابلة للتفاضل عند النقطة الدنيا. بر. المربع أكثر ملاءمة.

من الواضح أن الخطأ يتم تقليله عند المتجه همتعامد على المستوى الممتد بواسطة المتجهات أناو ي.

توضيح

بمعنى آخر: نحن نبحث عن خط يكون فيه مجموع الأطوال المربعة للمسافات من جميع النقاط إلى هذا الخط هو الحد الأدنى:

تحديث: لدي مشكلة هنا، المسافة إلى الخط المستقيم يجب قياسها عموديًا، وليس عن طريق الإسقاط المتعامد. هذا المعلق على حق.

توضيح

بكلمات مختلفة تمامًا (بعناية، غير رسمية بشكل سيء، ولكن يجب أن تكون واضحة): نأخذ جميع الخطوط الممكنة بين جميع أزواج النقاط ونبحث عن الخط المتوسط ​​بين الكل:

توضيح

هناك تفسير آخر واضح وصريح: نعلق نابضًا بين جميع نقاط البيانات (هنا لدينا ثلاث نقاط) والخط المستقيم الذي نبحث عنه، والخط المستقيم لحالة التوازن هو بالضبط ما نبحث عنه.

الحد الأدنى من الصيغة التربيعية

لذلك، نظرا لهذا المتجه بومستوى ممتد بواسطة ناقلات أعمدة المصفوفة أ(في هذه الحالة (x0,x1,x2) و (1,1,1)) نحن نبحث عن المتجه همع الحد الأدنى من مربع الطول. من الواضح أن الحد الأدنى لا يمكن تحقيقه إلا بالنسبة للمتجه ه، متعامد مع المستوى الممتد بواسطة ناقلات أعمدة المصفوفة أ:

بمعنى آخر، نحن نبحث عن المتجه x=(alpha, beta) بحيث:

اسمحوا لي أن أذكرك أن هذا المتجه x=(alpha, beta) هو الحد الأدنى للدالة التربيعية ||e(alpha, beta)||^2:

هنا سيكون من المفيد أن نتذكر أنه يمكن تفسير المصفوفة أيضًا كشكل تربيعي، على سبيل المثال، يمكن تفسير مصفوفة الهوية ((1,0)،(0,1)) على أنها دالة x^2 + y^ 2:

شكل تربيعي

كل هذا الجمباز معروف باسم الانحدار الخطي.

معادلة لابلاس مع شرط ديريشليت الحدودي

الآن أبسط مهمة حقيقية: هناك سطح مثلث معين، فمن الضروري سلاسة ذلك. على سبيل المثال، لنقم بتحميل نموذج لوجهي:

الالتزام الأصلي متاح. لتقليل التبعيات الخارجية، أخذت الكود الخاص بعارض البرنامج الموجود بالفعل على حبري. لحل نظام خطي، أستخدم OpenNL، وهو حل ممتاز، ومع ذلك، من الصعب جدًا تثبيته: تحتاج إلى نسخ ملفين (.h+.c) إلى المجلد الذي يحتوي على مشروعك. تتم جميع عمليات التجانس باستخدام الكود التالي:

من أجل (int d = 0؛ d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = وجوه[i]; لـ (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

إحداثيات X وY وZ قابلة للفصل، وأنا أقوم بتنعيمها بشكل منفصل. أي أنني أحل ثلاثة أنظمة من المعادلات الخطية، كل منها يحتوي على عدد من المتغيرات يساوي عدد الرؤوس في النموذج الخاص بي. تحتوي الصفوف n الأولى من المصفوفة A على 1 واحد فقط لكل صف، والصفوف n الأولى من المتجه b لها إحداثيات النموذج الأصلي. وهذا يعني أنني أقوم بربط زنبرك بين الموضع الجديد للقمة والموضع القديم للقمة - ولا ينبغي أن يتحرك الوضع الجديد بعيدًا عن الوضع القديم.

جميع الصفوف اللاحقة من المصفوفة A (faces.size()*3 = عدد حواف جميع المثلثات في الشبكة) لها تواجد واحد هو 1 وتواجد واحد هو -1، مع وجود المتجه b الذي يحتوي على صفر مكونات متقابلة. هذا يعني أنني وضعت زنبركًا على كل حافة من شبكتنا المثلثة: تحاول جميع الحواف الحصول على نفس قمة نقطة البداية والنهاية.

مرة أخرى: جميع القمم متغيرة، ولا يمكنها الابتعاد عن موضعها الأصلي، ولكنها في نفس الوقت تحاول أن تصبح متشابهة مع بعضها البعض.

وهنا النتيجة:

كل شيء سيكون على ما يرام، النموذج سلس حقا، لكنه ابتعد عن الحافة الأصلية. دعنا نغير الكود قليلاً:

من أجل (int i = 0؛ i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

في المصفوفة A، بالنسبة للقمم الموجودة على الحافة، لا أضيف صفًا من الفئة v_i = verts[i][d]، ولكن 1000*v_i = 1000*verts[i][d]. ماذا يتغير؟ وهذا يغير الصورة التربيعية للخطأ. الآن لن يكلف الانحراف الواحد من الأعلى عند الحافة وحدة واحدة، كما كان من قبل، بل 1000*1000 وحدة. وهذا يعني أننا علقنا زنبركًا أقوى على القمم القصوى، ويفضل الحل تمديد الآخرين بقوة أكبر. وهنا النتيجة:

دعونا نضاعف قوة الزنبرك بين القمم:
nlCoefficiency(face[ j ], 2); nlCoefficiency(face[(j+1)%3], -2);

ومن المنطقي أن السطح أصبح أكثر سلاسة:

والآن أقوى مائة مرة:

ما هذا؟ تخيل أننا غمسنا حلقة سلكية في الماء والصابون. نتيجة لذلك، سيحاول فيلم الصابون الناتج أن يكون لديه أقل انحناء قدر الإمكان، ولمس الحدود - حلقة السلك لدينا. وهذا هو بالضبط ما حصلنا عليه من خلال تثبيت الحدود وطلب سطح أملس من الداخل. تهانينا، لقد قمنا للتو بحل معادلة لابلاس مع شروط ديريشليت الحدودية. يبدو جيدا؟ لكن في الواقع، كل ما تحتاجه هو حل نظام واحد من المعادلات الخطية.

معادلة بواسون

دعونا نتذكر اسمًا رائعًا آخر.

لنفترض أن لدي صورة مثل هذه:

يبدو جيدًا للجميع، لكني لا أحب الكرسي.

سأقطع الصورة إلى نصفين:



وسأختار الكرسي بيدي:

ثم سأسحب كل ما هو أبيض في القناع إلى الجانب الأيسر من الصورة، وفي نفس الوقت طوال الصورة سأقول أن الفرق بين بيكسلين متجاورين يجب أن يكون مساوياً للفرق بين بيكسلين مجاورين من اليمين صورة:

من أجل (int i = 0؛ i

وهنا النتيجة:

الكود والصور موجوده

إذا كانت كمية فيزيائية معينة تعتمد على كمية أخرى، فيمكن دراسة هذا الاعتماد عن طريق قياس y عند قيم مختلفة لـ x. ونتيجة للقياسات يتم الحصول على عدد من القيم:

س 1، س 2، ...، س ط، ...، س ن؛

ذ 1 , ص 2 , ..., ذ ط , ... , ذ ن .

بناءً على بيانات مثل هذه التجربة، من الممكن إنشاء رسم بياني للاعتماد y = ƒ(x). يتيح المنحنى الناتج الحكم على شكل الدالة ƒ(x). ومع ذلك، فإن المعاملات الثابتة التي تدخل في هذه الدالة تظل مجهولة. ويمكن تحديدها باستخدام طريقة المربعات الصغرى. النقاط التجريبية، كقاعدة عامة، لا تقع بالضبط على المنحنى. تتطلب طريقة المربعات الصغرى أن يكون مجموع مربعات انحرافات النقاط التجريبية عن المنحنى، أي 2 كان الأصغر.

من الناحية العملية، يتم استخدام هذه الطريقة في أغلب الأحيان (وببساطة) في حالة العلاقة الخطية، أي. متى

ص = ك سأو ص = أ + ب س.

الاعتماد الخطي واسع الانتشار في الفيزياء. وحتى عندما تكون العلاقة غير خطية، فإنهم عادةً ما يحاولون إنشاء رسم بياني للحصول على خط مستقيم. على سبيل المثال، إذا افترض أن معامل انكسار الزجاج n يرتبط بالطول الموجي للضوء α بالعلاقة n = a + b/lect 2، فسيتم رسم اعتماد n على lect -2 على الرسم البياني.

النظر في التبعية ص = ك س(خط مستقيم يمر بنقطة الأصل). لنقم بتكوين القيمة φ مجموع مربعات انحرافات نقاطنا عن الخط المستقيم

قيمة φ تكون دائمًا موجبة وتتبين أنها أصغر كلما اقتربت نقاطنا من الخط المستقيم. تنص طريقة المربعات الصغرى على أنه يجب اختيار قيمة k بحيث يكون لـ φ حد أدنى


أو
(19)

يظهر الحساب أن خطأ الجذر التربيعي في تحديد قيمة k يساوي

, (20)
حيث n هو عدد القياسات.

دعونا الآن نفكر في حالة أكثر صعوبة بعض الشيء، عندما يجب أن تلبي النقاط الصيغة ص = أ + ب س(خط مستقيم لا يمر بأصل الأصل).

وتتمثل المهمة في العثور على أفضل قيم a و b من مجموعة القيم المتوفرة x i, y i.

دعونا مرة أخرى نشكل الصيغة التربيعية φ، التي تساوي مجموع الانحرافات المربعة للنقاط x i، y i من الخط المستقيم

وابحث عن قيم a وb التي يوجد لـ φ حد أدنى لها

;

.

.

الحل المشترك لهذه المعادلات يعطي

(21)

جذر متوسط ​​الأخطاء المربعة لتحديد a وb متساويان

(23)

.  (24)

عند معالجة نتائج القياس باستخدام هذه الطريقة، يكون من المناسب تلخيص جميع البيانات في جدول يتم فيه حساب جميع المبالغ المضمنة في الصيغ (19)(24) بشكل مبدئي. وترد أشكال هذه الجداول في الأمثلة أدناه.

مثال 1.تمت دراسة المعادلة الأساسية لديناميات الحركة الدورانية ε = M/J (خط مستقيم يمر عبر نقطة الأصل). عند قيم مختلفة للحظة M، تم قياس التسارع الزاوي ε لجسم معين. مطلوب تحديد لحظة القصور الذاتي لهذا الجسم. يتم سرد نتائج قياسات لحظة القوة والتسارع الزاوي في العمودين الثاني والثالث الجدول 5.

الجدول 5
ن م، ن م ε، ق -1 م 2 م ε ε - كم (ε - كم) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

باستخدام الصيغة (19) نحدد:

.

لتحديد جذر متوسط ​​مربع الخطأ، نستخدم الصيغة (20)

0.005775كلغ-1 · م -2 .

وفقا للصيغة (18) لدينا

; .

SJ = (2.996 0.005775)/0.3337 = 0.05185 كجم م 2.

بعد ضبط الموثوقية P = 0.95، باستخدام جدول معاملات الطالب لـ n = 5، نجد t = 2.78 ونحدد الخطأ المطلق ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 كجم م 2.

لنكتب النتائج في النموذج:

ي = (3.0 ± 0.2) كجم م 2;


مثال 2.دعونا نحسب معامل درجة الحرارة لمقاومة المعدن باستخدام طريقة المربعات الصغرى. المقاومة تعتمد خطيا على درجة الحرارة

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

يحدد الحد الحر المقاومة R 0 عند درجة حرارة 0 درجة مئوية، ومعامل الانحدار هو حاصل ضرب معامل درجة الحرارة α والمقاومة R 0 .

وترد نتائج القياسات والحسابات في الجدول ( انظر الجدول 6).

الجدول 6
ن ر°، ق ص، أوم ر-¯ر (ر-¯ر) 2 (ر-¯ر)ص ص - بت - أ (ص - ب - أ) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/ن 85.83333 1.4005 – – – – –

باستخدام الصيغ (21)، (22) نحدد

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 أوم.

دعونا نجد خطأ في تعريف α. وبما أن ، وفقا للصيغة (18) لدينا:

.

باستخدام الصيغ (23)، (24) لدينا

;

0.014126 أوم.

بعد ضبط الموثوقية على P = 0.95، باستخدام جدول معاملات الطالب لـ n = 6، نجد t = 2.57 ونحدد الخطأ المطلق Δα = 2.57 0.000132 = 0.000338 درجة -1.

α = (23 ± 4) 10 -4 يشيد-1 عند P = 0.95.


مثال 3.مطلوب تحديد نصف قطر انحناء العدسة باستخدام حلقات نيوتن. تم قياس نصف قطر حلقات نيوتن r m وتم تحديد أعداد هذه الحلقات m. يرتبط نصف قطر حلقات نيوتن بنصف قطر انحناء العدسة R ورقم الحلقة بالمعادلة

ص 2 م = م LAR - 2 د 0 ر،

حيث d 0 سمك الفجوة بين العدسة واللوحة المتوازية (أو تشوه العدسة)،

 الطول الموجي للضوء الساقط.

ν = (600 ± 6) نانومتر؛
ص 2 م = ص؛
م = س؛
αR = ب؛
-2د 0 ر = أ،

ثم المعادلة سوف تأخذ الشكل ص = أ + ب س.

.

يتم إدخال نتائج القياسات والحسابات الجدول 7.

الجدول 7
ن س = م ص = ص 2، 10 -2 مم 2 مم (م -¯م) 2 (م -¯ م)ذ ص - ب س - أ، 10 -4 (ص - ب س - أ) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/ن 3.5 20.8548333 – – – – –

ويستخدم على نطاق واسع في الاقتصاد القياسي في شكل تفسير اقتصادي واضح لمعلماته.

يأتي الانحدار الخطي لإيجاد معادلة النموذج

أو

معادلة النموذج يسمح على أساس قيم المعلمات المحددة Xلها قيم نظرية للخاصية الناتجة، مع استبدال القيم الفعلية للعامل فيها X.

يتم تقليل بناء الانحدار الخطي إلى تقدير معلماته - أو الخامس.يمكن العثور على تقديرات معلمات الانحدار الخطي باستخدام طرق مختلفة.

يعتمد النهج الكلاسيكي لتقدير معلمات الانحدار الخطي على طريقة المربعات الصغرى(الشركات المتعددة الجنسيات).

تتيح لنا طريقة المربعات الصغرى الحصول على تقديرات المعلمات هذه أو الخامس،حيث يكون مجموع الانحرافات التربيعية للقيم الفعلية للخاصية الناتجة (ص)من المحسوبة (النظرية) الحد الأدنى:

للعثور على الحد الأدنى من دالة، تحتاج إلى حساب المشتقات الجزئية لكل من المعلمات أو بوجعلهم يساوي الصفر.

دعونا نشير من خلال S، ثم:

بتحويل الصيغة، نحصل على النظام التالي من المعادلات العادية لتقدير المعلمات أو الخامس:

حل نظام المعادلات العادية (3.5) إما بطريقة الحذف المتتابع للمتغيرات أو بطريقة المحددات نجد التقديرات المطلوبة للمعلمات أو الخامس.

معامل الخامسيسمى معامل الانحدار . وتظهر قيمته متوسط ​​التغير في النتيجة مع تغير العامل بمقدار وحدة واحدة.

يتم دائمًا استكمال معادلة الانحدار بمؤشر على مدى قرب الاتصال. عند استخدام الانحدار الخطي، مثل هذا المؤشر هو معامل الارتباط الخطي. هناك تعديلات مختلفة على صيغة معامل الارتباط الخطي. وفيما يلي بعض منها:

وكما هو معروف فإن معامل الارتباط الخطي يقع ضمن الحدود: -1 1.

لتقييم جودة اختيار دالة خطية، يتم حساب المربع

يسمى معامل الارتباط الخطي معامل التحديد.يميز معامل التحديد نسبة التباين في الخاصية الناتجة ذ،موضحة بالانحدار في التباين الكلي للصفة الناتجة:

وبناء على ذلك، فإن القيمة 1 تميز حصة التباين ذ،ناتجة عن تأثير عوامل أخرى لم تؤخذ بعين الاعتبار في النموذج.

أسئلة للتحكم في النفس

1. جوهر طريقة المربعات الصغرى؟

2. كم عدد المتغيرات التي يوفرها الانحدار الزوجي؟

3. ما هو المعامل الذي يحدد مدى قرب الارتباط بين التغيرات؟

4. في أي حدود يتم تحديد معامل التحديد؟

5. تقدير المعلمة ب في تحليل الارتباط والانحدار؟

1. كريستوفر دوجيرتي. مقدمة في الاقتصاد القياسي. - م: إنفرا - م، 2001 - 402 ص.

2. س.أ. بوروديتش. الاقتصاد القياسي. شركة مينسك "المعرفة الجديدة" 2001.


3. آر يو. رحمتوفا دورة قصيرة في الاقتصاد القياسي. درس تعليمي. ألماتي. 2004. -78 ص.

4. أنا. إليسيفا. - م: "المالية والإحصاء"، 2002

5. مجلة شهرية إعلامية وتحليلية.

النماذج الاقتصادية غير الخطية. نماذج الانحدار غير الخطية. تحويل المتغيرات.

النماذج الاقتصادية غير الخطية..

تحويل المتغيرات.

معامل المرونة.

إذا كانت هناك علاقات غير خطية بين الظواهر الاقتصادية، فسيتم التعبير عنها باستخدام الوظائف غير الخطية المقابلة: على سبيل المثال، القطع الزائد متساوي الأضلاع , القطع المكافئة من الدرجة الثانية وإلخ.

هناك فئتان من الانحدارات غير الخطية:

1. الانحدارات غير الخطية بالنسبة للمتغيرات التوضيحية المتضمنة في التحليل، ولكنها خطية بالنسبة للمتغيرات المقدرة، على سبيل المثال:

كثيرات الحدود بدرجات مختلفة - , ;

القطع الزائد متساوي الأضلاع - ;

دالة شبه لوغاريتمية - .

2. الانحدارات غير الخطية في المعلمات التي يتم تقديرها، على سبيل المثال:

قوة - ؛

إيضاحي - ؛

متسارع - .

المجموع الإجمالي للانحرافات التربيعية للقيم الفردية للخاصية الناتجة فيمن متوسط ​​القيمة ناجم عن تأثير أسباب عديدة. دعونا نقسم مجموعة الأسباب بشكل مشروط إلى مجموعتين: العامل قيد الدراسة xو عوامل اخرى.

إذا كان العامل لا يؤثر على النتيجة، فإن خط الانحدار على الرسم البياني يكون موازيا للمحور أوهو

ثم يكون التباين الكامل للخاصية الناتجة ناتجًا عن تأثير عوامل أخرى وسيتزامن المجموع الإجمالي للانحرافات المربعة مع المتبقي. إذا لم تؤثر العوامل الأخرى على النتيجة، إذن ذ مربوطةمع Xوظيفيا ومجموع المربعات المتبقية هو صفر. في هذه الحالة، يكون مجموع الانحرافات المربعة التي يفسرها الانحدار هو نفس مجموع المربعات الإجمالية.

نظرًا لأن نقاط مجال الارتباط لا تقع جميعها على خط الانحدار، فإن تشتتها يحدث دائمًا نتيجة لتأثير العامل X، أي الانحدار فيبواسطة والناجمة عن أسباب أخرى (اختلاف غير مفسر). تعتمد مدى ملاءمة خط الانحدار للتنبؤ على أي جزء من التباين الكلي للسمة فيحسابات الاختلاف الموضح

من الواضح أنه إذا كان مجموع الانحرافات التربيعية بسبب الانحدار أكبر من مجموع المربعات المتبقية، فإن معادلة الانحدار تكون ذات دلالة إحصائية والعامل Xله تأثير كبير على النتيجة ش.

, أي مع عدد حرية الاختلاف المستقل للخاصية. ويرتبط عدد درجات الحرية بعدد وحدات السكان n وعدد الثوابت المحددة منها. فيما يتعلق بالمشكلة قيد الدراسة، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة عنها ص

يتم تقييم أهمية معادلة الانحدار ككل باستخدام F- معيار فيشر. في هذه الحالة، يتم طرح فرضية صفرية مفادها أن معامل الانحدار يساوي الصفر، أي. ب = 0، وبالتالي العامل Xلا يؤثر على النتيجة ش.

يسبق الحساب الفوري لاختبار F تحليل التباين. يحتل المكان المركزي فيه تحليل المجموع الكلي للانحرافات التربيعية للمتغير فيمن متوسط ​​القيمة فيإلى قسمين - "موضح" و"غير مفسر":

- مجموع الانحرافات التربيعية؛

- مجموع الانحرافات التربيعية التي يفسرها الانحدار؛

- المبلغ المتبقي من الانحرافات التربيعية.

يرتبط أي مجموع من الانحرافات المربعة بعدد درجات الحرية , أي مع عدد حرية الاختلاف المستقل للخاصية. ويرتبط عدد درجات الحرية بعدد الوحدات السكانية نومع عدد الثوابت المحددة منه. فيما يتعلق بالمشكلة قيد الدراسة، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة عنها صممكن المطلوبة لتشكيل مجموع معين من المربعات.

التشتت لكل درجة من الحريةد.

نسب F (اختبار F):

إذا كانت الفرضية الصفرية صحيحة، فإن العامل والتباينات المتبقية لا تختلف عن بعضها البعض. بالنسبة لـ H 0، يكون الدحض ضروريًا بحيث يتجاوز تشتت العامل التشتت المتبقي عدة مرات. قام الإحصائي الإنجليزي سنيديكور بتطوير جداول القيم الحرجة F-العلاقات عند مستويات مختلفة من أهمية الفرضية الصفرية وأعداد مختلفة من درجات الحرية. قيمة الجدول F-المعيار هو القيمة القصوى لنسبة التباينات التي يمكن أن تحدث في حالة التباعد العشوائي لمستوى احتمال معين لوجود الفرضية الصفرية. القيمة المحسوبة F- تعتبر العلاقات موثوقة إذا كان o أكبر من الجدول.

وفي هذه الحالة يتم رفض الفرضية الصفرية حول عدم وجود علاقة بين العلامات، ويتم التوصل إلى استنتاج حول أهمية هذه العلاقة: حقيقة F> جدول Fح0 مرفوض.

إذا كانت القيمة أقل من المجدولة حقيقة F ‹، جدول F، فإن احتمال الفرضية الصفرية أعلى من مستوى محدد ولا يمكن رفضها دون المخاطرة الجسيمة بالتوصل إلى نتيجة خاطئة حول وجود علاقة. وفي هذه الحالة، تعتبر معادلة الانحدار ذات دلالة إحصائية. لكنه لا ينحرف.

الخطأ المعياري لمعامل الانحدار

ولتقييم أهمية معامل الانحدار يتم مقارنة قيمته مع خطأه المعياري، أي يتم تحديد القيمة الفعلية ر-اختبار الطالب: والتي تتم بعد ذلك مقارنتها بقيمة الجدول عند مستوى دلالة معين وعدد درجات الحرية ( ن- 2).

خطأ في المعلمة القياسية أ:

يتم التحقق من أهمية معامل الارتباط الخطي بناءً على حجم الخطأ معامل الارتباط ر ص:

إجمالي تباين السمات X:

الانحدار الخطي المتعدد

بناء نموذج

الانحدار المتعدديمثل تراجعا لصفة فعالة بعاملين أو أكثر، أي نموذج للشكل

يمكن أن يعطي الانحدار نتائج جيدة في النمذجة إذا كان من الممكن إهمال تأثير العوامل الأخرى التي تؤثر على موضوع الدراسة. لا يمكن التحكم في سلوك المتغيرات الاقتصادية الفردية، أي أنه لا يمكن ضمان تساوي جميع الشروط الأخرى لتقييم تأثير عامل واحد قيد الدراسة. في هذه الحالة، يجب أن تحاول التعرف على تأثير العوامل الأخرى عن طريق إدخالها في النموذج، أي بناء معادلة الانحدار المتعدد: ص = أ+ب 1 × 1 +ب 2 +…+ب ع × ع + .

الهدف الرئيسي من الانحدار المتعدد هو بناء نموذج يحتوي على عدد كبير من العوامل، مع تحديد تأثير كل منها على حدة، وكذلك تأثيرها مجتمعة على المؤشر النموذجي. تتضمن مواصفات النموذج مجموعتين من القضايا: اختيار العوامل واختيار نوع معادلة الانحدار