مبدأ إل إس بونترياجين الأقصى في نظرية الأنظمة المثالية.

في هذا القسم سوف نثبت خاصية حلول المعادلة الحرارية أحادية البعد والتي تسمى مبدأ القيمة القصوى. يمكن صياغتها على شكل نظرية.

نظرية. إذا كانت الوظيفة ش(س,ر), محددة ومستمرة في منطقة مغلقة و , يرضي معادلة التوصيل الحراري في هذه المنطقة

ثم القيم القصوى والدنيا للدالة u(س,ر)يتم تحقيقها إما في اللحظة الأولى من الزمن أو عند النقاط الحدودية x = 0 أو س = ل.

من الواضح أن الدالة تحقق المعادلة (40) وتصل إلى قيمتها القصوى (الدنيا) عند أي نقطة. إلا أن هذا لا يتعارض مع النظرية، إذ يترتب على شروطها أنه إذا تحققت القيمة القصوى (الدنيا) داخل المنطقة، فيجب أن تتحقق أيضاً أو عند ر= 0، أو في س = 0 أوبري س=ل.

المعنى المادي لهذه النظرية واضح وهو على النحو التالي. إذا كانت درجة الحرارة عند الحدود أو في اللحظة الأولية لا تتجاوز قيمة معينة م، ثم في حالة عدم وجود مصادر الحرارة درجة حرارة أكبر من م.

دعونا نتناول إثبات نظرية القيمة القصوى. إنه مدفوع بالعكس. لذا دع م- الحد الأقصى لقيمة الوظيفة ش(س,ر) في ر = 0 (0 ≤ سل) أو متى س = 0 أوبري س = ل(0 ≤ رت). لنفترض الآن أنه في مرحلة ما في المنطقة ( س 0 ,ر 0)، بحيث يكون 0< س 0 < لش0< ر 0 ≤ ت، وظيفة ش(س,ر) تصل إلى قيمتها القصوى، متجاوزة مبالقيمة ε، أي

ثم عند النقطة ( س 0 ,ر 0) يجب أن تكون العلاقات راضية

ولجميع القيم ستكون علامة التساوي راضية.

أين ك -معامل ثابت. من الواضح أن

دعونا نختار ذلك كيلو طنكان أقل من ε/2، ​​أي. ، ثم القيمة القصوى الخامس(س,ر) في ر = 0 (0 ≤ سل) أو متى س = 0 أوبري س = للن يتجاوز ، أي.

(في ر = 0 أو س = 0 أو س = ل), (44)

إذ بالنسبة لهذه الحجج فإن الحد الأول في الصيغة (43) لا يتجاوز م، والثانية.

نظرا لاستمرارية الوظيفة الخامس(س,ر) ، يجب في مرحلة ما ( س 1 ,ر 1) الوصول إلى أقصى قيمة له، و

لحظة من الزمن ر 1 أكبر تمامًا من الصفر، وبما أن أو أو عدم المساواة (44) صحيحة. عند نقطة ( س 1 ,ر(١) قياسا على (٤١) و (٤٢) ينبغي أن يكون كذلك

مع الأخذ في الاعتبار تعريف الوظيفة الخامس(س,ر) (43)، نحصل عليها

إنه يتبع هذا

أولئك. المعادلة (40) عند النقطة الداخلية ( س 1 ,ر 1) غير راض. وهذا يثبت أن الحل ش(س,ر) معادلة التوصيل الحراري (40) داخل المنطقة لا يمكن أن تأخذ قيما تتجاوز القيمة الأكبر ش(س,ر) على الحدود.



يمكن إثبات الجزء الثاني من نظرية القيمة الدنيا بالمثل.

دعونا نقدم ونثبت النتائج المترتبة على مبدأ القيمة القصوى:

النتيجة الطبيعية 1.إذا كان هناك حلان للمعادلة (40) وحققا الشروط:

,

دليل.نظرًا للخطية (40)، فإن الدالة هي الحل، وبالتالي فهي تحقق مبدأ القيمة القصوى. حيث:

لذلك:

وإلا فإنه سيكون له قيمة دنيا سلبية. وقد ثبت النتيجة الطبيعية 1.

النتيجة الطبيعية 2.إذا كانت هناك ثلاثة حلول للمعادلة (40) وحققت الشرط:

من أجل، و، فإن نفس عدم المساواة ينطبق على الجميع .

دليل.يتم ذلك ببساطة عن طريق تطبيق النتيجة الطبيعية 1 على أزواج من الوظائف و و.

دعونا ننظر في حل المعادلة (1)، المقابلة للشروط الأولية والحدية للنموذج:

يجب أن يكون هناك حل للمعادلة (40) يتوافق مع الظروف الأولية والحدية المضطربة التي تحددها الدوال، و بحيث:

باستخدام النتيجة الطبيعية 3، يمكننا أن نستنتج ما يلي: مما يعني أن حلول المشاكل الأصلية والمضطربة قريبة قدر الإمكان.

يحدد المبدأ الأقصى الشروط اللازمة للتحكم الأمثل في أنظمة التحكم غير الخطية. ويمتد أيضًا إلى الحالات التي يتم فيها فرض قيود على إحداثيات حالة النظام. دعونا نفكر في النظرية الرئيسية للمبدأ الأقصى ونعطي صياغة أكثر ملاءمة للتحكم الأمثل.

دع التحكم الأمثل يوصف بنظام المعادلات التفاضلية غير الخطية:

(1)

أو في شكل ناقل:

--ناقل الأبعاد لحالة الكائن

--ناقل الأبعاد لإجراءات التحكم

- دالة الجانب الأيمن من المعادلة (1)

نحن نفترض أن متجه التحكم يأخذ القيم من بعض المناطق المغلقة في مساحة التحكم ذات الأبعاد Ur. لنفترض أن الوظائف
تكون مستمرة في جميع الوسائط ولها مشتقات مستمرة فيما يتعلق بمتغيرات الحالة . دعونا نطلق على الضوابط المقبولة تلك الضوابط
، وهي دوال مستمرة للوقت وتأخذ قيمًا من المجموعة U.

تتم صياغة المشكلة الرئيسية للتحكم الأمثل على النحو التالي: من بين جميع الضوابط المسموح بها التي تجلب نقطة التمثيل في مساحة الطور X من الموضع الأولي إلى النهاية ، إذا كانت هذه الضوابط موجودة. وتحتاج إلى العثور على عناصر التحكم التي تكون وظيفتها:

(2)

يصل إلى الحد الأدنى.

دعونا نقدم متغيرا جديدا ، والتي يتم تحديدها بواسطة المعادلات التفاضلية التالية:

(3)

هنا
هو التكامل الوظيفي (2).

وبإضافة المعادلة (3) إلى نظام المعادلات (1) نحصل على:


(4)

لنكتب (4) في شكل متجه. للقيام بذلك، نأخذ في الاعتبار المتجه (n+1) لإحداثيات الحالة:
، ثم في شكل متجه سيتم كتابة هذه المعادلة على النحو التالي:

(5)

ناقل الأجزاء اليمنى من النظام (5).

لاحظ أن وظيفة المتجهات
لا يعتمد على الإحداثيات المتجه . دعونا نشير بواسطة نقطة مع الإحداثيات
في فضاء المرحلة (ن+1). . يترك
- بعض الضوابط المقبولة التي يمر بها مسار المرحلة المقابلة (1).
من خلال النقطة . وعندما تتحقق المساواة
من خلال النقطة .

ويترتب على المعادلة (2) أن الإحداثيات يتم تحديدها بالمساواة:

لو
، فيكون لدينا:

وهكذا في الفضاء مسار المرحلة للنظام (5)، الموافق لنفس السيطرة
، يمر في
من خلال النقطة
، وعندما
من خلال النقطة
. ويوضح ذلك الشكل التالي:

دعونا نشير بـ P إلى خط مستقيم في الفضاء ، مرورا بالنقطة
وموازية للمحور . ومن ثم يمكن صياغة مشكلة التحكم الأمثل الرئيسية على النحو التالي:

في (ن+1)-الفضاء الأبعاد نقطة البداية المحددة
والخط المستقيم P الموازي للمحور والمرور عبر النقطة
. ومن بين جميع الضوابط المقبولة التي لها خاصية حل النظام (5) مع الشروط الأولية
يمر عبر نقطة على خط مستقيم P، فمن الضروري تحديد عنصر تحكم لإحداثيات النقطة سيكون لها أهمية ضئيلة.

المشكلة المصاغة هي مشكلة ماير الشرطية القصوى. ومع ذلك، نظرًا للقيود المفروضة على التحكم المسموح به بطرق حساب التفاضل والتكامل الكلاسيكي للتغيرات، لا يمكن حل هذه المشكلة.

صياغة نظرية تعطي الشرط الضروري للطرف الأقصى:

دعونا نقدم المتغيرات المساعدة
، والتي تلبي نظام المعادلات التالي:


(6)

يسمى النظام (6) مترافقًا بالنسبة لنظام المعادلات (5). إذا اخترنا بعض السيطرة الممكنة
على الجزء
وإيجاد الحل المناسب
مع الشروط الأولية المحددة
ثم عند الاستبدال في نظام معادلات التحكم (6)
والحلول
، نحصل على نظام خطي متجانس من المعادلات:


(7)

النظام (7) يحقق شروط وجود وتفرد حل نظام المعادلات التفاضلية. يمكن دمج أنظمة المعادلتين (5) و (6) في شكل واحد من التدوين؛ للقيام بذلك، من الضروري إدخال الدالة H في الاعتبار:

(8)

ومن ثم سيتم كتابة النظامين (5) و (6) على النحو التالي:


(9)


(10)

لاحظ أن ناقلات الوظائف
و
مستمرة في كل مكان باستثناء نقاط انقطاع السيطرة المسموح بها
. هذه الوظائف المتجهة لها مشتقات مستمرة. للقيم الثابتة
و
تصبح الوظيفة H وظيفة تحكم فقط
.


تبدأ خصوصية المهام لتحقيق أقصى قدر من الأداء في التأثير عند تسجيل معايير الجودة. بالنسبة لهذه المشكلات، يكون معيار الجودة هو الوظيفة التالية (5.1)

وبالتالي، من الضروري العثور على عنصر تحكم يتم فيه نقل كائن التحكم من الحالة الأولية إلى الحالة النهائية في أقل وقت ممكن.

لا يختلف تسلسل حل المشكلات قيد النظر عن إجراءات حل المشكلات الأخرى التي تم حلها على أساس المبدأ الأقصى:

تجميع هاملتون.

تحديد مدى اعتماد إجراء التحكم الأمثل على المتغيرات المترافقة بناءً على تعظيم الهاملتونيان؛

وضع نظام مترافق من المعادلات التفاضلية.

رسم نظام عام للمعادلات التفاضلية، من بين الحلول التي يوجد بها إجراء التحكم المطلوب.

عند النظر في كائنات التحكم الموصوفة بواسطة المعادلات الخطية، فإن مشاكل الأداء الأقصى لها خصوصية معينة. النقطة المهمة هي أن الدالة الهاملتونية المقابلة لهذه المشاكل تحتوي على تحكم بدرجة لا تزيد عن الأولى، وبالتالي، لا يمكن تحديد القيمة القصوى للدالة الهاملتونية عن طريق مساواة مشتقتها الأولى فيما يتعلق بالتحكم بالصفر. يتم البحث عن القيمة القصوى لهاملتون في هذه الحالة من خلال تحليل المجموعات المحتملة بين التحكم ومتغيرات نظام المعادلات المترافق. اتضح أن التحكم الأمثل يجب أن يكون الحد الأقصى في المعامل خلال فترة التحكم، وفي بعض نقاطه، يجب تغيير الإشارة فورًا وفقًا لإشارة بعض وظائف المتغيرات المترافقة. في ظل ظروف مثل هذا التأثير الضعيف لنظام المعادلات المترافق على إجراء التحكم، يصبح من الممكن التخلي تمامًا عن حل نظام المعادلات المترافق واعتبار لحظات تغيير علامة التحكم (لحظات التبديل) كمتغيرات مستقلة.

دعونا نفكر بمزيد من التفصيل في حل مشكلة الأداء الأقصى باستخدام المثال التالي.

كائن التحكم:

معيار الجودة:

هاميلتوني:

من خلال تحليل مجموعات القيم الممكنة، يمكننا أن نستنتج أنه لضمان القيمة القصوى للهاملتونية، اعتمادًا على عنصر التحكم، من الضروري تحقيق العلاقة التالية:

نظام المعادلات المترافق:

النظام العام للمعادلات:

نظرًا لأنه في نظام المعادلات (5.1) لا تعتمد معادلات المتغيرات المترافقة على حالات كائن التحكم، فلا يمكن العثور على تعبيرات لـ إلا من نظام المعادلات المترافقة دون الاهتمام بمعادلات حالات التحكم هدف.

في هذه الحالة:

من خلال تحليل التعبيرات التي تم الحصول عليها، يمكننا أن نستنتج أن إجراء التحكم المطلوب له شكل موجة مستطيلة، والتي لا تتغير الإشارة أكثر من مرة. من الواضح أنه يجب اختيار لحظة تغيير إشارة التحكم (لحظة التبديل) من شرط ضمان الشروط الحدودية المحددة لحالات كائن التحكم. يمكن استخدام عدة طرق لتحديد نقاط التبديل.

الطريقة الأولى لتحديد نقاط التبديل- تحليلي. عند استخدام هذه الطريقة، من الضروري الحصول على تعبير تحليلي لاستجابة كائن التحكم لإجراء تحكم في شكل موجة مستطيلة. نستخدم تحويل لابلاس لهذا الغرض. سيتم الإشارة إلى لحظة التبديل بواسطة .

نظام معادلات لابلاس المحول لكائن التحكم، مع مراعاة تأثير الموجة المستطيلة، له الشكل:

من نظام المعادلات هذا يمكننا الحصول على التعبيرات التالية للصور L لحالات كائن التحكم:

أو، بعد إجراء تحويل لابلاس العكسي، التعبيرات التحليلية الفعلية للعمليات العابرة في الزمن:

تتيح لنا التعبيرات الأخيرة العثور على قيمة لحظة التبديل واللحظة الزمنية التي يتم فيها نقل كائن التحكم إلى الحالة المطلوبة.

الطريقة الثانية لتحديد نقاط التبديل- البحث عن الحد الأدنى.

للتمكن من استخدام الحد الأدنى من خوارزميات البحث لحل مشكلة التحكم الأمثل، قمنا بصياغة مشكلة الأداء الأقصى على النحو التالي:

لنفترض أن إجراء التحكم هو دالة ثابتة للوقت، والتي تغير الإشارة في الوقت المناسب، ويتم نقل كائن التحكم إلى الحالة النهائية في الوقت المناسب. مطلوب تحديد قيم المعلمات التي يتم عندها تحقيق الحد الأدنى لقيمة التناقض بين القيم الفعلية والمطلوبة لحالات كائن التحكم في الوقت الحالي. يتم حساب القيمة المتبقية على أنها مجموع الفروق المربعة بين القيم الفعلية والمحددة لحالات كائن التحكم في الوقت الحالي.

يمكن حساب معاملات التحكم الأمثل باستخدام طريقة البحث الدنيا باستخدام برنامج MATLAB التالي:

الملف Main5.m

٪ ناقلات التقريبات الأولية للحظة التبديل و

% من نهاية فترة التحكم

T=fminsearch("fms5"،ti0)

الدالة و=fms5(T)

٪ الحل العددي للفرق. مستوى كائن التحكم أثناء العمل

٪ عليه السيطرة على موجة مربعة

Ode45("odefun5",,);

حساب النسبة المئوية المتبقية

f=x(الطول(t),1)^2+x(الطول(t),2)^2;

إنشاء مجموعة من قيم التحكم للتخطيط

لأني = 1: الطول (ر)

مؤامرة(ر،س(:،1)،ر،ش)

ملف odefun5.m

الدالة f=odefun5(t,x)

الطريقة الثالثة لتحديد نقاط التبديل- البناء الرسومي لخط التبديل.

هذه الطريقة مرئية للغاية، ولكنها قابلة للتطبيق على كائنات التحكم من الدرجة الثانية، لأنها يتم وصف سلوك هذه الكائنات فقط بشكل كامل من خلال صورة الطور. عند استخدام هذه الطريقة، يتم حل مشكلة التحكم الأمثل عن طريق إنشاء خط تبديل، الموقع الهندسي للنقاط في مساحة الطور لكائن التحكم، والذي يمكن من خلاله نقل الكائن إلى الحالة النهائية دون تبديل علامة التحكم. في حالة العثور على خط التبديل، يكون إجراء التحكم في الكائن كما يلي:

يتم تطبيق تحكم بإشارة معينة على الكائن، وتحت تأثير هذا التحكم، يتحرك الكائن حتى تصبح نقطة تمثيله على خط التبديل

عندما تصل نقطة التمثيل إلى خط التبديل، تتغير إشارة إجراء التحكم وتبدأ نقطة تمثيلها في التحرك على طول خط التبديل إلى الحالة المستهدفة. وبالتالي، يتم ضمان وصول نقطة التصوير إلى الحالة المستهدفة من خلال تحديد خط التبديل.

إحدى الطرق الواضحة لإنشاء خط التبديل هي مسح مستوى الطور بأكمله وتذكر تلك النقاط التي يتم من خلالها تحقيق الحالة المستهدفة من خلال تطبيق التحكم الثابت في الحجم والإشارة.

ومع ذلك، هناك طريقة لبناء خط التحويل بالكامل في خطوة واحدة. والحقيقة هي أن مسار الطور لجسم يتحرك في زمن عكسي من نقطة مستهدفة تحت تأثير ثابت التحكم في الحجم والإشارة له كل خصائص خط التبديل. وبالتالي، يمكن إنشاء خط التبديل عن طريق حل المعادلات التفاضلية لكائن التحكم المكتوبة في زمن عكسي. رياضياً، يتم الانتقال إلى الزمن العكسي عن طريق الاستبدال بـ في معادلات الكائن. وينبغي النظر في. أن خط التبديل له فرعين: أحدهما يتوافق مع قيمة إيجابية لإجراء التحكم، والآخر سلبي.

يتكون برنامج حل مشكلة الأداء الأقصى من جزأين:

برنامج نصي يبني مسار الطور لجسم ما عن طريق حل معادلاته عدديًا المكتوبة في زمن عكسي من نقطة البداية المقابلة للحالة المستهدفة (إنشاء خط تبديل)؛

برنامج نصي يبني مسار الطور لكائن ما عن طريق حل معادلاته عدديًا المكتوبة في الوقت العادي من نقطة البداية المقابلة للحالة الأولية (علامة إجراء التحكم عكس الإشارة المستخدمة عند إنشاء خط التبديل).

يجب أن تكون مدة مسار الطور الناتج عن البرنامج النصي الثاني كافية حتى تتقاطع مع خط التبديل. لحظة التقاطع هي لحظة التبديل المطلوبة.

مثال

دعونا ننظر في المتغيرات العشوائية

  • Xعدد النجاحات في اثنتي عشرة تجربة مستقلة مع توزيع برنولي مع احتمال النجاح θ في كل منها.
  • يعدد التجارب المستقلة مع توزيع برنولي المطلوبة للحصول على ثلاث نجاحات. احتمال النجاح في كل تجربة هو θ.

ثم الاعتبار X= 3 سيعطي دالة الاحتمالية

والاعتبار ي= 12 سيعطي دالة الاحتمالية

إنهما متساويان، حيث أن أحدهما يساوي حاصل ضرب الثاني بقيمة عددية. ينص مبدأ الاحتمال الأقصى في هذه الحالة على أن الاستنتاجات المستخلصة حول قيمة المتغير θ يجب أن تكون هي نفسها في كلتا الحالتين.

اختلاف الملاحظة X= 3 والمراقبة ي= 12 في تصميم التجربة البحتة: في إحدى الحالات تقرر في البداية إجراء اثنتي عشرة تجربة، وفي الحالة الأخرى الاستمرار في المحاولة حتى تكون هناك ثلاث تجارب ناجحة. نتيجةسيكون هو نفسه في كلتا الحالتين. ولذلك، يتم التعبير عن مبدأ الاحتمال الأقصى في بعض الأحيان على النحو التالي:

الاستنتاج يجب أن يعتمد فقط من النتيجةتجربة، و وليس من التصميمتجربة.

قانون الاحتمالية القصوى

المفهوم ذو الصلة بمبدأ الاحتمال الأقصى هو قانون الاحتمالية القصوىقائلًا إن نسبة قيمة المعلمة الأكثر قابلية للتطبيق تساوي نسبة وظائف الاحتمال الخاصة بها. ثم الموقف

هو مقياس لمدى القيمة سيقبل المعلمة أفيما يتعلق ب ب. فإذا كانت النسبة تساوي 1 فلا فرق، وإذا كانت أكبر من 1 فلا فرق أالأفضل ب، والعكس صحيح.

من مبدأ الاحتمال الأقصى وقانون الاحتمال الأقصى، يترتب على ذلك أن المعلمة التي تزيد من دالة الاحتمال هي الأفضل. هذا هو أساس طريقة الاحتمالية القصوى المعروفة.

مرجع تاريخي

تم ذكر مبدأ الاحتمال الأقصى لأول مرة في الطباعة. ومع ذلك، تم نشر أساسيات المبدأ وتطبيقه في الممارسة العملية في وقت سابق في أعمال R. A. Fisher في

الحجج المؤيدة والمعارضة لمبدأ الاحتمال الأقصى

مبدأ الاحتمال الأقصى غير مقبول من قبل الجميع. تتعارض بعض الأساليب الشائعة الاستخدام في الإحصاء التقليدي، مثل اختبار الفرضيات الإحصائية، مع مبدأ الاحتمالية القصوى. دعونا نلقي نظرة سريعة على بعض إيجابيات وسلبيات هذا المبدأ.

اعتماد النتيجة على تنظيم التجربة

تلعب الأحداث غير المحققة دورًا في بعض الأساليب الإحصائية الشائعة. على سبيل المثال، قد تعتمد نتيجة اختبار الفرضية الإحصائية على احتمالية الثقة بقدر أو حتى أكثر من توزيع المعلمة غير المعروفة. وقد يعتمد احتمال الثقة نفسه على تنظيم التجربة.

لا تعتمد بعض طرق اختبار الفرضيات الكلاسيكية على الاحتمالية. أحد الأمثلة التي يتم الاستشهاد بها غالبًا هو مشكلة التوقف المثالية. لنفترض أنني قلت إنني رميت عملة معدنية 12 مرة وحصلت على 3 صور. من هذا يمكنك استخلاص بعض الاستنتاجات حول احتمالية هبوط هذه العملة. لنفترض الآن أنني رميت العملة حتى ظهرت الصورة ثلاث مرات، مما أدى إلى 12 رمية. هل ستتوصل إلى استنتاجات مختلفة الآن؟

دالة الاحتمال هي نفسها في كلتا الحالتين وهي متناسبة

.

وفقا لمبدأ الاحتمال، يجب أن تكون الاستنتاجات هي نفسها في كلتا الحالتين.

لنفترض أن مجموعة من العلماء حددوا احتمالية تحقيق نتيجة ما (والتي سنسميها "النجاح") من خلال سلسلة من التجارب. يخبرنا المنطق السليم أنه إذا لم يكن هناك سبب للاعتقاد بأن النجاح أكثر احتمالا من الفشل، والعكس صحيح، فيتعين علينا أن نحدد احتمال النجاح عند 0.5. العالم آدم أجرى 12 اختبارا، حصل فيها على 3 نجاحات و9 رسوبات، وتوفي بعدها.

واصل زميله في المختبر بيل عمل آدم ونشر نتيجة اختبار الفرضية. لقد اختبر الفرضية القائلة باحتمالية النجاح ص=0.5 مقابل ص < 0.5. Вероятность того, что в 12 испытаниях наступит не более 3 успехов, равна

وهي 299/4096 = 7.3%. وبالتالي لم يتم رفض الفرضية عند مستوى ثقة 5%.

شارلوت، بعد قراءة مقال بيل، تكتب رسالة. وتعتقد أن آدم ربما استمر في الاختبار حتى وفاته، بعد أن حقق 3 نجاحات في تلك اللحظة. احتمال أن تتطلب ثلاثة نجاحات 12 تجربة أو أكثر هو

وهي 134/4096 = 3.27%. و الآنيتم رفض النتيجة عند مستوى 5٪.

بالنسبة لهؤلاء العلماء، يعتمد اعتماد نتيجة الاختبار على تصميم التجربة، وليس فقط على معقولية النتيجة.

ومن الواضح أن المفارقات من هذا النوع يعتبرها البعض حجة ضد مبدأ الاحتمالية، بينما يرى البعض الآخر أنها توضح أهمية المبدأ.

الأدب

أنظر أيضا

روابط

  • أنتوني دبليو إف. إدواردز. "احتمالية." http://www.cimat.mx/reportes/enlinea/D-99-10.html
  • جيف ميلر. أقدم الاستخدامات المعروفة لبعض كلمات الرياضيات (L)
  • جون ألدريتش. الاحتمالية والاحتمالية في الأساليب الإحصائية لـ R. A. Fisher للعاملين في مجال الأبحاث

مؤسسة ويكيميديا. 2010.

دعونا الآن نأخذ في الاعتبار القيود (2.2.2) على السيطرة. إذا لم تصل الوظائف في عملية التحكم الأمثل إلى حدود المجموعة (2.2.2) (مما يعني) فإن العلاقات (2.2.13) و (2.2.14) تكون راضية عنها. ومع ذلك، غالبًا ما يأخذ التحكم الأمثل قيمًا حدودية أو - علاوة على ذلك، يمكن للتحكم الأمثل أن يقفز من حد إلى آخر. إن مثل هذه الضوابط هي بالفعل وظائف مستمرة للزمن.

عندما يصل التحكم الأمثل إلى حدود المجموعة U، يتم انتهاك العلاقات (2.2.13)، (2.2.14). في هذه الحالة، تفي الضوابط المثلى بالمبدأ الأقصى لـ L. S. Pontryagin، الذي تم تأسيسه وإثباته في شكل النظرية الواردة أدناه.

بالانتقال إلى هذه النظرية، دعونا نقدم بعض التوضيحات. دعونا نلقي سيطرة تعسفية مقبولة، وفي ظل الظروف الأولية، نجد حلاً للنظام (2.2.1): .

باستبدال هذا الحل والتحكم في (2.2.8)، نحدد، في الوقت الحالي، وفي ظل بعض الشروط الأولية التعسفية، الحل (2.2.8): . بالنسبة لقيم المتجهات الثابتة (الثابتة)، تصبح الدالة H دالة للمتجه. الحد الأقصى لهذه الوظيفة بواسطة وسيتم الإشارة إليه بواسطة:

يمكن تحقيق الحد الأقصى (أعلى قيمة) للدالة المستمرة عند نقاط الحد الأقصى المحلي لهذه الوظيفة

وعلى حدود المجموعة.

النظرية 2.2.1 (المبدأ الأقصى لـ L. S. Pontryagin). دع ، يكون هذا التحكم مقبولاً بحيث تمر الحلول المقابلة للمعادلة (2.2.11) ، المنبثقة من الحالة (2.2.3) ، (2.2.7) في لحظة الزمن ، عبر النقطة في لحظة الزمن.

للتحكم الأمثل (الذي يأخذ ) أصغر قيمة)، من الضروري وجود مثل هذه الدوال المستمرة غير الصفرية التي تلبي المعادلات (2.2.12) بحيث تصل دالة المتغير لأي متغير إلى الحد الأقصى

في هذه الحالة، في اللحظة الأخيرة من الزمن تكون العلاقات راضية

إذا تم استيفاء (2.2.11) و (2.2.12) و (2.2.17)، فإن وظائف المتغير t تكون ثابتة وبالتالي لا يمكن إجراء التحقق من العلاقات (2.2.18) بالضرورة في الوقت الحالي من الزمن، ولكن في أي لحظة.

إن إثبات النظرية معقد للغاية، وبالتالي فإن الملحق 2 يوفر فقط اشتقاق العلاقة الرئيسية (2.2.17) للنظرية في حالة الطرف الأيمن الحر (غير محدد) والطرف الثابت.

يمكن كتابة العلاقات (2.2.17) و (2.2.18) بشكل أبسط:

وبالتالي فإن الشرط المركزي في النظرية 2.2.1 هو الشرط الأقصى (2.2.19). وهذا يعني أنه إذا كانت الضوابط المثلى والمسارات المثلى، فمن المؤكد أنه سيكون هناك مثل هذه الحلول الثابتة ومثل هذه) للنظام (2.2.12) بحيث تصل وظيفة متغيراتها للجميع إلى الحد الأقصى على U على وجه التحديد في ظل الضوابط المثلى. ولذلك، فإن النظرية 2.2.1، التي تعطي الشرط الضروري لتحقيق الأمثلية في مشاكل التحكم الأمثل، تسمى عادةً بالمبدأ الأقصى. لاحظ أنه عند النقاط الداخلية للمجموعة U، تكون الشروط (2.2.13)، (2.2.14)، الضرورية لـ (2.2.19)، مستوفاة للتحكم الأمثل.

التطبيق العملي لمبدأ الحد الأقصى.

كيف يمكننا عمليا استخدام الشرط (2.2.19) حيث أن الدوال والثوابت المتضمنة في هذا الشرط غير معروفة؟

هنا يتابعون على النحو التالي: باعتبار الدالة ) كدالة للمتغيرات وباعتبار المتغيرات كمعلمات، فإنهم يحلون مشكلة تعظيم الدالة وإيجاد الدالة

حيث يتم تحقيق أعلى قيمة للوظيفة.

في بعض الحالات، يمكن كتابة الدالة (2.2.20) بشكل صريح. على سبيل المثال، إذا كان الجانب الأيمن من (2.2.1) لديه البنية

وتكامل الدالة (2.2.5)

يتم وصف المجموعة بواسطة متباينات U (2.2.2)، إذن

وتصل هذه الدالة إلى أكبر قيمة لها على U عند النقطة ذات الإحداثيات

توفر الصيغة (2.2.22) كمية كبيرة من المعلومات حول بنية التحكم الأمثل: إحداثيات التحكم الأمثل هي دالة خطوة (ثابتة متعددة التعريف) ذات قيم، بينما يتم تحديد لحظات التبديل حسب الشرط

فلنفترض أن الدالة (2.2.20) معروفة. النظر في نظام المعادلات التفاضلية

فالدوال والمتضمنة في الجانب الأيمن من هذه المعادلات معروفة. الحل العام للنظام (2.2.24)، (2.2.25) يعتمد على ثوابت اختيارية يتم تحديدها من الشروط الحدية (2.2.3)، (2.2.4). تسمى مشكلة تكامل المعادلات (2.2.24)، (2.2.25) تحت الشروط الحدودية (2.2.3)، (2.2.4) بمشكلة القيمة الحدية (مشكلة القيمة الحدية ذات النقطتين).

وبالتالي، فإن المبدأ الأقصى يسمح لنا بتقليل حل مشكلة التحكم الأمثل في البرنامج إلى حل مشكلة القيمة الحدودية.

وتكمن صعوبة حلها في أن تكامل المعادلتين (2.2.24)، (2.2.25) في "الزمن المباشر" غير ممكن، لأن الشروط الأولية غير معروفة ومن الطرق الممكنة لحل مشكلة القيمة الحدية ما يلي . بالنظر إلى المتجه التعسفي والتكامل (2.2.24)، (2.2.25) في ظل ظروف أولية معروفة، سنجد الوظائف ونتحقق من تحقيق المساواة (2.2.4). إذا تم انتهاكه، نحدد متجهًا آخر، وبالتكامل (2.2.24)، (2.2.25) في ظل الظروف الأولية، نحصل على المتجه.

إذا لم يتطابق مع المعطى، فإننا نواصل العملية حتى يتم العثور على متجه بحيث يتم استيفاء الشروط (2.2.4) بدقة مقبولة. مع هذا النهج، يتم استخدام طرق التدرج عندما يتم تحديده من شرط "المسافة" الدنيا من متجه معين.

في الرياضيات الحسابية، تم تطوير عدد من الطرق للحل العددي التقريبي لمشاكل القيمة الحدودية: طريقة الرمي، طريقة المسح، عدد من الطرق التكرارية، . وفي كثير من الحالات لا يمكن أن نجد من الشرط (2.2.19) الصيغة الصريحة (2.2.22) للتحكم الأمثل. ثم تشكل المعادلات (2.2.1) و (2.2.6) والنظام المجاور (2.2.12) والشروط القصوى (2.2.19) مشكلة القيمة الحدية لمبدأ الحد الأقصى. تحتوي هذه المشكلة على عدد من الميزات المحددة التي تجعل من الصعب استخدام الطرق الرقمية القياسية لحل مسائل القيمة الحدية. تتضمن هذه الميزات انقطاعات الوظائف التي تحقق الشرط الأقصى (2.2.14)، وعدم تفردها، والطبيعة غير الخطية للاعتماد (2.2.20) حتى في الأنظمة الخطية. بالإضافة إلى ذلك، فإن إحدى سمات مشاكل القيمة الحدية المرتبطة بالمبدأ الأقصى، حتى في الحالات التي يكون من الممكن فيها العثور على شكل واضح من الضوابط (2.2.20)، هو ضعف تقاربها الناجم عن عدم استقرار النظام (2.2.24) )، (2.2.25). يتم تقديم عدد من التقنيات لحل مشاكل القيمة الحدودية للمبدأ الأقصى، على سبيل المثال، في.

دعونا نلاحظ في الختام أنه على الرغم من الطرق المختلفة لحل مشكلة القيمة الحدية للمبدأ الأقصى عدديًا، فإن عملية حل كل تحسين بناءً على هذا المبدأ هي مشكلة إبداعية مستقلة، يتم حلها في إطار فرع معين من الديناميكيات. الذي ينتمي إليه كائن التحكم، مع مراعاة ميزاته المحددة، ويستخدم لتحسين تقارب الحل العددي لمشكلة القيمة الحدودية.

مثال 2.2.1. بناء التحكم الأمثل في استهلاك الوقود.

دعونا نفكر في كائن التحكم الموصوف في المعادلات

دع القيد يفرض على السيطرة

وظيفة التحسين التي تعبر عن استهلاك الوقود لها الشكل

يتم إعطاء الحالة الأولية

والحالة في الوقت المناسب

مطلوب العثور على حيث ينتقل الكائن (2.2.26) من الحالة (2.2.29) إلى الحالة (2.2.30)، بينما يتم استيفاء القيود (2.2.27)، والوظيفة (2.2.28). يأخذ أصغر قيمة.

بالانتقال إلى تحديد التحكم الأمثل بناءً على المبدأ الأقصى، نقوم بتشكيل الوظيفة

معادلات للمتغيرات المساعدة

يتم تعريف عنصر التحكم الذي يوفر الحد الأقصى من الوظيفة (2.2.31) على أنه

المعادلات (2.2.26)، (2.2.32)، (2.2.33) تشكل مشكلة القيمة الحدية. وبالانتقال إلى دراسته نكتب حل النظام (2.2.32):

حيث توجد أرقام غير معروفة يجب تحديدها بحيث يقوم التحكم (2.2.33) بإحضار الكائن (2.2.26) إلى الحالة (2.2.30).

دعونا نجد حلاً للنظام (2.2.26) لـ و . في الحالة الأولى يكون حل هذا النظام بالشكل . يعتمد ذلك على الثوابت R و p، بينما . مسارات الطور لهذا النظام عبارة عن دوائر مركزها نقطة الأصل (الشكل 2.2.1، أ). مسارات الطور للنظام (2.2.26) هي أيضًا دوائر تقع مراكزها عند النقاط على التوالي (الشكل 2.2.1، ب، ج).