L.S. Pontryagin'in optimal sistemler teorisinde maksimum ilkesi.

Bu bölümde tek boyutlu ısı denkleminin çözümlerinin bir özelliğini kanıtlayacağız. maksimum değer prensibi. Bir teorem olarak formüle edilebilir.

Teorem. Eğer fonksiyon(X,T), Kapalı bir bölgede tanımlanmış ve sürekli Ve , bu bölgedeki ısı iletim denklemini karşılar

daha sonra u fonksiyonunun maksimum ve minimum değerleri(X,T)ya zamanın başlangıç ​​anında ya da x = sınır noktalarında elde edilir 0 veya x = l.

Fonksiyon açıkça denklem (40)'ı karşılar ve herhangi bir noktada maksimum (minimum) değerine ulaşır. Bununla birlikte, bu teoremle çelişmez, çünkü koşullarından, eğer bölge içinde maksimum (minimum) değer elde edilirse, o zaman bu değere de ulaşılması gerektiği sonucu çıkar. t= 0 veya x = 0 orpri x=l.

Bu teoremin fiziksel anlamı açıktır ve aşağıdaki gibidir. Sınırdaki veya başlangıç ​​anındaki sıcaklık belirli bir değeri aşmıyorsa M, daha sonra ısı kaynaklarının yokluğunda, daha yüksek bir sıcaklık M.

Maksimum değer teoreminin ispatı üzerinde duralım. Tam tersi tarafından yönlendiriliyor. Öyleyse izin ver M– maksimum fonksiyon değeri sen(X,T) t = 0 (0 ≤ Xben) veya ne zaman x = 0 orpri x = l(0 ≤ TT). Şimdi bölgenin bir noktasında olduğunu varsayalım ( X 0 ,T 0), öyle ki 0< X 0 < ben u0< T 0 ≤ T, işlev sen(X,T) maksimum değerine ulaşır, aşarak Mε değerine göre, yani.

Daha sonra bu noktada ( X 0 ,T 0) ilişkiler tatmin edilmeli

ve tüm değerler için eşittir işareti karşılanacaktır.

Nerede k- sabit katsayı. Açıkça görülüyor ki

öyle seçelim ki kTε/2'den azdı, yani , ardından maksimum değer v(X,T) t = 0 (0 ≤ Xben) veya ne zaman x = 0 orpri x = l aşmayacak, yani

(saatte t = 0 veya x = 0 veya x = l), (44)

çünkü bu argümanlar için formül (43)'teki ilk terim şunu aşmaz: M ve ikincisi.

Fonksiyonun devamlılığı nedeniyle v(X,T), bir noktada olması gerekir ( X 1 ,T 1) maksimum değerine ulaşması ve

zamanın içindeki an T 1 kesinlikle sıfırdan büyüktür ve for veya , veya eşitsizlik (44) geçerli olduğundan. şu noktada ( X 1 ,T 1), (41) ve (42)'ye benzer şekilde, şu şekilde olmalıdır:

Fonksiyon tanımını akılda tutarak v(X,T) (43), şunu elde ederiz

Şunu takip ediyor

onlar. denklem (40) iç noktada ( X 1 ,T 1) memnun değilim. Bu da çözümün olduğunu kanıtlıyor sen(X,T) Isı iletim denklemi (40) bölgesi içerisinde en büyük değeri aşan değerleri alamaz sen(X,T) sınırda.



Minimum değere ilişkin teoremin ikinci kısmı da benzer şekilde kanıtlanabilir.

Maksimum değer ilkesinin sonuçlarını sunalım ve kanıtlayalım:

Sonuç 1. Denklemin (40) iki çözümü ve koşulları karşılıyorsa:

,

Kanıt.(40)'ın doğrusallığından dolayı fonksiyon onun çözümüdür, dolayısıyla maksimum değer ilkesini karşılar. Bu durumda:

Buradan:

aksi halde negatif bir minimum değere sahip olacaktır. Sonuç 1 kanıtlanmıştır.

Sonuç 2. Denklemin (40) üç çözümü varsa ve koşulu karşılıyorsa:

için ve , aynı eşitsizlik herkes için geçerlidir .

Kanıt. Bu basitçe ve , ve fonksiyon çiftlerine Sonuç 1'in uygulanmasıyla yapılır.

Formun başlangıç ​​ve sınır koşullarına karşılık gelen denklem (1)'in çözümünü ele alalım:

, ve fonksiyonları tarafından belirlenen tedirgin başlangıç ​​ve sınır koşullarına karşılık gelen denklem (40)'ın bir çözümü olsun:

Sonuç 3'ü kullanarak şu sonuca varabiliriz: Bu, orijinal ve rahatsız edici sorunların çözümlerinin mümkün olduğunca yakın olduğu anlamına gelir.

Maksimum prensibi, doğrusal olmayan kontrol sistemlerinde optimum kontrol için gerekli koşulları belirler. Ayrıca sistem durumunun koordinatlarına kısıtlamaların getirildiği durumlara da genişletilir. Maksimum prensibinin ana teoremini ele alalım ve optimal kontrolün daha uygun bir formülasyonunu verelim.

Optimum kontrolün doğrusal olmayan diferansiyel denklem sistemiyle tanımlanmasına izin verin:

(1)

veya vektör formunda:

-nesne durumunun boyutlu vektörü

-kontrol eylemlerinin boyutlu vektörü

- denklemin sağ tarafının fonksiyonu (1)

Kontrol vektörünün Ur boyutlu kontrol uzayının bazı kapalı bölgelerinden değerler aldığını varsayıyoruz. Fonksiyonların olduğunu varsayalım.
tüm argümanlarda süreklidir ve durum değişkenlerine göre sürekli türevleri vardır . Kabul edilebilir kontrollere kontroller diyelim
zamanın parçalı sürekli fonksiyonlarıdır ve U kümesinden değerler alır.

Optimal kontrolün ana problemi şu şekilde formüle edilir: X faz uzayındaki temsil noktasını başlangıç ​​konumundan getiren tüm kabul edilebilir kontroller arasında sonuna kadar , eğer bu kontroller mevcutsa. Ayrıca işlevselliğin geçerli olduğu kontrolleri bulmanız gerekir:

(2)

minimum seviyeye ulaşır.

Yeni bir değişken tanıtalım aşağıdaki diferansiyel denklemlerle belirlenir:

(3)

Burada
fonksiyonel (2)'nin integralidir.

Denklem (1) sistemine denklem (3) eklenerek şunu elde ederiz:


(4)

(4)’ü vektör biçiminde yazalım. Bunu yapmak için durum koordinatlarının (n+1)'inci vektörünü dikkate alıyoruz:
, bu durumda vektör formunda bu denklem aşağıdaki gibi yazılacaktır:

(5)

sistemin (5) doğru kısımlarının vektörü.

Vektör fonksiyonunun
koordinata bağlı değildir vektör . ile belirtelim koordinatlı nokta
(n+1)'inci faz uzayında . İzin vermek
- karşılık gelen faz yörüngesinin (1) geçtiği bazı kabul edilebilir kontroller
nokta boyunca . Ve eşitlik sağlandığında
nokta boyunca .

Denklem (2)'den koordinatın eşitlikle belirlendiği sonucu çıkar:

Eğer
, o zaman elimizde:

Böylece uzayda aynı kontrole karşılık gelen sistemin (5) faz yörüngesi
, geçer
nokta boyunca
ve ne zaman
nokta boyunca
. Bu, aşağıdaki şekil ile gösterilmektedir:

Uzayda bir doğruyu P ile gösterelim. , noktadan geçerek
ve eksene paralel . O zaman ana optimal kontrol problemi şu şekilde formüle edilebilir:

(n+1) boyutlu uzayda belirtilen başlangıç ​​noktası
ve eksene paralel P düz çizgisi ve noktadan geçerken
. Sistem (5)'in başlangıç ​​koşullarıyla çözümünü sağlayan tüm kabul edilebilir kontroller arasında
P düz çizgisi üzerindeki bir noktadan geçiyorsa, noktanın koordinatına göre bir kontrol seçmek gerekir. minimum öneme sahip olacaktır.

Formüle edilen problem Mayer koşullu ekstremum problemidir. Ancak klasik varyasyon hesabı yöntemlerinin izin verilen kontrole getirdiği kısıtlamalar nedeniyle bu sorun çözülemez.

Ekstremum için gerekli koşulu veren teoremin formülasyonu:

Yardımcı değişkenleri tanıtalım
aşağıdaki denklem sistemini karşılayan:


(6)

Sistem (6), denklem sistemine (5) göre eşlenik olarak adlandırılır. Eğer uygulanabilir bir kontrol seçersek
segmentte
ve karşılık gelen bir çözüm bulun
verilen başlangıç ​​koşullarıyla
, daha sonra kontrol denklemleri sistemine ikame ederken (6)
ve çözümler
doğrusal homojen bir denklem sistemi elde ederiz:


(7)

Sistem (7), bir diferansiyel denklem sisteminin çözümünün varlığı ve tekliği için koşulları karşılar. Denklem (5) ve (6) sistemleri tek bir gösterim biçiminde birleştirilebilir; bunu yapmak için H fonksiyonunu dikkate almak gerekir:

(8)

Daha sonra (5) ve (6) sistemleri aşağıdaki gibi yazılacaktır:


(9)


(10)

Fonksiyonların vektörünün
Ve
kabul edilebilir kontrolün süreksizlik noktaları dışında her yerde sürekli
. Bu vektör fonksiyonlarının sürekli türevleri vardır. Sabit değerler için
Ve
H işlevi yalnızca bir kontrol işlevi haline gelir
.


Maksimum performansa yönelik görevlerin özgüllüğü, kalite kriterlerini kaydederken etkilenmeye başlar. Bu problemler için kalite kriteri aşağıdaki fonksiyoneldir (5.1)

Bu nedenle kontrol nesnesinin başlangıç ​​durumundan son durumuna aktarımının mümkün olan en kısa sürede gerçekleştirileceği bir kontrolün bulunması gerekmektedir.

Söz konusu sorunların çözüm sırası, maksimum ilkesine göre çözülen diğer sorunların çözümünden farklı değildir:

Hamiltonyen'in derlenmesi;

Hamiltoniyenin maksimize edilmesine dayalı olarak optimal kontrol eyleminin eşlenik değişkenler üzerindeki bağımlılığının belirlenmesi;

Eşlenik diferansiyel denklem sisteminin oluşturulması;

İstenilen kontrol eyleminin bulunduğu çözümler arasında genel bir diferansiyel denklem sisteminin oluşturulması.

Doğrusal denklemlerle tanımlanan kontrol nesneleri göz önüne alındığında, maksimum performans problemlerinin belirli bir özelliği vardır. Mesele şu ki, bu problemlere karşılık gelen Hamiltonian fonksiyonu, birinci dereceden daha yüksek olmayan bir kontrol içerir ve bu nedenle, Hamiltonian'ın maksimum değerinin belirlenmesi, kontrole göre birinci türevinin sıfıra eşitlenmesiyle gerçekleştirilemez. Bu durumda Hamiltoniyenin maksimum değerinin araştırılması, kontrol ile eşlenik denklem sisteminin değişkenleri arasındaki olası kombinasyonların analiz edilmesiyle gerçekleştirilir. Optimum kontrolün, kontrol aralığı dahilinde modül açısından maksimum olması gerektiği ve bazı noktalarında, eşlenik değişkenlerin bazı fonksiyonlarının işaretine göre anında işaret değiştirmesi gerektiği ortaya çıktı. Eşlenik denklem sisteminin kontrol eylemi üzerindeki bu kadar zayıf etkisinin olduğu koşullar altında, eşlenik denklem sisteminin çözümünü tamamen terk etmek ve kontrol işaretinin değişme anlarını (anahtarlama momentleri) bağımsız değişkenler olarak düşünmek mümkün hale gelir.

Aşağıdaki örneği kullanarak maksimum performans sorununun çözümünü daha ayrıntılı olarak ele alalım.

Kontrol nesnesi:

Kalite kriteri:

Hamiltoniyen:

Olası değer kombinasyonlarını analiz ederek, kontrole bağlı olarak Hamiltoniyenin maksimum değerini sağlamak için aşağıdaki ilişkinin sağlanması gerektiği sonucuna varabiliriz:

Eşlenik denklem sistemi:

Genel denklem sistemi:

Denklem sisteminde (5.1) eşlenik değişkenlere ait denklemler kontrol nesnesinin durumlarına bağlı olmadığından, kontrol durumlarına ilişkin denklemlere dikkat edilmeden ifadeler yalnızca eşlenik denklemler sisteminden bulunabilir. nesne.

Bu durumda:

Elde edilen ifadeleri analiz ederek, istenen kontrol eyleminin, birden fazla kez işaret değiştirmeyen dikdörtgen bir dalga biçiminde olduğu sonucuna varabiliriz. Açıkçası, kontrol işaretini değiştirme anı (anahtarlama anı), kontrol nesnesinin durumları için belirtilen sınır koşullarının sağlanması koşulundan seçilmelidir. Anahtarlama noktalarını belirlemek için çeşitli yöntemler kullanılabilir.

Anahtarlama noktalarını belirlemenin ilk yolu– analitik. Bu yöntemi kullanırken, kontrol nesnesinin bir kontrol eylemine tepkisi için dikdörtgen dalga biçiminde bir analitik ifade elde etmek gerekir. Bu amaçla Laplace dönüşümünü kullanıyoruz. Geçiş anı ile gösterilecektir.

Dikdörtgen bir dalganın etkisi dikkate alınarak kontrol nesnesinin Laplace ile dönüştürülmüş denklem sistemi şu şekildedir:

Bu denklem sisteminden, kontrol nesnesinin durumlarının L-görüntüleri için aşağıdaki ifadeleri elde edebiliriz:

veya ters Laplace dönüşümünü gerçekleştirdikten sonra zaman içindeki geçici süreçler için gerçek analitik ifadeler:

Son ifadeler, hem anahtarlama momentinin değerini hem de kontrol nesnesinin istenen duruma aktarıldığı andaki anı bulmamızı sağlar.

Anahtarlama noktalarını belirlemenin ikinci yolu– minimumu arayın.

Optimal kontrol problemini çözmek için minimum arama algoritmalarını kullanabilmek için maksimum performans problemini aşağıdaki gibi formüle ediyoruz:

Kontrol eyleminin, zamanın parçalı sabit bir fonksiyonu olduğunu, zamanında işaret değiştirdiğini ve kontrol nesnesinin zamanında son durumuna aktarıldığını varsayalım. Şu anda kontrol nesnesinin durumlarının gerçek ve gerekli değerleri arasındaki tutarsızlığın minimum değerinin elde edildiği parametre değerlerinin belirlenmesi gerekmektedir. Tutarsızlık değeri, o andaki kontrol nesnesinin durumlarının gerçek ve belirtilen değerleri arasındaki farkların karelerinin toplamı olarak hesaplanır.

Minimum arama yöntemini kullanarak optimum kontrol parametrelerinin hesaplanması aşağıdaki MATLAB programı kullanılarak gerçekleştirilebilir:

Dosya Main5.m

Anahtarlama momenti için başlangıç ​​yaklaşımlarının %vektörü ve

Kontrol aralığının sonunun %'si

T=fminsearch("fms5",ti0)

fonksiyon f=fms5(T)

farkın %sayısal çözümü. eylem sırasında kontrol nesnesinin seviyesi

% üzerinde kare dalga kontrolü

Ode45("odefun5",,);

kalanın % hesaplaması

f=x(uzunluk(t),1)^2+x(uzunluk(t),2)^2;

%Çizim için bir dizi kontrol değeri oluşturma

i=1 için:uzunluk(t)

arsa(t,x(:,1),t,u)

Dosya odefun5.m

fonksiyon f=odefun5(t,x)

Anahtarlama noktalarını belirlemenin üçüncü yolu– anahtarlama hattının grafiksel yapısı.

Bu yöntem son derece görseldir ancak ikinci dereceden kontrol nesnelerine uygulanabilir çünkü Yalnızca bu tür nesnelerin davranışı, faz portresi tarafından tamamen tanımlanır. Bu yöntemi kullanırken, optimal kontrol problemi, kontrol nesnesinin faz uzayındaki noktaların geometrik konumu olan ve nesnenin kontrol işaretini değiştirmeden son duruma aktarılabildiği bir anahtarlama çizgisi oluşturularak çözülür. Anahtarlama hattının bulunması durumunda nesne kontrol prosedürü aşağıdaki gibidir:

Nesneye belirli bir işaretin kontrolü uygulanır ve bu kontrolün etkisi altında nesne, temsil ettiği nokta anahtarlama çizgisi üzerine gelinceye kadar hareket eder.

Temsil noktası anahtarlama çizgisine çarptığında, kontrol eyleminin işareti değişir ve temsil noktası, anahtarlama çizgisi boyunca hedef duruma doğru hareket etmeye başlar. Böylece anahtarlama hattı tanımlanarak görüntüleme noktasının hedef duruma ulaşacağı garantisi sağlanır.

Bir anahtarlama hattı oluşturmanın açık bir yolu, tüm faz düzlemini taramak ve büyüklük ve işaret açısından sabit olan kontrolü uygulayarak hedef duruma ulaşılan noktaları hatırlamaktır.

Ancak tüm anahtarlama hattını tek adımda oluşturmanın bir yolu var. Gerçek şu ki, büyüklük ve işaret bakımından bir kontrol sabitinin etkisi altında bir hedef noktadan ters zamanda hareket eden bir nesnenin faz yörüngesi, bir anahtarlama hattının tüm özelliklerine sahiptir. Sonuç olarak, kontrol nesnesinin ters zamanda yazılan diferansiyel denklemleri çözülerek anahtarlama hattı oluşturulabilir. Matematiksel olarak ters zamana geçiş, cismin denklemlerinde ile değiştirilerek gerçekleştirilir. Dikkate alınmalıdır. anahtarlama hattının iki kolu vardır: bunlardan biri kontrol eyleminin pozitif değerine, diğeri ise negatif değere karşılık gelir.

Maksimum performans problemini çözmeye yönelik yazılım iki bölümden oluşur:

Bir nesnenin faz yörüngesini, hedef duruma karşılık gelen başlangıç ​​noktasından itibaren ters zamanda yazılmış denklemlerini sayısal olarak çözerek oluşturan bir komut dosyasıdır (bir anahtarlama çizgisi oluşturarak);

Bir nesnenin faz yörüngesini, başlangıç ​​durumuna karşılık gelen başlangıç ​​noktasından itibaren normal zamanda yazılmış denklemlerini sayısal olarak çözerek oluşturan bir komut dosyasıdır (kontrol eyleminin işareti, anahtarlama hattını oluştururken kullanılan işaretin tersidir).

İkinci komut dosyası tarafından oluşturulan faz yörüngesinin süresi, anahtarlama hattıyla kesişmesi için yeterli olmalıdır. Kesişme anı istenilen anahtarlama momentidir.

Örnek

Rastgele değişkenleri ele alalım

  • X Her birinde başarı olasılığı θ olan Bernoulli dağılımına sahip on iki bağımsız denemedeki başarı sayısı.
  • eÜç başarı elde etmek için Bernoulli dağılımına sahip bağımsız denemelerin sayısı. Her denemede başarı olasılığı θ'dır.

Daha sonra dikkate X= 3 olabilirlik fonksiyonunu verecektir

ve dikkate alma e= 12 olabilirlik fonksiyonunu verecektir

Biri ikincinin çarpımına skaler bir değerle eşit olduğundan eşdeğerdirler. Bu durumda maksimum olabilirlik ilkesi, θ değişkeninin değeri hakkında çıkarılan sonuçların her iki durumda da aynı olması gerektiğini söyler.

Gözlem farkı X= 3 ve gözlem e= 12 tamamen deneyin tasarımındaydı: bir durumda başlangıçta on iki deneme yapılmasına, diğerinde ise üç başarılı deneme elde edilene kadar denemeye devam edilmesine karar verildi. Sonuç her iki durumda da aynı olacaktır. Bu nedenle maksimum olabilirlik ilkesi bazen şu şekilde ifade edilir:

Sonuç bağlı olmalıdır sadece sonuçtan deney ve tasarımdan değil deney.

Maksimum olabilirlik yasası

Maksimum olabilirlik ilkesiyle ilgili bir kavram şudur: maksimum olasılık kanunu, hangi parametre değerinin daha uygulanabilir olduğunun oranının, olabilirlik fonksiyonlarının oranına eşit olduğunu söylüyor. Daha sonra tutum

değerinin ne kadar olduğunun bir ölçüsüdür X bir parametreyi kabul eder A Bakımından B. Yani oran 1'e eşitse fark yok, 1'den büyükse fark yok demektir. A tercih edilir B ve tam tersi.

Maksimum olabilirlik ilkesi ve maksimum olabilirlik yasasından, olabilirlik fonksiyonunu maksimuma çıkaran parametrenin en iyi olduğu sonucu çıkar. Bu, iyi bilinen maksimum olasılık yönteminin temelidir.

Tarihsel arka plan

Maksimum olabilirlik ilkesinden ilk olarak 2000 yılında basılı olarak bahsedilmiştir. Bununla birlikte, ilkenin temelleri ve pratikteki uygulaması daha önce R. A. Fisher'ın çalışmalarında yayınlanmıştır.

Maksimum olabilirlik ilkesinin lehine ve aleyhine argümanlar

Maksimum olabilirlik ilkesi herkes tarafından kabul edilmemektedir. İstatistiksel hipotez testi gibi yaygın olarak kullanılan bazı geleneksel istatistik yöntemleri, maksimum olabilirlik ilkesiyle çelişir. Bu prensibin bazı artılarına ve eksilerine kısaca göz atalım.

Sonucun deneyin organizasyonuna bağımlılığı

Gerçekleşmemiş olaylar bazı yaygın istatistiksel yöntemlerde rol oynar. Örneğin istatistiksel bir hipotez testinin sonucu, bilinmeyen parametrenin dağılımı kadar hatta ondan daha fazla güven olasılığına bağlı olabilir. Güven olasılığının kendisi de deneyin organizasyonuna bağlı olabilir.

Bazı klasik hipotez test yöntemleri olasılığa dayanmaz. Sıklıkla alıntılanan bir örnek, optimal durma problemidir. Diyelim ki 12 kez yazı tura attığımı ve 3 tura aldığımı söyledim. Bundan, bu madalyonun tura gelme olasılığı hakkında bazı sonuçlar çıkarabilirsiniz. Şimdi parayı 3 kez tura gelene kadar attığımı ve sonuçta 12 atış yaptığımı varsayalım. Şimdi farklı sonuçlar mı çıkaracaksınız?

Olabilirlik fonksiyonu her iki durumda da aynıdır ve orantılıdır

.

Olasılık ilkesine göre her iki durumda da sonuçların aynı olması gerekir.

Bir grup bilim insanının bir dizi deney yoluyla bazı sonuçların ("başarı" diyeceğimiz) olasılığını belirlediğini varsayalım. Sağduyu bize, başarının başarısızlıktan daha olası olduğuna (veya tam tersi) inanmak için hiçbir neden yoksa, başarı olasılığını 0,5'e ayarlamamız gerektiğini söyler. Bilim adamı Adam, 3 başarı ve 9 başarısızlık aldığı 12 test yaptı ve ardından öldü.

Laboratuvar arkadaşı Bill, Adam'ın çalışmasına devam etti ve hipotezi test etmenin sonuçlarını yayınladı. Başarı olasılığı hipotezini test etti P=0,5 vs P < 0.5. Вероятность того, что в 12 испытаниях наступит не более 3 успехов, равна

yani 299/4096 = %7,3. Dolayısıyla hipotez %5 güven düzeyinde reddedilmemektedir.

Bill'in makalesini okuyan Charlotte bir mektup yazar. Adam'ın teste ölene kadar devam etmiş olabileceğine ve bu noktada 3 başarı elde etmiş olabileceğine inanıyor. Üç başarının 12 veya daha fazla deneme gerektirme olasılığı

bu da 134/4096 = %3,27'dir. VE Şimdi sonuç %5 düzeyinde reddedilir.

Bu bilim adamlarına göre test sonucunun bağımlılığı, yalnızca sonucun inandırıcılığına değil, deneyin tasarımına da bağlıdır.

Açıkçası, bu tür paradokslar, bazıları tarafından olasılık ilkesine karşı bir argüman olarak değerlendirilirken, diğerleri ise ilkenin önemini göstermektedir.

Edebiyat

Ayrıca bakınız

Bağlantılar

  • Anthony W.F. Edwards. "Olasılık". http://www.cimat.mx/reportes/enlinea/D-99-10.html
  • Jeff Miller. Bazı Matematik Kelimelerinin Bilinen İlk Kullanımları (L)
  • John Aldrich. R. A. Fisher'ın Araştırma Çalışanları için İstatistiksel Yöntemlerinde Olasılık ve Olasılık

Wikimedia Vakfı.

2010.

Şimdi kontrol üzerindeki kısıtlamaları (2.2.2) dikkate alalım. Optimum kontrol sürecinde fonksiyonlar (2.2.2) kümesinin sınırlarına ulaşmazsa (bu demektir ki), bu durumda onlar için (2.2.13), (2.2.14) ilişkileri sağlanır. Ancak çoğu zaman optimal kontrol sınır değerlerini alır veya dahası optimal kontrol bir sınırdan diğerine atlayabilir. Bu tür kontroller zaten zamanın parçalı sürekli fonksiyonlarıdır.

Optimal kontrol U kümesinin sınırına ulaştığında (2.2.13), (2.2.14) bağıntıları ihlal edilir. Bu durumda, optimal kontroller, L. S. Pontryagin'in aşağıda verilen teorem şeklinde oluşturulan ve kanıtlanmış maksimum ilkesini karşılar.

Bu teoreme geçerek bazı açıklamalar yapalım. Keyfi kabul edilebilir bir kontrol alalım ve başlangıç ​​koşulları altında (2.2.1) sistemine bir çözüm bulalım: .

Bu çözümü ve kontrolü (2.2.8)'de yerine koyarsak, şimdilik bazı keyfi başlangıç ​​koşulları altında (2.2.8) çözümünü belirliyoruz: . Vektörlerin sabit (sabit) değerleri için H fonksiyonu, vektörün bir fonksiyonu haline gelir. Bu fonksiyonun maksimumu şu şekilde gösterilir:

Sürekli bir fonksiyonun maksimumu (en yüksek değeri), bu fonksiyonun hem yerel maksimum noktalarında elde edilebilir;

ve setin sınırlarında.

Optimum kontrol için (bunun için ) en küçük değeri alır), herhangi bir değişken için değişkenin fonksiyonunun maksimuma ulaşacağı denklemleri (2.2.12) karşılayan sıfırdan farklı sürekli fonksiyonların mevcut olması gerekir.

bu durumda zamanın son anında ilişkiler tatmin olur

(2.2.11), (2.2.12) ve (2.2.17) sağlanırsa, t değişkeninin fonksiyonları sabittir ve bu nedenle (2.2.18) ilişkilerinin doğrulanması şu anda zorunlu olarak gerçekleştirilemez zamanı gelince ama her an.

Teoremin ispatı oldukça karmaşıktır ve bu nedenle Ek 2, teoremin yalnızca serbest bir sağ uç (belirtilmemiş) ve sabit bir uç durumu için ana ilişkisinin (2.2.17) türetilmesini sağlar.

(2.2.17) ve (2.2.18) bağıntıları daha basit bir biçimde yazılabilir:

Dolayısıyla Teorem 2.2.1'deki merkezi koşul maksimum koşuldur (2.2.19). Bu, eğer optimal kontroller ve optimal yörüngeler ise, o zaman sistemin (2.2.12) kesinlikle öyle bir sabiti ve öyle çözümleri olacaktır ki, bunların değişkenlerinin fonksiyonu herkes için U üzerinde tam olarak optimal kontroller altında bir maksimuma ulaşacaktır. Bu nedenle optimal kontrol problemlerinde optimallik için gerekli koşulu veren Teorem 2.2.1'e genellikle maksimum ilkesi adı verilir. U kümesinin iç noktalarında, (2.2.19) için gerekli olan (2.2.13), (2.2.14) koşullarının optimal kontrol için karşılandığı dikkate alınmalıdır.

Maksimum ilkesinin pratik uygulaması.

Bu koşulun içerdiği fonksiyonlar ve sabitler bilinmediğine göre, (2.2.19) koşulunu pratikte nasıl kullanabiliriz?

Burada şu şekilde ilerliyorlar: Fonksiyonu değişkenlerin bir fonksiyonu olarak ele alıp değişkenleri de parametre olarak ele alarak fonksiyonu maksimuma çıkarma problemini çözerler ve fonksiyonu bulurlar.

fonksiyonun en yüksek değerinin elde edildiği nokta.

Bazı durumlarda fonksiyon (2.2.20) açıkça yazılabilir. Örneğin sağ taraflar (2.2.1) aşağıdaki yapıya sahipse

ve fonksiyonelin (2.2.5) integrali

küme U eşitsizlikleri (2.2.2) ile tanımlanır, o zaman

ve bu fonksiyon U üzerinde koordinatların olduğu noktada en büyük değerine ulaşır

Formül (2.2.22), optimal kontrolün yapısı hakkında büyük miktarda bilgi sağlar: optimal kontrolün koordinatı, değerleri olan bir adım (parçalı sabit) fonksiyonudur, anahtarlama momentleri ise duruma göre belirlenir.

Yani (2.2.20) fonksiyonunun bilindiğini varsayalım. Diferansiyel denklem sistemini düşünün

Bu denklemlerin sağ taraflarında yer alan fonksiyonlar bilinmektedir. Sistemin (2.2.24), (2.2.25) genel çözümü, (2.2.3), (2.2.4) sınır koşullarından belirlenen keyfi sabitlere bağlıdır. Denklemlerin (2.2.24), (2.2.25) sınır koşulları (2.2.3), (2.2.4) altında integrali alınması problemine sınır değer problemi (iki noktalı sınır değer problemi) adı verilir.

Böylece maksimum prensibi, optimal program kontrolü probleminin çözümünü sınır değer probleminin çözümüne indirgememize olanak tanır.

Bunu çözmenin zorluğu, başlangıç ​​koşulları bilinmediği için (2.2.24), (2.2.25) denklemlerinin “doğrudan zamanda” integrasyonunun mümkün olmamasıdır. Sınır değer probleminin çözümüne yönelik olası yaklaşımlardan biri aşağıdaki gibidir. . Rasgele bir vektör verildiğinde ve (2.2.24), (2.2.25)'in bilinen başlangıç ​​koşulları altında integrali alındığında, fonksiyonları bulacağız ve eşitliğin (2.2.4) yerine getirilip getirilmediğini kontrol edeceğiz. İhlal edilirse, başka bir vektör belirleriz ve (2.2.24), (2.2.25)'i başlangıç ​​koşulları altında entegre ederek vektör için elde ederiz.

Eğer verilenle örtüşmüyorsa, koşulları (2.2.4) kabul edilebilir bir doğrulukla karşılayan bir vektör bulunana kadar işleme devam ederiz. Bu yaklaşımla, belirli bir vektöre olan minimum “mesafe” koşulundan belirlendiğinde gradyan yöntemleri kullanılır.

Hesaplamalı matematikte, sınır değer problemlerinin yaklaşık sayısal çözümü için bir dizi yöntem geliştirilmiştir: atış yöntemi, tarama yöntemi, bir dizi yinelemeli yöntem, . Çoğu durumda, (2.2.19) koşulundan optimal kontrolün açık biçimini (2.2.22) bulmak mümkün değildir. Daha sonra denklemler (2.2.1), (2.2.6), ek sistem (2.2.12) ve maksimum koşullar (2.2.19), maksimum ilkesinin sınır değer problemini oluşturur. Bu problemin, sınır değer problemlerini çözmek için standart sayısal yöntemlerin kullanılmasını zorlaştıran bir dizi spesifik özelliği vardır. Bu tür özellikler, maksimum koşulu (2.2.14) karşılayan fonksiyonların süreksizliklerini, bunların benzersiz olmamalarını ve doğrusal sistemlerde bile bağımlılığın doğrusal olmayan doğasını (2.2.20) içerir. Ek olarak, maksimum ilkesiyle ilişkili sınır değer problemlerinin bir özelliği, açık bir kontrol biçimi (2.2.20) bulmanın mümkün olduğu durumlarda bile, sistemin kararsızlığından kaynaklanan zayıf yakınsamadır (2.2.24). ), (2.2.25). Maksimum ilkesinin sınır değeri problemlerini çözmek için bir dizi teknik, örneğin, içinde sunulmaktadır.

Sonuç olarak, maksimum prensibinin sınır değeri problemini sayısal olarak çözmek için çeşitli yöntemlere rağmen, bu prensibe dayalı olarak her bir optimizasyonu çözme sürecinin, belirli bir dinamik dalı çerçevesinde çözülen bağımsız bir yaratıcı problem olduğunu belirtelim. Kontrol nesnesinin ait olduğu belirli özellikleri dikkate alınarak, sınır değer probleminin sayısal çözümünün yakınsamasını geliştirmek için kullanılır.

Örnek 2.2.1. Optimum yakıt tüketimi kontrolünün oluşturulması.

Denklemlerle açıklanan kontrol nesnesini ele alalım

Denetime kısıtlama getirilsin

Yakıt tüketimini ifade eden optimizasyon fonksiyoneli şu şekildedir:

Başlangıç ​​durumu verilir

ve o andaki durumu

Kısıtlamalar (2.2.27) karşılanırken nesnenin (2.2.26) durumdan (2.2.29) duruma (2.2.30) gittiği ve fonksiyonel (2.2.28)'in bulunması gerekir. en küçük değeri alır.

Maksimum ilkesine dayalı olarak optimal kontrolü tanımlamaya geçerek fonksiyonu oluşturuyoruz.

yardımcı değişkenler için denklemler

Maksimum işlevi (2.2.31) sağlayan kontrol şu şekilde tanımlanır:

Denklemler (2.2.26), (2.2.32), (2.2.33) bir sınır değer problemi oluşturmaktadır. Çalışmasına geçerek (2.2.32) sistemine çözümü yazıyoruz:

kontrolün (2.2.33) nesneyi (2.2.26) duruma (2.2.30) getirmesi için belirlenmesi gereken bilinmeyen sayılar nerededir.

(2.2.26) sistemine ve için bir çözüm bulalım. İlk durumda bu sistemin çözümü şu şekildedir: R ve p sabitlerine bağlıdır. Bu sistemin faz yörüngeleri, merkezi orijinde olan dairelerdir (Şekil 2.2.1, a). Sistemin (2.2.26) faz yörüngeleri de, merkezleri sırasıyla noktalarda bulunan dairelerdir (Şekil 2.2.1, b, c).