L.S. Pontryagins maksimumsprinsipp i teorien om optimale systemer.

I denne delen vil vi bevise en egenskap ved løsninger til den endimensjonale varmeligningen, som kalles maksimumsverdiprinsippet. Det kan formuleres som et teorem.

Teorem. Hvis funksjon u(x,t), definert og kontinuerlig i et lukket område Og , tilfredsstiller varmeledningsligningen i dette området

deretter maksimums- og minimumsverdiene for funksjonen u(x,t)oppnås enten i det første øyeblikket eller ved grensepunktene x = 0 eller x = l.

Funksjonen tilfredsstiller åpenbart ligning (40) og når sin maksimale (minimum) verdi når som helst. Dette motsier imidlertid ikke teoremet, siden det av forholdene følger at hvis maksimal (minimum) verdi oppnås inne i regionen, så må den også oppnås eller kl. t= 0, eller kl x = 0 orpri x=l.

Den fysiske betydningen av denne teoremet er åpenbar og er som følger. Hvis temperaturen ved grensen eller i det første øyeblikket ikke overstiger en viss verdi M, da i fravær av varmekilder en temperatur større enn M.

La oss dvele ved beviset for teoremet for maksimumsverdien. Det drives av det motsatte. Så la M– maksimal funksjonsverdi u(x,t) kl t = 0 (0 ≤ xl) eller når x = 0 orpri x = l(0 ≤ tT). La oss nå anta at på et tidspunkt i regionen ( x 0 ,t 0), slik at 0< x 0 < l u0< t 0 ≤ T, funksjon u(x,t) når sin maksimale verdi, overskrider M ved verdien ε, dvs.

Så på punktet ( x 0 ,t 0) relasjonene må være tilfredsstilt

og for alle verdier vil likhetstegnet være tilfredsstilt.

Hvor k – konstant koeffisient. Det er åpenbart det

La oss velge slik kT var mindre enn ε/2, dvs. , deretter maksimumsverdien v(x,t) kl t = 0 (0 ≤ xl) eller når x = 0 orpri x = l vil ikke overstige , dvs.

(på t = 0 eller x = 0 eller x = l), (44)

siden det første leddet i formel (43) for disse argumentene ikke overskrider M, og den andre.

På grunn av funksjonens kontinuitet v(x,t), det må på et tidspunkt ( x 1 ,t 1) nå sin maksimale verdi, og

Tidens øyeblikk t 1 er strengt tatt større enn null og , siden for eller , eller ulikhet (44) gjelder. På punktet ( x 1 ,t 1), analogt med (41) og (42), bør det være

Husk funksjonsdefinisjonen v(x,t) (43), får vi

Det følger at

de. ligning (40) ved det indre punktet ( x 1 ,t 1) er ikke fornøyd. Dette beviser at løsningen u(x,t) varmeledningsligning (40) inne i regionen kan ikke ta verdier som overstiger den største verdien u(x,t) på grensen.



Den andre delen av teoremet for minimumsverdien kan bevises på samme måte.

La oss presentere og bevise konsekvensene av maksimalverdiprinsippet:

Konsekvens 1. Hvis to løsninger til ligning (40) og tilfredsstiller betingelsene:

,

Bevis. På grunn av lineariteten til (40), er funksjonen dens løsning, derfor tilfredsstiller den maksimalverdiprinsippet. Hvori:

Derfor:

ellers ville den ha en negativ minimumsverdi. Konsekvens 1 er bevist.

Konsekvens 2. Hvis tre løsninger til ligning (40) og tilfredsstiller betingelsen:

for , og , da gjelder den samme ulikheten for alle .

Bevis. Dette gjøres ganske enkelt ved å bruke Corollary 1 på funksjonspar og , og .

La oss vurdere løsningen av ligning (1), som tilsvarer de innledende og grensebetingelsene til formen:

La det være en løsning på ligning (40) som tilsvarer de forstyrrede start- og grensebetingelsene spesifisert av funksjonene , og , slik at:

Ved å bruke Corollary 3 kan vi konkludere med at: , som innebærer at løsningene på de opprinnelige og forstyrrede problemene er så nærme som mulig.

Maksimumsprinsippet bestemmer de nødvendige betingelsene for optimal kontroll i ikke-lineære kontrollsystemer. Den utvides også til tilfeller der det pålegges begrensninger på koordinatene til systemstaten. La oss vurdere hovedteoremet til maksimalprinsippet og gi en mer praktisk formulering av optimal kontroll.

La den optimale kontrollen beskrives ved et system med ikke-lineære differensialligninger:

(1)

eller i vektorform:

--dimensjonal vektor av objekttilstand

--dimensjonal vektor for kontrollhandlinger

- funksjonen til høyre side av ligning (1)

Vi antar at kontrollvektoren tar verdier fra et lukket område av det Ur-dimensjonale kontrollrommet. La oss anta at funksjonene
er kontinuerlige i alle argumenter og har kontinuerlige deriverte med hensyn til tilstandsvariabler . La oss kalle tillatte kontroller disse kontrollene
, som er stykkevis kontinuerlige funksjoner av tid og tar verdier fra settet U.

Hovedproblemet med optimal kontroll er formulert som følger: blant alle tillatte kontroller som bringer representasjonspunktet i faserommet X fra startposisjonen til slutten , hvis disse kontrollene finnes. Og du må finne kontroller som funksjonaliteten er for:

(2)

når et minimum.

La oss introdusere en ny variabel , som bestemmes av følgende differensialligninger:

(3)

Her
er integranden til funksjonell (2).

Ved å legge til ligning (3) til ligningssystemet (1), får vi:


(4)

La oss skrive (4) i vektorform. For å gjøre dette introduserer vi den (n+1)te vektoren for tilstandskoordinater:
, så i vektorform vil denne ligningen bli skrevet som følger:

(5)

vektor av de høyre delene av systemet (5).

Merk at vektorfunksjonen
er ikke avhengig av koordinaten vektor . La oss betegne med punkt med koordinater
i (n+1) faserommet . La
- noen tillatt kontroll som den tilsvarende fasebanen (1) passerer for
gjennom punktet . Og når likestillingen er oppfylt
gjennom punktet .

Fra ligning (2) følger det at koordinaten bestemmes av likheten:

Hvis
, da vil vi ha:

Altså i verdensrommet fasebane av system (5), tilsvarende samme kontroll
, passerer kl
gjennom punktet
, og når
gjennom punktet
. Dette er illustrert av følgende figur:

La oss betegne med P en rett linje i rommet , passerer gjennom punktet
og parallelt med aksen . Deretter kan det viktigste optimale kontrollproblemet formuleres som følger:

I (n+1)-dimensjonalt rom utgangspunkt angitt
og rett linje P, parallelt med aksen og passerer gjennom punktet
. Blant alle tillatte kontroller som har egenskapen at løsningen av systemet (5) med innledende forhold
går gjennom et punkt på en rett linje P, er det nødvendig å velge en kontroll som koordinaten til punktet ville ha minimal betydning.

Det formulerte problemet er et Mayer betinget ekstremum-problem. På grunn av begrensningene som er pålagt tillatt kontroll ved metoder for klassisk variasjonsberegning, kan dette problemet ikke løses.

Formulering av teoremet som gir den nødvendige betingelsen for ekstremumet:

La oss introdusere hjelpevariabler
, som tilfredsstiller følgende ligningssystem:


(6)

System (6) kalles konjugert med hensyn til ligningssystem (5). Hvis vi velger en tillatt kontroll
på segmentet
og finne en tilsvarende løsning
med gitte startbetingelser
, så når du erstatter inn i systemet med kontrollligninger (6)
og løsninger
, får vi et lineært homogent ligningssystem:


(7)

System (7) tilfredsstiller betingelsene for eksistensen og unikheten til en løsning på et system av differensialligninger. Systemer av ligninger (5) og (6) kan kombineres i en form for notasjon for å gjøre dette, er det nødvendig å introdusere funksjonen H i betraktning:

(8)

Da vil systemene (5) og (6) skrives som følger:


(9)


(10)

Merk at vektoren av funksjoner
Og
kontinuerlig overalt bortsett fra punkter med diskontinuitet i den tillatte kontrollen
. Disse vektorfunksjonene har kontinuerlige derivater. For faste verdier
Og
funksjon H blir kun en kontrollfunksjon
.


Spesifisiteten til oppgaver for maksimal ytelse begynner å påvirke når du registrerer kvalitetskriterier. For disse problemene er kvalitetskriteriet følgende funksjonelle (5.1)

Det er derfor nødvendig å finne en kontroll der overføringen av kontrollobjektet fra starttilstand til slutttilstand utføres på minst mulig tid.

Rekkefølgen for å løse problemene som vurderes skiller seg ikke fra prosedyren for å løse andre problemer løst på grunnlag av maksimalprinsippet:

Samling av Hamiltonian;

Bestemmelse av avhengigheten av den optimale kontrollhandlingen av konjugerte variabler basert på maksimering av Hamiltonian;

Tegne opp et konjugert system av differensialligninger;

Tegning av et generelt system med differensialligninger, blant løsningene som den ønskede kontrollhandlingen er funnet.

Når man vurderer kontrollobjekter beskrevet av lineære ligninger, har problemer med maksimal ytelse en viss særegenhet. Poenget er at Hamiltonian-funksjonen som tilsvarer disse problemene inneholder kontroll i en grad som ikke er høyere enn den første, og derfor kan ikke bestemmelsen av maksimalverdien til Hamiltonian utføres ved å likestille dens førstederiverte med hensyn til kontroll til null. Søket etter maksimalverdien til Hamiltonianen i dette tilfellet utføres ved å analysere mulige kombinasjoner mellom kontrollen og variablene til det konjugerte ligningssystemet. Det viser seg at den optimale kontrollen bør være maksimal i modul innenfor kontrollintervallet og, på noen av punktene, øyeblikkelig endre fortegn i samsvar med tegnet til en eller annen funksjon av konjugerte variabler. Under forhold med en så svak påvirkning av det konjugerte likningssystemet på kontrollhandlingen, blir det mulig å fullstendig forlate løsningen av det konjugerte likningssystemet og vurdere øyeblikkene for endring av kontrolltegn (byttemomenter) som uavhengige variabler.

La oss vurdere mer detaljert løsningen på problemet med maksimal ytelse ved å bruke følgende eksempel.

Kontrollobjekt:

Kvalitetskriterium:

Hamiltonian:

Ved å analysere mulige kombinasjoner av verdier kan vi konkludere med at for å sikre maksimalverdien til Hamiltonian, avhengig av kontrollen, er det nødvendig å tilfredsstille følgende forhold:

Konjugert ligningssystem:

Generelt ligningssystem:

Siden likningene for de konjugerte variablene i likningssystemet (5.1) ikke er avhengige av tilstandene til kontrollobjektet, kan uttrykk for kun finnes fra systemet med konjugerte likninger uten å ta hensyn til likningene for kontrollens tilstander. gjenstand.

I dette tilfellet:

Ved å analysere de oppnådde uttrykkene kan vi konkludere med at den ønskede kontrollhandlingen har form av en rektangulær bølge, som ikke endrer fortegn mer enn én gang. Det er klart at tidspunktet for endring av kontrolltegnet (svitsjemoment) må velges fra betingelsen om å sikre de spesifiserte grensebetingelsene for tilstandene til kontrollobjektet. Flere metoder kan brukes for å bestemme koblingspunkter.

Den første måten å bestemme byttepunkter– analytisk. Ved bruk av denne metoden er det nødvendig å få et analytisk uttrykk for responsen til kontrollobjektet på en kontrollhandling i form av en rektangulær bølge. Vi bruker Laplace-transformen til dette formålet. Øyeblikket for bytte vil bli angitt med .

Det Laplace-transformerte likningssystemet til kontrollobjektet, tatt i betraktning påvirkningen av en rektangulær bølge, har formen:

Fra dette ligningssystemet kan vi få følgende uttrykk for L-bilder av tilstandene til kontrollobjektet:

eller, etter å ha utført den inverse Laplace-transformasjonen, de faktiske analytiske uttrykkene for forbigående prosesser i tid:

De siste uttrykkene lar oss finne både verdien av koblingsmomentet og tidspunktet når kontrollobjektet overføres til ønsket tilstand.

Den andre måten å bestemme byttepunkter– søk etter minimum.

For å kunne bruke minimumssøkealgoritmer for å løse det optimale kontrollproblemet, formulerer vi maksimalytelsesproblemet som følger:

La oss anta at kontrollhandlingen er en stykkevis konstant funksjon av tid, som skifter fortegn ved tid , og kontrollobjektet overføres til den endelige tilstanden ved tid . Det er nødvendig å bestemme slike parameterverdier der minimumsverdien av avviket mellom de faktiske og nødvendige verdiene for tilstandene til kontrollobjektet for øyeblikket oppnås. Avviksverdien beregnes som summen av kvadrerte forskjeller mellom de faktiske og spesifiserte verdiene til tilstandene til kontrollobjektet på tidspunktet.

Beregning av optimale kontrollparametere ved bruk av minimumssøkemetoden kan utføres ved å bruke følgende MATLAB-program:

Fil Hoved5.m

%vektor av innledende tilnærminger for koblingsmomentet og

% av slutten av kontrollintervallet

T=fminsearch("fms5",ti0)

funksjon f=fms5(T)

%numerisk løsning av diff. nivå på kontrollobjektet under handling

% på den firkantbølgekontroll

Ode45("odefun5",,);

% beregning av rest

f=x(lengde(t),1)^2+x(lengde(t),2)^2;

%genererer en rekke kontrollverdier for plotting

for i=1:lengde(t)

plot(t,x(:,1),t,u)

Fil odefun5.m

funksjon f=odefun5(t,x)

Den tredje måten å bestemme byttepunkter– grafisk konstruksjon av koblingslinjen.

Denne metoden er svært visuell, men kan brukes på andre-ordens kontrollobjekter, fordi Oppførselen til bare slike objekter er fullstendig beskrevet av faseportrettet. Ved bruk av denne metoden løses det optimale kontrollproblemet ved å konstruere en svitsjelinje, den geometriske plasseringen av punkter i faserommet til kontrollobjektet, hvorfra objektet kan overføres til den endelige tilstanden uten å bytte kontrolltegnet. I tilfellet når svitsjelinjen er funnet, er objektkontrollprosedyren som følger:

En kontroll av et bestemt tegn påføres objektet, og under påvirkning av denne kontrollen beveger objektet seg til dets representasjonspunkt er på svitsjelinjen

Når representasjonspunktet treffer svitsjelinjen, endres tegnet på kontrollhandlingen og dets representasjonspunkt begynner å bevege seg langs svitsjelinjen til måltilstanden. Dermed sikres garantien for at avbildningspunktet vil treffe måltilstanden ved å definere svitsjelinjen.

En åpenbar måte å konstruere en svitsjelinje på er å skanne hele faseplanet og huske de punktene som måltilstanden oppnås fra ved å bruke kontroll som er konstant i størrelse og fortegn.

Det er imidlertid en måte å bygge hele koblingslinjen i ett trinn. Faktum er at fasebanen til et objekt som beveger seg i revers tid fra et målpunkt under påvirkning av en kontrollkonstant i størrelse og fortegn har alle egenskapene til en svitsjelinje. Følgelig kan svitsjelinjen konstrueres ved å løse differensialligningene til kontrollobjektet skrevet i revers tid. Matematisk utføres overgangen til omvendt tid ved å erstatte med i likningene til objektet. Bør vurderes. at koblingslinjen har to grener: en av dem tilsvarer en positiv verdi av kontrollhandlingen, og den andre til en negativ.

Programvaren for å løse problemet med maksimal ytelse består av to deler:

Et skript som konstruerer fasebanen til et objekt ved numerisk å løse dets ligninger skrevet i omvendt tid fra startpunktet som tilsvarer måltilstanden (konstruere en svitsjelinje);

Et skript som konstruerer fasebanen til et objekt ved numerisk å løse dets ligninger skrevet i ordinær tid fra startpunktet som tilsvarer starttilstanden (tegnet for kontrollhandlingen er motsatt av tegnet som brukes når svitsjelinjen konstrueres).

Varigheten av fasebanen som genereres av det andre skriptet må være tilstrekkelig for at det skal krysse svitsjelinjen. Skjæringsøyeblikket er det ønskede koblingsmomentet.

Eksempel

La oss vurdere tilfeldige variabler

  • X antall suksesser i tolv uavhengige forsøk med en Bernoulli-fordeling med sannsynlighet for suksess θ i hver av dem.
  • Y antall uavhengige forsøk med en Bernoulli-distribusjon som kreves for å oppnå tre suksesser. Sannsynligheten for suksess i hvert forsøk er θ.

Så omtanke X= 3 vil gi sannsynlighetsfunksjonen

og omtanke Y= 12 vil gi sannsynlighetsfunksjonen

De er ekvivalente, siden en er lik produktet av den andre med en skalarverdi. Maximum likelihood-prinsippet i dette tilfellet sier at konklusjonene som trekkes om verdien av variabelen θ skal være de samme i begge tilfeller.

Observasjonsforskjell X= 3 og observasjon Y= 12 rent i utformingen av eksperimentet: i det ene tilfellet ble det først besluttet å gjøre tolv forsøk, og i det andre å fortsette å prøve til det var tre vellykkede. Resultat vil være den samme i begge tilfeller. Derfor er prinsippet om maksimal sannsynlighet noen ganger uttrykt som følger:

Konklusjonen må avhenge bare fra resultatet eksperiment, og ikke fra design eksperiment.

Maksimal sannsynlighetslov

Et relatert konsept til prinsippet om maksimal sannsynlighet er loven om maksimal sannsynlighet, og sier at forholdet mellom hvilken parameterverdi som er mer anvendelig er lik forholdet mellom sannsynlighetsfunksjonene deres. Så holdningen

er et mål på hvor mye verdien x godtar en parameter en med hensyn til b. Således, hvis forholdet er lik 1, er det ingen forskjell, og hvis det er større enn 1, så enå foretrekke b, og vice versa.

Fra maksimum sannsynlighetsprinsippet og loven om maksimal sannsynlighet følger det at parameteren som maksimerer sannsynlighetsfunksjonen er den beste. Dette er grunnlaget for den velkjente maksimum sannsynlighetsmetoden.

Historisk referanse

Prinsippet om maksimal sannsynlighet ble først nevnt på trykk i. Imidlertid ble det grunnleggende om prinsippet og dets anvendelse i praksis publisert tidligere i verkene til R. A. Fisher i

Argumenter for og mot prinsippet om maksimum sannsynlighet

Prinsippet om maksimal sannsynlighet er ikke akseptert av alle. Noen ofte brukte metoder for tradisjonell statistikk, for eksempel statistisk hypotesetesting, motsier prinsippet om maksimal sannsynlighet. La oss se kort på noen av fordelene og ulempene med dette prinsippet.

Resultatets avhengighet av organiseringen av eksperimentet

Urealiserte hendelser spiller en rolle i noen vanlige statistiske metoder. For eksempel kan resultatet av en statistisk hypotesetest avhenge av konfidenssannsynligheten like mye eller enda mer enn fordelingen av den ukjente parameteren. Og selve tillitssannsynligheten kan avhenge av organiseringen av eksperimentet.

Noen klassiske hypotesetestingsmetoder er ikke basert på sannsynlighet. Et ofte nevnt eksempel er det optimale stoppeproblemet. Anta at jeg sa at jeg kastet en mynt 12 ganger og fikk 3 hoder. Fra dette kan du trekke noen konklusjoner om sannsynligheten for at denne mynten lander hodet. La oss nå si at jeg kastet mynten til den kom opp 3 ganger, noe som resulterte i 12 kast. Vil du trekke andre konklusjoner nå?

Sannsynlighetsfunksjonen er den samme i begge tilfeller og er proporsjonal

.

I følge likelihood-prinsippet skal konklusjonene være de samme i begge tilfeller.

Anta at en gruppe forskere bestemmer sannsynligheten for et eller annet utfall (som vi vil kalle "suksess") gjennom en rekke eksperimenter. Sunn fornuft forteller oss at hvis det ikke er noen grunn til å tro at suksess er mer sannsynlig enn fiasko, og vice versa, så bør vi sette sannsynligheten for suksess til 0,5. Forskeren Adam gjorde 12 tester, der han fikk 3 suksesser og 9 feil, hvoretter han døde.

Hans laboratoriekollega Bill fortsatte Adams arbeid og publiserte resultatet av å teste hypotesen. Han testet hypotesen om at sannsynligheten for suksess s=0,5 vs s < 0.5. Вероятность того, что в 12 испытаниях наступит не более 3 успехов, равна

som er 299/4096 = 7,3%. Dermed forkastes ikke hypotesen på 5 % konfidensnivå.

Charlotte, etter å ha lest Bills artikkel, skriver et brev. Hun tror at Adam kan ha fortsatt testen til han døde, etter å ha oppnådd 3 suksesser på det tidspunktet. Sannsynligheten for at tre suksesser vil kreve 12 eller flere forsøk er

som er 134/4096 = 3,27%. OG resultatet forkastes på 5 % nivå.

For disse forskerne avhenger testresultatets avhengighet av utformingen av eksperimentet, og ikke bare av sannsynligheten til resultatet.

Det er klart at paradokser av denne typen anses av noen som et argument mot likelihood-prinsippet, mens de for andre illustrerer viktigheten av prinsippet.

Litteratur

se også

Lenker

  • Anthony W.F. Edwards. "Sannsynlighet". http://www.cimat.mx/reportes/enlinea/D-99-10.html
  • Jeff Miller. Tidligste kjente bruksområder for noen av ordene i matematikk (L)
  • John Aldrich. Sannsynlighet og sannsynlighet i R. A. Fishers statistiske metoder for forskningsarbeidere

Wikimedia Foundation. 2010.

La oss nå ta hensyn til restriksjoner (2.2.2) på kontroll. Hvis funksjonene i prosessen med optimal kontroll ikke når grensene for sett (2.2.2) (som betyr), så er relasjoner (2.2.13), (2.2.14) tilfredsstilt for dem. Imidlertid tar optimal kontroll ofte grenseverdier eller - dessuten kan optimal kontroll hoppe fra en grense til en annen. Slike kontroller er allerede stykkevis kontinuerlige funksjoner av tid.

Når den optimale kontrollen treffer grensen til settet U, brytes relasjoner (2.2.13), (2.2.14). I dette tilfellet tilfredsstiller optimale kontroller L. S. Pontryagins maksimumsprinsipp, etablert og bevist i form av teoremet gitt nedenfor.

For å gå videre til dette teoremet, la oss gjøre noen avklaringer. La oss ta en vilkårlig tillatt kontroll og under innledende forhold finne en løsning på systemet (2.2.1): .

Ved å erstatte denne løsningen og kontrollen med (2.2.8), bestemmer vi foreløpig, under noen vilkårlige startbetingelser, løsning (2.2.8): . For faste (konstante) vektorverdier blir funksjonen H en funksjon av vektoren. Maksimum av denne funksjonen med og vil bli betegnet med:

Maksimum (høyeste verdi) for en kontinuerlig funksjon kan oppnås både ved punktene for lokalt maksimum for denne funksjonen, hvor

og ved settets grenser.

Teorem 2.2.1 (L. S. Pontryagins maksimumsprinsipp). La , være en tillatt kontroll slik at de tilsvarende løsningene til ligning (2.2.11), som utgår i øyeblikket fra tilstanden (2.2.3), (2.2.7), passerer gjennom punktet i tidspunktet.

For optimal kontroll (som ) tar den minste verdien), er det nødvendig å eksistere slike kontinuerlige funksjoner som ikke er null som tilfredsstiller ligningene (2.2.12) at for enhver variabel når funksjonen til variabelen et maksimum

i dette tilfellet er relasjonene tilfredsstilt i det siste øyeblikket

Hvis (2.2.11), (2.2.12) og (2.2.17) er oppfylt, så er funksjonene til variabelen t konstante og derfor kan verifiseringen av relasjoner (2.2.18) utføres ikke nødvendigvis i øyeblikket tiden, men når som helst.

Beviset for teoremet er ganske komplekst, og derfor gir vedlegg 2 kun utledningen av hovedrelasjonen (2.2.17) til teoremet for tilfellet med en fri høyre ende (ikke spesifisert) og en fast.

Relasjoner (2.2.17) og (2.2.18) kan skrives i en enklere form:

Dermed er den sentrale betingelsen i teorem 2.2.1 maksimumsbetingelsen (2.2.19). Det betyr at hvis det er optimale kontroller og er optimale baner, så vil det absolutt være en slik konstant og slike løsninger ) av systemet (2.2.12) at funksjonen til variablene deres for alle vil nå et maksimum på U nøyaktig under optimale kontroller . Derfor kalles setning 2.2.1, som gir den nødvendige betingelsen for optimalitet ved optimale kontrollproblemer, vanligvis maksimumsprinsippet. Merk at på de indre punktene av settet U, er forholdene (2.2.13), (2.2.14), som er nødvendige for (2.2.19), oppfylt for optimal kontroll.

Praktisk anvendelse av maksimumsprinsippet.

Hvordan kan vi praktisk talt bruke betingelse (2.2.19), siden funksjonene og konstanten som er inkludert i denne tilstanden er ukjent?

Her går de frem som følger: vurderer funksjonen ) som en funksjon av variabler og vurderer variablene som parametere, løser de problemet med å maksimere funksjonen og finne funksjonen

hvor den høyeste verdien av funksjonen oppnås.

I noen tilfeller kan funksjon (2.2.20) skrives eksplisitt. For eksempel, hvis høyresiden av (2.2.1) har strukturen

og integranden til funksjonen (2.2.5)

settet er beskrevet av U-ulikheter (2.2.2), da

og denne funksjonen når sin største verdi på U ved punktet med koordinatene

Formel (2.2.22) gir en stor mengde informasjon om strukturen til optimal kontroll: koordinaten for optimal kontroll er en trinnvis (stykkevis konstant) funksjon med verdier, mens byttemomentene bestemmes av tilstanden

Så, la oss anta at funksjonen (2.2.20) er kjent. Tenk på systemet med differensialligninger

Funksjonene og inkludert i høyresiden av disse ligningene er kjent. Den generelle løsningen til systemet (2.2.24), (2.2.25) avhenger av vilkårlige konstanter, som bestemmes fra grensebetingelsene (2.2.3), (2.2.4). Problemet med å integrere likninger (2.2.24), (2.2.25) under randbetingelser (2.2.3), (2.2.4) kalles et grenseverdiproblem (topunkts grenseverdiproblem).

Dermed lar maksimumsprinsippet oss redusere løsningen av problemet med optimal programkontroll til løsningen av et grenseverdiproblem.

Vanskeligheten med å løse det er at integrering av ligninger (2.2.24), (2.2.25) i "direkte tid" ikke er mulig, siden startbetingelsene er ukjente. En av de mulige tilnærmingene til å løse grenseverdiproblemet er som følger . Gitt en vilkårlig vektor og integrere (2.2.24), (2.2.25) under kjente startbetingelser, vil vi finne funksjonene og kontrollere oppfyllelsen av likhet (2.2.4). Hvis den brytes, spesifiserer vi en annen vektor, og ved å integrere (2.2.24), (2.2.25) under de opprinnelige betingelsene, får vi for vektoren.

Hvis den ikke sammenfaller med den gitte, fortsetter vi prosessen til en vektor er funnet slik at betingelsene (2.2.4) tilfredsstilles med akseptabel nøyaktighet. Med denne tilnærmingen brukes gradientmetoder når den bestemmes fra tilstanden til minimum "avstand" fra en gitt vektor.

I beregningsmatematikk er det utviklet en rekke metoder for tilnærmet numerisk løsning av grenseverdiproblemer: skytemetoden, sveipemetoden, en rekke iterative metoder, . I mange tilfeller er det ikke mulig å finne ut fra betingelse (2.2.19) den eksplisitte formen (2.2.22) for optimal kontroll. Da danner likningene (2.2.1), (2.2.6), adjointsystemet (2.2.12) og maksimumsbetingelsene (2.2.19) grenseverdiproblemet til maksimumsprinsippet. Dette problemet har en rekke spesifikke funksjoner som gjør det vanskelig å bruke standard numeriske metoder for å løse grenseverdiproblemer. Slike funksjoner inkluderer diskontinuiteter av funksjoner som tilfredsstiller den maksimale betingelsen (2.2.14), deres ikke-unikehet og den ikke-lineære naturen til avhengighet (2.2.20) selv i lineære systemer. I tillegg er et trekk ved grenseverdiproblemer knyttet til maksimumsprinsippet, selv i tilfeller der det er mulig å finne en eksplisitt form for kontroller (2.2.20), deres dårlige konvergens forårsaket av systemets ustabilitet (2.2.24) ), (2.2.25). En rekke teknikker for å løse grenseverdiproblemer av maksimumsprinsippet presenteres, for eksempel i.

La oss konkludere med at til tross for de forskjellige metodene for numerisk løsning av grenseverdiproblemet til maksimumsprinsippet, er prosessen med å løse hver optimalisering basert på dette prinsippet et uavhengig kreativt problem, løst innenfor rammen av den spesielle grenen av dynamikk til som kontrollobjektet tilhører, tatt i betraktning dets spesifikke egenskaper, brukt til å forbedre konvergensen av den numeriske løsningen av grenseverdiproblemet.

Eksempel 2.2.1. Konstruksjon av optimal drivstofforbrukskontroll.

La oss vurdere kontrollobjektet beskrevet av ligningene

La en begrensning pålegges kontrollen

Optimaliseringsfunksjonen som uttrykker drivstofforbruket har formen

Starttilstanden er gitt

og tilstand til tider

Det kreves å finne , hvor objektet (2.2.26) går fra tilstand (2.2.29) til tilstand (2.2.30), mens restriksjonene (2.2.27) er oppfylt, og det funksjonelle (2.2.28) tar den minste verdien.

Går vi videre til å definere optimal kontroll basert på maksimumsprinsippet, danner vi funksjonen

ligninger for hjelpevariabler

Kontrollen som leverer maksimal funksjon (2.2.31) er definert som

Ligninger (2.2.26), (2.2.32), (2.2.33) utgjør et grenseverdiproblem. For å gå videre til studien, skriver vi ned løsningen til systemet (2.2.32):

hvor er ukjente tall som må bestemmes slik at kontroll (2.2.33) bringer objektet (2.2.26) til tilstand (2.2.30).

La oss finne en løsning på system (2.2.26) for og . I det første tilfellet har løsningen på dette systemet formen . Det avhenger av konstantene R og p, mens . Fasebanene til dette systemet er sirkler med et senter i origo (fig. 2.2.1, a). Fasebanene til systemet (2.2.26) ved og er også sirkler, hvis sentre er lokalisert i punktene henholdsvis (fig. 2.2.1, b, c).