Принцип максимума л.С.Понтрягина в теории оптимальных систем.

В этом параграфе мы докажем свойство решений одномерного уравнения теплопроводности, которое называется принципом максимального значения . Оно может быть сформулировано как теорема.

Т е о р е м а. Если функция u (x ,t ), определенная и непрерывная в замкнутой области и , удовлетворяет в этой области уравнению теплопроводности

то максимальное и минимальное значения функции u (x ,t ) достигаются или в начальный момент времени или в граничных точках x = 0 или x = l.

Функция , очевидно, удовлетворяет уравнению (40) и достигает своего максимального (минимального) значения в любой точке. Однако это не противоречит теореме, так как из её условия следует, что если максимальное (минимальное) значение достигается внутри области, то оно также должно достигаться или при t= 0, или при x = 0 илипри x=l.

Физический смысл этой теоремы очевиден и заключается в следующем. Если температура на границе или в начальный момент не превосходит некоторого значения M , то при отсутствии источников тепла внутри тела не может создаться температура, больше чем М .

Остановимся на доказательстве теоремы для максимального значения. Оно ведется от противного. Итак, пусть М – максимальное значение функции u (x ,t ) при t = 0 (0 ≤ x ≤ l ) или при x = 0 илипри x = l (0 ≤ t ≤ T ). Допустим теперь, что в некоторой точке области (x 0 , t 0), такой, что 0 < x 0 < l и0 < t 0 ≤ T , функция u (x ,t ) достигает своего максимального значения, превосходящего М на величину ε, т.е.

Тогда в точке (x 0 , t 0) должны выполняться соотношения

причем при всех значениях будет выполняться знак равенства.

где k – постоянный коэффициент. Очевидно, что

Выберем так, чтобы kT было меньше ε/2, т.е. , тогда максимальное значение v (x , t ) при t = 0 (0 ≤ x ≤ l ) или при x = 0 илипри x = l не будет превосходить , т.е.

(при t = 0 или x = 0 или x = l ), (44)

так как для этих аргументов первое слагаемое в формуле (43) не превосходит М , а второе .

В силу непрерывности функции v (x , t ), она должна в некоторой точке (x 1 ,t 1) достигать своего максимального значения, причем

Момент времени t 1 строго больше нуля и , так как при или , или имеет место неравенство (44). В точке (x 1 , t 1), по аналогии с (41) и (42), должно быть

Имея в виду определение функции v (x , t ) (43), получим

Отсюда следует, что

т.е. уравнение (40) во внутренней точке (x 1 ,t 1) не удовлетворяется. Тем самым доказано, что решение u (x ,t ) уравнения теплопроводности (40) внутри области не может принимать значений, превосходящих наибольшее значение u (x ,t ) на границе.

Аналогично может быть доказана и вторая часть теоремы для минимального значения.

Приведем и докажем следствия из принципа максимального значения:

Следствие 1. Если два решения уравнения (40) и удовлетворяют условиям:

Доказательство. В силу линейности (40) функция является его решением, следовательно, удовлетворяет принципу максимального значения. При этом:

Следовательно:

в противном случае имела бы отрицательное минимальное значение. Следствие 1 доказано.

Следствие 2. Если три решения уравнения (40) , и удовлетворяют условию:

при , и , то это же неравенство выполняются и для всех .

Доказательство. Проводится просто применением следствия 1 к парам функций и , и .

Рассмотрим в решение уравнения (1), соответствующее начальному и граничным условиям вида:

Пусть есть решение уравнения (40), соответствующее возмущенным начальному и граничным условиям, задаваемыми функциями , и , такими, что:

Используем следствие 3, можем заключить, что: , что и подразумевает сколь угодную близость решений исходной и возмущенной задач.

Принцип максимума определяет необходимые условия оптимальности управления в нелинейных управляющих системах. Он распространен и на случаи, когда на координаты состояния системы накладываются ограничения. Рассмотрим основную теорему принципа максимума и дадим более удобную формулировку оптимального управления.

Пусть оптимальное управление описывается системой нелинейных дифференциальных уравнений:

(1)

или в векторной форме:

--мерный вектор состояния объекта

--мерный вектор управляющих воздействий

- функция правой части уравнения (1)

Полагаем, что вектор управления принимает значения из некоторой замкнутой области Ur-мерного пространства управлений. Положим, что функции
непрерывны по всем аргументам и имеют непрерывные производны по переменным состояния. Назовем допустимыми управлениями те управления
, которые являются кусочно-непрерывными функциями времени и принимают значения из множестваU.

Основная задача оптимального управления формулируется следующим образом: среди всех допустимых управления, приводящих изображающую точку в фазовом пространстве Xиз начального положенияв конечное, если эти управления существуют. И нужно найти такие управления, для которых функционал:

(2)

достигает минимума.

Введем новую переменную , которая определяется следующим дифференциальным уравнениям:

(3)

Здесь
- подынтегральная функция функционала (2).

Присоединив уравнение (3) к системе уравнений (1), получим:

(4)

Запишем (4) в векторной форме. Для этого введем в рассмотрение (n+1)-ый вектор координат состояния:
, тогда в векторной форме записи это уравнение запишется следующим образом:

(5)

вектор правых частей системы (5).

Заметим, что вектор-функция
не зависит от координатывектора. Обозначим черезточку с координатами
в (n+1)-ом фазовом пространстве. Пусть
- некоторое допустимое управления, для которого соответствующая фазовая траектория (1) проходит при
через точку. А при выполнении равенства
через точку.

Из уравнения (2) следует, что координата определяется равенством:

Если
, то будем иметь:

Таким образом, в пространстве фазовая траектория системы (5), соответствующая тому же управлению
, проходит при
через точку
, а при
через точку
. Это иллюстрирует следующий рисунок:

Обозначим через П прямую в пространстве , проходящую через точку
и параллельную оси. Тогда основную задачу оптимально управления можно сформулировать следующим образом:

В (n+1)-мерном пространствезаданы начальная точка
и прямая П, параллельная осии проходящую через точку
. Среди всех допустимых управлений, обладающих тем свойством, что решение системы (5) с начальными условиями
проходит через точку прямой П, необходимо выбрать такое управления, для которого координата точкиимело бы минимальное значение.

Сформулированная задача представляет собой задачу Майера на условный экстремум. Однако в силу ограничений, накладываемых на допустимое управление методами классического вариационного исчисления, эта задача не решается.

Формулировка теоремы, дающей необходимое условие экстремума:

Введем в рассмотрение вспомогательные переменные
, которые удовлетворяю следующей системе уравнений:

(6)

Система (6) называется сопряженной по отношению к системе уравнений (5). Если выбрать некоторое допустимое управление
на отрезке
и найти соответствующее ему решение
с заданными начальными условиями
, то при подстановки в систему уравнений (6) управления
и решения
, получим линейную однородную систему уравнений:

(7)

Система (7) удовлетворяет условиям существования и единственности решения системы дифференциальных уравнений. Системы уравнений (5) и (6) можно объединить одной формой записи, для этого надо ввести в рассмотрение функцию H:

(8)

Тогда системы (5) и (6) запишутся следующим образом:

(9)

(10)

Отметим, что вектор функций
и
непрерывны всюду, кроме точек разрыва допустимого управления
. Эти вектор-функции имеют непрерывные производные. При фиксированных значениях
и
функцияHстановится функцией только управления
.

Специфика задач на максимальное быстродействие начинает сказываться при записи критерия качества. Для этих задач критерием качества является следующий функционал (5.1)

Таким образом, требуется найти такое управление, при котором перевод объекта управления из начального состояния в конечное выполняется за минимально возможное время.

Последовательность решения рассматриваемых задач не отличается от процедуры решения других задач, решаемых на основе принципа максимума:

Составление Гамильтониана;

Определение зависимости оптимального управляющего воздействия от сопряженных переменных на основе максимизации Гамильтониана;

Составление сопряженной системы дифференциальных уравнений;

Составление общей системы дифференциальных уравнений, среди решений которой и находится искомое управляющее воздействие.

При рассмотрении объектов управления, описываемых линейными уравнениями, задачи максимального быстродействия имеют некоторую особенность. Дело в том, что соответствующая этим задачам функция Гамильтона содержит управление в степени не выше первой и, следовательно, определение максимального значения гамильтониана не может быть выполнено путем приравнивания нулю его первой производной по управлению. Поиск максимального значения гамильтониана в этом случае производится путем анализа возможных комбинаций между управлением и переменными сопряженной системы уравнений. При этом оказывается, что оптимальное управление должно быть максимально по модулю внутри интервала управления и в некоторых его точках мгновенно менять знак в соответствии со знаком некоторой функции от сопряженных переменных. В условиях такого слабого влияния сопряженной системы уравнений на управляющее воздействие возникает возможность вообще отказаться от решения сопряженной системы уравнений и рассматривать моменты смены знака управления (моменты переключения) как самостоятельные переменные.

Более подробно рассмотрим решение задачи максимального быстродействия на следующем примере.

Объект управления:

Критерий качества:

Гамильтониан:

Анализируя возможные комбинации значений и можно сделать вывод о том, что для обеспечения максимальной величины Гамильтониана в зависимости от управления необходимо выполнение следующего соотношения:

Сопряженная система уравнений:

Общая система уравнений:

Поскольку в системе уравнений (5.1) уравнения для сопряженных переменных не зависят от состояний объекта управления, то выражения для можно найти только из системы сопряженных уравнений не обращая внимания на уравнения для состояний объекта управления.

В данном случае:

Анализируя полученные выражения можно сделать вывод о том, что искомое управляющее воздействие имеет вид прямоугольной волны, которая меняет знак не более одного раза. Очевидно, что момент смены знака управления (момент переключения) должен выбираться из условия обеспечения заданных граничных условий для состояний объекта управления. для определения моментов переключения может быть использовано несколько способов.

Первый способ определения моментов переключения – аналитический. При использовании этого способа необходимо получить аналитическое выражение для реакции объекта управления на управляющее воздействие, имеющее вид прямоугольной волны. Используем для этой цели преобразование Лапласа. Момент переключения обозначим через .

Преобразованная по Лапласу система уравнений объекта управления, учитывающая воздействие прямоугольной волны имеет вид:

Из этой системы уравнений можно получить следующие выражения для L-изображений состояний объекта управления:

или, после выполнения обратного преобразования Лапласа, собственно аналитические выражения для переходных процессов во времени:

Последние выражения позволяют найти как значение момента переключения , так и момента времени перевода объекта управления в требуемое состояние .

Второй способ определения моментов переключения – поиск минимума.

Для возможности применения для решения задачи оптимального управления алгоритмов поиска минимума задачу максимального быстродействия сформулируем следующим образом:

Допустим, что управляющее воздействие является кусочнопостоянной функцией времени, которая меняет знак в момент времени , а перевод объекта управления в конечное состояние происходит в момент времени . Требуется определить такие значения параметров и при которых достигается минимальное значение невязки между фактическими и требуемыми значениями состояний объекта управления в момент . Значение невязки вычисляется как сумма квадратов разностей между фактическими и заданными значениями состояний объекта управления в момент времени .

Вычисление параметров оптимального управления методом поиска минимума может быть выполнено с помощью следующей MATLAB-программы:

Файл Main5.m

%вектор начальных приближений для момента переключения и

%момента завершения интервала управления

T=fminsearch("fms5",ti0)

function f=fms5(T)

%численное решение дифф. ур-ний объекта управления при действии

%на него прямоугольной волны управления

Ode45("odefun5",,);

%вычисление невязки

f=x(length(t),1)^2+x(length(t),2)^2;

%генерация массива значений управления для построения графика

for i=1:length(t)

plot(t,x(:,1),t,u)

Файл odefun5.m

function f=odefun5(t,x)

Третий способ определения моментов переключения – графическое построение линии переключения.

Этот способ отличается большой наглядностью, но применим к объектам управления второго порядка, т.к. поведение только таких объектов полностью описывается фазовым портретом. При использовании этого способа задача оптимального управления решается путем построения линии переключения, геометрического места точек фазового пространства объекта управления, из которых перевод объекта в конечное состояние возможен без переключения знака управления. В том случае, когда линия переключения найдена, процедура управления объектом заключается в следующем:

К объекту прикладывается управление некоторого знака и под действием этого управления объект движется до тех пор, пока его изображающая точка не окажется на линии переключения

При попадании изображающей точки на линию переключения выполняется смена знака управляющего воздействия и его изображающая точка начинает двигаться по линии переключения к целевому состоянию. Таким образом, гарантия попадания изображающей точки в целевое состояние обеспечивается по определению линии переключения.

Очевидным способом построения линии переключения является сканирование всей фазовой плоскости и запоминание тех ее точек, из которых целевое состояние достигается путем применения постоянного по величине и знаку управления.

Однако существует способ построения всей линии переключения за один прием. Дело в том, что фазовая траектория движения объекта в обратном времени из целевой точки под действием постоянного по величине и знаку управлении обладает всеми свойствами линии переключения. Следовательно, линия переключения может быть построена путем решения дифференциальных уравнений объекта управления записанных в обратном времени. Математически переход к обратному времени выполняется заменой на в уравнениях объекта. Следует учитывать. что линия переключения имеет две ветви: одна из них соответствует положительному значению управляющего воздействия, а другая – отрицательному.

Программное обеспечение решения задачи максимального быстродействия состоит из двух частей:

Скрипт, выполняющий построение фазовой траектории объекта путем численного решения его уравнений записанных в обратном времени из начальной точки, соответствующей целевому состоянию (построение линии переключения);

Скрипт, выполняющий построение фазовой траектории объекта путем численного решения его уравнений записанных в обычном времени из начальной точки, соответствующей начальному состоянию (знак управляющего воздействия противоположен знаку, использованному при построении линии переключения).

Длительность фазовой траектории, порождаемой вторым скриптом должна быть достаточной для ее пересечения с линией переключения. Момент пересечения и является искомым моментом переключения.

Пример

Рассмотрим случайные величины

X количество успехов в двенадцати независимых испытаний с распределением Бернулли с вероятностью успеха θ в каждом из них.
Y количество независимых испытаний с распределением Бернулли, необходимых для получения трех успехов. Вероятность успеха в каждом из испытаний θ.

Тогда рассмотрение X = 3 даст функцию правдоподобия

а рассмотрение Y = 12 даст функцию правдоподобия

Они равносильны, так как одна равняется произведению второй на скалярное значение. Принцип максимального правдоподобия в данном случае говорит, что выводы, сделанные о значении переменной θ должны быть одинаковы в обоих случаях.

Разница в наблюдении X = 3 и наблюдении Y = 12 исключительно в дизайне эксперимента: в одном случае изначально было решено делать двенадцать попыток, а в другом делать попытки, пока не будет трех успешных. Результат будет одинаковым в обоих случаях. Поэтому принцип максимального правдоподобия иногда выражают следующим образом:

Вывод должен зависеть только от исхода эксперимента, а не от дизайна эксперимента.

Закон максимального правдоподобия

Связанная с принципом максимального правдоподобия концепция - это закон максимального правдоподобия , говорящий, что отношение того, какое значение параметра более применимо, равняется отношению их функций правдоподобия. Тогда отношение

является мерой того, насколько величина x принимает параметр a в отношении к b . Таким образом, если отношение равняется 1, то разницы нет, а если больше 1, то a предпочтительней b , и наоборот.

Из принципа максимального правдоподобия и закона максимального правдоподобия следует, что параметр, который максимизирует функцию правдоподобия, является лучшим. Это и является основой широко известного метода максимального правдоподобия .

Историческая справка

Принцип максимального правдоподобия был впервые упомянут в печати в г. Однако основы принципа и применение его на практике были опубликованы ранее в работах Р. А. Фишера в г.

Аргументы за и против принципа максимального правдоподобия

Принцип максимального правдоподобия принимается не всеми. Некоторые широко используемые методы традиционной статистики, как например проверка статистических гипотез противоречат принципу максимального правдоподобия. Рассмотрим кратко некоторые за и против этого принципа.

Зависимость результата от организации эксперимента

Неосуществленные события действительно играют роль в некоторых общих статистических методах. Например результат проверки статистической гипотезы может зависеть от доверительной вероятности так же или даже более, чем распределение неизвестного параметра. А сама доверительная вероятность может зависеть организации эксперимента.

Некоторые классичекие методы проверки гипотез базируются не на правдоподобии. Часто приводимый пример это проблема оптимальной остановки. Предположим я сказал, что бросил монету 12 раз и получил 3 решки. Из этого вы сможете сделать некоторые выводы о вероятности выпадения решки у этой монеты. А теперь предположим, что я бросал монету пока решка не выпала 3 раза, и получилось 12 бросков. Сделаете ли вы теперь другие выводы?

Функция правдоподобия одинакова в обоих случаях и пропорциональна

В соответствии с принципом правдоподобия выводы должны быть одинаковы в обоих случаях.

Предположим некоторая группа ученых определяет вероятность некоторого исхода (который мы будем называть "успехом") серией экспериментов. Здравый смысл подсказывает нам, что если нет оснований считать что успех более вероятен, чем неудача, и наоборот, то следует положить вероятность успеха равной 0.5. Ученый Адам сделал 12 испытаний, в которых получил 3 успеха и 9 неудач, после чего умер.

Его коллега по лаборатории Билл продолжил работу Адама и опубликовал результат проверки гипотезы. Он проверил гипотезу что вероятность успеха p =0.5 против p < 0.5. Вероятность того, что в 12 испытаниях наступит не более 3 успехов, равна

что есть 299/4096 = 7.3 %. Таким образом гипотеза не отвергается при 5 % уровне доверия.

Шарлотта, прочитав статью Билла, пишет письмо. Она считает, что Адам, возможно, продолжал испытания пока не умер, успев получить к этому моменту 3 успеха. Вероятность того, что для трех успехов потребуется 12 или более испытаний равна

что есть 134/4096 = 3.27 %. И теперь результат отвергается при уровне в 5 %.

Для этих ученых зависимость результата испытаний зависит от организации эксперимента, а не только от правдоподобия результата.

Очевидно, парадоксы такого рода некоторые считают аргументом против принципа правдоподобия, для других они же иллюстрирует значимость принципа.

Литература

См. также

Ссылки

Anthony W.F. Edwards. «Likelihood». http://www.cimat.mx/reportes/enlinea/D-99-10.html
Jeff Miller. Earliest Known Uses of Some of the Words of Mathematics (L)
John Aldrich. Likelihood and Probability in R. A. Fisher’s Statistical Methods for Research Workers

Wikimedia Foundation . 2010 .

Учтем теперь ограничения (2.2.2) на управление. Если в процессе оптимального управления функции не достигают границ множества (2.2.2) (что означает ) то для них выполняются соотношения (2.2.13), (2.2.14). Однако часто оптимальное управление принимает граничные значения либо - , более того, оптимальное управление может скачком переходить с одной границы на другую. Такие управления уже являются кусочно-непрерывными функциями времени.

При попадании оптимального управления на границу множества U соотношения (2.2.13), (2.2.14) нарушаются. Оптимальные управления удовлетворяют в этом случае принципу максимума Л. С. Понтрягина, установленного и доказанного в форме приведенной ниже - теоремы.

Переходя к этой теореме, сделаем некоторые пояснения. Возьмем произвольное допустимое управление и при начальных условиях найдем решение системы (2.2.1): .

Подставляя это решение и управление в (2.2.8), определим, пока при некоторых произвольных начальных условиях , решение (2.2.8): . При фиксированных (постоянных) значениях векторов функция Н становится функцией вектора . Максимум этой функции по и обозначим через :

Максимум (наибольшее значение) непрерывной функции может достигаться как в точках локального максимума этой функции, в которых

так и на границах множества .

Теорема 2.2.1 (принцип максимума Л. С. Понтрягина). Пусть , - такое допустимое управление, что соответствующие ему решения уравнения (2.2.11), исходящие в момент из состояния (2.2.3), (2.2.7), проходят в момент времени через точку .

Для оптимальности управления (при котором ) принимает наименьшее значение) необходимо существование таких ненулевых непрерывных функций удовлетворяющих уравнениям (2.2.12), что при любом функция переменного достигает при максимума

при этом в конечный момент времени выполняются соотношения

Если удовлетворяют (2.2.11), (2.2.12) и (2.2.17), то функции переменного t являются постоянными и поэтому проверку соотношений (2.2.18) можно проводить не обязательно в момент времени а в любой момент .

Доказательство теоремы является достаточно сложным, и поэтому в приложении 2 приведен лишь вывод основного соотношения (2.2.17) теоремы для случая свободного правого конца ( не задан) и фиксированного .

Соотношения (2.2.17) и (2.2.18) можно записать в более простой форме:

Таким образом, центральным в теореме 2.2.1 является условие максимума (2.2.19). Оно означает, что если - оптимальные управления, а -оптимальные траектории, то непременно найдутся такая постоянная и такие решения ), системы (2.2.12), что функция их, переменных при всех будет достигать максимума на U именно при оптимальных управлениях . Поэтому теорему 2.2.1, дающую необходимое условие оптимальности в задачах оптимального управления, принято называть принципом максимума. Отметим, что во внутренних точках множества U для оптимального управления выполняются условия (2.2.13), (2.2.14), которые являются необходимыми для (2.2.19).

Практическое применение принципа максимума.

Как же практически воспользоваться условием (2.2.19), ведь функции и постоянная , входящие в это условие, неизвестны?

Здесь поступают следующим образом: рассматривая функцию ) как функцию переменных и считая переменные параметрами, решают задачу максимизации функции и находят функцию

на которой достигается наибольшее значение функции .

В ряде случаев функция (2.2.20) может быть записана в явном виде. Например, если правые части (2.2.1) имеют структуру

а подынтегральное выражение функционала (2.2.5)

множество описывается U неравенствами (2.2.2), то

и эта функция достигает наибольшего значения на U в точке с координатами

Формула (2.2.22) дает большой объем информации о структуре оптимального управления: координата оптимального управления является ступенчатой (кусочно-постоянной) функцией со значениями при этом моменты переключения определяются условием

Итак, допустим, что функция (2.2.20) известна. Рассмотрим систему дифференциальных уравнений

Функции и , входящие в правые части этих уравнений, известны. Общее решение системы (2.2.24), (2.2.25) зависит от произвольных постоянных, которые определяются из краевых условий (2.2.3), (2.2.4). Задача интегрирования уравнений (2.2.24), (2.2.25) при краевых условиях (2.2.3), (2.2.4) называется краевой задачей (двухточечной краевой задачей).

Таким образом, принцип максимума позволяет свести решение задачи об оптимальном программном управлении к решению краевой задачи.

Трудность ее решения состоит в том, что интегрирование уравнений (2.2.24), (2.2.25) в «прямом времени» не представляется возможным, так как неизвестны начальные условия Один из возможных подходов к решению краевой задачи заключается в следующем. Задаваясь произвольным вектором и интегрируя (2.2.24), (2.2.25) при известных начальных условиях , найдем функции и при проверим выполнение равенства (2.2.4). Если оно нарушается, задаемся другим вектором и, интегрируя (2.2.24), (2.2.25) при начальных условиях , получим при вектор .

Если он не совпадает с заданным, продолжаем процесс до тех пор, пока не найдется такой вектор что условия (2.2.4) будут выполняться с приемлемой точностью. При этом подходе используются градиентные методы, когда определяется из условия минимума «расстояния» от заданного вектора .

В вычислительной математике разработан ряд методов приближенного численного решения краевых задач: метод стрельбы, метод прогонки, ряд итерационных методов , . Во многих случаях не представляется возможным найти из условия (2.2.19) явный вид (2.2.22) оптимального управления. Тогда уравнения (2.2.1), (2.2.6), сопряженная система (2.2.12) и условия максимума (2.2.19) образуют краевую задачу принципа максимума. Эта задача имеет ряд специфических особенностей, затрудняющих применение стандартных численных методов решения краевых задач. К числу таких особенностей относятся разрывы функций удовлетворяющих условию максимума (2.2.14), их неединственность, нелинейный характер зависимости (2.2.20) даже в линейных системах. Кроме того, особенностью краевых задач, связанных с принципом максимума даже в случаях, когда удается найти явный вид управлений (2.2.20), является их плохая сходимость, вызванная неустойчивостью системы (2.2.24), (2.2.25). Ряд приемов решения краевых задач принципа максимума изложен, например, в .

Отметим в заключение, что, несмотря на различные методы численного решения краевой задачи принципа максимума, процесс решения каждой оптимизации на основе этого принципа является самостоятельной творческой задачей, решаемой в рамках той частной отрасли динамики, к которой относится объект управления, с учетом его специфических особенностей, используемых для улучшения сходимости численного решения краевой задачи.

Пример 2.2.1. Построение оптимального по расходу топлива управления .

Рассмотрим объект управления, описываемый уравнениями

Пусть на управление наложено ограничение

Функционал оптимизации, выражающий расход топлива, имеет вид

Заданы начальное состояние

и условие в момент времени

Требуется найти , при котором объект (2.2.26) переходит из состояния (2.2.29) в состояние (2.2.30), при этом выполняются ограничения (2.2.27), а функционал (2.2.28) принимает наименьшее значение.

Переходя к определению оптимального управления на основе принципа максимума, сформируем функцию

уравнения для вспомогательных переменных

Управление , доставляющее максимум функции (2.2.31), определяется как

Уравнения (2.2.26), (2.2.32), (2.2.33) составляют краевую задачу. Переходя к ее исследованию, запишем решение системы (2.2.32):

где - неизвестные числа, которые необходимо определить так, чтобы управление (2.2.33) привело объект (2.2.26) в состояние (2.2.30).

Найдем решение системы (2.2.26) при и . В первом случае решение этой системы имеет вид . Оно зависит от постоянных R и р, при этом . Фазовые траектории этой системы представляют собой окружности с центром в начале координат (рис. 2.2.1, а). Фазовые траектории системы (2.2.26) при и также являются окружностями, центры которых расположены в точках соответственно (рис. 2.2.1, б, в).