Спросить
Войти
Категория: Математика

ИССЛЕДОВАНИЕ УСЛОВИЙ НОРМАЛЬНОСТИ В ЗАДАЧАХ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ ТИПА РАВЕНСТВ И НЕРАВЕНСТВ

Автор: Карамзин Дмитрий Юрьевич

УДК 517.51

DOI 10.21685/2307-4205-2020-2-3

Д. Ю. Карамзин, Ф. Л. Перейра

ИССЛЕДОВАНИЕ УСЛОВИЙ НОРМАЛЬНОСТИ В ЗАДАЧАХ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ ТИПА РАВЕНСТВ И НЕРАВЕНСТВ

D. Yu. Karamzin, F. L. Pereira

INVESTIGATION OF CONDITIONS FOR NORMALITY IN CONTROL PROBLEMS WITH EQUALITY AND INEQUALITY STATE CONSTRAINTS

Аннотация. Работа направлена на исследование условий нормальности принципа максимума Понтря-гина для общих задач оптимального управления с фазовыми ограничениями, в которых фазовые ограничения задаются равенствами и неравенствами. Нормальность доказывается при условии регулярности, сформулированном в терминах предельного нормального конуса к допустимому множеству управления. Нормальность принципа максимума следует из условия регулярности, если одна из концевых точек свободна. При этом рассматривается случай замкнутого управляющего множества. Приводится оценка множителей Лагранжа, отвечающих за фазовые ограничения типа равенств, которая тесно связана со свойством регулярности траектории относительно фазовых ограничений этого типа. Отметим, что задачи оптимального управления с фазовыми ограничениями играют важную роль в моделировании различных технических процессов и систем.

Abstract. This work aims to investigate conditions for normality of the maximum principle for general state-constrained optimal control problems in which the state constraints are given by equalities and inequalities. Normality is proved under a regularity condition formulated in terms of the limiting normal cone to the feasible control set. The regularity condition implies normality of the maximum principle if one of the end-points is free. In this case, the case of a closed control set is considered. An estimate is given of the Lagrange multipliers responsible for state constraints of the type of equalities, which is closely related to the regularity property of the trajectory with respect to state constraints of this type. We also note that optimal control problems with state constraints play an important role in modeling various technical processes and systems.

Задачи оптимального управления с фазовыми ограничениями играют важнейшую роль в моделировании различных технических процессов и систем. Представляется также важным их исследование в рамках теории статистического подобия, сформулированной профессором Н. А. Северце-вым [1-3]. Перейдем к точным формулировкам.

Рассмотрим следующую задачу оптимального управления:

ф(p) ^ min, x = f (x, u),

p = (x(0), x(1)) e C, (1)

u(t) e U дляп.в. t e [0,1],

gi(x(t)) < 0, g2(x(t)) = 0 Vte [0,1].

Здесь x - это переменная состояния в Rn, а u - управляющая переменная в Rm. Предположим, что множество C замкнуто, а U компактно. Траектория x( ) является абсолютно непрерывной функцией, такой, что удовлетворяет уравнению x(t) = f (x(t),u(t)) для a.a. t e [0,1], концевым ограничениям p e C , а также фазовые ограничения g1(x(t)) < 0 , g2(x(t)) = 0 Vt e [0,1].

© Карамзин Д. Ю., Перейра Ф. Л., 2020

Отображения f: R" х Rm ^ R", ф: R2" ^ R и g,: R" ^ Ri, i = 1,2 предполагаются достаточно гладкими.

Введем понятие регулярности. Рассмотрим допустимый процесс (x*, u ). Обозначим

Г, (x, u, t) = —J~ (x, t)f (x, u), i = 1,2, dx

U(x) := {ue U :r2(x,u) = 0}.

Определение 1. Траектория x*() называется регулярной относительно фазовых ограничений типа равенств, если для всех t e [0,1] и u e U(x*(t)) выполняется следующее условие полного ранга:

rank (x*(t), u) = k2, du

im(x* (t), u ) n Nu (u ) = {0}.

Здесь №и (и) означает предельный нормальный конус Мордуховича ко множеству и в точке и.

Обозначим через и(г) замыкание по мере управляющей функции и *(г). Напомним, что многозначное отображение и(г) определено для г е (0,1) как множество векторов и е РРт таких, что

£({е [-е, + 8]:и*(^)е Ве(и)})>0 Уе> 0.

Здесь Ве (и) = {у е РРт :|у - и |<е}, а £ означает меру Лебега на прямой Р . При г = 0,1, определим и (г) по непрерывности как верхний топологический предел.

Рассмотрим множество J(х) := {у : g((х) = 0}.

Определение 2. Процесс управления (х ),и *(г)) называется внутренне регулярным относительно фазовых ограничений типа неравенств, если существует такое число е0 > 0, что для всех ге [0,1] существует 8 = 8(г)>0 такое, что для всех 5е (г-8,г + 8)п[0,1] и для всех иеи(5) можно найти единичный вектор

С = Сх(г, 5, и) е кег —2 (х* (5), и) п №и (и) ди

такой, что

1дЛ

(x* (s), u), dA< Vj e J(x* (t)). (2)

Процесс называется внешне регулярным относительно фазовых ограничений типа неравенства, если для всех г е [0,1] существует 8 = 8(г) > 0, такое что для всех 5 е (г - 8, г + 8) п [0,1], и еи (5) можно найти единичный вектор

сС2 = С2 (г, 5, и) е кег —2 (х* (5), и) п №и (и) ди

такой, что

As),u),dЛ>£o Vje J(x&(t)). (3)

Внутренне и внешне регулярный процесс будем называть регулярным относительно фазовых ограничений типа неравенства.

Здесь NU обозначает полярный конус к Ыи.

Определение 3. Процесс управления (x*(t),u)) называется внутренне/внешне регулярным относительно фазовых ограничений, если он является внутренне/внешне регулярным относительно фазовых ограничений типа неравенств, в то время как траектория x*(t) является регулярной относительно фазовых ограничений типа равенств. Внутренне и внешне регулярный процесс будет называться регулярным относительно фазовых ограничений.

Определение 4. Говорят, что выполнены условия управляемости относительно фазовых ограничений в точке p* = (x* (0), х*(1)), если для 5 = 1,2,

е сопу у(х*,и(х*)):

(-1)^дЗъГ(х*),У) >0 У]е 3(х*).

Здесь сопу означает выпуклую оболочку множества.

Между этими понятиями существует важная связь.

Лемма 1. Внутренне регулярный относительно фазовых ограничений процесс управления подразумевает условие управляемости при * = 1, в то время как внешне регулярный относительно фазовых ограничений процесс управления подразумевает условие управляемости при * = 2. Таким образом, регулярность процесса управления относительно фазовых ограничений влечет условия управляемости относительно фазовых ограничений в концевой точке.

Фазовые ограничения согласованы с концевыми ограничениями, если

С с О х О,

О :={хе Рп : g1(х) < 0,g2(х) = 0}.

Согласованность ограничений не является обременительным требованием. Очевидно, что ее всегда можно достичь, заменив множество С на множество С п (О х О). Поэтому в дальнейшем предполагается, что С вложено в фазовое множество О х О .

Рассмотрим расширенную функцию Гамильтона - Понтрягина [4],

Н (х, и, у, ц) := (у, у (х, и)) - (ц, Г( х, и)), где уеРП, ц = (^2), Цг е Рк1 и Г = (Г1,Г2).

Определение 5. Будем говорить, что процесс управления (х*,и*) удовлетворяет принципу максимума, если существуют множители Лагранжа: число Х> 0, абсолютно непрерывная вектор-функция ([0,1];РП), покомпонентно убывающая вектор-функция ограниченной вариации

ц1 е БУ ([0,1]; Рк1) и измеримая вектор-функция ц2 е L([0,1];Рк2) такая, что выполняются

следующие условия:

- условие нетривиальности

^ + ХУагЦ{ (010 + dist(у(0 )^(х*(0), тдg*(х*(0)) > 0 Vt е [0,1];

дх дх

сопряженное уравнение

V(t) = -—(x (t),u (t),V(t),M&(t)) дляп.в. te [0,1]; dx

- условия трансверсальности

(V (0)-ц,(0) dg1( x0),-V (1) + Ц,(1) dg1( x*)) e^ ( p&) + Nc (p&); dx dx dp

- условие максимума

max H(x*(t),u,V(t),h(t)) = H(x*(t),u\\t), V(t),h(t)) для п.в. te [0,1];

ueU (x*(t))

- закон сохранения энергии 3c e R: M(t) = c Vt e [0,1], где

M(t) := maxueu(x*(t))H(x*(t), u, V(t), Ц(t));

- условие Эйлера - Лагранжа

dH (x* (t), u* (t), V(t), h(t)) e convNu (u* (t)); du

- условие дополняющей нежесткости j"^ g1( x*(t)), d ^(t = 0.

Кроме того, справедлива следующая оценка множителей. Существует такое число к >0, что

| ц 2 (t) + % |< К-1V (t) - Ц (t) dg1( x&(t)) + (x&(t))

для п.в. t e [0,1] идля всех^ Rk2.

Приведем небольшой комментарий. В то время как условие нетривиальности, сопряженное уравнение, условие трансверсальности, условие максимума, закон сохранения, включение Эйлера -Лагранжа и условие дополнительной нежесткости достаточно хорошо известны, оценка (4) является новой и, кроме того, является существенной частью принципа максимума. Эта оценка множителей тесно связана со свойством регулярности относительно фазовых ограничений типа равенств и тем, что рассматривается случай просто замкнутого множества и. Обратим внимание, что эту оценку не получится вывести из условия Эйлера - Лагранжа из-за овыпукления нормального конуса, и поэтому она доказывается отдельно. Когда множество и выпукло, оценка (4) не нужна.

Рассмотрим следующие замечания.

Замечание 1. Наряду с набором множителей Лагранжа (А, у, Ц) условия принципа максимума также удовлетворяются следующим набором множителей Лагранжа:

( дg Л

А, у (г) + а—(г), ц (г) + a ,

V дх )

где g = (^^2), а - произвольный вектор из Рк, к = к1 + к2.

Замечание 2. Функция Ц (г) постоянна на любом временном интервале [а, Ь], на котором g/ (х )) < 0 У г е [ а, Ь].

Замечание 3. Закон сохранения энергии не является полностью независимым условием, поскольку следующую его часть легко извлечь из остальных условий принципа максимума, а именно, из условия максимума, сопряженного уравнения и монотонности множителя меры :

За е Р: М(г ) = с У г е (0,1), М (0) > с, М (1) > с.

Остальная часть закона о сохранении энергии представляет собой истинные (независимые) условия оптимальности:

M(0) < с, M(1) < с,

которые можно рассматривать как условия трансверсальности по отношению к ограничениям времени: t > 0 и t < 1, если считать время как фазовую переменную, а гамильтониан (энергию) -соответственно как сопряженную ко времени функцию.

Утверждение принципа максимума заключается в следующем.

Теорема 1. Предположим, что процесс управления (x*, u *) является оптимальным в задаче (1). Если траектория x*(t) является регулярной относительно фазовых ограничений типа равенств, то процесс (x*, u*) удовлетворяет принципу максимума.

Доказательство этого утверждения может быть найдено в работах [5, 6]. Основной результат нашей работы заключается в следующей теореме.

Теорема 2. Предположим, что процесс управления (x*,u*) является оптимальным в задаче (1). Предположим, что (x*, u*) является регулярным относительно фазовых ограничений, в то время как правая концевая точка свободна, что означает, что C = C0 х G для некоторого замкнутого множества C0 с G. Тогда процесс управления (x*, u*) удовлетворяет принципу максимума, причем X >0. Аналогично, если (x*,u*) является регулярным относительно фазовых ограничений и левая концевая точка свободна, что означает, что C = G х C1 для некоторого замкнутого множества C1 с G, то процесс управления (x*, u *) удовлетворяет принципу максимума при X >0.

Доказательство см. в работе [7].

Работа выполнена при поддержке Российского научного фонда (грант 19-11-00258).

Библиографический список

1. Северцев, Н. А. Статистическая теория подобия в задачах безопасности и надежности динамических систем / Н. А. Северцев. - Москва : Радиотехника, 2016. - 399 с.
2. Северцев, Н. А. Введение в безопасность : учеб. пособие / Н. А. Северцев, А. В. Бецков. - 2-е изд., перераб. и доп. - Москва : Юрайт, 2019. - 177 с.
3. Северцев, Н. А. Адаптивная модель оценки безопасности и надежности программного обеспечения / Н. А. Северцев, А. В. Бецков, А. Н. Дарьина // Надежность и качество сложных систем. - 2018. - № 4 (24). C. 19-28.
4. Pontryagin, L. S. The Mathematical Theory of Optimal Processes / L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mishchenko. - New York : Interscience, 1962. - 360 р.
5. Arutyunov, A. V. Non-degenerate necessary optimality conditions for the optimal control problem with equality-type state constraints / A. V. Arutyunov, D. Yu. Karamzin // Journal of Global Optimization. - 2016. - Vol. 64 (4). -P. 623-647.
6. Arutyunov, A. V. The Maximum Principle for Optimal Control Problems with State Constraints / A. V. Arutyunov,

D. Yu. Karamzin, F. L. Pereira // Journal of Optimization Theory and Applications. - 2011. - Vol. 149 (3). -P. 474-493.

7. Arutyunov, A. V. Necessary Optimality Conditions for Problems with Equality and Inequality Constraints: Abnormal Case / A. V. Arutyunov, D. Y. Karamzin, F. L. Pereira // Journal of Optimization Theory and Applications. - 2009. - Vol. 140:3. - P. 391-408.

References

1. Severtsev N. A. Statisticheskaya teoriya podobiya v zadachakh bezopasnosti i nadezhnosti dinamicheskikh sistem [Statistical similarity theory in security and reliability problems of dynamical systems]. Moscow: Radiotekhnika, 2016, 399 p. [In Russian]
2. Severtsev N. A., Betskov A. V. Vvedenie v bezopasnost&: ucheb. posobie [Introduction to safety : textbook]. 2nd ed., rev. and suppl. Moscow: Yurayt, 2019, 177 p. [In Russian]
3. Severtsev N. A., Betskov A. V., Dar&ina A. N. Nadezhnost& i kachestvo slozhnykh system [Reliability and quality of complex systems]. 2018, no. 4 (24), pp. 19-28. [In Russian]
4. Pontryagin L. S., Boltyanskii V. G., Gamkrelidze R. V., Mishchenko E. F. The Mathematical Theory of Optimal Processes. New York: Interscience, 1962, 360 p.
5. Arutyunov A. V., Karamzin D. Yu. Journal of Global Optimization. 2016, vol. 64 (4), pp. 623-647.
6. Arutyunov A. V., Karamzin D. Yu., Pereira F. L. Journal of Optimization Theory and Applications. 2011, vol. 149 (3), pp. 474-493.
7. Arutyunov A. V., Karamzin D. Y., Pereira F. L. Journal of Optimization Theory and Applications. 2009, vol. 140:3, pp. 391-408.

Карамзин Дмитрий ^Эрьевич

доктор физико-математических наук, ведущий научный сотрудник, Федеральный исследовательский центр «Информатика и управление» Российской академии наук (Россия, г. Москва, ул. Вавилова, 42, корп. 2) E-mail: dmitry_karamzin@mail.ru

Перейра Фернандо Лобо

кандидат математических наук, директор SYSTEC/FEUP, Университет Порту (Португалия, г. Порту) E-mail: flp@fe.up.pt

Karamzin Dmitriy Yur&evich

doctor of physical and mathematical sciences, leading researcher,

Federal Research Center "Computer Science and Control" of the Russian Academy of Sciences (42/2 Vavilova street, Moscow, Russia)

Pereira Fernando Lobo

Ph.D in mathematics, Director of SYSTEC/FEUP, University of Porto (Porto, Portugal)

Образец цитирования:

Карамзин, Д. Ю. Исследование условий нормальности в задачах управления с фазовыми ограничениями типа равенств и неравенств / Д. Ю. Карамзин, Ф. Л. Перейра // Надежность и качество сложных систем. - 2020. - № 2 (30). - С. 20-25. - БОТ 10.21685/2307-4205-2020-2-3.

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРИНЦИП МАКСИМУМА ФАЗОВЫЕ ОГРАНИЧЕНИЯ optimal control maximum principle state constraints
Другие работы в данной теме:
Контакты
Обратная связь
support@uchimsya.com
Учимся
Общая информация
Разделы
Тесты