А. В. Дмитрук, “Вариации $v$-замены времени в задаче оптимального управления с фазовыми и смешанными ограничениями”, Изв. РАН. Сер. матем., 87:4 (2023), 91–132; Izv. Math., 87:4 (2023), 726

Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

Известия Российской академии наук. Серия математическая

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Скоро в журнале
	Архив
	Импакт-фактор
	Правила для авторов
	Загрузить рукопись

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Изв. РАН. Сер. матем.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Известия Российской академии наук. Серия математическая, 2023, том 87, выпуск 4, страницы 91–132
DOI: https://doi.org/10.4213/im9305 (Mi im9305)

Вариации

$v$ -замены времени в задаче оптимального управления с фазовыми и смешанными ограничениями

А. В. Дмитрук

Математический институт им. В. А. Стеклова Российской академии наук, г. Москва

PDF полного текста (962 kB) PDF английской версии (886 kB) Полный текст в HTML

Список литературы:

PDF

HTML

DOI: https://doi.org/10.4213/im9305

Аннотация: Для общей задачи оптимального управления с фазовыми и регулярными смешанными ограничениями предлагается доказательство принципа максимума с помощью так называемой

$v$ -замены времени

$t \mapsto \tau$ , при которой исходное время становится еще одной фазовой переменной, подчиненной уравнению

$dt/d\tau = v(\tau)$ , а дополнительное управление

$v(\tau)\geqslant 0$ кусочно постоянно, и его значения служат аргументами новой задачи.
Библиография: 36 наименований.

Ключевые слова: фазовые и смешанные ограничения, позитивно-линейно независимые вектора,

$v$ -замена времени, условия стационарности, множители Лагранжа, мера Лебега–Стилтьеса, функционалы на

$L_\infty$ , слабая-

$*$ компактность, принцип максимума.

Финансовая поддержка	Номер гранта
Российский научный фонд	20-11-20169
Исследование выполнено за счет гранта Российского научного фонда № 20-11-20169, https://rscf.ru/project/20-11-20169/.

Поступило в редакцию: 20.12.2021
Исправленный вариант: 31.08.2022

Англоязычная версия:
Izvestiya: Mathematics, 2023, Volume 87, Issue 4, Pages 726–767
DOI: https://doi.org/10.4213/im9305e

Реферативные базы данных:

Тип публикации: Статья

УДК: 517.97

MSC: 49K15, 49K27

§ 1. Введение

Задачи оптимального управления с фазовыми и смешанными ограничениями встречаются повсеместно и в чисто теоретических, и в прикладных исследованиях. Их изучение началось с 1960 г. работой Р. В. Гамкрелидзе [1], методы которой были затем развиты в ряде других работ, например, [2]–[4]. При этом, как хорошо известно, обобщение принципа максимума (ПМ) Понтрягина на эти задачи было сопряжено со значительными трудностями, поскольку здесь мы имеем дело с бесконечным (континуальным) числом ограничений неравенства. Основная проблема возникала уже при получении условий стационарности (уравнения Эйлера–Лагранжа), она состояла в характеризации множителей Лагранжа при указанных ограничениях.

В работе А. Я. Дубовицкого и А. А. Милютина [5] было предложено трактовать фазовое ограничение $\Phi(t, x(t))\leqslant0$ как принадлежность конусу неотрицательных функций в пространстве $C$ непрерывных функций на данном отрезке времени, и тогда соответствующий множитель Лагранжа представляет собой элемент сопряженного пространства $C^*$ , т. е. меру Лебега–Стилтьеса. При таком подходе необходимые условия слабого минимума (т. е. условия стационарности) получить уже несложно (см., например, [5]–[7]). Затем ими же была предложена некоторая процедура сведения исходной задачи к семейству вспомогательных, присоединенных задач (см. [8]), из условий стационарности в которых они получили обобщение ПМ Понтрягина (т. е. необходимые условия сильного минимума) для задач с фазовыми ограничениями. Упомянутая процедура была основана на так называемой $v$ -замене времени, о которой будет сказано чуть ниже, но может быть основана и на других классах вариаций.

По аналогии с фазовыми, смешанные ограничения типа $\varphi(t, x(t),u(t))\leqslant0$ было предложено трактовать как принадлежность конусу неотрицательных функций пространства $L_\infty$ , и тогда соответствующие множители будут элементами сопряженного к нему пространства. Однако в общем случае охарактеризовать эти множители очень непросто, поскольку они могут содержать так называемые сингулярные составляющие. В случае, когда смешанные ограничения регулярны (их градиенты по $u$ в некотором смысле невырождены), можно показать, что сингулярных составляющих у множителей Лагранжа нет, все они суть функции из пространства $L_1$ , так что для формулировки условий оптимальности регулярные смешанные ограничения проще чисто фазовых.

На основе полученных условий стационарности, применяя опять $v$ -замену времени, А. Я. Дубовицкий и А. А. Милютин получили ПМ и для задач, в которых имеются и фазовые, и регулярные смешанные ограничения. Это доказательство было опубликовано лишь спустя много лет [6; гл. 5], а в то время авторы сосредоточились на исследовании задач со смешанными ограничениями общего вида, без предположения об их регулярности [9]–[11]. Публикации же других авторов по задачам с регулярными смешанными ограничениями начались с середины 1970-х гг., см. [12]–[14]. В работе [15] автор, будучи аспирантом А. А. Милютина, реализовал его идею об использовании для этой цели так называемых скользящих режимов, введенных ранее Р. В. Гамкрелидзе [16] для доказательства существования решений задач оптимального управления, и дал полное доказательство ПМ для задач с регулярными смешанными ограничениями равенства и неравенства.

Имеются и другие работы по условиям оптимальности для задач с такими ограничениями, но их немного, см. [3], [17]–[23]. Как правило, их авторы либо рассматривают частные постановки и предполагают усиленные условия регулярности, либо наоборот, идут в сторону обобщения задачи на случай, когда ограничения задачи задаются негладкими (липшицевыми) функциями, и получают соответствующие варианты условий стационарности и ПМ методами негладкого анализа. Нам все же представляется, что гладкий случай является основным и заслуживает самого детального изучения, тем более, что “негладкие” условия, примененные к гладкому случаю, как правило, получаются более грубыми, чем “гладкие”.

Общая $v$ -замена времени состоит в переходе от исходного времени $t$ к новому времени $\tau$ , при котором исходное время $t= t(\tau)$ становится еще одной фазовой переменной, подчиненной уравнению $dt/d\tau = v(\tau)$ , где $v(\tau)\geqslant 0$ есть еще одно управление. Принципиальный момент состоит здесь в том, что эта замена не взаимно однозначна (там, где $v(\tau)= 0)$ , и по этой причине малые вариации управления $v(\tau)$ порождают немалые (так называемые понтрягинские) вариации исходного управления $u(t)$ . Использование этого приема требует однако хорошего владения теорией функций действительного переменного.

В конце 1990-х гг. А. А. Милютин предложил использовать упрощенный вариант $v$ -замены, с кусочно постоянной функцией $v(\tau)$ . Этим способом он доказал принцип максимума для общей понтрягинской задачи, т. е. задачи с концевыми ограничениями, но без фазовых и смешанных. В случае кусочно постоянной $v$ -замены малые вариации управления $v(\tau)$ порождают, по сути дела, игольчатые вариации исходного управления $u(t)$ с небольшим, но существенным отличием от стандартных. Преимущество вариаций типа $v$ -замены по сравнению со стандартными игольчатыми вариациями (пакетами иголок) состоит в следующем:

a) их можно вставлять в любые точки $t$ данного интервала времени, тогда как игольчатые вариации можно вставлять лишь в точки Лебега оптимального управления $\widehat u(t)$ (см., например, [24]–[26]);

b) ограничения задачи будут определены по крайней мере в целой окрестности параметров данной $v$ -замены, тогда как игольчатые вариации приводят к задаче, функции которой определены лишь на неотрицательном ортанте конечномерного пространства (точнее, на его пересечении с окрестностью нуля), соответствующем ширинам иголок $\varepsilon_i\geqslant 0$ в данном пакете;

c) ограничения задачи будут гладко зависеть от параметров $v$ -замены, тогда как при введении игольчатых вариаций дифференцируемость этих ограничений по ширинам иголок будет лишь при $\varepsilon_i=0$ .

В недавних работах [27], [28] было показано, что кусочно постоянная $v$ -замена позволяет получить ПМ и в задачах с фазовыми ограничениями. Цель настоящей статьи – показать возможность ее применения для получения ПМ в задачах, где есть и фазовые, и смешанные ограничения. Однако здесь в присоединенной задаче уже недостаточно одних обобщенных игольчатых вариаций, надо добавить еще и равномерно малые вариации управления (для получения условия стационарности по управлению $\overline H_u=0)$ , поэтому эта задача ставится уже в бесконечномерном пространстве. Общая схема доказательства, как и в [27], [28], такова. Кусочное постоянство функции $v(\tau)$ позволяет перейти к задаче, аргументами которой служат значения этой функции на участках ее постоянства, значения управления $u$ на интервалах $v(\tau)>0$ , а также начальное значение фазовой переменной $x(\tau_0)$ . Наличие фазовых и смешанных ограничений приводит к тому, что в этой задаче имеется бесконечное число ограничений неравенства, т. е. это не есть обычная гладкая задача. Тем не менее, условия оптимальности в ней известны; их специфика лишь в том, что они содержат функционалы, опорные к конусам неотрицательных функций в соответствующих пространствах. Применяя эти условия и переписывая их в терминах исходной задачи, мы получаем множество соответствующих наборов множителей Лагранжа, которое является непустым компактом в некоторой топологии. Каждый элемент этого компакта (т. е. набор множителей Лагранжа) обеспечивает выполнение принципа максимума на конечном множестве значений управления и времени, соответствующем данной $v$ -замене. Компакты, порожденные всевозможными кусочно постоянными $v$ -заменами, частично упорядочены по включению, и поэтому образуют центрированную систему. Взяв любой элемент из их пересечения, мы получаем единое условие оптимальности – набор множителей Лагранжа, для которого принцип максимума выполнен при всех значениях управления и времени.

Предлагаемый здесь способ получения ПМ для задач с фазовыми и регулярными смешанными ограничениями имеет то преимущество по сравнению с использованием скользящих режимов [15], [7], что в последнем приходится доказывать довольно сложную (хотя саму по себе интересную) теорему о корректности расширения (овыпукления) управляемой системы при введении скользящих режимов [29], тогда как метод $v$ -вариаций этого не требует.

Отметим еще раз, что прием перехода к семейству вспомогательных задач, в которых выписываются уже известные условия оптимальности, и затем использования центрированной системы компактов также был предложен А. Я. Дубовицким и А. А. Милютиным (см. [8], [6], [30], [31]). Он уже применялся для получения ПМ как в задаче без фазовых ограничений [7], [32], [25], так и в задаче с таковыми [7], [27], [28].

§ 2. Постановка задачи и принцип максимума в ней

Пусть $x(\,{\cdot}\,)\colon [t_0,t_1]\to\mathbb{R}^n$ есть абсолютно непрерывная функция (фазовая переменная), $u(\,{\cdot}\,)\colon [t_0,t_1]\to\mathbb{R}^r$ – измеримая ограниченная функция (управление). Отрезок времени $[t_0,t_1]$ заранее не фиксирован. Рассмотрим следующую задачу с функционалом типа Майера:

$\begin{equation} \mathcal{J}:= F_0(t_0,x(t_0),t_1,x(t_1)) \to \min, \end{equation} \tag{2.1}$

$\begin{equation} F(t_0,x(t_0),t_1,x(t_1))\leqslant 0, \qquad K(t_0,x(t_0),t_1,x(t_1))=0, \end{equation} \tag{2.2}$

$\begin{equation} \dot x(t)= f(t,x(t),u(t)) \quad \text{п. в. на } [t_0,t_1], \end{equation} \tag{2.3}$

$\begin{equation} \varphi(t,x(t),u(t)) \leqslant 0,\qquad g(t,x(t),u(t))=0 \quad \text{п. в. на } [t_0,t_1], \end{equation} \tag{2.4}$

$\begin{equation} \Phi(t,x(t))\leqslant0 \quad \text{на } [t_0,t_1]. \end{equation} \tag{2.5}$

Здесь $F$ , $K$ , $f$ , $\varphi$ , $g$ , $\Phi$ – вектор-функции некоторых размерностей, которые мы для экономии букв обозначаем как $d(F)$ , $d(K)$ и тому подобное. В записи ограничений (2.2)–(2.5) мы всюду используем векторные обозначения, которые понимаются в покоординатном смысле. Целевая функция $F_0$ скалярная. Функции конечномерного аргумента определены на некотором открытом множестве $\mathcal{P} \subset\mathbb{R}^{2n+2}$ , а функции, зависящие от $(t,x,u)$ , – на некотором открытом множестве $\mathcal{Q} \subset \mathbb{R}^{1+n+r}$ . Предполагается, что все эти функции гладкие, т. е. непрерывно дифференцируемы по своим аргументам. Задачу (2.1)–(2.5) для краткости назовем задачей $\mathrm{A}$ .

Ограничения (2.2) называются концевыми (или терминальными), (2.4) – смешанными, (2.5) – фазовыми, а (2.3) – управляемой системой.

Кроме указанных предположений гладкости, примем также предположение о регулярности смешанных ограничений: для любой точки $(t,x,u)\in \mathcal{Q}$ , в которой выполнены ограничения (2.4), система векторов

$\begin{equation} \varphi'_{iu}(t,x,u),\quad i\in I(t,x,u), \qquad g'_{ju}(t,x,u),\quad j=1,\dots, d(g), \end{equation} \tag{2.6}$

позитивно-линейно независима. Здесь

$I(t,x,u) = \{i\mid \varphi_i(t,x,u) =0\}$ есть множество активных индексов для смешанных ограничений неравенства.

Определение 1. Система из двух наборов векторов $p_i$ , $i\in I$ , $q_j$ , $j\in J$ , пространства $\mathbb{R}^r$ , где $I$ и $J$ есть некоторые конечные множества индексов, называется позитивно-линейно независимой (ПЛН), если не существует нетривиального набора коэффициентов $\alpha_i$ , $i\in I$ , $\beta_j$ , $j\in J$ , из которых все $\alpha_i\geqslant 0$ , таких, что

$\begin{equation*} \sum_{i\in I} \alpha_i p_i + \sum_{j\in J} \beta_j q_j = 0. \end{equation*} \notag$

Нетрудно видеть, что это требование эквивалентно следующему: a) векторы $q_j$ линейно независимы; b) их линейная оболочка не пересекается с выпуклой оболочкой векторов $p_i$ . Иногда полезна двойственная формулировка условия b): существует вектор $\overline u$ такой, что все $(p_i,\overline u)<0$ и все $(q_j,\overline u) =0$ .

Таким образом, предположение о регулярности смешанных ограничений означает, что в любой точке, где они выполнены, градиенты по $u$ активных ограничений неравенства и всех ограничений равенства ПЛН¹.

Замечание 1. В негладких задачах вместо требования ПЛН системы (2.6) принимается его негладкий аналог, обеспечивающий тот факт, что любая внешняя нормаль $(\alpha,\beta)$ к множеству допустимых вариаций переменных $(x,u)$ первого порядка подчиняется оценке $|\alpha|\leqslant \mathrm{const}\,|\beta|$ . Геометрически он означает, что любая опорная гиперплоскость к графику многозначного отображения $x\mapsto U(t,x)$ , соответствующего смешанным ограничениям, не может быть близкой к вертикальной, т. е. имеет ограниченный наклон. Поэтому указанное условие регулярности так и называется: bounded slope condition, см., например, [17]–[23].

Замечание 2. Обратим внимание, что фазовые ограничения равенства $G(t,x)=0$ не допускаются – иначе линеаризация ограничений равенства задачи не будет, как правило, давать замкнутый образ, а это есть основное требование при получении условий оптимальности первого порядка во всех классах задач оптимизации (см., например, п. 9.1). Такие ограничения надо дифференцировать по $t$ и заменять на смешанные $G_t(t,x) + G_x(t,x)f(t,x,u) =0$ , рассчитывая, что их градиенты по $u$ вместе с (2.6) будут позитивно-линейно независимыми.

Замечание 3. Мы пока не допускаем традиционные ограничения типа включения $u(t)\in U$ . Если множество $U\subset \mathbb{R}^r$ задается гладкими ограничениями вида $\widetilde\varphi(u)\leqslant0$ , $\widetilde g(u)=0$ , то их надо рассматривать как смешанные ограничения в совокупности с (2.4), в противном случае приходится выходить за рамки гладких задач (и тогда предполагать, что опорный вектор к множеству $U$ вместе с градиентами смешанных ограничений по $u$ образует ПЛН систему), чего мы стараемся избегать в силу значительного технического усложнения исследования задачи. Впрочем, один довольно общий класс задач с ограничением типа включения будет кратко рассмотрен ниже, в § 7.

Итак, задача $\mathrm{A}$ поставлена. Пару функций $w(t)=(x(t), u(t))$ вместе с отрезком их определения $[t_0, t_1]$ , связанных соотношением (2.3), будем называть процессом задачи. Процесс называется допустимым, если его концы $(t_0,x(t_0),t_1,x(t_1))$ лежат в множестве $\mathcal{P}$ , существует компакт $D \subset \mathcal{Q}$ такой, что $(t,w(t))\in D$ для почти всех $t$ , и выполнены все ограничения задачи. Как обычно, будем говорить, что допустимый процесс $\widehat{w}(t)=(\widehat{x}(t), \widehat{u}(t))$ , $t\in [\,\widehat t_0, \widehat t_1]$ , доставляет сильный минимум, если существует $\varepsilon>0$ такое, что $\mathcal{J}(w) \geqslant \mathcal{J}(\widehat{w})$ для всех допустимых процессов $w(t)=(x(t), u(t))$ , $t\in [t_0, t_1]$ , удовлетворяющих условиям

$\begin{equation*} |t_0-\widehat t_0|<\varepsilon,\quad |t_1-\widehat t_0|<\varepsilon,\qquad |x(t)-\widehat x(t)|<\varepsilon \quad \text{на } [t_0,t_1]\cap[\,\widehat t_0,\widehat t_1]. \end{equation*} \notag$

Вместе с этим, введем также следующее понятие, предложенное А. Я. Дубовицким и А. А. Милютиным (см. [7], [31], [33]). Будем говорить, что процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}(t))$ , $t\in [\,\widehat t_0, \widehat t_1]$ , доставляет понтрягинский минимум в задаче $\mathrm{A}$ , если для любого числа $N$ он доставляет локальный минимум относительно нормы $\|x\|_C + \|u\|_1$ в той же задаче с дополнительным ограничением $|u(t)|\leqslant N;$ т. е. если существует $\varepsilon>0$ такое, что $\mathcal{J}(w)\geqslant \mathcal{J}(\widehat{w})$ для всех допустимых процессов $w(t)=(x(t), u(t))$ , $t\in [t_0, t_1]$ , удовлетворяющих условиям

$\begin{equation*} |t_0-\widehat t_0|< \varepsilon,\quad |t_1-\widehat t_0|< \varepsilon,\qquad \|x - \widehat{x}\|_C <\varepsilon, \qquad \|u -\widehat{u}\|_1 <\varepsilon, \quad \|u\|_\infty \leqslant N. \end{equation*} \notag$

(Здесь обе нормы берутся на общем отрезке определения соответствующих функций.)

Ясно, что понтрягинский минимум занимает промежуточное положение между слабым и сильным минимумами. В частности, он допускает как игольчатые, так и равномерно малые вариации управления.

Замечание 4. Если исследуемый процесс $(\widehat{x}(t), \widehat{u}(t))$ задан, то достаточно требовать выполнения условия регулярности смешанных ограничений лишь вдоль траектории $\widehat{x}(t)$ , т. е. достаточно того, чтобы система (2.6) была ПЛН не для всех указанных троек $(t,x,u)$ , а только для троек вида $(t,\widehat{x}(t),u)$ .

Чтобы избежать априорного вырождения “стандартных” условий оптимальности, мы будем предполагать, что концы оптимального процесса не лежат на фазовой границе; точнее, что для них выполнены строгие неравенства

$\begin{equation} \Phi(t_0, \widehat{x}(t_0))<0, \qquad \Phi(t_1, \widehat{x}(t_1))<0. \end{equation} \tag{2.7}$

Для формулировки необходимых условий оптимальности в задаче $\mathrm{A}$ нам потребуются следующие обозначения. Введем функцию Понтрягина

$\begin{equation*} H(t,x,u)=\psi_x f(t, x, u), \end{equation*} \notag$

где

$\psi_x$ есть вектор-строка размерности

$n$ (зависимость

$H$ от

$\psi_x$ иногда будем опускать), расширенную функцию Понтрягина

$\begin{equation*} \overline H(t,x,u)=\psi_x f(t, x, u) - \lambda\varphi(t,x,u) - mg(t,x,u) - \frac{d\mu}{dt}\, \Phi(t,x) \end{equation*} \notag$

и концевую функцию Лагранжа

$\begin{equation*} l(t_0,x_0,t_1,x_1)= (\alpha_0 F_0 + \alpha F + \beta K)(t_0,x_0,t_1,x_1), \end{equation*} \notag$

где

$\alpha_0$ – число,

$\alpha$ ,

$\beta$ – вектор-строки тех же размерностей, что и

$F$ ,

$K$ соответственно (зависимость

$l$ от

$\alpha_0$ ,

$\alpha$ ,

$\beta$ мы опускаем),

$\lambda$ ,

$m$ – вектор-строки размерностей

$\varphi$ ,

$g$ , а через

$d\mu/dt$ обозначена вектор-строка размерности

$\Phi$ .

Пусть $w=(x(t), u(t))$ , $t\in [t_0, t_1]$ , – допустимый процесс задачи $\mathrm{A}$ . Будем говорить, что для него выполнен принцип максимума, если существуют число $\alpha_0$ , вектор-строки $\alpha\in\mathbb{R}^{d(F)}$ , $\beta\in \mathbb{R}^{d(K)}$ , измеримые ограниченные функции $\lambda(t)$ и $m(t)$ размерностей $d(\varphi)$ и $d(g)$ соответственно, неубывающая функция $\mu(t)$ размерности $d(\Phi)$ , функции ограниченной вариации $\psi_x(t)$ , $\psi_t(t)$ размерности $n$ , $1$ соответственно (где $x$ , $t$ – индексы, а не обозначения производных) такие, что:

$\begin{equation} \begin{aligned} \, &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \lambda(t)\geqslant0\quad \text{п. в. на }[t_0,t_1]; \nonumber \\ &(\mathrm{ii})\ \alpha_0+|\alpha| + \int_{t_0}^{t_1} \lambda(t)\,dt + \int_{t_0}^{t_1} d \mu(t) >0; \nonumber \\ &(\mathrm{iii})\ \alpha F(t_0,x(t_0),t_1,x(t_1))=0,\quad \lambda(t)\varphi(t,x(t),u(t))=0\quad\text{п. в. на }[t_0,t_1], \nonumber \\ &\qquad \Phi(t,x(t))\,d \mu(t) =0\quad \text{на }[t_0,t_1]; \nonumber \\ &(\mathrm{iv}_x)\ -\dot\psi_x(t)=\overline H_x(t,x(t), u(t)); \nonumber \\ &(\mathrm{iv}_t)\ -\dot\psi_t(t)=\overline H_t(t,x(t), u(t)); \nonumber \\ &(\mathrm{v}_x)\ \psi_x(t_0)=l_{x_0}(t_0,x(t_0),t_1,x(t_1)),\quad \psi_x(t_1)= -l_{x_1}(t_0,x(t_0),t_1,x(t_1)); \nonumber \\ &(\mathrm{v}_t)\ \psi_t(t_0)= l_{t_0}(t_0,x(t_0),t_1,x(t_1)),\quad \psi_t(t_1)= -l_{t_1}(t_0,x(t_0),t_1,x(t_1)); \nonumber \\ &(\mathrm{vi})\ \overline H_u(\psi_x(t),t,x(t), u(t))=0\quad\text{для почти всех } t\in[t_0,t_1]; \nonumber \\ &(\mathrm{vii})\ H(\psi_x(t),t,x(t), u(t)) + \psi_t(t)=0\quad\text{для почти всех } t\in[t_0,t_1]; \nonumber \\ &(\mathrm{viii})\ H(\psi_x(t\,{-}\,0),t,x(t), u')\,{+}\, \psi_t(t\,{-}\,0)\,{\leqslant}\, 0, \ H(\psi_x(t\,{+}\,0),t,x(t),u') \,{+}\,\psi_t(t\,{+}\,0)\,{\leqslant}\, 0 \nonumber \\ &\qquad\ \text{для всех }t\in[t_0,t_1]\text{ и всех }u'\text{ таких, что}\end{aligned} \end{equation} \notag$

$\begin{equation} (t,x(t), u') \in \mathcal{Q}, \qquad \varphi(t,x(t), u')\leqslant0, \qquad g(t,x(t), u') =0. \end{equation} \tag{2.8}$

Множество всех

$u' \in \mathbb{R}^r$ , удовлетворяющих ограничениям (2.8), обозначим

$\mathcal{R}(t,x(t))$ .

Функции $\psi_x(t)$ и $\psi_t(t)$ называются сопряженными переменными². Можно пока не конкретизировать, с какой стороны они непрерывны, а считать, что в каждой точке $t$ эти функции имеют два значения – левое и правое; в точках непрерывности (а это все, кроме счетного множества) эти значения совпадают. Функция $\mu(t)$ порождает меру Лебега–Стилтьеса $d\mu(t)\geqslant0$ на $[t_0,t_1]$ , при этом $d\mu(t)/dt$ есть ее обобщенная плотность, а третье условие в (iii) означает, что $d\mu(t) =0$ на любом интервале, где $\Phi(t,x(t))<0$ . (Как уже говорилось, это относится к каждой компоненте вектора $\Phi$ и меры $d\mu$ .) В частности, в силу предположения (2.7) $d\mu(t) =0$ в некоторых окрестностях точек $t_0$ и $t_1$ . Отметим также, что без нарушения общности можно полагать $\mu(0)=0$ .

Условия (i)–(vi) называются условиями неотрицательности, нетривиальности, дополняющей нежесткости, сопряженными уравнениями, условиями трансверсальности и условиями стационарности по управлению соответственно. Условие (vii) можно назвать законом изменения энергии, так как из него и сопряженного уравнения $(\mathrm{iv}_t)$ для $\psi_t$ следует уравнение для функции $H$ , которая в механических задачах часто имеет смысл энергии системы:

$\begin{equation*} \dot H = \overline H_t \quad \text{или} \quad \frac{dH}{dt}= \frac{\partial \overline H}{\partial t}. \end{equation*} \notag$

(В случае, когда задача автономна, т. е. функции

$f$ ,

$g$ ,

$\varphi$ ,

$\Phi$ не зависят от

$t$ , получаем закон сохранения энергии:

$\dot H =0$ , т. е.

$H =\mathrm{const}$ .)

Условие (viii) очевидно эквивалентно тому, что $H(\psi_x(t),t,x(t), u')+ \psi_t(t)\,{\leqslant}\, 0$ во всех точках непрерывности функций $\psi_x$ и $\psi_t$ . Из него и условия (vii) вытекает условие максимума функции Понтрягина: для почти всех $t\in[t_0,t_1]$

$\begin{equation} \max_{u' \in \mathcal{R}(t,x(t))} H(\psi_x(t),t,x(t), u') = H(\psi_x(t),t,x(t), u(t)), \end{equation} \tag{2.9}$

благодаря которому вся совокупность условий (i)–(viii) и называется принципом максимума. Обратим внимание, что максимум здесь берется по

$u'$ из вышеуказанного множества

$\mathcal{R}(t,x(t))$ . При отсутствии фазовых и смешанных ограничений (2.4), (2.5) множество

$\mathcal{R}(t,x(t))= \{ u'\mid (t,x(t),u') \in \mathcal{Q}\}$ , множители

$\lambda(t)=0$ ,

$m(t)=0$ ,

$d\mu(t) = 0$ , и мы получаем принцип максимума Понтрягина для общей задачи Лагранжа классического вариационного исчисления (2.1)–(2.3), т. е. условие Вейерштрасса.

Отметим, что функция $\overline H$ участвует в тех условиях, где происходит дифференцирование по одной из переменных $t,x,u$ , тогда как функция $H$ нигде в условиях (i)–(viii) и (2.9) не дифференцируется.

Сопряженные уравнения $(\mathrm{iv}_x)$ – $(\mathrm{iv}_t)$ следует понимать как равенства мер на отрезке $[t_0,t_1]$ :

$\begin{equation*} \begin{aligned} \, d\psi_x(t) &= \bigl(-H_x(\psi_x(t),t,x(t), u(t)) \\ &\qquad +\lambda(t)\varphi_x(t,x(t), u(t)) + m(t)g_x(t,x(t), u(t))\bigr)\,d t + d \mu(t)\,\Phi_{x}(t,x(t)), \\ d\psi_t(t) &= \bigl(-H_t(\psi_x(t),t,x(t), u(t)) \\ &\qquad +\lambda(t)\varphi_t(t,x(t), u(t)) + m(t)g_t(t,x(t), u(t))\bigr)\,d t + d \mu(t)\,\Phi_{t}(t,x(t)), \end{aligned} \end{equation*} \notag$

Можно также записать эти равенства в интегральной форме, например:

$\begin{equation*} \psi_x(t+0) =\psi_x(t_0) + \int_{t_0}^t (- H_x + \lambda \varphi_x + mg_x)\,ds +\int_{t_0}^{t+0}\Phi_{x}(s,x(s))\,d\mu(s), \end{equation*} \notag$

и аналогично для

$\psi_x(t-0)$ и

$\psi_t(t \pm 0)$ .

Принцип максимума принято трактовать как необходимое условие сильного минимума. Однако верно и следующее, более сильное утверждение. Оно принадлежит А. Я. Дубовицкому и А. А. Милютину (см., например, [6], [11], [30]).

Теорема 1. Если процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}(t))$ , $t\in [\,\widehat t_0, \widehat t_1]$ , доставляет понтрягинский минимум в задаче $\mathrm{A}$ , то для него выполнен принцип максимума (i)–(viii).

Как было сказано во введении, мы дадим здесь новое, сравнительно простое доказательство этой теоремы. Его удобно провести сначала не для общей задачи $\mathrm{A}$ , а для ее частного случая, в котором зависимость от времени отсутствует.

§ 3. Автономная задача $\mathrm{B}$

Рассмотрим следующую задачу $\mathrm{B}$ на нефиксированном отрезке $[t_0,t_1]$ (автономный вариант задачи $\mathrm{A}$ ):

$\begin{equation} J:= F_0(x(t_0),x(t_1)) \to \min, \end{equation} \tag{3.1}$

$\begin{equation} F(x(t_0),x(t_1))\leqslant0, \qquad K(x(t_0),x(t_1))=0, \end{equation} \tag{3.2}$

$\begin{equation} \dot x(t)= f(x(t),u(t)), \end{equation} \tag{3.3}$

$\begin{equation} \varphi(x(t),u(t)) \leqslant 0,\qquad g(x(t),u(t))=0, \end{equation} \tag{3.4}$

$\begin{equation} \Phi(x(t))\leqslant0. \end{equation} \tag{3.5}$

Для нее из сопряженного уравнения $(\mathrm{iv}_t)$ следует, что $\psi_t = \mathrm{const}$ , и тогда из условий трансверсальности $(\mathrm v_t)$ получаем $\psi_t \equiv 0$ , поэтому вместо $\psi_x$ будем писать просто $\psi$ . Таким образом, условия (vii) и (viii) для задачи $\mathrm{B}$ запишутся соответственно в виде

$\begin{equation} \psi(t) f(x(t), u(t)) =0 \quad \text{почти всюду},\qquad \psi(t\pm 0) f(x(t), u') \leqslant 0 \quad \forall\, t, \end{equation} \tag{3.6}$

где

$u' \in \mathcal{R}(x(t))$ . В остальном формулировка ПМ остается без изменений.

Хотя задача $\mathrm{B}$ и является частным случаем задачи $\mathrm{A}$ , любую задачу типа $\mathrm{A}$ можно привести к виду $\mathrm{B}$ . Это достигается с помощью следующего простого приема. К управляемой системе $\dot{x}=f(t,x,u)$ добавим уравнение $dt/d\tau=1$ , считая, что $\tau$ – новое время, пробегающее некоторый отрезок $[\tau_0,\tau_1]$ , а исходное время $t=t(\tau)$ – новая фазовая переменная. Функции $x(\,{\cdot}\,)$ и $u(\,{\cdot}\,)$ также считаем теперь зависящими от нового времени: $x=x(\tau)$ , $u=u(\tau)$ . В результате приходим к следующей задаче $\mathrm{A}'$ :

$\begin{equation*} \begin{gathered} \, J= F_0(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1))\to \min, \\ F(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1)) \leqslant 0, \qquad K(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1))=0, \end{gathered} \end{equation*} \notag$

$\begin{equation} \frac{dx}{d\tau}= f(t(\tau),x(\tau),u(\tau)), \qquad \frac{dt}{d\tau}=1, \end{equation} \tag{3.7}$

$\begin{equation} \varphi(t(\tau),x(\tau),u(\tau) \leqslant0, \qquad g(t(\tau),x(\tau),u(\tau) =0, \end{equation} \tag{3.8}$

$\begin{equation} \Phi(t(\tau),x(\tau))\leqslant 0, \end{equation} \tag{3.9}$

где

$t(\tau)$ ,

$x(\tau)$ – фазовые переменные,

$u(\tau)$ – управление,

$\tau\in [\tau_0,\tau_1]$ – нефиксированный отрезок. Ясно, что задача

$\mathrm{A}'$ имеет тип

$\mathrm{B}$ .

Поскольку задача $\mathrm{A}'$ инвариантна относительно сдвига по времени $\tau$ , в ней можно зафиксировать начальный момент $\tau_0$ , и тогда, как нетрудно видеть, и допустимые, и оптимальные процессы задач $\mathrm{A}$ и $\mathrm{A}'$ будут находиться во взаимно однозначном соответствии. Поэтому, получив необходимые условия оптимальности в задаче $\mathrm{B}$ , можно применить их к задаче $\mathrm{A}'$ и тем самым получить необходимые условия в задаче $\mathrm{A}$ . Сопряженная переменная в задаче $\mathrm{A}'$ есть пара $(\psi_x, \psi_t)$ , функция Понтрягина для системы (3.7) будет $\widetilde H = \psi_x f + \psi_t$ , “автономные” условия (3.6) $\widetilde H(x,u) =0$ и $\widetilde H(x,u') \leqslant 0$ примут вид $\psi_x f(x,u) + \psi_t =0$ и $\psi_x f(x,u') + \psi_t \leqslant 0$ , т. е. в точности условия (vii) и (viii) теоремы 1. Детали этих преобразований мы оставляем читателю.

Перейдем к доказательству теоремы 1 для задачи $\mathrm{B}$ . Для этого мы опять превратим время в фазовую переменную, но теперь положим $dt/d\tau= v(\tau)$ , где функция $v(\tau)$ будет лишь неотрицательная, но не всюду положительная, и следовательно, $t=t(\tau)$ – монотонно неубывающая, но не строго возрастающая функция. Такая необратимая замена, превращающая время $t$ в фазовую переменную, была предложена А. Я. Дубовицким и использовалась в его совместных работах с А. А. Милютиным [5], [11], и затем в работах А. А. Милютина [6], [30] (см. также [32]); она была названа ими $v$ -заменой. Нетривиальный момент здесь в том, что малые вариации нового управления $v(\tau)$ будут приводить к вариациям типа игольчатых для исходного управления $u(t)$ . Простейший вариант такой $v$ -замены – с кусочно постоянными $v(\tau)$ – мы сейчас и рассмотрим.

Поскольку задача $\mathrm{B}$ инвариантна относительно сдвига по времени, начальный момент мы для определенности зафиксируем: $t_0= \widehat t_0$ .

Наряду с множеством $\mathcal{R}(x) = \{u \mid (x,u)\in \mathcal{Q},\, \varphi(x,u)\leqslant0, \, g(x,u)=0\}$ введем его подмножество $\mathcal{R}_0(x) = \{u\mid (x,u)\in \mathcal{Q},\, \varphi(x,u)<0, \, g(x,u)=0\}$ . Отметим сразу, что при нашем предположении о регулярности смешанных ограничений любая точка из $\mathcal{R}(x)$ есть предел точек из $\mathcal{R}_0(x)$ .

Лемма 1 (о плотности). Множество $\mathcal{R}_0(x)$ всюду плотно в $\mathcal{R}(x)$ .

Доказательство. Возьмем любую пару

$(x,u)$ , в которой

$u \in \mathcal{R}(x)$ . Пусть

$I$ есть множество активных неравенств для нее. В силу предположения о позитивно-линейной независимости градиентов

$\varphi_u(x,u)$ ,

$g_u(x,u)$ найдется вектор

$\overline u$ такой, что

$\varphi_u(x,u)\overline u<0$ и

$g_u(x,u)\overline u=0$ . Последнее равенство означает, что

$\overline u$ – касательный к поверхности

$M(x) = \{u'\mid g(x,u')=0\}$ в точке

$u$ , т. е. существует семейство поправок

$u_\varepsilon = o(\varepsilon)$ при

$\varepsilon\to0+$ такое, что

$u'_\varepsilon = u+ \varepsilon\overline u + u_\varepsilon \in M(x)$ , т. е.

$g(x, u'_\varepsilon)=0$ . При этом

$\varphi(x, u'_\varepsilon) = \varphi(x,u) + \varphi_u(x,u)\,\varepsilon\overline u + o(\varepsilon) <0$ . Таким образом, точки

$u'_\varepsilon \in \mathcal{R}_0(x)$ и сходятся к

$u$ , что и требовалось доказать.

$\Box$

3.1. Индекс $\theta$

Пусть $\widehat w= (\widehat{x}(t),\widehat{u}(t))$ , $t\in [\,\widehat t_0,\widehat t_1]$ , – оптимальный процесс задачи $\mathrm{B}$ . Мы свяжем с ним семейство задач $\mathrm{B}^\theta$ , которые построим ниже, и их оптимальных решений, занумерованных некоторым индексом $\theta$ .

Под индексом будем понимать набор значений времени и управления

$\begin{equation*} \theta= \{(t^1,u^1),\dots,(t^{d},u^{d})\}, \end{equation*} \notag$

где

$d$ – произвольное натуральное число,

$\widehat t_0 < t^1\leqslant \dots \leqslant t^{d} < \widehat t_1$ , а значение

$u^s\in \mathcal{R}_0(\widehat{x}(t^s))$ при каждом

$s =1,\dots, d$ – любое. Длина индекса

$d = d(\theta)$ своя для каждого

$\theta$ .

Определим отрезок $[\tau_0,\tau_1]$ следующим образом: берем отрезок $[\,\widehat t_0,\widehat t_1]$ , и в точках $t^1,\dots,t^{d(\theta)}$ последовательно вставляем отрезки единичной длины, сохраняя всякий раз положение точки $\widehat t_0$ . В результате получаем отрезок $[\tau_0,\tau_1]$ с концами $\tau_0=\widehat t_0$ , $\tau_1=\widehat t_1+ d(\theta)$ , а вставленные отрезки будут иметь вид

$\begin{equation*} \Delta^1=[t^1,\,t^1+1], \ \Delta^2=[t^2+1,\,t^2+2], \ \dots,\ \Delta^{d(\theta)} =[t^{d(\theta)}+(d(\theta)-1),\,t^{d(\theta)}+ d(\theta)]. \end{equation*} \notag$

Положим

$\begin{equation*} E_0= \bigcup_{1}^{d(\theta)}\Delta^s,\qquad E_+ = [\tau_0,\tau_1]\setminus E_0. \end{equation*} \notag$

Определим функции

$\begin{equation} v^\theta(\tau)= \begin{cases} 0, &\tau\in E_0, \\ 1, &\tau\in E_+, \end{cases} \qquad t^\theta(\tau)= \widehat t_0 + \int_{\tau_0}^\tau v^\theta(a)\,da, \quad \tau\in[\tau_0,\tau_1]. \end{equation} \tag{3.10}$

Тогда

$\begin{equation*} \frac{dt^\theta(\tau)}{d\tau}=v^\theta(\tau),\qquad t^\theta(\tau_0)=\widehat t_0, \quad t^\theta(\tau_1)=\widehat t_1. \end{equation*} \notag$

Таким образом,

$t^\theta(\tau)$ – кусочно линейная неубывающая функция, отображающая

$[\tau_0,\tau_1]$ на

$[\,\widehat t_0,\widehat t_1]$ , причем

$\Delta^s$ – ее отрезки постоянства и

$t^\theta(\Delta^s)=t^s$ ,

$s =1,\dots, d(\theta)$ .

Положим

$\begin{equation} u^\theta(\tau)=\begin{cases} \widehat u(t^\theta(\tau)), &\tau\in E_+, \\ u^s, &\tau\in \Delta^s, \ s =1,\dots, d(\theta), \end{cases} \qquad x^\theta(\tau)=\widehat{x}(t^\theta(\tau)). \end{equation} \tag{3.11}$

Тогда

$u^\theta(\tau)$ – ограниченная измеримая, а

$x^\theta(\tau)$ – абсолютно непрерывная функция; при этом

$\begin{equation*} \frac{dx^\theta(\tau)}{d\tau} = v^\theta(\tau)\, f(x^\theta(\tau),u^\theta(\tau)), \qquad x^\theta(\tau_0) = \widehat{x}(\widehat t_0), \quad x^\theta(\tau_1) = \widehat{x}(\widehat t_1), \end{equation*} \notag$

т. е. концы новой траектории

$x^\theta(\tau)$ совпадают с концами исходной

$\widehat{x}(t)$ . Кроме того,

$x^\theta(\tau) = \widehat{x}(t^s)$ на каждом вставленном отрезке

$\Delta^s$ , построенная пара удовлетворяет смешанным ограничениям (3.4) на всем отрезке

$[\tau_0,\tau_1]$ , т. е.

$\begin{equation} \begin{gathered} \, \varphi_i(x^\theta(\tau),u^\theta(\tau)) \leqslant 0, \qquad i=1,\dots,d(\varphi), \\ g_j(x^\theta(\tau),u^\theta(\tau)) =0, \qquad j=1,\dots,d(g), \end{gathered} \end{equation} \tag{3.12}$

причем на каждом

$\Delta^s$ неравенства строгие.

Обратим внимание, что некоторые точки $t^s$ могут совпадать: $t^{s'} = \dots = t^{s''} = t_*$ , поэтому в такой точке $t_*$ вставляется подряд несколько единичных отрезков, на каждом из которых задаются $v^\theta(\tau)=0$ и свое значение $u^\theta(\tau)= u^s$ .

Множество $E_0$ состоит из конечного числа отрезков $\Delta^s$ , $s =1,\dots, d(\theta)$ . Множество $E_+$ – из конечного числа интервалов или полуинтервалов. Все указанные отрезки, интервалы и полуинтервалы множеств $E_0$ и $E_+$ объединим в общий набор, упорядочим его и обозначим составляющие этого набора через $\sigma_k$ , $k=1,\dots,m$ . Итак, $[\tau_0,\tau_1]= \sigma_1 \cup \dots \cup \sigma_m$ , причем различные $\sigma_k$ не перекрываются. Обозначим через $\chi_k(\tau)$ характеристическую функцию множества $\sigma_k$ , $k=1,\dots,m$ .

3.2. Управляемая система индекса $\theta$

Нам потребуется следующий простой факт.

Лемма 2. Пусть точка $(x^*,u^*)\in\mathbb{R}^{n+r}$ удовлетворяет условиям

$\begin{equation*} \varphi(x^*,u^*) <0, \qquad g(x^*,u^*) =0. \end{equation*} \notag$

Тогда найдется окрестность $\mathcal{O}(x^*)$ точки $x^*$ и гладкая функция $\mathcal{U}\colon \mathcal{O}(x^*)\,{\to}\, \mathbb{R}^r$ такие, что

$\begin{equation*} \varphi(x,\mathcal{U}(x)) <0, \quad g(x,\mathcal{U}(x)) =0 \quad \forall\, x\in \mathcal{O}(x^*), \end{equation*} \notag$

и при этом

$\mathcal{U}(x^*) = u^*$ .

Доказательство. Напомним, что в силу предположения о регулярности смешанных ограничений ранг матрицы

$g'_u(x^*,u^*)$ есть

$d(g)$ . Поэтому компоненты вектора

$u$ можно разбить на две группы:

$u =(u_1,u_2)$ , так что

$\dim u_2= d(g)$ и матрица

$g'_{u_2}(x^*,u^*_1, u^*_2)$ невырождена. Тогда по теореме о неявной функции найдется окрестность

$\mathcal{O}(x^*,u^*_1)$ , в которой равенство

$g(x, u_1, u_2)=0$ разрешается в виде гладкой функции

$u_2 = G(x, u_1)$ , т. е. выполнено равенство

$g(x, u_1, G(x, u_1))=0$ , причем

$G(x^*, u_1^*) = u_2^*$ .

Замораживая здесь $u_1 =u_1^*$ , получаем гладкую функцию $u_2 = \widetilde G(x) = G(x, u_1^*)$ на открытом множестве $\mathcal{O}(x^*) = \{x\mid (x,u_1^*) \in \mathcal{O}(x^*,u^*_1)\}$ . Сужая его, если необходимо, получаем также выполнение неравенства $\varphi(x,u_1^*,\widetilde G(x)) <0$ . Остается положить $\mathcal{U}(x) = (u_1^*,\widetilde G(x))$ . $\Box$

Зададим теперь некоторый индекс $\theta$ . Для каждого $s =1,\dots, d(\theta)$ пусть $\mathcal{U}^s(x)$ есть функция из леммы 2, соответствующая точке $(\widehat{x}(t^s),u^s)$ , определенная в некоторой окрестности точки $\widehat{x}(t^s)$ . Отметим, что $\mathcal{U}^s(\widehat{x}(t^s)) = u^s$ .

Для данного индекса $\theta$ зафиксируем соответствующий ему отрезок $[\tau_0,\tau_1]$ . Рассмотрим пространство $\mathbb{R}^{m+n}$ с переменными $z=(z_1,\dots,z_m)$ , $x_0= x(\tau_0)$ . Обобщая (3.10), введем кусочно постоянную функцию

$\begin{equation} v(\tau)= \sum_{k=1}^m z_k\chi_k(\tau), \qquad \tau\in [\tau_0,\tau_1] \end{equation} \tag{3.13}$

(т. е.

$z_k$ есть ее значение на участке

$\sigma_k$ ), и рассмотрим управляемую систему

$\begin{equation} \frac{dx}{d\tau}= v(\tau) \begin{cases} f(x(\tau),u(\tau)), &\tau\in E_+, \\ f(x(\tau),\,\mathcal{U}^s(x(\tau))), &\tau\in \Delta^s \subset E_0, \end{cases} \qquad x(\tau_0)=x_0. \end{equation} \tag{3.14}$

Здесь управление

$u \in L^r_\infty(E_+)$ , т. е.

$u(\tau)$ есть произвольная измеримая ограниченная функция на

$E_+$ , а на каждом

$\Delta^s\subset E_0$ мы полагаем

$u(\tau) = \mathcal{U}^s(x(\tau))$ , т. е. фактически управление там отсутствует. Отметим, что

$\mathcal{U}^s(x^\theta(\tau)) = u^\theta(\tau) = u^s$ на каждом

$\Delta^s$ .

Введем функцию

$\begin{equation*} \mathcal{F}(\tau,x,u)= \begin{cases} f(x,u), &\tau\in E_+, \\ f(x,\mathcal{U}^s(x)), &\tau\in \Delta^s \subset E_0. \end{cases} \end{equation*} \notag$

Заметим, что она гладким образом зависит от пары

$(x,u)\in \mathbb{R}^n \times \mathbb{R}^r;$ разрывность

$\mathcal{F}$ по

$\tau$ здесь не играет роли. При этом система (3.14) имеет вид

$\begin{equation} \frac{dx}{d\tau}= v(\tau)\mathcal{F}(\tau,x(\tau),u(\tau)),\qquad x(\tau_0)=x_0, \end{equation} \tag{3.15}$

а с учетом (3.13) она фактически такова:

$\begin{equation} \frac{dx}{d\tau}= \sum_{k=1}^m z_k\chi_k(\tau)\mathcal{F}(\tau,x(\tau),u(\tau)), \qquad x(\tau_0)=x_0. \end{equation} \tag{3.16}$

Пусть $z^\theta_k$ – значение $v^\theta(\tau)$ на $\sigma_k$ , $k=1,\dots,m$ , т. е. $v^\theta(\tau)=\sum z^\theta_k\chi_k(\tau)$ . Напомним, что $z^\theta_k=0$ , если $\sigma_k\subset E_0$ , и $z^\theta_k =1$ , если $\sigma_k\subset E_+$ . Положим $z^\theta =(z^\theta_1,\dots, z^\theta_m)$ , $x^\theta_0= x^\theta(\tau_0)= \widehat{x}(\widehat t_0)$ ; управление $u^\theta(\tau)$ введено выше. Нетрудно убедиться, что тройка $(u^\theta,z^\theta,x^\theta_0)$ удовлетворяет системе (3.16). Назовем ее базовой точкой задачи $\mathrm{B}^{\theta}$ (которую построим чуть ниже), соответствующей процессу $\widehat{w}(t)= (\widehat{x}(t),\widehat{u}(t))$ исходной задачи $\mathrm{B}$ .

Нетрудно видеть, что для любой тройки $(u,z,x_0)\in L_\infty^r(E_+) \times \mathbb{R}^m \times \mathbb{R}^n$ , достаточно близкой к $(u^\theta,z^\theta,x^\theta_0)$ , задача Коши (3.16) имеет единственное решение $x(\tau)$ на том же отрезке $[\tau_0,\tau_1]$ . При этом пара $(x(\tau),u(\tau))$ порождается единственным решением $(x'(t),u'(t))$ исходной системы (3.3), определенным на отрезке $[\,\widehat t_0,\, t_1 = t(\tau_1)]$ , т. е.

$\begin{equation} x(\tau)= x'(t(\tau)), \qquad u(\tau)= u'(t(\tau)), \end{equation} \tag{3.17}$

где

$t(\tau)$ определяется уравнением

$dt/d\tau = v(\tau),$

$t(\tau_0)= \tau_0$ . Более того, если тройка

$(u,z,x_0)$ стремится к базовой тройке

$(u^\theta,z^\theta,x^\theta_0)$ , то

$t(\tau_1)$ стремится к

$\widehat t_1$ , пара

$(x'(t),u'(t))$ стремится к оптимальной паре

$(\widehat{x}(t),\widehat{u}(t))$ задачи

$\mathrm{B}$ по норме пространства

$C\times L_1$ (оцениваемой каждый раз на общем отрезке их определения), и при этом

$\|u'\|_\infty \leqslant \mathrm{const}$ (где константа зависит от

$\theta)$ .

Действительно, при переходе от нового времени $\tau$ к исходному времени $t$ все отрезки из $E_+$ перейдут в отрезки, получающиеся из исходных отрезков $[t^s, t^{s+1}]$ малыми сдвигами и растяжениями (сжатиями), поэтому фазовая переменная $x'(t)$ на них будет равномерно близкой к оптимальной $\widehat{x}(t)$ , а управление $u'(t)$ интегрально близким к $\widehat{u}(t)$ . Каждый отрезок $\Delta \subset E_0$ оси $\tau$ перейдет в маленький отрезок оси $t$ , поэтому $x'(t)$ будет равномерно близким к $\widehat{x}(t)$ на нем, и интеграл от $|u'(t)|$ будет малым. Подробное доказательство этих фактов сводится к рутинной проверке соответствующих оценок, мы его опускаем. (Оценки такого типа приведены в [34].)

Замечание 5. Обратим внимание, что при базовом $z^\theta$ , т. е. при $v= v^\theta$ , каждый отрезок $\Delta^s \subset E_0$ при отображении $\tau \mapsto t(\tau)$ схлопывается и переходит в точку $t^s$ , так что выбранные нами значения $u^\theta(\tau) =u^s$ на $\Delta^s$ не проявляются в исходном времени $t$ и поэтому, казалось бы, не играют никакой роли. Но если $z$ немного отклоняется от базового, то соответствующее $z_s >0$ , и отрезок $\Delta^s \subset E_0$ оси $\tau$ переходит уже в маленький отрезок длины $z_s$ на оси $t$ , на котором значение $u'(t) = \mathcal{U}^s(x(\tau(t)))$ близко к $u^s$ . Тем самым в исходном времени возникает фактически игольчатая вариация управления! От “стандартной” игольчатой вариации эта вариация отличается главным образом тем, что мы не заменяем управление $\widehat{u}(t)$ на малом отрезке около точки $t^s$ , а расшиваем эту точку, вставляя в это место малый отрезок с профилем $u'(t) = \mathcal{U}^s(x(\tau(t)))$ . Поскольку точек $t^s$ несколько, в итоге получаем пакет таких обобщенных игольчатых вариаций. Использовать стандартные игольчатые вариации, подобно тому как это делалось, например, в [25], [26] (для задач без фазовых и смешанных ограничений), здесь не представляется возможным, так как ограничение $\Phi(x(t))\leqslant 0$ не будет дифференцируемо по ширине иголки, ибо уже производная траектории $x(t)$ по ширине иголки будет разрывной функцией.

Как уже отмечалось во введении, преимущество таких “вставных” иголок по сравнению с обычными состоит также в том, что они обеспечивают гладкую зависимость всех ограничений задачи от ширины иголки при любом измеримом управлении, тогда как при использовании обычных иголок для этого надо предполагать кусочную непрерывность оптимального управления $\widehat{u}(t)$ .

Поскольку правая часть в (3.15), (3.16) есть гладкая функция от $(u,z,x)\in\mathbb{R}^{r+m+n}$ , то для каждой тройки $(u,z,x_0)\in L_\infty^r(E_+) \times \mathbb{R}^m \times \mathbb{R}^n$ , достаточно близкой к $(u^\theta,z^\theta,x^\theta_0)$ , решение $x(\tau)$ задачи Коши (3.16) существует и гладким образом зависит от этой тройки³. Таким образом, имеется оператор

$\begin{equation*} P\colon L^r_\infty(E_+)\times \mathbb{R}^m \times \mathbb{R}^n\to C^n[\tau_0, \tau_1], \qquad (u,z,x_0) \mapsto x(\tau), \end{equation*} \notag$

дифференцируемый по Фреше в окрестности точки

$(u^\theta,z^\theta,x^\theta_0)$ , производная которого непрерывна в этой точке. Производная в самой этой точке есть линейное отображение

$P'(u,z,x_0)\colon (\overline u,\overline{z},\overline x_0) \mapsto \overline x(\tau)$ , где функция

$\overline x(\tau)$ есть решение задачи Коши с начальным значением

$\overline{x}(\tau_0) =\overline{x}_0$ для уравнения в вариациях

$\begin{equation} \frac{d\overline{x}}{d\tau} = \sum_k \bigl( z^\theta \chi_k \mathcal{F}_x(\tau,x^\theta, u^\theta)\overline{x} + z^\theta \chi_k \mathcal{F}_u(\tau,x^\theta, u^\theta) \overline u + \overline{z}_k\chi_k \mathcal{F}(\tau,x^\theta, u^\theta) \bigr), \end{equation} \tag{3.18}$

или в другой форме:

$\begin{equation} \frac{d\overline{x}}{d\tau} = v^\theta \bigl(f_x(x^\theta, u^\theta)\overline{x} + f_u(x^\theta, u^\theta) \overline u\bigr) + \overline v f(x^\theta, u^\theta), \end{equation} \tag{3.19}$

где согласно (3.13)

$\overline v(\tau)= \sum_{k=1}^m \overline{z}_k\chi_k(\tau)$ .

Здесь мы учли, что $\mathcal{U}^s(x^\theta(\tau)) = u^\theta(\tau)$ там, где $v^\theta =0$ , т. е. на $E_0$ , и что $\mathcal{F}(\tau,x^\theta, u^\theta) = f(x^\theta, u^\theta)$ на всем $[\tau_0,\tau_1]$ . Производные $\mathcal{F}_x,\, \mathcal{F}_u$ совпадают с $f_x$ , $f_u$ на $E_+$ , а на $E_0$ их значение не играет роли, важно лишь их существование. (Впрочем, уравнение (3.19) вытекает и непосредственно из (3.15).)

3.3. Задача $\mathrm{B}^{\theta}$ индекса $\theta$

Для заданного индекса $\theta$ рассмотрим следующую задачу $\mathrm{B}^{\theta}$ в пространстве $L^r_\infty(E_+)\times \mathbb{R}^m \times \mathbb{R}^n$ с элементами $(u,z,x_0)$ :

$\begin{equation} F_0(x_0,x(\tau_1))\to \min, \end{equation} \tag{3.20}$

$\begin{equation} F(x_0,x(\tau_1))\leqslant 0,\qquad K(x_0,x(\tau_1))=0, \qquad -z \leqslant 0, \end{equation} \tag{3.21}$

$\begin{equation} \Phi(x(\tau))\leqslant 0 \quad \text{на } [\tau_0,\tau_1], \end{equation} \tag{3.22}$

$\begin{equation} \varphi(x(\tau),u(\tau)) \leqslant 0,\qquad g(x(\tau),u(\tau)) = 0 \quad \text{на }E_+, \end{equation} \tag{3.23}$

где

$x(\tau) = P(u,z,x_0)(\tau)$ выражается через

$(u,z,x_0)$ в силу управляемой системы (3.16). Назовем ее присоединенной задачей, соответствующей процессу

$\widehat{w}(t)= (\widehat{x}(t),\widehat{u}(t))$ исходной задачи

$\mathrm{B}$ и индексу

$\theta$ .

Замечание 6. Управление $u(\tau)$ на отрезках из $E_0$ не варьируется, а задается конкретными функциями от $x$ , тогда как его варьирование на множестве $E_+$ будет нужно для получения условия стационарности по управлению $\overline H_u=0$ . В задаче без смешанных ограничений этого условия нет, поэтому можно не варьировать управление на $E_+$ , обходясь только обобщенными иголками, так что задача $\mathrm{B}^{\theta}$ будет конечномерной [27], [28]. При наличии смешанных ограничений одних обобщенных иголок недостаточно.

Установим связь между оптимальностью базовых точек задач $\mathrm{B}$ и $\mathrm{B}^\theta$ .

Лемма 3. Если процесс $\widehat{w}= (\widehat{x}(t), \widehat{u}(t))$ доставляет понтрягинский минимум в задаче $\mathrm{B}$ , то тройка $\zeta^\theta =(u^\theta,z^\theta,x^\theta_0)$ доставляет локальный минимум в присоединенной задаче $\mathrm{B}^{\theta}$ , т. е. минимум относительно нормы $\|u\|_\infty +|z| +|x_0|$ (слабый минимум).

Доказательство. Допустим, тройка

$\zeta^\theta$ не есть точка локального минимума задачи

$\mathrm{B}^{\theta}$ . Это означает, что существует последовательность допустимых троек

$\zeta = (u,z,x_0)$ задачи

$\mathrm{B}^{\theta}$ такая, что

$\zeta \to \zeta^\theta$ , на которой

$F_0(\zeta) < F_0(\zeta^\theta)$ . Переходя от времени

$\tau$ к исходному времени

$t$ , построим, как указано выше, последовательность процессов

$w' = (x'(t), u'(t))$ , удовлетворяющих равенствам (3.17) и системе (3.3). Для этих процессов в силу (3.23) смешанные ограничения задачи

$\mathrm{B}$ будут выполнены на образе множества

$E_+$ . На отрезках оси

$\tau$ из

$E_0$ эти ограничения выполнены по построению, причем неравенства здесь строгие. При переходе к

$t$ каждый отрезок из

$E_0$ перейдет в маленький отрезок, на котором смешанные ограничения также будут выполнены (даже строго). Выполнение фазовых ограничений для процесса

$w'$ сохранится в силу (3.22).

Так как каждая траектория $x'(t)$ имеет те же концы, что и $x(\tau)$ , то построенные процессы $w'$ допустимы в задаче $\mathrm{B}$ и имеют значения $F_0(w') = F_0(\zeta) < F_0(\zeta^\theta) = F_0(\widehat{w})$ . Наконец, поскольку $\zeta \to \zeta^\theta$ , то, как показано выше, $\|x' -\widehat{x}\|_C \to 0$ , $\|u' -\widehat{u}\|_1 \to 0$ и $\|u\|_\infty \leqslant \mathrm{const}$ , что противоречит наличию понтрягинского минимума в точке $\widehat{w}$ задачи $\mathrm{B}$ . $\Box$

Выпишем теперь необходимые условия локального минимума для задачи $\mathrm{B}^{\theta}$ . Обратим внимание, что хотя все “установочные” функции этой задачи гладкие, она все-таки не является стандартной гладкой задачей, ибо в ней имеется континуальное число ограничений неравенства (3.22), (3.23). Это есть задача так называемой “полубесконечной” оптимизации. Тем не менее, необходимые условия локального минимума для таких задач известны – это общее правило множителей (или принцип) Лагранжа (см. п. 9.1). В данном случае они состоят в следующем.

Теорема 2. Пусть тройка $(u^\theta, z^\theta, x^\theta_0)$ доставляет локальный минимум в задаче $\mathrm{B}^{\theta}$ . Тогда найдется число $\alpha_0$ , векторы-строки $\alpha\in\mathbb{R}^{d(F)}$ , $\beta\in \mathbb{R}^{d(K)}$ , $\gamma \in\mathbb{R}^{m+n}$ , элементы $\lambda \in L_\infty^{d(\varphi)*}(E_+)$ , $m \in L_\infty^{d(g)*}(E_+)$ и вектор-функция $\mu(\tau)$ размерности $d(\Phi)$ на $[\tau_0,\tau_1]$ с неубывающими компонентами и условием $\mu(\tau_0)=0$ такие, что

$\begin{equation*} \begin{aligned} \, &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \gamma\geqslant 0,\quad \lambda\geqslant 0, \\ &(\mathrm{ii})\ \alpha_0+ |\alpha|+ |\beta|+ |\gamma|+ \|\lambda\|+ \|m\|+ \mu(\tau_1)> 0, \\ &(\mathrm{iii})\ \alpha F(\widehat{x}_0, \widehat{x}_1)=0,\quad \gamma z^\theta =0,\quad \langle \lambda,\varphi(x^\theta,u^\theta) \rangle =0,\quad \Phi(x^\theta(\tau))\,d \mu(\tau) =0, \end{aligned} \end{equation*} \notag$

и при этом функция Лагранжа задачи $\mathrm{B}^{\theta}$

$\begin{equation*} L(u,z,x_0) = (\alpha_0 F_0+\alpha F+\beta K) -\gamma z + \langle \lambda,\varphi(x,u)\rangle +\langle m, g(x,u)\rangle + \int_{\tau_0}^{\tau_1}\Phi(x)\,d \mu \end{equation*} \notag$

стационарна в точке

$(u^\theta, z^\theta, x^\theta_0)$ :

$\begin{equation} L'(u^\theta, z^\theta, x^\theta_0) = 0. \end{equation} \tag{3.24}$

Здесь $\lambda$ и $m$ – линейные непрерывные функционалы на пространствах $L_\infty(E_+)$ соответствующих размерностей; через $\langle \lambda,\overline\varphi \rangle$ и $\langle m,\overline g \rangle$ мы обозначаем результаты их действия на произвольные элементы $\overline\varphi$ и $\overline g$ этих пространств.

Наша ближайшая цель – расшифровать выписанные условия.

Остановимся чуть подробнее на условии $\langle \lambda,\varphi(w^\theta) \rangle = \sum_i\langle \lambda_i,\varphi_i(w^\theta) \rangle =0$ . Оно означает, что для каждого $i$ функционал $\lambda_i \in L^*_\infty(E_+)$ есть опорный элемент (внешняя нормаль) к конусу $\Omega$ неположительных функций пространства $L_\infty(E_+)$ в точке $\varphi_i(w^\theta)\in \Omega$ . Введем для каждого $\delta>0$ множество $M_i^\delta = \{ \tau\in E_+\mid \varphi_i(w^\theta) \geqslant -\delta\}$ , возможно пустое. Тогда каждый $\lambda_i$ характеризуется следующими свойствами (см. [7; § 3.5]): a) $\lambda_i\geqslant0$ ; b) $\lambda_i$ сосредоточен на множестве $M_i^\delta$ при любом $\delta>0$ ; c) $\|\lambda_i\| := \langle \lambda_i, \mathbf{1}\rangle =1$ . (Здесь $\mathbf{1}$ есть функция, тождественно равная $1$ .) Ниже мы покажем, что каждый $\lambda_i$ есть “обычная” функция из $L_1(E_+)$ , и даже из $L_\infty(E_+)$ , и, значит, сосредоточен на множестве $M_i^0 \,{=}\, \{ \tau\,{\in}\, E_+ \,{\mid}\, \varphi_i(w^\theta) \,{=}\,0\}$ , т. е. почти всюду на $E_+$ выполнено обычное условие дополняющей нежесткости $\lambda_i(\tau)\varphi_i(w^\theta(\tau)) =0$ .

§ 4. Условия стационарности в задаче $\mathrm{B}^\theta$

Для удобства обозначения введем концевую функцию Лагранжа $l = \alpha_0 F_0+\alpha F+\beta K$ и для краткости положим $f^\theta = f(x^\theta, u^\theta)$ , $f^\theta_x = f_x(x^\theta,u^\theta)$ , и тому подобное.

Условие (3.24) означает, что для любых $(\overline u,\overline{z},\overline x_0)$

$\begin{equation} \begin{aligned} \, &L'(u^\theta, z^\theta, x^\theta_0)(\overline u,\overline{z}, \overline x_0) = l_{x_0} \overline x_0+ l_{x_1} \overline x_1 - \gamma \overline{z} \nonumber \\ &\qquad\qquad\quad + \langle \lambda,(\varphi_x^\theta \overline x + \varphi_u^\theta\overline u) \rangle + \langle m,(g_x^\theta \overline x + g_u^\theta\overline u) \rangle + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu =0, \end{aligned} \end{equation} \tag{4.1}$

где

$\overline x_1 =\overline x(\tau_1)$ в силу уравнения (3.18) (или (3.19)). (Производные всех функций берутся здесь в оптимальной точке

$(u^\theta, z^\theta, x^\theta_0)$ .)

1. Упростим сначала вид функционалов $\lambda$ , $m$ , априорно принадлежащих $L^*_\infty(E_+)$ . Для этого напомним следующее свойство функционалов из пространства $L_\infty^*(\Delta)$ на некотором отрезке $\Delta$ .

Функционал $\pi\in L_\infty^*(\Delta)$ называется абсолютно непрерывным, если существует функция $p \in L_1(\Delta)$ такая, что $\pi$ имеет представление

$\begin{equation*} \langle \pi, u \rangle = \int_{\tau_0}^{\tau_1} p(\tau)\,u(\tau)\,d\tau \quad \text{для всех} \quad u\in L_\infty(\Delta). \end{equation*} \notag$

Нетрудно показать, что $\pi$ абсолютно непрерывен тогда и только тогда, когда $\langle \pi, u_n\rangle \to 0$ для любой последовательности функций $u_n \in L_\infty(\Delta)$ такой, что $\|u_n\|_\infty \leqslant\mathrm{const}$ , $\|u_n\|_1 \to0$ . (Это вытекает, например, из теоремы Иосиды–Хьюитта о разложении $\pi$ на две составляющие – абсолютно непрерывную и сингулярную. Ясно, что для абсолютно непрерывной компоненты это предельное свойство выполнено, а для сингулярной нет.)

Отсюда следует, что для любого $\eta \in L_\infty^*(E_+)$ и любой функции $a\in L_\infty(E_+)$ функционал вида $\langle \eta, a\overline x \rangle$ , где $\overline x$ выражается через $\overline u \in L_\infty(E_+)$ из уравнения $d\overline{x}/d\tau = A(\tau)\overline x + B(\tau)\overline u$ с заданными матрицами $A, B\in L_\infty$ на отрезке $[\tau_0,\tau_1]$ и начальным значением $\overline x(\tau_0)=0$ , будет абсолютно непрерывным от $\overline u$ . Действительно, если $\|\overline u_n\|_1 \to 0$ , то по лемме Гронуолла $\|\overline x_n\|_C \to0$ , тогда $\| a\,\overline x_n\|_\infty \to 0$ , и, значит, $\langle \eta, a\overline x_n \rangle \to 0$ . По тем же причинам для любой меры $d\mu$ на $[\tau_0,\tau_1]$ и любой непрерывной функции $c(\tau)$ функционал $\int c\overline x\,d\mu$ также является абсолютно непрерывным относительно $\overline u \in L_\infty(E_+)$ .

2. Вернемся к равенству (4.1). Положим в нем $\overline{z}=0$ , $\overline x_0=0$ . Тогда $\overline{v}=0$ , и согласно (3.19), $\overline x$ выражается через $\overline u$ из уравнения

$\begin{equation} \frac{d\overline{x}}{d\tau}= v^\theta(f_x^\theta \overline x + f_u^\theta \overline u), \qquad \overline x(\tau_0)=0. \end{equation} \tag{4.2}$

При этом для всех

$\overline u \in L_\infty(E_+)$ выполнено равенство

$\begin{equation*} \langle \lambda,\varphi_u^\theta\overline u \rangle + \langle m, g_u^\theta\overline u \rangle = -l_{x_1} \overline x_1 - \langle \lambda, \varphi_x^\theta\overline x \rangle - \langle m, g_x^\theta\overline x \rangle + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu, \end{equation*} \notag$

правая часть которого, как мы показали, есть абсолютно непрерывный функционал, т. е.

$\begin{equation} \sum_{i=1}^{d(\varphi)}\langle \lambda_i,\varphi_{iu}^\theta\overline u \rangle+ \sum_{j=1}^{d(g)}\langle m, g_{ju}^\theta\overline u \rangle = \int_{E_+} p(\tau)\overline u(\tau)\,d\tau, \end{equation} \tag{4.3}$

где

$p$ – некоторая функция из

$L_1(E_+)$ . В силу принятого нами предположения о регулярности смешанных ограничений для набора вектор-функций

$\varphi_{iu}(w^\theta)$ ,

$g_{ju}(w^\theta)$ справедлива теорема 8 об отсутствии сингулярных составляющих, согласно которой из равенства (4.3) следует, что все компоненты функционалов

$\lambda$ и

$m$ абсолютно непрерывны, т. е.

$\lambda_i = \lambda_i(\tau)$ и

$m_j= m_j(\tau)$ суть функции из

$L_1(E_+)$ , причем все

$\lambda_i(\tau)\geqslant0$ на

$E_+$ . Тогда условие дополняющей нежесткости

$\langle \lambda,\varphi(x^\theta,u^\theta) \rangle =0$ приобретает вид

$\begin{equation*} \sum_{i=1}^{d(\varphi)}\int_{E_+}\lambda_i(\tau)\varphi_i(x^\theta(\tau),u^\theta(\tau))\,d\tau =0, \end{equation*} \notag$

и, значит, для каждой компоненты

$\lambda_i$ верно равенство

$\lambda_i(\tau)\varphi_i(x^\theta(\tau),u^\theta(\tau))\,{=}\,0$ , т. е.

$\lambda_i$ сосредоточена на множестве зануления

$i$ -го смешанного неравенства

$\varphi_i(x^\theta(\tau),u^\theta(\tau))=0$ . Для единообразия положим

$\lambda=0$ и

$m=0$ на

$E_0$ , так что теперь

$\lambda$ ,

$m$ суть элементы

$L_1[\tau_0,\tau_1]$ .

Тогда, возвращаясь к равенству (4.1), получаем его в виде

$\begin{equation} \begin{aligned} \, &l_{x_0} \overline x_0+ l_{x_1} \overline x_1-\gamma \overline{z} \nonumber \\ &\qquad + \int_{\tau_0}^{\tau_1} \lambda (\varphi_x^\theta\overline x + \varphi_u^\theta\overline u)\, d\tau + \int_{\tau_0}^{\tau_1} m (g_x^\theta \overline x + g_u^\theta\overline u)\,d\tau + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu =0. \end{aligned} \end{equation} \tag{4.4}$

3. Перепишем это равенство в терминах независимых переменных $(\overline u,\overline{z},\overline x_0)$ с учетом уравнения (3.18) (или (3.19)). Нам надо преобразовать члены, содержащие $\overline x_1$ и $\overline x(\tau)$ . Для этого установим следующий простой факт.

Лемма 4. Пусть абсолютно непрерывная функция $\overline x(\tau)$ и функция ограниченной вариации $\psi(\tau)$ (обе $n$ -мерные, из них $\overline x$ есть столбец, $\psi$ – строка) удовлетворяют уравнениям

$\begin{equation} \dot{\overline x} = A\overline x + \overline b, \quad \overline x(\tau_0) = \overline x_0, \qquad \dot\psi = -\psi A + \dot\rho, \quad \psi(\tau_1) = -l_1, \end{equation} \tag{4.5}$

где матрица

$A(\tau)$ и функция

$\overline b(\tau)$ измеримы и ограничены,

$\rho(\tau)$ есть функция ограниченной вариации, непрерывная в точках

$\tau_0$ ,

$\tau_1$ , и

$l_1$ есть вектор из

$\mathbb{R}^n$ . Тогда

$\begin{equation} l_1\overline x_1 + \int_{\tau_0}^{\tau_1} \overline x\, d\rho = -\psi_0\overline x_0 - \int_{\tau_0}^{\tau_1} \psi\overline b\,d\tau. \end{equation} \tag{4.6}$

Доказательство. Возьмем производную по времени от произведения

$\psi\overline x$ :

$\begin{equation*} \frac d{d\tau}(\psi\overline x)= (-\psi A + \dot\rho)\overline x + \psi(A\overline x + \overline b) = \dot\rho\overline x+\psi\overline b, \end{equation*} \notag$

поэтому

$\begin{equation*} \psi_1\overline x_1 - \psi_0\overline x_0 = \int_{\tau_0}^{\tau_1} \overline x\,d\rho + \int_{\tau_0}^{\tau_1} \psi\overline b\,d\tau. \end{equation*} \notag$

Отсюда с учетом граничного значения

$\psi_1 = -l_1$ получаем (4.6).

$\Box$

Замечание 7. Доказанное утверждение есть обобщение классической леммы Дюбуа–Раймона, или, по сути дела, формула интегрирования по частям для интеграла Стилтьеса.

Применим теперь лемму 4 к равенству (4.4) с учетом уравнения (3.19). Сопоставляя (4.4) с левой частью (4.6) и (3.19) с верхней строчкой в (4.5), видим, что

$\begin{equation*} \begin{gathered} \, A = v^\theta f_x^\theta, \qquad \overline b = v^\theta f^\theta_u\overline u+ \overline v f^\theta, \\ d\rho = (\lambda\varphi_x^\theta+m g_x^\theta)\,d\tau+ \Phi_x^\theta\,d\mu, \qquad l_1= l_{x_1}. \end{gathered} \end{equation*} \notag$

Поэтому введем функцию ограниченной вариации

$\psi^\theta(\tau)$ (сопряженную переменную задачи

$\mathrm{B}^\theta)$ , которая согласно (4.5) есть решение уравнения

$\begin{equation} \frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+ \lambda\varphi_x^\theta +mg_x^\theta+\frac{d\mu}{d\tau}\,\Phi_x^\theta, \qquad \psi^\theta(\tau_1)= -l_{x_1}. \end{equation} \tag{4.7}$

Тогда по лемме 4 равенство (4.4) принимает вид

$\begin{equation*} l_{x_0} \overline x_0 - \psi_0^\theta\overline x_0 - \gamma \overline{z} - \int_{\tau_0}^{\tau_1} \psi^\theta (v^\theta f_u^\theta\overline u + \overline{v} f^\theta)\,d\tau + \int_{\tau_0}^{\tau_1} (\lambda\varphi_u^\theta + m g_u^\theta) \overline u \,d\tau =0, \end{equation*} \notag$

откуда, учитывая, что

$\overline v(\tau)= \sum \overline{z}_k \chi_k(\tau)$ , имеем

$\begin{equation} \begin{aligned} \, &(l_{x_0}-\psi^\theta_0)\overline x_0 + \sum_k z_k^\theta \int_{\sigma_k} (-\psi^\theta f_u^\theta +\lambda\varphi_u^\theta+ mg_u^\theta)\overline u \,d\tau \nonumber \\ &\qquad- \sum_k \overline{z}_k \int_{\sigma_k} \psi^\theta f^\theta\, d\tau - \sum_k\gamma_k\overline{z}_k= 0. \end{aligned} \end{equation} \tag{4.8}$

Это равенство выполнено для всех $\overline x_0\in\mathbb{R}^n$ , всех $\overline{z}_k\in \mathbb{R}$ , $k=1,\dots,m,$ и всех $\overline u \in L_\infty(E_+)$ . Варьируя $\overline x_0$ и $\overline{z}_k$ , получаем $\psi^\theta(\tau_0) = l_{x_0}$ , и при каждом $k$

$\begin{equation} \int_{\sigma_k} \psi^\theta f^\theta\, d\tau = -\gamma_k. \end{equation} \tag{4.9}$

Вспомним, что все $\gamma_k \geqslant 0$ , $z_k^\theta\geqslant 0$ , а согласно условию дополняющей нежесткости (iii) из теоремы 2 $\gamma z^\theta := \sum \gamma_k z^\theta_k =0$ , и, значит, $\gamma_k z^\theta_k =0$ для всех $k$ .

Если $\sigma_k\subset E_+$ , то $z^\theta_k =1$ , и тогда $\gamma_k =0$ . Если же $\sigma_k\subset E_0$ , то $z^\theta_k =0$ , и тогда нам известно лишь, что $\gamma_k \geqslant 0$ .

Наконец, варьируя $\overline u$ , получаем на каждом $\sigma_k\subset E_+$

$\begin{equation} -\psi^\theta f_u^\theta+\lambda\varphi_u^\theta+ m g_u^\theta=0. \end{equation} \tag{4.10}$

Подчеркнем, что это равенство выполнено только на $E_+$ . Если $\sigma_k\subset E_0$ , то $\overline u$ не варьируется, и никакого условия мы здесь не получаем.

4. Подведем предварительный итог проделанной расшифровки условий стационарности (4.1).

Теорема 3. Для любого индекса $\theta$ существует набор

$\begin{equation*} \xi^\theta= (\alpha_0,\alpha,\beta,\lambda^\theta(\tau), m^\theta(\tau),\mu^\theta(\tau)), \end{equation*} \notag$

лежащий в пространстве $\mathbb{R}^{1+d(F)+d(K)} \times \bigl(L_1^{d(\varphi)} \times L_1^{d(g)} \times BV^{d(\Phi)}\bigr)[\tau_0,\tau_1]$ , и соответствующая ему функция ограниченной вариации $\psi^\theta(\tau)$ такие, что выполнены условия

$\begin{equation*} \begin{gathered} \, \begin{split} &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \gamma\geqslant 0,\quad \lambda^\theta\geqslant 0,\quad d\mu^\theta \geqslant0, \\ &(\mathrm{ii})\ \alpha_0+ |\alpha|+ |\beta|+ \int_{E_+} |\lambda^\theta|\,dt + \int_{E_+} |m^\theta|\,dt+ \int_{\tau_0}^{\tau_1} d\mu^\theta>0, \\ &\qquad\lambda^\theta =0,\quad m^\theta=0\quad\textit{п. в. на }E_0, \\ &(\mathrm{iii})\ \alpha F(\widehat{x}_0,\widehat{x}_1)=0,\quad \lambda^\theta(\tau) \varphi^\theta(\tau) =0,\quad \Phi(x^\theta(\tau))\,d \mu^\theta(\tau) =0, \end{split} \end{gathered} \end{equation*} \notag$

$\begin{equation} \frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+ \lambda^\theta \varphi_x^\theta+m^\theta g_x^\theta + \frac{d\mu^\theta}{d\tau}\,\Phi_x^\theta, \end{equation} \tag{4.11}$

$\begin{equation} \psi^\theta(\tau_0)= l_{x_0}, \qquad \psi^\theta(\tau_1)= -l_{x_1}, \end{equation} \tag{4.12}$

$\begin{equation} -\psi^\theta f_u^\theta+\lambda^\theta \varphi_u^\theta+ m^\theta g_u^\theta=0 \quad \textit{на }E_+, \end{equation} \tag{4.13}$

$\begin{equation} \int_{\sigma_k}\psi^\theta f^\theta \, d\tau \begin{cases} =0, &\textit{если }\sigma_k\subset E_+, \\ \leqslant 0, &\textit{если }\sigma_k\subset E_0, \end{cases} \qquad k=1,\dots,m. \end{equation} \tag{4.14}$

Функция $\psi^\theta$ однозначно определяется набором $\xi^\theta$ из уравнения (4.11) и любого из граничных условий (4.12).

Отметим, что множитель $\gamma$ не включен в условие нетривиальности (ii), поскольку он выражается через $\psi^\theta$ в силу (4.9). Более того, покажем, что из условия (ii) можно исключить и $m^\theta$ , т. е. считать, что

$\begin{equation*} \alpha_0+ |\alpha|+ |\beta|+ \int_{E_+} |\lambda^\theta|\,dt + \int_{\tau_0}^{\tau_1} d\mu^\theta>0. \end{equation*} \notag$

Действительно, если левая часть здесь равна нулю, то $l=0$ , $\lambda^\theta=0$ , $d\mu^\theta =0$ ,

$\begin{equation*} \frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+m^\theta g_x^\theta,\qquad \psi^\theta(\tau_0)= \psi^\theta(\tau_1)= 0, \qquad -\psi^\theta f_u^\theta+ m^\theta g_u^\theta=0 \quad \text{на } E_+. \end{equation*} \notag$

Так как матрица $g_u(x^\theta, u^\theta)$ имеет полный ранг, причем равномерно по $\tau$ , она имеет ограниченную правую обратную $D(\tau)$ , так что $m^\theta = \psi^\theta f_u^\theta D(\tau)$ . Подставляя это выражение в уравнение для $\psi^\theta$ , получим линейное однородное уравнение с нулевыми граничными условиями. Отсюда $\psi^\theta =0$ , а тогда и $m^\theta =0$ .

Отметим, что и в общем случае, при ненулевых $\lambda^\theta$ , $d\mu^\theta$ , мы так же можем выразить $m^\theta = (\psi^\theta f_u^\theta - \lambda^\theta\varphi_u^\theta)D(\tau)$ и подставить это в сопряженное уравнение, получив линейное уравнение относительно $\psi$ с правой частью, содержащей $\lambda^\theta$ и $d\mu^\theta$ .

5. Рассмотрим подробнее второе условие из (4.14). Возьмем произвольный отрезок $\sigma = [\tau', \tau'']$ , из которых состоит $E_0$ . На нем $u^\theta(\tau) = u^s$ при некотором $s$ , оно постоянно, $v^\theta = 0$ , поэтому значение $x^\theta(\tau)$ также постоянно, обозначим его $\widehat{x}_*$ ; при этом $f^\theta = f(\widehat{x}_*,u^s)$ . Слева и справа к данному отрезку $[\tau', \tau'']$ могут примыкать и другие отрезки из $E_0$ . (При отображении $\tau \mapsto t$ они все перейдут в одну точку $t^s.)$ Пусть $\widetilde \sigma =[\tau'_*,\tau''_*]$ есть объединение данного отрезка со всеми примыкающими к нему отрезками из $E_0$ . (Если слева других таких нет, то $\tau'_* =\tau'$ , а если нет справа, то $\tau''_* =\tau''.)$ Тогда $v^\theta = 0$ на всем этом отрезке $\widetilde\sigma$ , так что по-прежнему $x^\theta(\tau)= \widehat{x}_*$ постоянно.

Согласно (4.11), и учитывая, что $\lambda=0$ , $m=0$ на $\widetilde\sigma$ , имеем

$\begin{equation} d\psi^\theta(\tau)= \sum_{j=1}^{d(\Phi)} d\mu_j^\theta(\tau)\,\Phi_j'(\widehat{x}_*)\quad \text{на } \widetilde\sigma. \end{equation} \tag{4.15}$

(Напомним, что индекс

$j$ обозначает

$j$ -е фазовое ограничение

$\Phi_j(x)\leqslant0$ и соответствующую ему меру

$d\mu_j^\theta$ . При этом

$\Phi'_j$ суть строки матрицы

$\Phi_x$ .) Отсюда следует, что для любого

$\tau\in [\tau'_*,\tau''_*]$

$\begin{equation} \psi^\theta(\tau)-\psi^\theta(\tau'_*-0)= \sum_{j=1}^{d(\Phi)} [\mu_j^\theta(\tau)-\mu_j^\theta(\tau'_*-0)]\Phi_j'(\widehat{x}_*). \end{equation} \tag{4.16}$

Второе условие из (4.14) означает, что на исходном (нерасширенном) отрезке

$\sigma$ выполнено неравенство

$\begin{equation} \int_{\tau'}^{\tau''} \psi^\theta(\tau) f(\widehat{x}_*,u^k)\, d\tau \leqslant 0. \end{equation} \tag{4.17}$

Подставляя сюда значение

$\psi^\theta(\tau)$ из (4.16), получаем

$\begin{equation} \begin{aligned} \, &\psi^\theta(\tau'_*-0)f(\widehat{x}_*,u^s)(\tau''-\tau') \nonumber \\ &\qquad +\sum_{j=1}^{d(\Phi)}\Phi'_j(\widehat{x}_*)f(\widehat{x}_*,u^s) \int_{\tau'}^{\tau''}[\mu_j^\theta(\tau)- \mu_j^\theta(\tau'_*-0)]\,d\tau \leqslant 0. \end{aligned} \end{equation} \tag{4.18}$

Поскольку

$\mu_j^\theta(\tau) \leqslant \mu_j^\theta(\tau''_*+0)$ на отрезке

$[\tau', \tau'']$ для всех

$j$ , имеем неравенство

$\begin{equation*} \int_{\tau'}^{\tau''}[(\mu_j^\theta(\tau) -\mu_j^\theta(\tau'_*-0)]\, d\tau \leqslant [\mu_j^\theta(\tau''_*+0) -\mu_j^\theta(\tau'_*-0)](\tau''-\tau'). \end{equation*} \notag$

Пусть числа

$0\leqslant \rho_j \leqslant 1$ ,

$j=1,\dots,d(\Phi)$ , таковы, что

$\begin{equation*} \int_{\tau'}^{\tau''} [(\mu_j^\theta(\tau) -\mu_j^\theta(\tau'_*-0)]\, d\tau = \rho_j [\mu_j^\theta(\tau''_*+0) -\mu_j^\theta(\tau'_*-0)](\tau''-\tau'). \end{equation*} \notag$

Тогда из условия (4.18) вытекает, что

$\begin{equation} \biggl(\psi^\theta(\tau'_*-0) + \sum_{j=1}^{d(\Phi)} \rho_j [\mu_j^\theta(\tau''_* +0) -\mu_j^\theta(\tau'_*-0)] \Phi'_j(\widehat{x}_*)\biggr) f(\widehat{x}_*,u^s) \leqslant 0. \end{equation} \tag{4.19}$

Замечание 8. Этот нетривиальный прием замены условия (4.18) на условие (4.19) с неизвестными числами $\rho_j$ был предложен А. А. Милютиным в его лекциях на механико-математическом факультете МГУ в 1970-х гг. Он позволит нам сделать следующий важный шаг в доказательстве ПМ для задач со многими фазовыми ограничениями – перейти от условий во времени $\tau$ к условиям в исходном времени $t$ . В случае скалярного фазового ограничения этот прием не нужен, так как тогда функция $\psi^\theta(\tau) f(\widehat{x}_*,u^k)$ монотонна на $[\tau'_*,\tau''_*]$ (см. [27]).

Перепишем теперь полученные условия в терминах исходного времени $t$ . Это даст нам возможность рассматривать условия, полученные для различных индексов $\theta$ , на одном и том же отрезке $[\,\widehat t_0,\widehat t_1]$ .

§ 5. Конечнозначный принцип максимума индекса $\theta$

По построению на отрезке $[\tau_0, \tau_1]$ имеем неубывающую функцию $t^\theta(\tau)$ , которая отображает его на отрезок $[\,\widehat t_0,\widehat t_1]$ , причем на каждом отрезке $\sigma \subset E_0$ она постоянна. Кроме того, на $[\tau_0, \tau_1]$ имеются функции $u^\theta(\tau)$ и $x^\theta(\tau)$ , связанные с исходными $\widehat{x}(t)$ и $\widehat{u}(t)$ формулами (3.11).

Пусть $\tau^\theta(t)$ есть наименьший корень уравнения $t^\theta(\tau) =t$ . Эта функция строго возрастает и имеет разрывы в заданных точках $t^s$ (и только в них): скачок $\Delta\tau(t^s) = \tau''_* -\tau'_*$ , где $[\tau'_*,\tau''_*]$ – указанный выше максимальный отрезок, соответствующий точке $t^s$ . Положим

$\begin{equation*} \begin{alignedat}{2} \lambda(t) &= \lambda^\theta(\tau^\theta(t)), &\qquad m(t) &= m^\theta(\tau^\theta(t)), \\ \mu(t) &= \mu^\theta(\tau^\theta(t)), &\qquad \psi(t)&=\psi^\theta(\tau^\theta(t)), \end{alignedat} \qquad t\in [\,\widehat t_0,\widehat t_1]. \end{equation*} \notag$

Заметим, что поскольку $\lambda^\theta =0$ и $m^\theta=0$ на $E_0$ , и $dt = d\tau$ на $E_+$ , функции $\lambda(t)$ и $m(t)$ по-прежнему интегрируемы, теперь уже на отрезке $[\,\widehat t_0,\widehat t_1]$ , и нормировка этих множителей при переходе от $\tau$ к $t$ сохраняется:

$\begin{equation*} \int_{\widehat t_0}^{\widehat t_1} |\lambda(t)|\,dt = \int_{\tau_0}^{\tau_1} |\lambda^\theta(\tau)|\,dt, \qquad \int_{\widehat t_0}^{\widehat t_1} |m(t)|\,dt = \int_{\tau_0}^{\tau_1} |m^\theta(\tau)|\,dt. \end{equation*} \notag$

(Впрочем, второе равенство нам не понадобится, так как множитель

$m$ мы исключили из нормировки).

Нетрудно также убедиться, что функция $\mu(t)$ не убывает и имеет в точках $t^s$ скачки $\Delta\mu(t^s) = \mu^\theta(\tau''_* +0) - \mu^\theta(\tau'_*-0)$ , при этом

$\begin{equation*} \int_{\widehat t_0}^{\widehat t_1} d\mu(t)\,dt =\int_{\tau_0}^{\tau_1} d\mu^\theta(\tau)\,d\tau, \end{equation*} \notag$

а $\psi(t)$ есть функция ограниченной вариации, удовлетворяющая уравнению

$\begin{equation*} \begin{aligned} \, \frac{d\psi(t)}{dt} &= -\psi(t)f_x(\widehat{x}(t),\widehat{u}(t)) \\ &\qquad + \lambda(t)\varphi_x(\widehat{x}(t),\widehat{u}(t))+ m(t)g_x(\widehat{x}(t),\widehat{u}(t))+ \frac{d \mu(t)}{dt}\, \Phi'(\widehat{x}(t)), \end{aligned} \end{equation*} \notag$

и имеющая те же концевые значения, что и $\psi^\theta(\tau)$ . Это уравнение следует из (4.11) с учетом того, что для $\tau \in E_+$ и соответствующего $t = t^\theta(\tau)$ справедливо $d\mu(t) = d\mu^\theta(\tau)$ . Проверку этих свойств мы оставляем читателю.

Напомним, что в силу предположения (2.7) в окрестностях точек $\widehat t_0$ , $\widehat t_1$ мера не работает: $d\mu(t)=0$ , поэтому функция $\psi(t)$ непрерывна в этих точках.

Теорема 3 переписывается в исходном времени $t\in [\,\widehat t_0,\widehat t_1]$ следующим образом.

Теорема 4 (принцип максимума индекса $\theta$ ). Для любого индекса $\theta$ существует набор $\xi = (\alpha_0,\alpha,\beta,\lambda(t), m(t),\mu(t))$ , где функции $\lambda(t)$ и $m(t)$ интегрируемы, $\mu(t)$ не убывает, и соответствующая ему функция ограниченной вариации $\psi(t)$ такие, что выполнены условия:

$\begin{equation} \begin{gathered} \, \begin{split} &(\mathrm{i}) \ \alpha_0\geqslant0,\qquad \alpha\geqslant 0,\quad \lambda(t)\geqslant0,\quad d\mu(t)\geqslant 0; \\ &(\mathrm{ii}) \ \alpha_0+ |\alpha|+ |\beta|+ \sum_i \int_{\widehat t_0}^{\widehat t_1} \lambda_i(t)\,dt+ \sum_j \int_{\widehat t_0}^{\widehat t_1}d \mu_j(t) =1; \\ &(\mathrm{iii}) \ \alpha F(\widehat{x}_0,\widehat{x}_1)=0, \qquad \lambda_i(t)\varphi_i(\widehat{x}(t)),\widehat{u}(t))=0,\quad i=1,\dots, d(\varphi), \\ &\qquad\Phi_j(\widehat{x}(t))\,d\mu_j(t) =0,\qquad j=1,\dots, d(\Phi); \\ &(\mathrm{iv}) \ \frac{d\psi}{dt}= -\psi f_x(\widehat{x},\widehat{u})+ \lambda\varphi_x(\widehat{x},\widehat{u})+ m g_x(\widehat{x},\widehat{u})+ \frac{d \mu}{dt}\, \Phi_x(\widehat{x}); \\ &(\mathrm{v}) \ \psi(\widehat t_0)= l_{x_0},\qquad \psi(\widehat t_1)= -l_{x_1}; \\ &(\mathrm{vi}) \ -\psi f_u(\widehat{x},\widehat{u})+\lambda\varphi_u(\widehat{x},\widehat{u})+ mg_u(\widehat{x},\widehat{u})=0; \\ &(\mathrm{vii}) \ \textit{для любых соседних точек }t^s < t^{s+1}\textit{ индекса }\theta \\ &\qquad\qquad\qquad\int_{t^s}^{t^{s+1}} \psi(t)\,f(\widehat{x}(t),\widehat{u}(t))\,dt = 0, \\ &(\mathrm{viii}) \ \textit{для любой пары }(t^s,u^s)\textit{ из индекса }\theta\textit{ найдутся числа } 0\leqslant \rho_j\leqslant 1, \\ &\qquad\ j=1,\dots,d(\Phi),\textit{ такие, что} \end{split}\end{gathered} \end{equation} \notag$

$\begin{equation} \biggl(\psi(t^s -0)+ \sum_{j=1}^{d(\Phi)} \rho_j \Delta\mu_j(t^s)\Phi'_j(\widehat x(t^s))\biggr) f(\widehat{x}(t^s),u^s) \leqslant 0. \end{equation} \tag{5.1}$

Условие (vii) получается здесь из первого условия (4.14) с учетом того, что на каждом $\Delta \subset E_+$ отображение $\tau \to t$ взаимно однозначно, $v^\theta(\tau)=1$ , и поэтому $dt= d\tau$ . Условие (viii) вытекает из (4.19).

Отметим, что функция $\psi(t)$ однозначно определяется набором $\xi$ из уравнения (iv) и любого из граничных условий (v).

Итак, для данного индекса $\theta$ мы получили набор множителей Лагранжа, которые порождают функцию $\psi(t)$ , так что выполнены указанные условия (i)–(viii). Эти множители Лагранжа, вообще говоря, зависят от индекса $\theta$ . Условия (i)–(vi) одни и те же для всех индексов, а условия (vii)–(viii) связаны с каждым отдельным индексом. Наша цель теперь – перейти к условиям (vii)–(viii) с набором множителей, не зависящим от индекса $\theta$ .

§ 6. Переход к универсальному принципу максимума

1. Предположение о регулярности смешанных ограничений позволило нам установить, что множители $\lambda(t)$ , $m(t)$ в теореме 4 суть интегрируемые функции. Более того, покажем теперь, что они ограничены. Поскольку число активных смешанных неравенств $\varphi_i(\widehat{w}(t))\leqslant0$ непостоянно по времени, можно рассмотреть случаи всевозможных конечных подмножеств из $\{1,\dots, d(\varphi)\}$ , а тогда без нарушения общности можно ограничиться случаем, когда все неравенства $\varphi_i(\widehat{w}(t))\leqslant0$ активны на некотором измеримом множестве $E \subset [\,\widehat t_0,\widehat t_1]$ . Пусть

$\begin{equation*} \begin{gathered} \, S = \biggl\{(\alpha,\beta)\in \mathbb{R}^{d(\varphi)}\times \mathbb{R}^{d(g)}\biggm| \alpha\geqslant 0,\, \sum\alpha_i + \sum |\beta_j|=1\biggr\}, \\ Q_0 = \{w\in \mathcal{Q}\mid \varphi(w)=0,\, g(w)=0\}. \end{gathered} \end{equation*} \notag$

(Напомним, что

$Q$ есть открытое множество в

$\mathbb{R}^{n+r}$ , на котором определены функции задачи.)

По условию в любой точке $w\in Q_0$ векторы $\varphi_{iu}(w)$ , $g_{ju}(w)$ позитивно-линейно независимы, следовательно,

$\begin{equation*} \min_S \Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| >0. \end{equation*} \notag$

Так как функция, стоящая слева, непрерывна, то для любого компакта

$M \subset Q_0$ по-прежнему будет

$\begin{equation*} \min_{w\in M} \min_S \Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| := c >0. \end{equation*} \notag$

Тогда для любого

$w\in M$ и любых

$\alpha\geqslant0$ ,

$\beta$ справедлива оценка

$\begin{equation} \Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| \geqslant c \Bigl(\sum\alpha_i + \sum |\beta_j|\Bigr). \end{equation} \tag{6.1}$

Вспомним, что для процесса $\widehat{w}$ существует компакт $D\,{\subset}\, Q$ такой, что $\widehat{w}(t) \,{\in}\, D$ почти всюду на $[\,\widehat t_0,\widehat t_1]$ , а значит, и на $E$ . Положим теперь $M = D\cap Q_0$ . Ясно, что $M$ есть компакт, и $\widehat{w}(t) \in M$ почти всюду на $E$ .

Положим $\alpha= \lambda(t)$ , $\beta = m(t)$ . Тогда в силу (6.1) для почти всех $t\in E$ справедлива оценка

$\begin{equation*} \sum \lambda_i(t) + \sum |m_j(t)| \leqslant \frac 1c \Bigl|\sum \lambda_i(t) \varphi_{iu}(\widehat{w}(t)) + \sum m_j(t) g_{ju}(\widehat{w}(t))\Bigr|. \end{equation*} \notag$

Теперь заметим, что в силу условия (vi) справа под модулем стоит ограниченная функция $\psi(t) f_u(\widehat{w}(t))$ , поэтому

$\begin{equation} \sum \lambda_i(t) + \sum |m_j(t)| \leqslant \frac 1c |\psi(t) f_u(\widehat{w}(t))|, \end{equation} \tag{6.2}$

откуда следует, что и все множители

$\lambda_i(t)$ ,

$m_j(t)$ суть ограниченные функции, т. е. принадлежат

$L_\infty(E)$ .

2. Для учета условий, порождаемых различными индексами $\theta$ , проделаем следующую процедуру⁴. Для данного индекса $\theta$ введем множество всех наборов $\xi =(\alpha_0,\alpha,\beta,\lambda(t),m(t),\mu(t))$ , удовлетворяющих, вместе с соответствующими функциями $\psi(t)$ , условиям (i)–(viii) теоремы 4; обозначим его $\Lambda^\theta$ . Как было показано, это множество лежит в пространстве

$\begin{equation*} Y^* = \mathbb{R}^{1+d(F)+d(K)} \times L_\infty^{d(\varphi)}(\Delta) \times L_\infty^{d(g)}(\Delta) \times BV^{d(\Phi)}(\Delta), \end{equation*} \notag$

сопряженном к пространству

$\begin{equation*} Y = \mathbb{R}^{1+d(F)+d(K)} \times L_1^{d(\varphi)}(\Delta) \times L_1^{d(g)}(\Delta)\times C^{d(\Phi)}(\Delta), \end{equation*} \notag$

где

$\Delta = [\,\widehat t_0,\widehat t_1].\;$ Установим следующий ключевой факт.

Лемма 5. Множество $\Lambda^\theta$ есть компакт в слабой- $*$ топологии пространства $Y^*$ .

Доказательство. Установим сначала ограниченность

$\Lambda^\theta$ . Из нормировки (ii) следует, что

$\alpha_0 +|\alpha|+|\beta|\leqslant 1$ и

$\|\lambda\|_1 + \|d\mu\|\leqslant 1$ . Как и прежде, умножив равенство (vi) на ограниченную матрицу

$D(t)$ , получим выражение

$m = (\psi f_u - \lambda g_u)D(t)$ , подставив которое в уравнение (iv), получим для

$\psi$ линейное уравнение вида

$d\psi = (A(t)\psi + B(t)\lambda)\,dt + G(t)\, d\mu$ , где

$A$ ,

$B$ ,

$G$ – измеримые ограниченные матрицы. Отсюда по лемме 6

$\begin{equation*} \|\psi\|_\infty \leqslant \mathrm{const} \bigl(|\psi(\widehat t_0)| + \|\lambda\|_1 + \|d\mu\|\bigr) \leqslant \mathrm{const} \end{equation*} \notag$

на всем

$\Lambda^\theta$ , а тогда в силу (6.2) также и

$\|\lambda\|_\infty + \|m\|_\infty \leqslant \mathrm{const}$ на всем

$\Lambda^\theta$ . Таким образом, множество

$\Lambda^\theta$ ограничено.

Далее, поскольку все условия, задающие $\Lambda^\theta$ , кроме нормировки, линейны по всем компонентам $\xi$ , а относительно бесконечномерных компонент $\lambda_i$ , $d\mu_j$ нормировка задается линейными функционалами из исходных пространств (соответственно из $L_1$ , $C$ ), т. е. слабо- $*$ непрерывными функционалами, то нетрудно показать, что множество $\Lambda^\theta$ слабо- $*$ замкнуто.

Проверим, например, слабую- $*$ замкнутость множества всех $\xi$ , удовлетворяющих сопряженному уравнению (iv), которое запишем в терминах мер:

$\begin{equation} d\psi(t)= (-\psi f_x + \lambda\varphi_x + m g_x)\,dt + \Phi_{x}\, d\mu(t), \end{equation} \tag{6.3}$

и граничным условиям

$\begin{equation} \psi(\widehat t_0) = (\alpha_0 F_0 + \alpha F +\beta K)'_{x_0}, \qquad \psi(\widehat t_1) = -(\alpha_0 F_0 + \alpha F +\beta K)'_{x_1}. \end{equation} \tag{6.4}$

Отметим, что функции

$f_x$ ,

$\varphi_x$ ,

$g_x$ , вычисленные вдоль процесса

$\widehat{w}(t)$ , измеримы и ограничены, а

$\Phi_x$ непрерывна.

Пользуясь опять выражением $m =(\psi f_u-\lambda g_u)D(t)$ , получим из (6.3) уравнение

$\begin{equation} d\psi(t)= A(t)\psi(t)\,dt+B(t)\lambda(t)\,dt+ G(t)\,d\mu(t), \end{equation} \tag{6.5}$

где

$A$ ,

$B$ ,

$G$ – некоторые измеримые ограниченные матрицы соответствующих размерностей. (Здесь

$\psi$ ,

$\lambda$ ,

$\mu$ представлены как столбцы.)

Пусть наборы $\xi^k\in Y^*$ , $k =1,2,\dots$ , удовлетворяют условиям (6.3), (6.4) и слабо- $*$ сходятся к некоторому набору $\xi^0 \in Y^*$ . Покажем, что и предельный набор $\xi^0$ также удовлетворяет этим условиям. (Так как пространство $Y$ сепарабельно, слабая- $*$ топология на ограниченных множествах в $Y^*$ метризуема, поэтому достаточно рассматривать последовательности.)

Из слабой- $*$ сходимости мер $d\mu^k \to d\mu^0$ в пространстве $C^*$ , слабой- $*$ сходимости функций $\lambda^k \to \lambda^0$ в пространстве $L_\infty$ и сходимости конечномерных компонент $(\alpha_0^k,\alpha^k,\beta^k) \to (\alpha_0^0,\alpha^0,\beta^0)$ вытекает, что функции $\psi^k$ равномерно ограничены, $\psi^k(t) \to \psi^0(t)$ почти всюду на $\Delta$ , а меры $d\psi^k$ также слабо- $*$ сходятся к $d\psi^0$ (см. лемму 7). По теореме Лебега $\psi^k \to \psi^0$ , а тогда и $m^k \to m^0$ слабо- $*$ в пространстве $L_\infty$ .

Поскольку (6.3) представляет собой равенство линейных функционалов над пространством $C^n(\Delta)$ , то достаточно проверить его на любой функции $\overline x\in C^n(\Delta)$ . По условию для любого $k$ имеем

$\begin{equation} \int_\Delta \overline x\,d\psi^k= \int_\Delta \overline x(-\psi^k f_x + \lambda^k\varphi_x + m^k g_x)\,dt + \int_\Delta \overline x\Phi_{x}\, d\mu^k. \end{equation} \tag{6.6}$

Так как

$d\psi^k\to d\psi^0$ и

$d\mu^k\to d\mu^0$ слабо-

$*$ , то левая часть и последний член в правой сходятся к нужным пределам:

$\begin{equation} \int_\Delta \overline x\,d\psi^k \to \int_\Delta \overline x\,d\psi^0, \qquad \int_\Delta \overline x\Phi_x\,d\mu^k \to \int_\Delta \overline x\Phi_x\,d\mu^0, \end{equation} \tag{6.7}$

а сходимость среднего интеграла в правой части (6.6)

$\begin{equation*} \int_\Delta \overline x(-\psi^k f_x + \lambda^k\varphi_x + m^k g_x)\,dt \to \int_\Delta \overline x(-\psi^0 f_x + \lambda^0\varphi_x + m^0 g_x)\,dt \end{equation*} \notag$

следует из того, что

$\psi^k\to \psi^0$ ,

$\lambda^k\to \lambda^0$ и

$m^k\to m^0$ слабо-

$*$ в пространстве

$L_\infty$ относительно

$L_1$ .

Таким образом, в пределе получаем

$\begin{equation*} \int_\Delta \overline x\,d\psi^0= \int_\Delta \overline x(-\psi^0 f_x + \lambda^0 \varphi_x + m^0 g_x)\,dt + \int_\Delta \overline x\Phi_{x}\, d\mu^0. \end{equation*} \notag$

В силу произвольности

$\overline x \in C^n(\Delta)$ отсюда следует требуемое равенство

$\begin{equation*} d\psi^0(t)= (-\psi^0 f_x + \lambda^0 \varphi_x + m^0\,g_x)\,dt + \Phi_{x}\, d\mu^0(t), \end{equation*} \notag$

т. е. уравнение (iv) выдерживает переход к слабому-

$*$ пределу.

Слабая- $*$ замкнутость условий (i), (ii), (v), (vi), (vii) и первых двух условий из (iii), задающих множество $\Lambda^\theta$ , устанавливается еще проще, мы это опускаем. Третье условие из (iii) для любого $j= 1, \dots, d(\Phi)$ означает, что на любом интервале между соседними точками $t^s< t^{s+1}$ , где $\Phi_j(\widehat{x}(t))<0$ , мера $d\mu_j =0$ . Это эквивалентно тому, что для любой непрерывной функции $\overline x(t)$ , носитель которой содержится в этом интервале, $\int \overline x\,d\mu_j =0$ . Ясно, что это свойство сохраняется при слабой- $*$ сходимости $d\mu^k_j \to d\mu^0_j$ .

Осталось рассмотреть лишь последнее условие (viii). Зафиксируем любое $s$ и рассмотрим пару $(t^s,u^s)$ из индекса $\theta$ . Чтобы избежать путаницы с номерами последовательности, обозначим здесь $t^s =t_*$ , $\widehat{x}(t^s)= \widehat{x}_*$ , $u^s = u_*$ .

Для любого набора $\xi \in \Lambda^\theta$ введем функцию $h(t) = \psi(t) f(\widehat{x}_*,u_*)$ , т. е. проекцию вектора $\psi(t)$ на фиксированное направление $f(\widehat{x}_*,u_*)$ , и будем рассматривать ее на всем отрезке $\Delta = [\,\widehat t_0,\widehat t_1]$ . Из уравнения (6.3) следует, что для $h$ выполнено уравнение

$\begin{equation*} d h(t)= (-\psi f_x + \lambda\varphi_x + m\,g_x)f(\widehat{x}_*,u_*)\,dt+ \sum \Phi'_j(\widehat{x}(t))\,f(\widehat{x}_*,u_*)\, d\mu_j(t). \end{equation*} \notag$

Введем скалярные функции $a_j(t) = \Phi'_j(\widehat{x}(t))\, f(\widehat{x}_*,u_*)$ , $j=1,\dots, d(\Phi)$ . Все они непрерывны, ибо функции $\Phi'_j(\widehat{x}(t))$ непрерывны, а вектор $f(\widehat{x}_*,u_*)$ постоянен. Введем также функцию $b(t) = (-\psi f_x + \lambda\varphi_x + m\,g_x)f(\widehat{x}_*,u_*)$ , она измерима и ограничена. Таким образом,

$\begin{equation} d h(t)= b(t)\,dt+ \sum a_j(t)\, d\mu_j(t). \end{equation} \tag{6.8}$

Пусть теперь последовательность $\xi^k \in\Lambda^\theta$ слабо- $*$ сходится к $\xi^0 \in Y^*$ . Тогда при каждом $k =1,2, \dots$ имеется мера

$\begin{equation*} d h^k(t)= b^k(t)\,dt+ \sum a_j(t)\, d\mu_j^k(t), \end{equation*} \notag$

где

$\|b^k\|_\infty \leqslant \mathrm{const}$ и

$\|d\mu_j^k\| \leqslant 1$ в силу нормировки (ii).

Согласно условию (viii) для данной пары $(t_*,u_*)$ при каждом $n$ имеются числа $\rho_{j}^k\in[0,1]$ , $j=1,\dots,d(\Phi)$ , такие, что

$\begin{equation*} h^k(t_*-0)+ \sum \rho_{j}^k a_j(t_*)\Delta\mu_{j}^k(t_*) \leqslant 0. \end{equation*} \notag$

Ясно, что

$h^k(\widehat t_0) \to h^0(\widehat t_0)$ , и по условию

$b^k \xrightarrow{\text{слабо-}*} b^0$ (в пространстве

$L_\infty(\Delta)$ относительно

$L_1(\Delta))$ , а также

$d\mu^k \xrightarrow{\text{слабо-}*} d\mu^0$ при всех

$j$ . Таким образом, мы находимся в условиях леммы 11, согласно которой найдутся числа

$\rho_{j}^0\in [0,1]$ ,

$j= 1,\dots, d(\Phi)$ , такие, что

$\begin{equation*} h^0(t_*-0)+ \sum \rho_{j}^0 a_j(t_*) \Delta\mu_{j}^0(t_*) \leqslant 0. \end{equation*} \notag$

Последнее неравенство означает, что

$\begin{equation*} \biggl(\psi^0(t_*-0)+ \sum_{j=1}^{d(\Phi)} \rho^0_{j}\, \Delta\mu^0_{j}(t_*)\Phi'_j(\widehat{x}_*)\biggr) f(\widehat{x}_*,u_*) \leqslant 0, \end{equation*} \notag$

а это и есть условие (viii) для предельного набора

$\xi^0 \in \Lambda^\theta$ .

Таким образом, множество $\Lambda^\theta$ ограничено и слабо- $*$ замкнуто. А тогда по теореме Алаоглу оно есть слабый- $*$ компакт. Лемма 5 доказана. $\Box$

3. Итак, перебирая всевозможные индексы $\theta$ , мы для каждого из них получаем свой непустой компакт $\Lambda^\theta$ . Покажем, что семейство всех этих компактов образует центрированную систему. Для этого введем отношение порядка в множестве всех индексов. Будем говорить, что $\theta_1\subset \theta_2$ , если каждая пара $(t^s,u^s)$ из $\theta_1$ входит и в $\theta_2$ . Ясно, что для любых двух индексов $\theta_1$ и $\theta_2$ найдется третий, содержащий каждый из них, например их объединение. Нетрудно заметить, что при расширении индекса $\theta$ множество $\Lambda^\theta$ сужается, т. е. включение $\theta_1\subset\theta_2$ влечет обратное включение $\Lambda^{\theta_1}\supset \Lambda^{\theta_2}$ . Пусть теперь имеется конечный набор компактов $\Lambda^{\theta_1},\dots, \Lambda^{\theta_m}$ . Возьмем любой индекс $\theta$ , содержащий в себе все индексы $\theta_1,\dots, \theta_m$ . Тогда непустой компакт $\Lambda^\theta$ содержится в каждом из компактов $\Lambda^{\theta_1},\dots,\Lambda^{\theta_m}$ , и, следовательно, их пересечение непусто. Поэтому семейство $\{ \Lambda^{\theta}\}$ центрировано, и тогда оно имеет непустое пересечение

$\begin{equation*} \Lambda_*= \bigcap_{\theta}\Lambda^\theta. \end{equation*} \notag$

Возьмем произвольный набор множителей $\xi=(\alpha_0,\alpha,\beta,\lambda,m,\mu)\in \Lambda_*$ , и пусть $\psi$ есть соответствующая ему сопряженная функция. Для этого набора по определению выполнены условия (i)–(vi) теоремы 4. Выполнение условия (vii) в любом индексе $\theta$ означает, что для любого интервала $(t',t'')$

$\begin{equation*} \int_{t'}^{t''}\psi(t) f(\widehat{x}(t),\widehat{u}(t))\,dt = 0 \end{equation*} \notag$

(ибо найдется индекс, содержащий точки

$t'$ ,

$t''$ ), а это эквивалентно выполнению почти всюду на

$[\,\widehat t_0,\widehat t_1]$ равенства

$\begin{equation} \psi(t)f(\widehat{x}(t),\widehat{u}(t)) = 0. \end{equation} \tag{6.9}$

Из условия (viii) для набора $\xi$ следует, что для любого $u \in \mathcal{R}_0(\widehat{x}(t))$ и любой точки $t \in (\widehat t_0,\widehat t_1)$ , в которой меры $d\mu_j$ не имеют атомов (т. е. $\Delta\mu_j(t)=0$ ), выполнено неравенство

$\begin{equation} \psi(t -0) f(\widehat{x}(t),u) \leqslant 0. \end{equation} \tag{6.10}$

Так как это неравенство выполнено для всех

$t$ , кроме счетного числа точек, а

$\psi$ можно считать непрерывной с одной из сторон, то оно выполнено для всех

$t$ из интервала

$(\widehat t_0,\widehat t_1)$ , а значит, и для его граничных точек (поскольку

$\psi$ непрерывна в этих точках). Тогда для всех

$t$ выполнено и симметричное неравенство

$\begin{equation} \psi(t +0) f(\widehat{x}(t),u) \leqslant 0. \end{equation} \tag{6.11}$

Неравенства (6.10) и (6.11) остаются в силе для любого

$u \in \mathcal{R}(\widehat{x}(t))$ , ибо по лемме 1 любая такая точка есть предел точек из

$\mathcal{R}_0(\widehat{x}(t))$ , и, значит, выполнено условие (3.6) принципа максимума автономной задачи

$\mathrm{B}$ .

Таким образом, для выбранного набора $\xi$ выполнены все условия ПМ задачи $\mathrm{B}$ . Теорема 1 для задачи $\mathrm{B}$ доказана, а значит, она доказана и для исходной задачи $\mathrm{A}$ . $\Box$

§ 7. Задача с ограничением типа включения

Остановимся вкратце на задаче с ограничением типа включения $u(t) \in U$ . Как уже говорилось в замечании 3, просто так добавить его в задачу нельзя. Однако есть следующая возможность. Будем предполагать, что компоненты управления разбиты на две группы: $u= (u_1, u_2)$ , где $u_1\in\mathbb{R}^{r_1}$ , $u_2\in\mathbb{R}^{r_2}$ , и рассматривается задача $\mathrm{A}$ с дополнительным ограничением только на вторую группу: $u_2 \in U$ , где множество $U \subset \mathbb{R}^{r_2}$ произвольно. Назовем ее задачей $\mathrm{D}$ . (Если компонента $u_2$ отсутствует, мы возвращаемся к задаче $\mathrm{A}$ .)

Предполагается, что функции $f$ , $\varphi$ , $g$ и их первые производные по $u_1$ непрерывны по совокупности переменных $(t,x, u_1, u_2)$ на множестве $\mathcal{Q}$ , тогда как по $u_2$ дифференцируемости может не быть. В этом смысле будем говорить, что $u_1$ есть гладко входящее управление, а $u_2$ – негладко входящее.

Требование регулярности смешанных ограничений надо теперь относить только к гладко входящему управлению, т. е. предполагать, что для любой точки $(t,x,u_1,u_2)\in \mathcal{Q}$ , в которой выполнены эти ограничения вместе с $u_2 \in U$ , градиенты по $u_1$

$\begin{equation*} \varphi'_{iu_1}(t,x,u_1,u_2),\quad i\in I(t,x,u_1,u_2), \qquad g'_{ju_1}(t,x,u_1,u_2),\quad j=1,\dots, d(g), \end{equation*} \notag$

позитивно-линейно независимы. (Отметим, что это более жесткое требование, чем прежнее, в котором фигурировали градиенты по всем компонентам управления.) В этом случае по аналогии с теоремой 1 справедлива следующая теорема.

Теорема 5. Если процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}_1(t), \widehat{u}_2(t))$ , $t\in [\,\widehat t_0, \widehat t_1]$ , доставляет сильный минимум в задаче $\mathrm{D}$ , то найдутся множители $\alpha_0$ , $\alpha$ , $\beta$ и функции $\lambda(t)$ , $m(t)$ , $\mu(t)$ , $\psi_x(t)$ , $\psi_t(t)$ того же класса, что и прежде, для которых выполнены условия (i)–(vi) теоремы 1, условие (vii) заменяется на

$\begin{equation*} \overline H_{u_1}(\psi_x(t),t,\widehat{x}(t), \widehat{u}(t))=0, \end{equation*} \notag$

а условие (viii) должно выполняться для всех

$u' =(u'_1, u'_2)$ таких, что

$\begin{equation*} \varphi(t,\widehat{x}(t), u'_1, u'_2)\leqslant0,\quad g(t,\widehat{x}(t), u'_1, u'_2) =0, \qquad u'_2 \in U. \end{equation*} \notag$

Если обозначить через $\widetilde{\mathcal{R}}(t,x(t))$ множество всех $u' =(u'_1, u'_2)$ , удовлетворяющих последним трем соотношениям, то в условии максимума (2.9) надо заменить $\mathcal{R}(t,\widehat{x}(t))$ на $\widetilde{\mathcal{R}}(t,\widehat{x}(t))$ .

Доказательство, как и приведенное выше, сводится к автономному случаю и повторяет прежнее с тем лишь отличием, что теперь индекс $\theta$ состоит из конечного числа троек $(t^s, u_1^s, u_2^s)$ , для которых выполнены условия $\varphi(\widehat{x}(t^s),u^s) <0$ , $g(\widehat{x}(t^s),u^s) =0$ и дополнительно $u_2^s \in U$ , а при построении управляемой системы в $\theta$ -задаче надо брать функции $u_1 = \mathcal{U}_1^s(x,u_2^s)$ при фиксированных $u_2^s \in U$ . Детали мы оставляем читателю.

§ 8. Пример: геодезические на гладкой поверхности

Пусть в евклидовом пространстве $\mathbb{R}^n$ задана поверхность $S\colon c(x)=0$ , где $c$ – дважды гладкая функция такая, что во всех точках поверхности $c'(x) \ne 0$ . Заданы также две различные точки $x_0$ , $x_1$ этой поверхности. Требуется найти кривую кратчайшей длины, лежащую на $S$ и соединяющую данные точки.

Поставим эту задачу в виде следующей задачи быстродействия:

$\begin{equation*} \begin{gathered} \, \dot x =u, \qquad |u|\leqslant 1, \qquad x(t_0)= x_0, \qquad x(t_1)= x_1, \\ c(x(t))=0, \qquad J = t_1 -t_0 \to \min. \end{gathered} \end{equation*} \notag$

Здесь

$x$ – фазовая переменная, а ее скорость

$u$ – управление. Ясно, что если величина скорости ограничена единицей, то траектория наискорейшего движения и будет иметь наименьшую длину. Существование решения в этой задаче вытекает из классической теоремы Филиппова, так как она линейна по управлению, и множество допустимых управлений есть выпуклый компакт.

Как уже говорилось выше, фазовое ограничение равенства $c(x)=0$ недопустимо. Продифференцировав его в силу системы, и учитывая, что начальная точка $s_0$ лежит на $S$ , заменим его на равенство $x(t_0)= x_0$ и равенство нулю производной $c'(x)u=0$ . Однако при этом равенство $x(t_1)= x_1$ в конечной точке переопределено, ибо в ней мы автоматически получим $c(x(t_1))=0$ , так что совокупность всех ограничений равенства будет заведомо вырожденной. Поэтому для совпадения $x(t_1)= x_1$ достаточно требовать его выполнения лишь в касательной гиперплоскости к $S$ в точке $x_1$ .

Пусть $L(x_1)$ есть эта касательная гиперплоскость, и пусть $\xi_1,\dots, \xi_{n-1}$ есть некоторый базис в ней. Тогда при $t= t_1$ достаточно требовать, чтобы

$\begin{equation} (\xi_i,\, (x(t_1)- x_1)) =0, \qquad i=1,\dots, n-1, \end{equation} \tag{8.1}$

т. е.

$\pi_L (x(t_1)- x_1)) =0$ , где

$\pi_L\colon \mathbb{R}^n \to L(s_1)$ – ортогональная проекция на

$L(x_1)$ вдоль вектора

$c'(x_1)$ . Нетрудно показать, что в некоторой окрестности точки

$x_1$ из этого равенства и

$c(x)=0$ следует, что

$x(t_1)= x_1$ .

Итак, вместо исходной “неправильной” постановки задачи мы рассмотрим следующую постановку:

$\begin{equation} \dot x =u, \qquad x(t_0)= x_0, \quad J = t_1 -t_0 \to \min, \end{equation} \tag{8.2}$

$\begin{equation} (\xi_i,\, (x(t_1)- x_1)) =0, \qquad i=1,\dots, n-1, \end{equation} \tag{8.3}$

$\begin{equation} c'(x)u=0, \qquad (u,u)-1 \leqslant 0. \end{equation} \tag{8.4}$

Последние два соотношения будем трактовать как смешанные ограничения, а управление $u$ считать гладко входящим. Таким образом, мы имеем задачу типа $\mathrm{A}$ .

Отметим, что в любой точке $(x,u)$ , где ограничения (8.4) выполнены и $|u|=1$ , их градиенты по $u$ линейно независимы. Действительно, эти градиенты есть ненулевые векторы $c'(x)$ и $2u$ , которые в силу первого равенства ортогональны. Если же $u=0$ , то надо рассматривать лишь градиент первого ограничения $c'(x)$ , а он по условию не равен нулю. Таким образом, ограничения (8.4) регулярны, и поэтому для задачи (8.2)–(8.4) применима теорема 1.

Пусть $(\widehat{x}(t), \widehat{u}(t))$ есть оптимальная пара. Тогда найдутся число $\alpha_0\geqslant 0$ , векторы $\beta\in \mathbb{R}^n$ , $\gamma\in \mathbb{R}^{n-1}$ , липшицевы функции $\psi_x(t)$ , $\psi_t(t)$ , измеримые ограниченные функции $\lambda(t)\geqslant 0$ , $m(t)$ , не все из них равные $0$ , из которых составляется функция Понтрягина $H =(\psi_x,\,u)$ , расширенная функция Понтрягина

$\begin{equation*} \overline H = (\psi_x,u) - \frac12 \lambda(t)((u,u)-1)- m(t)(c'(x),u) \end{equation*} \notag$

и концевая функция Лагранжа

$\begin{equation*} l= \alpha_0(t_1 -t_0) +\beta (x(t_0)- x_0) + \sum_{i=1}^{n-1} \gamma_i(\xi_i,\,(x(t_1)- x_1)), \end{equation*} \notag$

для которых вдоль

$(\widehat{x}(t), \widehat{u}(t))$ выполняется следующее:

– условие дополняющей нежесткости

$\begin{equation} \lambda(t)\,\bigl((\widehat{u},\widehat{u})-1\bigr) =0; \end{equation} \tag{8.5}$

– сопряженное уравнение по $x$

$\begin{equation} \dot\psi_x = -\overline H_x = m(t)c''(\widehat{x})\widehat{u} \end{equation} \tag{8.6}$

(мы здесь пользуемся симметрией матрицы

$c''(x)$ );

– условия трансверсальности

$\begin{equation} \psi_x(t_0) = \beta, \qquad \psi_x(t_1)= - \sum_{i=1}^{n-1} \gamma_i\xi_i; \end{equation} \tag{8.7}$

– сопряженное уравнение по $t$

$\begin{equation} \psi_t= \mathrm{const} = -\alpha_0; \end{equation} \tag{8.8}$

– “закон сохранения энергии”

$\begin{equation} (\psi_x,\widehat{u})+ \psi_t= 0,\quad \text{т. е.}\quad \widehat H = (\psi_x,\widehat{u}) \equiv \alpha_0; \end{equation} \tag{8.9}$

– условие стационарности по $u$

$\begin{equation} \overline H_u= \psi_x- \lambda(t)u- m(t)c'(x)=0. \end{equation} \tag{8.10}$

Можно написать еще условие максимума

$H$ , но в силу выпуклости ограничений (8.4) по

$u$ оно вытекает из последнего равенства.

Далее “шляпку” над $x$ , $u$ не пишем и вместо $\psi_x$ пишем просто $\psi$ .

Умножим (8.10) на $u$ : $(\psi,u) - \lambda(t)(u,u) =0$ . В силу (8.5) $\lambda(t)(u,u) = \lambda(t)$ , и тогда из (8.9) $\lambda(t) \equiv \alpha_0$ .

Рассмотрим случай $\alpha_0=0$ . Тогда $\lambda(t)=0$ , и из (8.10) следует, что $\psi(t) = m(t)c'(x)$ , т. е. $\psi(t)$ пропорционально $c'(x(t))$ . Отсюда $m(t) = (k(t), \psi(t))$ с некоторой вектор-функцией $k(t)$ . Тогда (8.6) принимает вид однородного уравнения

$\begin{equation*} \dot\psi= (k, \psi)c''(x)u. \end{equation*} \notag$

При этом

$\psi(t_1) = m(t_1)\,c'(x_1)$ , а согласно (8.7) должно быть

$\psi(t_1) \in L(x_1)$ . Значит,

$\psi(t_1)=0$ , и тогда

$\psi(t) \equiv 0$ . Отсюда и из (8.7) следует что

$\beta=0$ , все

$\gamma_i=0$ , так что набор множителей тривиален, противоречие.

Следовательно, $\alpha_0=1$ , тогда $\lambda(t) \equiv 1$ , и из дополняющей нежесткости (8.5) получаем, что $|u| \equiv 1$ (движение с максимально возможной скоростью).

Итак, имеем

$\begin{equation} \dot\psi = m(t)c''(x)u, \end{equation} \tag{8.11}$

$\begin{equation} \psi = u + m(t)c'(x). \end{equation} \tag{8.12}$

Умножим последнее на

$c'(x)$ :

$\begin{equation} (\psi, c'(x))= m(t)(c'(x),c'(x)). \end{equation} \tag{8.13}$

Так как

$c'(x) \ne 0$ , то функция

$m(t)$ липшицева. Тогда

$u(t) = \psi(t) - m(t)c'(x)$ тоже липшицева, ее можно дифференцировать:

$\begin{equation*} \dot u= \dot\psi- \dot mc'(x)- mc''(x)u= - \dot mc'(x), \end{equation*} \notag$

т. е.

$\ddot x = - \dot mc'(x)$ .

Из равенства $(c'(x),\dot x)=0$ следует $(c'(x),\ddot x)+ (c''(x)\dot x, \dot x)=0$ , откуда с учетом предыдущего $\dot m(c'(x),c'(x)) = (c''(x)\dot x, \dot x)$ , поэтому

$\begin{equation*} \dot m = \frac{(c''(x)\dot x, \dot x)}{(c'(x),c'(x))}, \end{equation*} \notag$

и окончательно получаем уравнение геодезических в терминах траектории

$x(t)$ :

$\begin{equation} \ddot x= -\frac{(c''(x)\dot x, \dot x)}{(c'(x),c'(x))}c'(x). \end{equation} \tag{8.14}$

(Здесь везде переход от ковектора к вектору происходит просто транспонированием, так как мы находимся в евклидовом пространстве

$\mathbb{R}^n$ .)

В частных случаях, когда поверхность $S$ есть плоскость, сфера или цилиндр, из (8.14) получаем движение по прямой, по большому кругу и по винтовой линии со скоростью $1$ .

§ 9. Приложение

9.1. Принцип Лагранжа для задач на экстремум с бесконечным числом ограничений

Пусть $X$ , $Y$ и $Z_i$ , $i=1,\dots, \nu$ , – банаховы пространства, $\mathcal{D}\subset X$ – открытое множество, $K_i \subset Z_i$ , $i=1,\dots, \nu,$ – замкнутые выпуклые конусы с непустой внутренностью. Пусть заданы отображения $F_0\colon \mathcal{D}\to \mathbb{R}$ , $g\colon \mathcal{D}\to Y$ и $f_i \colon \mathcal{D}\to Z_i$ , $i=1,\dots, \nu$ . Рассмотрим следующую задачу на экстремум:

$\begin{equation} F_0(x)\to \min, \qquad f_i(x) \in K_i, \quad i=1,\dots, \nu, \qquad g(x)=0. \end{equation} \tag{9.1}$

Эта постановка включает большинство теоретических и прикладных задач оптимизации, в том числе задачи оптимального управления с фазовыми и смешанными ограничениями неравенства $\Phi(t,x(t)) \leqslant 0$ и $\varphi(t,x(t),u(t)) \leqslant 0$ , которые можно трактовать как принадлежность $\Phi(t,x(t))$ и $\varphi(t,x(t),u(t))$ конусам неположительных функций в пространствах $C$ и $L_\infty$ соответственно (см. [35]); различные варианты задачи (9.1) рассмотрены в [36], [37].

Предположения. 1) Целевая функция $F_0$ и отображения $f_i$ дифференцируемы по Фреше в некоторой точке $x_0 \in \mathcal{D}$ ; оператор $g$ строго дифференцируем в $x_0$ (предположения гладкости), 2) образ производной $g'(x_0)$ замкнут в $Y$ (ослабленная регулярность ограничения равенства).

Несмотря на то, что все отображения здесь дифференцируемы, задача (9.1) не является стандартной гладкой задачей, так как каждое ограничение $f_i(x)\,{\in}\, K_i$ может задаваться бесконечным числом гладких скалярных неравенств (ибо пространства $Z_i$ могут быть бесконечномерными).

Теорема 6. Пусть $x_0$ есть точка локального минимума в задаче (9.1). Тогда найдутся множители $\alpha_0\geqslant 0$ , $z_i^* \in Z^*_i$ , $i=1,\dots,\nu$ , и $y^*\in Y^*$ , не все равные нулю, такие, что $z_i^* \in K^0_i$ и $\langle z_i^*, f_i(x_0) \rangle =0$ , $i=1,\dots,\nu$ (т. е. каждый $z^*_i$ есть внешняя нормаль к конусу $K_i$ в точке $f_i(x_0)$ ), и при этом функция Лагранжа $\mathcal{L}(x) = \alpha_0 F_0(x) + \sum_{i=1}^\nu \langle z_i^*, f_i(x)\rangle + \langle y^*, g(x)\rangle$ стационарна в $x_0$ :

$\begin{equation} \mathcal{L}'(x_0) = \alpha_0 F_0'(x_0)+ \sum_{i=1}^\nu z_i^* f_i'(x_0)+ y^* g'(x_0) = 0. \end{equation} \tag{9.2}$

Последнее равенство называется уравнением Эйлера–Лагранжа.

Теорема 6 есть обобщение классического правила множителей Лагранжа на задачи с бесконечным числом ограничений. Доказательство проводится по схеме Дубовицкого–Милютина с использованием стандартных понятий и фактов функционального анализа, см. [7], [35]–[37].

9.2. Теорема об отсутствии сингулярных составляющих [15]

Пусть в пространстве $\mathbb{R}^{d(w)}$ имеется компакт $D$ , на котором заданы непрерывные вектор-функции $p_i\colon D\to \mathbb{R}^r$ , $i\in I$ , и $q_j\colon D\to \mathbb{R}^r$ , $j\in J$ , где $I$ и $J$ – конечные множества индексов. Пусть для любой точки $w\in D$ система векторов $p_i(w)$ , $i\in I$ , $q_j(w)$ , $j\in J$ , позитивно-линейно независима (ПЛН).

Пусть дано измеримое множество $E\subset \mathbb{R}$ конечной положительной меры, и измеримая функция $\widehat{w}(t)\in D$ почти всюду на $E$ .

Теорема 7. Пусть функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$ , из которых все $\lambda_i\geqslant0$ , и функция $l\in L_1^r(E)$ таковы, что для любой пробной функции $\overline u(t)\in L_\infty^r(E)$ выполнено равенство

$\begin{equation} \sum_{i\in I} \langle \lambda_i, p_i(\widehat{w}(t))\overline u(t)\rangle+ \sum_{j\in J} \langle m_j, q_j(\widehat{w}(t))\overline u(t)\rangle = \int_{E} l(t)\overline u(t)\,dt. \end{equation} \tag{9.3}$

Тогда все

$\lambda_i$ и

$m_j$ суть функции из

$L_1^r(E)$ , из них все

$\lambda_i(t)\geqslant0$ почти всюду на

$E$ .

Доказательство. Как уже отмечалось, для любой точки

$w_0\in D$ существует вектор

$\overline{v}_0$ такой, что

$p_i(w_0)\overline{v}_0> 1$ для всех

$i\in I$ и

$q_j(w_0)\overline{v}_0 =0$ для всех

$j$ . По соображениям непрерывности существует окрестность

$\mathcal{O}(w_0)$ точки

$w_0$ и непрерывная функция

$\overline{v}(w)$ такие, что на

$\mathcal{O}(w_0)$

$\begin{equation} p_i(w)\overline{v}(w)> 1\quad \forall\, i\in I, \qquad q_j(w)\overline{v}(w) =0\quad \forall\, j\in J, \end{equation} \tag{9.4}$

и при этом

$\overline{v}(w_0)= \overline{v}_0$ . (Например, можно взять проекцию вектора

$\overline{v}_0$ на общее подпространство нулей векторов

$q_j(w)$ .) В силу компактности можно выбрать конечное число этих окрестностей

$\mathcal{O}(w_s)$ ,

$s=1,\dots,\widetilde s$ , которые покрывают весь

$D$ , и на их объединении построить “кусочно непрерывную” (точнее, ограниченную борелевскую) функцию

$\overline{v}(w)$ , для которой условия (9.4) выполнены на всем

$D$ . Тогда при

$w= \widehat{w}(t)$ получаем измеримую функцию

$\overline{v}(\widehat{w}(t))$ , для которой при почти всех

$t\in E$

$\begin{equation} p_i(\widehat{w}(t))\overline{v}(\widehat{w}(t))> 1\quad \forall\, i\in I, \qquad q_j(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =0\quad \forall\, j\in J. \end{equation} \tag{9.5}$

Допустим теперь, что сингулярная составляющая есть у какого-либо функционала $\lambda_i$ , для определенности пусть это $\lambda_1$ . Таким образом, $\lambda_1 =\lambda_1' +\lambda_1''$ , где функционал $\lambda_1'$ – абсолютно непрерывный, а $\lambda_1''$ – сингулярный, сосредоточенный на некоторой последовательности множеств $E_k\subset E$ , $\operatorname{mes}E_k\to 0$ , $k=1, 2, \dots$ , причем $\|\lambda_1''\| = \gamma >0$ .

Рассмотрим последовательность функций $\overline u_k(t) = \chi_{E_k}(t)\overline{v}(\widehat{w}(t))$ . Для нее в силу (9.5) вторая сумма в (9.3) пропадает, и поэтому

$\begin{equation*} \sum_i \langle \lambda_i, p_i(\widehat{w}(t))\overline u_k(t) \rangle = \int_{E_k} l(t)\overline u(t)\,dt. \end{equation*} \notag$

Поскольку все

$\lambda_i\geqslant 0$ (а тогда все

$\lambda_i'\geqslant 0$ и

$\lambda_i''\geqslant 0)$ , то левая часть последнего равенства не меньше, чем

$\begin{equation*} \langle \lambda_1'', \chi_{E_k}\rangle= \langle \lambda_1'', \mathbf{1}\rangle= \|\lambda_1''\| = \gamma > 0 \end{equation*} \notag$

(где

$\mathbf{1}(t)\equiv 1$ ), тогда как правая часть стремится к нулю в силу абсолютной непрерывности интеграла Лебега. Противоречие. Таким образом, у функционалов

$\lambda_i$ сингулярных составляющих быть не может, все они регулярны:

$\lambda_i\in L_1^r(E)$ ,

$i\in I$ .

Тогда равенство (9.3) приобретает вид

$\begin{equation} \sum_j \langle m_j,q_i(\widehat{w}(t))\overline u(t)\rangle = \int_{E} l'(t)\overline u(t)\,dt, \end{equation} \tag{9.6}$

где

$l'(t)$ – некоторая новая функция из

$L^r_1(E)$ .

Допустим теперь, что один из функционалов $m_j$ , например $m_1$ , имеет ненулевую сингулярную составляющую, т. е. $m_1 = m_1' + m_1''$ , где функционал $m_1'$ – абсолютно непрерывный, а $m_1''$ – сингулярный, сосредоточенный на множествах $E_k\subset E$ , $\operatorname{mes}E_k\to 0$ , причем $\|m_1''\|=\gamma >0$ . Возьмем опять любую точку $w_0\in D$ . Поскольку векторы $q_j(w_0)$ , $j\in J$ , линейно независимы, то существует вектор $\overline{v}_0$ такой, что $q_1(w_0)\overline{v}_0 =1$ и $q_i(w_0)\overline{v}_0 =0$ для всех $j\ne 1$ . Более того, существует окрестность $\mathcal{O}(w_0)$ и непрерывная функция $\overline{v}(w)$ такие, что на $\mathcal{O}(w_0)$

$\begin{equation} q_1(w)\overline{v}(w) =1, \qquad q_j(w)\overline{v}(w) =0\quad \forall\, j\ne 1, \end{equation} \tag{9.7}$

и при этом

$\overline{v}(w_0)= \overline{v}_0$ . (Можно взять проекцию вектора

$\overline{v}_0$ на общее подпространство нулей векторов

$q_j(w)$ ,

$j\ne 1$ , и затем нормировать ее.) В силу компактности можно выбрать конечное число этих окрестностей

$\mathcal{O}(w_s)$ ,

$s=1,\dots,\widetilde s$ , которые покрывают весь

$D$ , и на их объединении построить ограниченную борелевскую функцию

$\overline{v}(w)$ , для которой условия (9.7) выполнены на всем

$D$ . Тогда при

$w= \widehat{w}(t)$ получаем измеримую функцию

$\overline{v}(\widehat{w}(t))$ , для которой при почти всех

$t\in E$

$\begin{equation} q_1(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =1, \qquad q_j(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =0\quad \forall\, j\ne 1. \end{equation} \tag{9.8}$

Пусть $z(t)\in L_\infty (E)$ – такая функция, для которой $\langle m_1'', z\rangle =1$ . Тогда для $\overline u(t) = z(t)\,\overline{v}(\widehat{w}(t))$ имеем

$\begin{equation*} q_1(\widehat{w}(t))\overline u(t) = z(t), \qquad q_j(\widehat{w}(t))\overline u(t) =0\quad \forall\, j\ne 1, \end{equation*} \notag$

а для последовательности

$\overline u_k(t) = \chi_{E_k}(t)\overline u(t)$ получим из (9.6)

$\begin{equation*} \langle m_1, q_1(\widehat{w}(t))\overline u_k(t)\rangle = \int_{E_k} l'(t)\overline u(t)\,dt, \end{equation*} \notag$

т. е.

$\begin{equation} \langle m_1'', q_1(\widehat{w}(t))\overline u_k(t)\rangle= -\langle m_1', q_1(\widehat{w}(t))\overline u_k(t) \rangle + \int_{E_k} l'(t) \overline u(t)\,dt. \end{equation} \tag{9.9}$

Но поскольку при всех

$k$

$\begin{equation*} \langle m_1'', q_1(\widehat{w}(t)\,\overline u_k(t)\rangle= \langle m_1'', q_1(\widehat{w}(t)\,\overline u(t)\rangle = \langle m_1'', z \rangle =1, \end{equation*} \notag$

то левая часть в (9.9) при всех

$k$ равна

$1$ , а правая стремится к нулю, т. е. опять приходим к противоречию. Таким образом, функционалы

$m_j$ также не могут иметь сингулярных составляющих. Теорема 7 доказана⁵^[x]⁵Чуть более общий вариант этой теоремы приведен в [7], [35], где вместо вектор-функций

$p_i(\widehat{w}(t))$ ,

$q_j(\widehat{w})(t)$ рассматривались произвольные вектор-функции

$A_i(t)$ ,

$B_j(t)$ , равномерно позитивно-линейно независимые на множестве

$E$ ..

Следующая теорема является обобщением доказанной на случай, когда набор векторов $p_i(w)$ , входящих в ПЛН систему, зависит от точки $w$ . А именно, пусть на компакте $D$ , кроме вектор-функций $p_i$ , $q_j$ , заданы также непрерывные скалярные функции $\varphi_i(w)\leqslant 0$ , $i\in I$ , и пусть для любой точки $w\in D$ система векторов $p_i(w)$ , $i\in I(w)$ , $q_j(w)$ , $j\in J$ , где $I(w) = \{i\in I \mid \varphi_i(w) =0\}$ есть множество активных индексов для точки $w$ , ПЛН.

Пусть опять дано измеримое множество $E$ и измеримая функция $\widehat{w}(t)\in D$ почти всюду на $E$ . По-прежнему даны функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$ , но теперь каждый $\lambda_i\geqslant0$ и сосредоточен на множестве $M_i^\delta = \{ t\mid \varphi_i(\widehat{w}(t))\geqslant -\delta\}$ при любом $\delta>0$ .

Теорема 8. Пусть функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$ , из которых все $\lambda_i\geqslant0$ , и функция $l\in L_1^r(E)$ таковы, что для любой пробной функции $\overline u(t)\in L_\infty^r(E)$ выполнено равенство (9.3). Тогда все $\lambda_i$ и $m_j$ суть функции из $L_1^r(E)$ , откуда следует, что все $\lambda_i(t)\geqslant 0$ и $\lambda_i(t)\varphi_i(\widehat{w}(t))=0$ почти всюду на $E$ .

Доказательство. Возьмем любое множество индексов

$\Gamma \subset I$ и определим компакт

$D_\Gamma = \{w \in D\mid \varphi_i(w)=0\ \forall\, i\in \Gamma\}$ . В частности,

$D_{\varnothing}= D$ .

Для каждого $\delta>0$ определим также более широкий компакт $D_\Gamma^\delta = \{w \,{\in}\, D\mid \varphi_i(w)\geqslant -\delta\ \forall\, i\in \Gamma\}$ . Очевидно, $\bigcap_{\delta>0} D_\Gamma^\delta = D_\Gamma$ , и поэтому найдется $\delta>0$ , для которого векторы $p_{i}(w)$ , $i\in \Gamma$ , $q_j(w)$ , $j \in J$ , ПЛН в любой точке $w\in D_\Gamma^\delta$ . В силу конечности множества всех $\Gamma$ существует $\delta>0$ , общее для них всех. Уменьшая его, если надо, считаем, что если $D_{\Gamma_1} \cap D_{\Gamma_1} =\varnothing$ , то и $D_{\Gamma_1}^\delta \cap D_{\Gamma_1}^\delta =\varnothing$ . Совокупность всех этих компактов частично упорядочена по включению: если $\Gamma_1\subset \Gamma_2$ , то $D_1^\delta\supset D_2^\delta$ , и для любых $\Gamma_1$ , $\Gamma_2$ будет $D_{\Gamma_1\cup I_2}^\delta = D_{\Gamma_1}^\delta \cap D_{\Gamma_2}^\delta$ .

Имея функцию $\widehat{w}(t)$ , для каждого $\Gamma$ определим измеримое множество $M_\Gamma^\delta = \{t\in E\mid \widehat{w}(t) \in D_\Gamma^\delta\}$ . Пусть $\mathcal{G}$ есть семейство всех “существенных” множеств $\Gamma$ , т. е. тех, для которых $M_\Gamma^\delta$ имеет положительную меру. Ясно, что $\mathcal{G}$ также частично упорядочено по включению. На этом множестве возьмем любой максимальный элемент $\Gamma_1$ , т. е. такой, что при любом другом $\Gamma \supset \Gamma_1$ множество $M_\Gamma^\delta$ имеет нулевую меру. Другими словами, на $M_{\Gamma_1}^\delta$ при всех $i\in \Gamma_1$ функции $\varphi_i(\widehat{w}(t)) \geqslant -\delta$ , а при “чужих” $i\notin \Gamma_1$ имеем $\varphi_i(\widehat{w}(t)) <-\delta$ .

Рассмотрим равенство (9.3) для всех $\overline u(t)$ , сосредоточенных на множестве $M_{\Gamma_1}^\delta$ . По условию все функционалы $\lambda_i$ сосредоточены на своих $M_i^\delta$ , а из максимальности $\Gamma_1$ следует, что при $i\notin \Gamma_1$ все они равны нулю на $M_{\Gamma_1}^\delta$ , и поэтому в первой сумме здесь можно оставить только $i\in \Gamma_1$ :

$\begin{equation*} \sum_{i\in \Gamma_1} \langle \lambda_i,p_i(\widehat{w}(t))\overline u(t)\rangle+ \sum_{j\in J} \langle m_j,q_j(\widehat{w}(t))\overline u(t) \rangle = \int_{M_{\Gamma_1}^\delta} l(\tau)\overline u(\tau)\,d\tau. \end{equation*} \notag$

Тогда к набору

$\lambda_i$ ,

$i\in \Gamma_1$ ,

$m_j$ ,

$j\in J$ , компакту

$D_{\Gamma_1}^\delta$ и множеству

$M_{\Gamma_1}^\delta$ применима теорема 7, согласно которой все функционалы из этого набора, суженные на

$M_\Gamma^\delta$ , абсолютно непрерывны. Таким образом, остается рассмотреть равенство (9.3) на множестве

$E_1 = E \setminus M_{\Gamma_1}^\delta$ .

Для этого множества семейство $\mathcal{G}$ существенных $\Gamma \subset I$ будет меньше, по крайней мере на $\Gamma_1$ , и мы опять проделаем ту же процедуру: возьмем любой максимальный элемент $\Gamma_2$ , для него все “чужие” функционалы $\lambda_i=0$ на $M_{\Gamma_2}^\delta$ , а “свои” $\lambda_i$ , $i\in \Gamma_2$ , и $m_j$ , $j\in J$ , суженные на $M_{\Gamma_2}^\delta$ , по теореме 7 будут абсолютно непрерывны, так что останется перейти к множеству $E_2 = E_1 \setminus M_{\Gamma_2}^\delta$ , и так далее. За конечное число шагов придем к ситуации, когда $\mathcal{G}$ будет состоять из единственного множества $\Gamma_N$ . Тогда по теореме 7 получим, что на $M_{\Gamma_N}^\delta$ все $\lambda_i$ , $i\in \Gamma_N$ , и $m_j$ , $j\in J$ , абсолютно непрерывны, а на оставшемся множестве $E_N$ все $\lambda_i =0$ , и поэтому все $m_j$ , $j\in J$ , опять по теореме 7, абсолютно непрерывны. Теорема 8 доказана. $\Box$

Применяя эту теорему к равенству (4.3), скалярным функциям $\varphi_i(w)$ , вектор-функциям $p_i(w)\,{=}\, \varphi'_{iu}(w)$ и $q_j(w) \,{=}\, g'_{ju}(w)$ , множеству $E_+$ задачи $\mathrm{B}^\theta$ , компакту $D = \{w \in \widehat D\mid \varphi(w)\leqslant 0,\, g(w)=0\}$ , где $\widehat D$ – компакт, содержащий оптимальный процесс, и функции $w^\theta(\tau)\in D$ , получаем, что все функционалы $\lambda_i$ и $m_j$ суть функции из $L_1^r(E_+)$ .

9.3. Некоторые свойства функций ограниченной вариации

Пусть на отрезке $\Delta=[t_0,t_1]$ рассматривается линейное дифференциальное уравнение относительно вектор-функции $\psi \in BV(\Delta)$ (здесь мы считаем ее столбцом):

$\begin{equation} d\psi(t)= A(t)\psi(t)\,dt+B(t)\lambda(t)\,dt+ G(t)\,d\mu(t), \qquad \psi(t_0) = \psi_0, \end{equation} \tag{9.10}$

где

$A$ ,

$B$ ,

$G$ – заданные измеримые матрицы соответствующих размерностей, из них

$A$ интегрируема⁶^[x]⁶Для доказательства ПМ достаточно считать, что матрица

$A$ тоже ограничена.,

$B$ ,

$G$ ограничены, функция

$\mu\in BV(\Delta)$ (т. е. мера

$d\mu\in C^*(\Delta))$ , функция

$\lambda\in L_1(\Delta)$ , и вектор

$\psi_0 \in \mathbb{R}^{d(\psi)}$ .

Если считать функции $\psi\in BV(\Delta)$ непрерывными слева, т. е. $\psi(t-0)= \psi(t)$ для $t\in (t_0,t_1]$ , положить $\psi(t_0-0)= \psi(t_0)$ и считать, что имеется также значение $\psi(t_1+0)$ , то мера $d\psi$ и функция $\psi$ связаны следующим образом:

$\begin{equation*} \psi(t) = \int_{t_0-0}^{t-0} d\psi, \quad t\in (t_0,t_1], \quad \text{и} \quad \psi(t_1+0) = \psi(t_1) + \Delta\psi(t_1), \end{equation*} \notag$

при этом

$\begin{equation*} \|d\psi\|_{C^*}= \int_{t_0-0}^{t_1+0} |d\psi|,\qquad \|\psi\|_{BV} = |\psi(t_0)| + \|d\psi\|_{C^*}. \end{equation*} \notag$

Отметим, что

$\|\psi\|_\infty = \max_{[t_0-0,\, t_1+0]} |\psi(t)| \leqslant \|\psi\|_{BV}$ . Если

$\psi$ абсолютно непрерывна, то

$\|\psi\|_{BV} = \|\psi\|_{AC} = |\psi(t_0)| + \int_{t_0}^{t_1} |\dot\psi(t)|\,dt$ .

Излагаемые в этом пункте факты хорошо известны, их доказательства приводятся здесь для удобства читателя. Следующая лемма фактически взята нами из книги [30].

Лемма 6. При любом начальном значении $\psi(t_0)=\psi_0$ уравнение (9.10) имеет единственное решение $\psi(t)$ , оно непрерывно во всех точках непрерывности меры $d\mu$ и удовлетворяет оценке

$\begin{equation} \|\psi\|_{BV} \leqslant \mathrm{const} \biggl(|\psi_0| + \int_{t_0}^{t_1}|\lambda(t)|\,dt + \int_{t_0-0}^{t_1+0}|d\mu(t)| \biggr). \end{equation} \tag{9.11}$

Доказательство. Введем функцию ограниченной вариации

$\begin{equation} \rho(t) = \int_{t_0}^{t-0} \bigl(B(\tau)\lambda(\tau)\,d\tau + G(\tau)\,d\mu(\tau)\bigr), \qquad \rho(t_0)=0. \end{equation} \tag{9.12}$

Ясно, что она непрерывна во всех точках непрерывности меры

$d\mu$ и порождает меру

$d\rho = B \lambda\,dt + G\,d\mu$ . При этом

$\|\rho\|_{BV} \leqslant \mathrm{const}(\|\lambda\|_1 + \|d\mu\|_{C^*})$ , а уравнение (9.10) имеет теперь вид

$\begin{equation} d\psi(t)= A(t) \psi(t)\,dt+ d\rho(t), \qquad \psi(t_0) = \psi_0. \end{equation} \tag{9.13}$

Будем искать его решение в виде

$\psi = \overline\psi +\rho$ . Тогда

$d\overline\psi = A(\overline\psi + \rho)\, dt$ , значит функция

$\overline\psi$ абсолютно непрерывна и подчинена линейному ОДУ

$\begin{equation} \dot{\overline\psi}= A(\overline\psi +\rho), \qquad \overline\psi(t_0) = \psi_0. \end{equation} \tag{9.14}$

Как известно, оно имеет единственное решение, причем

$\begin{equation*} \|\overline\psi\|_{BV}= \|\overline\psi\|_{AC} \leqslant \mathrm{const}(|\psi_0| + \|\rho\|_\infty) \leqslant \mathrm{const}(|\psi_0| + \|\rho\|_{BV}). \end{equation*} \notag$

Отсюда для

$\psi = \overline\psi +\rho$ получаем требуемую оценку (9.11), что и требовалось доказать.

$\Box$

Лемма 7. Пусть при $k\to\infty$ функции $\lambda^k \to \lambda^0$ слабо (в пространстве $L_1(\Delta)$ относительно $L_\infty(\Delta))$ , меры $d\mu^k \to d\mu^0$ слабо- $*$ в пространстве $C^*(\Delta)$ и начальные значения $\psi^k_0\to \psi^0_0$ . Тогда для соответствующих решений уравнения (9.10) имеется сходимость $\psi^k(t)\to \psi^0(t)$ во всех точках непрерывности предельной меры $d\mu^0$ , и, значит, почти всюду на $\Delta$ . Кроме того, $\|\psi^k\|_\infty \leqslant\mathrm{const}$ , $\|\psi^k -\psi^0\|_1 \to0$ , а меры $d\psi^k \to d\psi^0$ слабо- $*$ в $C^*(\Delta)$ .

Доказательство. Построим функции

$\rho^k$ и

$\rho^0$ , соответствующие тройкам

$(\lambda^k, d\mu^k, \psi^k_0)$ и

$(\lambda^0, d\mu^0, \psi^0_0)$ по формуле (9.12). Из условия леммы следует, что меры

$d\rho^k \to d\rho^0$ слабо-

$*$ в

$C^*(\Delta)$ , а тогда, как известно,

$\rho^k(t)\to \rho^0(t)$ во всех точках непрерывности предельной меры

$d\rho^0$ , и тем более во всех точках непрерывности меры

$d\mu^0$ . В силу (9.12)

$\|\rho^k\|_\infty \leqslant \mathrm{const} (\|\lambda^k\|_1 + \|d\mu^k\|) \leqslant \mathrm{const}$ , откуда по теореме Лебега

$\|A(t)(\rho^k(t) -\rho^0(t))\|_1 \to 0$ , и тогда из (9.14) следует, что соответствующие

$\overline\psi^{\,k}$ сходятся к

$\overline\psi^{\,0}$ всюду на

$\Delta$ , поэтому

$\psi^k(t)\to \psi^0(t)$ во всех точках непрерывности меры

$d\mu^0$ . Поскольку

$\|\psi^k\|_\infty \leqslant \|\psi^k\|_{BV} \leqslant \mathrm{const}$ в силу (9.11), то

$\|\psi^k -\psi^0\|_1 \to0$ и

$\|A(t)(\psi^k(t) -\psi^0(t))\|_1 \to 0$ , тогда из равенства (9.13) следует, что меры

$d\psi^k \to d\psi^0$ слабо-

$*$ сходятся в

$C^*(\Delta)$ .

$\Box$

Лемма 8 (о пределе скачков мер). Пусть меры $d\mu^k \geqslant0$ и $d\mu^k \to d\mu^0$ слабо- $*$ на отрезке $\Delta = [t_0, t_1]$ . Тогда для любой точки $t_* \in \Delta$

$\begin{equation} \limsup_k \Delta\mu^k(t_*) \leqslant \Delta\mu^0(t_*). \end{equation} \tag{9.15}$

(В слабом-

$*$ пределе мера может концентрироваться в данной точке.)

Доказательство. Положим

$\Delta\mu^0(t_*) = c\geqslant0$ . Рассмотрим сначала случай

$t_* \in \operatorname{int}\Delta$ . Возьмем любое

$\varepsilon>0$ и любые две точки

$t'< t_*< t''$ такие, что

$\mu^0(t'') -\mu^0(t') < c+\varepsilon$ . Тогда и на любом меньшем отрезке

$[\tau_1,\tau_2] \subset [t',t'']$ по-прежнему будет

$\mu^0(\tau_2) -\mu^0(\tau_1)< c+\varepsilon$ . В силу слабой-

$*$ сходимости

$d\mu^k \to d\mu^0$ , на отрезке

$[t',t'']$ имеется сходимость почти всюду. Возьмем теперь любые две точки

$\tau_1\in (t',t_*)$ и

$\tau_2\in (t_*, t'')$ , в которых есть сходимость:

$\begin{equation*} \mu^k(\tau_1) \to \mu^0(\tau_1), \qquad \mu^k(\tau_2) \to \mu^0(\tau_2). \end{equation*} \notag$

Тогда при больших

$k$ имеем

$\begin{equation*} \Delta\mu^k(t_*) \leqslant \mu^k(\tau_2) - \mu^k(\tau_1)= \mu^0(\tau_2) - \mu^0(\tau_1) + o(1)< c+\varepsilon + o(1), \end{equation*} \notag$

откуда

$\limsup_k\Delta\mu^k(t_*) \leqslant c+\varepsilon$ . В силу произвольности

$\varepsilon$ получаем оценку (9.15). В случае

$t_* =t_0$ или

$t_* =t_1$ требуется лишь небольшая модификация этих рассуждений. Лемма доказана.

Лемма 9. Пусть меры $d\mu^k \geqslant0$ и $d\mu^k \to d\mu^0$ слабо- $*$ на отрезке $\Delta = [t_0, t_1]$ . Тогда для любого отрезка $D \subset \Delta$

$\begin{equation*} \limsup_k \int_{D} d\mu^k \leqslant \int_{D} d\mu^0. \end{equation*} \notag$

Доказательство аналогично предыдущему; мы его опускаем.

Лемма 10. Пусть даны меры $d\mu^k \geqslant0$ , $d\mu^k \xrightarrow{\textrm{слабо-}*} d\mu^0$ , $\mu^k(t_0)= \mu^0(t_0)=0$ , функции $b^k \in L_1(\Delta)$ , $b^k \to b^0 \in L_1(\Delta)$ слабо, и меры

$\begin{equation*} \begin{alignedat}{1} d h^k &= b^k(t)\,dt+ a(t)\,d\mu^k, \\ d h^0 &= b^0(t)\,dt+ a(t)\,d\mu^0, \end{alignedat} \qquad h^k(t_0)\to h^0(t_0), \end{equation*} \notag$

где функция

$a(t)$ непрерывна на

$\Delta$ . Пусть в некоторой точке

$t_*\in \operatorname{int} \Delta$ при всех

$k$ выполнены неравенства

$\begin{equation} h^k(t_*-0)+ \rho^k a(t_*)\Delta\mu^k(t_*) \leqslant 0, \qquad \rho^k \in [0,1]. \end{equation} \tag{9.16}$

Тогда найдется

$\rho^0 \in [0,1]$ такое, что

$\begin{equation} h^0(t_*-0)+ \rho^0 a(t_*)\Delta\mu^0(t_*) \leqslant 0. \end{equation} \tag{9.17}$

Доказательство. Рассмотрим случай

$a(t_*)\geqslant0$ . Полагая все

$\rho^k=0$ , имеем

$h^k(t_*-0)\leqslant 0$ . Покажем, что и в пределе будет

$h^0(t_*-0) \leqslant 0$ .

Из слабой- $*$ сходимости $d\mu^k \to d\mu^0$ вытекает, что нормы $\|d\mu^k\|_{C^*}$ ограничены некоторой константой $M$ . Зафиксируем любое $\varepsilon>0$ . Из непрерывности $a(t)$ и слабой сходимости $b^k \to b^0$ вытекает, что найдется $\delta>0$ такое, что на интервале $(t_* -\delta,\, t_*)$ имеем $a(t)\geqslant - \varepsilon/M$ , и при всех $k$ выполняется оценка

$\begin{equation*} \int_{t_* -\delta}^{t_*} |b^k(t)|\,dt < \varepsilon. \end{equation*} \notag$

Тогда на этом интервале

$\begin{equation*} h^k(t_*-0)- h^k(t) \geqslant -\int |b^k(t)|\,dt- \frac{\varepsilon}{M} \int d\mu^k \geqslant - 2\varepsilon, \end{equation*} \notag$

откуда

$h^k(t) \leqslant h^k(t_*-0) +2\varepsilon$ . Так как по условию

$h^k(t_*-0) \leqslant 0$ , то отсюда получаем

$h^k(t)\leqslant 2\varepsilon$ на интервале

$(t_* -\delta,\, t_*)$ . Поскольку

$\varepsilon$ и

$\delta$ не зависят от номера

$k$ , а из условий леммы следует, что

$h^k(t) \to h^0(t)$ почти всюду, то

$h(t)\leqslant 2\varepsilon$ на том же интервале, а значит, и

$h(t_*-0)\leqslant 2\varepsilon$ . В силу произвольности

$\varepsilon>0$ отсюда получаем

$h(t_*-0)\leqslant 0$ , что и требовалось доказать.

В случае $a(t_*)< 0$ , полагая все $\rho^k=1$ , получаем $h^k(t_*-0) + a(t_*)\Delta\mu^k(t_*) = h^k(t_*+0)\leqslant0$ при всех $k$ . Сделав замену $t \mapsto \tau = t_0+t_1-t$ , приходим к рассмотренному случаю $\widetilde a(\tau_*) = -a(\tau_*)>0$ с неравенством $\widetilde h^k(\tau_*-0) \leqslant0$ . $\Box$

Следующая лемма есть обобщение доказанной на случай конечного числа мер $d\mu^k$ .

Пусть даны меры $d\mu^k_j \geqslant0,$ $d\mu^k_j \xrightarrow{\text{слабо-}*} d\mu^0_j$ при $k\to \infty$ , $\mu^k_j(t_0)= \mu^0_j(t_0)=0$ , $j=1,\dots, N$ , функции $b^k \in L_1(\Delta),\;$ $b^k \to b^0 \in L_1(\Delta)$ слабо, и меры

$\begin{equation*} \begin{alignedat}{1} d h^k &= b^k(t)\,dt+ a_1(t)\,d\mu^k_1 + \dots + a_N(t)\, d\mu^k_N, \\ d h^0 &= b^0(t)\,dt+ a_1(t)\,d\mu^0_1 + \dots + a_N(t)\,d\mu^0_N, \end{alignedat} \qquad h^k(t_0)\to h^0(t_0), \end{equation*} \notag$

где

$N$ – натуральное число и функции

$a_j(t)\geqslant 0$ непрерывны на

$\Delta$ .

Ясно, что при этом $d h^k \xrightarrow{\text{слабо-}*} d h^0$ и $h^k(t)\to h^0(t)$ почти всюду на $\Delta$ .

Лемма 11. Пусть в некоторой точке $t_*\in \operatorname{int} \Delta$ при всех $k$ выполнены неравенства

$\begin{equation} h^k(t_*-0)+ \sum_{j=1}^N \rho^k_j a_j(t_*)\Delta\mu^k_j(t_*) \leqslant 0, \qquad \rho^k_j \in [0,1]. \end{equation} \tag{9.18}$

Тогда найдутся числа

$\rho^0_j \in [0,1]$ такие, что

$\begin{equation} h^0(t_*-0)+ \sum_{j=1}^N \rho^0_j a(t_*)\Delta\mu^0_j(t_*) \leqslant 0. \end{equation} \tag{9.19}$

Доказательство. Возьмем любые числа

$\gamma_j$ ,

$j=1,\dots, N$ , такие, что

$\sum \gamma_j\,{=}\,1$ . Для каждого

$j$ введем меры

$\begin{equation*} d h^k_j = \gamma_j b^k\,dt + a_j\,d \mu^k_j, \quad h^k_j(t_0)= \gamma_j h^k(t_0), \qquad k = 0,1,2,\dots, \end{equation*} \notag$

и тем самым определим функции

$h^k_j(t)$ . Положим

$\widetilde h^k = \sum_j h^k_j$ . Тогда

$d\widetilde h^k = d h^k$ ,

$\widetilde h^k(t_0) = h^k(t_0)$ , и поэтому

$\widetilde h^k = h^k$ всюду на

$\Delta$ , если считать их непрерывными слева. Для каждого

$j=1,\dots, N$ пусть

$\begin{equation*} h^k_j(t_*-0)+ \rho^k_j a_j(t_*)\Delta\mu^k_j(t_*)= c_j. \end{equation*} \notag$

Суммируя по всем

$j$ , в силу (9.18) имеем

$\sum c_j\leqslant0$ . По лемме 10 (примененной к функциям

$h^k_j(t) - c_j$ и

$\widetilde b^k_j(t) = \gamma_jb^k(t)$ при каждом

$j$ ) найдутся числа

$\rho^0_j\in [0,1]$ такие, что

$\begin{equation*} h^0_j(t_*-0)+ \rho^0_j a_j(t_*)\Delta\mu^0_j(t_*) \leqslant c_j. \end{equation*} \notag$

Суммируя это неравенство по всем

$j=1,\dots, N$ и учитывая, что

$h^0_j = \gamma_j h^0$ , получаем (9.19).

$\Box$

Автор выражает благодарность Н. П. Осмоловскому за полезные обсуждения.



Список литературы

1.	Р. В. Гамкрелидзе, “Оптимальные процессы управления при ограниченных фазовых координатах”, Изв. АН СССР. Сер. матем., 24:3 (1960), 315–356
2.	M. R. Hestenes, Calculus of variations and optimal control theory, John Wiley & Sons, Inc., New York–London–Sydney, 1966, xii+405 pp.
3.	R. F. Hartl, S. P. Sethi, R. G. Vickson, “A survey of the maximum principles for optimal control problems with state constraints”, SIAM Rev., 37:2 (1995), 181–218
4.	A. Dmitruk, I. Samylovskiy, “On the relation between two approaches to necessary optimality conditions in problems with state constraints”, J. Optim. Theory Appl., 173:2 (2017), 391–420
5.	А. Я. Дубовицкий, А. А. Милютин, “Задачи на экстремум при наличии ограничений”, Ж. вычисл. матем. и матем. физ., 5:3 (1965), 395–453 ; англ. пер.: A. Ya. Dubovitskii, A. A. Milyutin, “Extremum problems in the presence of restrictions”, U.S.S.R. Comput. Math. Math. Phys., 5:3 (1965), 1–80
6.	А. А. Милютин, “Принцип максимума в регулярной задаче оптимального управления”, Необходимое условие в оптимальном управлении, Гл. 1–5, Наука, М., 1990
7.	А. А. Милютин, А. В. Дмитрук, Н. П. Осмоловский, Принцип максимума в оптимальном управлении, МГУ, мех.-матем. ф-т, М., 2004, 168 с. https://kafedra-opu.ru/node/139
8.	А. А. Милютин, “Общие схемы получения необходимых условий экстремума и задачи оптимального управления”, УМН, 25:5(155) (1970), 110–116 ; англ. пер.: A. A. Milyutin, “General schemes of necessary conditions for extrema and problems of optimal control”, Russian Math. Surveys, 25:5 (1970), 109–115
9.	А. Я. Дубовицкий, А. А. Милютин, “Необходимые условия слабого экстремума в задачах оптимального управления со смешанными ограничениями типа неравенства”, Ж. вычисл. матем. и матем. физ., 8:4 (1968), 725–779 ; англ. пер.: A. Ya. Dubovitskii, A. A. Milyutin, “Necessary conditions for a weak extremum in optimal control problems with mixed constraints of the inequality type”, U.S.S.R. Comput. Math. Math. Phys., 8:4 (1968), 24–98
10.	А. Я. Дубовицкий, А. А. Милютин, Необходимые условия слабого экстремума в общей задаче оптимального управления, Наука, Ин-т хим. физики АН СССР, М., 1971, 113 с.
11.	А. Я. Дубовицкий, А. А. Милютин, “Теория принципа максимума”, Методы теории экстремальных задач в экономике, ред. В. Л. Левин, Наука, ЦЭМИ, М., 1981, 6–47
12.	K. Makowski, L. W. Neustadt, “Optimal control problems with mixed control-phase variable equality and inequality constraints”, SIAM J. Control, 12:2 (1974), 184–228
13.	А. М. Тер-Крикоров, “Выпуклое программирование в пространстве, сопряженном пространству Банаха, и выпуклые задачи оптимального управления с фазовыми ограничениями”, Ж. вычисл. матем. и матем. физ., 16:2 (1976), 351–358 ; англ. пер.: A. M. Ter-Krikorov, “Convex programming in a space adjoint to a Banach space and convex optimal control problems with phase constraints”, U.S.S.R. Comput. Math. Math. Phys., 16:2 (1976), 68–75
14.	А. Н. Дюкалов, А. Е. Илютович, “Признак оптимальности в нелинейных задачах оптимального управления со смешанными ограничениями. I”, Автомат. и телемех., 1977, № 3, 96–106 ; II, № 5, 11–20 ; англ. пер.: A. N. Dyukalov, A. Y. Ilyutovich, “Indicator of optimality in nonlinear control problems with mixed constraints. I”, Autom. Remote Control, 38:3 (1977), 381–389; “Features of optimality in nonlinear problems of optimal control with mixed constraints. II”:5, 620–628
15.	А. В. Дмитрук, “Принцип максимума для общей задачи оптимального управления с фазовыми и регулярными смешанными ограничениями”, Оптимальность управляемых динамических систем, 14, Наука, ВНИИСИ, М., 1990, 26–42 ; англ. пер.: A. V. Dmitruk, “Maximum principle for the general optimal control problem with phase and regular mixed constraints”, Comput. Math. and Modeling, 4 (1993), 364–377
16.	Р. В. Гамкрелидзе, “О скользящих оптимальных режимах”, Докл. АН СССР, 143:6 (1962), 1243–1245 ; англ. пер.: R. V. Gamkrelidze, “Optimal sliding states”, Soviet Math. Dokl., 3 (1962), 559–562
17.	E. N. Devdariani, Yu. S. Ledyaev, “Maximum principle for implicit control systems”, Appl. Math. Optim., 40:1 (1999), 79–103
18.	M. d. R. de Pinho, J. F. Rosenblueth, “Necessary conditions for constrained problems under Mangasarian–Fromowitz conditions”, SIAM J. Control Optim., 47:1 (2008), 535–552
19.	F. Clarke, M. R. de Pinho, “Optimal control problems with mixed constraints”, SIAM J. Control Optim., 48:7 (2010), 4500–4524
20.	H. A. Biswas, M. d. R. de Pinho, “A maximum principle for optimal control problems with state and mixed constraints”, ESAIM Control Optim. Calc. Var., 21:4 (2015), 939–957
21.	A. Boccia, M. D. R. de Pinho, R. B. Vinter, “Optimal control problems with mixed and pure state constraints”, SIAM J. Control Optim., 54:6 (2016), 3061–3083
22.	An Li, J. J. Ye, “Necessary optimality conditions for optimal control problems with nonsmooth mixed state and control constraints”, Set-Valued Var. Anal., 24:3 (2016), 449–470
23.	R. Andreani, V. A. de Oliveira, J. T. Pereira, G. N. Silva, “A weak maximum principle for optimal control problems with mixed constraints under a constant rank condition”, IMA J. Math. Control Inform., 37:3 (2020), 1021–1047
24.	Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко, Математическая теория оптимальных процессов, Физматгиз, М., 1961, 391 с. ; 2-е изд., Наука, М., 1969, 384 с. ; англ. пер. 1-го изд.: L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mishchenko, The mathematical theory of optimal processes, Intersci. Publ. John Wiley & Sons, Inc., New York–London, 1962, viii+360 с.
25.	А. В. Дмитрук, Н. П. Осмоловский, “О доказательстве принципа максимума Понтрягина с помощью игольчатых вариаций”, Фундамент. и прикл. матем., 19:5 (2014), 49–73 ; англ. пер.: A. V. Dmitruk, N. P. Osmolovskii, “On the proof of Pontryagin's maximum principle by means of needle variations”, J. Math. Sci. (N.Y.), 218:5 (2016), 581–598
26.	Г. Г. Магарил-Ильяев, “Принцип максимума Понтрягина. Ab ovo usque ad mala”, Оптимальное управление, Сборник статей. К 105-летию со дня рождения академика Льва Семеновича Понтрягина, Труды МИАН, 291, МАИК «Наука/Интерпериодика», М., 2015, 215–230 ; англ. пер.: G. G. Magaril-Il'yaev, “The Pontryagin maximum principle. Ab ovo usque ad mala”, Proc. Steklov Inst. Math., 291 (2015), 203–218
27.	А. В. Дмитрук, Н. П. Осмоловский, “Вариации типа $v$ -замены времени в задачах с фазовыми ограничениями”, Выпуск посвящен 70-летнему юбилею Александра Георгиевича Ченцова, Тр. ИММ УрО РАН, 24, № 1, 2018, 76–92 ; англ. пер.: A. V. Dmitruk, N. P. Osmolovskii, “Variations of the $v$ -change of time in problems with state constraints”, Proc. Steklov Inst. Math. (Suppl.), 305, suppl. 1 (2019), S49–S64
28.	A. V. Dmitruk, N. P. Osmolovskii, “Proof of the maximum principle for a problem with state constraints by the $v$ -change of time variable”, Discrete Contin. Dyn. Syst. Ser. B, 24:5 (2019), 2189–2204
29.	А. В. Дмитрук, “Аппроксимационная теорема для нелинейной управляемой системы со скользящими режимами”, Динамические системы и оптимизация, Сборник статей. К 70-летию со дня рождения академика Дмитрия Викторовича Аносова, Труды МИАН, 256, Наука, МАИК «Наука/Интерпериодика», М., 2007, 102–114 ; англ. пер.: A. V. Dmitruk, “Approximation theorem for a nonlinear control system with sliding modes”, Proc. Steklov Inst. Math., 256 (2007), 92–104
30.	А. А. Милютин, Принцип максимума в общей задаче оптимального управления, Физматлит, М., 2001, 303 с.
31.	A. V. Dmitruk, “On the development of Pontryagin's maximum principle in the works of A. Ya. Dubovitskii and A. A. Milyutin”, Control Cybernet., 38:4A (2009), 923–957
32.	“Необходимые условия экстремума (принцип Лагранжа)”, Оптимальное управление, Гл. 3, ред. В. М. Тихомиров, Н. П. Осмоловский, МЦНМО, М., 2008, 89–122
33.	A. A. Milyutin, N. P. Osmolovskii, “First order conditions”, Calculus of variations and optimal control, Transl. from the Russian manuscript, Transl. Math. Monogr., 180, Amer. Math. Soc., Providence, RI, 1998
34.	А. В. Дмитрук, А. М. Каганович, “Принцип максимума для задач оптимального управления с промежуточными ограничениями”, Нелинейная динамика и управление, 6, Физматлит, М., 2008, 101–136 ; англ. пер.: A. V. Dmitruk, A. M. Kaganovich, “Maximum principle for optimal control problems with intermediate constraints”, Comput. Math. Model., 22:2 (2011), 180–215
35.	A. V. Dmitruk, N. P. Osmolovskii, “Necessary conditions for a weak minimum in optimal control problems with integral equations subject to state and mixed constraints”, SIAM J. Control Optim., 52:6 (2014), 3437–3462
36.	A. Dmitruk, N. Osmolovskii, “A general Lagrange multipliers theorem”, 2017 Constructive nonsmooth analysis and related topics (dedicated to the memory of V. F. Demyanov), CNSA-2017 (St. Petersburg, 2017), IEEE, 2017, 82–84
37.	A. V. Dmitruk, N. P. Osmolovskii, “A general Lagrange multipliers theorem and related questions”, Control systems and mathematical methods in economics, Lecture Notes in Econom. and Math. Systems, 687, Springer, Cham, 2018, 165–194

Образец цитирования: А. В. Дмитрук, “Вариации

$v$ -замены времени в задаче оптимального управления с фазовыми и смешанными ограничениями”, Изв. РАН. Сер. матем., 87:4 (2023), 91–132; Izv. Math., 87:4 (2023), 726–767

Цитирование в формате AMSBIB

\RBibitem{Dmi23}

\by А.~В.~Дмитрук

\paper Вариации $v$-замены времени в~задаче оптимального управления с~фазовыми и смешанными ограничениями

\jour Изв. РАН. Сер. матем.

\yr 2023

\vol 87

\issue 4

\pages 91--132

\mathnet{http://mi.mathnet.ru/im9305}

\crossref{https://doi.org/10.4213/im9305}

\mathscinet{http://mathscinet.ams.org/mathscinet-getitem?mr=4656040}

\zmath{https://zbmath.org/?q=an:1533.49015}

\adsnasa{https://adsabs.harvard.edu/cgi-bin/bib_query?2023IzMat..87..726D}

\transl

\jour Izv. Math.

\yr 2023

\vol 87

\issue 4

\pages 726--767

\crossref{https://doi.org/10.4213/im9305e}

\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=001088986700003}

\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85174899146}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/im9305

https://doi.org/10.4213/im9305

https://www.mathnet.ru/rus/im/v87/i4/p91

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Известия Российской академии наук. Серия математическая

Статистика просмотров:
Страница аннотации:	516
PDF русской версии:	40
PDF английской версии:	87
HTML русской версии:	209
HTML английской версии:	176
Список литературы:	95
Первая страница:	8