|
Вариации $v$-замены времени в задаче оптимального управления с фазовыми и смешанными ограничениями
А. В. Дмитрук Математический институт им. В. А. Стеклова Российской академии наук, г. Москва
Аннотация:
Для общей задачи оптимального управления с фазовыми и регулярными смешанными ограничениями предлагается доказательство принципа максимума с помощью так называемой $v$-замены времени $t \mapsto \tau$, при которой исходное время становится еще одной фазовой переменной, подчиненной уравнению $dt/d\tau = v(\tau)$, а дополнительное управление $v(\tau)\geqslant 0$ кусочно постоянно, и его значения служат аргументами новой задачи.
Библиография: 36 наименований.
Ключевые слова:
фазовые и смешанные ограничения, позитивно-линейно независимые вектора, $v$-замена времени, условия стационарности, множители Лагранжа, мера Лебега–Стилтьеса, функционалы на $L_\infty$, слабая-$*$ компактность, принцип максимума.
Поступило в редакцию: 20.12.2021 Исправленный вариант: 31.08.2022
§ 1. Введение Задачи оптимального управления с фазовыми и смешанными ограничениями встречаются повсеместно и в чисто теоретических, и в прикладных исследованиях. Их изучение началось с 1960 г. работой Р. В. Гамкрелидзе [1], методы которой были затем развиты в ряде других работ, например, [2]–[4]. При этом, как хорошо известно, обобщение принципа максимума (ПМ) Понтрягина на эти задачи было сопряжено со значительными трудностями, поскольку здесь мы имеем дело с бесконечным (континуальным) числом ограничений неравенства. Основная проблема возникала уже при получении условий стационарности (уравнения Эйлера–Лагранжа), она состояла в характеризации множителей Лагранжа при указанных ограничениях. В работе А. Я. Дубовицкого и А. А. Милютина [5] было предложено трактовать фазовое ограничение $\Phi(t, x(t))\leqslant0$ как принадлежность конусу неотрицательных функций в пространстве $C$ непрерывных функций на данном отрезке времени, и тогда соответствующий множитель Лагранжа представляет собой элемент сопряженного пространства $C^*$, т. е. меру Лебега–Стилтьеса. При таком подходе необходимые условия слабого минимума (т. е. условия стационарности) получить уже несложно (см., например, [5]–[7]). Затем ими же была предложена некоторая процедура сведения исходной задачи к семейству вспомогательных, присоединенных задач (см. [8]), из условий стационарности в которых они получили обобщение ПМ Понтрягина (т. е. необходимые условия сильного минимума) для задач с фазовыми ограничениями. Упомянутая процедура была основана на так называемой $v$-замене времени, о которой будет сказано чуть ниже, но может быть основана и на других классах вариаций. По аналогии с фазовыми, смешанные ограничения типа $\varphi(t, x(t),u(t))\leqslant0$ было предложено трактовать как принадлежность конусу неотрицательных функций пространства $L_\infty$, и тогда соответствующие множители будут элементами сопряженного к нему пространства. Однако в общем случае охарактеризовать эти множители очень непросто, поскольку они могут содержать так называемые сингулярные составляющие. В случае, когда смешанные ограничения регулярны (их градиенты по $u$ в некотором смысле невырождены), можно показать, что сингулярных составляющих у множителей Лагранжа нет, все они суть функции из пространства $L_1$, так что для формулировки условий оптимальности регулярные смешанные ограничения проще чисто фазовых. На основе полученных условий стационарности, применяя опять $v$-замену времени, А. Я. Дубовицкий и А. А. Милютин получили ПМ и для задач, в которых имеются и фазовые, и регулярные смешанные ограничения. Это доказательство было опубликовано лишь спустя много лет [6; гл. 5], а в то время авторы сосредоточились на исследовании задач со смешанными ограничениями общего вида, без предположения об их регулярности [9]–[11]. Публикации же других авторов по задачам с регулярными смешанными ограничениями начались с середины 1970-х гг., см. [12]–[14]. В работе [15] автор, будучи аспирантом А. А. Милютина, реализовал его идею об использовании для этой цели так называемых скользящих режимов, введенных ранее Р. В. Гамкрелидзе [16] для доказательства существования решений задач оптимального управления, и дал полное доказательство ПМ для задач с регулярными смешанными ограничениями равенства и неравенства. Имеются и другие работы по условиям оптимальности для задач с такими ограничениями, но их немного, см. [3], [17]–[23]. Как правило, их авторы либо рассматривают частные постановки и предполагают усиленные условия регулярности, либо наоборот, идут в сторону обобщения задачи на случай, когда ограничения задачи задаются негладкими (липшицевыми) функциями, и получают соответствующие варианты условий стационарности и ПМ методами негладкого анализа. Нам все же представляется, что гладкий случай является основным и заслуживает самого детального изучения, тем более, что “негладкие” условия, примененные к гладкому случаю, как правило, получаются более грубыми, чем “гладкие”. Общая $v$-замена времени состоит в переходе от исходного времени $t$ к новому времени $\tau$, при котором исходное время $t= t(\tau)$ становится еще одной фазовой переменной, подчиненной уравнению $dt/d\tau = v(\tau)$, где $v(\tau)\geqslant 0$ есть еще одно управление. Принципиальный момент состоит здесь в том, что эта замена не взаимно однозначна (там, где $v(\tau)= 0)$, и по этой причине малые вариации управления $v(\tau)$ порождают немалые (так называемые понтрягинские) вариации исходного управления $u(t)$. Использование этого приема требует однако хорошего владения теорией функций действительного переменного. В конце 1990-х гг. А. А. Милютин предложил использовать упрощенный вариант $v$-замены, с кусочно постоянной функцией $v(\tau)$. Этим способом он доказал принцип максимума для общей понтрягинской задачи, т. е. задачи с концевыми ограничениями, но без фазовых и смешанных. В случае кусочно постоянной $v$-замены малые вариации управления $v(\tau)$ порождают, по сути дела, игольчатые вариации исходного управления $u(t)$ с небольшим, но существенным отличием от стандартных. Преимущество вариаций типа $v$-замены по сравнению со стандартными игольчатыми вариациями (пакетами иголок) состоит в следующем: a) их можно вставлять в любые точки $t$ данного интервала времени, тогда как игольчатые вариации можно вставлять лишь в точки Лебега оптимального управления $\widehat u(t)$ (см., например, [24]–[26]); b) ограничения задачи будут определены по крайней мере в целой окрестности параметров данной $v$-замены, тогда как игольчатые вариации приводят к задаче, функции которой определены лишь на неотрицательном ортанте конечномерного пространства (точнее, на его пересечении с окрестностью нуля), соответствующем ширинам иголок $\varepsilon_i\geqslant 0$ в данном пакете; c) ограничения задачи будут гладко зависеть от параметров $v$-замены, тогда как при введении игольчатых вариаций дифференцируемость этих ограничений по ширинам иголок будет лишь при $\varepsilon_i=0$. В недавних работах [27], [28] было показано, что кусочно постоянная $v$-замена позволяет получить ПМ и в задачах с фазовыми ограничениями. Цель настоящей статьи – показать возможность ее применения для получения ПМ в задачах, где есть и фазовые, и смешанные ограничения. Однако здесь в присоединенной задаче уже недостаточно одних обобщенных игольчатых вариаций, надо добавить еще и равномерно малые вариации управления (для получения условия стационарности по управлению $\overline H_u=0)$, поэтому эта задача ставится уже в бесконечномерном пространстве. Общая схема доказательства, как и в [27], [28], такова. Кусочное постоянство функции $v(\tau)$ позволяет перейти к задаче, аргументами которой служат значения этой функции на участках ее постоянства, значения управления $u$ на интервалах $v(\tau)>0$, а также начальное значение фазовой переменной $x(\tau_0)$. Наличие фазовых и смешанных ограничений приводит к тому, что в этой задаче имеется бесконечное число ограничений неравенства, т. е. это не есть обычная гладкая задача. Тем не менее, условия оптимальности в ней известны; их специфика лишь в том, что они содержат функционалы, опорные к конусам неотрицательных функций в соответствующих пространствах. Применяя эти условия и переписывая их в терминах исходной задачи, мы получаем множество соответствующих наборов множителей Лагранжа, которое является непустым компактом в некоторой топологии. Каждый элемент этого компакта (т. е. набор множителей Лагранжа) обеспечивает выполнение принципа максимума на конечном множестве значений управления и времени, соответствующем данной $v$-замене. Компакты, порожденные всевозможными кусочно постоянными $v$-заменами, частично упорядочены по включению, и поэтому образуют центрированную систему. Взяв любой элемент из их пересечения, мы получаем единое условие оптимальности – набор множителей Лагранжа, для которого принцип максимума выполнен при всех значениях управления и времени. Предлагаемый здесь способ получения ПМ для задач с фазовыми и регулярными смешанными ограничениями имеет то преимущество по сравнению с использованием скользящих режимов [15], [7], что в последнем приходится доказывать довольно сложную (хотя саму по себе интересную) теорему о корректности расширения (овыпукления) управляемой системы при введении скользящих режимов [29], тогда как метод $v$-вариаций этого не требует. Отметим еще раз, что прием перехода к семейству вспомогательных задач, в которых выписываются уже известные условия оптимальности, и затем использования центрированной системы компактов также был предложен А. Я. Дубовицким и А. А. Милютиным (см. [8], [6], [30], [31]). Он уже применялся для получения ПМ как в задаче без фазовых ограничений [7], [32], [25], так и в задаче с таковыми [7], [27], [28].
§ 2. Постановка задачи и принцип максимума в ней Пусть $x(\,{\cdot}\,)\colon [t_0,t_1]\to\mathbb{R}^n$ есть абсолютно непрерывная функция (фазовая переменная), $u(\,{\cdot}\,)\colon [t_0,t_1]\to\mathbb{R}^r$ – измеримая ограниченная функция (управление). Отрезок времени $[t_0,t_1]$ заранее не фиксирован. Рассмотрим следующую задачу с функционалом типа Майера:
$$
\begin{equation}
\mathcal{J}:= F_0(t_0,x(t_0),t_1,x(t_1)) \to \min,
\end{equation}
\tag{2.1}
$$
$$
\begin{equation}
F(t_0,x(t_0),t_1,x(t_1))\leqslant 0, \qquad K(t_0,x(t_0),t_1,x(t_1))=0,
\end{equation}
\tag{2.2}
$$
$$
\begin{equation}
\dot x(t)= f(t,x(t),u(t)) \quad \text{п. в. на } [t_0,t_1],
\end{equation}
\tag{2.3}
$$
$$
\begin{equation}
\varphi(t,x(t),u(t)) \leqslant 0,\qquad g(t,x(t),u(t))=0 \quad \text{п. в. на } [t_0,t_1],
\end{equation}
\tag{2.4}
$$
$$
\begin{equation}
\Phi(t,x(t))\leqslant0 \quad \text{на } [t_0,t_1].
\end{equation}
\tag{2.5}
$$
Здесь $F$, $K$, $f$, $\varphi$, $g$, $\Phi$ – вектор-функции некоторых размерностей, которые мы для экономии букв обозначаем как $d(F)$, $d(K)$ и тому подобное. В записи ограничений (2.2)–(2.5) мы всюду используем векторные обозначения, которые понимаются в покоординатном смысле. Целевая функция $F_0$ скалярная. Функции конечномерного аргумента определены на некотором открытом множестве $\mathcal{P} \subset\mathbb{R}^{2n+2}$, а функции, зависящие от $(t,x,u)$, – на некотором открытом множестве $\mathcal{Q} \subset \mathbb{R}^{1+n+r}$. Предполагается, что все эти функции гладкие, т. е. непрерывно дифференцируемы по своим аргументам. Задачу (2.1)–(2.5) для краткости назовем задачей $\mathrm{A}$. Ограничения (2.2) называются концевыми (или терминальными), (2.4) – смешанными, (2.5) – фазовыми, а (2.3) – управляемой системой. Кроме указанных предположений гладкости, примем также предположение о регулярности смешанных ограничений: для любой точки $(t,x,u)\in \mathcal{Q}$, в которой выполнены ограничения (2.4), система векторов
$$
\begin{equation}
\varphi'_{iu}(t,x,u),\quad i\in I(t,x,u), \qquad g'_{ju}(t,x,u),\quad j=1,\dots, d(g),
\end{equation}
\tag{2.6}
$$
позитивно-линейно независима. Здесь $I(t,x,u) = \{i\mid \varphi_i(t,x,u) =0\}$ есть множество активных индексов для смешанных ограничений неравенства. Определение 1. Система из двух наборов векторов $p_i$, $i\in I$, $q_j$, $j\in J$, пространства $\mathbb{R}^r$, где $I$ и $J$ есть некоторые конечные множества индексов, называется позитивно-линейно независимой (ПЛН), если не существует нетривиального набора коэффициентов $\alpha_i$, $i\in I$, $\beta_j$, $j\in J$, из которых все $\alpha_i\geqslant 0$, таких, что
$$
\begin{equation*}
\sum_{i\in I} \alpha_i p_i + \sum_{j\in J} \beta_j q_j = 0.
\end{equation*}
\notag
$$
Нетрудно видеть, что это требование эквивалентно следующему: a) векторы $q_j$ линейно независимы; b) их линейная оболочка не пересекается с выпуклой оболочкой векторов $p_i$. Иногда полезна двойственная формулировка условия b): существует вектор $\overline u$ такой, что все $(p_i,\overline u)<0$ и все $(q_j,\overline u) =0$. Таким образом, предположение о регулярности смешанных ограничений означает, что в любой точке, где они выполнены, градиенты по $u$ активных ограничений неравенства и всех ограничений равенства ПЛН1[x]1В зарубежной литературе требование существования указанного вектора $\overline u$ (вместе с линейной независимостью градиентов $g'_{ju})$ называется условием Мангасаряна–Фромовица.. Замечание 1. В негладких задачах вместо требования ПЛН системы (2.6) принимается его негладкий аналог, обеспечивающий тот факт, что любая внешняя нормаль $(\alpha,\beta)$ к множеству допустимых вариаций переменных $(x,u)$ первого порядка подчиняется оценке $|\alpha|\leqslant \mathrm{const}\,|\beta|$. Геометрически он означает, что любая опорная гиперплоскость к графику многозначного отображения $x\mapsto U(t,x)$, соответствующего смешанным ограничениям, не может быть близкой к вертикальной, т. е. имеет ограниченный наклон. Поэтому указанное условие регулярности так и называется: bounded slope condition, см., например, [17]–[23]. Замечание 2. Обратим внимание, что фазовые ограничения равенства $G(t,x)=0$ не допускаются – иначе линеаризация ограничений равенства задачи не будет, как правило, давать замкнутый образ, а это есть основное требование при получении условий оптимальности первого порядка во всех классах задач оптимизации (см., например, п. 9.1). Такие ограничения надо дифференцировать по $t$ и заменять на смешанные $G_t(t,x) + G_x(t,x)f(t,x,u) =0$, рассчитывая, что их градиенты по $u$ вместе с (2.6) будут позитивно-линейно независимыми. Замечание 3. Мы пока не допускаем традиционные ограничения типа включения $u(t)\in U$. Если множество $U\subset \mathbb{R}^r$ задается гладкими ограничениями вида $\widetilde\varphi(u)\leqslant0$, $\widetilde g(u)=0$, то их надо рассматривать как смешанные ограничения в совокупности с (2.4), в противном случае приходится выходить за рамки гладких задач (и тогда предполагать, что опорный вектор к множеству $U$ вместе с градиентами смешанных ограничений по $u$ образует ПЛН систему), чего мы стараемся избегать в силу значительного технического усложнения исследования задачи. Впрочем, один довольно общий класс задач с ограничением типа включения будет кратко рассмотрен ниже, в § 7. Итак, задача $\mathrm{A}$ поставлена. Пару функций $w(t)=(x(t), u(t))$ вместе с отрезком их определения $[t_0, t_1]$, связанных соотношением (2.3), будем называть процессом задачи. Процесс называется допустимым, если его концы $(t_0,x(t_0),t_1,x(t_1))$ лежат в множестве $\mathcal{P}$, существует компакт $D \subset \mathcal{Q}$ такой, что $(t,w(t))\in D$ для почти всех $t$, и выполнены все ограничения задачи. Как обычно, будем говорить, что допустимый процесс $\widehat{w}(t)=(\widehat{x}(t), \widehat{u}(t))$, $t\in [\,\widehat t_0, \widehat t_1]$, доставляет сильный минимум, если существует $\varepsilon>0$ такое, что $\mathcal{J}(w) \geqslant \mathcal{J}(\widehat{w})$ для всех допустимых процессов $w(t)=(x(t), u(t))$, $t\in [t_0, t_1]$, удовлетворяющих условиям
$$
\begin{equation*}
|t_0-\widehat t_0|<\varepsilon,\quad |t_1-\widehat t_0|<\varepsilon,\qquad |x(t)-\widehat x(t)|<\varepsilon \quad \text{на } [t_0,t_1]\cap[\,\widehat t_0,\widehat t_1].
\end{equation*}
\notag
$$
Вместе с этим, введем также следующее понятие, предложенное А. Я. Дубовицким и А. А. Милютиным (см. [7], [31], [33]). Будем говорить, что процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}(t))$, $t\in [\,\widehat t_0, \widehat t_1]$, доставляет понтрягинский минимум в задаче $\mathrm{A}$, если для любого числа $N$ он доставляет локальный минимум относительно нормы $\|x\|_C + \|u\|_1$ в той же задаче с дополнительным ограничением $|u(t)|\leqslant N;$ т. е. если существует $\varepsilon>0$ такое, что $\mathcal{J}(w)\geqslant \mathcal{J}(\widehat{w})$ для всех допустимых процессов $w(t)=(x(t), u(t))$, $t\in [t_0, t_1]$, удовлетворяющих условиям
$$
\begin{equation*}
|t_0-\widehat t_0|< \varepsilon,\quad |t_1-\widehat t_0|< \varepsilon,\qquad \|x - \widehat{x}\|_C <\varepsilon, \qquad \|u -\widehat{u}\|_1 <\varepsilon, \quad \|u\|_\infty \leqslant N.
\end{equation*}
\notag
$$
(Здесь обе нормы берутся на общем отрезке определения соответствующих функций.) Ясно, что понтрягинский минимум занимает промежуточное положение между слабым и сильным минимумами. В частности, он допускает как игольчатые, так и равномерно малые вариации управления. Замечание 4. Если исследуемый процесс $(\widehat{x}(t), \widehat{u}(t))$ задан, то достаточно требовать выполнения условия регулярности смешанных ограничений лишь вдоль траектории $\widehat{x}(t)$, т. е. достаточно того, чтобы система (2.6) была ПЛН не для всех указанных троек $(t,x,u)$, а только для троек вида $(t,\widehat{x}(t),u)$. Чтобы избежать априорного вырождения “стандартных” условий оптимальности, мы будем предполагать, что концы оптимального процесса не лежат на фазовой границе; точнее, что для них выполнены строгие неравенства
$$
\begin{equation}
\Phi(t_0, \widehat{x}(t_0))<0, \qquad \Phi(t_1, \widehat{x}(t_1))<0.
\end{equation}
\tag{2.7}
$$
Для формулировки необходимых условий оптимальности в задаче $\mathrm{A}$ нам потребуются следующие обозначения. Введем функцию Понтрягина
$$
\begin{equation*}
H(t,x,u)=\psi_x f(t, x, u),
\end{equation*}
\notag
$$
где $\psi_x$ есть вектор-строка размерности $n$ (зависимость $H$ от $\psi_x$ иногда будем опускать), расширенную функцию Понтрягина
$$
\begin{equation*}
\overline H(t,x,u)=\psi_x f(t, x, u) - \lambda\varphi(t,x,u) - mg(t,x,u) - \frac{d\mu}{dt}\, \Phi(t,x)
\end{equation*}
\notag
$$
и концевую функцию Лагранжа
$$
\begin{equation*}
l(t_0,x_0,t_1,x_1)= (\alpha_0 F_0 + \alpha F + \beta K)(t_0,x_0,t_1,x_1),
\end{equation*}
\notag
$$
где $\alpha_0$ – число, $\alpha$, $\beta$ – вектор-строки тех же размерностей, что и $F$, $K$ соответственно (зависимость $l$ от $\alpha_0$, $\alpha$, $\beta$ мы опускаем), $\lambda$, $m$ – вектор-строки размерностей $\varphi$, $g$, а через $d\mu/dt$ обозначена вектор-строка размерности $\Phi$. Пусть $w=(x(t), u(t))$, $t\in [t_0, t_1]$, – допустимый процесс задачи $\mathrm{A}$. Будем говорить, что для него выполнен принцип максимума, если существуют число $\alpha_0$, вектор-строки $\alpha\in\mathbb{R}^{d(F)}$, $\beta\in \mathbb{R}^{d(K)}$, измеримые ограниченные функции $\lambda(t)$ и $m(t)$ размерностей $d(\varphi)$ и $d(g)$ соответственно, неубывающая функция $\mu(t)$ размерности $d(\Phi)$, функции ограниченной вариации $\psi_x(t)$, $\psi_t(t)$ размерности $n$, $1$ соответственно (где $x$, $t$ – индексы, а не обозначения производных) такие, что:
$$
\begin{equation}
\begin{aligned} \, &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \lambda(t)\geqslant0\quad \text{п. в. на }[t_0,t_1]; \nonumber \\ &(\mathrm{ii})\ \alpha_0+|\alpha| + \int_{t_0}^{t_1} \lambda(t)\,dt + \int_{t_0}^{t_1} d \mu(t) >0; \nonumber \\ &(\mathrm{iii})\ \alpha F(t_0,x(t_0),t_1,x(t_1))=0,\quad \lambda(t)\varphi(t,x(t),u(t))=0\quad\text{п. в. на }[t_0,t_1], \nonumber \\ &\qquad \Phi(t,x(t))\,d \mu(t) =0\quad \text{на }[t_0,t_1]; \nonumber \\ &(\mathrm{iv}_x)\ -\dot\psi_x(t)=\overline H_x(t,x(t), u(t)); \nonumber \\ &(\mathrm{iv}_t)\ -\dot\psi_t(t)=\overline H_t(t,x(t), u(t)); \nonumber \\ &(\mathrm{v}_x)\ \psi_x(t_0)=l_{x_0}(t_0,x(t_0),t_1,x(t_1)),\quad \psi_x(t_1)= -l_{x_1}(t_0,x(t_0),t_1,x(t_1)); \nonumber \\ &(\mathrm{v}_t)\ \psi_t(t_0)= l_{t_0}(t_0,x(t_0),t_1,x(t_1)),\quad \psi_t(t_1)= -l_{t_1}(t_0,x(t_0),t_1,x(t_1)); \nonumber \\ &(\mathrm{vi})\ \overline H_u(\psi_x(t),t,x(t), u(t))=0\quad\text{для почти всех } t\in[t_0,t_1]; \nonumber \\ &(\mathrm{vii})\ H(\psi_x(t),t,x(t), u(t)) + \psi_t(t)=0\quad\text{для почти всех } t\in[t_0,t_1]; \nonumber \\ &(\mathrm{viii})\ H(\psi_x(t\,{-}\,0),t,x(t), u')\,{+}\, \psi_t(t\,{-}\,0)\,{\leqslant}\, 0, \ H(\psi_x(t\,{+}\,0),t,x(t),u') \,{+}\,\psi_t(t\,{+}\,0)\,{\leqslant}\, 0 \nonumber \\ &\qquad\ \text{для всех }t\in[t_0,t_1]\text{ и всех }u'\text{ таких, что}\end{aligned}
\end{equation}
\notag
$$
$$
\begin{equation} (t,x(t), u') \in \mathcal{Q}, \qquad \varphi(t,x(t), u')\leqslant0, \qquad g(t,x(t), u') =0.
\end{equation}
\tag{2.8}
$$
Множество всех $u' \in \mathbb{R}^r$, удовлетворяющих ограничениям (2.8), обозначим $\mathcal{R}(t,x(t))$. Функции $\psi_x(t)$ и $\psi_t(t)$ называются сопряженными переменными2[x]2Обозначения $\psi_x$ и $\psi_t$ предложены А. Я. Дубовицким и А. А. Милютиным. Их удобство быстро выясняется при решении конкретных задач с многими фазовыми переменными.. Можно пока не конкретизировать, с какой стороны они непрерывны, а считать, что в каждой точке $t$ эти функции имеют два значения – левое и правое; в точках непрерывности (а это все, кроме счетного множества) эти значения совпадают. Функция $\mu(t)$ порождает меру Лебега–Стилтьеса $d\mu(t)\geqslant0$ на $[t_0,t_1]$, при этом $d\mu(t)/dt$ есть ее обобщенная плотность, а третье условие в (iii) означает, что $d\mu(t) =0$ на любом интервале, где $\Phi(t,x(t))<0$. (Как уже говорилось, это относится к каждой компоненте вектора $\Phi$ и меры $d\mu$.) В частности, в силу предположения (2.7) $d\mu(t) =0$ в некоторых окрестностях точек $t_0$ и $t_1$. Отметим также, что без нарушения общности можно полагать $\mu(0)=0$. Условия (i)–(vi) называются условиями неотрицательности, нетривиальности, дополняющей нежесткости, сопряженными уравнениями, условиями трансверсальности и условиями стационарности по управлению соответственно. Условие (vii) можно назвать законом изменения энергии, так как из него и сопряженного уравнения $(\mathrm{iv}_t)$ для $\psi_t$ следует уравнение для функции $H$, которая в механических задачах часто имеет смысл энергии системы:
$$
\begin{equation*}
\dot H = \overline H_t \quad \text{или} \quad \frac{dH}{dt}= \frac{\partial \overline H}{\partial t}.
\end{equation*}
\notag
$$
(В случае, когда задача автономна, т. е. функции $f$, $g$, $\varphi$, $\Phi$ не зависят от $t$, получаем закон сохранения энергии: $\dot H =0$, т. е. $H =\mathrm{const}$.) Условие (viii) очевидно эквивалентно тому, что $H(\psi_x(t),t,x(t), u')+ \psi_t(t)\,{\leqslant}\, 0$ во всех точках непрерывности функций $\psi_x$ и $\psi_t$. Из него и условия (vii) вытекает условие максимума функции Понтрягина: для почти всех $t\in[t_0,t_1]$
$$
\begin{equation}
\max_{u' \in \mathcal{R}(t,x(t))} H(\psi_x(t),t,x(t), u') = H(\psi_x(t),t,x(t), u(t)),
\end{equation}
\tag{2.9}
$$
благодаря которому вся совокупность условий (i)–(viii) и называется принципом максимума. Обратим внимание, что максимум здесь берется по $u'$ из вышеуказанного множества $\mathcal{R}(t,x(t))$. При отсутствии фазовых и смешанных ограничений (2.4), (2.5) множество $\mathcal{R}(t,x(t))= \{ u'\mid (t,x(t),u') \in \mathcal{Q}\}$, множители $\lambda(t)=0$, $m(t)=0$, $d\mu(t) = 0$, и мы получаем принцип максимума Понтрягина для общей задачи Лагранжа классического вариационного исчисления (2.1)–(2.3), т. е. условие Вейерштрасса. Отметим, что функция $\overline H$ участвует в тех условиях, где происходит дифференцирование по одной из переменных $t,x,u$, тогда как функция $H$ нигде в условиях (i)–(viii) и (2.9) не дифференцируется. Сопряженные уравнения $(\mathrm{iv}_x)$–$(\mathrm{iv}_t)$ следует понимать как равенства мер на отрезке $[t_0,t_1]$:
$$
\begin{equation*}
\begin{aligned} \, d\psi_x(t) &= \bigl(-H_x(\psi_x(t),t,x(t), u(t)) \\ &\qquad +\lambda(t)\varphi_x(t,x(t), u(t)) + m(t)g_x(t,x(t), u(t))\bigr)\,d t + d \mu(t)\,\Phi_{x}(t,x(t)), \\ d\psi_t(t) &= \bigl(-H_t(\psi_x(t),t,x(t), u(t)) \\ &\qquad +\lambda(t)\varphi_t(t,x(t), u(t)) + m(t)g_t(t,x(t), u(t))\bigr)\,d t + d \mu(t)\,\Phi_{t}(t,x(t)), \end{aligned}
\end{equation*}
\notag
$$
Можно также записать эти равенства в интегральной форме, например:
$$
\begin{equation*}
\psi_x(t+0) =\psi_x(t_0) + \int_{t_0}^t (- H_x + \lambda \varphi_x + mg_x)\,ds +\int_{t_0}^{t+0}\Phi_{x}(s,x(s))\,d\mu(s),
\end{equation*}
\notag
$$
и аналогично для $\psi_x(t-0)$ и $\psi_t(t \pm 0)$. Принцип максимума принято трактовать как необходимое условие сильного минимума. Однако верно и следующее, более сильное утверждение. Оно принадлежит А. Я. Дубовицкому и А. А. Милютину (см., например, [6], [11], [30]). Теорема 1. Если процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}(t))$, $t\in [\,\widehat t_0, \widehat t_1]$, доставляет понтрягинский минимум в задаче $\mathrm{A}$, то для него выполнен принцип максимума (i)–(viii). Как было сказано во введении, мы дадим здесь новое, сравнительно простое доказательство этой теоремы. Его удобно провести сначала не для общей задачи $\mathrm{A}$, а для ее частного случая, в котором зависимость от времени отсутствует.
§ 3. Автономная задача $\mathrm{B}$ Рассмотрим следующую задачу $\mathrm{B}$ на нефиксированном отрезке $[t_0,t_1]$ (автономный вариант задачи $\mathrm{A}$):
$$
\begin{equation}
J:= F_0(x(t_0),x(t_1)) \to \min,
\end{equation}
\tag{3.1}
$$
$$
\begin{equation}
F(x(t_0),x(t_1))\leqslant0, \qquad K(x(t_0),x(t_1))=0,
\end{equation}
\tag{3.2}
$$
$$
\begin{equation}
\dot x(t)= f(x(t),u(t)),
\end{equation}
\tag{3.3}
$$
$$
\begin{equation}
\varphi(x(t),u(t)) \leqslant 0,\qquad g(x(t),u(t))=0,
\end{equation}
\tag{3.4}
$$
$$
\begin{equation}
\Phi(x(t))\leqslant0.
\end{equation}
\tag{3.5}
$$
Для нее из сопряженного уравнения $(\mathrm{iv}_t)$ следует, что $\psi_t = \mathrm{const}$, и тогда из условий трансверсальности $(\mathrm v_t)$ получаем $\psi_t \equiv 0$, поэтому вместо $\psi_x$ будем писать просто $\psi$. Таким образом, условия (vii) и (viii) для задачи $\mathrm{B}$ запишутся соответственно в виде
$$
\begin{equation}
\psi(t) f(x(t), u(t)) =0 \quad \text{почти всюду},\qquad \psi(t\pm 0) f(x(t), u') \leqslant 0 \quad \forall\, t,
\end{equation}
\tag{3.6}
$$
где $u' \in \mathcal{R}(x(t))$. В остальном формулировка ПМ остается без изменений. Хотя задача $\mathrm{B}$ и является частным случаем задачи $\mathrm{A}$, любую задачу типа $\mathrm{A}$ можно привести к виду $\mathrm{B}$. Это достигается с помощью следующего простого приема. К управляемой системе $\dot{x}=f(t,x,u)$ добавим уравнение $dt/d\tau=1$, считая, что $\tau$ – новое время, пробегающее некоторый отрезок $[\tau_0,\tau_1]$, а исходное время $t=t(\tau)$ – новая фазовая переменная. Функции $x(\,{\cdot}\,)$ и $u(\,{\cdot}\,)$ также считаем теперь зависящими от нового времени: $x=x(\tau)$, $u=u(\tau)$. В результате приходим к следующей задаче $\mathrm{A}'$:
$$
\begin{equation*}
\begin{gathered} \, J= F_0(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1))\to \min, \\ F(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1)) \leqslant 0, \qquad K(t(\tau_0),x(\tau_0),t(\tau_1),x(\tau_1))=0, \end{gathered}
\end{equation*}
\notag
$$
$$
\begin{equation}
\frac{dx}{d\tau}= f(t(\tau),x(\tau),u(\tau)), \qquad \frac{dt}{d\tau}=1,
\end{equation}
\tag{3.7}
$$
$$
\begin{equation}
\varphi(t(\tau),x(\tau),u(\tau) \leqslant0, \qquad g(t(\tau),x(\tau),u(\tau) =0,
\end{equation}
\tag{3.8}
$$
$$
\begin{equation}
\Phi(t(\tau),x(\tau))\leqslant 0,
\end{equation}
\tag{3.9}
$$
где $t(\tau)$, $x(\tau)$ – фазовые переменные, $u(\tau)$ – управление, $\tau\in [\tau_0,\tau_1]$ – нефиксированный отрезок. Ясно, что задача $\mathrm{A}'$ имеет тип $\mathrm{B}$. Поскольку задача $\mathrm{A}'$ инвариантна относительно сдвига по времени $\tau$, в ней можно зафиксировать начальный момент $\tau_0$, и тогда, как нетрудно видеть, и допустимые, и оптимальные процессы задач $\mathrm{A}$ и $\mathrm{A}'$ будут находиться во взаимно однозначном соответствии. Поэтому, получив необходимые условия оптимальности в задаче $\mathrm{B}$, можно применить их к задаче $\mathrm{A}'$ и тем самым получить необходимые условия в задаче $\mathrm{A}$. Сопряженная переменная в задаче $\mathrm{A}'$ есть пара $(\psi_x, \psi_t)$, функция Понтрягина для системы (3.7) будет $\widetilde H = \psi_x f + \psi_t$, “автономные” условия (3.6) $\widetilde H(x,u) =0$ и $\widetilde H(x,u') \leqslant 0$ примут вид $\psi_x f(x,u) + \psi_t =0$ и $\psi_x f(x,u') + \psi_t \leqslant 0$, т. е. в точности условия (vii) и (viii) теоремы 1. Детали этих преобразований мы оставляем читателю. Перейдем к доказательству теоремы 1 для задачи $\mathrm{B}$. Для этого мы опять превратим время в фазовую переменную, но теперь положим $dt/d\tau= v(\tau)$, где функция $v(\tau)$ будет лишь неотрицательная, но не всюду положительная, и следовательно, $t=t(\tau)$ – монотонно неубывающая, но не строго возрастающая функция. Такая необратимая замена, превращающая время $t$ в фазовую переменную, была предложена А. Я. Дубовицким и использовалась в его совместных работах с А. А. Милютиным [5], [11], и затем в работах А. А. Милютина [6], [30] (см. также [32]); она была названа ими $v$-заменой. Нетривиальный момент здесь в том, что малые вариации нового управления $v(\tau)$ будут приводить к вариациям типа игольчатых для исходного управления $u(t)$. Простейший вариант такой $v$-замены – с кусочно постоянными $v(\tau)$ – мы сейчас и рассмотрим. Поскольку задача $\mathrm{B}$ инвариантна относительно сдвига по времени, начальный момент мы для определенности зафиксируем: $t_0= \widehat t_0$. Наряду с множеством $\mathcal{R}(x) = \{u \mid (x,u)\in \mathcal{Q},\, \varphi(x,u)\leqslant0, \, g(x,u)=0\}$ введем его подмножество $\mathcal{R}_0(x) = \{u\mid (x,u)\in \mathcal{Q},\, \varphi(x,u)<0, \, g(x,u)=0\}$. Отметим сразу, что при нашем предположении о регулярности смешанных ограничений любая точка из $\mathcal{R}(x)$ есть предел точек из $\mathcal{R}_0(x)$. Лемма 1 (о плотности). Множество $\mathcal{R}_0(x)$ всюду плотно в $\mathcal{R}(x)$. Доказательство. Возьмем любую пару $(x,u)$, в которой $u \in \mathcal{R}(x)$. Пусть $I$ есть множество активных неравенств для нее. В силу предположения о позитивно-линейной независимости градиентов $\varphi_u(x,u)$, $g_u(x,u)$ найдется вектор $\overline u$ такой, что $\varphi_u(x,u)\overline u<0$ и $g_u(x,u)\overline u=0$. Последнее равенство означает, что $\overline u$ – касательный к поверхности $M(x) = \{u'\mid g(x,u')=0\}$ в точке $u$, т. е. существует семейство поправок $u_\varepsilon = o(\varepsilon)$ при $\varepsilon\to0+$ такое, что $u'_\varepsilon = u+ \varepsilon\overline u + u_\varepsilon \in M(x)$, т. е. $g(x, u'_\varepsilon)=0$. При этом $\varphi(x, u'_\varepsilon) = \varphi(x,u) + \varphi_u(x,u)\,\varepsilon\overline u + o(\varepsilon) <0$. Таким образом, точки $u'_\varepsilon \in \mathcal{R}_0(x)$ и сходятся к $u$, что и требовалось доказать. $\Box$ 3.1. Индекс $\theta$ Пусть $\widehat w= (\widehat{x}(t),\widehat{u}(t))$, $t\in [\,\widehat t_0,\widehat t_1]$, – оптимальный процесс задачи $\mathrm{B}$. Мы свяжем с ним семейство задач $\mathrm{B}^\theta$, которые построим ниже, и их оптимальных решений, занумерованных некоторым индексом $\theta$. Под индексом будем понимать набор значений времени и управления
$$
\begin{equation*}
\theta= \{(t^1,u^1),\dots,(t^{d},u^{d})\},
\end{equation*}
\notag
$$
где $d$ – произвольное натуральное число, $\widehat t_0 < t^1\leqslant \dots \leqslant t^{d} < \widehat t_1$, а значение $u^s\in \mathcal{R}_0(\widehat{x}(t^s))$ при каждом $s =1,\dots, d$ – любое. Длина индекса $d = d(\theta)$ своя для каждого $\theta$. Определим отрезок $[\tau_0,\tau_1]$ следующим образом: берем отрезок $[\,\widehat t_0,\widehat t_1]$, и в точках $t^1,\dots,t^{d(\theta)}$ последовательно вставляем отрезки единичной длины, сохраняя всякий раз положение точки $\widehat t_0$. В результате получаем отрезок $[\tau_0,\tau_1]$ с концами $\tau_0=\widehat t_0$, $\tau_1=\widehat t_1+ d(\theta)$, а вставленные отрезки будут иметь вид
$$
\begin{equation*}
\Delta^1=[t^1,\,t^1+1], \ \Delta^2=[t^2+1,\,t^2+2], \ \dots,\ \Delta^{d(\theta)} =[t^{d(\theta)}+(d(\theta)-1),\,t^{d(\theta)}+ d(\theta)].
\end{equation*}
\notag
$$
Положим
$$
\begin{equation*}
E_0= \bigcup_{1}^{d(\theta)}\Delta^s,\qquad E_+ = [\tau_0,\tau_1]\setminus E_0.
\end{equation*}
\notag
$$
Определим функции
$$
\begin{equation}
v^\theta(\tau)= \begin{cases} 0, &\tau\in E_0, \\ 1, &\tau\in E_+, \end{cases} \qquad t^\theta(\tau)= \widehat t_0 + \int_{\tau_0}^\tau v^\theta(a)\,da, \quad \tau\in[\tau_0,\tau_1].
\end{equation}
\tag{3.10}
$$
Тогда
$$
\begin{equation*}
\frac{dt^\theta(\tau)}{d\tau}=v^\theta(\tau),\qquad t^\theta(\tau_0)=\widehat t_0, \quad t^\theta(\tau_1)=\widehat t_1.
\end{equation*}
\notag
$$
Таким образом, $t^\theta(\tau)$ – кусочно линейная неубывающая функция, отображающая $[\tau_0,\tau_1]$ на $[\,\widehat t_0,\widehat t_1]$, причем $\Delta^s$ – ее отрезки постоянства и $t^\theta(\Delta^s)=t^s$, $s =1,\dots, d(\theta)$. Положим
$$
\begin{equation}
u^\theta(\tau)=\begin{cases} \widehat u(t^\theta(\tau)), &\tau\in E_+, \\ u^s, &\tau\in \Delta^s, \ s =1,\dots, d(\theta), \end{cases} \qquad x^\theta(\tau)=\widehat{x}(t^\theta(\tau)).
\end{equation}
\tag{3.11}
$$
Тогда $u^\theta(\tau)$ – ограниченная измеримая, а $x^\theta(\tau)$ – абсолютно непрерывная функция; при этом
$$
\begin{equation*}
\frac{dx^\theta(\tau)}{d\tau} = v^\theta(\tau)\, f(x^\theta(\tau),u^\theta(\tau)), \qquad x^\theta(\tau_0) = \widehat{x}(\widehat t_0), \quad x^\theta(\tau_1) = \widehat{x}(\widehat t_1),
\end{equation*}
\notag
$$
т. е. концы новой траектории $x^\theta(\tau)$ совпадают с концами исходной $\widehat{x}(t)$. Кроме того, $x^\theta(\tau) = \widehat{x}(t^s)$ на каждом вставленном отрезке $\Delta^s$, построенная пара удовлетворяет смешанным ограничениям (3.4) на всем отрезке $[\tau_0,\tau_1]$, т. е.
$$
\begin{equation}
\begin{gathered} \, \varphi_i(x^\theta(\tau),u^\theta(\tau)) \leqslant 0, \qquad i=1,\dots,d(\varphi), \\ g_j(x^\theta(\tau),u^\theta(\tau)) =0, \qquad j=1,\dots,d(g), \end{gathered}
\end{equation}
\tag{3.12}
$$
причем на каждом $\Delta^s$ неравенства строгие. Обратим внимание, что некоторые точки $t^s$ могут совпадать: $t^{s'} = \dots = t^{s''} = t_*$, поэтому в такой точке $t_*$ вставляется подряд несколько единичных отрезков, на каждом из которых задаются $v^\theta(\tau)=0$ и свое значение $u^\theta(\tau)= u^s$. Множество $E_0$ состоит из конечного числа отрезков $\Delta^s$, $s =1,\dots, d(\theta)$. Множество $E_+$ – из конечного числа интервалов или полуинтервалов. Все указанные отрезки, интервалы и полуинтервалы множеств $E_0$ и $E_+$ объединим в общий набор, упорядочим его и обозначим составляющие этого набора через $\sigma_k$, $k=1,\dots,m$. Итак, $[\tau_0,\tau_1]= \sigma_1 \cup \dots \cup \sigma_m$, причем различные $\sigma_k$ не перекрываются. Обозначим через $\chi_k(\tau)$ характеристическую функцию множества $\sigma_k$, $k=1,\dots,m$. 3.2. Управляемая система индекса $\theta$ Нам потребуется следующий простой факт. Лемма 2. Пусть точка $(x^*,u^*)\in\mathbb{R}^{n+r}$ удовлетворяет условиям
$$
\begin{equation*}
\varphi(x^*,u^*) <0, \qquad g(x^*,u^*) =0.
\end{equation*}
\notag
$$
Тогда найдется окрестность $\mathcal{O}(x^*)$ точки $x^*$ и гладкая функция $\mathcal{U}\colon \mathcal{O}(x^*)\,{\to}\, \mathbb{R}^r$ такие, что
$$
\begin{equation*}
\varphi(x,\mathcal{U}(x)) <0, \quad g(x,\mathcal{U}(x)) =0 \quad \forall\, x\in \mathcal{O}(x^*),
\end{equation*}
\notag
$$
и при этом $\mathcal{U}(x^*) = u^*$. Доказательство. Напомним, что в силу предположения о регулярности смешанных ограничений ранг матрицы $g'_u(x^*,u^*)$ есть $d(g)$. Поэтому компоненты вектора $u$ можно разбить на две группы: $u =(u_1,u_2)$, так что $\dim u_2= d(g)$ и матрица $g'_{u_2}(x^*,u^*_1, u^*_2)$ невырождена. Тогда по теореме о неявной функции найдется окрестность $\mathcal{O}(x^*,u^*_1)$, в которой равенство $g(x, u_1, u_2)=0$ разрешается в виде гладкой функции $u_2 = G(x, u_1)$, т. е. выполнено равенство $g(x, u_1, G(x, u_1))=0$, причем $G(x^*, u_1^*) = u_2^*$.
Замораживая здесь $u_1 =u_1^*$, получаем гладкую функцию $u_2 = \widetilde G(x) = G(x, u_1^*)$ на открытом множестве $\mathcal{O}(x^*) = \{x\mid (x,u_1^*) \in \mathcal{O}(x^*,u^*_1)\}$. Сужая его, если необходимо, получаем также выполнение неравенства $\varphi(x,u_1^*,\widetilde G(x)) <0$. Остается положить $\mathcal{U}(x) = (u_1^*,\widetilde G(x))$. $\Box$ Зададим теперь некоторый индекс $\theta$. Для каждого $s =1,\dots, d(\theta)$ пусть $\mathcal{U}^s(x)$ есть функция из леммы 2, соответствующая точке $(\widehat{x}(t^s),u^s)$, определенная в некоторой окрестности точки $\widehat{x}(t^s)$. Отметим, что $\mathcal{U}^s(\widehat{x}(t^s)) = u^s$. Для данного индекса $\theta$ зафиксируем соответствующий ему отрезок $[\tau_0,\tau_1]$. Рассмотрим пространство $\mathbb{R}^{m+n}$ с переменными $z=(z_1,\dots,z_m)$, $x_0= x(\tau_0)$. Обобщая (3.10), введем кусочно постоянную функцию
$$
\begin{equation}
v(\tau)= \sum_{k=1}^m z_k\chi_k(\tau), \qquad \tau\in [\tau_0,\tau_1]
\end{equation}
\tag{3.13}
$$
(т. е. $z_k$ есть ее значение на участке $\sigma_k$), и рассмотрим управляемую систему
$$
\begin{equation}
\frac{dx}{d\tau}= v(\tau) \begin{cases} f(x(\tau),u(\tau)), &\tau\in E_+, \\ f(x(\tau),\,\mathcal{U}^s(x(\tau))), &\tau\in \Delta^s \subset E_0, \end{cases} \qquad x(\tau_0)=x_0.
\end{equation}
\tag{3.14}
$$
Здесь управление $u \in L^r_\infty(E_+)$, т. е. $u(\tau)$ есть произвольная измеримая ограниченная функция на $E_+$, а на каждом $\Delta^s\subset E_0$ мы полагаем $u(\tau) = \mathcal{U}^s(x(\tau))$, т. е. фактически управление там отсутствует. Отметим, что $\mathcal{U}^s(x^\theta(\tau)) = u^\theta(\tau) = u^s$ на каждом $\Delta^s$. Введем функцию
$$
\begin{equation*}
\mathcal{F}(\tau,x,u)= \begin{cases} f(x,u), &\tau\in E_+, \\ f(x,\mathcal{U}^s(x)), &\tau\in \Delta^s \subset E_0. \end{cases}
\end{equation*}
\notag
$$
Заметим, что она гладким образом зависит от пары $(x,u)\in \mathbb{R}^n \times \mathbb{R}^r;$ разрывность $\mathcal{F}$ по $\tau$ здесь не играет роли. При этом система (3.14) имеет вид
$$
\begin{equation}
\frac{dx}{d\tau}= v(\tau)\mathcal{F}(\tau,x(\tau),u(\tau)),\qquad x(\tau_0)=x_0,
\end{equation}
\tag{3.15}
$$
а с учетом (3.13) она фактически такова:
$$
\begin{equation}
\frac{dx}{d\tau}= \sum_{k=1}^m z_k\chi_k(\tau)\mathcal{F}(\tau,x(\tau),u(\tau)), \qquad x(\tau_0)=x_0.
\end{equation}
\tag{3.16}
$$
Пусть $z^\theta_k$ – значение $v^\theta(\tau)$ на $\sigma_k$, $k=1,\dots,m$, т. е. $v^\theta(\tau)=\sum z^\theta_k\chi_k(\tau)$. Напомним, что $z^\theta_k=0$, если $\sigma_k\subset E_0$, и $z^\theta_k =1$, если $\sigma_k\subset E_+$. Положим $z^\theta =(z^\theta_1,\dots, z^\theta_m)$, $x^\theta_0= x^\theta(\tau_0)= \widehat{x}(\widehat t_0)$; управление $u^\theta(\tau)$ введено выше. Нетрудно убедиться, что тройка $(u^\theta,z^\theta,x^\theta_0)$ удовлетворяет системе (3.16). Назовем ее базовой точкой задачи $\mathrm{B}^{\theta}$ (которую построим чуть ниже), соответствующей процессу $\widehat{w}(t)= (\widehat{x}(t),\widehat{u}(t))$ исходной задачи $\mathrm{B}$. Нетрудно видеть, что для любой тройки $(u,z,x_0)\in L_\infty^r(E_+) \times \mathbb{R}^m \times \mathbb{R}^n$, достаточно близкой к $(u^\theta,z^\theta,x^\theta_0)$, задача Коши (3.16) имеет единственное решение $x(\tau)$ на том же отрезке $[\tau_0,\tau_1]$. При этом пара $(x(\tau),u(\tau))$ порождается единственным решением $(x'(t),u'(t))$ исходной системы (3.3), определенным на отрезке $[\,\widehat t_0,\, t_1 = t(\tau_1)]$, т. е.
$$
\begin{equation}
x(\tau)= x'(t(\tau)), \qquad u(\tau)= u'(t(\tau)),
\end{equation}
\tag{3.17}
$$
где $t(\tau)$ определяется уравнением $dt/d\tau = v(\tau),$ $t(\tau_0)= \tau_0$. Более того, если тройка $(u,z,x_0)$ стремится к базовой тройке $(u^\theta,z^\theta,x^\theta_0)$, то $t(\tau_1)$ стремится к $\widehat t_1$, пара $(x'(t),u'(t))$ стремится к оптимальной паре $(\widehat{x}(t),\widehat{u}(t))$ задачи $\mathrm{B}$ по норме пространства $C\times L_1$ (оцениваемой каждый раз на общем отрезке их определения), и при этом $\|u'\|_\infty \leqslant \mathrm{const}$ (где константа зависит от $\theta)$. Действительно, при переходе от нового времени $\tau$ к исходному времени $t$ все отрезки из $E_+$ перейдут в отрезки, получающиеся из исходных отрезков $[t^s, t^{s+1}]$ малыми сдвигами и растяжениями (сжатиями), поэтому фазовая переменная $x'(t)$ на них будет равномерно близкой к оптимальной $\widehat{x}(t)$, а управление $u'(t)$ интегрально близким к $\widehat{u}(t)$. Каждый отрезок $\Delta \subset E_0$ оси $\tau$ перейдет в маленький отрезок оси $t$, поэтому $x'(t)$ будет равномерно близким к $\widehat{x}(t)$ на нем, и интеграл от $|u'(t)|$ будет малым. Подробное доказательство этих фактов сводится к рутинной проверке соответствующих оценок, мы его опускаем. (Оценки такого типа приведены в [34].) Замечание 5. Обратим внимание, что при базовом $z^\theta$, т. е. при $v= v^\theta$, каждый отрезок $\Delta^s \subset E_0$ при отображении $\tau \mapsto t(\tau)$ схлопывается и переходит в точку $t^s$, так что выбранные нами значения $u^\theta(\tau) =u^s$ на $\Delta^s$ не проявляются в исходном времени $t$ и поэтому, казалось бы, не играют никакой роли. Но если $z$ немного отклоняется от базового, то соответствующее $z_s >0$, и отрезок $\Delta^s \subset E_0$ оси $\tau$ переходит уже в маленький отрезок длины $z_s$ на оси $t$, на котором значение $u'(t) = \mathcal{U}^s(x(\tau(t)))$ близко к $u^s$. Тем самым в исходном времени возникает фактически игольчатая вариация управления! От “стандартной” игольчатой вариации эта вариация отличается главным образом тем, что мы не заменяем управление $\widehat{u}(t)$ на малом отрезке около точки $t^s$, а расшиваем эту точку, вставляя в это место малый отрезок с профилем $u'(t) = \mathcal{U}^s(x(\tau(t)))$. Поскольку точек $t^s$ несколько, в итоге получаем пакет таких обобщенных игольчатых вариаций. Использовать стандартные игольчатые вариации, подобно тому как это делалось, например, в [25], [26] (для задач без фазовых и смешанных ограничений), здесь не представляется возможным, так как ограничение $\Phi(x(t))\leqslant 0$ не будет дифференцируемо по ширине иголки, ибо уже производная траектории $x(t)$ по ширине иголки будет разрывной функцией. Как уже отмечалось во введении, преимущество таких “вставных” иголок по сравнению с обычными состоит также в том, что они обеспечивают гладкую зависимость всех ограничений задачи от ширины иголки при любом измеримом управлении, тогда как при использовании обычных иголок для этого надо предполагать кусочную непрерывность оптимального управления $\widehat{u}(t)$. Поскольку правая часть в (3.15), (3.16) есть гладкая функция от $(u,z,x)\in\mathbb{R}^{r+m+n}$, то для каждой тройки $(u,z,x_0)\in L_\infty^r(E_+) \times \mathbb{R}^m \times \mathbb{R}^n$, достаточно близкой к $(u^\theta,z^\theta,x^\theta_0)$, решение $x(\tau)$ задачи Коши (3.16) существует и гладким образом зависит от этой тройки3[x]3Условие $z_k \geqslant 0$ будет далее присутствовать лишь в ограничениях задачи, но сама система (3.16) имеет смысл при любых $z_k$.. Таким образом, имеется оператор
$$
\begin{equation*}
P\colon L^r_\infty(E_+)\times \mathbb{R}^m \times \mathbb{R}^n\to C^n[\tau_0, \tau_1], \qquad (u,z,x_0) \mapsto x(\tau),
\end{equation*}
\notag
$$
дифференцируемый по Фреше в окрестности точки $(u^\theta,z^\theta,x^\theta_0)$, производная которого непрерывна в этой точке. Производная в самой этой точке есть линейное отображение $P'(u,z,x_0)\colon (\overline u,\overline{z},\overline x_0) \mapsto \overline x(\tau)$, где функция $\overline x(\tau)$ есть решение задачи Коши с начальным значением $\overline{x}(\tau_0) =\overline{x}_0$ для уравнения в вариациях
$$
\begin{equation}
\frac{d\overline{x}}{d\tau} = \sum_k \bigl( z^\theta \chi_k \mathcal{F}_x(\tau,x^\theta, u^\theta)\overline{x} + z^\theta \chi_k \mathcal{F}_u(\tau,x^\theta, u^\theta) \overline u + \overline{z}_k\chi_k \mathcal{F}(\tau,x^\theta, u^\theta) \bigr),
\end{equation}
\tag{3.18}
$$
или в другой форме:
$$
\begin{equation}
\frac{d\overline{x}}{d\tau} = v^\theta \bigl(f_x(x^\theta, u^\theta)\overline{x} + f_u(x^\theta, u^\theta) \overline u\bigr) + \overline v f(x^\theta, u^\theta),
\end{equation}
\tag{3.19}
$$
где согласно (3.13) $\overline v(\tau)= \sum_{k=1}^m \overline{z}_k\chi_k(\tau)$. Здесь мы учли, что $\mathcal{U}^s(x^\theta(\tau)) = u^\theta(\tau)$ там, где $v^\theta =0$, т. е. на $E_0$, и что $\mathcal{F}(\tau,x^\theta, u^\theta) = f(x^\theta, u^\theta)$ на всем $[\tau_0,\tau_1]$. Производные $\mathcal{F}_x,\, \mathcal{F}_u$ совпадают с $f_x$, $f_u$ на $E_+$, а на $E_0$ их значение не играет роли, важно лишь их существование. (Впрочем, уравнение (3.19) вытекает и непосредственно из (3.15).) 3.3. Задача $\mathrm{B}^{\theta}$ индекса $\theta$ Для заданного индекса $\theta$ рассмотрим следующую задачу $\mathrm{B}^{\theta}$ в пространстве $L^r_\infty(E_+)\times \mathbb{R}^m \times \mathbb{R}^n$ с элементами $(u,z,x_0)$:
$$
\begin{equation}
F_0(x_0,x(\tau_1))\to \min,
\end{equation}
\tag{3.20}
$$
$$
\begin{equation}
F(x_0,x(\tau_1))\leqslant 0,\qquad K(x_0,x(\tau_1))=0, \qquad -z \leqslant 0,
\end{equation}
\tag{3.21}
$$
$$
\begin{equation}
\Phi(x(\tau))\leqslant 0 \quad \text{на } [\tau_0,\tau_1],
\end{equation}
\tag{3.22}
$$
$$
\begin{equation}
\varphi(x(\tau),u(\tau)) \leqslant 0,\qquad g(x(\tau),u(\tau)) = 0 \quad \text{на }E_+,
\end{equation}
\tag{3.23}
$$
где $x(\tau) = P(u,z,x_0)(\tau)$ выражается через $(u,z,x_0)$ в силу управляемой системы (3.16). Назовем ее присоединенной задачей, соответствующей процессу $\widehat{w}(t)= (\widehat{x}(t),\widehat{u}(t))$ исходной задачи $\mathrm{B}$ и индексу $\theta$. Замечание 6. Управление $u(\tau)$ на отрезках из $E_0$ не варьируется, а задается конкретными функциями от $x$, тогда как его варьирование на множестве $E_+$ будет нужно для получения условия стационарности по управлению $\overline H_u=0$. В задаче без смешанных ограничений этого условия нет, поэтому можно не варьировать управление на $E_+$, обходясь только обобщенными иголками, так что задача $\mathrm{B}^{\theta}$ будет конечномерной [27], [28]. При наличии смешанных ограничений одних обобщенных иголок недостаточно. Установим связь между оптимальностью базовых точек задач $\mathrm{B}$ и $\mathrm{B}^\theta$. Лемма 3. Если процесс $\widehat{w}= (\widehat{x}(t), \widehat{u}(t))$ доставляет понтрягинский минимум в задаче $\mathrm{B}$, то тройка $\zeta^\theta =(u^\theta,z^\theta,x^\theta_0)$ доставляет локальный минимум в присоединенной задаче $\mathrm{B}^{\theta}$, т. е. минимум относительно нормы $\|u\|_\infty +|z| +|x_0|$ (слабый минимум). Доказательство. Допустим, тройка $\zeta^\theta$ не есть точка локального минимума задачи $\mathrm{B}^{\theta}$. Это означает, что существует последовательность допустимых троек $\zeta = (u,z,x_0)$ задачи $\mathrm{B}^{\theta}$ такая, что $\zeta \to \zeta^\theta$, на которой $F_0(\zeta) < F_0(\zeta^\theta)$. Переходя от времени $\tau$ к исходному времени $t$, построим, как указано выше, последовательность процессов $w' = (x'(t), u'(t))$, удовлетворяющих равенствам (3.17) и системе (3.3). Для этих процессов в силу (3.23) смешанные ограничения задачи $\mathrm{B}$ будут выполнены на образе множества $E_+$. На отрезках оси $\tau$ из $E_0$ эти ограничения выполнены по построению, причем неравенства здесь строгие. При переходе к $t$ каждый отрезок из $E_0$ перейдет в маленький отрезок, на котором смешанные ограничения также будут выполнены (даже строго). Выполнение фазовых ограничений для процесса $w'$ сохранится в силу (3.22).
Так как каждая траектория $x'(t)$ имеет те же концы, что и $x(\tau)$, то построенные процессы $w'$ допустимы в задаче $\mathrm{B}$ и имеют значения $F_0(w') = F_0(\zeta) < F_0(\zeta^\theta) = F_0(\widehat{w})$. Наконец, поскольку $\zeta \to \zeta^\theta$, то, как показано выше, $\|x' -\widehat{x}\|_C \to 0$, $\|u' -\widehat{u}\|_1 \to 0$ и $\|u\|_\infty \leqslant \mathrm{const}$, что противоречит наличию понтрягинского минимума в точке $\widehat{w}$ задачи $\mathrm{B}$. $\Box$ Выпишем теперь необходимые условия локального минимума для задачи $\mathrm{B}^{\theta}$. Обратим внимание, что хотя все “установочные” функции этой задачи гладкие, она все-таки не является стандартной гладкой задачей, ибо в ней имеется континуальное число ограничений неравенства (3.22), (3.23). Это есть задача так называемой “полубесконечной” оптимизации. Тем не менее, необходимые условия локального минимума для таких задач известны – это общее правило множителей (или принцип) Лагранжа (см. п. 9.1). В данном случае они состоят в следующем. Теорема 2. Пусть тройка $(u^\theta, z^\theta, x^\theta_0)$ доставляет локальный минимум в задаче $\mathrm{B}^{\theta}$. Тогда найдется число $\alpha_0$, векторы-строки $\alpha\in\mathbb{R}^{d(F)}$, $\beta\in \mathbb{R}^{d(K)}$, $\gamma \in\mathbb{R}^{m+n}$, элементы $\lambda \in L_\infty^{d(\varphi)*}(E_+)$, $m \in L_\infty^{d(g)*}(E_+)$ и вектор-функция $\mu(\tau)$ размерности $d(\Phi)$ на $[\tau_0,\tau_1]$ с неубывающими компонентами и условием $\mu(\tau_0)=0$ такие, что
$$
\begin{equation*}
\begin{aligned} \, &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \gamma\geqslant 0,\quad \lambda\geqslant 0, \\ &(\mathrm{ii})\ \alpha_0+ |\alpha|+ |\beta|+ |\gamma|+ \|\lambda\|+ \|m\|+ \mu(\tau_1)> 0, \\ &(\mathrm{iii})\ \alpha F(\widehat{x}_0, \widehat{x}_1)=0,\quad \gamma z^\theta =0,\quad \langle \lambda,\varphi(x^\theta,u^\theta) \rangle =0,\quad \Phi(x^\theta(\tau))\,d \mu(\tau) =0, \end{aligned}
\end{equation*}
\notag
$$
и при этом функция Лагранжа задачи $\mathrm{B}^{\theta}$
$$
\begin{equation*}
L(u,z,x_0) = (\alpha_0 F_0+\alpha F+\beta K) -\gamma z + \langle \lambda,\varphi(x,u)\rangle +\langle m, g(x,u)\rangle + \int_{\tau_0}^{\tau_1}\Phi(x)\,d \mu
\end{equation*}
\notag
$$
стационарна в точке $(u^\theta, z^\theta, x^\theta_0)$:
$$
\begin{equation}
L'(u^\theta, z^\theta, x^\theta_0) = 0.
\end{equation}
\tag{3.24}
$$
Здесь $\lambda$ и $m$ – линейные непрерывные функционалы на пространствах $L_\infty(E_+)$ соответствующих размерностей; через $\langle \lambda,\overline\varphi \rangle$ и $\langle m,\overline g \rangle$ мы обозначаем результаты их действия на произвольные элементы $\overline\varphi$ и $\overline g$ этих пространств. Наша ближайшая цель – расшифровать выписанные условия. Остановимся чуть подробнее на условии $\langle \lambda,\varphi(w^\theta) \rangle = \sum_i\langle \lambda_i,\varphi_i(w^\theta) \rangle =0$. Оно означает, что для каждого $i$ функционал $\lambda_i \in L^*_\infty(E_+)$ есть опорный элемент (внешняя нормаль) к конусу $\Omega$ неположительных функций пространства $L_\infty(E_+)$ в точке $\varphi_i(w^\theta)\in \Omega$. Введем для каждого $\delta>0$ множество $M_i^\delta = \{ \tau\in E_+\mid \varphi_i(w^\theta) \geqslant -\delta\}$, возможно пустое. Тогда каждый $\lambda_i$ характеризуется следующими свойствами (см. [7; § 3.5]): a) $\lambda_i\geqslant0$; b) $\lambda_i$ сосредоточен на множестве $M_i^\delta$ при любом $\delta>0$; c) $\|\lambda_i\| := \langle \lambda_i, \mathbf{1}\rangle =1$. (Здесь $\mathbf{1}$ есть функция, тождественно равная $1$.) Ниже мы покажем, что каждый $\lambda_i$ есть “обычная” функция из $L_1(E_+)$, и даже из $L_\infty(E_+)$, и, значит, сосредоточен на множестве $M_i^0 \,{=}\, \{ \tau\,{\in}\, E_+ \,{\mid}\, \varphi_i(w^\theta) \,{=}\,0\}$, т. е. почти всюду на $E_+$ выполнено обычное условие дополняющей нежесткости $\lambda_i(\tau)\varphi_i(w^\theta(\tau)) =0$.
§ 4. Условия стационарности в задаче $\mathrm{B}^\theta$ Для удобства обозначения введем концевую функцию Лагранжа $l = \alpha_0 F_0+\alpha F+\beta K$ и для краткости положим $f^\theta = f(x^\theta, u^\theta)$, $f^\theta_x = f_x(x^\theta,u^\theta)$, и тому подобное. Условие (3.24) означает, что для любых $(\overline u,\overline{z},\overline x_0)$
$$
\begin{equation}
\begin{aligned} \, &L'(u^\theta, z^\theta, x^\theta_0)(\overline u,\overline{z}, \overline x_0) = l_{x_0} \overline x_0+ l_{x_1} \overline x_1 - \gamma \overline{z} \nonumber \\ &\qquad\qquad\quad + \langle \lambda,(\varphi_x^\theta \overline x + \varphi_u^\theta\overline u) \rangle + \langle m,(g_x^\theta \overline x + g_u^\theta\overline u) \rangle + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu =0, \end{aligned}
\end{equation}
\tag{4.1}
$$
где $\overline x_1 =\overline x(\tau_1)$ в силу уравнения (3.18) (или (3.19)). (Производные всех функций берутся здесь в оптимальной точке $(u^\theta, z^\theta, x^\theta_0)$.) 1. Упростим сначала вид функционалов $\lambda$, $m$, априорно принадлежащих $L^*_\infty(E_+)$. Для этого напомним следующее свойство функционалов из пространства $L_\infty^*(\Delta)$ на некотором отрезке $\Delta$. Функционал $\pi\in L_\infty^*(\Delta)$ называется абсолютно непрерывным, если существует функция $p \in L_1(\Delta)$ такая, что $\pi$ имеет представление
$$
\begin{equation*}
\langle \pi, u \rangle = \int_{\tau_0}^{\tau_1} p(\tau)\,u(\tau)\,d\tau \quad \text{для всех} \quad u\in L_\infty(\Delta).
\end{equation*}
\notag
$$
Нетрудно показать, что $\pi$ абсолютно непрерывен тогда и только тогда, когда $\langle \pi, u_n\rangle \to 0$ для любой последовательности функций $u_n \in L_\infty(\Delta)$ такой, что $\|u_n\|_\infty \leqslant\mathrm{const}$, $\|u_n\|_1 \to0$. (Это вытекает, например, из теоремы Иосиды–Хьюитта о разложении $\pi$ на две составляющие – абсолютно непрерывную и сингулярную. Ясно, что для абсолютно непрерывной компоненты это предельное свойство выполнено, а для сингулярной нет.) Отсюда следует, что для любого $\eta \in L_\infty^*(E_+)$ и любой функции $a\in L_\infty(E_+)$ функционал вида $\langle \eta, a\overline x \rangle$, где $\overline x$ выражается через $\overline u \in L_\infty(E_+)$ из уравнения $d\overline{x}/d\tau = A(\tau)\overline x + B(\tau)\overline u$ с заданными матрицами $A, B\in L_\infty$ на отрезке $[\tau_0,\tau_1]$ и начальным значением $\overline x(\tau_0)=0$, будет абсолютно непрерывным от $\overline u$. Действительно, если $\|\overline u_n\|_1 \to 0$, то по лемме Гронуолла $\|\overline x_n\|_C \to0$, тогда $\| a\,\overline x_n\|_\infty \to 0$, и, значит, $\langle \eta, a\overline x_n \rangle \to 0$. По тем же причинам для любой меры $d\mu$ на $[\tau_0,\tau_1]$ и любой непрерывной функции $c(\tau)$ функционал $\int c\overline x\,d\mu$ также является абсолютно непрерывным относительно $\overline u \in L_\infty(E_+)$. 2. Вернемся к равенству (4.1). Положим в нем $\overline{z}=0$, $\overline x_0=0$. Тогда $\overline{v}=0$, и согласно (3.19), $\overline x$ выражается через $\overline u$ из уравнения
$$
\begin{equation}
\frac{d\overline{x}}{d\tau}= v^\theta(f_x^\theta \overline x + f_u^\theta \overline u), \qquad \overline x(\tau_0)=0.
\end{equation}
\tag{4.2}
$$
При этом для всех $\overline u \in L_\infty(E_+)$ выполнено равенство
$$
\begin{equation*}
\langle \lambda,\varphi_u^\theta\overline u \rangle + \langle m, g_u^\theta\overline u \rangle = -l_{x_1} \overline x_1 - \langle \lambda, \varphi_x^\theta\overline x \rangle - \langle m, g_x^\theta\overline x \rangle + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu,
\end{equation*}
\notag
$$
правая часть которого, как мы показали, есть абсолютно непрерывный функционал, т. е.
$$
\begin{equation}
\sum_{i=1}^{d(\varphi)}\langle \lambda_i,\varphi_{iu}^\theta\overline u \rangle+ \sum_{j=1}^{d(g)}\langle m, g_{ju}^\theta\overline u \rangle = \int_{E_+} p(\tau)\overline u(\tau)\,d\tau,
\end{equation}
\tag{4.3}
$$
где $p$ – некоторая функция из $L_1(E_+)$. В силу принятого нами предположения о регулярности смешанных ограничений для набора вектор-функций $\varphi_{iu}(w^\theta)$, $g_{ju}(w^\theta)$ справедлива теорема 8 об отсутствии сингулярных составляющих, согласно которой из равенства (4.3) следует, что все компоненты функционалов $\lambda$ и $m$ абсолютно непрерывны, т. е. $\lambda_i = \lambda_i(\tau)$ и $m_j= m_j(\tau)$ суть функции из $L_1(E_+)$, причем все $\lambda_i(\tau)\geqslant0$ на $E_+$. Тогда условие дополняющей нежесткости $\langle \lambda,\varphi(x^\theta,u^\theta) \rangle =0$ приобретает вид
$$
\begin{equation*}
\sum_{i=1}^{d(\varphi)}\int_{E_+}\lambda_i(\tau)\varphi_i(x^\theta(\tau),u^\theta(\tau))\,d\tau =0,
\end{equation*}
\notag
$$
и, значит, для каждой компоненты $\lambda_i$ верно равенство $\lambda_i(\tau)\varphi_i(x^\theta(\tau),u^\theta(\tau))\,{=}\,0$, т. е. $\lambda_i$ сосредоточена на множестве зануления $i$-го смешанного неравенства $\varphi_i(x^\theta(\tau),u^\theta(\tau))=0$. Для единообразия положим $\lambda=0$ и $m=0$ на $E_0$, так что теперь $\lambda$, $m$ суть элементы $L_1[\tau_0,\tau_1]$. Тогда, возвращаясь к равенству (4.1), получаем его в виде
$$
\begin{equation}
\begin{aligned} \, &l_{x_0} \overline x_0+ l_{x_1} \overline x_1-\gamma \overline{z} \nonumber \\ &\qquad + \int_{\tau_0}^{\tau_1} \lambda (\varphi_x^\theta\overline x + \varphi_u^\theta\overline u)\, d\tau + \int_{\tau_0}^{\tau_1} m (g_x^\theta \overline x + g_u^\theta\overline u)\,d\tau + \int_{\tau_0}^{\tau_1}\Phi_x^\theta \overline x\,d \mu =0. \end{aligned}
\end{equation}
\tag{4.4}
$$
3. Перепишем это равенство в терминах независимых переменных $(\overline u,\overline{z},\overline x_0)$ с учетом уравнения (3.18) (или (3.19)). Нам надо преобразовать члены, содержащие $\overline x_1$ и $\overline x(\tau)$. Для этого установим следующий простой факт. Лемма 4. Пусть абсолютно непрерывная функция $\overline x(\tau)$ и функция ограниченной вариации $\psi(\tau)$ (обе $n$-мерные, из них $\overline x$ есть столбец, $\psi$ – строка) удовлетворяют уравнениям
$$
\begin{equation}
\dot{\overline x} = A\overline x + \overline b, \quad \overline x(\tau_0) = \overline x_0, \qquad \dot\psi = -\psi A + \dot\rho, \quad \psi(\tau_1) = -l_1,
\end{equation}
\tag{4.5}
$$
где матрица $A(\tau)$ и функция $\overline b(\tau)$ измеримы и ограничены, $\rho(\tau)$ есть функция ограниченной вариации, непрерывная в точках $\tau_0$, $\tau_1$, и $l_1$ есть вектор из $\mathbb{R}^n$. Тогда
$$
\begin{equation}
l_1\overline x_1 + \int_{\tau_0}^{\tau_1} \overline x\, d\rho = -\psi_0\overline x_0 - \int_{\tau_0}^{\tau_1} \psi\overline b\,d\tau.
\end{equation}
\tag{4.6}
$$
Доказательство. Возьмем производную по времени от произведения $\psi\overline x$:
$$
\begin{equation*}
\frac d{d\tau}(\psi\overline x)= (-\psi A + \dot\rho)\overline x + \psi(A\overline x + \overline b) = \dot\rho\overline x+\psi\overline b,
\end{equation*}
\notag
$$
поэтому
$$
\begin{equation*}
\psi_1\overline x_1 - \psi_0\overline x_0 = \int_{\tau_0}^{\tau_1} \overline x\,d\rho + \int_{\tau_0}^{\tau_1} \psi\overline b\,d\tau.
\end{equation*}
\notag
$$
Отсюда с учетом граничного значения $\psi_1 = -l_1$ получаем (4.6). $\Box$ Замечание 7. Доказанное утверждение есть обобщение классической леммы Дюбуа–Раймона, или, по сути дела, формула интегрирования по частям для интеграла Стилтьеса. Применим теперь лемму 4 к равенству (4.4) с учетом уравнения (3.19). Сопоставляя (4.4) с левой частью (4.6) и (3.19) с верхней строчкой в (4.5), видим, что
$$
\begin{equation*}
\begin{gathered} \, A = v^\theta f_x^\theta, \qquad \overline b = v^\theta f^\theta_u\overline u+ \overline v f^\theta, \\ d\rho = (\lambda\varphi_x^\theta+m g_x^\theta)\,d\tau+ \Phi_x^\theta\,d\mu, \qquad l_1= l_{x_1}. \end{gathered}
\end{equation*}
\notag
$$
Поэтому введем функцию ограниченной вариации $\psi^\theta(\tau)$ (сопряженную переменную задачи $\mathrm{B}^\theta)$, которая согласно (4.5) есть решение уравнения
$$
\begin{equation}
\frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+ \lambda\varphi_x^\theta +mg_x^\theta+\frac{d\mu}{d\tau}\,\Phi_x^\theta, \qquad \psi^\theta(\tau_1)= -l_{x_1}.
\end{equation}
\tag{4.7}
$$
Тогда по лемме 4 равенство (4.4) принимает вид
$$
\begin{equation*}
l_{x_0} \overline x_0 - \psi_0^\theta\overline x_0 - \gamma \overline{z} - \int_{\tau_0}^{\tau_1} \psi^\theta (v^\theta f_u^\theta\overline u + \overline{v} f^\theta)\,d\tau + \int_{\tau_0}^{\tau_1} (\lambda\varphi_u^\theta + m g_u^\theta) \overline u \,d\tau =0,
\end{equation*}
\notag
$$
откуда, учитывая, что $\overline v(\tau)= \sum \overline{z}_k \chi_k(\tau)$, имеем
$$
\begin{equation}
\begin{aligned} \, &(l_{x_0}-\psi^\theta_0)\overline x_0 + \sum_k z_k^\theta \int_{\sigma_k} (-\psi^\theta f_u^\theta +\lambda\varphi_u^\theta+ mg_u^\theta)\overline u \,d\tau \nonumber \\ &\qquad- \sum_k \overline{z}_k \int_{\sigma_k} \psi^\theta f^\theta\, d\tau - \sum_k\gamma_k\overline{z}_k= 0. \end{aligned}
\end{equation}
\tag{4.8}
$$
Это равенство выполнено для всех $\overline x_0\in\mathbb{R}^n$, всех $\overline{z}_k\in \mathbb{R}$, $k=1,\dots,m,$ и всех $\overline u \in L_\infty(E_+)$. Варьируя $\overline x_0$ и $\overline{z}_k$, получаем $\psi^\theta(\tau_0) = l_{x_0}$, и при каждом $k$
$$
\begin{equation}
\int_{\sigma_k} \psi^\theta f^\theta\, d\tau = -\gamma_k.
\end{equation}
\tag{4.9}
$$
Вспомним, что все $\gamma_k \geqslant 0$, $z_k^\theta\geqslant 0$, а согласно условию дополняющей нежесткости (iii) из теоремы 2 $\gamma z^\theta := \sum \gamma_k z^\theta_k =0$, и, значит, $\gamma_k z^\theta_k =0$ для всех $k$. Если $\sigma_k\subset E_+$, то $z^\theta_k =1$, и тогда $\gamma_k =0$. Если же $\sigma_k\subset E_0$, то $z^\theta_k =0$, и тогда нам известно лишь, что $\gamma_k \geqslant 0$. Наконец, варьируя $\overline u$, получаем на каждом $\sigma_k\subset E_+$
$$
\begin{equation}
-\psi^\theta f_u^\theta+\lambda\varphi_u^\theta+ m g_u^\theta=0.
\end{equation}
\tag{4.10}
$$
Подчеркнем, что это равенство выполнено только на $E_+$. Если $\sigma_k\subset E_0$, то $\overline u$ не варьируется, и никакого условия мы здесь не получаем. 4. Подведем предварительный итог проделанной расшифровки условий стационарности (4.1). Теорема 3. Для любого индекса $\theta$ существует набор
$$
\begin{equation*}
\xi^\theta= (\alpha_0,\alpha,\beta,\lambda^\theta(\tau), m^\theta(\tau),\mu^\theta(\tau)),
\end{equation*}
\notag
$$
лежащий в пространстве $\mathbb{R}^{1+d(F)+d(K)} \times \bigl(L_1^{d(\varphi)} \times L_1^{d(g)} \times BV^{d(\Phi)}\bigr)[\tau_0,\tau_1]$, и соответствующая ему функция ограниченной вариации $\psi^\theta(\tau)$ такие, что выполнены условия
$$
\begin{equation*}
\begin{gathered} \, \begin{split} &(\mathrm{i})\ \alpha_0\geqslant0,\quad \alpha\geqslant0,\quad \gamma\geqslant 0,\quad \lambda^\theta\geqslant 0,\quad d\mu^\theta \geqslant0, \\ &(\mathrm{ii})\ \alpha_0+ |\alpha|+ |\beta|+ \int_{E_+} |\lambda^\theta|\,dt + \int_{E_+} |m^\theta|\,dt+ \int_{\tau_0}^{\tau_1} d\mu^\theta>0, \\ &\qquad\lambda^\theta =0,\quad m^\theta=0\quad\textit{п. в. на }E_0, \\ &(\mathrm{iii})\ \alpha F(\widehat{x}_0,\widehat{x}_1)=0,\quad \lambda^\theta(\tau) \varphi^\theta(\tau) =0,\quad \Phi(x^\theta(\tau))\,d \mu^\theta(\tau) =0, \end{split} \end{gathered}
\end{equation*}
\notag
$$
$$
\begin{equation}
\frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+ \lambda^\theta \varphi_x^\theta+m^\theta g_x^\theta + \frac{d\mu^\theta}{d\tau}\,\Phi_x^\theta,
\end{equation}
\tag{4.11}
$$
$$
\begin{equation}
\psi^\theta(\tau_0)= l_{x_0}, \qquad \psi^\theta(\tau_1)= -l_{x_1},
\end{equation}
\tag{4.12}
$$
$$
\begin{equation}
-\psi^\theta f_u^\theta+\lambda^\theta \varphi_u^\theta+ m^\theta g_u^\theta=0 \quad \textit{на }E_+,
\end{equation}
\tag{4.13}
$$
$$
\begin{equation}
\int_{\sigma_k}\psi^\theta f^\theta \, d\tau \begin{cases} =0, &\textit{если }\sigma_k\subset E_+, \\ \leqslant 0, &\textit{если }\sigma_k\subset E_0, \end{cases} \qquad k=1,\dots,m.
\end{equation}
\tag{4.14}
$$
Функция $\psi^\theta$ однозначно определяется набором $\xi^\theta$ из уравнения (4.11) и любого из граничных условий (4.12). Отметим, что множитель $\gamma$ не включен в условие нетривиальности (ii), поскольку он выражается через $\psi^\theta$ в силу (4.9). Более того, покажем, что из условия (ii) можно исключить и $m^\theta$, т. е. считать, что
$$
\begin{equation*}
\alpha_0+ |\alpha|+ |\beta|+ \int_{E_+} |\lambda^\theta|\,dt + \int_{\tau_0}^{\tau_1} d\mu^\theta>0.
\end{equation*}
\notag
$$
Действительно, если левая часть здесь равна нулю, то $l=0$, $\lambda^\theta=0$, $d\mu^\theta =0$,
$$
\begin{equation*}
\frac{d\psi^\theta}{d\tau}= -v^\theta\psi^\theta f_x^\theta+m^\theta g_x^\theta,\qquad \psi^\theta(\tau_0)= \psi^\theta(\tau_1)= 0, \qquad -\psi^\theta f_u^\theta+ m^\theta g_u^\theta=0 \quad \text{на } E_+.
\end{equation*}
\notag
$$
Так как матрица $g_u(x^\theta, u^\theta)$ имеет полный ранг, причем равномерно по $\tau$, она имеет ограниченную правую обратную $D(\tau)$, так что $m^\theta = \psi^\theta f_u^\theta D(\tau)$. Подставляя это выражение в уравнение для $\psi^\theta$, получим линейное однородное уравнение с нулевыми граничными условиями. Отсюда $\psi^\theta =0$, а тогда и $m^\theta =0$. Отметим, что и в общем случае, при ненулевых $\lambda^\theta$, $d\mu^\theta$, мы так же можем выразить $m^\theta = (\psi^\theta f_u^\theta - \lambda^\theta\varphi_u^\theta)D(\tau)$ и подставить это в сопряженное уравнение, получив линейное уравнение относительно $\psi$ с правой частью, содержащей $\lambda^\theta$ и $d\mu^\theta$. 5. Рассмотрим подробнее второе условие из (4.14). Возьмем произвольный отрезок $\sigma = [\tau', \tau'']$, из которых состоит $E_0$. На нем $u^\theta(\tau) = u^s$ при некотором $s$, оно постоянно, $v^\theta = 0$, поэтому значение $x^\theta(\tau)$ также постоянно, обозначим его $\widehat{x}_*$; при этом $f^\theta = f(\widehat{x}_*,u^s)$. Слева и справа к данному отрезку $[\tau', \tau'']$ могут примыкать и другие отрезки из $E_0$. (При отображении $\tau \mapsto t$ они все перейдут в одну точку $t^s.)$ Пусть $\widetilde \sigma =[\tau'_*,\tau''_*]$ есть объединение данного отрезка со всеми примыкающими к нему отрезками из $E_0$. (Если слева других таких нет, то $\tau'_* =\tau'$, а если нет справа, то $\tau''_* =\tau''.)$ Тогда $v^\theta = 0$ на всем этом отрезке $\widetilde\sigma$, так что по-прежнему $x^\theta(\tau)= \widehat{x}_*$ постоянно. Согласно (4.11), и учитывая, что $\lambda=0$, $m=0$ на $\widetilde\sigma$, имеем
$$
\begin{equation}
d\psi^\theta(\tau)= \sum_{j=1}^{d(\Phi)} d\mu_j^\theta(\tau)\,\Phi_j'(\widehat{x}_*)\quad \text{на } \widetilde\sigma.
\end{equation}
\tag{4.15}
$$
(Напомним, что индекс $j$ обозначает $j$-е фазовое ограничение $\Phi_j(x)\leqslant0$ и соответствующую ему меру $d\mu_j^\theta$. При этом $\Phi'_j$ суть строки матрицы $\Phi_x$.) Отсюда следует, что для любого $\tau\in [\tau'_*,\tau''_*]$
$$
\begin{equation}
\psi^\theta(\tau)-\psi^\theta(\tau'_*-0)= \sum_{j=1}^{d(\Phi)} [\mu_j^\theta(\tau)-\mu_j^\theta(\tau'_*-0)]\Phi_j'(\widehat{x}_*).
\end{equation}
\tag{4.16}
$$
Второе условие из (4.14) означает, что на исходном (нерасширенном) отрезке $\sigma$ выполнено неравенство
$$
\begin{equation}
\int_{\tau'}^{\tau''} \psi^\theta(\tau) f(\widehat{x}_*,u^k)\, d\tau \leqslant 0.
\end{equation}
\tag{4.17}
$$
Подставляя сюда значение $\psi^\theta(\tau)$ из (4.16), получаем
$$
\begin{equation}
\begin{aligned} \, &\psi^\theta(\tau'_*-0)f(\widehat{x}_*,u^s)(\tau''-\tau') \nonumber \\ &\qquad +\sum_{j=1}^{d(\Phi)}\Phi'_j(\widehat{x}_*)f(\widehat{x}_*,u^s) \int_{\tau'}^{\tau''}[\mu_j^\theta(\tau)- \mu_j^\theta(\tau'_*-0)]\,d\tau \leqslant 0. \end{aligned}
\end{equation}
\tag{4.18}
$$
Поскольку $\mu_j^\theta(\tau) \leqslant \mu_j^\theta(\tau''_*+0)$ на отрезке $[\tau', \tau'']$ для всех $j$, имеем неравенство
$$
\begin{equation*}
\int_{\tau'}^{\tau''}[(\mu_j^\theta(\tau) -\mu_j^\theta(\tau'_*-0)]\, d\tau \leqslant [\mu_j^\theta(\tau''_*+0) -\mu_j^\theta(\tau'_*-0)](\tau''-\tau').
\end{equation*}
\notag
$$
Пусть числа $0\leqslant \rho_j \leqslant 1$, $j=1,\dots,d(\Phi)$, таковы, что
$$
\begin{equation*}
\int_{\tau'}^{\tau''} [(\mu_j^\theta(\tau) -\mu_j^\theta(\tau'_*-0)]\, d\tau = \rho_j [\mu_j^\theta(\tau''_*+0) -\mu_j^\theta(\tau'_*-0)](\tau''-\tau').
\end{equation*}
\notag
$$
Тогда из условия (4.18) вытекает, что
$$
\begin{equation}
\biggl(\psi^\theta(\tau'_*-0) + \sum_{j=1}^{d(\Phi)} \rho_j [\mu_j^\theta(\tau''_* +0) -\mu_j^\theta(\tau'_*-0)] \Phi'_j(\widehat{x}_*)\biggr) f(\widehat{x}_*,u^s) \leqslant 0.
\end{equation}
\tag{4.19}
$$
Замечание 8. Этот нетривиальный прием замены условия (4.18) на условие (4.19) с неизвестными числами $\rho_j$ был предложен А. А. Милютиным в его лекциях на механико-математическом факультете МГУ в 1970-х гг. Он позволит нам сделать следующий важный шаг в доказательстве ПМ для задач со многими фазовыми ограничениями – перейти от условий во времени $\tau$ к условиям в исходном времени $t$. В случае скалярного фазового ограничения этот прием не нужен, так как тогда функция $\psi^\theta(\tau) f(\widehat{x}_*,u^k)$ монотонна на $[\tau'_*,\tau''_*]$ (см. [27]). Перепишем теперь полученные условия в терминах исходного времени $t$. Это даст нам возможность рассматривать условия, полученные для различных индексов $\theta$, на одном и том же отрезке $[\,\widehat t_0,\widehat t_1]$.
§ 5. Конечнозначный принцип максимума индекса $\theta$ По построению на отрезке $[\tau_0, \tau_1]$ имеем неубывающую функцию $t^\theta(\tau)$, которая отображает его на отрезок $[\,\widehat t_0,\widehat t_1]$, причем на каждом отрезке $\sigma \subset E_0$ она постоянна. Кроме того, на $[\tau_0, \tau_1]$ имеются функции $u^\theta(\tau)$ и $x^\theta(\tau)$, связанные с исходными $\widehat{x}(t)$ и $\widehat{u}(t)$ формулами (3.11). Пусть $\tau^\theta(t)$ есть наименьший корень уравнения $t^\theta(\tau) =t$. Эта функция строго возрастает и имеет разрывы в заданных точках $t^s$ (и только в них): скачок $\Delta\tau(t^s) = \tau''_* -\tau'_*$, где $[\tau'_*,\tau''_*]$ – указанный выше максимальный отрезок, соответствующий точке $t^s$. Положим
$$
\begin{equation*}
\begin{alignedat}{2} \lambda(t) &= \lambda^\theta(\tau^\theta(t)), &\qquad m(t) &= m^\theta(\tau^\theta(t)), \\ \mu(t) &= \mu^\theta(\tau^\theta(t)), &\qquad \psi(t)&=\psi^\theta(\tau^\theta(t)), \end{alignedat} \qquad t\in [\,\widehat t_0,\widehat t_1].
\end{equation*}
\notag
$$
Заметим, что поскольку $\lambda^\theta =0$ и $m^\theta=0$ на $E_0$, и $dt = d\tau$ на $E_+$, функции $\lambda(t)$ и $m(t)$ по-прежнему интегрируемы, теперь уже на отрезке $[\,\widehat t_0,\widehat t_1]$, и нормировка этих множителей при переходе от $\tau$ к $t$ сохраняется:
$$
\begin{equation*}
\int_{\widehat t_0}^{\widehat t_1} |\lambda(t)|\,dt = \int_{\tau_0}^{\tau_1} |\lambda^\theta(\tau)|\,dt, \qquad \int_{\widehat t_0}^{\widehat t_1} |m(t)|\,dt = \int_{\tau_0}^{\tau_1} |m^\theta(\tau)|\,dt.
\end{equation*}
\notag
$$
(Впрочем, второе равенство нам не понадобится, так как множитель $m$ мы исключили из нормировки). Нетрудно также убедиться, что функция $\mu(t)$ не убывает и имеет в точках $t^s$ скачки $\Delta\mu(t^s) = \mu^\theta(\tau''_* +0) - \mu^\theta(\tau'_*-0)$, при этом
$$
\begin{equation*}
\int_{\widehat t_0}^{\widehat t_1} d\mu(t)\,dt =\int_{\tau_0}^{\tau_1} d\mu^\theta(\tau)\,d\tau,
\end{equation*}
\notag
$$
а $\psi(t)$ есть функция ограниченной вариации, удовлетворяющая уравнению
$$
\begin{equation*}
\begin{aligned} \, \frac{d\psi(t)}{dt} &= -\psi(t)f_x(\widehat{x}(t),\widehat{u}(t)) \\ &\qquad + \lambda(t)\varphi_x(\widehat{x}(t),\widehat{u}(t))+ m(t)g_x(\widehat{x}(t),\widehat{u}(t))+ \frac{d \mu(t)}{dt}\, \Phi'(\widehat{x}(t)), \end{aligned}
\end{equation*}
\notag
$$
и имеющая те же концевые значения, что и $\psi^\theta(\tau)$. Это уравнение следует из (4.11) с учетом того, что для $\tau \in E_+$ и соответствующего $t = t^\theta(\tau)$ справедливо $d\mu(t) = d\mu^\theta(\tau)$. Проверку этих свойств мы оставляем читателю. Напомним, что в силу предположения (2.7) в окрестностях точек $\widehat t_0$, $\widehat t_1$ мера не работает: $d\mu(t)=0$, поэтому функция $\psi(t)$ непрерывна в этих точках. Теорема 3 переписывается в исходном времени $t\in [\,\widehat t_0,\widehat t_1]$ следующим образом. Теорема 4 (принцип максимума индекса $\theta$). Для любого индекса $\theta$ существует набор $\xi = (\alpha_0,\alpha,\beta,\lambda(t), m(t),\mu(t))$, где функции $\lambda(t)$ и $m(t)$ интегрируемы, $\mu(t)$ не убывает, и соответствующая ему функция ограниченной вариации $\psi(t)$ такие, что выполнены условия:
$$
\begin{equation}
\begin{gathered} \, \begin{split} &(\mathrm{i}) \ \alpha_0\geqslant0,\qquad \alpha\geqslant 0,\quad \lambda(t)\geqslant0,\quad d\mu(t)\geqslant 0; \\ &(\mathrm{ii}) \ \alpha_0+ |\alpha|+ |\beta|+ \sum_i \int_{\widehat t_0}^{\widehat t_1} \lambda_i(t)\,dt+ \sum_j \int_{\widehat t_0}^{\widehat t_1}d \mu_j(t) =1; \\ &(\mathrm{iii}) \ \alpha F(\widehat{x}_0,\widehat{x}_1)=0, \qquad \lambda_i(t)\varphi_i(\widehat{x}(t)),\widehat{u}(t))=0,\quad i=1,\dots, d(\varphi), \\ &\qquad\Phi_j(\widehat{x}(t))\,d\mu_j(t) =0,\qquad j=1,\dots, d(\Phi); \\ &(\mathrm{iv}) \ \frac{d\psi}{dt}= -\psi f_x(\widehat{x},\widehat{u})+ \lambda\varphi_x(\widehat{x},\widehat{u})+ m g_x(\widehat{x},\widehat{u})+ \frac{d \mu}{dt}\, \Phi_x(\widehat{x}); \\ &(\mathrm{v}) \ \psi(\widehat t_0)= l_{x_0},\qquad \psi(\widehat t_1)= -l_{x_1}; \\ &(\mathrm{vi}) \ -\psi f_u(\widehat{x},\widehat{u})+\lambda\varphi_u(\widehat{x},\widehat{u})+ mg_u(\widehat{x},\widehat{u})=0; \\ &(\mathrm{vii}) \ \textit{для любых соседних точек }t^s < t^{s+1}\textit{ индекса }\theta \\ &\qquad\qquad\qquad\int_{t^s}^{t^{s+1}} \psi(t)\,f(\widehat{x}(t),\widehat{u}(t))\,dt = 0, \\ &(\mathrm{viii}) \ \textit{для любой пары }(t^s,u^s)\textit{ из индекса }\theta\textit{ найдутся числа } 0\leqslant \rho_j\leqslant 1, \\ &\qquad\ j=1,\dots,d(\Phi),\textit{ такие, что}
\end{split}\end{gathered}
\end{equation}
\notag
$$
$$
\begin{equation} \biggl(\psi(t^s -0)+ \sum_{j=1}^{d(\Phi)} \rho_j \Delta\mu_j(t^s)\Phi'_j(\widehat x(t^s))\biggr) f(\widehat{x}(t^s),u^s) \leqslant 0.
\end{equation}
\tag{5.1}
$$
Условие (vii) получается здесь из первого условия (4.14) с учетом того, что на каждом $\Delta \subset E_+$ отображение $\tau \to t$ взаимно однозначно, $v^\theta(\tau)=1$, и поэтому $dt= d\tau$. Условие (viii) вытекает из (4.19). Отметим, что функция $\psi(t)$ однозначно определяется набором $\xi$ из уравнения (iv) и любого из граничных условий (v). Итак, для данного индекса $\theta$ мы получили набор множителей Лагранжа, которые порождают функцию $\psi(t)$, так что выполнены указанные условия (i)–(viii). Эти множители Лагранжа, вообще говоря, зависят от индекса $\theta$. Условия (i)–(vi) одни и те же для всех индексов, а условия (vii)–(viii) связаны с каждым отдельным индексом. Наша цель теперь – перейти к условиям (vii)–(viii) с набором множителей, не зависящим от индекса $\theta$.
§ 6. Переход к универсальному принципу максимума 1. Предположение о регулярности смешанных ограничений позволило нам установить, что множители $\lambda(t)$, $m(t)$ в теореме 4 суть интегрируемые функции. Более того, покажем теперь, что они ограничены. Поскольку число активных смешанных неравенств $\varphi_i(\widehat{w}(t))\leqslant0$ непостоянно по времени, можно рассмотреть случаи всевозможных конечных подмножеств из $\{1,\dots, d(\varphi)\}$, а тогда без нарушения общности можно ограничиться случаем, когда все неравенства $\varphi_i(\widehat{w}(t))\leqslant0$ активны на некотором измеримом множестве $E \subset [\,\widehat t_0,\widehat t_1]$. Пусть
$$
\begin{equation*}
\begin{gathered} \, S = \biggl\{(\alpha,\beta)\in \mathbb{R}^{d(\varphi)}\times \mathbb{R}^{d(g)}\biggm| \alpha\geqslant 0,\, \sum\alpha_i + \sum |\beta_j|=1\biggr\}, \\ Q_0 = \{w\in \mathcal{Q}\mid \varphi(w)=0,\, g(w)=0\}. \end{gathered}
\end{equation*}
\notag
$$
(Напомним, что $Q$ есть открытое множество в $\mathbb{R}^{n+r}$, на котором определены функции задачи.) По условию в любой точке $w\in Q_0$ векторы $\varphi_{iu}(w)$, $g_{ju}(w)$ позитивно-линейно независимы, следовательно,
$$
\begin{equation*}
\min_S \Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| >0.
\end{equation*}
\notag
$$
Так как функция, стоящая слева, непрерывна, то для любого компакта $M \subset Q_0$ по-прежнему будет
$$
\begin{equation*}
\min_{w\in M} \min_S \Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| := c >0.
\end{equation*}
\notag
$$
Тогда для любого $w\in M$ и любых $\alpha\geqslant0$, $\beta$ справедлива оценка
$$
\begin{equation}
\Bigl|\sum\alpha_i \varphi_{iu}(w) + \sum \beta_j g_{ju}(w)\Bigr| \geqslant c \Bigl(\sum\alpha_i + \sum |\beta_j|\Bigr).
\end{equation}
\tag{6.1}
$$
Вспомним, что для процесса $\widehat{w}$ существует компакт $D\,{\subset}\, Q$ такой, что $\widehat{w}(t) \,{\in}\, D$ почти всюду на $[\,\widehat t_0,\widehat t_1]$, а значит, и на $E$. Положим теперь $M = D\cap Q_0$. Ясно, что $M$ есть компакт, и $\widehat{w}(t) \in M$ почти всюду на $E$. Положим $\alpha= \lambda(t)$, $\beta = m(t)$. Тогда в силу (6.1) для почти всех $t\in E$ справедлива оценка
$$
\begin{equation*}
\sum \lambda_i(t) + \sum |m_j(t)| \leqslant \frac 1c \Bigl|\sum \lambda_i(t) \varphi_{iu}(\widehat{w}(t)) + \sum m_j(t) g_{ju}(\widehat{w}(t))\Bigr|.
\end{equation*}
\notag
$$
Теперь заметим, что в силу условия (vi) справа под модулем стоит ограниченная функция $\psi(t) f_u(\widehat{w}(t))$, поэтому
$$
\begin{equation}
\sum \lambda_i(t) + \sum |m_j(t)| \leqslant \frac 1c |\psi(t) f_u(\widehat{w}(t))|,
\end{equation}
\tag{6.2}
$$
откуда следует, что и все множители $\lambda_i(t)$, $m_j(t)$ суть ограниченные функции, т. е. принадлежат $L_\infty(E)$. 2. Для учета условий, порождаемых различными индексами $\theta$, проделаем следующую процедуру4[x]4Аналогичная процедура использовалась в доказательстве ПМ для задач без смешанных ограничений [7], [25], [27], [28].. Для данного индекса $\theta$ введем множество всех наборов $\xi =(\alpha_0,\alpha,\beta,\lambda(t),m(t),\mu(t))$, удовлетворяющих, вместе с соответствующими функциями $\psi(t)$, условиям (i)–(viii) теоремы 4; обозначим его $\Lambda^\theta$. Как было показано, это множество лежит в пространстве
$$
\begin{equation*}
Y^* = \mathbb{R}^{1+d(F)+d(K)} \times L_\infty^{d(\varphi)}(\Delta) \times L_\infty^{d(g)}(\Delta) \times BV^{d(\Phi)}(\Delta),
\end{equation*}
\notag
$$
сопряженном к пространству
$$
\begin{equation*}
Y = \mathbb{R}^{1+d(F)+d(K)} \times L_1^{d(\varphi)}(\Delta) \times L_1^{d(g)}(\Delta)\times C^{d(\Phi)}(\Delta),
\end{equation*}
\notag
$$
где $\Delta = [\,\widehat t_0,\widehat t_1].\;$ Установим следующий ключевой факт. Лемма 5. Множество $\Lambda^\theta$ есть компакт в слабой-$*$ топологии пространства $Y^*$. Доказательство. Установим сначала ограниченность $\Lambda^\theta$. Из нормировки (ii) следует, что $\alpha_0 +|\alpha|+|\beta|\leqslant 1$ и $\|\lambda\|_1 + \|d\mu\|\leqslant 1$. Как и прежде, умножив равенство (vi) на ограниченную матрицу $D(t)$, получим выражение $m = (\psi f_u - \lambda g_u)D(t)$, подставив которое в уравнение (iv), получим для $\psi$ линейное уравнение вида $d\psi = (A(t)\psi + B(t)\lambda)\,dt + G(t)\, d\mu$, где $A$, $B$, $G$ – измеримые ограниченные матрицы. Отсюда по лемме 6
$$
\begin{equation*}
\|\psi\|_\infty \leqslant \mathrm{const} \bigl(|\psi(\widehat t_0)| + \|\lambda\|_1 + \|d\mu\|\bigr) \leqslant \mathrm{const}
\end{equation*}
\notag
$$
на всем $\Lambda^\theta$, а тогда в силу (6.2) также и $\|\lambda\|_\infty + \|m\|_\infty \leqslant \mathrm{const}$ на всем $\Lambda^\theta$. Таким образом, множество $\Lambda^\theta$ ограничено.
Далее, поскольку все условия, задающие $\Lambda^\theta$, кроме нормировки, линейны по всем компонентам $\xi$, а относительно бесконечномерных компонент $\lambda_i$, $d\mu_j$ нормировка задается линейными функционалами из исходных пространств (соответственно из $L_1$, $C$), т. е. слабо-$*$ непрерывными функционалами, то нетрудно показать, что множество $\Lambda^\theta$ слабо-$*$ замкнуто.
Проверим, например, слабую-$*$ замкнутость множества всех $\xi$, удовлетворяющих сопряженному уравнению (iv), которое запишем в терминах мер:
$$
\begin{equation}
d\psi(t)= (-\psi f_x + \lambda\varphi_x + m g_x)\,dt + \Phi_{x}\, d\mu(t),
\end{equation}
\tag{6.3}
$$
и граничным условиям
$$
\begin{equation}
\psi(\widehat t_0) = (\alpha_0 F_0 + \alpha F +\beta K)'_{x_0}, \qquad \psi(\widehat t_1) = -(\alpha_0 F_0 + \alpha F +\beta K)'_{x_1}.
\end{equation}
\tag{6.4}
$$
Отметим, что функции $f_x$, $\varphi_x$, $g_x$, вычисленные вдоль процесса $\widehat{w}(t)$, измеримы и ограничены, а $\Phi_x$ непрерывна.
Пользуясь опять выражением $m =(\psi f_u-\lambda g_u)D(t)$, получим из (6.3) уравнение
$$
\begin{equation}
d\psi(t)= A(t)\psi(t)\,dt+B(t)\lambda(t)\,dt+ G(t)\,d\mu(t),
\end{equation}
\tag{6.5}
$$
где $A$, $B$, $G$ – некоторые измеримые ограниченные матрицы соответствующих размерностей. (Здесь $\psi$, $\lambda$, $\mu$ представлены как столбцы.)
Пусть наборы $\xi^k\in Y^*$, $k =1,2,\dots$, удовлетворяют условиям (6.3), (6.4) и слабо-$*$ сходятся к некоторому набору $\xi^0 \in Y^*$. Покажем, что и предельный набор $\xi^0$ также удовлетворяет этим условиям. (Так как пространство $Y$ сепарабельно, слабая-$*$ топология на ограниченных множествах в $Y^*$ метризуема, поэтому достаточно рассматривать последовательности.)
Из слабой-$*$ сходимости мер $d\mu^k \to d\mu^0$ в пространстве $C^*$, слабой-$*$ сходимости функций $\lambda^k \to \lambda^0$ в пространстве $L_\infty$ и сходимости конечномерных компонент $(\alpha_0^k,\alpha^k,\beta^k) \to (\alpha_0^0,\alpha^0,\beta^0)$ вытекает, что функции $\psi^k$ равномерно ограничены, $\psi^k(t) \to \psi^0(t)$ почти всюду на $\Delta$, а меры $d\psi^k$ также слабо-$*$ сходятся к $d\psi^0$ (см. лемму 7). По теореме Лебега $\psi^k \to \psi^0$, а тогда и $m^k \to m^0$ слабо-$*$ в пространстве $L_\infty$.
Поскольку (6.3) представляет собой равенство линейных функционалов над пространством $C^n(\Delta)$, то достаточно проверить его на любой функции $\overline x\in C^n(\Delta)$. По условию для любого $k$ имеем
$$
\begin{equation}
\int_\Delta \overline x\,d\psi^k= \int_\Delta \overline x(-\psi^k f_x + \lambda^k\varphi_x + m^k g_x)\,dt + \int_\Delta \overline x\Phi_{x}\, d\mu^k.
\end{equation}
\tag{6.6}
$$
Так как $d\psi^k\to d\psi^0$ и $d\mu^k\to d\mu^0$ слабо-$*$, то левая часть и последний член в правой сходятся к нужным пределам:
$$
\begin{equation}
\int_\Delta \overline x\,d\psi^k \to \int_\Delta \overline x\,d\psi^0, \qquad \int_\Delta \overline x\Phi_x\,d\mu^k \to \int_\Delta \overline x\Phi_x\,d\mu^0,
\end{equation}
\tag{6.7}
$$
а сходимость среднего интеграла в правой части (6.6)
$$
\begin{equation*}
\int_\Delta \overline x(-\psi^k f_x + \lambda^k\varphi_x + m^k g_x)\,dt \to \int_\Delta \overline x(-\psi^0 f_x + \lambda^0\varphi_x + m^0 g_x)\,dt
\end{equation*}
\notag
$$
следует из того, что $\psi^k\to \psi^0$, $\lambda^k\to \lambda^0$ и $m^k\to m^0$ слабо-$*$ в пространстве $L_\infty$ относительно $L_1$.
Таким образом, в пределе получаем
$$
\begin{equation*}
\int_\Delta \overline x\,d\psi^0= \int_\Delta \overline x(-\psi^0 f_x + \lambda^0 \varphi_x + m^0 g_x)\,dt + \int_\Delta \overline x\Phi_{x}\, d\mu^0.
\end{equation*}
\notag
$$
В силу произвольности $\overline x \in C^n(\Delta)$ отсюда следует требуемое равенство
$$
\begin{equation*}
d\psi^0(t)= (-\psi^0 f_x + \lambda^0 \varphi_x + m^0\,g_x)\,dt + \Phi_{x}\, d\mu^0(t),
\end{equation*}
\notag
$$
т. е. уравнение (iv) выдерживает переход к слабому-$*$ пределу.
Слабая-$*$ замкнутость условий (i), (ii), (v), (vi), (vii) и первых двух условий из (iii), задающих множество $\Lambda^\theta$, устанавливается еще проще, мы это опускаем. Третье условие из (iii) для любого $j= 1, \dots, d(\Phi)$ означает, что на любом интервале между соседними точками $t^s< t^{s+1}$, где $\Phi_j(\widehat{x}(t))<0$, мера $d\mu_j =0$. Это эквивалентно тому, что для любой непрерывной функции $\overline x(t)$, носитель которой содержится в этом интервале, $\int \overline x\,d\mu_j =0$. Ясно, что это свойство сохраняется при слабой-$*$ сходимости $d\mu^k_j \to d\mu^0_j$.
Осталось рассмотреть лишь последнее условие (viii). Зафиксируем любое $s$ и рассмотрим пару $(t^s,u^s)$ из индекса $\theta$. Чтобы избежать путаницы с номерами последовательности, обозначим здесь $t^s =t_*$, $\widehat{x}(t^s)= \widehat{x}_*$, $u^s = u_*$.
Для любого набора $\xi \in \Lambda^\theta$ введем функцию $h(t) = \psi(t) f(\widehat{x}_*,u_*)$, т. е. проекцию вектора $\psi(t)$ на фиксированное направление $f(\widehat{x}_*,u_*)$, и будем рассматривать ее на всем отрезке $\Delta = [\,\widehat t_0,\widehat t_1]$. Из уравнения (6.3) следует, что для $h$ выполнено уравнение
$$
\begin{equation*}
d h(t)= (-\psi f_x + \lambda\varphi_x + m\,g_x)f(\widehat{x}_*,u_*)\,dt+ \sum \Phi'_j(\widehat{x}(t))\,f(\widehat{x}_*,u_*)\, d\mu_j(t).
\end{equation*}
\notag
$$
Введем скалярные функции $a_j(t) = \Phi'_j(\widehat{x}(t))\, f(\widehat{x}_*,u_*)$, $j=1,\dots, d(\Phi)$. Все они непрерывны, ибо функции $\Phi'_j(\widehat{x}(t))$ непрерывны, а вектор $f(\widehat{x}_*,u_*)$ постоянен. Введем также функцию $b(t) = (-\psi f_x + \lambda\varphi_x + m\,g_x)f(\widehat{x}_*,u_*)$, она измерима и ограничена. Таким образом,
$$
\begin{equation}
d h(t)= b(t)\,dt+ \sum a_j(t)\, d\mu_j(t).
\end{equation}
\tag{6.8}
$$
Пусть теперь последовательность $\xi^k \in\Lambda^\theta$ слабо-$*$ сходится к $\xi^0 \in Y^*$. Тогда при каждом $k =1,2, \dots$ имеется мера
$$
\begin{equation*}
d h^k(t)= b^k(t)\,dt+ \sum a_j(t)\, d\mu_j^k(t),
\end{equation*}
\notag
$$
где $\|b^k\|_\infty \leqslant \mathrm{const}$ и $\|d\mu_j^k\| \leqslant 1$ в силу нормировки (ii).
Согласно условию (viii) для данной пары $(t_*,u_*)$ при каждом $n$ имеются числа $\rho_{j}^k\in[0,1]$, $j=1,\dots,d(\Phi)$, такие, что
$$
\begin{equation*}
h^k(t_*-0)+ \sum \rho_{j}^k a_j(t_*)\Delta\mu_{j}^k(t_*) \leqslant 0.
\end{equation*}
\notag
$$
Ясно, что $h^k(\widehat t_0) \to h^0(\widehat t_0)$, и по условию $b^k \xrightarrow{\text{слабо-}*} b^0$ (в пространстве $L_\infty(\Delta)$ относительно $L_1(\Delta))$, а также $d\mu^k \xrightarrow{\text{слабо-}*} d\mu^0$ при всех $j$. Таким образом, мы находимся в условиях леммы 11, согласно которой найдутся числа $\rho_{j}^0\in [0,1]$, $j= 1,\dots, d(\Phi)$, такие, что
$$
\begin{equation*}
h^0(t_*-0)+ \sum \rho_{j}^0 a_j(t_*) \Delta\mu_{j}^0(t_*) \leqslant 0.
\end{equation*}
\notag
$$
Последнее неравенство означает, что
$$
\begin{equation*}
\biggl(\psi^0(t_*-0)+ \sum_{j=1}^{d(\Phi)} \rho^0_{j}\, \Delta\mu^0_{j}(t_*)\Phi'_j(\widehat{x}_*)\biggr) f(\widehat{x}_*,u_*) \leqslant 0,
\end{equation*}
\notag
$$
а это и есть условие (viii) для предельного набора $\xi^0 \in \Lambda^\theta$.
Таким образом, множество $\Lambda^\theta$ ограничено и слабо-$*$ замкнуто. А тогда по теореме Алаоглу оно есть слабый-$*$ компакт. Лемма 5 доказана. $\Box$ 3. Итак, перебирая всевозможные индексы $\theta$, мы для каждого из них получаем свой непустой компакт $\Lambda^\theta$. Покажем, что семейство всех этих компактов образует центрированную систему. Для этого введем отношение порядка в множестве всех индексов. Будем говорить, что $\theta_1\subset \theta_2$, если каждая пара $(t^s,u^s)$ из $\theta_1$ входит и в $\theta_2$. Ясно, что для любых двух индексов $\theta_1$ и $\theta_2$ найдется третий, содержащий каждый из них, например их объединение. Нетрудно заметить, что при расширении индекса $\theta$ множество $\Lambda^\theta$ сужается, т. е. включение $\theta_1\subset\theta_2$ влечет обратное включение $\Lambda^{\theta_1}\supset \Lambda^{\theta_2}$. Пусть теперь имеется конечный набор компактов $\Lambda^{\theta_1},\dots, \Lambda^{\theta_m}$. Возьмем любой индекс $\theta$, содержащий в себе все индексы $\theta_1,\dots, \theta_m$. Тогда непустой компакт $\Lambda^\theta$ содержится в каждом из компактов $\Lambda^{\theta_1},\dots,\Lambda^{\theta_m}$, и, следовательно, их пересечение непусто. Поэтому семейство $\{ \Lambda^{\theta}\}$ центрировано, и тогда оно имеет непустое пересечение
$$
\begin{equation*}
\Lambda_*= \bigcap_{\theta}\Lambda^\theta.
\end{equation*}
\notag
$$
Возьмем произвольный набор множителей $\xi=(\alpha_0,\alpha,\beta,\lambda,m,\mu)\in \Lambda_*$, и пусть $\psi$ есть соответствующая ему сопряженная функция. Для этого набора по определению выполнены условия (i)–(vi) теоремы 4. Выполнение условия (vii) в любом индексе $\theta$ означает, что для любого интервала $(t',t'')$
$$
\begin{equation*}
\int_{t'}^{t''}\psi(t) f(\widehat{x}(t),\widehat{u}(t))\,dt = 0
\end{equation*}
\notag
$$
(ибо найдется индекс, содержащий точки $t'$, $t''$), а это эквивалентно выполнению почти всюду на $[\,\widehat t_0,\widehat t_1]$ равенства
$$
\begin{equation}
\psi(t)f(\widehat{x}(t),\widehat{u}(t)) = 0.
\end{equation}
\tag{6.9}
$$
Из условия (viii) для набора $\xi$ следует, что для любого $u \in \mathcal{R}_0(\widehat{x}(t))$ и любой точки $t \in (\widehat t_0,\widehat t_1)$, в которой меры $d\mu_j$ не имеют атомов (т. е. $\Delta\mu_j(t)=0$), выполнено неравенство
$$
\begin{equation}
\psi(t -0) f(\widehat{x}(t),u) \leqslant 0.
\end{equation}
\tag{6.10}
$$
Так как это неравенство выполнено для всех $t$, кроме счетного числа точек, а $\psi$ можно считать непрерывной с одной из сторон, то оно выполнено для всех $t$ из интервала $(\widehat t_0,\widehat t_1)$, а значит, и для его граничных точек (поскольку $\psi$ непрерывна в этих точках). Тогда для всех $t$ выполнено и симметричное неравенство
$$
\begin{equation}
\psi(t +0) f(\widehat{x}(t),u) \leqslant 0.
\end{equation}
\tag{6.11}
$$
Неравенства (6.10) и (6.11) остаются в силе для любого $u \in \mathcal{R}(\widehat{x}(t))$, ибо по лемме 1 любая такая точка есть предел точек из $\mathcal{R}_0(\widehat{x}(t))$, и, значит, выполнено условие (3.6) принципа максимума автономной задачи $\mathrm{B}$. Таким образом, для выбранного набора $\xi$ выполнены все условия ПМ задачи $\mathrm{B}$. Теорема 1 для задачи $\mathrm{B}$ доказана, а значит, она доказана и для исходной задачи $\mathrm{A}$. $\Box$
§ 7. Задача с ограничением типа включения Остановимся вкратце на задаче с ограничением типа включения $u(t) \in U$. Как уже говорилось в замечании 3, просто так добавить его в задачу нельзя. Однако есть следующая возможность. Будем предполагать, что компоненты управления разбиты на две группы: $u= (u_1, u_2)$, где $u_1\in\mathbb{R}^{r_1}$, $u_2\in\mathbb{R}^{r_2}$, и рассматривается задача $\mathrm{A}$ с дополнительным ограничением только на вторую группу: $u_2 \in U$, где множество $U \subset \mathbb{R}^{r_2}$ произвольно. Назовем ее задачей $\mathrm{D}$. (Если компонента $u_2$ отсутствует, мы возвращаемся к задаче $\mathrm{A}$.) Предполагается, что функции $f$, $\varphi$, $g$ и их первые производные по $u_1$ непрерывны по совокупности переменных $(t,x, u_1, u_2)$ на множестве $\mathcal{Q}$, тогда как по $u_2$ дифференцируемости может не быть. В этом смысле будем говорить, что $u_1$ есть гладко входящее управление, а $u_2$ – негладко входящее. Требование регулярности смешанных ограничений надо теперь относить только к гладко входящему управлению, т. е. предполагать, что для любой точки $(t,x,u_1,u_2)\in \mathcal{Q}$, в которой выполнены эти ограничения вместе с $u_2 \in U$, градиенты по $u_1$
$$
\begin{equation*}
\varphi'_{iu_1}(t,x,u_1,u_2),\quad i\in I(t,x,u_1,u_2), \qquad g'_{ju_1}(t,x,u_1,u_2),\quad j=1,\dots, d(g),
\end{equation*}
\notag
$$
позитивно-линейно независимы. (Отметим, что это более жесткое требование, чем прежнее, в котором фигурировали градиенты по всем компонентам управления.) В этом случае по аналогии с теоремой 1 справедлива следующая теорема. Теорема 5. Если процесс $\widehat{w}=(\widehat{x}(t), \widehat{u}_1(t), \widehat{u}_2(t))$, $t\in [\,\widehat t_0, \widehat t_1]$, доставляет сильный минимум в задаче $\mathrm{D}$, то найдутся множители $\alpha_0$, $\alpha$, $\beta$ и функции $\lambda(t)$, $m(t)$, $\mu(t)$, $\psi_x(t)$, $\psi_t(t)$ того же класса, что и прежде, для которых выполнены условия (i)–(vi) теоремы 1, условие (vii) заменяется на
$$
\begin{equation*}
\overline H_{u_1}(\psi_x(t),t,\widehat{x}(t), \widehat{u}(t))=0,
\end{equation*}
\notag
$$
а условие (viii) должно выполняться для всех $u' =(u'_1, u'_2)$ таких, что
$$
\begin{equation*}
\varphi(t,\widehat{x}(t), u'_1, u'_2)\leqslant0,\quad g(t,\widehat{x}(t), u'_1, u'_2) =0, \qquad u'_2 \in U.
\end{equation*}
\notag
$$
Если обозначить через $\widetilde{\mathcal{R}}(t,x(t))$ множество всех $u' =(u'_1, u'_2)$, удовлетворяющих последним трем соотношениям, то в условии максимума (2.9) надо заменить $\mathcal{R}(t,\widehat{x}(t))$ на $\widetilde{\mathcal{R}}(t,\widehat{x}(t))$. Доказательство, как и приведенное выше, сводится к автономному случаю и повторяет прежнее с тем лишь отличием, что теперь индекс $\theta$ состоит из конечного числа троек $(t^s, u_1^s, u_2^s)$, для которых выполнены условия $\varphi(\widehat{x}(t^s),u^s) <0$, $g(\widehat{x}(t^s),u^s) =0$ и дополнительно $u_2^s \in U$, а при построении управляемой системы в $\theta$-задаче надо брать функции $u_1 = \mathcal{U}_1^s(x,u_2^s)$ при фиксированных $u_2^s \in U$. Детали мы оставляем читателю.
§ 8. Пример: геодезические на гладкой поверхности Пусть в евклидовом пространстве $\mathbb{R}^n$ задана поверхность $S\colon c(x)=0$, где $c$ – дважды гладкая функция такая, что во всех точках поверхности $c'(x) \ne 0$. Заданы также две различные точки $x_0$, $x_1$ этой поверхности. Требуется найти кривую кратчайшей длины, лежащую на $S$ и соединяющую данные точки. Поставим эту задачу в виде следующей задачи быстродействия:
$$
\begin{equation*}
\begin{gathered} \, \dot x =u, \qquad |u|\leqslant 1, \qquad x(t_0)= x_0, \qquad x(t_1)= x_1, \\ c(x(t))=0, \qquad J = t_1 -t_0 \to \min. \end{gathered}
\end{equation*}
\notag
$$
Здесь $x$ – фазовая переменная, а ее скорость $u$ – управление. Ясно, что если величина скорости ограничена единицей, то траектория наискорейшего движения и будет иметь наименьшую длину. Существование решения в этой задаче вытекает из классической теоремы Филиппова, так как она линейна по управлению, и множество допустимых управлений есть выпуклый компакт. Как уже говорилось выше, фазовое ограничение равенства $c(x)=0$ недопустимо. Продифференцировав его в силу системы, и учитывая, что начальная точка $s_0$ лежит на $S$, заменим его на равенство $x(t_0)= x_0$ и равенство нулю производной $c'(x)u=0$. Однако при этом равенство $x(t_1)= x_1$ в конечной точке переопределено, ибо в ней мы автоматически получим $c(x(t_1))=0$, так что совокупность всех ограничений равенства будет заведомо вырожденной. Поэтому для совпадения $x(t_1)= x_1$ достаточно требовать его выполнения лишь в касательной гиперплоскости к $S$ в точке $x_1$. Пусть $L(x_1)$ есть эта касательная гиперплоскость, и пусть $\xi_1,\dots, \xi_{n-1}$ есть некоторый базис в ней. Тогда при $t= t_1$ достаточно требовать, чтобы
$$
\begin{equation}
(\xi_i,\, (x(t_1)- x_1)) =0, \qquad i=1,\dots, n-1,
\end{equation}
\tag{8.1}
$$
т. е. $\pi_L (x(t_1)- x_1)) =0$, где $\pi_L\colon \mathbb{R}^n \to L(s_1)$ – ортогональная проекция на $L(x_1)$ вдоль вектора $c'(x_1)$. Нетрудно показать, что в некоторой окрестности точки $x_1$ из этого равенства и $c(x)=0$ следует, что $x(t_1)= x_1$. Итак, вместо исходной “неправильной” постановки задачи мы рассмотрим следующую постановку:
$$
\begin{equation}
\dot x =u, \qquad x(t_0)= x_0, \quad J = t_1 -t_0 \to \min,
\end{equation}
\tag{8.2}
$$
$$
\begin{equation}
(\xi_i,\, (x(t_1)- x_1)) =0, \qquad i=1,\dots, n-1,
\end{equation}
\tag{8.3}
$$
$$
\begin{equation}
c'(x)u=0, \qquad (u,u)-1 \leqslant 0.
\end{equation}
\tag{8.4}
$$
Последние два соотношения будем трактовать как смешанные ограничения, а управление $u$ считать гладко входящим. Таким образом, мы имеем задачу типа $\mathrm{A}$. Отметим, что в любой точке $(x,u)$, где ограничения (8.4) выполнены и $|u|=1$, их градиенты по $u$ линейно независимы. Действительно, эти градиенты есть ненулевые векторы $c'(x)$ и $2u$, которые в силу первого равенства ортогональны. Если же $u=0$, то надо рассматривать лишь градиент первого ограничения $c'(x)$, а он по условию не равен нулю. Таким образом, ограничения (8.4) регулярны, и поэтому для задачи (8.2)–(8.4) применима теорема 1. Пусть $(\widehat{x}(t), \widehat{u}(t))$ есть оптимальная пара. Тогда найдутся число $\alpha_0\geqslant 0$, векторы $\beta\in \mathbb{R}^n$, $\gamma\in \mathbb{R}^{n-1}$, липшицевы функции $\psi_x(t)$, $\psi_t(t)$, измеримые ограниченные функции $\lambda(t)\geqslant 0$, $m(t)$, не все из них равные $0$, из которых составляется функция Понтрягина $H =(\psi_x,\,u)$, расширенная функция Понтрягина
$$
\begin{equation*}
\overline H = (\psi_x,u) - \frac12 \lambda(t)((u,u)-1)- m(t)(c'(x),u)
\end{equation*}
\notag
$$
и концевая функция Лагранжа
$$
\begin{equation*}
l= \alpha_0(t_1 -t_0) +\beta (x(t_0)- x_0) + \sum_{i=1}^{n-1} \gamma_i(\xi_i,\,(x(t_1)- x_1)),
\end{equation*}
\notag
$$
для которых вдоль $(\widehat{x}(t), \widehat{u}(t))$ выполняется следующее: – условие дополняющей нежесткости
$$
\begin{equation}
\lambda(t)\,\bigl((\widehat{u},\widehat{u})-1\bigr) =0;
\end{equation}
\tag{8.5}
$$
– сопряженное уравнение по $x$
$$
\begin{equation}
\dot\psi_x = -\overline H_x = m(t)c''(\widehat{x})\widehat{u}
\end{equation}
\tag{8.6}
$$
(мы здесь пользуемся симметрией матрицы $c''(x)$); – условия трансверсальности
$$
\begin{equation}
\psi_x(t_0) = \beta, \qquad \psi_x(t_1)= - \sum_{i=1}^{n-1} \gamma_i\xi_i;
\end{equation}
\tag{8.7}
$$
– сопряженное уравнение по $t$
$$
\begin{equation}
\psi_t= \mathrm{const} = -\alpha_0;
\end{equation}
\tag{8.8}
$$
– “закон сохранения энергии”
$$
\begin{equation}
(\psi_x,\widehat{u})+ \psi_t= 0,\quad \text{т. е.}\quad \widehat H = (\psi_x,\widehat{u}) \equiv \alpha_0;
\end{equation}
\tag{8.9}
$$
– условие стационарности по $u$
$$
\begin{equation}
\overline H_u= \psi_x- \lambda(t)u- m(t)c'(x)=0.
\end{equation}
\tag{8.10}
$$
Можно написать еще условие максимума $H$, но в силу выпуклости ограничений (8.4) по $u$ оно вытекает из последнего равенства. Далее “шляпку” над $x$, $u$ не пишем и вместо $\psi_x$ пишем просто $\psi$. Умножим (8.10) на $u$: $(\psi,u) - \lambda(t)(u,u) =0$. В силу (8.5) $\lambda(t)(u,u) = \lambda(t)$, и тогда из (8.9) $\lambda(t) \equiv \alpha_0$. Рассмотрим случай $\alpha_0=0$. Тогда $\lambda(t)=0$, и из (8.10) следует, что $\psi(t) = m(t)c'(x)$, т. е. $\psi(t)$ пропорционально $c'(x(t))$. Отсюда $m(t) = (k(t), \psi(t))$ с некоторой вектор-функцией $k(t)$. Тогда (8.6) принимает вид однородного уравнения
$$
\begin{equation*}
\dot\psi= (k, \psi)c''(x)u.
\end{equation*}
\notag
$$
При этом $\psi(t_1) = m(t_1)\,c'(x_1)$, а согласно (8.7) должно быть $\psi(t_1) \in L(x_1)$. Значит, $\psi(t_1)=0$, и тогда $\psi(t) \equiv 0$. Отсюда и из (8.7) следует что $\beta=0$, все $\gamma_i=0$, так что набор множителей тривиален, противоречие. Следовательно, $\alpha_0=1$, тогда $\lambda(t) \equiv 1$, и из дополняющей нежесткости (8.5) получаем, что $|u| \equiv 1$ (движение с максимально возможной скоростью). Итак, имеем
$$
\begin{equation}
\dot\psi = m(t)c''(x)u,
\end{equation}
\tag{8.11}
$$
$$
\begin{equation}
\psi = u + m(t)c'(x).
\end{equation}
\tag{8.12}
$$
Умножим последнее на $c'(x)$:
$$
\begin{equation}
(\psi, c'(x))= m(t)(c'(x),c'(x)).
\end{equation}
\tag{8.13}
$$
Так как $c'(x) \ne 0$, то функция $m(t)$ липшицева. Тогда $u(t) = \psi(t) - m(t)c'(x)$ тоже липшицева, ее можно дифференцировать:
$$
\begin{equation*}
\dot u= \dot\psi- \dot mc'(x)- mc''(x)u= - \dot mc'(x),
\end{equation*}
\notag
$$
т. е. $\ddot x = - \dot mc'(x)$. Из равенства $(c'(x),\dot x)=0$ следует $(c'(x),\ddot x)+ (c''(x)\dot x, \dot x)=0$, откуда с учетом предыдущего $\dot m(c'(x),c'(x)) = (c''(x)\dot x, \dot x)$, поэтому
$$
\begin{equation*}
\dot m = \frac{(c''(x)\dot x, \dot x)}{(c'(x),c'(x))},
\end{equation*}
\notag
$$
и окончательно получаем уравнение геодезических в терминах траектории $x(t)$:
$$
\begin{equation}
\ddot x= -\frac{(c''(x)\dot x, \dot x)}{(c'(x),c'(x))}c'(x).
\end{equation}
\tag{8.14}
$$
(Здесь везде переход от ковектора к вектору происходит просто транспонированием, так как мы находимся в евклидовом пространстве $\mathbb{R}^n$.) В частных случаях, когда поверхность $S$ есть плоскость, сфера или цилиндр, из (8.14) получаем движение по прямой, по большому кругу и по винтовой линии со скоростью $1$.
§ 9. Приложение9.1. Принцип Лагранжа для задач на экстремум с бесконечным числом ограничений Пусть $X$, $Y$ и $Z_i$, $i=1,\dots, \nu$, – банаховы пространства, $\mathcal{D}\subset X$ – открытое множество, $K_i \subset Z_i$, $i=1,\dots, \nu,$ – замкнутые выпуклые конусы с непустой внутренностью. Пусть заданы отображения $F_0\colon \mathcal{D}\to \mathbb{R}$, $g\colon \mathcal{D}\to Y$ и $f_i \colon \mathcal{D}\to Z_i$, $i=1,\dots, \nu$. Рассмотрим следующую задачу на экстремум:
$$
\begin{equation}
F_0(x)\to \min, \qquad f_i(x) \in K_i, \quad i=1,\dots, \nu, \qquad g(x)=0.
\end{equation}
\tag{9.1}
$$
Эта постановка включает большинство теоретических и прикладных задач оптимизации, в том числе задачи оптимального управления с фазовыми и смешанными ограничениями неравенства $\Phi(t,x(t)) \leqslant 0$ и $\varphi(t,x(t),u(t)) \leqslant 0$, которые можно трактовать как принадлежность $\Phi(t,x(t))$ и $\varphi(t,x(t),u(t))$ конусам неположительных функций в пространствах $C$ и $L_\infty$ соответственно (см. [35]); различные варианты задачи (9.1) рассмотрены в [36], [37]. Предположения. 1) Целевая функция $F_0$ и отображения $f_i$ дифференцируемы по Фреше в некоторой точке $x_0 \in \mathcal{D}$; оператор $g$ строго дифференцируем в $x_0$ (предположения гладкости), 2) образ производной $g'(x_0)$ замкнут в $Y$ (ослабленная регулярность ограничения равенства). Несмотря на то, что все отображения здесь дифференцируемы, задача (9.1) не является стандартной гладкой задачей, так как каждое ограничение $f_i(x)\,{\in}\, K_i$ может задаваться бесконечным числом гладких скалярных неравенств (ибо пространства $Z_i$ могут быть бесконечномерными). Теорема 6. Пусть $x_0$ есть точка локального минимума в задаче (9.1). Тогда найдутся множители $\alpha_0\geqslant 0$, $z_i^* \in Z^*_i$, $i=1,\dots,\nu$, и $y^*\in Y^*$, не все равные нулю, такие, что $z_i^* \in K^0_i$ и $\langle z_i^*, f_i(x_0) \rangle =0$, $i=1,\dots,\nu$ (т. е. каждый $z^*_i$ есть внешняя нормаль к конусу $K_i$ в точке $f_i(x_0)$), и при этом функция Лагранжа $\mathcal{L}(x) = \alpha_0 F_0(x) + \sum_{i=1}^\nu \langle z_i^*, f_i(x)\rangle + \langle y^*, g(x)\rangle$ стационарна в $x_0$:
$$
\begin{equation}
\mathcal{L}'(x_0) = \alpha_0 F_0'(x_0)+ \sum_{i=1}^\nu z_i^* f_i'(x_0)+ y^* g'(x_0) = 0.
\end{equation}
\tag{9.2}
$$
Последнее равенство называется уравнением Эйлера–Лагранжа. Теорема 6 есть обобщение классического правила множителей Лагранжа на задачи с бесконечным числом ограничений. Доказательство проводится по схеме Дубовицкого–Милютина с использованием стандартных понятий и фактов функционального анализа, см. [7], [35]–[37]. 9.2. Теорема об отсутствии сингулярных составляющих [15] Пусть в пространстве $\mathbb{R}^{d(w)}$ имеется компакт $D$, на котором заданы непрерывные вектор-функции $p_i\colon D\to \mathbb{R}^r$, $i\in I$, и $q_j\colon D\to \mathbb{R}^r$, $j\in J$, где $I$ и $J$ – конечные множества индексов. Пусть для любой точки $w\in D$ система векторов $p_i(w)$, $i\in I$, $q_j(w)$, $j\in J$, позитивно-линейно независима (ПЛН). Пусть дано измеримое множество $E\subset \mathbb{R}$ конечной положительной меры, и измеримая функция $\widehat{w}(t)\in D$ почти всюду на $E$. Теорема 7. Пусть функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$, из которых все $\lambda_i\geqslant0$, и функция $l\in L_1^r(E)$ таковы, что для любой пробной функции $\overline u(t)\in L_\infty^r(E)$ выполнено равенство
$$
\begin{equation}
\sum_{i\in I} \langle \lambda_i, p_i(\widehat{w}(t))\overline u(t)\rangle+ \sum_{j\in J} \langle m_j, q_j(\widehat{w}(t))\overline u(t)\rangle = \int_{E} l(t)\overline u(t)\,dt.
\end{equation}
\tag{9.3}
$$
Тогда все $\lambda_i$ и $m_j$ суть функции из $L_1^r(E)$, из них все $\lambda_i(t)\geqslant0$ почти всюду на $E$. Доказательство. Как уже отмечалось, для любой точки $w_0\in D$ существует вектор $\overline{v}_0$ такой, что $p_i(w_0)\overline{v}_0> 1$ для всех $i\in I$ и $q_j(w_0)\overline{v}_0 =0$ для всех $j$. По соображениям непрерывности существует окрестность $\mathcal{O}(w_0)$ точки $w_0$ и непрерывная функция $\overline{v}(w)$ такие, что на $\mathcal{O}(w_0)$
$$
\begin{equation}
p_i(w)\overline{v}(w)> 1\quad \forall\, i\in I, \qquad q_j(w)\overline{v}(w) =0\quad \forall\, j\in J,
\end{equation}
\tag{9.4}
$$
и при этом $\overline{v}(w_0)= \overline{v}_0$. (Например, можно взять проекцию вектора $\overline{v}_0$ на общее подпространство нулей векторов $q_j(w)$.) В силу компактности можно выбрать конечное число этих окрестностей $\mathcal{O}(w_s)$, $s=1,\dots,\widetilde s$, которые покрывают весь $D$, и на их объединении построить “кусочно непрерывную” (точнее, ограниченную борелевскую) функцию $\overline{v}(w)$, для которой условия (9.4) выполнены на всем $D$. Тогда при $w= \widehat{w}(t)$ получаем измеримую функцию $\overline{v}(\widehat{w}(t))$, для которой при почти всех $t\in E$
$$
\begin{equation}
p_i(\widehat{w}(t))\overline{v}(\widehat{w}(t))> 1\quad \forall\, i\in I, \qquad q_j(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =0\quad \forall\, j\in J.
\end{equation}
\tag{9.5}
$$
Допустим теперь, что сингулярная составляющая есть у какого-либо функционала $\lambda_i$, для определенности пусть это $\lambda_1$. Таким образом, $\lambda_1 =\lambda_1' +\lambda_1''$, где функционал $\lambda_1'$ – абсолютно непрерывный, а $\lambda_1''$ – сингулярный, сосредоточенный на некоторой последовательности множеств $E_k\subset E$, $\operatorname{mes}E_k\to 0$, $k=1, 2, \dots$, причем $\|\lambda_1''\| = \gamma >0$.
Рассмотрим последовательность функций $\overline u_k(t) = \chi_{E_k}(t)\overline{v}(\widehat{w}(t))$. Для нее в силу (9.5) вторая сумма в (9.3) пропадает, и поэтому
$$
\begin{equation*}
\sum_i \langle \lambda_i, p_i(\widehat{w}(t))\overline u_k(t) \rangle = \int_{E_k} l(t)\overline u(t)\,dt.
\end{equation*}
\notag
$$
Поскольку все $\lambda_i\geqslant 0$ (а тогда все $\lambda_i'\geqslant 0$ и $\lambda_i''\geqslant 0)$, то левая часть последнего равенства не меньше, чем
$$
\begin{equation*}
\langle \lambda_1'', \chi_{E_k}\rangle= \langle \lambda_1'', \mathbf{1}\rangle= \|\lambda_1''\| = \gamma > 0
\end{equation*}
\notag
$$
(где $\mathbf{1}(t)\equiv 1$), тогда как правая часть стремится к нулю в силу абсолютной непрерывности интеграла Лебега. Противоречие. Таким образом, у функционалов $\lambda_i$ сингулярных составляющих быть не может, все они регулярны: $\lambda_i\in L_1^r(E)$, $i\in I$.
Тогда равенство (9.3) приобретает вид
$$
\begin{equation}
\sum_j \langle m_j,q_i(\widehat{w}(t))\overline u(t)\rangle = \int_{E} l'(t)\overline u(t)\,dt,
\end{equation}
\tag{9.6}
$$
где $l'(t)$ – некоторая новая функция из $L^r_1(E)$.
Допустим теперь, что один из функционалов $m_j$, например $m_1$, имеет ненулевую сингулярную составляющую, т. е. $m_1 = m_1' + m_1''$, где функционал $m_1'$ – абсолютно непрерывный, а $m_1''$ – сингулярный, сосредоточенный на множествах $E_k\subset E$, $\operatorname{mes}E_k\to 0$, причем $\|m_1''\|=\gamma >0$. Возьмем опять любую точку $w_0\in D$. Поскольку векторы $q_j(w_0)$, $j\in J$, линейно независимы, то существует вектор $\overline{v}_0$ такой, что $q_1(w_0)\overline{v}_0 =1$ и $q_i(w_0)\overline{v}_0 =0$ для всех $j\ne 1$. Более того, существует окрестность $\mathcal{O}(w_0)$ и непрерывная функция $\overline{v}(w)$ такие, что на $\mathcal{O}(w_0)$
$$
\begin{equation}
q_1(w)\overline{v}(w) =1, \qquad q_j(w)\overline{v}(w) =0\quad \forall\, j\ne 1,
\end{equation}
\tag{9.7}
$$
и при этом $\overline{v}(w_0)= \overline{v}_0$. (Можно взять проекцию вектора $\overline{v}_0$ на общее подпространство нулей векторов $q_j(w)$, $j\ne 1$, и затем нормировать ее.) В силу компактности можно выбрать конечное число этих окрестностей $\mathcal{O}(w_s)$, $s=1,\dots,\widetilde s$, которые покрывают весь $D$, и на их объединении построить ограниченную борелевскую функцию $\overline{v}(w)$, для которой условия (9.7) выполнены на всем $D$. Тогда при $w= \widehat{w}(t)$ получаем измеримую функцию $\overline{v}(\widehat{w}(t))$, для которой при почти всех $t\in E$
$$
\begin{equation}
q_1(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =1, \qquad q_j(\widehat{w}(t))\overline{v}(\widehat{w}(t)) =0\quad \forall\, j\ne 1.
\end{equation}
\tag{9.8}
$$
Пусть $z(t)\in L_\infty (E)$ – такая функция, для которой $\langle m_1'', z\rangle =1$. Тогда для $\overline u(t) = z(t)\,\overline{v}(\widehat{w}(t))$ имеем
$$
\begin{equation*}
q_1(\widehat{w}(t))\overline u(t) = z(t), \qquad q_j(\widehat{w}(t))\overline u(t) =0\quad \forall\, j\ne 1,
\end{equation*}
\notag
$$
а для последовательности $\overline u_k(t) = \chi_{E_k}(t)\overline u(t)$ получим из (9.6)
$$
\begin{equation*}
\langle m_1, q_1(\widehat{w}(t))\overline u_k(t)\rangle = \int_{E_k} l'(t)\overline u(t)\,dt,
\end{equation*}
\notag
$$
т. е.
$$
\begin{equation}
\langle m_1'', q_1(\widehat{w}(t))\overline u_k(t)\rangle= -\langle m_1', q_1(\widehat{w}(t))\overline u_k(t) \rangle + \int_{E_k} l'(t) \overline u(t)\,dt.
\end{equation}
\tag{9.9}
$$
Но поскольку при всех $k$
$$
\begin{equation*}
\langle m_1'', q_1(\widehat{w}(t)\,\overline u_k(t)\rangle= \langle m_1'', q_1(\widehat{w}(t)\,\overline u(t)\rangle = \langle m_1'', z \rangle =1,
\end{equation*}
\notag
$$
то левая часть в (9.9) при всех $k$ равна $1$, а правая стремится к нулю, т. е. опять приходим к противоречию. Таким образом, функционалы $m_j$ также не могут иметь сингулярных составляющих. Теорема 7 доказана 5[x]5Чуть более общий вариант этой теоремы приведен в [7], [35], где вместо вектор-функций $p_i(\widehat{w}(t))$, $q_j(\widehat{w})(t)$ рассматривались произвольные вектор-функции $A_i(t)$, $B_j(t)$, равномерно позитивно-линейно независимые на множестве $E$.. Следующая теорема является обобщением доказанной на случай, когда набор векторов $p_i(w)$, входящих в ПЛН систему, зависит от точки $w$. А именно, пусть на компакте $D$, кроме вектор-функций $p_i$, $q_j$, заданы также непрерывные скалярные функции $\varphi_i(w)\leqslant 0$, $i\in I$, и пусть для любой точки $w\in D$ система векторов $p_i(w)$, $i\in I(w)$, $q_j(w)$, $j\in J$, где $I(w) = \{i\in I \mid \varphi_i(w) =0\}$ есть множество активных индексов для точки $w$, ПЛН. Пусть опять дано измеримое множество $E$ и измеримая функция $\widehat{w}(t)\in D$ почти всюду на $E$. По-прежнему даны функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$, но теперь каждый $\lambda_i\geqslant0$ и сосредоточен на множестве $M_i^\delta = \{ t\mid \varphi_i(\widehat{w}(t))\geqslant -\delta\}$ при любом $\delta>0$. Теорема 8. Пусть функционалы $\lambda_i, m_j \in (L_\infty^*(E))^r$, из которых все $\lambda_i\geqslant0$, и функция $l\in L_1^r(E)$ таковы, что для любой пробной функции $\overline u(t)\in L_\infty^r(E)$ выполнено равенство (9.3). Тогда все $\lambda_i$ и $m_j$ суть функции из $L_1^r(E)$, откуда следует, что все $\lambda_i(t)\geqslant 0$ и $\lambda_i(t)\varphi_i(\widehat{w}(t))=0$ почти всюду на $E$. Доказательство. Возьмем любое множество индексов $\Gamma \subset I$ и определим компакт $D_\Gamma = \{w \in D\mid \varphi_i(w)=0\ \forall\, i\in \Gamma\}$. В частности, $D_{\varnothing}= D$.
Для каждого $\delta>0$ определим также более широкий компакт $D_\Gamma^\delta = \{w \,{\in}\, D\mid \varphi_i(w)\geqslant -\delta\ \forall\, i\in \Gamma\}$. Очевидно, $\bigcap_{\delta>0} D_\Gamma^\delta = D_\Gamma$, и поэтому найдется $\delta>0$, для которого векторы $p_{i}(w)$, $i\in \Gamma$, $q_j(w)$, $j \in J$, ПЛН в любой точке $w\in D_\Gamma^\delta$. В силу конечности множества всех $\Gamma$ существует $\delta>0$, общее для них всех. Уменьшая его, если надо, считаем, что если $D_{\Gamma_1} \cap D_{\Gamma_1} =\varnothing$, то и $D_{\Gamma_1}^\delta \cap D_{\Gamma_1}^\delta =\varnothing$. Совокупность всех этих компактов частично упорядочена по включению: если $\Gamma_1\subset \Gamma_2$, то $D_1^\delta\supset D_2^\delta$, и для любых $\Gamma_1$, $\Gamma_2$ будет $D_{\Gamma_1\cup I_2}^\delta = D_{\Gamma_1}^\delta \cap D_{\Gamma_2}^\delta$.
Имея функцию $\widehat{w}(t)$, для каждого $\Gamma$ определим измеримое множество $M_\Gamma^\delta = \{t\in E\mid \widehat{w}(t) \in D_\Gamma^\delta\}$. Пусть $\mathcal{G}$ есть семейство всех “существенных” множеств $\Gamma$, т. е. тех, для которых $M_\Gamma^\delta$ имеет положительную меру. Ясно, что $\mathcal{G}$ также частично упорядочено по включению. На этом множестве возьмем любой максимальный элемент $\Gamma_1$, т. е. такой, что при любом другом $\Gamma \supset \Gamma_1$ множество $M_\Gamma^\delta$ имеет нулевую меру. Другими словами, на $M_{\Gamma_1}^\delta$ при всех $i\in \Gamma_1$ функции $\varphi_i(\widehat{w}(t)) \geqslant -\delta$, а при “чужих” $i\notin \Gamma_1$ имеем $\varphi_i(\widehat{w}(t)) <-\delta$.
Рассмотрим равенство (9.3) для всех $\overline u(t)$, сосредоточенных на множестве $M_{\Gamma_1}^\delta$. По условию все функционалы $\lambda_i$ сосредоточены на своих $M_i^\delta$, а из максимальности $\Gamma_1$ следует, что при $i\notin \Gamma_1$ все они равны нулю на $M_{\Gamma_1}^\delta$, и поэтому в первой сумме здесь можно оставить только $i\in \Gamma_1$:
$$
\begin{equation*}
\sum_{i\in \Gamma_1} \langle \lambda_i,p_i(\widehat{w}(t))\overline u(t)\rangle+ \sum_{j\in J} \langle m_j,q_j(\widehat{w}(t))\overline u(t) \rangle = \int_{M_{\Gamma_1}^\delta} l(\tau)\overline u(\tau)\,d\tau.
\end{equation*}
\notag
$$
Тогда к набору $\lambda_i$, $i\in \Gamma_1$, $m_j$, $j\in J$, компакту $D_{\Gamma_1}^\delta$ и множеству $M_{\Gamma_1}^\delta$ применима теорема 7, согласно которой все функционалы из этого набора, суженные на $M_\Gamma^\delta$, абсолютно непрерывны. Таким образом, остается рассмотреть равенство (9.3) на множестве $E_1 = E \setminus M_{\Gamma_1}^\delta$.
Для этого множества семейство $\mathcal{G}$ существенных $\Gamma \subset I$ будет меньше, по крайней мере на $\Gamma_1$, и мы опять проделаем ту же процедуру: возьмем любой максимальный элемент $\Gamma_2$, для него все “чужие” функционалы $\lambda_i=0$ на $M_{\Gamma_2}^\delta$, а “свои” $\lambda_i$, $i\in \Gamma_2$, и $m_j$, $j\in J$, суженные на $M_{\Gamma_2}^\delta$, по теореме 7 будут абсолютно непрерывны, так что останется перейти к множеству $E_2 = E_1 \setminus M_{\Gamma_2}^\delta$, и так далее. За конечное число шагов придем к ситуации, когда $\mathcal{G}$ будет состоять из единственного множества $\Gamma_N$. Тогда по теореме 7 получим, что на $M_{\Gamma_N}^\delta$ все $\lambda_i$, $i\in \Gamma_N$, и $m_j$, $j\in J$, абсолютно непрерывны, а на оставшемся множестве $E_N$ все $\lambda_i =0$, и поэтому все $m_j$, $j\in J$, опять по теореме 7, абсолютно непрерывны. Теорема 8 доказана. $\Box$ Применяя эту теорему к равенству (4.3), скалярным функциям $\varphi_i(w)$, вектор-функциям $p_i(w)\,{=}\, \varphi'_{iu}(w)$ и $q_j(w) \,{=}\, g'_{ju}(w)$, множеству $E_+$ задачи $\mathrm{B}^\theta$, компакту $D = \{w \in \widehat D\mid \varphi(w)\leqslant 0,\, g(w)=0\}$, где $\widehat D$ – компакт, содержащий оптимальный процесс, и функции $w^\theta(\tau)\in D$, получаем, что все функционалы $\lambda_i$ и $m_j$ суть функции из $L_1^r(E_+)$. 9.3. Некоторые свойства функций ограниченной вариации Пусть на отрезке $\Delta=[t_0,t_1]$ рассматривается линейное дифференциальное уравнение относительно вектор-функции $\psi \in BV(\Delta)$ (здесь мы считаем ее столбцом):
$$
\begin{equation}
d\psi(t)= A(t)\psi(t)\,dt+B(t)\lambda(t)\,dt+ G(t)\,d\mu(t), \qquad \psi(t_0) = \psi_0,
\end{equation}
\tag{9.10}
$$
где $A$, $B$, $G$ – заданные измеримые матрицы соответствующих размерностей, из них $A$ интегрируема6[x]6Для доказательства ПМ достаточно считать, что матрица $A$ тоже ограничена., $B$, $G$ ограничены, функция $\mu\in BV(\Delta)$ (т. е. мера $d\mu\in C^*(\Delta))$, функция $\lambda\in L_1(\Delta)$, и вектор $\psi_0 \in \mathbb{R}^{d(\psi)}$. Если считать функции $\psi\in BV(\Delta)$ непрерывными слева, т. е. $\psi(t-0)= \psi(t)$ для $t\in (t_0,t_1]$, положить $\psi(t_0-0)= \psi(t_0)$ и считать, что имеется также значение $\psi(t_1+0)$, то мера $d\psi$ и функция $\psi$ связаны следующим образом:
$$
\begin{equation*}
\psi(t) = \int_{t_0-0}^{t-0} d\psi, \quad t\in (t_0,t_1], \quad \text{и} \quad \psi(t_1+0) = \psi(t_1) + \Delta\psi(t_1),
\end{equation*}
\notag
$$
при этом
$$
\begin{equation*}
\|d\psi\|_{C^*}= \int_{t_0-0}^{t_1+0} |d\psi|,\qquad \|\psi\|_{BV} = |\psi(t_0)| + \|d\psi\|_{C^*}.
\end{equation*}
\notag
$$
Отметим, что $\|\psi\|_\infty = \max_{[t_0-0,\, t_1+0]} |\psi(t)| \leqslant \|\psi\|_{BV}$. Если $\psi$ абсолютно непрерывна, то $\|\psi\|_{BV} = \|\psi\|_{AC} = |\psi(t_0)| + \int_{t_0}^{t_1} |\dot\psi(t)|\,dt$. Излагаемые в этом пункте факты хорошо известны, их доказательства приводятся здесь для удобства читателя. Следующая лемма фактически взята нами из книги [30]. Лемма 6. При любом начальном значении $\psi(t_0)=\psi_0$ уравнение (9.10) имеет единственное решение $\psi(t)$, оно непрерывно во всех точках непрерывности меры $d\mu$ и удовлетворяет оценке
$$
\begin{equation}
\|\psi\|_{BV} \leqslant \mathrm{const} \biggl(|\psi_0| + \int_{t_0}^{t_1}|\lambda(t)|\,dt + \int_{t_0-0}^{t_1+0}|d\mu(t)| \biggr).
\end{equation}
\tag{9.11}
$$
Доказательство. Введем функцию ограниченной вариации
$$
\begin{equation}
\rho(t) = \int_{t_0}^{t-0} \bigl(B(\tau)\lambda(\tau)\,d\tau + G(\tau)\,d\mu(\tau)\bigr), \qquad \rho(t_0)=0.
\end{equation}
\tag{9.12}
$$
Ясно, что она непрерывна во всех точках непрерывности меры $d\mu$ и порождает меру $d\rho = B \lambda\,dt + G\,d\mu$. При этом $\|\rho\|_{BV} \leqslant \mathrm{const}(\|\lambda\|_1 + \|d\mu\|_{C^*})$, а уравнение (9.10) имеет теперь вид
$$
\begin{equation}
d\psi(t)= A(t) \psi(t)\,dt+ d\rho(t), \qquad \psi(t_0) = \psi_0.
\end{equation}
\tag{9.13}
$$
Будем искать его решение в виде $\psi = \overline\psi +\rho$. Тогда $d\overline\psi = A(\overline\psi + \rho)\, dt$, значит функция $\overline\psi$ абсолютно непрерывна и подчинена линейному ОДУ
$$
\begin{equation}
\dot{\overline\psi}= A(\overline\psi +\rho), \qquad \overline\psi(t_0) = \psi_0.
\end{equation}
\tag{9.14}
$$
Как известно, оно имеет единственное решение, причем
$$
\begin{equation*}
\|\overline\psi\|_{BV}= \|\overline\psi\|_{AC} \leqslant \mathrm{const}(|\psi_0| + \|\rho\|_\infty) \leqslant \mathrm{const}(|\psi_0| + \|\rho\|_{BV}).
\end{equation*}
\notag
$$
Отсюда для $\psi = \overline\psi +\rho$ получаем требуемую оценку (9.11), что и требовалось доказать. $\Box$ Лемма 7. Пусть при $k\to\infty$ функции $\lambda^k \to \lambda^0$ слабо (в пространстве $L_1(\Delta)$ относительно $L_\infty(\Delta))$, меры $d\mu^k \to d\mu^0$ слабо-$*$ в пространстве $C^*(\Delta)$ и начальные значения $\psi^k_0\to \psi^0_0$. Тогда для соответствующих решений уравнения (9.10) имеется сходимость $\psi^k(t)\to \psi^0(t)$ во всех точках непрерывности предельной меры $d\mu^0$, и, значит, почти всюду на $\Delta$. Кроме того, $\|\psi^k\|_\infty \leqslant\mathrm{const}$, $\|\psi^k -\psi^0\|_1 \to0$, а меры $d\psi^k \to d\psi^0$ слабо-$*$ в $C^*(\Delta)$. Доказательство. Построим функции $\rho^k$ и $\rho^0$, соответствующие тройкам $(\lambda^k, d\mu^k, \psi^k_0)$ и $(\lambda^0, d\mu^0, \psi^0_0)$ по формуле (9.12). Из условия леммы следует, что меры $d\rho^k \to d\rho^0$ слабо-$*$ в $C^*(\Delta)$, а тогда, как известно, $\rho^k(t)\to \rho^0(t)$ во всех точках непрерывности предельной меры $d\rho^0$, и тем более во всех точках непрерывности меры $d\mu^0$. В силу (9.12) $\|\rho^k\|_\infty \leqslant \mathrm{const} (\|\lambda^k\|_1 + \|d\mu^k\|) \leqslant \mathrm{const}$, откуда по теореме Лебега $\|A(t)(\rho^k(t) -\rho^0(t))\|_1 \to 0$, и тогда из (9.14) следует, что соответствующие $\overline\psi^{\,k}$ сходятся к $\overline\psi^{\,0}$ всюду на $\Delta$, поэтому $\psi^k(t)\to \psi^0(t)$ во всех точках непрерывности меры $d\mu^0$. Поскольку $\|\psi^k\|_\infty \leqslant \|\psi^k\|_{BV} \leqslant \mathrm{const}$ в силу (9.11), то $\|\psi^k -\psi^0\|_1 \to0$ и $\|A(t)(\psi^k(t) -\psi^0(t))\|_1 \to 0$, тогда из равенства (9.13) следует, что меры $d\psi^k \to d\psi^0$ слабо-$*$ сходятся в $C^*(\Delta)$. $\Box$ Лемма 8 (о пределе скачков мер). Пусть меры $d\mu^k \geqslant0$ и $d\mu^k \to d\mu^0$ слабо-$*$ на отрезке $\Delta = [t_0, t_1]$. Тогда для любой точки $t_* \in \Delta$
$$
\begin{equation}
\limsup_k \Delta\mu^k(t_*) \leqslant \Delta\mu^0(t_*).
\end{equation}
\tag{9.15}
$$
(В слабом-$*$ пределе мера может концентрироваться в данной точке.) Доказательство. Положим $\Delta\mu^0(t_*) = c\geqslant0$. Рассмотрим сначала случай $t_* \in \operatorname{int}\Delta$. Возьмем любое $\varepsilon>0$ и любые две точки $t'< t_*< t''$ такие, что $\mu^0(t'') -\mu^0(t') < c+\varepsilon$. Тогда и на любом меньшем отрезке $[\tau_1,\tau_2] \subset [t',t'']$ по-прежнему будет $\mu^0(\tau_2) -\mu^0(\tau_1)< c+\varepsilon$. В силу слабой-$*$ сходимости $d\mu^k \to d\mu^0$, на отрезке $[t',t'']$ имеется сходимость почти всюду. Возьмем теперь любые две точки $\tau_1\in (t',t_*)$ и $\tau_2\in (t_*, t'')$, в которых есть сходимость:
$$
\begin{equation*}
\mu^k(\tau_1) \to \mu^0(\tau_1), \qquad \mu^k(\tau_2) \to \mu^0(\tau_2).
\end{equation*}
\notag
$$
Тогда при больших $k$ имеем
$$
\begin{equation*}
\Delta\mu^k(t_*) \leqslant \mu^k(\tau_2) - \mu^k(\tau_1)= \mu^0(\tau_2) - \mu^0(\tau_1) + o(1)< c+\varepsilon + o(1),
\end{equation*}
\notag
$$
откуда $\limsup_k\Delta\mu^k(t_*) \leqslant c+\varepsilon$. В силу произвольности $\varepsilon$ получаем оценку (9.15). В случае $t_* =t_0$ или $t_* =t_1$ требуется лишь небольшая модификация этих рассуждений. Лемма доказана. Лемма 9. Пусть меры $d\mu^k \geqslant0$ и $d\mu^k \to d\mu^0$ слабо-$*$ на отрезке $\Delta = [t_0, t_1]$. Тогда для любого отрезка $D \subset \Delta$
$$
\begin{equation*}
\limsup_k \int_{D} d\mu^k \leqslant \int_{D} d\mu^0.
\end{equation*}
\notag
$$
Доказательство аналогично предыдущему; мы его опускаем. Лемма 10. Пусть даны меры $d\mu^k \geqslant0$, $d\mu^k \xrightarrow{\textrm{слабо-}*} d\mu^0$, $\mu^k(t_0)= \mu^0(t_0)=0$, функции $b^k \in L_1(\Delta)$, $b^k \to b^0 \in L_1(\Delta)$ слабо, и меры
$$
\begin{equation*}
\begin{alignedat}{1} d h^k &= b^k(t)\,dt+ a(t)\,d\mu^k, \\ d h^0 &= b^0(t)\,dt+ a(t)\,d\mu^0, \end{alignedat} \qquad h^k(t_0)\to h^0(t_0),
\end{equation*}
\notag
$$
где функция $a(t)$ непрерывна на $\Delta$. Пусть в некоторой точке $t_*\in \operatorname{int} \Delta$ при всех $k$ выполнены неравенства
$$
\begin{equation}
h^k(t_*-0)+ \rho^k a(t_*)\Delta\mu^k(t_*) \leqslant 0, \qquad \rho^k \in [0,1].
\end{equation}
\tag{9.16}
$$
Тогда найдется $\rho^0 \in [0,1]$ такое, что
$$
\begin{equation}
h^0(t_*-0)+ \rho^0 a(t_*)\Delta\mu^0(t_*) \leqslant 0.
\end{equation}
\tag{9.17}
$$
Доказательство. Рассмотрим случай $a(t_*)\geqslant0$. Полагая все $\rho^k=0$, имеем $h^k(t_*-0)\leqslant 0$. Покажем, что и в пределе будет $h^0(t_*-0) \leqslant 0$.
Из слабой-$*$ сходимости $d\mu^k \to d\mu^0$ вытекает, что нормы $\|d\mu^k\|_{C^*}$ ограничены некоторой константой $M$. Зафиксируем любое $\varepsilon>0$. Из непрерывности $a(t)$ и слабой сходимости $b^k \to b^0$ вытекает, что найдется $\delta>0$ такое, что на интервале $(t_* -\delta,\, t_*)$ имеем $a(t)\geqslant - \varepsilon/M$, и при всех $k$ выполняется оценка
$$
\begin{equation*}
\int_{t_* -\delta}^{t_*} |b^k(t)|\,dt < \varepsilon.
\end{equation*}
\notag
$$
Тогда на этом интервале
$$
\begin{equation*}
h^k(t_*-0)- h^k(t) \geqslant -\int |b^k(t)|\,dt- \frac{\varepsilon}{M} \int d\mu^k \geqslant - 2\varepsilon,
\end{equation*}
\notag
$$
откуда $ h^k(t) \leqslant h^k(t_*-0) +2\varepsilon$. Так как по условию $h^k(t_*-0) \leqslant 0$, то отсюда получаем $h^k(t)\leqslant 2\varepsilon$ на интервале $(t_* -\delta,\, t_*)$. Поскольку $\varepsilon$ и $\delta$ не зависят от номера $k$, а из условий леммы следует, что $h^k(t) \to h^0(t)$ почти всюду, то $h(t)\leqslant 2\varepsilon$ на том же интервале, а значит, и $h(t_*-0)\leqslant 2\varepsilon$. В силу произвольности $\varepsilon>0$ отсюда получаем $h(t_*-0)\leqslant 0$, что и требовалось доказать.
В случае $a(t_*)< 0$, полагая все $\rho^k=1$, получаем $h^k(t_*-0) + a(t_*)\Delta\mu^k(t_*) = h^k(t_*+0)\leqslant0$ при всех $k$. Сделав замену $t \mapsto \tau = t_0+t_1-t$, приходим к рассмотренному случаю $\widetilde a(\tau_*) = -a(\tau_*)>0$ с неравенством $\widetilde h^k(\tau_*-0) \leqslant0$. $\Box$ Следующая лемма есть обобщение доказанной на случай конечного числа мер $d\mu^k$. Пусть даны меры $d\mu^k_j \geqslant0,$ $d\mu^k_j \xrightarrow{\text{слабо-}*} d\mu^0_j$ при $k\to \infty$, $\mu^k_j(t_0)= \mu^0_j(t_0)=0$, $j=1,\dots, N$, функции $b^k \in L_1(\Delta),\;$ $b^k \to b^0 \in L_1(\Delta)$ слабо, и меры
$$
\begin{equation*}
\begin{alignedat}{1} d h^k &= b^k(t)\,dt+ a_1(t)\,d\mu^k_1 + \dots + a_N(t)\, d\mu^k_N, \\ d h^0 &= b^0(t)\,dt+ a_1(t)\,d\mu^0_1 + \dots + a_N(t)\,d\mu^0_N, \end{alignedat} \qquad h^k(t_0)\to h^0(t_0),
\end{equation*}
\notag
$$
где $N$ – натуральное число и функции $a_j(t)\geqslant 0$ непрерывны на $\Delta$. Ясно, что при этом $d h^k \xrightarrow{\text{слабо-}*} d h^0$ и $h^k(t)\to h^0(t)$ почти всюду на $\Delta$. Лемма 11. Пусть в некоторой точке $t_*\in \operatorname{int} \Delta$ при всех $k$ выполнены неравенства
$$
\begin{equation}
h^k(t_*-0)+ \sum_{j=1}^N \rho^k_j a_j(t_*)\Delta\mu^k_j(t_*) \leqslant 0, \qquad \rho^k_j \in [0,1].
\end{equation}
\tag{9.18}
$$
Тогда найдутся числа $\rho^0_j \in [0,1]$ такие, что
$$
\begin{equation}
h^0(t_*-0)+ \sum_{j=1}^N \rho^0_j a(t_*)\Delta\mu^0_j(t_*) \leqslant 0.
\end{equation}
\tag{9.19}
$$
Доказательство. Возьмем любые числа $\gamma_j$, $j=1,\dots, N$, такие, что $\sum \gamma_j\,{=}\,1$. Для каждого $j$ введем меры
$$
\begin{equation*}
d h^k_j = \gamma_j b^k\,dt + a_j\,d \mu^k_j, \quad h^k_j(t_0)= \gamma_j h^k(t_0), \qquad k = 0,1,2,\dots,
\end{equation*}
\notag
$$
и тем самым определим функции $h^k_j(t)$. Положим $\widetilde h^k = \sum_j h^k_j$. Тогда $d\widetilde h^k = d h^k$, $\widetilde h^k(t_0) = h^k(t_0)$, и поэтому $\widetilde h^k = h^k$ всюду на $\Delta$, если считать их непрерывными слева. Для каждого $j=1,\dots, N$ пусть
$$
\begin{equation*}
h^k_j(t_*-0)+ \rho^k_j a_j(t_*)\Delta\mu^k_j(t_*)= c_j.
\end{equation*}
\notag
$$
Суммируя по всем $j$, в силу (9.18) имеем $\sum c_j\leqslant0$. По лемме 10 (примененной к функциям $h^k_j(t) - c_j$ и $\widetilde b^k_j(t) = \gamma_jb^k(t)$ при каждом $j$) найдутся числа $\rho^0_j\in [0,1]$ такие, что
$$
\begin{equation*}
h^0_j(t_*-0)+ \rho^0_j a_j(t_*)\Delta\mu^0_j(t_*) \leqslant c_j.
\end{equation*}
\notag
$$
Суммируя это неравенство по всем $j=1,\dots, N$ и учитывая, что $h^0_j = \gamma_j h^0$, получаем (9.19). $\Box$ Автор выражает благодарность Н. П. Осмоловскому за полезные обсуждения.
|
|
|
Список литературы
|
|
|
1. |
Р. В. Гамкрелидзе, “Оптимальные процессы управления при ограниченных фазовых координатах”, Изв. АН СССР. Сер. матем., 24:3 (1960), 315–356 |
2. |
M. R. Hestenes, Calculus of variations and optimal control theory, John Wiley & Sons, Inc., New York–London–Sydney, 1966, xii+405 pp. |
3. |
R. F. Hartl, S. P. Sethi, R. G. Vickson, “A survey of the maximum principles for optimal control problems with state constraints”, SIAM Rev., 37:2 (1995), 181–218 |
4. |
A. Dmitruk, I. Samylovskiy, “On the relation between two approaches to necessary optimality conditions in problems with state constraints”, J. Optim. Theory Appl., 173:2 (2017), 391–420 |
5. |
А. Я. Дубовицкий, А. А. Милютин, “Задачи на экстремум при наличии ограничений”, Ж. вычисл. матем. и матем. физ., 5:3 (1965), 395–453 ; англ. пер.: A. Ya. Dubovitskii, A. A. Milyutin, “Extremum problems in the presence of restrictions”, U.S.S.R. Comput. Math. Math. Phys., 5:3 (1965), 1–80 |
6. |
А. А. Милютин, “Принцип максимума в регулярной задаче оптимального управления”, Необходимое условие в оптимальном управлении, Гл. 1–5, Наука, М., 1990 |
7. |
А. А. Милютин, А. В. Дмитрук, Н. П. Осмоловский, Принцип максимума в оптимальном управлении, МГУ, мех.-матем. ф-т, М., 2004, 168 с. https://kafedra-opu.ru/node/139 |
8. |
А. А. Милютин, “Общие схемы получения необходимых условий экстремума и задачи оптимального управления”, УМН, 25:5(155) (1970), 110–116 ; англ. пер.: A. A. Milyutin, “General schemes of necessary conditions for extrema and problems of optimal control”, Russian Math. Surveys, 25:5 (1970), 109–115 |
9. |
А. Я. Дубовицкий, А. А. Милютин, “Необходимые условия слабого экстремума в задачах оптимального управления со смешанными ограничениями типа неравенства”, Ж. вычисл. матем. и матем. физ., 8:4 (1968), 725–779 ; англ. пер.: A. Ya. Dubovitskii, A. A. Milyutin, “Necessary conditions for a weak extremum in optimal control problems with mixed constraints of the inequality type”, U.S.S.R. Comput. Math. Math. Phys., 8:4 (1968), 24–98 |
10. |
А. Я. Дубовицкий, А. А. Милютин, Необходимые условия слабого экстремума в общей задаче оптимального управления, Наука, Ин-т хим. физики АН СССР, М., 1971, 113 с. |
11. |
А. Я. Дубовицкий, А. А. Милютин, “Теория принципа максимума”, Методы теории экстремальных задач в экономике, ред. В. Л. Левин, Наука, ЦЭМИ, М., 1981, 6–47 |
12. |
K. Makowski, L. W. Neustadt, “Optimal control problems with mixed control-phase variable equality and inequality constraints”, SIAM J. Control, 12:2 (1974), 184–228 |
13. |
А. М. Тер-Крикоров, “Выпуклое программирование в пространстве, сопряженном пространству Банаха, и выпуклые задачи оптимального управления с фазовыми ограничениями”, Ж. вычисл. матем. и матем. физ., 16:2 (1976), 351–358 ; англ. пер.: A. M. Ter-Krikorov, “Convex programming in a space adjoint to a Banach space and convex optimal control problems with phase constraints”, U.S.S.R. Comput. Math. Math. Phys., 16:2 (1976), 68–75 |
14. |
А. Н. Дюкалов, А. Е. Илютович, “Признак оптимальности в нелинейных задачах оптимального управления со смешанными ограничениями. I”, Автомат. и телемех., 1977, № 3, 96–106 ; II, № 5, 11–20 ; англ. пер.: A. N. Dyukalov, A. Y. Ilyutovich, “Indicator of optimality in nonlinear control problems with mixed constraints. I”, Autom. Remote Control, 38:3 (1977), 381–389; “Features of optimality in nonlinear problems of optimal control with mixed constraints. II”:5, 620–628 |
15. |
А. В. Дмитрук, “Принцип максимума для общей задачи оптимального управления с фазовыми и регулярными смешанными ограничениями”, Оптимальность управляемых динамических систем, 14, Наука, ВНИИСИ, М., 1990, 26–42 ; англ. пер.: A. V. Dmitruk, “Maximum principle for the general optimal control problem with phase and regular mixed constraints”, Comput. Math. and Modeling, 4 (1993), 364–377 |
16. |
Р. В. Гамкрелидзе, “О скользящих оптимальных режимах”, Докл. АН СССР, 143:6 (1962), 1243–1245 ; англ. пер.: R. V. Gamkrelidze, “Optimal sliding states”, Soviet Math. Dokl., 3 (1962), 559–562 |
17. |
E. N. Devdariani, Yu. S. Ledyaev, “Maximum principle for implicit control systems”, Appl. Math. Optim., 40:1 (1999), 79–103 |
18. |
M. d. R. de Pinho, J. F. Rosenblueth, “Necessary conditions for constrained problems under Mangasarian–Fromowitz conditions”, SIAM J. Control Optim., 47:1 (2008), 535–552 |
19. |
F. Clarke, M. R. de Pinho, “Optimal control problems with mixed constraints”, SIAM J. Control Optim., 48:7 (2010), 4500–4524 |
20. |
H. A. Biswas, M. d. R. de Pinho, “A maximum principle for optimal control problems with state and mixed constraints”, ESAIM Control Optim. Calc. Var., 21:4 (2015), 939–957 |
21. |
A. Boccia, M. D. R. de Pinho, R. B. Vinter, “Optimal control problems with mixed and pure state constraints”, SIAM J. Control Optim., 54:6 (2016), 3061–3083 |
22. |
An Li, J. J. Ye, “Necessary optimality conditions for optimal control problems with nonsmooth mixed state and control constraints”, Set-Valued Var. Anal., 24:3 (2016), 449–470 |
23. |
R. Andreani, V. A. de Oliveira, J. T. Pereira, G. N. Silva, “A weak maximum principle for optimal control problems with mixed constraints under a constant rank condition”, IMA J. Math. Control Inform., 37:3 (2020), 1021–1047 |
24. |
Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко, Математическая теория оптимальных процессов, Физматгиз, М., 1961, 391 с. ; 2-е изд., Наука, М., 1969, 384 с. ; англ. пер. 1-го изд.: L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mishchenko, The mathematical theory of optimal processes, Intersci. Publ. John Wiley & Sons, Inc., New York–London, 1962, viii+360 с. |
25. |
А. В. Дмитрук, Н. П. Осмоловский, “О доказательстве принципа максимума Понтрягина с помощью игольчатых вариаций”, Фундамент. и прикл. матем., 19:5 (2014), 49–73 ; англ. пер.: A. V. Dmitruk, N. P. Osmolovskii, “On the proof of Pontryagin's maximum principle by means of needle variations”, J. Math. Sci. (N.Y.), 218:5 (2016), 581–598 |
26. |
Г. Г. Магарил-Ильяев, “Принцип максимума Понтрягина. Ab ovo usque ad mala”, Оптимальное управление, Сборник статей. К 105-летию со дня рождения академика Льва Семеновича Понтрягина, Труды МИАН, 291, МАИК «Наука/Интерпериодика», М., 2015, 215–230 ; англ. пер.: G. G. Magaril-Il'yaev, “The Pontryagin maximum principle. Ab ovo usque ad mala”, Proc. Steklov Inst. Math., 291 (2015), 203–218 |
27. |
А. В. Дмитрук, Н. П. Осмоловский, “Вариации типа $v$-замены времени в задачах с фазовыми ограничениями”, Выпуск посвящен 70-летнему юбилею Александра Георгиевича Ченцова, Тр. ИММ УрО РАН, 24, № 1, 2018, 76–92 ; англ. пер.: A. V. Dmitruk, N. P. Osmolovskii, “Variations of the $v$-change of time in problems with state constraints”, Proc. Steklov Inst. Math. (Suppl.), 305, suppl. 1 (2019), S49–S64 |
28. |
A. V. Dmitruk, N. P. Osmolovskii, “Proof of the maximum principle for a problem with state constraints by the $v$-change of time variable”, Discrete Contin. Dyn. Syst. Ser. B, 24:5 (2019), 2189–2204 |
29. |
А. В. Дмитрук, “Аппроксимационная теорема для нелинейной управляемой системы со скользящими режимами”, Динамические системы и оптимизация, Сборник статей. К 70-летию со дня рождения академика Дмитрия Викторовича Аносова, Труды МИАН, 256, Наука, МАИК «Наука/Интерпериодика», М., 2007, 102–114 ; англ. пер.: A. V. Dmitruk, “Approximation theorem for a nonlinear control system with sliding modes”, Proc. Steklov Inst. Math., 256 (2007), 92–104 |
30. |
А. А. Милютин, Принцип максимума в общей задаче оптимального управления, Физматлит, М., 2001, 303 с. |
31. |
A. V. Dmitruk, “On the development of Pontryagin's maximum principle in the works of A. Ya. Dubovitskii and A. A. Milyutin”, Control Cybernet., 38:4A (2009), 923–957 |
32. |
“Необходимые условия экстремума (принцип Лагранжа)”, Оптимальное управление, Гл. 3, ред. В. М. Тихомиров, Н. П. Осмоловский, МЦНМО, М., 2008, 89–122 |
33. |
A. A. Milyutin, N. P. Osmolovskii, “First order conditions”, Calculus of variations and optimal control, Transl. from the Russian manuscript, Transl. Math. Monogr., 180, Amer. Math. Soc., Providence, RI, 1998 |
34. |
А. В. Дмитрук, А. М. Каганович, “Принцип максимума для задач оптимального управления с промежуточными ограничениями”, Нелинейная динамика и управление, 6, Физматлит, М., 2008, 101–136 ; англ. пер.: A. V. Dmitruk, A. M. Kaganovich, “Maximum principle for optimal control problems with intermediate constraints”, Comput. Math. Model., 22:2 (2011), 180–215 |
35. |
A. V. Dmitruk, N. P. Osmolovskii, “Necessary conditions for a weak minimum in optimal control problems with integral equations subject to state and mixed constraints”, SIAM J. Control Optim., 52:6 (2014), 3437–3462 |
36. |
A. Dmitruk, N. Osmolovskii, “A general Lagrange multipliers theorem”, 2017 Constructive nonsmooth analysis and related topics (dedicated to the memory of V. F. Demyanov), CNSA-2017 (St. Petersburg, 2017), IEEE, 2017, 82–84 |
37. |
A. V. Dmitruk, N. P. Osmolovskii, “A general Lagrange multipliers theorem and related questions”, Control systems and mathematical methods in economics, Lecture Notes in Econom. and Math. Systems, 687, Springer, Cham, 2018, 165–194 |
Образец цитирования:
А. В. Дмитрук, “Вариации $v$-замены времени в задаче оптимального управления с фазовыми и смешанными ограничениями”, Изв. РАН. Сер. матем., 87:4 (2023), 91–132; Izv. Math., 87:4 (2023), 726–767
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/im9305https://doi.org/10.4213/im9305 https://www.mathnet.ru/rus/im/v87/i4/p91
|
Статистика просмотров: |
Страница аннотации: | 436 | PDF русской версии: | 25 | PDF английской версии: | 72 | HTML русской версии: | 147 | HTML английской версии: | 144 | Список литературы: | 84 | Первая страница: | 8 |
|