Математический сборник
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Скоро в журнале
Архив
Импакт-фактор
Правила для авторов
Лицензионный договор
Загрузить рукопись
Историческая справка

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. сб.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математический сборник, 2023, том 214, номер 9, страницы 161–174
DOI: https://doi.org/10.4213/sm9851
(Mi sm9851)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением

К. А. Щелчков

Удмуртский государственный университет, г. Ижевск
Список литературы:
Аннотация: Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Управление осуществляется посредством кусочно постоянного управления, множество значений которого является конечным. Целью управления является движение сколь угодно близко к конечной траектории, описываемой вспомогательной системой управления простого вида, при любых действиях помехи. В обеих задачах получены фазовые ограничения на вспомогательную систему, в рамках которых управление вспомогательной системы может быть любым. Для любой окрестности и произвольного управления вспомогательной системы, которое удовлетворяет полученным ограничениям, в исходных задачах существуют допустимые управления, обеспечивающие в каждый момент времени нахождение фазовой точки исходной системы в указанной окрестности соответствующей фазовой точки вспомогательной системы. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.
Библиография: 29 названий.
Ключевые слова: дифференциальная игра, нелинейная система, преследователь, убегающий.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 075-01483-23-00, проект FEWS-2020-0010
Работа выполнена при поддержке Министерства науки и высшего образования РФ в рамках государственного задания № 075-01483-23-00, проект FEWS-2020-0010.
Поступила в редакцию: 23.10.2022 и 10.05.2023
Англоязычная версия:
Sbornik: Mathematics, 2023, Volume 214, Issue 9, Pages 1337–1350
DOI: https://doi.org/10.4213/sm9851e
Реферативные базы данных:
Тип публикации: Статья
MSC: Primary 49N70; Secondary 49N75

§ 1. Введение

Дифференциальные игры двух лиц, рассмотренные первоначально Р. Айзексом в [1], в настоящее время представляют широкое поле для исследований (см. [2]–[7]). Были разработаны методы решения различных классов игровых задач: метод Айзекса, основанный на анализе определенного уравнения в частных производных и его характеристик, метод экстремального прицеливания Красовского, метод Понтрягина и другие. Н. Н. Красовским и представителями его научной школы создана теория позиционных игр, в основе которой лежат понятие максимального стабильного моста и правило экстремального прицеливания. Однако эффективное построение таких мостов для исследования реальных конфликтно управляемых процессов (в первую очередь нелинейных дифференциальных игр) весьма затруднительно, а иногда даже невозможно. Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления для отдельных классов игр, обладающих дополнительными свойствами. Построение приближения стабильных мостов в нелинейных дифференциальных играх, в том числе численно, рассматривается, в частности, в работах [8], [9].

Достаточные условия разрешимости задачи преследования в нелинейном примере Л. С. Понтрягина получены в [10]. В работе [11] представлены достаточные условия разрешимости задачи преследования в нелинейной дифференциальной игре при некоторых дополнительных условиях на множество значений правой части системы дифференциальных уравнений и терминальное множество. В работе [12] получены достаточные условия поимки в нелинейной игре, описываемой стационарной нелинейной системой, исследуется оптимальность времени поимки для некоторого случая на плоскости. Задача, рассматриваемая в работе [12], сравнима с представленной. Условия поимки в [12] оказываются значительно сильнее условий, полученных в настоящей работе. При этом в [12] преследователь использует контрстратегию. В работе [13] с использованием формализации дифференциальной игры рассматривается нелинейная задача управления с помехой. Получены достаточные условия существования выигрышной стратегии. В работе [14] рассматривается нелинейная дифференциальная игра двух лиц с интегральным критерием качества. Игроки используют кусочно программные управления специального вида, причем временной интервал делится на две части. Получены необходимые и достаточные условия существования седловой точки для рассматриваемой игры. В работе [15] рассматривается дифференциальная игра преследования на плоскости, динамика которой описывается нелинейной системой дифференциальных уравнений определенного вида. Целевым множеством является начало координат. Получены условия осуществления поимки посредством позиционной контрстратегии и характеристики игры в явном виде, приведены примеры.

В работе [16] было введено понятие положительного базиса, которое в работах [16]–[18] эффективно использовалось для исследования свойства управляемости нелинейных систем, описываемых дифференциальными уравнениями в конечномерном евклидовом пространстве. В работах [19]–[21] свойства положительного базиса использовались для исследования управляемых систем на многообразиях. В работах [22]–[26] свойства положительного базиса были использованы для исследования задачи преследования группой преследователей одного или нескольких убегающих в линейных дифференциальных играх с равными возможностями игроков. В этих работах концепция положительного базиса используется для описания начальных положений игроков.

В работах [27] и [29] рассматривалась задача поимки в нелинейной дифференциальной игре, аналогичной дифференциальной игре настоящей работы. В них получены достаточные условия на параметры игры для существования окрестности нуля, из которой происходит поимка. Ключевым было условие, что некоторый набор векторов образует положительный базис. В работе [28] получены дополнительные свойства выигрышной стратегии для задачи.

Настоящая работа является продолжением исследований [27]–[29]. Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Получены условия, при которых возможно удерживать траекторию исходной системы вблизи траектории некоторой системы простого вида при любых действиях помехи.

§ 2. Система с производной первого порядка

В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений

$$ \begin{equation*} \dot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \end{equation*} \notag $$
где $x \in \mathbb R^k$ – фазовый вектор, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f$: $\mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по $x$. Функция $g\colon \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных. То есть существуют положительные числа $L_1$, $L_2$ такие, что
$$ \begin{equation*} \begin{gathered} \, \|f(x_1, u_i) - f(x_2, u_i)\| \leqslant L_1\|x_1 - x_2\|, \qquad x_1, x_2 \in \mathbb R^k, \quad i=1, \dots, m, \\ \|g(x_1, v_1) - g(x_2, v_2)\| \leqslant L_2\bigl(\|x_1 - x_2\| + \|v_1 - v_2\|\bigr), \qquad x_1, x_2 \in \mathbb R^k, \quad v_1, v_2 \in V. \end{gathered} \end{equation*} \notag $$
Здесь и всюду далее норма считается евклидовой.

Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\eta},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\eta}=T$.

Определение 1. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \eta - 1$, ставящих в соответствие величинам $(\tau_r, x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$.

Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$.

Определение 2. В игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка, если существует ${T>0}$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления убегающего $v(\cdot)$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Целью преследователя является осуществление $\varepsilon$-поимки. Цель убегающего – воспрепятствовать этому.

Определение 3 (см. [16]). Совокупность векторов $a_1, \dots, a_n \in \mathbb R^k$ называется положительным базисом, если для любой точки $\xi \in \mathbb R^k$ существуют числа $\mu_1, \dots, \mu_n \geqslant 0$ такие, что $\xi=\sum_{i=1}^{n}{\mu_i a_i}$.

Введем следующие обозначения: $\operatorname{Int} A$ – внутренность множества $A$; $\operatorname{co} A$ – выпуклая оболочка множества $A$; $O_{\varepsilon}(x)$ – открытый шар радиуса $\varepsilon$ с центром в точке $x$; $D_{\varepsilon}(x)$ – замкнутый шар радиуса $\varepsilon$ с центром в точке $x$.

Справедлива следующая теорема о поимке.

Теорема 1 (см. [27]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существует $\varepsilon_0 \,{>}\, 0$ такое, что для любой точки $x_0 \in O_{\varepsilon_0}(0)$ в игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка.

В [28] доказано, что для любого $x_0 \in O_{\varepsilon_0}(0)$ ($\varepsilon_0$ – значение из теоремы 1) $\varepsilon$-поимка происходит за время ${\|x_0\|}/{\alpha(\|x_0\|)}$, где

$$ \begin{equation*} \alpha(r)=\min_{x \in D_{r}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, u_i) + g(x, v), p\bigr\rangle. \end{equation*} \notag $$
При этом для построения стратегии преследователя $P$ достаточно использовать разбиение с фиксированным шагом.

Введем вспомогательную управляемую систему

$$ \begin{equation} \dot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0, \end{equation} \tag{2.1} $$
где $w, y \in \mathbb R^k$. Допустимым управлением системы (2.1) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$.

Пусть $\varepsilon_0$ – значение из теоремы 1. Справедлива следующая теорема.

Теорема 2. Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис,

$$ \begin{equation*} -g(0, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\}\bigr), \end{equation*} \notag $$
заданы $R \in (0, \varepsilon_0)$, $x_0 \in O_{R}(0)$, $T > 0$, $\rho \in (0, \alpha(R)]$, а $w(\cdot)$ – произвольное допустимое управление системы (2.1), для которого $\|y(t)\| < R$ для всех $t \in [0, T]$. Тогда для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v$ убегающего $E$ справедливо неравенство $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$.

Доказательство. Согласно доказательству теоремы 1 для всех $x \in D_{R}(0)$ справедливо вложение
$$ \begin{equation*} -g(x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, u_1), \dots, f(x, u_m)\}\bigr). \end{equation*} \notag $$
Пусть $b_0, b_1 \in O_{R}(0)$ и выполнено включение $b_0 \in D_{\widehat r}(b_1) \subset D_{R}(0)$ для некоторого $\widehat r > 0$. Тогда при переносе начала координат в точку $b_1$ выполняется теорема 1, т.е. за конечное время из точки $b_0$ исходную систему можно привести сколь угодно близко к точке $b_1$ при любых допустимых действиях убегающего. При этом, согласно [28], конечное время можно взять равным $\|b_1 - b_0\| / \alpha(R)$ и шаг разбиения фиксированным. Отметим, что в таком случае если $\|x(\tau_j) - b_1\| \leqslant \varepsilon$, где $\varepsilon$ является радиусом целевой окрестности, то для всех $t \in (\tau_j, \tau_\eta]$ справедливо неравенство $\|x(t) - b_1\| < \varepsilon$.

Зафиксируем $\delta > 0$. Так как функция $y(t)$, $t \in [0, T]$, является непрерывной и $\|y(t)\| < R$ для всех $t \in [0, T]$, то справедливо следующее неравенство:

$$ \begin{equation} \max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{R}(0), \, t \in [0, T]\} \doteq \delta_1 > 0. \end{equation} \tag{2.2} $$
Пусть $q$ – произвольное натурально число такое, что
$$ \begin{equation*} \frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1\}}{4}. \end{equation*} \notag $$
Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.

На интервале $[t_0, t_1)$ считаем точку $\xi_1=y(t_1)$ целевой. Тогда существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_1) \in \xi_1 + D_{\widehat\varepsilon}(0)=y(t_1) + D_{\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_2$ ближайшую точку к $x(t_1)$ на множестве $y(t_2) + D_{\widehat\varepsilon}(0)$. Следовательно, $\|x(t_1) - \xi_2\| \leqslant \Delta\rho$. На интервале $[t_1, t_2)$ считаем точку $\xi_2$ целевой. Существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_2) \in \xi_2 + D_{\widehat\varepsilon}(0) \subset y(t_2) + D_{2\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_3$ ближайшую точку к $x(t_2)$ на множестве $y(t_2) + D_{2\widehat\varepsilon}(0)$. Аналогично, $\|x(t_2) - \xi_3\| \leqslant \Delta\rho$, $\xi_3$ – целевая точка, и мы приводим систему в $\xi_3 + D_{\widehat\varepsilon}(0) \subset y(t_3) + D_{3\widehat\varepsilon}(0)$. И так далее.

На последнем шаге получаем $x(T)=x(t_q) \in y(t_q) + D_{q\widehat\varepsilon}(0)=y(T) + D_{\widehat\delta}(0)$. Так как для всех $l=0, \dots, q-1$ справедливы включения $x(t_l) \in y(t_l) + D_{\widehat\delta}(0)$, $x(t_{l+1}) \in y(t_{l+1}) + D_{\widehat\delta}(0)$ и $\|y(t_{l+1}) - y(t_l)\| \leqslant \widehat\delta$, то в силу [27] $x(t) \in y(t_{l+1}) + D_{3\widehat\delta}(0)$. Таким образом, в силу (2.2) для каждого $l=0, \dots, q-1$ справедливы следующие неравенства:

$$ \begin{equation*} \begin{gathered} \, \|x(t) - y(t)\| \leqslant 4\widehat\delta \leqslant \delta \quad \text{для всех }\ t \in [t_l, t_{l+1}], \\ \|x(t) - y(t)\| \leqslant \delta_1 \quad \text{для всех }\ t \in [t_l, t_{l+1}]. \end{gathered} \end{equation*} \notag $$

Теорема 2 доказана.

§ 3. Система с производной второго порядка

В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0, \dot x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений

$$ \begin{equation} \ddot x=f(x, \dot x, u) + g(x, \dot x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)=\dot x_0, \end{equation} \tag{3.1} $$
где $x \in \mathbb R^k$ – фазовая переменная, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f\colon \mathbb R^k \times \mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по совокупности переменных $x$ и $\dot x$, функция $g\colon \mathbb R^k \times \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных, т.е. существуют положительные числа $L_1$, $L_2$ такие, что
$$ \begin{equation*} \begin{gathered} \, \|f(x_1, \dot x_1, u_i) - f(x_2, \dot x_2, u_i)\| \leqslant L_1(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad i=1, \dots, m, \\ \|g(x_1, \dot x_1, v_1) - g(x_2, \dot x_2, v_2)\| \leqslant L_2(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\| + \|v_1 - v_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad v_1, v_2 \in V. \end{gathered} \end{equation*} \notag $$

Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\gamma},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\gamma}=T.$

Определение 4. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \gamma - 1,$ ставящих в соответствие величинам $(\tau_r, x(\tau_r), \dot x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$.

Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$.

Определение 5. В игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Целью преследователя является осуществление $\varepsilon$-поимки, цель убегающего – воспрепятствовать этому.

В [29] доказана теорема о поимке в данной задаче для системы вида

$$ \begin{equation*} \ddot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)= \dot x_0. \end{equation*} \notag $$

Теорема 3 (см. [29]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0$, $\dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$.

Подход, используемый при доказательстве данной теоремы, будет применен и для получения условий разрешимости задачи преследования с динамикой (3.1). Кроме того, по аналогии с [28] преследователю достаточно выбирать стратегии с фиксированным шагом разбиения временного интервала. Справедлива следующая теорема.

Теорема 4. Пусть $f(0, 0, u_1),\dots,f(0, 0, u_m)$ образуют положительный базис и $-g(0, 0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0, \dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$. Кроме того, преследователю для построения стратегии достаточно использовать разбиение временного интервала с фиксированным шагом.

Доказательство. Схема доказательства и общие рассуждения аналогичны доказательству теоремы 3.

$1^0$. Покажем, что существуют $\overline\alpha > 0$, $\varepsilon_0 > 0$ такие, что для любых точек $x, \dot x \in D_{\varepsilon_0}(0)$ и вектора $p \in \mathbb R^k$, $\|p\|=1$, найдется $i \in \{1, \dots, m\}$ такое, что для любого $v \in V$ выполнено

$$ \begin{equation*} \bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle \geqslant \overline\alpha. \end{equation*} \notag $$
Данное неравенство справедливо в силу липшицевости функций $f, g$ в указанном смысле и свойств положительного базиса (см. [16]). То есть для некоторого $\varepsilon_0 > 0$ и для любых $x, \dot x \in D_{\varepsilon_0}(0)$ справедливо вложение
$$ \begin{equation*} -g(x, \dot x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, \dot x, u_1), \dots, f(x, \dot x, u_m)\}\bigr). \end{equation*} \notag $$
Следовательно, в силу свойств положительного базиса (см. [16]) векторы
$$ \begin{equation*} \bigl\{f(x, \dot x, u_1) + g(x, \dot x, v), \dots, f(x, \dot x, u_m) + g(x, \dot x, v)\bigr\} \end{equation*} \notag $$
образуют положительный базис для любого $v \in V$. Таким образом, существуют $\widehat x, \widetilde x \in D_{\varepsilon_0}(0)$, $\widehat p \in \mathbb R^k$, $\|\widehat p\|=1$, $\widehat v \in V$, $\widehat i \in \{1, \dots, m\}$ такие, что
$$ \begin{equation*} \min_{x, \dot x \in D_{\varepsilon_0}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle = \bigl\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\bigr\rangle. \end{equation*} \notag $$
Отсюда получаем $\overline\alpha=\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\rangle > 0$.

$2^0$. Введем ряд обозначений. Так как функции $f$, $g$ являются липшицевыми, то достигается следующий максимум:

$$ \begin{equation*} \max_{x, \dot x \in D_{2\varepsilon_0}(0), u \in U, v \in V}{\|f(x, \dot x, u) + g(x, \dot x, v)\|}=\overline D. \end{equation*} \notag $$
Обозначим
$$ \begin{equation*} D=\max\bigl\{\overline D, 2\varepsilon_0 \bigr\}. \end{equation*} \notag $$
Определим число $h$ так:
$$ \begin{equation*} h=\min\biggl\{\frac{\overline\alpha}{4(L_1 + L_2)}, \varepsilon_0\biggr\}. \end{equation*} \notag $$
Пусть $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|= 1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ и
$$ \begin{equation*} \max_{u \in U}\bigl\langle f(\overline x, \dot{\overline x}, u), p\bigr\rangle = \bigl\langle f(\overline x, \dot{\overline x}, \overline u), p\bigr\rangle. \end{equation*} \notag $$
Отметим, что, в силу п. $1^0$ для любого $v \in V$
$$ \begin{equation*} \bigl\langle f(\overline x, \dot{\overline x}, \overline u) + g(\overline x, \dot{\overline x}, v), p\bigr\rangle \geqslant \overline\alpha. \end{equation*} \notag $$
Аналогично доказательству теоремы 3 получаем следующую оценку:
$$ \begin{equation*} \begin{aligned} \, \bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle &\geqslant \overline\alpha - L_1(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) - L_2(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) \\ &\geqslant \overline\alpha - 2h(L_1 + L_2). \end{aligned} \end{equation*} \notag $$
Отсюда следует, что для любых $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|=1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ справедливо неравенство
$$ \begin{equation*} \bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle \geqslant \frac{\overline\alpha}{2}=\alpha. \end{equation*} \notag $$

$3^0$. В данном пункте определим размер шага разбиения временного отрезка.

Зафиксируем $0 < \delta \leqslant \varepsilon_0$. Выберем шаг разбиения

$$ \begin{equation*} \Delta=\min\biggl\{\frac{\alpha\delta}{D^2}, \frac{h}{D}\biggr\}. \end{equation*} \notag $$
Отметим, что в силу п. $2^0$, если $x(0), \dot x(0) \in D_{\varepsilon_0}(0)$, $t \in [0, \Delta]$, то для любых допустимых управлений игроков справедливы следующие неравенства:
$$ \begin{equation*} \begin{gathered} \, \|x(t) - x(0)\| \leqslant h, \qquad \|\dot x(t) - \dot x(0)\| \leqslant h, \\ \|f(x(t), \dot x(t), u(t))+ g(x(t), \dot x(t), v(t))\| \leqslant D, \qquad \|\dot x(t)\| \leqslant D. \end{gathered} \end{equation*} \notag $$

$4^0$. Произведем оценку приближения к нулю функции скорости $\dot x(\cdot)$ за один шаг разбиения.

Без ограничения общности можно рассмотреть только интервал $[0, \Delta)$. Значение управления преследователя будем выбирать следующим образом. Если $\dot x(0)=0$, то $\overline u_0 \in U$ произвольное. Если $\dot x(0) \neq 0$, то обозначим $p=-\dot x(0) / \|\dot x(0)\|$ и $\overline u_0 \in U$ выбираем из следующего равенства:

$$ \begin{equation*} \max_{u \in U}\bigl\langle f(x(0), \dot x(0), u), p\bigr\rangle = \bigl\langle f(x(0), \dot x(0), \overline u_0), p\bigr\rangle. \end{equation*} \notag $$
Таким образом, в силу пп. $2^0$ и $3^0$ для любых $t \in [0, \Delta)$, $v \in V$ справедливо следующее неравенство:
$$ \begin{equation*} \bigl\langle f(x(t), \dot x(t), \overline u_0) + g(x(t), \dot x(t), v), p\bigr\rangle \geqslant \alpha. \end{equation*} \notag $$

Пусть $t \in [0, \Delta)$. Оценим квадрат нормы скорости:

$$ \begin{equation*} \begin{aligned} \, \|\dot x(t)\|^2 &= \biggl\| \dot x(0) + \int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &= \|\dot x(0)\|^2 + \biggl \|\int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &\qquad+ 2\int_{0}^{t}\bigl\langle f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s)), \dot x(0) \bigr\rangle \, ds \\ &\leqslant \|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|. \end{aligned} \end{equation*} \notag $$
Оценим последний трехчлен $A=\|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|$.

Если $\|\dot x(0)\| \geqslant \delta$, то

$$ \begin{equation*} \begin{aligned} \, \Delta \leqslant \frac{\alpha\delta}{D^2} &\quad\Longrightarrow\quad D^2t^2 - t\alpha\|\dot x(0)\| \leqslant t(D^2\Delta - \alpha\delta) \leqslant 0 \\ & \quad\Longrightarrow\quad A \leqslant \|\dot x(0)\|^2 - t\alpha\|\dot x(0)\| \leqslant \biggl( \|\dot x(0)\| - \frac{t\alpha}{2} \biggr)^2. \end{aligned} \end{equation*} \notag $$

Если $\|\dot x(0)\| \leqslant \delta$, то трехчлен $A$ достигает своего максимума при $\|\dot x(0)\|=0$ или при $\|\dot x(0)\|=\delta$. Отметим, что в силу п. $2^0$ $D \geqslant 2\alpha$. Тогда если $\|\dot x(0)\|=0$, то

$$ \begin{equation*} A=D^2t^2 \leqslant D^2\Delta^2 \leqslant \frac{\alpha^2\delta^2}{D^2} \leqslant \frac{\delta^2}{4}. \end{equation*} \notag $$
Если $\|\dot x(0)\|=\delta$, то
$$ \begin{equation*} A=\delta^2 + D^2t^2 - 2t\alpha\delta \leqslant \delta^2 + t(D^2\Delta - 2\alpha\delta) \leqslant \delta^2. \end{equation*} \notag $$

Таким образом, если $\|\dot x(0)\| \geqslant \delta$, то $\|\dot x(\Delta)\| \leqslant \|\dot x(0)\| -{\Delta\alpha}/{2}$.

Если $\|\dot x(0)\| < \delta$, то $\|\dot x(t)\| \leqslant \delta$ для всех $t \in [0, \Delta]$.

$5^0$. В данном пункте построим стратегию для приведения функции $\dot x(\cdot)$ в $D_{\delta}(0)$ и оценим время.

На каждом интервале $[\tau_i, \tau_{i+1})$, $i=0, \dots, \eta - 1$, будем выбирать управление преследователя в соответствии с п. $4^0$, где вместо векторов $x(0)$, $\dot x(0)$ используем $x(\tau_i)$, $\dot x(\tau_i)$ соответственно. Выберем такое неотрицательное целое $\eta$, что

$$ \begin{equation*} \frac{\Delta\alpha\eta}{2} < \|\dot x(0)\| \leqslant \frac{\Delta\alpha(\eta+1)}{2}, \end{equation*} \notag $$
т.е.
$$ \begin{equation*} \eta=\biggl[\frac{2\|\dot x(0)\|}{\Delta\alpha}\biggr]. \end{equation*} \notag $$
Следовательно, в силу оценок из п. $4^0$ $\|\dot x(\tau_\eta)\| \leqslant \delta$. Действительно, если $\|\dot x(\tau_\eta)\| > \delta$, то в силу оценок из п. $4^0$ для каждого $i=0, \dots, \eta - 1$ справедливо неравенство $\|\dot x(\tau_i)\| > \delta$. При этом $D\Delta \leqslant \delta/2$. Следовательно, $\|\dot x(\tau_{\eta+1})\| > \delta/2$ и $\|\dot x(\tau_{\eta+1})\| \leqslant \|\dot x(0)\| - \Delta\alpha(\eta+1)/2$, т.е. получаем противоречие.

Оценим $\tau_\eta$:

$$ \begin{equation*} \tau_\eta=\eta\Delta \leqslant \frac{2\|\dot x(0)\|\Delta}{\Delta\alpha}=\frac{2\|\dot x(0)\|}{\alpha}. \end{equation*} \notag $$

Таким образом, если выполнено условие ${\|x(0)\| + \tau_\eta\|\dot x(0)\|} \,{<}\, \varepsilon_0$, то $\|x(t)\| \,{<}\, \varepsilon_0$ для всех $t \in [0, \tau_\eta]$.

$6^0$. Пусть $\zeta \in D_{\varepsilon_0/3}(0)$, $\dot x(\tau_q) \in D_{2\varepsilon_0 / 3}(\zeta)$, $q \geqslant 0$. Покажем, что можно привести значение функции $\dot x(\cdot)$ сколь угодно близко к точке $\zeta$ из положения $\dot x(\tau_q)$ к некоторому моменту $\overline t$.

Для выбора вектора управления преследователя в п. $4^0$ будем использовать вектор $p=\zeta - \dot x(\tau_q)$, т.е. целевая точка вместо точки $0$ изменяется на $\zeta$. В момент $\tau_{q+1}$ имеем $p=(\zeta - \dot x(\tau_{q+1}))/\|\zeta-\dot x(\tau_{q+1})\|$ и т.д. Согласно п. $4^0$ имеем включение $\dot x(t) \in D_{2\varepsilon_0 / 3}(\zeta)$, т.е. $\dot x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [t_q, \overline t]$. Аналогично п. $5^0$ получаем оценку времени

$$ \begin{equation*} \overline t - t_q \leqslant \frac{2\|\zeta - \dot x(\tau_q)\|}{\alpha}. \end{equation*} \notag $$

$7^0$. В данном пункте построим продолжение стратегии из п. $5^0$, приводящее функцию $x(\cdot)$ за конечное время в любую наперед заданную окрестность нуля.

Пусть выполнена процедура из п. $5^0$, т.е. $\|\dot x(\tau_\eta)\| \leqslant \delta$. Обозначим $\varphi=-x(\tau_\eta)/\|x(\tau_\eta)\|$. Здесь и далее будем брать такое $\delta \leqslant \varepsilon_0/3$, что $\varepsilon_0/(3\delta)=\mu \in \mathbb N$. Кроме того, предполагаем, что $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$. Далее в доказательстве получим условия, гарантирующие выполнения этого неравенства.

Далее, считая начальным положением $\dot x(\tau_\eta)$, в соответствии с п. $6^0$ можем привести функцию $\dot x(\cdot)$ в шар $D_{\delta}(\delta\varphi)$ за время $\Delta_1 \,{\leqslant}\, 4\delta / \alpha$, т.е. к моменту $\tau_\eta\,{+}\, \Delta_1$.

Затем, считая начальным положением $\dot x(\tau_\eta + \Delta_1)$, приводим функцию $\dot x(\cdot)$ в шар $D_{\delta}(2\delta\varphi)$ за время $\Delta_2 \leqslant 4\delta / \alpha$, т.е. к моменту $\tau_\eta + \Delta_1 + \Delta_2$.

Продолжаем данную процедуру до попадания функции $\dot x(\cdot)$ в шар $D_{\delta}(\mu\delta\varphi)=D_{\delta}(\varphi\varepsilon_0/3)$. Это произойдет к моменту $\tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Здесь $\Delta_i \leqslant 4\delta / \alpha$, $i=1, \dots, \mu$. После этого в качестве целевой до окончания игры выбираем точку $\varphi\varepsilon_0/3$. Таким образом, в силу п. $4^0$ $\dot x(t) \in D_{\delta}(\varphi\varepsilon_0/3)$, $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.

Представим $\dot x(t)=\beta(t)\varphi + \psi(t)$, где $\beta(t)=i\delta$ при $t \in \bigl[\tau_\eta + \sum_{j=1}^{i - 1}{\Delta_j}, \tau_\eta + \sum_{j=1}^{i}{\Delta_j}\bigr)$, $i=1, \dots, \mu$, и $\beta(t)=\varepsilon_0/3$ при $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Отметим, что $\|\psi(t)\| \leqslant 2\delta$, $\tau_\eta \leqslant t \leqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$, и $\|\psi(t)\| \leqslant \delta$ при $t > \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.

Таким образом, найдется и единственное $\widehat t \geqslant 0$ такое, что

$$ \begin{equation*} x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds=0. \end{equation*} \notag $$
Так как $\|x(\tau_\eta)\| \leqslant \varepsilon_0$, то $\widehat t \leqslant \Delta_1 + \dots + \Delta_\mu + 3$.

Если $\widehat t \leqslant \Delta_1$, то

$$ \begin{equation*} \begin{aligned} \, \|x(\tau_\eta + \widehat t)\| &= \biggl\|x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\psi(s)\, ds\biggr\| \\ &\leqslant \|x(\tau_\eta) + \varphi\delta\widehat t\| + 2\delta\widehat t = (\|x(\tau_\eta)\| - \delta\widehat t) + 2\delta\widehat t = 2\delta\widehat t \leqslant 2\delta\Delta_1. \end{aligned} \end{equation*} \notag $$

Если $\Delta_1 < \widehat t \leqslant \Delta_1 + \Delta_2$, то

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant (\|x(\tau_\eta)\| - \delta\Delta_1 - 2\delta(\widehat t - \Delta_1)) + 2\delta\Delta_1 + 2\delta(\widehat t - \Delta_1) = \|x(\tau_\eta)\| + \delta\Delta_1. \end{equation*} \notag $$

Если $\Delta_1 + \Delta_2 < \widehat t \leqslant \Delta_1 + \Delta_2 + \Delta_2$, то

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant \|x(\tau_\eta)\| + \delta\Delta_1 - \delta(\widehat t - \Delta_1 - \Delta_2). \end{equation*} \notag $$
И так далее.

Таким образом, так как $\Delta_1 \leqslant 4\delta / \alpha$, то для выполнения неравенства $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$, достаточно выполнения следующего неравенства:

$$ \begin{equation*} \|x(\tau_\eta)\| + \frac{4\delta^2}{\alpha} \leqslant \varepsilon_0. \end{equation*} \notag $$

Оценим норму $\|x(\tau_\eta + \widehat t)\|$:

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant 2\delta\sum_{i=1}^{\mu}{\Delta_i} + \delta\biggl(\widehat t - \sum_{i=1}^{\mu}{\Delta_i}\biggr) \leqslant 2\delta\cdot\frac{4\delta\mu}{\alpha} + 3\delta = \delta\biggl( \frac{8\varepsilon_0}{3\alpha} + 3 \biggr ). \end{equation*} \notag $$
Следовательно, так как мы можем выбирать сколь угодно малое $\delta$, то можем привести траекторию $x(\cdot)$ сколь угодно близко к нулю за время
$$ \begin{equation*} \tau_\eta + \widehat t \leqslant \frac{2\|\dot x(0)\|}{\alpha} + \Delta_1 + \dots + \Delta_\mu + 3 \leqslant \frac{2\varepsilon_0}{\alpha} + \frac{4\varepsilon_0}{3\alpha} + 3 = \frac{10\varepsilon_0}{3\alpha} + 3=T. \end{equation*} \notag $$

В силу п. $5^0$, если $\|x(0)\| + \tau_\eta\|\dot x(0)\|< \varepsilon_0$, то $\|x(t)\| < \varepsilon_0$ для всех $t \in [0, \tau_\eta]$. Так как $\tau_\eta \leqslant 2\|\dot x(0)\|/\alpha \leqslant 2\varepsilon_0/\alpha$, то получаем искомое $\theta=\max\{2\varepsilon_0/\alpha, 1\}$.

Теорема 4 доказана.

Введем вспомогательную управляемую систему

$$ \begin{equation} \ddot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0, \quad \dot y(0)=\dot x_0, \end{equation} \tag{3.2} $$

где $w, y \in \mathbb R^k$. Допустимыми управлением системы (3.2) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$.

Пусть $\varepsilon_0$ и $\theta$ те же, что и в теореме 4.

Справедлива следующая теорема.

Теорема 5. Пусть $f(0, 0, u_1), \dots, f(0, 0, u_m)$ образуют положительный базис, $-g(0, 0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$, заданы $x_0, \dot x_0 \in \mathbb R^k$, $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, $T > 0$. Тогда существует $\rho > 0$ такое, что для любого произвольного допустимого управления $w(\cdot)$ системы (3.2), удовлетворяющего условиям $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, и для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ справедливы неравенства $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$.

Доказательство. В доказательстве теоремы 4 поимка осуществляется путем управления положением функции скорости $\dot x(\cdot)$. Вследствие доказательства теоремы 4 (см. п. $6^0$), если $b_0, b_1 \in O_{\widehat\varepsilon_0}(0)$ и $b_0 \in D_{\widehat r}(b_1) \subset D_{\varepsilon_0}(0)$ для некоторого $\widehat r > 0$, то функцию $\dot x(\cdot)$ из начальной точки $b_0$ за конечное время $2\|b_1 - b_0\|/\alpha$ можно привести в любую окрестность точки $b_1$ при любых действиях убегающего при условии $\|x(t)\| \leqslant \varepsilon_0$, $t \in [0, 2\|b_1 - b_0\|/\alpha]$. Здесь $\alpha$ соответствует п. $2^0$ доказательства теоремы 4.

Положим $\rho=\alpha / 2$. Тогда согласно определению $\theta$ в п. $7^0$ доказательства теоремы 4 для любых начальных положений, удовлетворяющих условию $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, и произвольного $T > 0$ найдется управление $w(\cdot)$ системы (3.2) такое, что $\|y(t)\| < \varepsilon_0$, $\|\dot y(t)\| < \varepsilon_0$ и $\|w(t)\| \leqslant \rho$ для всех $t \in [0, T]$. Действительно, можем выбрать $w(t)=-\rho\dot y(0)/\|\dot y(0)\|$ при $t \in [0, \|\dot y(0)\|/\rho)$ и $w(t) \equiv 0$ при $t \geqslant \|\dot y(0)\|/\rho$. Тогда при $t \in [0, \|\dot y(0)\|/\rho]$ справедливо следующее неравенство:

$$ \begin{equation*} \begin{aligned} \, \|y(t)\| &\leqslant \|y(0)\| + t\|\dot y(0)\| < \|y(0)\| + \frac{\|\dot y(0)\|\varepsilon_0}{\rho} \\ &= \|y(0)\| + \frac{2\|\dot y(0)\|\varepsilon_0}{\alpha} \leqslant \|x_0\| + \theta\|\dot x_0\| < \varepsilon_0. \end{aligned} \end{equation*} \notag $$

При $t > \|\dot y(0)\|/\rho$ справедливо равенство $\|y(t)\|=\|y(\|\dot y(0)\|/\rho)\|$.

Зафиксируем $\delta > 0$. Так как функции $y(t)$, $\dot y(t)$, $t \in [0, T]$, являются непрерывными, $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, то получаем следующие неравенства:

$$ \begin{equation} \begin{aligned} \, \max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_1 > 0, \\ \max\{r \geqslant 0 \, | \, \dot y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_2 > 0. \end{aligned} \end{equation} \tag{3.3} $$

Положим $\delta_3=\delta_1 / T$, $\delta_4=\delta / T$. Отсюда, если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_3$, получаем $\|x(t) - y(t)\| \leqslant \delta_1$, т.е. $x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [0, T]$. Если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_4$, то $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Пусть $q$ – произвольное натуральное число такое, что

$$ \begin{equation} \frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1, \delta_2, \delta_3, \delta_4\}}{4}. \end{equation} \tag{3.4} $$

Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.

Далее, аналогично доказательству теоремы 2 строится стратегия приведения значения функции скорости $\dot x(\cdot)$ в окрестность точки $\dot y(t)$, т.е. из точки $x(t_0)$ в $D_{\widehat\varepsilon}(y(t_1))$, из $x(t_1)$ в $D_{2\widehat\varepsilon}(y(t_2))$ и т.д. В силу (3.3) и (3.4) для всех $t \in [0, T]$ справедливы следующие включения: $\|x(t) - y(t)\| \leqslant \delta$, $\|\dot x(t) - \dot y(t)\| \leqslant \delta$, $x(t) \in D_{\varepsilon_0}(0)$, $\dot x(t) \in D_{\varepsilon_0}(0)$.

Теорема 5 доказана.

Определение 6. В игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнены неравенства $\|x(\tau)\| < \widehat\varepsilon$ и $\|\dot x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Справедливо следующее следствие.

Следствие. Пусть выполнены условия теоремы 5 и $\|x_0\|+\theta\|\dot x_0\|<\varepsilon_0$. Тогда в игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка.

Доказательство. В доказательстве теоремы 5 достаточно дополнительно ограничить управление $w(\cdot)$ вспомогательной системы (3.2): $y(T)=0$ и $\dot y(T)= 0$. Всегда существует такое $T \geqslant 0$ и управление вспомогательной системы. Обозначим $t_1=\|\dot y(0)\|/\rho$, $t_2=t_1 + \sqrt{\|y(t_1)/\rho\|}$, $t_3=t_2 + \sqrt{\|y(t_1)/\rho\|}$. Определим управление следующим образом:
$$ \begin{equation*} \begin{aligned} \, w(t)&=\frac{-\rho\dot y(0)}{\|\dot y(0)\|} \quad \text{при }\ t \in [0, t_1), \\ w(t)&=\frac{-\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_1, t_2), \\ w(t)&=\frac{\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_2, t_3]. \end{aligned} \end{equation*} \notag $$
Тогда
$$ \begin{equation*} \begin{aligned} \, y(t_3) &=y(t_1) + (t_3 - t_1)\dot y(t_1) + \int_{t_1}^{t_3}\dot y(s) \, ds \\ &= y(t_1) + \int_{t_1}^{t_2}\frac{-s\rho y(t_1)}{\|\dot y(0)\|} \, ds + \int_{t_2}^{t_3}\biggl(\frac{-y(t_1)}{2} + \frac{s\rho y(t_1)}{\|\dot y(0)\|}\biggr) \, ds \\ &= y(t_1) - \frac{y(t_1)}{2} - \frac{y(t_1)}{2}=0. \end{aligned} \end{equation*} \notag $$

Следствие доказано.

§ 4. Заключение

Рассмотрены две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика в первой задаче описывается системой вида $\dot x=f(x, u) + g(x, v)$. Показано, что если решение вспомогательной системы $\dot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Динамика во второй задаче описывается системой вида $\ddot x=f(x, \dot x, u) + g(x, \dot x, v)$. Показано, что если решение вспомогательной системы $\ddot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.

Список литературы

1. Р. Айзекс, Дифференциальные игры, Мир, М., 1967, 479 с.  mathscinet  zmath; пер. с англ.: R. Isaacs, Differential games. A mathematical theory with applications to warfare and pursuit, control and optimization, John Wiley & Sons, Inc, New York–London–Sydney, 1965, xvii+384 с.  mathscinet  zmath
2. A. Blaquiere, F. Gerard, G. Leitmann, Quantitative and qualitative differential games, Math. Sci. Eng., 58, Academic Press, New York–London, 1969, xi+172 pp.  mathscinet
3. Н. Н. Красовский, Игровые задачи о встрече движений, Наука, М., 1970, 420 с.  mathscinet  zmath
4. A. Friedman, Differential games, Pure Appl. Math., XXV, Wiley-Interscience [A division of John Wiley & Sons, Inc.], New York–London, 1971, xii+350 pp.  mathscinet  zmath
5. O. Hajek, Pursuit games. An introduction to the theory and applications of differential games of pursuit and evasion, Math. Sci. Eng., 120, Academic Press, Inc. [Harcourt Brace Jovanovich, Publishers], New York–London, 1975, xii+266 pp.  mathscinet  zmath
6. G. Leitmann, Cooperative and non-cooperative many players differential games, Internat. Centre for Mech. Sci. (CISM) Courses and Lectures, 190, Springer-Verlag, Vienna, 1974, 77 pp.  zmath
7. Н. Н. Красовский, А. И. Субботин, Позиционные дифференциальные игры, Наука, М., 1974, 456 с.  mathscinet  zmath; англ. пер.: N. N. Krasovskii, A. I. Subbotin, Game-theoretical control problems, Springer Ser. Soviet Math., Springer-Verlag, New York, 1988, xii+517 с.  mathscinet  zmath
8. П. Е. Двуреченский, Г. Е. Иванов, “Алгоритмы вычисления операторов Минковского и их применение в дифференциальных играх”, Ж. вычисл. матем. и матем. физ., 54:2 (2014), 224–255  mathnet  crossref  zmath; англ. пер.: P. E. Dvurechensky, G. E. Ivanov, “Algorithms for computing Minkowski operators and their application in differential games”, Comput. Math. Math. Phys., 54:2 (2014), 235–264  crossref  mathscinet
9. В. Н. Ушаков, А. А. Ершов, “K решению задач управления с фиксированным моментом окончания”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 26:4 (2016), 543–564  mathnet  crossref  mathscinet  zmath
10. М. С. Никольский, “Одна нелинейная задача преследования”, Кибернетика, 1973, № 2, 92–94  mathscinet  zmath
11. Б. Н. Пшеничный, Н. Б. Шишкина, “Достаточные условия конечности времени преследования”, ПММ, 49:4 (1985), 517–523  mathscinet  zmath; англ. пер.: B. N. Pshenichnyi, N. B. Shishkina, “Sufficient conditions of finiteness of the pursuit time”, J. Appl. Math. Mech., 49:4 (1985), 399–404  crossref
12. Н. Сатимов, “К задаче преследования в нелинейных дифференциальных играх”, Кибернетика, 1973, № 3, 88–93  mathscinet  zmath
13. P. Soravia, “$\mathscr{H}_\infty$ control of nonlinear systems: differential games and viscosity solutions”, SIAM J. Control Optim., 34:3 (1996), 1071–1097  crossref  mathscinet  zmath
14. T. Natarajan, D. A. Pierre, G. Naadimuthu, E. S. Lee, “Piecewise suboptimal control laws for differential games”, J. Math. Anal. Appl., 104:1 (1984), 189–211  crossref  mathscinet  zmath
15. А. А. Азамов, “Об одном классе нелинейных дифференциальных игр”, Матем. заметки, 30:4 (1981), 619–625  mathnet  mathscinet  zmath; англ. пер.: A. A. Azamov, “A class of nonlinear differential games”, Math. Notes, 30:4 (1981), 805–808  crossref
16. Н. Н. Петров, “Об управляемости автономных систем”, Дифференц. уравнения, 4:4 (1968), 606–617  mathnet  mathscinet  zmath; англ. пер.: N. N. Petrov, “Controllability of autonomous systems”, Differ. Equ., 4 (1972), 311–317
17. Н. Н. Петров, “Локальная управляемость автономных систем”, Дифференц. уравнения, 4:7 (1968), 1218–1232  mathnet  mathscinet  zmath; англ. пер.: N. N. Petrov, “Local controllability of autonomous systems”, Differ. Equ., 4 (1972), 632–639
18. Н. Н. Петров, “Плоские задачи теории управляемости”, Вестн. ЛГУ, 1969, № 13, 69–78  mathscinet  zmath
19. А. Я. Нарманов, Н. Н. Петров, “Нелокальные проблемы теории оптимальных процессов. I”, Дифференц. уравнения, 21:4 (1985), 605–614  mathnet  mathscinet  zmath; англ. пер.: A. Ya. Narmanov, N. N. Petrov, “Nonlocal problems in the theory of optimal processes. I”, Differ. Equ., 21 (1985), 398–406
20. А. Я. Нарманов, “О стабильности вполне управляемых систем”, Дифференц. уравнения, 36:10 (2000), 1336–1344  mathnet  mathscinet  zmath; англ. пер.: A. Ya. Narmanov, “Stability of completely controllable systems”, Differ. Equ., 36:10 (2000), 1475–1483  crossref
21. А. Я. Нарманов, “О стабильности вполне управляемых систем”, Матем. тр., 4:1 (2001), 94–110  mathnet  mathscinet  zmath; англ. пер.: A. Ya. Narmanov, “On stability of totally controlled systems”, Siberian Adv. Math., 11:4 (2001), 110–125
22. А. С. Банников, Н. Н. Петров, “К нестационарной задаче группового преследования”, Тр. ИММ УрО РАН, 16, № 1, 2010, 40–51  mathnet  zmath; англ. пер.: A. S. Bannikov, N. N. Petrov, “On a nonstationary problem of group pursuit”, Proc. Steklov Inst. Math. (Suppl.), 271, suppl. 1 (2010), S41–S52  crossref  mathscinet
23. Н. Н. Петров, “Одна задача простого преследования с фазовыми ограничениями”, Автомат. и телемех., 1992, № 5, 22–26  mathnet  mathscinet  zmath; англ. пер.: N. N. Petrov, “A certain simple pursuit problem with phase constraints”, Autom. Remote Control, 53:5 (1992), 639–642
24. Н. Н. Петров, “Одна задача группового преследования с дробными производными и фазовыми ограничениями”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 27:1 (2017), 54–59  mathnet  crossref  mathscinet  zmath
25. Н. Н. Петров, Н. А. Соловьева, “Многократная поимка в рекуррентном примере Л. С. Понтрягина с фазовыми ограничениями”, Тр. ИММ УрО РАН, 21, № 2, 2015, 178–186  mathnet  mathscinet  zmath; англ. пер.: N. N. Petrov, N. A. Solov'eva, “Multiple capture in Pontryagin's recurrent example with phase constraints”, Proc. Steklov Inst. Math. (Suppl.), 293, suppl. 1 (2016), 174–182  crossref
26. М. Н. Виноградова, Н. Н. Петров, Н. А. Соловьева, “Поимка двух скоординированных убегающих в линейных рекуррентных дифференциальных играх”, Тр. ИММ УрО РАН, 19, № 1, 2013, 41–48  mathnet  mathscinet
27. К. А. Щелчков, “Об одной нелинейной задаче преследования с дискретным управлением и неполной информацией”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 28:1 (2018), 111–118  mathnet  crossref  mathscinet  zmath
28. К. А. Щелчков, “Оценка времени поимки и построение стратегии преследователя в нелинейной дифференциальной игре двух лиц”, Дифференц. уравнения, 58:2 (2022), 260–269  mathscinet  zmath; англ. пер.: K. A. Shchelchkov, “Estimate of the capture time and construction of the Pursuer's strategy in a nonlinear two-person differential game”, Differ. Equ., 58:2 (2022), 264–274  crossref
29. K. Shchelchkov, “$\varepsilon$-capture in nonlinear differential games described by system of order two”, Dyn. Games Appl., 12:2 (2022), 662–676  crossref  mathscinet  zmath

Образец цитирования: К. А. Щелчков, “Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением”, Матем. сб., 214:9 (2023), 161–174; K. A. Shchelchkov, “Relative optimality in nonlinear differential games with discrete control”, Sb. Math., 214:9 (2023), 1337–1350
Цитирование в формате AMSBIB
\RBibitem{Shc23}
\by К.~А.~Щелчков
\paper Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением
\jour Матем. сб.
\yr 2023
\vol 214
\issue 9
\pages 161--174
\mathnet{http://mi.mathnet.ru/sm9851}
\crossref{https://doi.org/10.4213/sm9851}
\mathscinet{http://mathscinet.ams.org/mathscinet-getitem?mr=4705901}
\zmath{https://zbmath.org/?q=an:1537.49034}
\adsnasa{https://adsabs.harvard.edu/cgi-bin/bib_query?2023SbMat.214.1337S}
\transl
\by K.~A.~Shchelchkov
\paper Relative optimality in nonlinear differential games with discrete control
\jour Sb. Math.
\yr 2023
\vol 214
\issue 9
\pages 1337--1350
\crossref{https://doi.org/10.4213/sm9851e}
\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=001168284500005}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85185923867}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/sm9851
  • https://doi.org/10.4213/sm9851
  • https://www.mathnet.ru/rus/sm/v214/i9/p161
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математический сборник Sbornik: Mathematics
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024