К. А. Щелчков, “Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением”, Матем. сб., 214:9 (2023), 161–174; K. A. Shchelchkov, “Relative optimality in nonlinear differential games with discrete control”, Sb. Math., 214:9 (2023), 1337

Математический сборник

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Скоро в журнале
	Архив
	Импакт-фактор
	Правила для авторов
	Лицензионный договор
	Загрузить рукопись
	Историческая справка

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Матем. сб.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Математический сборник, 2023, том 214, номер 9, страницы 161–174
DOI: https://doi.org/10.4213/sm9851 (Mi sm9851)

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением

К. А. Щелчков

Удмуртский государственный университет, г. Ижевск

PDF полного текста (603 kB) PDF английской версии (471 kB) Полный текст в HTML Список цитирования (1)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.4213/sm9851

Аннотация: Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Управление осуществляется посредством кусочно постоянного управления, множество значений которого является конечным. Целью управления является движение сколь угодно близко к конечной траектории, описываемой вспомогательной системой управления простого вида, при любых действиях помехи. В обеих задачах получены фазовые ограничения на вспомогательную систему, в рамках которых управление вспомогательной системы может быть любым. Для любой окрестности и произвольного управления вспомогательной системы, которое удовлетворяет полученным ограничениям, в исходных задачах существуют допустимые управления, обеспечивающие в каждый момент времени нахождение фазовой точки исходной системы в указанной окрестности соответствующей фазовой точки вспомогательной системы. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.
Библиография: 29 названий.

Ключевые слова: дифференциальная игра, нелинейная система, преследователь, убегающий.

Финансовая поддержка	Номер гранта
Министерство науки и высшего образования Российской Федерации	075-01483-23-00, проект FEWS-2020-0010
Работа выполнена при поддержке Министерства науки и высшего образования РФ в рамках государственного задания № 075-01483-23-00, проект FEWS-2020-0010.

Поступила в редакцию: 23.10.2022 и 10.05.2023

Англоязычная версия:
Sbornik: Mathematics, 2023, Volume 214, Issue 9, Pages 1337–1350
DOI: https://doi.org/10.4213/sm9851e

Реферативные базы данных:

Тип публикации: Статья

MSC: Primary 49N70; Secondary 49N75

§ 1. Введение

Дифференциальные игры двух лиц, рассмотренные первоначально Р. Айзексом в [1], в настоящее время представляют широкое поле для исследований (см. [2]–[7]). Были разработаны методы решения различных классов игровых задач: метод Айзекса, основанный на анализе определенного уравнения в частных производных и его характеристик, метод экстремального прицеливания Красовского, метод Понтрягина и другие. Н. Н. Красовским и представителями его научной школы создана теория позиционных игр, в основе которой лежат понятие максимального стабильного моста и правило экстремального прицеливания. Однако эффективное построение таких мостов для исследования реальных конфликтно управляемых процессов (в первую очередь нелинейных дифференциальных игр) весьма затруднительно, а иногда даже невозможно. Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления для отдельных классов игр, обладающих дополнительными свойствами. Построение приближения стабильных мостов в нелинейных дифференциальных играх, в том числе численно, рассматривается, в частности, в работах [8], [9].

Достаточные условия разрешимости задачи преследования в нелинейном примере Л. С. Понтрягина получены в [10]. В работе [11] представлены достаточные условия разрешимости задачи преследования в нелинейной дифференциальной игре при некоторых дополнительных условиях на множество значений правой части системы дифференциальных уравнений и терминальное множество. В работе [12] получены достаточные условия поимки в нелинейной игре, описываемой стационарной нелинейной системой, исследуется оптимальность времени поимки для некоторого случая на плоскости. Задача, рассматриваемая в работе [12], сравнима с представленной. Условия поимки в [12] оказываются значительно сильнее условий, полученных в настоящей работе. При этом в [12] преследователь использует контрстратегию. В работе [13] с использованием формализации дифференциальной игры рассматривается нелинейная задача управления с помехой. Получены достаточные условия существования выигрышной стратегии. В работе [14] рассматривается нелинейная дифференциальная игра двух лиц с интегральным критерием качества. Игроки используют кусочно программные управления специального вида, причем временной интервал делится на две части. Получены необходимые и достаточные условия существования седловой точки для рассматриваемой игры. В работе [15] рассматривается дифференциальная игра преследования на плоскости, динамика которой описывается нелинейной системой дифференциальных уравнений определенного вида. Целевым множеством является начало координат. Получены условия осуществления поимки посредством позиционной контрстратегии и характеристики игры в явном виде, приведены примеры.

В работе [16] было введено понятие положительного базиса, которое в работах [16]–[18] эффективно использовалось для исследования свойства управляемости нелинейных систем, описываемых дифференциальными уравнениями в конечномерном евклидовом пространстве. В работах [19]–[21] свойства положительного базиса использовались для исследования управляемых систем на многообразиях. В работах [22]–[26] свойства положительного базиса были использованы для исследования задачи преследования группой преследователей одного или нескольких убегающих в линейных дифференциальных играх с равными возможностями игроков. В этих работах концепция положительного базиса используется для описания начальных положений игроков.

В работах [27] и [29] рассматривалась задача поимки в нелинейной дифференциальной игре, аналогичной дифференциальной игре настоящей работы. В них получены достаточные условия на параметры игры для существования окрестности нуля, из которой происходит поимка. Ключевым было условие, что некоторый набор векторов образует положительный базис. В работе [28] получены дополнительные свойства выигрышной стратегии для задачи.

Настоящая работа является продолжением исследований [27]–[29]. Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Получены условия, при которых возможно удерживать траекторию исходной системы вблизи траектории некоторой системы простого вида при любых действиях помехи.

§ 2. Система с производной первого порядка

В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений

$$ \begin{equation*} \dot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \end{equation*} \notag $$

где $x \in \mathbb R^k$ – фазовый вектор, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f$: $\mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по $x$. Функция $g\colon \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных. То есть существуют положительные числа $L_1$, $L_2$ такие, что

$$ \begin{equation*} \begin{gathered} \, \|f(x_1, u_i) - f(x_2, u_i)\| \leqslant L_1\|x_1 - x_2\|, \qquad x_1, x_2 \in \mathbb R^k, \quad i=1, \dots, m, \\ \|g(x_1, v_1) - g(x_2, v_2)\| \leqslant L_2\bigl(\|x_1 - x_2\| + \|v_1 - v_2\|\bigr), \qquad x_1, x_2 \in \mathbb R^k, \quad v_1, v_2 \in V. \end{gathered} \end{equation*} \notag $$

Здесь и всюду далее норма считается евклидовой.

Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\eta},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\eta}=T$.

Определение 1. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \eta - 1$, ставящих в соответствие величинам $(\tau_r, x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$.

Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$.

Определение 2. В игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка, если существует ${T>0}$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления убегающего $v(\cdot)$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Целью преследователя является осуществление $\varepsilon$-поимки. Цель убегающего – воспрепятствовать этому.

Определение 3 (см. [16]). Совокупность векторов $a_1, \dots, a_n \in \mathbb R^k$ называется положительным базисом, если для любой точки $\xi \in \mathbb R^k$ существуют числа $\mu_1, \dots, \mu_n \geqslant 0$ такие, что $\xi=\sum_{i=1}^{n}{\mu_i a_i}$.

Введем следующие обозначения: $\operatorname{Int} A$ – внутренность множества $A$; $\operatorname{co} A$ – выпуклая оболочка множества $A$; $O_{\varepsilon}(x)$ – открытый шар радиуса $\varepsilon$ с центром в точке $x$; $D_{\varepsilon}(x)$ – замкнутый шар радиуса $\varepsilon$ с центром в точке $x$.

Справедлива следующая теорема о поимке.

Теорема 1 (см. [27]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существует $\varepsilon_0 \,{>}\, 0$ такое, что для любой точки $x_0 \in O_{\varepsilon_0}(0)$ в игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка.

В [28] доказано, что для любого $x_0 \in O_{\varepsilon_0}(0)$ ($\varepsilon_0$ – значение из теоремы 1) $\varepsilon$-поимка происходит за время ${\|x_0\|}/{\alpha(\|x_0\|)}$, где

$$ \begin{equation*} \alpha(r)=\min_{x \in D_{r}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, u_i) + g(x, v), p\bigr\rangle. \end{equation*} \notag $$

При этом для построения стратегии преследователя $P$ достаточно использовать разбиение с фиксированным шагом.

Введем вспомогательную управляемую систему

$$ \begin{equation} \dot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0, \end{equation} \tag{2.1} $$

где $w, y \in \mathbb R^k$. Допустимым управлением системы (2.1) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$.

Пусть $\varepsilon_0$ – значение из теоремы 1. Справедлива следующая теорема.

Теорема 2. Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис,

$$ \begin{equation*} -g(0, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\}\bigr), \end{equation*} \notag $$

заданы $R \in (0, \varepsilon_0)$, $x_0 \in O_{R}(0)$, $T > 0$, $\rho \in (0, \alpha(R)]$, а $w(\cdot)$ – произвольное допустимое управление системы (2.1), для которого $\|y(t)\| < R$ для всех $t \in [0, T]$. Тогда для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v$ убегающего $E$ справедливо неравенство $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$.

Доказательство. Согласно доказательству теоремы 1 для всех $x \in D_{R}(0)$ справедливо вложение

$$ \begin{equation*} -g(x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, u_1), \dots, f(x, u_m)\}\bigr). \end{equation*} \notag $$

Пусть $b_0, b_1 \in O_{R}(0)$ и выполнено включение $b_0 \in D_{\widehat r}(b_1) \subset D_{R}(0)$ для некоторого $\widehat r > 0$. Тогда при переносе начала координат в точку $b_1$ выполняется теорема 1, т.е. за конечное время из точки $b_0$ исходную систему можно привести сколь угодно близко к точке $b_1$ при любых допустимых действиях убегающего. При этом, согласно [28], конечное время можно взять равным $\|b_1 - b_0\| / \alpha(R)$ и шаг разбиения фиксированным. Отметим, что в таком случае если $\|x(\tau_j) - b_1\| \leqslant \varepsilon$, где $\varepsilon$ является радиусом целевой окрестности, то для всех $t \in (\tau_j, \tau_\eta]$ справедливо неравенство $\|x(t) - b_1\| < \varepsilon$.

Зафиксируем $\delta > 0$. Так как функция $y(t)$, $t \in [0, T]$, является непрерывной и $\|y(t)\| < R$ для всех $t \in [0, T]$, то справедливо следующее неравенство:

$$ \begin{equation} \max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{R}(0), \, t \in [0, T]\} \doteq \delta_1 > 0. \end{equation} \tag{2.2} $$

Пусть $q$ – произвольное натурально число такое, что

$$ \begin{equation*} \frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1\}}{4}. \end{equation*} \notag $$

Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.

На интервале $[t_0, t_1)$ считаем точку $\xi_1=y(t_1)$ целевой. Тогда существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_1) \in \xi_1 + D_{\widehat\varepsilon}(0)=y(t_1) + D_{\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_2$ ближайшую точку к $x(t_1)$ на множестве $y(t_2) + D_{\widehat\varepsilon}(0)$. Следовательно, $\|x(t_1) - \xi_2\| \leqslant \Delta\rho$. На интервале $[t_1, t_2)$ считаем точку $\xi_2$ целевой. Существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_2) \in \xi_2 + D_{\widehat\varepsilon}(0) \subset y(t_2) + D_{2\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_3$ ближайшую точку к $x(t_2)$ на множестве $y(t_2) + D_{2\widehat\varepsilon}(0)$. Аналогично, $\|x(t_2) - \xi_3\| \leqslant \Delta\rho$, $\xi_3$ – целевая точка, и мы приводим систему в $\xi_3 + D_{\widehat\varepsilon}(0) \subset y(t_3) + D_{3\widehat\varepsilon}(0)$. И так далее.

На последнем шаге получаем $x(T)=x(t_q) \in y(t_q) + D_{q\widehat\varepsilon}(0)=y(T) + D_{\widehat\delta}(0)$. Так как для всех $l=0, \dots, q-1$ справедливы включения $x(t_l) \in y(t_l) + D_{\widehat\delta}(0)$, $x(t_{l+1}) \in y(t_{l+1}) + D_{\widehat\delta}(0)$ и $\|y(t_{l+1}) - y(t_l)\| \leqslant \widehat\delta$, то в силу [27] $x(t) \in y(t_{l+1}) + D_{3\widehat\delta}(0)$. Таким образом, в силу (2.2) для каждого $l=0, \dots, q-1$ справедливы следующие неравенства:

$$ \begin{equation*} \begin{gathered} \, \|x(t) - y(t)\| \leqslant 4\widehat\delta \leqslant \delta \quad \text{для всех }\ t \in [t_l, t_{l+1}], \\ \|x(t) - y(t)\| \leqslant \delta_1 \quad \text{для всех }\ t \in [t_l, t_{l+1}]. \end{gathered} \end{equation*} \notag $$

Теорема 2 доказана.

§ 3. Система с производной второго порядка

В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0, \dot x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений

$$ \begin{equation} \ddot x=f(x, \dot x, u) + g(x, \dot x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)=\dot x_0, \end{equation} \tag{3.1} $$

где $x \in \mathbb R^k$ – фазовая переменная, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f\colon \mathbb R^k \times \mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по совокупности переменных $x$ и $\dot x$, функция $g\colon \mathbb R^k \times \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных, т.е. существуют положительные числа $L_1$, $L_2$ такие, что

$$ \begin{equation*} \begin{gathered} \, \|f(x_1, \dot x_1, u_i) - f(x_2, \dot x_2, u_i)\| \leqslant L_1(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad i=1, \dots, m, \\ \|g(x_1, \dot x_1, v_1) - g(x_2, \dot x_2, v_2)\| \leqslant L_2(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\| + \|v_1 - v_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad v_1, v_2 \in V. \end{gathered} \end{equation*} \notag $$

Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\gamma},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\gamma}=T.$

Определение 4. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \gamma - 1,$ ставящих в соответствие величинам $(\tau_r, x(\tau_r), \dot x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$.

Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$.

Определение 5. В игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Целью преследователя является осуществление $\varepsilon$-поимки, цель убегающего – воспрепятствовать этому.

В [29] доказана теорема о поимке в данной задаче для системы вида

$$ \begin{equation*} \ddot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)= \dot x_0. \end{equation*} \notag $$

Теорема 3 (см. [29]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0$, $\dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$.

Подход, используемый при доказательстве данной теоремы, будет применен и для получения условий разрешимости задачи преследования с динамикой (3.1). Кроме того, по аналогии с [28] преследователю достаточно выбирать стратегии с фиксированным шагом разбиения временного интервала. Справедлива следующая теорема.

Теорема 4. Пусть $f(0, 0, u_1),\dots,f(0, 0, u_m)$ образуют положительный базис и $-g(0, 0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0, \dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$. Кроме того, преследователю для построения стратегии достаточно использовать разбиение временного интервала с фиксированным шагом.

Доказательство. Схема доказательства и общие рассуждения аналогичны доказательству теоремы 3.

$1^0$. Покажем, что существуют $\overline\alpha > 0$, $\varepsilon_0 > 0$ такие, что для любых точек $x, \dot x \in D_{\varepsilon_0}(0)$ и вектора $p \in \mathbb R^k$, $\|p\|=1$, найдется $i \in \{1, \dots, m\}$ такое, что для любого $v \in V$ выполнено

$$ \begin{equation*} \bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle \geqslant \overline\alpha. \end{equation*} \notag $$

Данное неравенство справедливо в силу липшицевости функций $f, g$ в указанном смысле и свойств положительного базиса (см. [16]). То есть для некоторого $\varepsilon_0 > 0$ и для любых $x, \dot x \in D_{\varepsilon_0}(0)$ справедливо вложение

$$ \begin{equation*} -g(x, \dot x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, \dot x, u_1), \dots, f(x, \dot x, u_m)\}\bigr). \end{equation*} \notag $$

Следовательно, в силу свойств положительного базиса (см. [16]) векторы

$$ \begin{equation*} \bigl\{f(x, \dot x, u_1) + g(x, \dot x, v), \dots, f(x, \dot x, u_m) + g(x, \dot x, v)\bigr\} \end{equation*} \notag $$

образуют положительный базис для любого $v \in V$. Таким образом, существуют $\widehat x, \widetilde x \in D_{\varepsilon_0}(0)$, $\widehat p \in \mathbb R^k$, $\|\widehat p\|=1$, $\widehat v \in V$, $\widehat i \in \{1, \dots, m\}$ такие, что

$$ \begin{equation*} \min_{x, \dot x \in D_{\varepsilon_0}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle = \bigl\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\bigr\rangle. \end{equation*} \notag $$

Отсюда получаем $\overline\alpha=\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\rangle > 0$.

$2^0$. Введем ряд обозначений. Так как функции $f$, $g$ являются липшицевыми, то достигается следующий максимум:

$$ \begin{equation*} \max_{x, \dot x \in D_{2\varepsilon_0}(0), u \in U, v \in V}{\|f(x, \dot x, u) + g(x, \dot x, v)\|}=\overline D. \end{equation*} \notag $$

Обозначим

$$ \begin{equation*} D=\max\bigl\{\overline D, 2\varepsilon_0 \bigr\}. \end{equation*} \notag $$

Определим число $h$ так:

$$ \begin{equation*} h=\min\biggl\{\frac{\overline\alpha}{4(L_1 + L_2)}, \varepsilon_0\biggr\}. \end{equation*} \notag $$

Пусть $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|= 1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ и

$$ \begin{equation*} \max_{u \in U}\bigl\langle f(\overline x, \dot{\overline x}, u), p\bigr\rangle = \bigl\langle f(\overline x, \dot{\overline x}, \overline u), p\bigr\rangle. \end{equation*} \notag $$

Отметим, что, в силу п. $1^0$ для любого $v \in V$

$$ \begin{equation*} \bigl\langle f(\overline x, \dot{\overline x}, \overline u) + g(\overline x, \dot{\overline x}, v), p\bigr\rangle \geqslant \overline\alpha. \end{equation*} \notag $$

Аналогично доказательству теоремы 3 получаем следующую оценку:

$$ \begin{equation*} \begin{aligned} \, \bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle &\geqslant \overline\alpha - L_1(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) - L_2(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) \\ &\geqslant \overline\alpha - 2h(L_1 + L_2). \end{aligned} \end{equation*} \notag $$

Отсюда следует, что для любых $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|=1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ справедливо неравенство

$$ \begin{equation*} \bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle \geqslant \frac{\overline\alpha}{2}=\alpha. \end{equation*} \notag $$

$3^0$. В данном пункте определим размер шага разбиения временного отрезка.

Зафиксируем $0 < \delta \leqslant \varepsilon_0$. Выберем шаг разбиения

$$ \begin{equation*} \Delta=\min\biggl\{\frac{\alpha\delta}{D^2}, \frac{h}{D}\biggr\}. \end{equation*} \notag $$

Отметим, что в силу п. $2^0$, если $x(0), \dot x(0) \in D_{\varepsilon_0}(0)$, $t \in [0, \Delta]$, то для любых допустимых управлений игроков справедливы следующие неравенства:

$$ \begin{equation*} \begin{gathered} \, \|x(t) - x(0)\| \leqslant h, \qquad \|\dot x(t) - \dot x(0)\| \leqslant h, \\ \|f(x(t), \dot x(t), u(t))+ g(x(t), \dot x(t), v(t))\| \leqslant D, \qquad \|\dot x(t)\| \leqslant D. \end{gathered} \end{equation*} \notag $$

$4^0$. Произведем оценку приближения к нулю функции скорости $\dot x(\cdot)$ за один шаг разбиения.

Без ограничения общности можно рассмотреть только интервал $[0, \Delta)$. Значение управления преследователя будем выбирать следующим образом. Если $\dot x(0)=0$, то $\overline u_0 \in U$ произвольное. Если $\dot x(0) \neq 0$, то обозначим $p=-\dot x(0) / \|\dot x(0)\|$ и $\overline u_0 \in U$ выбираем из следующего равенства:

$$ \begin{equation*} \max_{u \in U}\bigl\langle f(x(0), \dot x(0), u), p\bigr\rangle = \bigl\langle f(x(0), \dot x(0), \overline u_0), p\bigr\rangle. \end{equation*} \notag $$

Таким образом, в силу пп. $2^0$ и $3^0$ для любых $t \in [0, \Delta)$, $v \in V$ справедливо следующее неравенство:

$$ \begin{equation*} \bigl\langle f(x(t), \dot x(t), \overline u_0) + g(x(t), \dot x(t), v), p\bigr\rangle \geqslant \alpha. \end{equation*} \notag $$

Пусть $t \in [0, \Delta)$. Оценим квадрат нормы скорости:

$$ \begin{equation*} \begin{aligned} \, \|\dot x(t)\|^2 &= \biggl\| \dot x(0) + \int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &= \|\dot x(0)\|^2 + \biggl \|\int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &\qquad+ 2\int_{0}^{t}\bigl\langle f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s)), \dot x(0) \bigr\rangle \, ds \\ &\leqslant \|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|. \end{aligned} \end{equation*} \notag $$

Оценим последний трехчлен $A=\|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|$.

Если $\|\dot x(0)\| \geqslant \delta$, то

$$ \begin{equation*} \begin{aligned} \, \Delta \leqslant \frac{\alpha\delta}{D^2} &\quad\Longrightarrow\quad D^2t^2 - t\alpha\|\dot x(0)\| \leqslant t(D^2\Delta - \alpha\delta) \leqslant 0 \\ & \quad\Longrightarrow\quad A \leqslant \|\dot x(0)\|^2 - t\alpha\|\dot x(0)\| \leqslant \biggl( \|\dot x(0)\| - \frac{t\alpha}{2} \biggr)^2. \end{aligned} \end{equation*} \notag $$

$$ \begin{equation*} A=D^2t^2 \leqslant D^2\Delta^2 \leqslant \frac{\alpha^2\delta^2}{D^2} \leqslant \frac{\delta^2}{4}. \end{equation*} \notag $$

Если $\|\dot x(0)\|=\delta$, то

$$ \begin{equation*} A=\delta^2 + D^2t^2 - 2t\alpha\delta \leqslant \delta^2 + t(D^2\Delta - 2\alpha\delta) \leqslant \delta^2. \end{equation*} \notag $$

Таким образом, если $\|\dot x(0)\| \geqslant \delta$, то $\|\dot x(\Delta)\| \leqslant \|\dot x(0)\| -{\Delta\alpha}/{2}$.

Если $\|\dot x(0)\| < \delta$, то $\|\dot x(t)\| \leqslant \delta$ для всех $t \in [0, \Delta]$.

$5^0$. В данном пункте построим стратегию для приведения функции $\dot x(\cdot)$ в $D_{\delta}(0)$ и оценим время.

На каждом интервале $[\tau_i, \tau_{i+1})$, $i=0, \dots, \eta - 1$, будем выбирать управление преследователя в соответствии с п. $4^0$, где вместо векторов $x(0)$, $\dot x(0)$ используем $x(\tau_i)$, $\dot x(\tau_i)$ соответственно. Выберем такое неотрицательное целое $\eta$, что

$$ \begin{equation*} \frac{\Delta\alpha\eta}{2} < \|\dot x(0)\| \leqslant \frac{\Delta\alpha(\eta+1)}{2}, \end{equation*} \notag $$

т.е.

$$ \begin{equation*} \eta=\biggl[\frac{2\|\dot x(0)\|}{\Delta\alpha}\biggr]. \end{equation*} \notag $$

Следовательно, в силу оценок из п. $4^0$ $\|\dot x(\tau_\eta)\| \leqslant \delta$. Действительно, если $\|\dot x(\tau_\eta)\| > \delta$, то в силу оценок из п. $4^0$ для каждого $i=0, \dots, \eta - 1$ справедливо неравенство $\|\dot x(\tau_i)\| > \delta$. При этом $D\Delta \leqslant \delta/2$. Следовательно, $\|\dot x(\tau_{\eta+1})\| > \delta/2$ и $\|\dot x(\tau_{\eta+1})\| \leqslant \|\dot x(0)\| - \Delta\alpha(\eta+1)/2$, т.е. получаем противоречие.

Оценим $\tau_\eta$:

$$ \begin{equation*} \tau_\eta=\eta\Delta \leqslant \frac{2\|\dot x(0)\|\Delta}{\Delta\alpha}=\frac{2\|\dot x(0)\|}{\alpha}. \end{equation*} \notag $$

Таким образом, если выполнено условие ${\|x(0)\| + \tau_\eta\|\dot x(0)\|} \,{<}\, \varepsilon_0$, то $\|x(t)\| \,{<}\, \varepsilon_0$ для всех $t \in [0, \tau_\eta]$.

$6^0$. Пусть $\zeta \in D_{\varepsilon_0/3}(0)$, $\dot x(\tau_q) \in D_{2\varepsilon_0 / 3}(\zeta)$, $q \geqslant 0$. Покажем, что можно привести значение функции $\dot x(\cdot)$ сколь угодно близко к точке $\zeta$ из положения $\dot x(\tau_q)$ к некоторому моменту $\overline t$.

Для выбора вектора управления преследователя в п. $4^0$ будем использовать вектор $p=\zeta - \dot x(\tau_q)$, т.е. целевая точка вместо точки $0$ изменяется на $\zeta$. В момент $\tau_{q+1}$ имеем $p=(\zeta - \dot x(\tau_{q+1}))/\|\zeta-\dot x(\tau_{q+1})\|$ и т.д. Согласно п. $4^0$ имеем включение $\dot x(t) \in D_{2\varepsilon_0 / 3}(\zeta)$, т.е. $\dot x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [t_q, \overline t]$. Аналогично п. $5^0$ получаем оценку времени

$$ \begin{equation*} \overline t - t_q \leqslant \frac{2\|\zeta - \dot x(\tau_q)\|}{\alpha}. \end{equation*} \notag $$

$7^0$. В данном пункте построим продолжение стратегии из п. $5^0$, приводящее функцию $x(\cdot)$ за конечное время в любую наперед заданную окрестность нуля.

Пусть выполнена процедура из п. $5^0$, т.е. $\|\dot x(\tau_\eta)\| \leqslant \delta$. Обозначим $\varphi=-x(\tau_\eta)/\|x(\tau_\eta)\|$. Здесь и далее будем брать такое $\delta \leqslant \varepsilon_0/3$, что $\varepsilon_0/(3\delta)=\mu \in \mathbb N$. Кроме того, предполагаем, что $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$. Далее в доказательстве получим условия, гарантирующие выполнения этого неравенства.

Далее, считая начальным положением $\dot x(\tau_\eta)$, в соответствии с п. $6^0$ можем привести функцию $\dot x(\cdot)$ в шар $D_{\delta}(\delta\varphi)$ за время $\Delta_1 \,{\leqslant}\, 4\delta / \alpha$, т.е. к моменту $\tau_\eta\,{+}\, \Delta_1$.

Затем, считая начальным положением $\dot x(\tau_\eta + \Delta_1)$, приводим функцию $\dot x(\cdot)$ в шар $D_{\delta}(2\delta\varphi)$ за время $\Delta_2 \leqslant 4\delta / \alpha$, т.е. к моменту $\tau_\eta + \Delta_1 + \Delta_2$.

Продолжаем данную процедуру до попадания функции $\dot x(\cdot)$ в шар $D_{\delta}(\mu\delta\varphi)=D_{\delta}(\varphi\varepsilon_0/3)$. Это произойдет к моменту $\tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Здесь $\Delta_i \leqslant 4\delta / \alpha$, $i=1, \dots, \mu$. После этого в качестве целевой до окончания игры выбираем точку $\varphi\varepsilon_0/3$. Таким образом, в силу п. $4^0$ $\dot x(t) \in D_{\delta}(\varphi\varepsilon_0/3)$, $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.

Представим $\dot x(t)=\beta(t)\varphi + \psi(t)$, где $\beta(t)=i\delta$ при $t \in \bigl[\tau_\eta + \sum_{j=1}^{i - 1}{\Delta_j}, \tau_\eta + \sum_{j=1}^{i}{\Delta_j}\bigr)$, $i=1, \dots, \mu$, и $\beta(t)=\varepsilon_0/3$ при $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Отметим, что $\|\psi(t)\| \leqslant 2\delta$, $\tau_\eta \leqslant t \leqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$, и $\|\psi(t)\| \leqslant \delta$ при $t > \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.

Таким образом, найдется и единственное $\widehat t \geqslant 0$ такое, что

$$ \begin{equation*} x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds=0. \end{equation*} \notag $$

Так как $\|x(\tau_\eta)\| \leqslant \varepsilon_0$, то $\widehat t \leqslant \Delta_1 + \dots + \Delta_\mu + 3$.

Если $\widehat t \leqslant \Delta_1$, то

$$ \begin{equation*} \begin{aligned} \, \|x(\tau_\eta + \widehat t)\| &= \biggl\|x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\psi(s)\, ds\biggr\| \\ &\leqslant \|x(\tau_\eta) + \varphi\delta\widehat t\| + 2\delta\widehat t = (\|x(\tau_\eta)\| - \delta\widehat t) + 2\delta\widehat t = 2\delta\widehat t \leqslant 2\delta\Delta_1. \end{aligned} \end{equation*} \notag $$

Если $\Delta_1 < \widehat t \leqslant \Delta_1 + \Delta_2$, то

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant (\|x(\tau_\eta)\| - \delta\Delta_1 - 2\delta(\widehat t - \Delta_1)) + 2\delta\Delta_1 + 2\delta(\widehat t - \Delta_1) = \|x(\tau_\eta)\| + \delta\Delta_1. \end{equation*} \notag $$

Если $\Delta_1 + \Delta_2 < \widehat t \leqslant \Delta_1 + \Delta_2 + \Delta_2$, то

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant \|x(\tau_\eta)\| + \delta\Delta_1 - \delta(\widehat t - \Delta_1 - \Delta_2). \end{equation*} \notag $$

И так далее.

Таким образом, так как $\Delta_1 \leqslant 4\delta / \alpha$, то для выполнения неравенства $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$, достаточно выполнения следующего неравенства:

$$ \begin{equation*} \|x(\tau_\eta)\| + \frac{4\delta^2}{\alpha} \leqslant \varepsilon_0. \end{equation*} \notag $$

Оценим норму $\|x(\tau_\eta + \widehat t)\|$:

$$ \begin{equation*} \|x(\tau_\eta + \widehat t)\| \leqslant 2\delta\sum_{i=1}^{\mu}{\Delta_i} + \delta\biggl(\widehat t - \sum_{i=1}^{\mu}{\Delta_i}\biggr) \leqslant 2\delta\cdot\frac{4\delta\mu}{\alpha} + 3\delta = \delta\biggl( \frac{8\varepsilon_0}{3\alpha} + 3 \biggr ). \end{equation*} \notag $$

Следовательно, так как мы можем выбирать сколь угодно малое $\delta$, то можем привести траекторию $x(\cdot)$ сколь угодно близко к нулю за время

$$ \begin{equation*} \tau_\eta + \widehat t \leqslant \frac{2\|\dot x(0)\|}{\alpha} + \Delta_1 + \dots + \Delta_\mu + 3 \leqslant \frac{2\varepsilon_0}{\alpha} + \frac{4\varepsilon_0}{3\alpha} + 3 = \frac{10\varepsilon_0}{3\alpha} + 3=T. \end{equation*} \notag $$

В силу п. $5^0$, если $\|x(0)\| + \tau_\eta\|\dot x(0)\|< \varepsilon_0$, то $\|x(t)\| < \varepsilon_0$ для всех $t \in [0, \tau_\eta]$. Так как $\tau_\eta \leqslant 2\|\dot x(0)\|/\alpha \leqslant 2\varepsilon_0/\alpha$, то получаем искомое $\theta=\max\{2\varepsilon_0/\alpha, 1\}$.

Теорема 4 доказана.

Введем вспомогательную управляемую систему

$$ \begin{equation} \ddot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0, \quad \dot y(0)=\dot x_0, \end{equation} \tag{3.2} $$

где $w, y \in \mathbb R^k$. Допустимыми управлением системы (3.2) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$.

Пусть $\varepsilon_0$ и $\theta$ те же, что и в теореме 4.

Справедлива следующая теорема.

Теорема 5. Пусть $f(0, 0, u_1), \dots, f(0, 0, u_m)$ образуют положительный базис, $-g(0, 0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$, заданы $x_0, \dot x_0 \in \mathbb R^k$, $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, $T > 0$. Тогда существует $\rho > 0$ такое, что для любого произвольного допустимого управления $w(\cdot)$ системы (3.2), удовлетворяющего условиям $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, и для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ справедливы неравенства $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$.

Доказательство. В доказательстве теоремы 4 поимка осуществляется путем управления положением функции скорости $\dot x(\cdot)$. Вследствие доказательства теоремы 4 (см. п. $6^0$), если $b_0, b_1 \in O_{\widehat\varepsilon_0}(0)$ и $b_0 \in D_{\widehat r}(b_1) \subset D_{\varepsilon_0}(0)$ для некоторого $\widehat r > 0$, то функцию $\dot x(\cdot)$ из начальной точки $b_0$ за конечное время $2\|b_1 - b_0\|/\alpha$ можно привести в любую окрестность точки $b_1$ при любых действиях убегающего при условии $\|x(t)\| \leqslant \varepsilon_0$, $t \in [0, 2\|b_1 - b_0\|/\alpha]$. Здесь $\alpha$ соответствует п. $2^0$ доказательства теоремы 4.

$$ \begin{equation*} \begin{aligned} \, \|y(t)\| &\leqslant \|y(0)\| + t\|\dot y(0)\| < \|y(0)\| + \frac{\|\dot y(0)\|\varepsilon_0}{\rho} \\ &= \|y(0)\| + \frac{2\|\dot y(0)\|\varepsilon_0}{\alpha} \leqslant \|x_0\| + \theta\|\dot x_0\| < \varepsilon_0. \end{aligned} \end{equation*} \notag $$

При $t > \|\dot y(0)\|/\rho$ справедливо равенство $\|y(t)\|=\|y(\|\dot y(0)\|/\rho)\|$.

Зафиксируем $\delta > 0$. Так как функции $y(t)$, $\dot y(t)$, $t \in [0, T]$, являются непрерывными, $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, то получаем следующие неравенства:

$$ \begin{equation} \begin{aligned} \, \max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_1 > 0, \\ \max\{r \geqslant 0 \, | \, \dot y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_2 > 0. \end{aligned} \end{equation} \tag{3.3} $$

Положим $\delta_3=\delta_1 / T$, $\delta_4=\delta / T$. Отсюда, если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_3$, получаем $\|x(t) - y(t)\| \leqslant \delta_1$, т.е. $x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [0, T]$. Если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_4$, то $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Пусть $q$ – произвольное натуральное число такое, что

$$ \begin{equation} \frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1, \delta_2, \delta_3, \delta_4\}}{4}. \end{equation} \tag{3.4} $$

Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.

Далее, аналогично доказательству теоремы 2 строится стратегия приведения значения функции скорости $\dot x(\cdot)$ в окрестность точки $\dot y(t)$, т.е. из точки $x(t_0)$ в $D_{\widehat\varepsilon}(y(t_1))$, из $x(t_1)$ в $D_{2\widehat\varepsilon}(y(t_2))$ и т.д. В силу (3.3) и (3.4) для всех $t \in [0, T]$ справедливы следующие включения: $\|x(t) - y(t)\| \leqslant \delta$, $\|\dot x(t) - \dot y(t)\| \leqslant \delta$, $x(t) \in D_{\varepsilon_0}(0)$, $\dot x(t) \in D_{\varepsilon_0}(0)$.

Теорема 5 доказана.

Определение 6. В игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнены неравенства $\|x(\tau)\| < \widehat\varepsilon$ и $\|\dot x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$.

Справедливо следующее следствие.

Следствие. Пусть выполнены условия теоремы 5 и $\|x_0\|+\theta\|\dot x_0\|<\varepsilon_0$. Тогда в игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка.

Доказательство. В доказательстве теоремы 5 достаточно дополнительно ограничить управление $w(\cdot)$ вспомогательной системы (3.2): $y(T)=0$ и $\dot y(T)= 0$. Всегда существует такое $T \geqslant 0$ и управление вспомогательной системы. Обозначим $t_1=\|\dot y(0)\|/\rho$, $t_2=t_1 + \sqrt{\|y(t_1)/\rho\|}$, $t_3=t_2 + \sqrt{\|y(t_1)/\rho\|}$. Определим управление следующим образом:

$$ \begin{equation*} \begin{aligned} \, w(t)&=\frac{-\rho\dot y(0)}{\|\dot y(0)\|} \quad \text{при }\ t \in [0, t_1), \\ w(t)&=\frac{-\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_1, t_2), \\ w(t)&=\frac{\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_2, t_3]. \end{aligned} \end{equation*} \notag $$

Тогда

$$ \begin{equation*} \begin{aligned} \, y(t_3) &=y(t_1) + (t_3 - t_1)\dot y(t_1) + \int_{t_1}^{t_3}\dot y(s) \, ds \\ &= y(t_1) + \int_{t_1}^{t_2}\frac{-s\rho y(t_1)}{\|\dot y(0)\|} \, ds + \int_{t_2}^{t_3}\biggl(\frac{-y(t_1)}{2} + \frac{s\rho y(t_1)}{\|\dot y(0)\|}\biggr) \, ds \\ &= y(t_1) - \frac{y(t_1)}{2} - \frac{y(t_1)}{2}=0. \end{aligned} \end{equation*} \notag $$

Следствие доказано.

§ 4. Заключение

Рассмотрены две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика в первой задаче описывается системой вида $\dot x=f(x, u) + g(x, v)$. Показано, что если решение вспомогательной системы $\dot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Динамика во второй задаче описывается системой вида $\ddot x=f(x, \dot x, u) + g(x, \dot x, v)$. Показано, что если решение вспомогательной системы $\ddot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.



Список литературы

1.	Р. Айзекс, Дифференциальные игры, Мир, М., 1967, 479 с. ; пер. с англ.: R. Isaacs, Differential games. A mathematical theory with applications to warfare and pursuit, control and optimization, John Wiley & Sons, Inc, New York–London–Sydney, 1965, xvii+384 с.
2.	A. Blaquiere, F. Gerard, G. Leitmann, Quantitative and qualitative differential games, Math. Sci. Eng., 58, Academic Press, New York–London, 1969, xi+172 pp.
3.	Н. Н. Красовский, Игровые задачи о встрече движений, Наука, М., 1970, 420 с.
4.	A. Friedman, Differential games, Pure Appl. Math., XXV, Wiley-Interscience [A division of John Wiley & Sons, Inc.], New York–London, 1971, xii+350 pp.
5.	O. Hajek, Pursuit games. An introduction to the theory and applications of differential games of pursuit and evasion, Math. Sci. Eng., 120, Academic Press, Inc. [Harcourt Brace Jovanovich, Publishers], New York–London, 1975, xii+266 pp.
6.	G. Leitmann, Cooperative and non-cooperative many players differential games, Internat. Centre for Mech. Sci. (CISM) Courses and Lectures, 190, Springer-Verlag, Vienna, 1974, 77 pp.
7.	Н. Н. Красовский, А. И. Субботин, Позиционные дифференциальные игры, Наука, М., 1974, 456 с. ; англ. пер.: N. N. Krasovskii, A. I. Subbotin, Game-theoretical control problems, Springer Ser. Soviet Math., Springer-Verlag, New York, 1988, xii+517 с.
8.	П. Е. Двуреченский, Г. Е. Иванов, “Алгоритмы вычисления операторов Минковского и их применение в дифференциальных играх”, Ж. вычисл. матем. и матем. физ., 54:2 (2014), 224–255 ; англ. пер.: P. E. Dvurechensky, G. E. Ivanov, “Algorithms for computing Minkowski operators and their application in differential games”, Comput. Math. Math. Phys., 54:2 (2014), 235–264
9.	В. Н. Ушаков, А. А. Ершов, “K решению задач управления с фиксированным моментом окончания”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 26:4 (2016), 543–564
10.	М. С. Никольский, “Одна нелинейная задача преследования”, Кибернетика, 1973, № 2, 92–94
11.	Б. Н. Пшеничный, Н. Б. Шишкина, “Достаточные условия конечности времени преследования”, ПММ, 49:4 (1985), 517–523 ; англ. пер.: B. N. Pshenichnyi, N. B. Shishkina, “Sufficient conditions of finiteness of the pursuit time”, J. Appl. Math. Mech., 49:4 (1985), 399–404
12.	Н. Сатимов, “К задаче преследования в нелинейных дифференциальных играх”, Кибернетика, 1973, № 3, 88–93
13.	P. Soravia, “$\mathscr{H}_\infty$ control of nonlinear systems: differential games and viscosity solutions”, SIAM J. Control Optim., 34:3 (1996), 1071–1097
14.	T. Natarajan, D. A. Pierre, G. Naadimuthu, E. S. Lee, “Piecewise suboptimal control laws for differential games”, J. Math. Anal. Appl., 104:1 (1984), 189–211
15.	А. А. Азамов, “Об одном классе нелинейных дифференциальных игр”, Матем. заметки, 30:4 (1981), 619–625 ; англ. пер.: A. A. Azamov, “A class of nonlinear differential games”, Math. Notes, 30:4 (1981), 805–808
16.	Н. Н. Петров, “Об управляемости автономных систем”, Дифференц. уравнения, 4:4 (1968), 606–617 ; англ. пер.: N. N. Petrov, “Controllability of autonomous systems”, Differ. Equ., 4 (1972), 311–317
17.	Н. Н. Петров, “Локальная управляемость автономных систем”, Дифференц. уравнения, 4:7 (1968), 1218–1232 ; англ. пер.: N. N. Petrov, “Local controllability of autonomous systems”, Differ. Equ., 4 (1972), 632–639
18.	Н. Н. Петров, “Плоские задачи теории управляемости”, Вестн. ЛГУ, 1969, № 13, 69–78
19.	А. Я. Нарманов, Н. Н. Петров, “Нелокальные проблемы теории оптимальных процессов. I”, Дифференц. уравнения, 21:4 (1985), 605–614 ; англ. пер.: A. Ya. Narmanov, N. N. Petrov, “Nonlocal problems in the theory of optimal processes. I”, Differ. Equ., 21 (1985), 398–406
20.	А. Я. Нарманов, “О стабильности вполне управляемых систем”, Дифференц. уравнения, 36:10 (2000), 1336–1344 ; англ. пер.: A. Ya. Narmanov, “Stability of completely controllable systems”, Differ. Equ., 36:10 (2000), 1475–1483
21.	А. Я. Нарманов, “О стабильности вполне управляемых систем”, Матем. тр., 4:1 (2001), 94–110 ; англ. пер.: A. Ya. Narmanov, “On stability of totally controlled systems”, Siberian Adv. Math., 11:4 (2001), 110–125
22.	А. С. Банников, Н. Н. Петров, “К нестационарной задаче группового преследования”, Тр. ИММ УрО РАН, 16, № 1, 2010, 40–51 ; англ. пер.: A. S. Bannikov, N. N. Petrov, “On a nonstationary problem of group pursuit”, Proc. Steklov Inst. Math. (Suppl.), 271, suppl. 1 (2010), S41–S52
23.	Н. Н. Петров, “Одна задача простого преследования с фазовыми ограничениями”, Автомат. и телемех., 1992, № 5, 22–26 ; англ. пер.: N. N. Petrov, “A certain simple pursuit problem with phase constraints”, Autom. Remote Control, 53:5 (1992), 639–642
24.	Н. Н. Петров, “Одна задача группового преследования с дробными производными и фазовыми ограничениями”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 27:1 (2017), 54–59
25.	Н. Н. Петров, Н. А. Соловьева, “Многократная поимка в рекуррентном примере Л. С. Понтрягина с фазовыми ограничениями”, Тр. ИММ УрО РАН, 21, № 2, 2015, 178–186 ; англ. пер.: N. N. Petrov, N. A. Solov'eva, “Multiple capture in Pontryagin's recurrent example with phase constraints”, Proc. Steklov Inst. Math. (Suppl.), 293, suppl. 1 (2016), 174–182
26.	М. Н. Виноградова, Н. Н. Петров, Н. А. Соловьева, “Поимка двух скоординированных убегающих в линейных рекуррентных дифференциальных играх”, Тр. ИММ УрО РАН, 19, № 1, 2013, 41–48
27.	К. А. Щелчков, “Об одной нелинейной задаче преследования с дискретным управлением и неполной информацией”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 28:1 (2018), 111–118
28.	К. А. Щелчков, “Оценка времени поимки и построение стратегии преследователя в нелинейной дифференциальной игре двух лиц”, Дифференц. уравнения, 58:2 (2022), 260–269 ; англ. пер.: K. A. Shchelchkov, “Estimate of the capture time and construction of the Pursuer's strategy in a nonlinear two-person differential game”, Differ. Equ., 58:2 (2022), 264–274
29.	K. Shchelchkov, “$\varepsilon$-capture in nonlinear differential games described by system of order two”, Dyn. Games Appl., 12:2 (2022), 662–676

Образец цитирования: К. А. Щелчков, “Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением”, Матем. сб., 214:9 (2023), 161–174; K. A. Shchelchkov, “Relative optimality in nonlinear differential games with discrete control”, Sb. Math., 214:9 (2023), 1337–1350

Цитирование в формате AMSBIB

\RBibitem{Shc23}

\by К.~А.~Щелчков

\paper Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением

\jour Матем. сб.

\yr 2023

\vol 214

\issue 9

\pages 161--174

\mathnet{http://mi.mathnet.ru/sm9851}

\crossref{https://doi.org/10.4213/sm9851}

\mathscinet{http://mathscinet.ams.org/mathscinet-getitem?mr=4705901}

\zmath{https://zbmath.org/?q=an:1537.49034}

\adsnasa{https://adsabs.harvard.edu/cgi-bin/bib_query?2023SbMat.214.1337S}

\transl

\by K.~A.~Shchelchkov

\paper Relative optimality in nonlinear differential games with discrete control

\jour Sb. Math.

\yr 2023

\vol 214

\issue 9

\pages 1337--1350

\crossref{https://doi.org/10.4213/sm9851e}

\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=001168284500005}

\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85185923867}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/sm9851

https://doi.org/10.4213/sm9851

https://www.mathnet.ru/rus/sm/v214/i9/p161

Эта публикация цитируется в следующих 1 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы