|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением
К. А. Щелчков Удмуртский государственный университет, г. Ижевск
Аннотация:
Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Управление осуществляется посредством кусочно постоянного управления, множество значений которого является конечным. Целью управления является движение сколь угодно близко к конечной траектории, описываемой вспомогательной системой управления простого вида, при любых действиях помехи. В обеих задачах получены фазовые ограничения на вспомогательную систему, в рамках которых управление вспомогательной системы может быть любым. Для любой окрестности и произвольного управления вспомогательной системы, которое удовлетворяет полученным ограничениям, в исходных задачах существуют допустимые управления, обеспечивающие в каждый момент времени нахождение фазовой точки исходной системы в указанной окрестности соответствующей фазовой точки вспомогательной системы. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.
Библиография: 29 названий.
Ключевые слова:
дифференциальная игра, нелинейная система, преследователь, убегающий.
Поступила в редакцию: 23.10.2022 и 10.05.2023
§ 1. Введение Дифференциальные игры двух лиц, рассмотренные первоначально Р. Айзексом в [1], в настоящее время представляют широкое поле для исследований (см. [2]–[7]). Были разработаны методы решения различных классов игровых задач: метод Айзекса, основанный на анализе определенного уравнения в частных производных и его характеристик, метод экстремального прицеливания Красовского, метод Понтрягина и другие. Н. Н. Красовским и представителями его научной школы создана теория позиционных игр, в основе которой лежат понятие максимального стабильного моста и правило экстремального прицеливания. Однако эффективное построение таких мостов для исследования реальных конфликтно управляемых процессов (в первую очередь нелинейных дифференциальных игр) весьма затруднительно, а иногда даже невозможно. Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления для отдельных классов игр, обладающих дополнительными свойствами. Построение приближения стабильных мостов в нелинейных дифференциальных играх, в том числе численно, рассматривается, в частности, в работах [8], [9]. Достаточные условия разрешимости задачи преследования в нелинейном примере Л. С. Понтрягина получены в [10]. В работе [11] представлены достаточные условия разрешимости задачи преследования в нелинейной дифференциальной игре при некоторых дополнительных условиях на множество значений правой части системы дифференциальных уравнений и терминальное множество. В работе [12] получены достаточные условия поимки в нелинейной игре, описываемой стационарной нелинейной системой, исследуется оптимальность времени поимки для некоторого случая на плоскости. Задача, рассматриваемая в работе [12], сравнима с представленной. Условия поимки в [12] оказываются значительно сильнее условий, полученных в настоящей работе. При этом в [12] преследователь использует контрстратегию. В работе [13] с использованием формализации дифференциальной игры рассматривается нелинейная задача управления с помехой. Получены достаточные условия существования выигрышной стратегии. В работе [14] рассматривается нелинейная дифференциальная игра двух лиц с интегральным критерием качества. Игроки используют кусочно программные управления специального вида, причем временной интервал делится на две части. Получены необходимые и достаточные условия существования седловой точки для рассматриваемой игры. В работе [15] рассматривается дифференциальная игра преследования на плоскости, динамика которой описывается нелинейной системой дифференциальных уравнений определенного вида. Целевым множеством является начало координат. Получены условия осуществления поимки посредством позиционной контрстратегии и характеристики игры в явном виде, приведены примеры. В работе [16] было введено понятие положительного базиса, которое в работах [16]–[18] эффективно использовалось для исследования свойства управляемости нелинейных систем, описываемых дифференциальными уравнениями в конечномерном евклидовом пространстве. В работах [19]–[21] свойства положительного базиса использовались для исследования управляемых систем на многообразиях. В работах [22]–[26] свойства положительного базиса были использованы для исследования задачи преследования группой преследователей одного или нескольких убегающих в линейных дифференциальных играх с равными возможностями игроков. В этих работах концепция положительного базиса используется для описания начальных положений игроков. В работах [27] и [29] рассматривалась задача поимки в нелинейной дифференциальной игре, аналогичной дифференциальной игре настоящей работы. В них получены достаточные условия на параметры игры для существования окрестности нуля, из которой происходит поимка. Ключевым было условие, что некоторый набор векторов образует положительный базис. В работе [28] получены дополнительные свойства выигрышной стратегии для задачи. Настоящая работа является продолжением исследований [27]–[29]. Рассматриваются две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй – нелинейной системой дифференциальных уравнений второго порядка. Получены условия, при которых возможно удерживать траекторию исходной системы вблизи траектории некоторой системы простого вида при любых действиях помехи.
§ 2. Система с производной первого порядка В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений
$$
\begin{equation*}
\dot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0,
\end{equation*}
\notag
$$
где $x \in \mathbb R^k$ – фазовый вектор, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f$: $\mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по $x$. Функция $g\colon \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных. То есть существуют положительные числа $L_1$, $L_2$ такие, что
$$
\begin{equation*}
\begin{gathered} \, \|f(x_1, u_i) - f(x_2, u_i)\| \leqslant L_1\|x_1 - x_2\|, \qquad x_1, x_2 \in \mathbb R^k, \quad i=1, \dots, m, \\ \|g(x_1, v_1) - g(x_2, v_2)\| \leqslant L_2\bigl(\|x_1 - x_2\| + \|v_1 - v_2\|\bigr), \qquad x_1, x_2 \in \mathbb R^k, \quad v_1, v_2 \in V. \end{gathered}
\end{equation*}
\notag
$$
Здесь и всюду далее норма считается евклидовой. Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\eta},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\eta}=T$. Определение 1. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \eta - 1$, ставящих в соответствие величинам $(\tau_r, x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$. Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$. Определение 2. В игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка, если существует ${T>0}$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления убегающего $v(\cdot)$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$. Целью преследователя является осуществление $\varepsilon$-поимки. Цель убегающего – воспрепятствовать этому. Определение 3 (см. [16]). Совокупность векторов $a_1, \dots, a_n \in \mathbb R^k$ называется положительным базисом, если для любой точки $\xi \in \mathbb R^k$ существуют числа $\mu_1, \dots, \mu_n \geqslant 0$ такие, что $\xi=\sum_{i=1}^{n}{\mu_i a_i}$. Введем следующие обозначения: $\operatorname{Int} A$ – внутренность множества $A$; $\operatorname{co} A$ – выпуклая оболочка множества $A$; $O_{\varepsilon}(x)$ – открытый шар радиуса $\varepsilon$ с центром в точке $x$; $D_{\varepsilon}(x)$ – замкнутый шар радиуса $\varepsilon$ с центром в точке $x$. Справедлива следующая теорема о поимке. Теорема 1 (см. [27]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существует $\varepsilon_0 \,{>}\, 0$ такое, что для любой точки $x_0 \in O_{\varepsilon_0}(0)$ в игре $\Gamma(x_0)$ происходит $\varepsilon$-поимка. В [28] доказано, что для любого $x_0 \in O_{\varepsilon_0}(0)$ ($\varepsilon_0$ – значение из теоремы 1) $\varepsilon$-поимка происходит за время ${\|x_0\|}/{\alpha(\|x_0\|)}$, где
$$
\begin{equation*}
\alpha(r)=\min_{x \in D_{r}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, u_i) + g(x, v), p\bigr\rangle.
\end{equation*}
\notag
$$
При этом для построения стратегии преследователя $P$ достаточно использовать разбиение с фиксированным шагом. Введем вспомогательную управляемую систему
$$
\begin{equation}
\dot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0,
\end{equation}
\tag{2.1}
$$
где $w, y \in \mathbb R^k$. Допустимым управлением системы (2.1) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$. Пусть $\varepsilon_0$ – значение из теоремы 1. Справедлива следующая теорема. Теорема 2. Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис,
$$
\begin{equation*}
-g(0, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\}\bigr),
\end{equation*}
\notag
$$
заданы $R \in (0, \varepsilon_0)$, $x_0 \in O_{R}(0)$, $T > 0$, $\rho \in (0, \alpha(R)]$, а $w(\cdot)$ – произвольное допустимое управление системы (2.1), для которого $\|y(t)\| < R$ для всех $t \in [0, T]$. Тогда для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v$ убегающего $E$ справедливо неравенство $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Доказательство. Согласно доказательству теоремы 1 для всех $x \in D_{R}(0)$ справедливо вложение
$$
\begin{equation*}
-g(x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, u_1), \dots, f(x, u_m)\}\bigr).
\end{equation*}
\notag
$$
Пусть $b_0, b_1 \in O_{R}(0)$ и выполнено включение $b_0 \in D_{\widehat r}(b_1) \subset D_{R}(0)$ для некоторого $\widehat r > 0$. Тогда при переносе начала координат в точку $b_1$ выполняется теорема 1, т.е. за конечное время из точки $b_0$ исходную систему можно привести сколь угодно близко к точке $b_1$ при любых допустимых действиях убегающего. При этом, согласно [28], конечное время можно взять равным $\|b_1 - b_0\| / \alpha(R)$ и шаг разбиения фиксированным. Отметим, что в таком случае если $\|x(\tau_j) - b_1\| \leqslant \varepsilon$, где $\varepsilon$ является радиусом целевой окрестности, то для всех $t \in (\tau_j, \tau_\eta]$ справедливо неравенство $\|x(t) - b_1\| < \varepsilon$.
Зафиксируем $\delta > 0$. Так как функция $y(t)$, $t \in [0, T]$, является непрерывной и $\|y(t)\| < R$ для всех $t \in [0, T]$, то справедливо следующее неравенство:
$$
\begin{equation}
\max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{R}(0), \, t \in [0, T]\} \doteq \delta_1 > 0.
\end{equation}
\tag{2.2}
$$
Пусть $q$ – произвольное натурально число такое, что
$$
\begin{equation*}
\frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1\}}{4}.
\end{equation*}
\notag
$$
Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.
На интервале $[t_0, t_1)$ считаем точку $\xi_1=y(t_1)$ целевой. Тогда существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_1) \in \xi_1 + D_{\widehat\varepsilon}(0)=y(t_1) + D_{\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_2$ ближайшую точку к $x(t_1)$ на множестве $y(t_2) + D_{\widehat\varepsilon}(0)$. Следовательно, $\|x(t_1) - \xi_2\| \leqslant \Delta\rho$. На интервале $[t_1, t_2)$ считаем точку $\xi_2$ целевой. Существует кусочно постоянная стратегия преследователя с фиксированным шагом разбиения такая, что $x(t_2) \in \xi_2 + D_{\widehat\varepsilon}(0) \subset y(t_2) + D_{2\widehat\varepsilon}(0)$. Далее, обозначим через $\xi_3$ ближайшую точку к $x(t_2)$ на множестве $y(t_2) + D_{2\widehat\varepsilon}(0)$. Аналогично, $\|x(t_2) - \xi_3\| \leqslant \Delta\rho$, $\xi_3$ – целевая точка, и мы приводим систему в $\xi_3 + D_{\widehat\varepsilon}(0) \subset y(t_3) + D_{3\widehat\varepsilon}(0)$. И так далее.
На последнем шаге получаем $x(T)=x(t_q) \in y(t_q) + D_{q\widehat\varepsilon}(0)=y(T) + D_{\widehat\delta}(0)$. Так как для всех $l=0, \dots, q-1$ справедливы включения $x(t_l) \in y(t_l) + D_{\widehat\delta}(0)$, $x(t_{l+1}) \in y(t_{l+1}) + D_{\widehat\delta}(0)$ и $\|y(t_{l+1}) - y(t_l)\| \leqslant \widehat\delta$, то в силу [27] $x(t) \in y(t_{l+1}) + D_{3\widehat\delta}(0)$. Таким образом, в силу (2.2) для каждого $l=0, \dots, q-1$ справедливы следующие неравенства:
$$
\begin{equation*}
\begin{gathered} \, \|x(t) - y(t)\| \leqslant 4\widehat\delta \leqslant \delta \quad \text{для всех }\ t \in [t_l, t_{l+1}], \\ \|x(t) - y(t)\| \leqslant \delta_1 \quad \text{для всех }\ t \in [t_l, t_{l+1}]. \end{gathered}
\end{equation*}
\notag
$$
Теорема 2 доказана.
§ 3. Система с производной второго порядка В пространстве $\mathbb R^k$, $k \geqslant 2$, рассматривается дифференциальная игра $\Gamma (x_0, \dot x_0)$ двух лиц: преследователя $P$ и убегающего $E$. Динамика игры описывается системой дифференциальных уравнений
$$
\begin{equation}
\ddot x=f(x, \dot x, u) + g(x, \dot x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)=\dot x_0,
\end{equation}
\tag{3.1}
$$
где $x \in \mathbb R^k$ – фазовая переменная, $u$ и $v$ – управляющие воздействия; $U=\{u_1, \dots, u_m\}$, $u_i \in \mathbb R^l$, $i=1, \dots, m$. Множество $V \subset \mathbb R^s$ – компакт. Функция $f\colon \mathbb R^k \times \mathbb R^k \times U \to \mathbb R^k$ для каждого $u \in U$ липшицева по совокупности переменных $x$ и $\dot x$, функция $g\colon \mathbb R^k \times \mathbb R^k \times V \to \mathbb R^k$ липшицева по совокупности переменных, т.е. существуют положительные числа $L_1$, $L_2$ такие, что
$$
\begin{equation*}
\begin{gathered} \, \|f(x_1, \dot x_1, u_i) - f(x_2, \dot x_2, u_i)\| \leqslant L_1(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad i=1, \dots, m, \\ \|g(x_1, \dot x_1, v_1) - g(x_2, \dot x_2, v_2)\| \leqslant L_2(\|x_1 - x_2\| + \|\dot x_1 - \dot x_2\| + \|v_1 - v_2\|), \\ x_1, x_2, \dot x_1, \dot x_2 \in \mathbb R^k, \qquad v_1, v_2 \in V. \end{gathered}
\end{equation*}
\notag
$$
Под разбиением $\sigma$ промежутка $[0, T]$ будем понимать конечное разбиение $\{\tau_q\}_{q=0}^{\gamma},$ где $0=\tau_0 < \tau_1 < \tau_2 < \dots < \tau_{\gamma}=T.$ Определение 4. Кусочно постоянной стратегией $W$ преследователя $P$ на промежутке $[0, T]$ называется пара $(\sigma, W_{\sigma}),$ где $\sigma$ – разбиение промежутка $[0, T]$, а $W_{\sigma}$ – семейство отображений $d_r, r=0, 1, \dots, \gamma - 1,$ ставящих в соответствие величинам $(\tau_r, x(\tau_r), \dot x(\tau_r))$ постоянное управление $\overline u_r(t) \equiv \overline u_r \in U$, $t \in [\tau_r, \tau_{r+1})$. Под управлением убегающего будем понимать произвольную измеримую функцию $v\colon [0, \infty) \to V$. Определение 5. В игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнено неравенство $\|x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$. Целью преследователя является осуществление $\varepsilon$-поимки, цель убегающего – воспрепятствовать этому. В [29] доказана теорема о поимке в данной задаче для системы вида
$$
\begin{equation*}
\ddot x=f(x, u) + g(x, v), \qquad u \in U, \quad v \in V, \quad x(0)=x_0, \quad \dot x(0)= \dot x_0.
\end{equation*}
\notag
$$
Теорема 3 (см. [29]). Пусть $f(0, u_1), \dots, f(0, u_m)$ образуют положительный базис и $-g(0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, u_1), \dots, f(0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0$, $\dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$. Подход, используемый при доказательстве данной теоремы, будет применен и для получения условий разрешимости задачи преследования с динамикой (3.1). Кроме того, по аналогии с [28] преследователю достаточно выбирать стратегии с фиксированным шагом разбиения временного интервала. Справедлива следующая теорема. Теорема 4. Пусть $f(0, 0, u_1),\dots,f(0, 0, u_m)$ образуют положительный базис и $-g(0, 0, V) \,{\subset} \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$. Тогда существуют $\varepsilon_0 \,{>}\, 0$, $\theta > 0$ и $T > 0$ такие, что для любых начальных положений $x_0, \dot x_0$ таких, что $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, в игре $\Gamma(x_0, \dot x_0)$ происходит $\varepsilon$-поимка за время $T$. Кроме того, преследователю для построения стратегии достаточно использовать разбиение временного интервала с фиксированным шагом. Доказательство. Схема доказательства и общие рассуждения аналогичны доказательству теоремы 3.
$1^0$. Покажем, что существуют $\overline\alpha > 0$, $\varepsilon_0 > 0$ такие, что для любых точек $x, \dot x \in D_{\varepsilon_0}(0)$ и вектора $p \in \mathbb R^k$, $\|p\|=1$, найдется $i \in \{1, \dots, m\}$ такое, что для любого $v \in V$ выполнено
$$
\begin{equation*}
\bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle \geqslant \overline\alpha.
\end{equation*}
\notag
$$
Данное неравенство справедливо в силу липшицевости функций $f, g$ в указанном смысле и свойств положительного базиса (см. [ 16]). То есть для некоторого $\varepsilon_0 > 0$ и для любых $x, \dot x \in D_{\varepsilon_0}(0)$ справедливо вложение
$$
\begin{equation*}
-g(x, \dot x, V) \subset \operatorname{Int} \bigl(\operatorname{co} \{f(x, \dot x, u_1), \dots, f(x, \dot x, u_m)\}\bigr).
\end{equation*}
\notag
$$
Следовательно, в силу свойств положительного базиса (см. [ 16]) векторы
$$
\begin{equation*}
\bigl\{f(x, \dot x, u_1) + g(x, \dot x, v), \dots, f(x, \dot x, u_m) + g(x, \dot x, v)\bigr\}
\end{equation*}
\notag
$$
образуют положительный базис для любого $v \in V$. Таким образом, существуют $\widehat x, \widetilde x \in D_{\varepsilon_0}(0)$, $\widehat p \in \mathbb R^k$, $\|\widehat p\|=1$, $\widehat v \in V$, $\widehat i \in \{1, \dots, m\}$ такие, что
$$
\begin{equation*}
\min_{x, \dot x \in D_{\varepsilon_0}(0)}\min_{\|p\|=1}\min_{v \in V}\max_{i=1, \dots, m}\bigl\langle f(x, \dot x, u_i) + g(x, \dot x, v), p\bigr\rangle = \bigl\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\bigr\rangle.
\end{equation*}
\notag
$$
Отсюда получаем $\overline\alpha=\langle f(\widehat x, \widetilde x, u_{\widehat i}) + g(\widehat x, \widetilde x, \widehat v), \widehat p\rangle > 0$.
$2^0$. Введем ряд обозначений. Так как функции $f$, $g$ являются липшицевыми, то достигается следующий максимум:
$$
\begin{equation*}
\max_{x, \dot x \in D_{2\varepsilon_0}(0), u \in U, v \in V}{\|f(x, \dot x, u) + g(x, \dot x, v)\|}=\overline D.
\end{equation*}
\notag
$$
Обозначим
$$
\begin{equation*}
D=\max\bigl\{\overline D, 2\varepsilon_0 \bigr\}.
\end{equation*}
\notag
$$
Определим число $h$ так:
$$
\begin{equation*}
h=\min\biggl\{\frac{\overline\alpha}{4(L_1 + L_2)}, \varepsilon_0\biggr\}.
\end{equation*}
\notag
$$
Пусть $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|= 1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ и
$$
\begin{equation*}
\max_{u \in U}\bigl\langle f(\overline x, \dot{\overline x}, u), p\bigr\rangle = \bigl\langle f(\overline x, \dot{\overline x}, \overline u), p\bigr\rangle.
\end{equation*}
\notag
$$
Отметим, что, в силу п. $1^0$ для любого $v \in V$
$$
\begin{equation*}
\bigl\langle f(\overline x, \dot{\overline x}, \overline u) + g(\overline x, \dot{\overline x}, v), p\bigr\rangle \geqslant \overline\alpha.
\end{equation*}
\notag
$$
Аналогично доказательству теоремы 3 получаем следующую оценку:
$$
\begin{equation*}
\begin{aligned} \, \bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle &\geqslant \overline\alpha - L_1(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) - L_2(\|x - \overline x\| + \|\dot x - \dot{\overline x}\|) \\ &\geqslant \overline\alpha - 2h(L_1 + L_2). \end{aligned}
\end{equation*}
\notag
$$
Отсюда следует, что для любых $\overline x, \dot{\overline x} \in D_{\varepsilon_0}(0)$, $p \in \mathbb R^k$, $\|p\|=1$, $x \in D_{h}(\overline x)$, $\dot x \in D_{h}(\dot{\overline x})$, $v \in V$ справедливо неравенство
$$
\begin{equation*}
\bigl\langle f(x, \dot x, \overline u) + g(x, \dot x, v), p\bigr\rangle \geqslant \frac{\overline\alpha}{2}=\alpha.
\end{equation*}
\notag
$$
$3^0$. В данном пункте определим размер шага разбиения временного отрезка.
Зафиксируем $0 < \delta \leqslant \varepsilon_0$. Выберем шаг разбиения
$$
\begin{equation*}
\Delta=\min\biggl\{\frac{\alpha\delta}{D^2}, \frac{h}{D}\biggr\}.
\end{equation*}
\notag
$$
Отметим, что в силу п. $2^0$, если $x(0), \dot x(0) \in D_{\varepsilon_0}(0)$, $t \in [0, \Delta]$, то для любых допустимых управлений игроков справедливы следующие неравенства:
$$
\begin{equation*}
\begin{gathered} \, \|x(t) - x(0)\| \leqslant h, \qquad \|\dot x(t) - \dot x(0)\| \leqslant h, \\ \|f(x(t), \dot x(t), u(t))+ g(x(t), \dot x(t), v(t))\| \leqslant D, \qquad \|\dot x(t)\| \leqslant D. \end{gathered}
\end{equation*}
\notag
$$
$4^0$. Произведем оценку приближения к нулю функции скорости $\dot x(\cdot)$ за один шаг разбиения.
Без ограничения общности можно рассмотреть только интервал $[0, \Delta)$. Значение управления преследователя будем выбирать следующим образом. Если $\dot x(0)=0$, то $\overline u_0 \in U$ произвольное. Если $\dot x(0) \neq 0$, то обозначим $p=-\dot x(0) / \|\dot x(0)\|$ и $\overline u_0 \in U$ выбираем из следующего равенства:
$$
\begin{equation*}
\max_{u \in U}\bigl\langle f(x(0), \dot x(0), u), p\bigr\rangle = \bigl\langle f(x(0), \dot x(0), \overline u_0), p\bigr\rangle.
\end{equation*}
\notag
$$
Таким образом, в силу пп. $2^0$ и $3^0$ для любых $t \in [0, \Delta)$, $v \in V$ справедливо следующее неравенство:
$$
\begin{equation*}
\bigl\langle f(x(t), \dot x(t), \overline u_0) + g(x(t), \dot x(t), v), p\bigr\rangle \geqslant \alpha.
\end{equation*}
\notag
$$
Пусть $t \in [0, \Delta)$. Оценим квадрат нормы скорости:
$$
\begin{equation*}
\begin{aligned} \, \|\dot x(t)\|^2 &= \biggl\| \dot x(0) + \int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &= \|\dot x(0)\|^2 + \biggl \|\int_{0}^{t}\bigl(f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s))\bigr)\, ds\biggr \|^2 \\ &\qquad+ 2\int_{0}^{t}\bigl\langle f(x(s), \dot x(s), \overline u_0) + g(x(s), \dot x(s), v(s)), \dot x(0) \bigr\rangle \, ds \\ &\leqslant \|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|. \end{aligned}
\end{equation*}
\notag
$$
Оценим последний трехчлен $A=\|\dot x(0)\|^2 + D^2t^2 - 2t\alpha\|\dot x(0)\|$.
Если $\|\dot x(0)\| \geqslant \delta$, то
$$
\begin{equation*}
\begin{aligned} \, \Delta \leqslant \frac{\alpha\delta}{D^2} &\quad\Longrightarrow\quad D^2t^2 - t\alpha\|\dot x(0)\| \leqslant t(D^2\Delta - \alpha\delta) \leqslant 0 \\ & \quad\Longrightarrow\quad A \leqslant \|\dot x(0)\|^2 - t\alpha\|\dot x(0)\| \leqslant \biggl( \|\dot x(0)\| - \frac{t\alpha}{2} \biggr)^2. \end{aligned}
\end{equation*}
\notag
$$
Если $\|\dot x(0)\| \leqslant \delta$, то трехчлен $A$ достигает своего максимума при $\|\dot x(0)\|=0$ или при $\|\dot x(0)\|=\delta$. Отметим, что в силу п. $2^0$ $D \geqslant 2\alpha$. Тогда если $\|\dot x(0)\|=0$, то
$$
\begin{equation*}
A=D^2t^2 \leqslant D^2\Delta^2 \leqslant \frac{\alpha^2\delta^2}{D^2} \leqslant \frac{\delta^2}{4}.
\end{equation*}
\notag
$$
Если $\|\dot x(0)\|=\delta$, то
$$
\begin{equation*}
A=\delta^2 + D^2t^2 - 2t\alpha\delta \leqslant \delta^2 + t(D^2\Delta - 2\alpha\delta) \leqslant \delta^2.
\end{equation*}
\notag
$$
Таким образом, если $\|\dot x(0)\| \geqslant \delta$, то $\|\dot x(\Delta)\| \leqslant \|\dot x(0)\| -{\Delta\alpha}/{2}$.
Если $\|\dot x(0)\| < \delta$, то $\|\dot x(t)\| \leqslant \delta$ для всех $t \in [0, \Delta]$.
$5^0$. В данном пункте построим стратегию для приведения функции $\dot x(\cdot)$ в $D_{\delta}(0)$ и оценим время.
На каждом интервале $[\tau_i, \tau_{i+1})$, $i=0, \dots, \eta - 1$, будем выбирать управление преследователя в соответствии с п. $4^0$, где вместо векторов $x(0)$, $\dot x(0)$ используем $x(\tau_i)$, $\dot x(\tau_i)$ соответственно. Выберем такое неотрицательное целое $\eta$, что
$$
\begin{equation*}
\frac{\Delta\alpha\eta}{2} < \|\dot x(0)\| \leqslant \frac{\Delta\alpha(\eta+1)}{2},
\end{equation*}
\notag
$$
т.е.
$$
\begin{equation*}
\eta=\biggl[\frac{2\|\dot x(0)\|}{\Delta\alpha}\biggr].
\end{equation*}
\notag
$$
Следовательно, в силу оценок из п. $4^0$ $\|\dot x(\tau_\eta)\| \leqslant \delta$. Действительно, если $\|\dot x(\tau_\eta)\| > \delta$, то в силу оценок из п. $4^0$ для каждого $i=0, \dots, \eta - 1$ справедливо неравенство $\|\dot x(\tau_i)\| > \delta$. При этом $D\Delta \leqslant \delta/2$. Следовательно, $\|\dot x(\tau_{\eta+1})\| > \delta/2$ и $\|\dot x(\tau_{\eta+1})\| \leqslant \|\dot x(0)\| - \Delta\alpha(\eta+1)/2$, т.е. получаем противоречие.
Оценим $\tau_\eta$:
$$
\begin{equation*}
\tau_\eta=\eta\Delta \leqslant \frac{2\|\dot x(0)\|\Delta}{\Delta\alpha}=\frac{2\|\dot x(0)\|}{\alpha}.
\end{equation*}
\notag
$$
Таким образом, если выполнено условие ${\|x(0)\| + \tau_\eta\|\dot x(0)\|} \,{<}\, \varepsilon_0$, то $\|x(t)\| \,{<}\, \varepsilon_0$ для всех $t \in [0, \tau_\eta]$.
$6^0$. Пусть $\zeta \in D_{\varepsilon_0/3}(0)$, $\dot x(\tau_q) \in D_{2\varepsilon_0 / 3}(\zeta)$, $q \geqslant 0$. Покажем, что можно привести значение функции $\dot x(\cdot)$ сколь угодно близко к точке $\zeta$ из положения $\dot x(\tau_q)$ к некоторому моменту $\overline t$.
Для выбора вектора управления преследователя в п. $4^0$ будем использовать вектор $p=\zeta - \dot x(\tau_q)$, т.е. целевая точка вместо точки $0$ изменяется на $\zeta$. В момент $\tau_{q+1}$ имеем $p=(\zeta - \dot x(\tau_{q+1}))/\|\zeta-\dot x(\tau_{q+1})\|$ и т.д. Согласно п. $4^0$ имеем включение $\dot x(t) \in D_{2\varepsilon_0 / 3}(\zeta)$, т.е. $\dot x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [t_q, \overline t]$. Аналогично п. $5^0$ получаем оценку времени
$$
\begin{equation*}
\overline t - t_q \leqslant \frac{2\|\zeta - \dot x(\tau_q)\|}{\alpha}.
\end{equation*}
\notag
$$
$7^0$. В данном пункте построим продолжение стратегии из п. $5^0$, приводящее функцию $x(\cdot)$ за конечное время в любую наперед заданную окрестность нуля.
Пусть выполнена процедура из п. $5^0$, т.е. $\|\dot x(\tau_\eta)\| \leqslant \delta$. Обозначим $\varphi=-x(\tau_\eta)/\|x(\tau_\eta)\|$. Здесь и далее будем брать такое $\delta \leqslant \varepsilon_0/3$, что $\varepsilon_0/(3\delta)=\mu \in \mathbb N$. Кроме того, предполагаем, что $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$. Далее в доказательстве получим условия, гарантирующие выполнения этого неравенства.
Далее, считая начальным положением $\dot x(\tau_\eta)$, в соответствии с п. $6^0$ можем привести функцию $\dot x(\cdot)$ в шар $D_{\delta}(\delta\varphi)$ за время $\Delta_1 \,{\leqslant}\, 4\delta / \alpha$, т.е. к моменту $\tau_\eta\,{+}\, \Delta_1$.
Затем, считая начальным положением $\dot x(\tau_\eta + \Delta_1)$, приводим функцию $\dot x(\cdot)$ в шар $D_{\delta}(2\delta\varphi)$ за время $\Delta_2 \leqslant 4\delta / \alpha$, т.е. к моменту $\tau_\eta + \Delta_1 + \Delta_2$.
Продолжаем данную процедуру до попадания функции $\dot x(\cdot)$ в шар $D_{\delta}(\mu\delta\varphi)=D_{\delta}(\varphi\varepsilon_0/3)$. Это произойдет к моменту $\tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Здесь $\Delta_i \leqslant 4\delta / \alpha$, $i=1, \dots, \mu$. После этого в качестве целевой до окончания игры выбираем точку $\varphi\varepsilon_0/3$. Таким образом, в силу п. $4^0$ $\dot x(t) \in D_{\delta}(\varphi\varepsilon_0/3)$, $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.
Представим $\dot x(t)=\beta(t)\varphi + \psi(t)$, где $\beta(t)=i\delta$ при $t \in \bigl[\tau_\eta + \sum_{j=1}^{i - 1}{\Delta_j}, \tau_\eta + \sum_{j=1}^{i}{\Delta_j}\bigr)$, $i=1, \dots, \mu$, и $\beta(t)=\varepsilon_0/3$ при $t \geqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$. Отметим, что $\|\psi(t)\| \leqslant 2\delta$, $\tau_\eta \leqslant t \leqslant \tau_\eta + \Delta_1 + \dots + \Delta_\mu$, и $\|\psi(t)\| \leqslant \delta$ при $t > \tau_\eta + \Delta_1 + \dots + \Delta_\mu$.
Таким образом, найдется и единственное $\widehat t \geqslant 0$ такое, что
$$
\begin{equation*}
x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds=0.
\end{equation*}
\notag
$$
Так как $\|x(\tau_\eta)\| \leqslant \varepsilon_0$, то $\widehat t \leqslant \Delta_1 + \dots + \Delta_\mu + 3$.
Если $\widehat t \leqslant \Delta_1$, то
$$
\begin{equation*}
\begin{aligned} \, \|x(\tau_\eta + \widehat t)\| &= \biggl\|x(\tau_\eta) + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\beta(t)\varphi\, ds + \int_{\tau_\eta}^{\tau_\eta + \widehat t}\psi(s)\, ds\biggr\| \\ &\leqslant \|x(\tau_\eta) + \varphi\delta\widehat t\| + 2\delta\widehat t = (\|x(\tau_\eta)\| - \delta\widehat t) + 2\delta\widehat t = 2\delta\widehat t \leqslant 2\delta\Delta_1. \end{aligned}
\end{equation*}
\notag
$$
Если $\Delta_1 < \widehat t \leqslant \Delta_1 + \Delta_2$, то
$$
\begin{equation*}
\|x(\tau_\eta + \widehat t)\| \leqslant (\|x(\tau_\eta)\| - \delta\Delta_1 - 2\delta(\widehat t - \Delta_1)) + 2\delta\Delta_1 + 2\delta(\widehat t - \Delta_1) = \|x(\tau_\eta)\| + \delta\Delta_1.
\end{equation*}
\notag
$$
Если $\Delta_1 + \Delta_2 < \widehat t \leqslant \Delta_1 + \Delta_2 + \Delta_2$, то
$$
\begin{equation*}
\|x(\tau_\eta + \widehat t)\| \leqslant \|x(\tau_\eta)\| + \delta\Delta_1 - \delta(\widehat t - \Delta_1 - \Delta_2).
\end{equation*}
\notag
$$
И так далее.
Таким образом, так как $\Delta_1 \leqslant 4\delta / \alpha$, то для выполнения неравенства $\|x(t)\| \leqslant \varepsilon_0$, $t > \tau_\eta$, достаточно выполнения следующего неравенства:
$$
\begin{equation*}
\|x(\tau_\eta)\| + \frac{4\delta^2}{\alpha} \leqslant \varepsilon_0.
\end{equation*}
\notag
$$
Оценим норму $\|x(\tau_\eta + \widehat t)\|$:
$$
\begin{equation*}
\|x(\tau_\eta + \widehat t)\| \leqslant 2\delta\sum_{i=1}^{\mu}{\Delta_i} + \delta\biggl(\widehat t - \sum_{i=1}^{\mu}{\Delta_i}\biggr) \leqslant 2\delta\cdot\frac{4\delta\mu}{\alpha} + 3\delta = \delta\biggl( \frac{8\varepsilon_0}{3\alpha} + 3 \biggr ).
\end{equation*}
\notag
$$
Следовательно, так как мы можем выбирать сколь угодно малое $\delta$, то можем привести траекторию $x(\cdot)$ сколь угодно близко к нулю за время
$$
\begin{equation*}
\tau_\eta + \widehat t \leqslant \frac{2\|\dot x(0)\|}{\alpha} + \Delta_1 + \dots + \Delta_\mu + 3 \leqslant \frac{2\varepsilon_0}{\alpha} + \frac{4\varepsilon_0}{3\alpha} + 3 = \frac{10\varepsilon_0}{3\alpha} + 3=T.
\end{equation*}
\notag
$$
В силу п. $5^0$, если $\|x(0)\| + \tau_\eta\|\dot x(0)\|< \varepsilon_0$, то $\|x(t)\| < \varepsilon_0$ для всех $t \in [0, \tau_\eta]$. Так как $\tau_\eta \leqslant 2\|\dot x(0)\|/\alpha \leqslant 2\varepsilon_0/\alpha$, то получаем искомое $\theta=\max\{2\varepsilon_0/\alpha, 1\}$.
Теорема 4 доказана. Введем вспомогательную управляемую систему
$$
\begin{equation}
\ddot y=w, \qquad \|w\| \leqslant \rho, \quad y(0)=x_0, \quad \dot y(0)=\dot x_0,
\end{equation}
\tag{3.2}
$$
где $w, y \in \mathbb R^k$. Допустимыми управлением системы (3.2) считаем измеримые функции $w(t)$, $\|w(t)\| \leqslant \rho$, $t \geqslant 0$. Пусть $\varepsilon_0$ и $\theta$ те же, что и в теореме 4. Справедлива следующая теорема. Теорема 5. Пусть $f(0, 0, u_1), \dots, f(0, 0, u_m)$ образуют положительный базис, $-g(0, 0, V) \subset \operatorname{Int} (\operatorname{co} \{f(0, 0, u_1), \dots, f(0, 0, u_m)\})$, заданы $x_0, \dot x_0 \in \mathbb R^k$, $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, $T > 0$. Тогда существует $\rho > 0$ такое, что для любого произвольного допустимого управления $w(\cdot)$ системы (3.2), удовлетворяющего условиям $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, и для любого $\delta > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ справедливы неравенства $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Доказательство. В доказательстве теоремы 4 поимка осуществляется путем управления положением функции скорости $\dot x(\cdot)$. Вследствие доказательства теоремы 4 (см. п. $6^0$), если $b_0, b_1 \in O_{\widehat\varepsilon_0}(0)$ и $b_0 \in D_{\widehat r}(b_1) \subset D_{\varepsilon_0}(0)$ для некоторого $\widehat r > 0$, то функцию $\dot x(\cdot)$ из начальной точки $b_0$ за конечное время $2\|b_1 - b_0\|/\alpha$ можно привести в любую окрестность точки $b_1$ при любых действиях убегающего при условии $\|x(t)\| \leqslant \varepsilon_0$, $t \in [0, 2\|b_1 - b_0\|/\alpha]$. Здесь $\alpha$ соответствует п. $2^0$ доказательства теоремы 4.
Положим $\rho=\alpha / 2$. Тогда согласно определению $\theta$ в п. $7^0$ доказательства теоремы 4 для любых начальных положений, удовлетворяющих условию $\|x_0\| + \theta\|\dot x_0\| < \varepsilon_0$, и произвольного $T > 0$ найдется управление $w(\cdot)$ системы (3.2) такое, что $\|y(t)\| < \varepsilon_0$, $\|\dot y(t)\| < \varepsilon_0$ и $\|w(t)\| \leqslant \rho$ для всех $t \in [0, T]$. Действительно, можем выбрать $w(t)=-\rho\dot y(0)/\|\dot y(0)\|$ при $t \in [0, \|\dot y(0)\|/\rho)$ и $w(t) \equiv 0$ при $t \geqslant \|\dot y(0)\|/\rho$. Тогда при $t \in [0, \|\dot y(0)\|/\rho]$ справедливо следующее неравенство:
$$
\begin{equation*}
\begin{aligned} \, \|y(t)\| &\leqslant \|y(0)\| + t\|\dot y(0)\| < \|y(0)\| + \frac{\|\dot y(0)\|\varepsilon_0}{\rho} \\ &= \|y(0)\| + \frac{2\|\dot y(0)\|\varepsilon_0}{\alpha} \leqslant \|x_0\| + \theta\|\dot x_0\| < \varepsilon_0. \end{aligned}
\end{equation*}
\notag
$$
При $t > \|\dot y(0)\|/\rho$ справедливо равенство $\|y(t)\|=\|y(\|\dot y(0)\|/\rho)\|$.
Зафиксируем $\delta > 0$. Так как функции $y(t)$, $\dot y(t)$, $t \in [0, T]$, являются непрерывными, $\|y(t)\| < \varepsilon_0$ и $\|\dot y(t)\| < \varepsilon_0$ для всех $t \in [0, T]$, то получаем следующие неравенства:
$$
\begin{equation}
\begin{aligned} \, \max\{r \geqslant 0 \, | \, y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_1 > 0, \\ \max\{r \geqslant 0 \, | \, \dot y(t) + D_{r}(0) \subset D_{\varepsilon_0}(0), \, t \in [0, T]\} \doteq \delta_2 > 0. \end{aligned}
\end{equation}
\tag{3.3}
$$
Положим $\delta_3=\delta_1 / T$, $\delta_4=\delta / T$. Отсюда, если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_3$, получаем $\|x(t) - y(t)\| \leqslant \delta_1$, т.е. $x(t) \in D_{\varepsilon_0}(0)$ для всех $t \in [0, T]$. Если $\|\dot x(t) - \dot y(t)\| \leqslant \delta_4$, то $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Пусть $q$ – произвольное натуральное число такое, что
$$
\begin{equation}
\frac{\rho T}{q} \leqslant \frac{\min\{\delta, \delta_1, \delta_2, \delta_3, \delta_4\}}{4}.
\end{equation}
\tag{3.4}
$$
Обозначим $\widehat\delta=\rho T/q$, $\Delta=T/q$, $\widehat\varepsilon=\widehat\delta / q$, $t_0=0$, $t_1=\Delta$, $t_2=2\Delta, \dots, t_q=q\Delta=T$.
Далее, аналогично доказательству теоремы 2 строится стратегия приведения значения функции скорости $\dot x(\cdot)$ в окрестность точки $\dot y(t)$, т.е. из точки $x(t_0)$ в $D_{\widehat\varepsilon}(y(t_1))$, из $x(t_1)$ в $D_{2\widehat\varepsilon}(y(t_2))$ и т.д. В силу (3.3) и (3.4) для всех $t \in [0, T]$ справедливы следующие включения: $\|x(t) - y(t)\| \leqslant \delta$, $\|\dot x(t) - \dot y(t)\| \leqslant \delta$, $x(t) \in D_{\varepsilon_0}(0)$, $\dot x(t) \in D_{\varepsilon_0}(0)$.
Теорема 5 доказана. Определение 6. В игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка, если существует $T > 0$ такое, что для любого $\widehat\varepsilon > 0$ существует кусочно постоянная стратегия $W$ преследователя $P$ на промежутке $[0, T]$ такая, что для любого допустимого управления $v(\cdot)$ убегающего $E$ выполнены неравенства $\|x(\tau)\| < \widehat\varepsilon$ и $\|\dot x(\tau)\| < \widehat\varepsilon$ для некоторого $\tau \in [0, T]$. Справедливо следующее следствие. Следствие. Пусть выполнены условия теоремы 5 и $\|x_0\|+\theta\|\dot x_0\|<\varepsilon_0$. Тогда в игре $\Gamma(x_0, \dot x_0)$ происходит мягкая $\varepsilon$-поимка. Доказательство. В доказательстве теоремы 5 достаточно дополнительно ограничить управление $w(\cdot)$ вспомогательной системы (3.2): $y(T)=0$ и $\dot y(T)= 0$. Всегда существует такое $T \geqslant 0$ и управление вспомогательной системы. Обозначим $t_1=\|\dot y(0)\|/\rho$, $t_2=t_1 + \sqrt{\|y(t_1)/\rho\|}$, $t_3=t_2 + \sqrt{\|y(t_1)/\rho\|}$. Определим управление следующим образом:
$$
\begin{equation*}
\begin{aligned} \, w(t)&=\frac{-\rho\dot y(0)}{\|\dot y(0)\|} \quad \text{при }\ t \in [0, t_1), \\ w(t)&=\frac{-\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_1, t_2), \\ w(t)&=\frac{\rho y(t_1)}{\|y(t_1)\|} \quad \text{при }\ t \in [t_2, t_3]. \end{aligned}
\end{equation*}
\notag
$$
Тогда
$$
\begin{equation*}
\begin{aligned} \, y(t_3) &=y(t_1) + (t_3 - t_1)\dot y(t_1) + \int_{t_1}^{t_3}\dot y(s) \, ds \\ &= y(t_1) + \int_{t_1}^{t_2}\frac{-s\rho y(t_1)}{\|\dot y(0)\|} \, ds + \int_{t_2}^{t_3}\biggl(\frac{-y(t_1)}{2} + \frac{s\rho y(t_1)}{\|\dot y(0)\|}\biggr) \, ds \\ &= y(t_1) - \frac{y(t_1)}{2} - \frac{y(t_1)}{2}=0. \end{aligned}
\end{equation*}
\notag
$$
Следствие доказано.
§ 4. Заключение Рассмотрены две задачи управления с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика в первой задаче описывается системой вида $\dot x=f(x, u) + g(x, v)$. Показано, что если решение вспомогательной системы $\dot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Динамика во второй задаче описывается системой вида $\ddot x=f(x, \dot x, u) + g(x, \dot x, v)$. Показано, что если решение вспомогательной системы $\ddot y=w$, $\|w\| \leqslant \rho$, ограничено некоторым образом, то для любого $\delta > 0$ существует такая допустимая стратегия игрока, что при любых действиях помехи $\|x(t) - y(t)\| \leqslant \delta$ и $\|\dot x(t) - \dot y(t)\| \leqslant \delta$ для всех $t \in [0, T]$. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы при любых действиях помехи.
|
|
|
Список литературы
|
|
|
1. |
Р. Айзекс, Дифференциальные игры, Мир, М., 1967, 479 с. ; пер. с англ.: R. Isaacs, Differential games. A mathematical theory with applications to warfare and pursuit, control and optimization, John Wiley & Sons, Inc, New York–London–Sydney, 1965, xvii+384 с. |
2. |
A. Blaquiere, F. Gerard, G. Leitmann, Quantitative and qualitative differential games, Math. Sci. Eng., 58, Academic Press, New York–London, 1969, xi+172 pp. |
3. |
Н. Н. Красовский, Игровые задачи о встрече движений, Наука, М., 1970, 420 с. |
4. |
A. Friedman, Differential games, Pure Appl. Math., XXV, Wiley-Interscience [A division of John Wiley & Sons, Inc.], New York–London, 1971, xii+350 pp. |
5. |
O. Hajek, Pursuit games. An introduction to the theory and applications of differential games of pursuit and evasion, Math. Sci. Eng., 120, Academic Press, Inc. [Harcourt Brace Jovanovich, Publishers], New York–London, 1975, xii+266 pp. |
6. |
G. Leitmann, Cooperative and non-cooperative many players differential games, Internat. Centre for Mech. Sci. (CISM) Courses and Lectures, 190, Springer-Verlag, Vienna, 1974, 77 pp. |
7. |
Н. Н. Красовский, А. И. Субботин, Позиционные дифференциальные игры, Наука, М., 1974, 456 с. ; англ. пер.: N. N. Krasovskii, A. I. Subbotin, Game-theoretical control problems, Springer Ser. Soviet Math., Springer-Verlag, New York, 1988, xii+517 с. |
8. |
П. Е. Двуреченский, Г. Е. Иванов, “Алгоритмы вычисления операторов Минковского и их применение в дифференциальных играх”, Ж. вычисл. матем. и матем. физ., 54:2 (2014), 224–255 ; англ. пер.: P. E. Dvurechensky, G. E. Ivanov, “Algorithms for computing Minkowski operators and their application in differential games”, Comput. Math. Math. Phys., 54:2 (2014), 235–264 |
9. |
В. Н. Ушаков, А. А. Ершов, “K решению задач управления с фиксированным моментом окончания”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 26:4 (2016), 543–564 |
10. |
М. С. Никольский, “Одна нелинейная задача преследования”, Кибернетика, 1973, № 2, 92–94 |
11. |
Б. Н. Пшеничный, Н. Б. Шишкина, “Достаточные условия конечности времени преследования”, ПММ, 49:4 (1985), 517–523 ; англ. пер.: B. N. Pshenichnyi, N. B. Shishkina, “Sufficient conditions of finiteness of the pursuit time”, J. Appl. Math. Mech., 49:4 (1985), 399–404 |
12. |
Н. Сатимов, “К задаче преследования в нелинейных дифференциальных играх”, Кибернетика, 1973, № 3, 88–93 |
13. |
P. Soravia, “$\mathscr{H}_\infty$ control of nonlinear systems: differential games and viscosity solutions”, SIAM J. Control Optim., 34:3 (1996), 1071–1097 |
14. |
T. Natarajan, D. A. Pierre, G. Naadimuthu, E. S. Lee, “Piecewise suboptimal control laws for differential games”, J. Math. Anal. Appl., 104:1 (1984), 189–211 |
15. |
А. А. Азамов, “Об одном классе нелинейных дифференциальных игр”, Матем. заметки, 30:4 (1981), 619–625 ; англ. пер.: A. A. Azamov, “A class of nonlinear differential games”, Math. Notes, 30:4 (1981), 805–808 |
16. |
Н. Н. Петров, “Об управляемости автономных систем”, Дифференц. уравнения, 4:4 (1968), 606–617 ; англ. пер.: N. N. Petrov, “Controllability of autonomous systems”, Differ. Equ., 4 (1972), 311–317 |
17. |
Н. Н. Петров, “Локальная управляемость автономных систем”, Дифференц. уравнения, 4:7 (1968), 1218–1232 ; англ. пер.: N. N. Petrov, “Local controllability of autonomous systems”, Differ. Equ., 4 (1972), 632–639 |
18. |
Н. Н. Петров, “Плоские задачи теории управляемости”, Вестн. ЛГУ, 1969, № 13, 69–78 |
19. |
А. Я. Нарманов, Н. Н. Петров, “Нелокальные проблемы теории оптимальных процессов. I”, Дифференц. уравнения, 21:4 (1985), 605–614 ; англ. пер.: A. Ya. Narmanov, N. N. Petrov, “Nonlocal problems in the theory of optimal processes. I”, Differ. Equ., 21 (1985), 398–406 |
20. |
А. Я. Нарманов, “О стабильности вполне управляемых систем”, Дифференц. уравнения, 36:10 (2000), 1336–1344 ; англ. пер.: A. Ya. Narmanov, “Stability of completely controllable systems”, Differ. Equ., 36:10 (2000), 1475–1483 |
21. |
А. Я. Нарманов, “О стабильности вполне управляемых систем”, Матем. тр., 4:1 (2001), 94–110 ; англ. пер.: A. Ya. Narmanov, “On stability of totally controlled systems”, Siberian Adv. Math., 11:4 (2001), 110–125 |
22. |
А. С. Банников, Н. Н. Петров, “К нестационарной задаче группового преследования”, Тр. ИММ УрО РАН, 16, № 1, 2010, 40–51 ; англ. пер.: A. S. Bannikov, N. N. Petrov, “On a nonstationary problem of group pursuit”, Proc. Steklov Inst. Math. (Suppl.), 271, suppl. 1 (2010), S41–S52 |
23. |
Н. Н. Петров, “Одна задача простого преследования с фазовыми ограничениями”, Автомат. и телемех., 1992, № 5, 22–26 ; англ. пер.: N. N. Petrov, “A certain simple pursuit problem with phase constraints”, Autom. Remote Control, 53:5 (1992), 639–642 |
24. |
Н. Н. Петров, “Одна задача группового преследования с дробными производными и фазовыми ограничениями”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 27:1 (2017), 54–59 |
25. |
Н. Н. Петров, Н. А. Соловьева, “Многократная поимка в рекуррентном примере Л. С. Понтрягина с фазовыми ограничениями”, Тр. ИММ УрО РАН, 21, № 2, 2015, 178–186 ; англ. пер.: N. N. Petrov, N. A. Solov'eva, “Multiple capture in Pontryagin's recurrent example with phase constraints”, Proc. Steklov Inst. Math. (Suppl.), 293, suppl. 1 (2016), 174–182 |
26. |
М. Н. Виноградова, Н. Н. Петров, Н. А. Соловьева, “Поимка двух скоординированных убегающих в линейных рекуррентных дифференциальных играх”, Тр. ИММ УрО РАН, 19, № 1, 2013, 41–48 |
27. |
К. А. Щелчков, “Об одной нелинейной задаче преследования с дискретным управлением и неполной информацией”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 28:1 (2018), 111–118 |
28. |
К. А. Щелчков, “Оценка времени поимки и построение стратегии преследователя в нелинейной дифференциальной игре двух лиц”, Дифференц. уравнения, 58:2 (2022), 260–269 ; англ. пер.: K. A. Shchelchkov, “Estimate of the capture time and construction of the Pursuer's strategy in a nonlinear two-person differential game”, Differ. Equ., 58:2 (2022), 264–274 |
29. |
K. Shchelchkov, “$\varepsilon$-capture in nonlinear differential games described by system of order two”, Dyn. Games Appl., 12:2 (2022), 662–676 |
Образец цитирования:
К. А. Щелчков, “Относительная оптимальность в нелинейных дифференциальных играх с дискретным управлением”, Матем. сб., 214:9 (2023), 161–174; K. A. Shchelchkov, “Relative optimality in nonlinear differential games with discrete control”, Sb. Math., 214:9 (2023), 1337–1350
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/sm9851https://doi.org/10.4213/sm9851 https://www.mathnet.ru/rus/sm/v214/i9/p161
|
|