|
|
Семинар отдела управляемых систем
3 апреля 2014 г., г. Екатеринбург, ул. С. Ковалевской, 16, комн. 322
|
|
|
|
|
|
Позиционное управление в игре преследования с двумя слабыми догоняющими и одним убегающим
В. С. Пацко, С. С. Кумков |
Количество просмотров: |
Эта страница: | 140 |
|
Аннотация:
Модельная игра с двумя преследователями и одним убегающим записывается следующим образом. Три инерционных объекта движутся по прямой. Динамика преследователей $P_1$, $P_2$ и убегающего $E$:
\begin{equation}
\label{patsko1}
\begin{array}{lclcl}
\ddot{z}_{P_1} = a_{P_1}, & \qquad & \ddot{z}_{P_2} = a_{P_2},
& \qquad & \ddot{z}_E = a_E, \\[1ex]
\dot{a}_{P_1} = (u_1 - a_{P_1})/l_{P_1}, & & \dot{a}_{P_2} = (u_2 - a_{P_2})/l_{P_2},
& & \dot{a}_E = (v - a_E)/l_E,\\[1ex]
|u_1| \leqslant \mu_1, & & |u_2| \leqslant \mu_2,
& & |v| \leqslant \nu, \\[1ex]
a_{P_1}(t_0) = 0, & & a_{P_2}(t_0) = 0,
& & a_E(t_0) = 0.
\end{array}
\end{equation}
Здесь $z_{P_1}$, $z_{P_2}$, $z_E$ — геометрические координаты объектов, $a_{P_1}$, $a_{P_2}$, $a_E$ — их ускорения, порождаемые управлениями $u_1$, $u_2$, $v$. Постоянные времени $l_{P_1}$, $l_{P_2}$, $l_E$ определяют, насколько быстро управления влияют на систему. Предполагаем, что $\mu_i < \nu$, $\mu_i/l_{P_i} < \nu/l_E$, $i = 1$, $2$. Такой набор параметров соответствует случаю слабых преследователей.
Зафиксируем момент времени $T$. В этот момент вычисляются отклонения убегающего от преследователей: $d_{P_1, E}(T) = z_{E}(T) - z_{P_1}(T)$, $d_{P_2, E}(T) = z_{E}(T) - z_{P_2}(T)$.
Предположим, что преследователи действуют координированно. Объединим их в одного игрока $P$, которого назовём первым игроком. Он обладает векторным управляющим воздействием $u = (u_1, u_2)$. Убегающий считается вторым игроком. Функцию платы определим в виде
\begin{equation}
\label{patsko4}
\varphi = \min\Bigl\{\bigl|d_{P_1,E}(T)\bigr|, \ \bigl|d_{P_2,E}(T)\bigr|\Bigr\}.
\end{equation}
В каждый момент $t$ игроки точно знают значения всех фазовых координат $z_{P_1}$, $\dot{z}_{P_1}$, $a_{P_1}$, $z_{P_2}$, $\dot{z}_{P_2}$, $a_{P_2}$, $z_{E}$, $\dot{z}_{E}$, $a_{E}$. Первый игрок выбирает своё управление обратной связи так, чтобы минимизировать плату; второй игрок максимизирует её.
Приводятся результаты численного построения множеств уровня функции цены игры в трёхмерном пространстве $t$, $x_1$, $x_2$. Здесь $x_1$ ($x_2$) — отклонение первого (второго) преследователя от убегающего, прогнозируемое с текущего момента на момент $T$ при нулевых управлениях игроков.
Основная часть доклада посвящена построению и обоснованию метода управления первого игрока в игре при помощи линий переключения, зависящих от времени. Метод даёт результат, близкий к оптимальному, и является устойчивым по отношению к малым погрешностям численных построений и к малым ошибкам измерения текущего фазового состояния.
|
|