Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Семинар отдела управляемых систем
3 апреля 2014 г., г. Екатеринбург, ул. С. Ковалевской, 16, комн. 322
 


Позиционное управление в игре преследования с двумя слабыми догоняющими и одним убегающим

В. С. Пацко, С. С. Кумков

Количество просмотров:
Эта страница:139

Аннотация: Модельная игра с двумя преследователями и одним убегающим записывается следующим образом. Три инерционных объекта движутся по прямой. Динамика преследователей $P_1$, $P_2$ и убегающего $E$:
\begin{equation} \label{patsko1} \begin{array}{lclcl} \ddot{z}_{P_1} = a_{P_1}, & \qquad & \ddot{z}_{P_2} = a_{P_2}, & \qquad & \ddot{z}_E = a_E, \\[1ex] \dot{a}_{P_1} = (u_1 - a_{P_1})/l_{P_1}, & & \dot{a}_{P_2} = (u_2 - a_{P_2})/l_{P_2}, & & \dot{a}_E = (v - a_E)/l_E,\\[1ex] |u_1| \leqslant \mu_1, & & |u_2| \leqslant \mu_2, & & |v| \leqslant \nu, \\[1ex] a_{P_1}(t_0) = 0, & & a_{P_2}(t_0) = 0, & & a_E(t_0) = 0. \end{array} \end{equation}
Здесь $z_{P_1}$, $z_{P_2}$, $z_E$ — геометрические координаты объектов, $a_{P_1}$, $a_{P_2}$, $a_E$ — их ускорения, порождаемые управлениями $u_1$, $u_2$, $v$. Постоянные времени $l_{P_1}$, $l_{P_2}$, $l_E$ определяют, насколько быстро управления влияют на систему. Предполагаем, что $\mu_i < \nu$, $\mu_i/l_{P_i} < \nu/l_E$, $i = 1$, $2$. Такой набор параметров соответствует случаю слабых преследователей.
Зафиксируем момент времени $T$. В этот момент вычисляются отклонения убегающего от преследователей: $d_{P_1, E}(T) = z_{E}(T) - z_{P_1}(T)$, $d_{P_2, E}(T) = z_{E}(T) - z_{P_2}(T)$.
Предположим, что преследователи действуют координированно. Объединим их в одного игрока $P$, которого назовём первым игроком. Он обладает векторным управляющим воздействием $u = (u_1, u_2)$. Убегающий считается вторым игроком. Функцию платы определим в виде
\begin{equation} \label{patsko4} \varphi = \min\Bigl\{\bigl|d_{P_1,E}(T)\bigr|, \ \bigl|d_{P_2,E}(T)\bigr|\Bigr\}. \end{equation}

В каждый момент $t$ игроки точно знают значения всех фазовых координат $z_{P_1}$, $\dot{z}_{P_1}$, $a_{P_1}$, $z_{P_2}$, $\dot{z}_{P_2}$, $a_{P_2}$, $z_{E}$, $\dot{z}_{E}$, $a_{E}$. Первый игрок выбирает своё управление обратной связи так, чтобы минимизировать плату; второй игрок максимизирует её.
Приводятся результаты численного построения множеств уровня функции цены игры в трёхмерном пространстве $t$, $x_1$, $x_2$. Здесь $x_1$ ($x_2$) — отклонение первого (второго) преследователя от убегающего, прогнозируемое с текущего момента на момент $T$ при нулевых управлениях игроков.
Основная часть доклада посвящена построению и обоснованию метода управления первого игрока в игре при помощи линий переключения, зависящих от времени. Метод даёт результат, близкий к оптимальному, и является устойчивым по отношению к малым погрешностям численных построений и к малым ошибкам измерения текущего фазового состояния.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024