Семинары: В. С. Пацко, С. С. Кумков, Позиционное управление в игре преследования с двумя слабыми догоняющими и одним убегающим

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Семинар отдела управляемых систем
3 апреля 2014 г., г. Екатеринбург, ул. С. Ковалевской, 16, комн. 322

Позиционное управление в игре преследования с двумя слабыми догоняющими и одним убегающим

В. С. Пацко, С. С. Кумков

Количество просмотров:
Эта страница:	139

Аннотация: Модельная игра с двумя преследователями и одним убегающим записывается следующим образом. Три инерционных объекта движутся по прямой. Динамика преследователей $P_1$, $P_2$ и убегающего $E$:
\begin{equation} \label{patsko1} \begin{array}{lclcl} \ddot{z}_{P_1} = a_{P_1}, & \qquad & \ddot{z}_{P_2} = a_{P_2}, & \qquad & \ddot{z}_E = a_E, \\[1ex] \dot{a}_{P_1} = (u_1 - a_{P_1})/l_{P_1}, & & \dot{a}_{P_2} = (u_2 - a_{P_2})/l_{P_2}, & & \dot{a}_E = (v - a_E)/l_E,\\[1ex] |u_1| \leqslant \mu_1, & & |u_2| \leqslant \mu_2, & & |v| \leqslant \nu, \\[1ex] a_{P_1}(t_0) = 0, & & a_{P_2}(t_0) = 0, & & a_E(t_0) = 0. \end{array} \end{equation}
Здесь $z_{P_1}$, $z_{P_2}$, $z_E$ — геометрические координаты объектов, $a_{P_1}$, $a_{P_2}$, $a_E$ — их ускорения, порождаемые управлениями $u_1$, $u_2$, $v$. Постоянные времени $l_{P_1}$, $l_{P_2}$, $l_E$ определяют, насколько быстро управления влияют на систему. Предполагаем, что $\mu_i < \nu$, $\mu_i/l_{P_i} < \nu/l_E$, $i = 1$, $2$. Такой набор параметров соответствует случаю слабых преследователей.
Зафиксируем момент времени $T$. В этот момент вычисляются отклонения убегающего от преследователей: $d_{P_1, E}(T) = z_{E}(T) - z_{P_1}(T)$, $d_{P_2, E}(T) = z_{E}(T) - z_{P_2}(T)$.
Предположим, что преследователи действуют координированно. Объединим их в одного игрока $P$, которого назовём первым игроком. Он обладает векторным управляющим воздействием $u = (u_1, u_2)$. Убегающий считается вторым игроком. Функцию платы определим в виде
\begin{equation} \label{patsko4} \varphi = \min\Bigl\{\bigl|d_{P_1,E}(T)\bigr|, \ \bigl|d_{P_2,E}(T)\bigr|\Bigr\}. \end{equation}

В каждый момент $t$ игроки точно знают значения всех фазовых координат $z_{P_1}$, $\dot{z}_{P_1}$, $a_{P_1}$, $z_{P_2}$, $\dot{z}_{P_2}$, $a_{P_2}$, $z_{E}$, $\dot{z}_{E}$, $a_{E}$. Первый игрок выбирает своё управление обратной связи так, чтобы минимизировать плату; второй игрок максимизирует её.
Приводятся результаты численного построения множеств уровня функции цены игры в трёхмерном пространстве $t$, $x_1$, $x_2$. Здесь $x_1$ ($x_2$) — отклонение первого (второго) преследователя от убегающего, прогнозируемое с текущего момента на момент $T$ при нулевых управлениях игроков.
Основная часть доклада посвящена построению и обоснованию метода управления первого игрока в игре при помощи линий переключения, зависящих от времени. Метод даёт результат, близкий к оптимальному, и является устойчивым по отношению к малым погрешностям численных построений и к малым ошибкам измерения текущего фазового состояния.

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы