Аннотация:
Доклад посвящён задаче построения синтезирующих (“позиционных”)
управлений в системах, допускающих импульсные воздействия
конечного порядка (обобщённые “дельта-функции” и их производные).
Подобные задачи, имеющие серьёзную прикладную мотивацию, рассматривались,
в основном, с точки зрения программных управлений.
В настоящем докладе указана возможность применения идей динамического
программирования к задачам позиционного импульсного управления.
Описание разрешающих стратегий синтеза управлений здесь рассматривается
для систем с исходной линейной структурой, путём сочетания методов
классической теории распределений с методами теории квазивариационных
неравенств, свойственных гамильтонову формализму. При этом
синтезированная система уже оказывается нелинейной. “Идеальные”
же решения при этом таковы, что вполне управляемая система,
с воздействиями, содержащими не только $\delta$-функции, но
и высшие производные $\delta^{(j)}$ этих функций, может быть переведена из
одного фазового состояния в другое за нулевое время. Физически реализуемые
аппроксимации подобных “идеальных” решений называют
“быстрыми управлениями”. Они позволяют достигать указанной выше
цели управления за сколь угодно малое, конечное “нано-время”.
Так, для системы в распределениях
\begin{equation}
\dot x=A(t)x+B(t)u \qquad (\operatorname{supp}x(\,\cdot\,)=[\alpha,\beta],\ \ \alpha<\tau\le t\le\vartheta<\beta)
\tag{1}
\end{equation}
с гладкими коэффициентами и с импульсными управлениями вида
\begin{equation}
u=u(t,x)=u^0(t)=\sum_{s=1}^r\sum_{j=0}^kq_{sj}\delta^{(j)}(t-\tau_s), \qquad \tau_s=\tau_s(t,x),
\tag{2}
\end{equation}
минимизирующими выпуклый функционал вида $\varphi(x(\,\cdot\,))$ при
ограничении на норму матрицы $\{q_{sj}\}$, рассматриваются физически реализуемые
аппроксимации, порождаемые решением следующей задачи.
Введя обозначения
$$
L_0(t)=B(t), \qquad L_j(t)=A(t)L_{j-1}(t)-\frac{dL_{j-1}}{dt}\,, \quad j=\overline{1,k},
$$
рассмотрим систему
\begin{equation}
\frac{dx}{dt}=A(t)x+\sum_0^kL_j(s)u^{(j)}(t), \qquad t\le s\le\vartheta,
\tag{3}
\end{equation}
с начальной позицией $\{\tau,x_\tau,k_\tau\}$, при совместных ограничениях:
интегральныx
$$
\int_\tau^\vartheta\sum_0^k\|u^{(j)}(t)\|\,dt\le k_\tau, \quad k_\tau>0; \quad k(t)\ge0, \quad t\in(\tau,\vartheta]
$$
и геометрическиx
$$
\|u(s)^{(j)}\|\le\mu_j, \quad \mu_j\ge0, \quad \mu'=\{\mu_0,\dots,\mu_k\}, \quad j=0,\dots,k.
$$
Требуется, при заданном $\mu$, найти синтезированное управление
$$
u^0(t,x,k\mid\mu),
$$
минимизирующее функционал $\varphi(\vartheta,x(\vartheta))+k(\vartheta)$,
где $\varphi(\vartheta,x)$ непрерывная, ограниченная снизу функция,
выпуклая по $x$.
Решение данной задачи вытекает из следующего уравнения типа
Гамильтона–Якоби–Беллмана для функции цены
\begin{gather*}
V(t,x,k\mid\mu)=\min_u\{\varphi(x(\vartheta))\mid x(t)=x,\ k(t)=k,\ \|u^{(j)}(t)\|\le\mu_j\|
\\
V_t+\min_u\biggl\{\biggl(V_x,A(t)x+\sum_0^kL_j(t)u^{(j)}\biggr)+\sum_0^k\|u^{(j)}(t)\|\Bigm|\|u\|\le\mu\biggr\}=0,
\end{gather*}
с краевым условием
$$
V(\vartheta,x,k\mid\mu)=\varphi(\vartheta,x), \qquad k(\vartheta)=0.
$$
Реализация $u_j^0[t\mid\mu]$ управления $u_j^0(t,x(t),k\mid\mu)$
является релейной функцией, принимающей одно из трёх значения
$\{\pm\mu_j,0\}$ всюду, за исключений точек переключения, где
$u^0[t]\in[-\mu_j,+\mu_j]$. При надлежащих условиях на последовательности
$\mu_j\to\infty$ имеет место слабая сходимость вида
$L_j(t)u_j^0[t\mid\mu]\to B(t)q_{sj}\delta^{(j)}(t-\tau_s)$.
Таким образом, “обыкновенные” релейные (быстрые) управления для системы (3)
отображаются, при $\mu_j\to\infty$, в импульсные (мгновенные) управления
вида (2) для системы (1).
Заметим, что идеальные импульсные управления могут также рассматриваться
как виртуальные управления, реализующие мгновенные переключения
фазовых координат и коэффициентов уравнений в математических моделях
гибридных систем.
Список литературы [1] Красовский Н. Н., “Об одной задаче оптимального регулирования”,
Прикладная математика и механика, 21, No. 5, 670–677 (1957).
[2] Bensoussan A. and Lions J.-L.,
Contrôle impulsionnel et inéquations quasi-variationelles,
Paris, Dunod, (1982).
[3] Куржанский А. Б., Осипов Ю. С., “К управлению линейной системой
обобщёнными воздействиями”, Дифференциальные уравнения,
5, No. 8, 1360–1370 (1969).
[4] Куржанский А. Б., “Оптимальные системы с импульсными управлениями”,
Дифференциальные игры и задачи управления, УНЦ АН СССР, 131–156 (1975).
[5] Daryin A. N., Kurzhanski A. B., and Seleznev A. V.,
“A dynamic programming approach to the impulse control synthesis problem”,
Proc. Joint 44th IEEE CDC-ECC 2005, Seville, 8215–8220 (2005).