Видеотека
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Видеотека
Архив
Популярное видео

Поиск
RSS
Новые поступления






Вторая конференция Математических центров России. Секция «Уравнения с частными производными»
7 ноября 2022 г. 17:50–18:30, г. Москва, Ломоносовский корпус МГУ, аудитория Д5, Ломоносовский пр., 27, к. 1
 


Аппроксимация решений уравнения Беллмана для задач управления средним полем

Ю. В. Авербух
Дополнительные материалы:
Adobe PDF 293.5 Kb

Количество просмотров:
Эта страница:42
Материалы:14

Аннотация: В докладе рассматривается задача управления средним полем, моделирующая движение большой группы агентов с динамикой \[\frac{d}{dt}x(t)=f(t,x(t),m(t),u(t)), t\in [0,T],x(t)\in\mathbb{T}^d,m(t)\in\mathcal{P}(\mathbb{T}^d), u\in U.\] Здесь $\mathbb{T}^d$ обозначает $d$-мерный тор, $\mathcal{P}(\mathbb{T}^d)$ – пространство вероятностей на торе, снабженное метрикой Канторовича. Также $m(t)$ обозначает распределение всех агентов в момент времени $t$. Подход управления средним полем предполагает, что агенты выбирают свое управление независимо, но действуют кооперативно, стремясь минимизировать величину $\sigma(m(T))$.
Отметим, что в данном случае в качестве позиции выступает вероятность, описывающая распределение агентов.
Основным объектом исследования является функция цены $\operatorname{Val}(t_0,m_0)$, которая сопоставляет начальному моменту времени $t_0$ и начальному распределению агентов $m_0$ значение $\sigma(m(T))$ при оптимальном управлении. Эта функция должна удовлетворять уравнению Беллмана \[\frac{\partial\varphi}{\partial t}+H(t,m,\nabla_m\varphi)=0,\] где $\nabla_m\varphi$ – производная функции $\varphi$ по $m$.
В докладе рассматривается построение приближений функции цены решениями конечномерных уравнений типа Гамильтона-Якоби \[\frac{\partial}{\partial t}\phi+\mathcal{H}(t,\mu,\nabla_\mu\phi)=0,\] где $\mu$ — элемент некоторого конечномерного симплекса $\Sigma$, $\phi:[0,T]\times\Sigma\rightarrow\mathbb{R}$. Отметим, что конечномерное уравнение Гамильтона–Якоби возникает как уравнение Беллмана в некоторой конечномерной задаче управления, интерпретируемой как задача управления средним полем с конечным числом состояний.

Дополнительные материалы: AverboukhYuV.pdf (293.5 Kb)
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024