Видеотека: Ю. В. Авербух, Аппроксимация решений уравнения Беллмана для задач управления средним полем

Видеотека

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Видеотека
	Архив
	Популярное видео

	Поиск
	RSS
	Новые поступления

Вторая конференция Математических центров России. Секция «Уравнения с частными производными»
7 ноября 2022 г. 17:50–18:30, г. Москва, Ломоносовский корпус МГУ, аудитория Д5, Ломоносовский пр., 27, к. 1

Аппроксимация решений уравнения Беллмана для задач управления средним полем

Ю. В. Авербух

*Дополнительные материалы:*
	Adobe PDF	293.5 Kb

Количество просмотров:
Эта страница:	100
Материалы:	12

Аннотация: В докладе рассматривается задача управления средним полем, моделирующая движение большой группы агентов с динамикой \[\frac{d}{dt}x(t)=f(t,x(t),m(t),u(t)), t\in [0,T],x(t)\in\mathbb{T}^d,m(t)\in\mathcal{P}(\mathbb{T}^d), u\in U.\] Здесь $\mathbb{T}^d$ обозначает $d$-мерный тор, $\mathcal{P}(\mathbb{T}^d)$ – пространство вероятностей на торе, снабженное метрикой Канторовича. Также $m(t)$ обозначает распределение всех агентов в момент времени $t$. Подход управления средним полем предполагает, что агенты выбирают свое управление независимо, но действуют кооперативно, стремясь минимизировать величину $\sigma(m(T))$.
Отметим, что в данном случае в качестве позиции выступает вероятность, описывающая распределение агентов.
Основным объектом исследования является функция цены $\operatorname{Val}(t_0,m_0)$, которая сопоставляет начальному моменту времени $t_0$ и начальному распределению агентов $m_0$ значение $\sigma(m(T))$ при оптимальном управлении. Эта функция должна удовлетворять уравнению Беллмана \[\frac{\partial\varphi}{\partial t}+H(t,m,\nabla_m\varphi)=0,\] где $\nabla_m\varphi$ – производная функции $\varphi$ по $m$.
В докладе рассматривается построение приближений функции цены решениями конечномерных уравнений типа Гамильтона-Якоби \[\frac{\partial}{\partial t}\phi+\mathcal{H}(t,\mu,\nabla_\mu\phi)=0,\] где $\mu$ — элемент некоторого конечномерного симплекса $\Sigma$, $\phi:[0,T]\times\Sigma\rightarrow\mathbb{R}$. Отметим, что конечномерное уравнение Гамильтона–Якоби возникает как уравнение Беллмана в некоторой конечномерной задаче управления, интерпретируемой как задача управления средним полем с конечным числом состояний.

Дополнительные материалы:

AverboukhYuV.pdf (293.5 Kb)

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы