|
Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, 2014, выпуск 2, страницы 29–42
(Mi vuu425)
|
|
|
|
МАТЕМАТИКА
Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией
Н. С. Исмагилов Уфимский государственный авиационный технический университет, 450000, Россия, г. Уфа, ул. К. Маркса, 12
Аннотация:
В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению
$$dx(t) = b(t,x(t),u(t))\,dt + \sigma(t,x(t))u(t)\,dW(t), \quad x(0) = x_0.$$
Здесь $x(t)$ — фазовая координата, $u(t)$ — управляющая функция, $W(t)$ — винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t) = \Phi(t,u(t)W(t) + y(t))$, в котором $\Phi(t,v)$ — известная функция, полностью определяющаяся коэффициентом $\sigma(t,x)$, и не зависит от управления, а $y(t)$ — решение потраекторно-детерминированного дифференциального уравнения с мерой вида
$$dy(t) = B(t,y(t),u(t))\,dt - W(t)\,du(t).$$
Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.
Ключевые слова:
стохастическое оптимальное управление, стохастические дифференциальные уравнения, детерминированный подход, потраекторная оптимизация, оптимальное импульсное управление.
Поступила в редакцию: 29.10.2013
Образец цитирования:
Н. С. Исмагилов, “Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2014, № 2, 29–42
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vuu425 https://www.mathnet.ru/rus/vuu/y2014/i2/p29
|
Статистика просмотров: |
Страница аннотации: | 269 | PDF полного текста: | 161 | Список литературы: | 41 |
|