Вестник Удмуртского университета. Математика. Механика. Компьютерные науки
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, 2014, выпуск 2, страницы 29–42 (Mi vuu425)  

МАТЕМАТИКА

Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией

Н. С. Исмагилов

Уфимский государственный авиационный технический университет, 450000, Россия, г. Уфа, ул. К. Маркса, 12
Список литературы:
Аннотация: В работе рассматривается задача оптимального управления одномерным процессом, заданным стохастическим дифференциальным уравнением, в котором управление воздействует как на коэффициент сноса, так и на коэффициент диффузии, при этом диффузионная составляющая линейна по управлению
$$dx(t) = b(t,x(t),u(t))\,dt + \sigma(t,x(t))u(t)\,dW(t), \quad x(0) = x_0.$$
Здесь $x(t)$ — фазовая координата, $u(t)$ — управляющая функция, $W(t)$ — винеровский процесс. Доказана теорема, которая предоставляет структуру решения рассматриваемого уравнения в виде суперпозиции функций $x(t) = \Phi(t,u(t)W(t) + y(t))$, в котором $\Phi(t,v)$ — известная функция, полностью определяющаяся коэффициентом $\sigma(t,x)$, и не зависит от управления, а $y(t)$ — решение потраекторно-детерминированного дифференциального уравнения с мерой вида
$$dy(t) = B(t,y(t),u(t))\,dt - W(t)\,du(t).$$

Выявленная структура решения позволяет вместо исходной стохастической задачи оптимального управления исследовать новую эквивалентную задачу с фазовой переменной $y(t)$, которая является потраекторно-детерминированной задачей оптимального импульсного управления. При детерминированном рассмотрении новой задачи решения последней могут оказаться упреждающими функциями, поэтому в работе предлагается метод, который позволяет добиться неупреждаемости оптимальных решений. Суть метода заключается в модификации функционала потерь в новой потраекторно-детерминированной задаче специальным образом подобранным интегральным слагаемым, которое позволяет гарантировать неупреждаемость решений.
Ключевые слова: стохастическое оптимальное управление, стохастические дифференциальные уравнения, детерминированный подход, потраекторная оптимизация, оптимальное импульсное управление.
Поступила в редакцию: 29.10.2013
Тип публикации: Статья
УДК: 519.21, 517.977
Образец цитирования: Н. С. Исмагилов, “Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2014, № 2, 29–42
Цитирование в формате AMSBIB
\RBibitem{Ism14}
\by Н.~С.~Исмагилов
\paper Об одном детерминированном подходе к решению задач стохастического оптимального управления с управляемой диффузией
\jour Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки
\yr 2014
\issue 2
\pages 29--42
\mathnet{http://mi.mathnet.ru/vuu425}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vuu425
  • https://www.mathnet.ru/rus/vuu/y2014/i2/p29
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Удмуртского университета. Математика. Механика. Компьютерные науки
    Статистика просмотров:
    Страница аннотации:269
    PDF полного текста:161
    Список литературы:41
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024