Журнал вычислительной математики и математической физики
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Ж. вычисл. матем. и матем. физ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Журнал вычислительной математики и математической физики, 2021, том 61, номер 5, страницы 865–877
DOI: https://doi.org/10.31857/S0044466921050045
(Mi zvmmf11244)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Оптимальное управление

TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления

А. И. Бойкоa, И. В. Оселедецab, Г. Феррерa

a 121205 Москва, Большой бульвар, 30, стр. 1, Сколковский институт науки и технологий, Россия
b 119333 Москва, ул. Губкина, 8, ИВМ РАН, Россия
Аннотация: Рассматривается задача стохастического оптимального управления общего вида с малым винеровским шумом. Данная задача аппроксимируется с помощью марковского процесса принятия решений. Решение уравнения Беллмана на функцию ценности вычисляется с помощью метода итерации ценности (VI) в формате малорангового тензорного поезда (ТТ-VI). Предложена модификация данного алгоритма (ТТ-QI): нелинейный оператор Беллмана итеративно применяется сначала с использованием малоранговых алгебраических операций, а затем с использованием алгоритма крестовой аппроксимации. Показана более низкая, чем в основном методе, сложность на одну итерацию в случае малых ТТ-рангов тензоров вероятностей перехода. На примере задач управления обратным маятником и машинами Дубинса показано ускорение времени расчета оптимального регулятора в 3–10 раз по сравнению с существующим методом.
Библ. 13. Фиг. 6. Табл. 1.
Ключевые слова: динамическое программирование, оптимальное управление, марковские процессы принятия решений, малоранговые разложения.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 14.756.31.0001
Работа выполнена при частичной финансовой поддержке Минобрнауки РФ (проект 14.756.31.0001).
Поступила в редакцию: 24.11.2020
Исправленный вариант: 24.11.2020
Принята в печать: 14.01.2021
Англоязычная версия:
Computational Mathematics and Mathematical Physics, 2021, Volume 61, Issue 5, Pages 836–846
DOI: https://doi.org/10.1134/S0965542521050043
Реферативные базы данных:
Тип публикации: Статья
УДК: 517.977.54
Образец цитирования: А. И. Бойко, И. В. Оселедец, Г. Феррер, “TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления”, Ж. вычисл. матем. и матем. физ., 61:5 (2021), 865–877; Comput. Math. Math. Phys., 61:5 (2021), 836–846
Цитирование в формате AMSBIB
\RBibitem{BoyOseFer21}
\by А.~И.~Бойко, И.~В.~Оселедец, Г.~Феррер
\paper TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления
\jour Ж. вычисл. матем. и матем. физ.
\yr 2021
\vol 61
\issue 5
\pages 865--877
\mathnet{http://mi.mathnet.ru/zvmmf11244}
\crossref{https://doi.org/10.31857/S0044466921050045}
\elib{https://elibrary.ru/item.asp?id=45633477}
\transl
\jour Comput. Math. Math. Phys.
\yr 2021
\vol 61
\issue 5
\pages 836--846
\crossref{https://doi.org/10.1134/S0965542521050043}
\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=000668966500013}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85109064040}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/zvmmf11244
  • https://www.mathnet.ru/rus/zvmmf/v61/i5/p865
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Журнал вычислительной математики и математической физики Computational Mathematics and Mathematical Physics
    Статистика просмотров:
    Страница аннотации:78
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024