А. И. Бойко, И. В. Оселедец, Г. Феррер, “TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления”, Ж. вычисл. матем. и матем. физ., 61:5 (2021), 865–877; Comput. Math. Math. Phys., 61:5 (2021), 836

Журнал вычислительной математики и математической физики

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Ж. вычисл. матем. и матем. физ.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Журнал вычислительной математики и математической физики, 2021, том 61, номер 5, страницы 865–877
DOI: https://doi.org/10.31857/S0044466921050045 (Mi zvmmf11244)

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Оптимальное управление

TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления

А. И. Бойко^a, И. В. Оселедец^ab, Г. Феррер^a

^a 121205 Москва, Большой бульвар, 30, стр. 1, Сколковский институт науки и технологий, Россия
^b 119333 Москва, ул. Губкина, 8, ИВМ РАН, Россия

Список цитирования (1)

DOI: https://doi.org/10.31857/S0044466921050045

Аннотация: Рассматривается задача стохастического оптимального управления общего вида с малым винеровским шумом. Данная задача аппроксимируется с помощью марковского процесса принятия решений. Решение уравнения Беллмана на функцию ценности вычисляется с помощью метода итерации ценности (VI) в формате малорангового тензорного поезда (ТТ-VI). Предложена модификация данного алгоритма (ТТ-QI): нелинейный оператор Беллмана итеративно применяется сначала с использованием малоранговых алгебраических операций, а затем с использованием алгоритма крестовой аппроксимации. Показана более низкая, чем в основном методе, сложность на одну итерацию в случае малых ТТ-рангов тензоров вероятностей перехода. На примере задач управления обратным маятником и машинами Дубинса показано ускорение времени расчета оптимального регулятора в 3–10 раз по сравнению с существующим методом.
Библ. 13. Фиг. 6. Табл. 1.

Ключевые слова: динамическое программирование, оптимальное управление, марковские процессы принятия решений, малоранговые разложения.

Финансовая поддержка	Номер гранта
Министерство образования и науки Российской Федерации	14.756.31.0001
Работа выполнена при частичной финансовой поддержке Минобрнауки РФ (проект 14.756.31.0001).

Поступила в редакцию: 24.11.2020
Исправленный вариант: 24.11.2020
Принята в печать: 14.01.2021

Англоязычная версия:
Computational Mathematics and Mathematical Physics, 2021, Volume 61, Issue 5, Pages 836–846
DOI: https://doi.org/10.1134/S0965542521050043

Реферативные базы данных:

Тип публикации: Статья

УДК: 517.977.54

Образец цитирования: А. И. Бойко, И. В. Оселедец, Г. Феррер, “TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления”, Ж. вычисл. матем. и матем. физ., 61:5 (2021), 865–877; Comput. Math. Math. Phys., 61:5 (2021), 836–846

Цитирование в формате AMSBIB

\RBibitem{BoyOseFer21}

\by А.~И.~Бойко, И.~В.~Оселедец, Г.~Феррер

\paper TT-QI: ускоренная итерация функции ценности в формате тензорного поезда для задач стохастического оптимального управления

\jour Ж. вычисл. матем. и матем. физ.

\yr 2021

\vol 61

\issue 5

\pages 865--877

\mathnet{http://mi.mathnet.ru/zvmmf11244}

\crossref{https://doi.org/10.31857/S0044466921050045}

\elib{https://elibrary.ru/item.asp?id=45633477}

\transl

\jour Comput. Math. Math. Phys.

\yr 2021

\vol 61

\issue 5

\pages 836--846

\crossref{https://doi.org/10.1134/S0965542521050043}

\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=000668966500013}

\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85109064040}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/zvmmf11244

https://www.mathnet.ru/rus/zvmmf/v61/i5/p865

Эта публикация цитируется в следующих 1 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Журнал вычислительной математики и математической физики

Computational Mathematics and Mathematical Physics

Статистика просмотров:
Страница аннотации:	103

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы