|
Синтез управления двумерным случайным блужданием с эталонным стационарным распределением
М. Г. Коновалов, Р. В. Разумчик Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Аннотация:
Описан конструктивный метод решения новой «обратной» задачи управления случайным блужданием (цепью Маркова) с непрерывным ограниченным и замкнутым двумерным множеством состояний, вероятности перехода которой зависят от текущего значения цепи. Цель управления — отыскание такой стратегии, при которой стационарное распределение цепи наиболее приближено в определенном смысле к эталонному. Реализация метода осуществляется с помощью квазиградиентного алгоритма определения оптимальных значений параметров стратегии, основанного на оценках частных производных целевой функции по наблюдениям за фазовой траекторией. Приведены численные результаты работы алгоритма в примерах с простейшими эталонными плотностями. Внедрение полученных результатов в подвижных объектах (например, беспилотных летательных аппаратах) позволяет наделить их способностью стохастического автономного движения.
Ключевые слова:
управление марковской цепью, непрерывное множество состояний, квазиградиентные алгоритмы, беспилотные летательные аппараты.
Поступила в редакцию: 17.04.2022
Образец цитирования:
М. Г. Коновалов, Р. В. Разумчик, “Синтез управления двумерным случайным блужданием с эталонным стационарным распределением”, Информ. и её примен., 16:2 (2022), 109–117
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ia793 https://www.mathnet.ru/rus/ia/v16/i2/p109
|
Статистика просмотров: |
Страница аннотации: | 284 | PDF полного текста: | 42 | Список литературы: | 15 |
|