М. Г. Коновалов, Р. В. Разумчик, “Управление случайным блужданием с эталонным стационарным распределением”, Информ. и её примен., 12:3 (2018), 2

Информатика и её применения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Информатика и её применения, 2018, том 12, выпуск 3, страницы 2–13
DOI: https://doi.org/10.14357/19922264180301 (Mi ia540)

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Управление случайным блужданием с эталонным стационарным распределением

М. Г. Коновалов^a, Р. В. Разумчик^ab

^a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
^b Российский университет дружбы народов

PDF полного текста (537 kB) Список цитирования (1)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14357/19922264180301

Аннотация: Рассматривается случайное блуждание на отрезке, допускающее управление в форме выбора направления для очередного шага. Задано множество стратегий управления, параметризованных конечномерными векторами. Требуется найти из этого множества такую стратегию, при которой плотность стационарного распределения марковской цепи, описывающей блуждание, максимально приближена к заданной эталонной плотности распределения. Постановка задачи отличается от классической схемы марковского процесса принятия решений тем, что отсутствует одношаговый доход. Содержательная трактовка задачи появляется в психологии, робототехнике, генетике. Предложен квазиградиентный алгоритм определения оптимальных значений параметров, основанный на оценках частных производных целевой функции по наблюдениям за фазовой траекторией. Приведены численные результаты работы алгоритма в примерах с различными классами стратегий и различными эталонными плотностями распределения.

Ключевые слова: управление марковской цепью с непрерывным множеством состояний; квазиградиентные алгоритмы; оценки производных по наблюдениям.

Финансовая поддержка	Номер гранта
Российский фонд фундаментальных исследований	18-07-00692_а
Исследование выполнено при частичной финансовой поддержке РФФИ в рамках научного проекта № 18-07-00692.

Поступила в редакцию: 28.04.2018

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: М. Г. Коновалов, Р. В. Разумчик, “Управление случайным блужданием с эталонным стационарным распределением”, Информ. и её примен., 12:3 (2018), 2–13

Цитирование в формате AMSBIB

\RBibitem{KonRaz18}

\by М.~Г.~Коновалов, Р.~В.~Разумчик

\paper Управление случайным блужданием с~эталонным стационарным распределением

\jour Информ. и её примен.

\yr 2018

\vol 12

\issue 3

\pages 2--13

\mathnet{http://mi.mathnet.ru/ia540}

\crossref{https://doi.org/10.14357/19922264180301}

\elib{https://elibrary.ru/item.asp?id=32686781}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ia540

https://www.mathnet.ru/rus/ia/v12/i3/p2

Эта публикация цитируется в следующих 1 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы