|
Автоматика и телемеханика, 2012, выпуск 4, страницы 114–130
(Mi at3793)
|
|
|
|
Эта публикация цитируется в 15 научных статьях (всего в 15 статьях)
Робастные и адаптивные системы
Робастное параллельное управление в случайной среде (задаче о двуруком бандите)
А. В. Колногоров Новгородский государственный университет им. Ярослава Мудрого
Аннотация:
Задача о поведении в случайной среде, известная как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Предложена стратегия параллельного управления, которая в средах с нормально распределенными доходами, имеющими единичные дисперсии, обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска, которые ищутся как байесовские, соответствующие наихудшему априорному распределению. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных (например, бинарных).
Образец цитирования:
А. В. Колногоров, “Робастное параллельное управление в случайной среде (задаче о двуруком бандите)”, Автомат. и телемех., 2012, № 4, 114–130; Autom. Remote Control, 73:4 (2012), 689–701
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/at3793 https://www.mathnet.ru/rus/at/y2012/i4/p114
|
|