|
|
Семинар лаборатории ПреМоЛаб
29 октября 2014 г. 17:00, г. Москва, Институт проблем передачи информации им. А. А. Харкевича РАН (Б. Каретный пер., 19, метро «Цветной бульвар»), ауд. 615
|
|
|
|
|
|
Управление в случайной среде: задача о двуруком бандите
А. В. Колногоров Новгородский государственный университет им. Ярослава Мудрого
|
Количество просмотров: |
Эта страница: | 241 |
|
Аннотация:
Рассматривается управление обработкой больших объемов данных, если для обработки имеются два альтернативных метода с различными априори неизвестными эффективностями. Требуется определить более эффективный метод и обеспечить его преимущественное применение. С использованием параллельной обработки это может быть выполнено за сравнительно небольшое число этапов, причем практически без потери качества управления, т.е. без увеличения минимаксного риска.
Решение задачи ищется с помощью основной теоремы теории игр, согласно которой минимаксные стратегия и риск могут быть найдены как байесовские, соответствующие наихудшему априорному распределению. Для вычисления байесовских стратегии и риска относительно наихудшего априорного распределения получено инвариантное интегро-разностное уравнение. Если горизонт управления неограниченно растет, интегро-разностное уравнение превращается в дифференциальное уравнение в частных производных второго порядка. Численные эксперименты показывают близость решений инвариантного интегро-разностного и дифференциального уравнений.
|
|