Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Семинар лаборатории ПреМоЛаб
29 октября 2014 г. 17:00, г. Москва, Институт проблем передачи информации им. А. А. Харкевича РАН (Б. Каретный пер., 19, метро «Цветной бульвар»), ауд. 615
 


Управление в случайной среде: задача о двуруком бандите

А. В. Колногоров

Новгородский государственный университет им. Ярослава Мудрого

Количество просмотров:
Эта страница:229

Аннотация: Рассматривается управление обработкой больших объемов данных, если для обработки имеются два альтернативных метода с различными априори неизвестными эффективностями. Требуется определить более эффективный метод и обеспечить его преимущественное применение. С использованием параллельной обработки это может быть выполнено за сравнительно небольшое число этапов, причем практически без потери качества управления, т.е. без увеличения минимаксного риска.
Решение задачи ищется с помощью основной теоремы теории игр, согласно которой минимаксные стратегия и риск могут быть найдены как байесовские, соответствующие наихудшему априорному распределению. Для вычисления байесовских стратегии и риска относительно наихудшего априорного распределения получено инвариантное интегро-разностное уравнение. Если горизонт управления неограниченно растет, интегро-разностное уравнение превращается в дифференциальное уравнение в частных производных второго порядка. Численные эксперименты показывают близость решений инвариантного интегро-разностного и дифференциального уравнений.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024