Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Стохастический анализ в задачах
27 апреля 2013 г. 11:00, г. Москва, Большой Власьевский переулок, дом 11
 


Алгоритмы зеркального спуска в задачах о многоруком бандите

А. В. Назин

Институт проблем управления им. В. А. Трапезникова РАН, г. Москва
Дополнительные материалы:
Adobe PDF 226.3 Kb



Аннотация: Рассматриваются две стохастические задачи о многоруком бандите. Одна «классическая», с конечным числом действий и со случайными потерями (в частном случае, бинарными, принимающими значения 0 или 1). Другая задача, как обобщение предыдущей, содержит потери, зависящие еще и от состояния наблюдаемой стационарной конечной марковской цепи. На основе оптимизационного подхода получены рекуррентные алгоритмы зеркального спуска. Доказаны верхние границы превышения средних потерь над их минимальным значением. Обсуждаются также и нижние границы для этих задач. Доказывается, что верхние и нижние границы совпадают с точностью до логарифмического множителя.

Дополнительные материалы: mnu_27_04_2013.pdf (226.3 Kb)
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024