Семинары: А. В. Назин, Алгоритмы зеркального спуска в задачах о многоруком бандите

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Стохастический анализ в задачах
27 апреля 2013 г. 11:00, г. Москва, Большой Власьевский переулок, дом 11

Алгоритмы зеркального спуска в задачах о многоруком бандите

А. В. Назин

Институт проблем управления им. В. А. Трапезникова РАН, г. Москва

*Дополнительные материалы:*
	Adobe PDF	226.3 Kb

Количество просмотров:
Эта страница:	629
Материалы:	108
Youtube:

http://www.youtube.com/watch?v=ioxvHQOxhNo

Аннотация: Рассматриваются две стохастические задачи о многоруком бандите. Одна «классическая», с конечным числом действий и со случайными потерями (в частном случае, бинарными, принимающими значения 0 или 1). Другая задача, как обобщение предыдущей, содержит потери, зависящие еще и от состояния наблюдаемой стационарной конечной марковской цепи. На основе оптимизационного подхода получены рекуррентные алгоритмы зеркального спуска. Доказаны верхние границы превышения средних потерь над их минимальным значением. Обсуждаются также и нижние границы для этих задач. Доказывается, что верхние и нижние границы совпадают с точностью до логарифмического множителя.

Дополнительные материалы:

mnu_27_04_2013.pdf (226.3 Kb)

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы