Семинары: Глеб Гусев, Применение алгоритмов многорукого бандита к задачам веб-поиска

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Коллоквиум Факультета компьютерных наук НИУ ВШЭ
13 ноября 2014 г. 16:40–18:00, г. Москва, Покровский бульвар 11

Применение алгоритмов многорукого бандита к задачам веб-поиска

Глеб Гусев

Компания «Яндекс»

*Дополнительные материалы:*
	Adobe PDF	1.2 Mb

Количество просмотров:
Эта страница:	458
Материалы:	128
Youtube:

https://www.youtube.com/watch?v=BBHR5l7iUlU

Аннотация: Доклад посвящен знаменитой проблеме многорукого бандита и ее применениям в веб-поиске. Проблема происходит от задачи игрока в казино, который дергает ручки игральных автоматов.
Шаг игры состоит в том, что игрок выбирает ручку, получает некоторый выигрыш, который является выборкой из некоторого заранее неизвестного вероятностного распределения, ассоциированного с данной ручкой, и обновляет информацию о наблюдаемых выигрышах выбранной ручки. Цель игрока — максимизировать математическое ожидание суммарного выигрыша, полученного игроком в течение некоторого определенного количества шагов. Для этого ему приходится выбирать баланс между эксплуатированием ручек, которые которые приносили выигрыш в прошлом, и экспериментированием с ручками, которые недостаточно хорошо были опробованы ранее.
Задача коммерческой поисковой системы обычно рассматривается как задача машинного обучения: есть примеры размеченных релевантных и нерелевантных пар (запрос, документ), есть набор числовых признаков, которые могут быть автоматически посчитаны для любой такой пары, и нужно обучить модель (функцию от признаков), которая ранжирует документы по убыванию их релевантности. Однако, это лишь первое приближение к задаче. Оно не учитывает интерактивную оставляющую взаимодействия с пользователями, которые своим поведением на страницах с результатами поиска дают системе неявный фид-бек. Задача поисковой системы может быть сформулирована как задача многорукого бандита различными способами. Я рассмотрю основные имеющиеся подходы, некоторые недавние продвижения и дальнейшие актуальные задачи в этом направлении.

Дополнительные материалы:

presentation.pdf (1.2 Mb)

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы