Семинары: Д. В. Беломестный, Обучение с подкреплением на основе предпочтений

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Семинар «Математические основы искусственного интеллекта»
2 октября 2024 г. 17:00–18:00, г. Москва, МИАН, ул. Губкина, д. 8, конференц-зал, 9 этаж + Zoom

Обучение с подкреплением на основе предпочтений

Д. В. Беломестный^ab

^a University of Duisburg-Essen
^b Национальный исследовательский университет "Высшая школа экономики", г. Москва

Количество просмотров:
Эта страница:	45

Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы