А. К. Латышев, А. И. Панов, “Методы внутренней мотивации в задачах обучения с подкреплением на основе модели”, Искусственный интеллект и принятие решений, 2023, № 3, 84

Искусственный интеллект и принятие решений

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Правила для авторов

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Искусственный интеллект и принятие решений, 2023, выпуск 3, страницы 84–97
DOI: https://doi.org/10.14357/20718594230309 (Mi iipr40)

Машинное обучение, нейронные сети

Методы внутренней мотивации в задачах обучения с подкреплением на основе модели

А. К. Латышев^a, А. И. Панов^bc

^a Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия
^b Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
^c Институт искусственного интеллекта AIRI, Москва, Россия

PDF полного текста (919 kB)

DOI: https://doi.org/10.14357/20718594230309

Аннотация: Обучение с подкреплением предлагает широкий спектр методов решения задач управления поведением интеллектуальных агентов. Однако актуальной остается проблема обучения агента в условиях редкого получения сигнала вознаграждения. Возможным решением является использование методов внутренней мотивации – идеи, пришедшей из психологии развития, объясняющей поведение человека в отсутствии внешних управляющих стимулов. В статье рассмотрены существующие методы определения внутренней мотивации, опирающиеся на обучаемую модель мира. Предложена систематизация методов, состоящая из трех классов, которые различаются по способу приложения модели к компонентам агента: вознаграждению, исследовательской стратегии и внутренним целям. Представлен единая схема описания архитектуры агента, использующего модель среды и внутреннюю мотивацию для ускорения обучения. Проанализированы перспективы развития новых методов в данном направлении.

Ключевые слова: внутренняя мотивация, обучение с подкреплением, модель мира, исследование среды.

Финансовая поддержка	Номер гранта
Правительство Российской Федерации	70-2021-00138
Работа выполнена при поддержке Аналитического центра при Правительстве Российской Федерации в соответствии с договором о субсидии (идентификатор договора 000000D730321P5Q0002; грант № 70-2021-00138).

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: А. К. Латышев, А. И. Панов, “Методы внутренней мотивации в задачах обучения с подкреплением на основе модели”, Искусственный интеллект и принятие решений, 2023, № 3, 84–97

Цитирование в формате AMSBIB

\RBibitem{LatPan23}

\by А.~К.~Латышев, А.~И.~Панов

\paper Методы внутренней мотивации в задачах обучения с подкреплением на основе модели

\jour Искусственный интеллект и принятие решений

\yr 2023

\issue 3

\pages 84--97

\mathnet{http://mi.mathnet.ru/iipr40}

\crossref{https://doi.org/10.14357/20718594230309}

\elib{https://elibrary.ru/item.asp?id=54684782}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/iipr40

https://www.mathnet.ru/rus/iipr/y2023/i3/p84

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Искусственный интеллект и принятие решений

Статистика просмотров:
Страница аннотации:	14
PDF полного текста:	8
Первая страница:	1

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы