Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2023, выпуск 3, страницы 84–97
DOI: https://doi.org/10.14357/20718594230309
(Mi iipr40)
 

Машинное обучение, нейронные сети

Методы внутренней мотивации в задачах обучения с подкреплением на основе модели

А. К. Латышевa, А. И. Пановbc

a Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия
b Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
c Институт искусственного интеллекта AIRI, Москва, Россия
Аннотация: Обучение с подкреплением предлагает широкий спектр методов решения задач управления поведением интеллектуальных агентов. Однако актуальной остается проблема обучения агента в условиях редкого получения сигнала вознаграждения. Возможным решением является использование методов внутренней мотивации – идеи, пришедшей из психологии развития, объясняющей поведение человека в отсутствии внешних управляющих стимулов. В статье рассмотрены существующие методы определения внутренней мотивации, опирающиеся на обучаемую модель мира. Предложена систематизация методов, состоящая из трех классов, которые различаются по способу приложения модели к компонентам агента: вознаграждению, исследовательской стратегии и внутренним целям. Представлен единая схема описания архитектуры агента, использующего модель среды и внутреннюю мотивацию для ускорения обучения. Проанализированы перспективы развития новых методов в данном направлении.
Ключевые слова: внутренняя мотивация, обучение с подкреплением, модель мира, исследование среды.
Финансовая поддержка Номер гранта
Правительство Российской Федерации 70-2021-00138
Работа выполнена при поддержке Аналитического центра при Правительстве Российской Федерации в соответствии с договором о субсидии (идентификатор договора 000000D730321P5Q0002; грант № 70-2021-00138).
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: А. К. Латышев, А. И. Панов, “Методы внутренней мотивации в задачах обучения с подкреплением на основе модели”, Искусственный интеллект и принятие решений, 2023, № 3, 84–97
Цитирование в формате AMSBIB
\RBibitem{LatPan23}
\by А.~К.~Латышев, А.~И.~Панов
\paper Методы внутренней мотивации в задачах обучения с подкреплением на основе модели
\jour Искусственный интеллект и принятие решений
\yr 2023
\issue 3
\pages 84--97
\mathnet{http://mi.mathnet.ru/iipr40}
\crossref{https://doi.org/10.14357/20718594230309}
\elib{https://elibrary.ru/item.asp?id=54684782}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr40
  • https://www.mathnet.ru/rus/iipr/y2023/i3/p84
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
    Статистика просмотров:
    Страница аннотации:14
    PDF полного текста:8
    Первая страница:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024