Автоматика и телемеханика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Автомат. и телемех.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Автоматика и телемеханика, 2022, выпуск 6, страницы 53–71
DOI: https://doi.org/10.31857/S0005231022060058
(Mi at15976)
 

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Одновременное планирование и обучение в иерархической системе управления когнитивным агентом

А. И. Пановab

a Федеральный исследовательский центр “Информатика и управление” РАН, Москва
b Московский физико-технический институт (национальный исследовательский университет)
Список литературы:
Аннотация: Задачи планирования поведения и обучения принятию решений в динамической среде в системах управления интеллектуальными агентами обычно разделяют и рассматривают отдельно. Предложена новая объединенная иерархическая постановка задачи одновременно планирования и обучения (SLAP) в контексте предметного обучения с подкреплением и описана архитектура когнитивного агента, решающего данную задачу. Предложен новый алгоритм обучения действиям в частично наблюдаемой внешней среде с использованием подкрепляющего сигнала, предметного описания состояний внешней среды и динамически обновляемых планов действий. Рассмотрены основные свойства и преимущества предложенного алгоритма, среди которых — отсутствие фиксированного когнитивного цикла, вследствие которого ранее приходилось использовать разделение подсистем планирования и обучения, возможность строить и обновлять модель взаимодействия со средой, что повышает эффективность обучения. Предложено теоретическое обоснование некоторых положений данного подхода, предложен модельный пример и продемонстрирован принцип работы SLAP агента при управлении беспилотным автомобилем.
Ключевые слова: обучение с подкреплением, планирование поведения, когнитивный агент, иерархическое планирование, системы управления, беспилотный транспорт, мобильные роботы.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-29-22027
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 18-29-22027).
Статья представлена к публикации членом редколлегии: О. П. Кузнецов

Поступила в редакцию: 31.10.2021
После доработки: 09.01.2022
Принята к публикации: 26.01.2022
Англоязычная версия:
Automation and Remote Control, 2022, Volume 83, Issue 6, Pages 869–883
DOI: https://doi.org/10.1134/S0005117922060054
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: А. И. Панов, “Одновременное планирование и обучение в иерархической системе управления когнитивным агентом”, Автомат. и телемех., 2022, № 6, 53–71; Autom. Remote Control, 83:6 (2022), 869–883
Цитирование в формате AMSBIB
\RBibitem{Pan22}
\by А.~И.~Панов
\paper Одновременное планирование и обучение в~иерархической системе управления когнитивным агентом
\jour Автомат. и телемех.
\yr 2022
\issue 6
\pages 53--71
\mathnet{http://mi.mathnet.ru/at15976}
\crossref{https://doi.org/10.31857/S0005231022060058}
\edn{https://elibrary.ru/ACLEUU}
\transl
\jour Autom. Remote Control
\yr 2022
\vol 83
\issue 6
\pages 869--883
\crossref{https://doi.org/10.1134/S0005117922060054}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/at15976
  • https://www.mathnet.ru/rus/at/y2022/i6/p53
  • Эта публикация цитируется в следующих 4 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Автоматика и телемеханика
    Статистика просмотров:
    Страница аннотации:98
    Список литературы:33
    Первая страница:18
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024