А. И. Панов, “Одновременное планирование и обучение в иерархической системе управления когнитивным агентом”, Автомат. и телемех., 2022, № 6, 53–71; Autom. Remote Control, 83:6 (2022), 869

Автоматика и телемеханика

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор
	Правила для авторов
	Загрузить рукопись

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Автомат. и телемех.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Автоматика и телемеханика, 2022, выпуск 6, страницы 53–71
DOI: https://doi.org/10.31857/S0005231022060058 (Mi at15976)

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Одновременное планирование и обучение в иерархической системе управления когнитивным агентом

А. И. Панов^ab

^a Федеральный исследовательский центр “Информатика и управление” РАН, Москва
^b Московский физико-технический институт (национальный исследовательский университет)

PDF полного текста (1001 kB) Первая страница Список цитирования (4)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.31857/S0005231022060058

Аннотация: Задачи планирования поведения и обучения принятию решений в динамической среде в системах управления интеллектуальными агентами обычно разделяют и рассматривают отдельно. Предложена новая объединенная иерархическая постановка задачи одновременно планирования и обучения (SLAP) в контексте предметного обучения с подкреплением и описана архитектура когнитивного агента, решающего данную задачу. Предложен новый алгоритм обучения действиям в частично наблюдаемой внешней среде с использованием подкрепляющего сигнала, предметного описания состояний внешней среды и динамически обновляемых планов действий. Рассмотрены основные свойства и преимущества предложенного алгоритма, среди которых — отсутствие фиксированного когнитивного цикла, вследствие которого ранее приходилось использовать разделение подсистем планирования и обучения, возможность строить и обновлять модель взаимодействия со средой, что повышает эффективность обучения. Предложено теоретическое обоснование некоторых положений данного подхода, предложен модельный пример и продемонстрирован принцип работы SLAP агента при управлении беспилотным автомобилем.

Ключевые слова: обучение с подкреплением, планирование поведения, когнитивный агент, иерархическое планирование, системы управления, беспилотный транспорт, мобильные роботы.

Финансовая поддержка	Номер гранта
Российский фонд фундаментальных исследований	18-29-22027
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 18-29-22027).

Статья представлена к публикации членом редколлегии: О. П. Кузнецов

Поступила в редакцию: 31.10.2021
После доработки: 09.01.2022
Принята к публикации: 26.01.2022

Англоязычная версия:
Automation and Remote Control, 2022, Volume 83, Issue 6, Pages 869–883
DOI: https://doi.org/10.1134/S0005117922060054

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: А. И. Панов, “Одновременное планирование и обучение в иерархической системе управления когнитивным агентом”, Автомат. и телемех., 2022, № 6, 53–71; Autom. Remote Control, 83:6 (2022), 869–883

Цитирование в формате AMSBIB

\RBibitem{Pan22}

\by А.~И.~Панов

\paper Одновременное планирование и обучение в~иерархической системе управления когнитивным агентом

\jour Автомат. и телемех.

\yr 2022

\issue 6

\pages 53--71

\mathnet{http://mi.mathnet.ru/at15976}

\crossref{https://doi.org/10.31857/S0005231022060058}

\edn{https://elibrary.ru/ACLEUU}

\transl

\jour Autom. Remote Control

\yr 2022

\vol 83

\issue 6

\pages 869--883

\crossref{https://doi.org/10.1134/S0005117922060054}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/at15976

https://www.mathnet.ru/rus/at/y2022/i6/p53

Эта публикация цитируется в следующих 4 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	104
Список литературы:	33
Первая страница:	18

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы