|
Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)
Одновременное планирование и обучение в иерархической системе управления когнитивным агентом
А. И. Пановab a Федеральный исследовательский центр “Информатика и управление” РАН, Москва
b Московский физико-технический институт (национальный исследовательский университет)
Аннотация:
Задачи планирования поведения и обучения принятию решений в динамической среде в системах управления интеллектуальными агентами обычно разделяют и рассматривают отдельно. Предложена новая объединенная иерархическая постановка задачи одновременно планирования и обучения (SLAP) в контексте предметного обучения с подкреплением и описана архитектура когнитивного агента, решающего данную задачу. Предложен новый алгоритм обучения действиям в частично наблюдаемой внешней среде с использованием подкрепляющего сигнала, предметного описания состояний внешней среды и динамически обновляемых планов действий. Рассмотрены основные свойства и преимущества предложенного алгоритма, среди которых — отсутствие фиксированного когнитивного цикла, вследствие которого ранее приходилось использовать разделение подсистем планирования и обучения, возможность строить и обновлять модель взаимодействия со средой, что повышает эффективность обучения. Предложено теоретическое обоснование некоторых положений данного подхода, предложен модельный пример и продемонстрирован принцип работы SLAP агента при управлении беспилотным автомобилем.
Ключевые слова:
обучение с подкреплением, планирование поведения, когнитивный агент, иерархическое планирование, системы управления, беспилотный транспорт, мобильные роботы.
Образец цитирования:
А. И. Панов, “Одновременное планирование и обучение в иерархической системе управления когнитивным агентом”, Автомат. и телемех., 2022, № 6, 53–71; Autom. Remote Control, 83:6 (2022), 869–883
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/at15976 https://www.mathnet.ru/rus/at/y2022/i6/p53
|
Статистика просмотров: |
Страница аннотации: | 98 | Список литературы: | 33 | Первая страница: | 18 |
|