|
ТЕХНИЧЕСКИЕ НАУКИ
Классификация задач мультиагентного обучения
с подкреплением
В. И. Петренко Федеральное государственное автономное образовательное учреждение высшего образования
«Северо-Кавказский федеральный университет»,
355017, Ставропольский край, г. Ставрополь, ул. Пушкина, 1
Аннотация:
C появлением глубокого одноагентного обучения с подкреплением (ООП) мультиагентное обучение с подкреплением (МОП) получило новый толчок к развитию в виде глубокого МОП (ГМОП).
Активное развитие методов данной области в течение последних нескольких лет актуализирует
вопросы их систематизации и классификации. Существующие работы в качестве признаков
классификации используют механизмы, применяемые в соответствующих методах ГМОП. Однако применимость того или иного метода определяется не только классом метода, но и классом
задачи МОП. Целью данной работы являются формализация и классификация задач МОП. Для
достижения цели выполнены математическая формализация и обобщение существующих классификаций задач ООП. Рассмотрены и математически формализованы особенности, возникающие при переходе от задачи ООП к задаче МОП. Выделены существенные признаки и выполнена
классификация задач МОП на основе теоретико-множественного подхода. Использование теоретико-множественного подхода позволило выявить классы задач МОП, обобщаемые в других
подобных работах, однако обладающие специфическими свойствами, что может быть использовано при разработке более эффективных методов решения таких задач МОП. Ожидается, что
предложенные формализм и классификация задач МОП будут полезны исследователям в качестве инструмента постановки задачи и определения места исследования в общей структуре методов и задач МОП, а также разработчикам для обоснованного выбора методов МОП на основе
класса решаемой задачи.
Ключевые слова:
мультиагентное обучение с подкреплением, мультиагентные системы,
классификация.
Поступила в редакцию: 27.05.2021
Образец цитирования:
В. И. Петренко, “Классификация задач мультиагентного обучения
с подкреплением”, Известия Кабардино-Балкарского научного центра РАН, 2021, № 3, 32–44
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/izkab354 https://www.mathnet.ru/rus/izkab/y2021/i3/p32
|
Статистика просмотров: |
Страница аннотации: | 110 | PDF полного текста: | 169 | Список литературы: | 20 |
|