Известия Кабардино-Балкарского научного центра РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Известия Кабардино-Балкарского научного центра РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Известия Кабардино-Балкарского научного центра РАН, 2021, выпуск 3, страницы 32–44
DOI: https://doi.org/10.35330/1991-6639-2021-3-101-32-44
(Mi izkab354)
 

ТЕХНИЧЕСКИЕ НАУКИ

Классификация задач мультиагентного обучения с подкреплением

В. И. Петренко

Федеральное государственное автономное образовательное учреждение высшего образования «Северо-Кавказский федеральный университет», 355017, Ставропольский край, г. Ставрополь, ул. Пушкина, 1
Список литературы:
Аннотация: C появлением глубокого одноагентного обучения с подкреплением (ООП) мультиагентное обучение с подкреплением (МОП) получило новый толчок к развитию в виде глубокого МОП (ГМОП). Активное развитие методов данной области в течение последних нескольких лет актуализирует вопросы их систематизации и классификации. Существующие работы в качестве признаков классификации используют механизмы, применяемые в соответствующих методах ГМОП. Однако применимость того или иного метода определяется не только классом метода, но и классом задачи МОП. Целью данной работы являются формализация и классификация задач МОП. Для достижения цели выполнены математическая формализация и обобщение существующих классификаций задач ООП. Рассмотрены и математически формализованы особенности, возникающие при переходе от задачи ООП к задаче МОП. Выделены существенные признаки и выполнена классификация задач МОП на основе теоретико-множественного подхода. Использование теоретико-множественного подхода позволило выявить классы задач МОП, обобщаемые в других подобных работах, однако обладающие специфическими свойствами, что может быть использовано при разработке более эффективных методов решения таких задач МОП. Ожидается, что предложенные формализм и классификация задач МОП будут полезны исследователям в качестве инструмента постановки задачи и определения места исследования в общей структуре методов и задач МОП, а также разработчикам для обоснованного выбора методов МОП на основе класса решаемой задачи.
Ключевые слова: мультиагентное обучение с подкреплением, мультиагентные системы, классификация.
Поступила в редакцию: 27.05.2021
Тип публикации: Статья
УДК: 004.852
MSC: 68T05
Образец цитирования: В. И. Петренко, “Классификация задач мультиагентного обучения с подкреплением”, Известия Кабардино-Балкарского научного центра РАН, 2021, № 3, 32–44
Цитирование в формате AMSBIB
\RBibitem{Pet21}
\by В.~И.~Петренко
\paper Классификация задач мультиагентного обучения
с подкреплением
\jour Известия Кабардино-Балкарского научного центра РАН
\yr 2021
\issue 3
\pages 32--44
\mathnet{http://mi.mathnet.ru/izkab354}
\crossref{https://doi.org/10.35330/1991-6639-2021-3-101-32-44}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/izkab354
  • https://www.mathnet.ru/rus/izkab/y2021/i3/p32
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Известия Кабардино-Балкарского научного центра РАН Известия Кабардино-Балкарского научного центра РАН
    Статистика просмотров:
    Страница аннотации:110
    PDF полного текста:169
    Список литературы:20
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024