Loading [MathJax]/jax/output/SVG/config.js
Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 251–259
DOI: https://doi.org/10.31857/S2686954324700619
(Mi danma604)
 

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Среды для тестирования методов автоматической генерации расписания обучения: краткий обзор

М. И. Нестероваabc, А. А. Скрынникac, А. И. Пановabc

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
b Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
c AIRI, Москва, Россия
Аннотация: В рамках обучения с подкреплением существует множество методов, в которых агент учится выполнять различные задания. Например, такой подход может быть востребован в обучении универсального агента, способного решать широкий спектр задач, или специализированного агента, который обучается конкретному навыку. Применение расписания обучения для определения порядка изучения заданий помогает повысить производительность и эффективность процесса обучения агента. При изучении таких методов важным для обучения и тестирования является правильный выбор сред. В нашей статье представлен обзор сред, подходящих для оценки различных методов, и выделены их ключевые различия. Подробно описаны компоненты заданий и классификация существующих методов на основе расписания обучения. Мы предоставляем исследователям необходимую информацию о выборе и использовании сред для анализа и создания методов на основе расписания обучения.
Ключевые слова: обучение с подкреплением, расписание обучения, многозадачное обучение, глубокое обучение.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 075-15-2024-544
Работа выполнена при поддержке Министерства науки и высшего образования Российской Федерации в рамках проекта 075-15-2024-544.
Поступило: 20.09.2024
Принято к публикации: 02.10.2024
Англоязычная версия:
Doklady Mathematics, 2024, Volume 110, Issue suppl. 2, Pages S223–S229
DOI: https://doi.org/10.1134/S1064562424602099
Реферативные базы данных:
Тип публикации: Статья
УДК: 517.977
Образец цитирования: М. И. Нестерова, А. А. Скрынник, А. И. Панов, “Среды для тестирования методов автоматической генерации расписания обучения: краткий обзор”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 251–259; Dokl. Math., 110:suppl. 2 (2024), S223–S229
Цитирование в формате AMSBIB
\RBibitem{NesSkrPan24}
\by М.~И.~Нестерова, А.~А.~Скрынник, А.~И.~Панов
\paper Среды для тестирования методов автоматической генерации расписания обучения: краткий обзор
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2024
\vol 520
\issue 2
\pages 251--259
\mathnet{http://mi.mathnet.ru/danma604}
\crossref{https://doi.org/10.31857/S2686954324700619}
\elib{https://elibrary.ru/item.asp?id=80287452}
\transl
\jour Dokl. Math.
\yr 2024
\vol 110
\issue suppl. 2
\pages S223--S229
\crossref{https://doi.org/10.1134/S1064562424602099}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma604
  • https://www.mathnet.ru/rus/danma/v520/i2/p251
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
    Статистика просмотров:
    Страница аннотации:16
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025