Математическая теория игр и её приложения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



МТИП:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математическая теория игр и её приложения, 2023, том 15, выпуск 3, страницы 88–106 (Mi mgta337)  

Алгоритм зеркального спуска в задаче об одноруком бандите

Дмитрий Н. Шиян

Новгородский государственный университет им. Ярослава Мудрого 173003, Великий Новгород, ул. Б.С.-Петербургская, 41
Список литературы:
Аннотация: Рассматривается применение алгоритма зеркального спуска (АЗС) в задаче об одноруком бандите в минимаксной постановке применительно к обработке данных. Данная задача известна также как игра с природой, в которой платежной функцией игрока является математическое ожидание полного дохода. Игроку необходимо в процессе управления определить наиболее эффективный метод из двух доступных и обеспечить его преимущественное применение. При этом априорная эффективность одного из методов известна. В данной статье рассмотрена модификация АЗС, позволяющая улучшить эффективность управления за счет использования дополнительной информации. Предложенная стратегия сохраняет характерное свойство стратегий для одноруких бандитов – если известное действие будет однажды применено, то оно будет применяться до конца управления. Рассмотрены модификации для алгоритма для одиночной обработки и для его пакетной версии. Пакетная обработка интересна тем, что полное время обработки определяется количеством пакетов, а не исходным количеством данных, при возможности обеспечить параллельную обработку данных в пакетах. Для предложенных алгоритмов с помощью моделирования методом Монте-Карло были вычислены оптимальные значения настраиваемых параметров и получены оценки минимаксного риска.
Ключевые слова: задача о двуруком бандите, задача об одноруком бандите, минимаксный подход, алгоритм зеркального спуска, EXP3, пакетная обработка.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 20-01-00062
Исследование выполнено при финансовой поддержке РФФИ, научный проект номер 20-01-00062.
Поступила в редакцию: 04.04.2023
Исправленный вариант: 10.06.2023
Принята в печать: 01.09.2023
Тип публикации: Статья
УДК: 519.832, 519.245
ББК: 22.18
Образец цитирования: Дмитрий Н. Шиян, “Алгоритм зеркального спуска в задаче об одноруком бандите”, МТИП, 15:3 (2023), 88–106
Цитирование в формате AMSBIB
\RBibitem{Shi23}
\by Дмитрий~Н.~Шиян
\paper Алгоритм зеркального спуска в задаче об одноруком бандите
\jour МТИП
\yr 2023
\vol 15
\issue 3
\pages 88--106
\mathnet{http://mi.mathnet.ru/mgta337}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mgta337
  • https://www.mathnet.ru/rus/mgta/v15/i3/p88
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математическая теория игр и её приложения
    Статистика просмотров:
    Страница аннотации:29
    PDF полного текста:19
    Список литературы:13
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024