Математическая теория игр и её приложения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



МТИП:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математическая теория игр и её приложения, 2023, том 15, выпуск 4, страницы 3–27 (Mi mgta328)  

Стратегии UCB и оптимизация пакетной обработки в задаче об одноруком бандите

Сергей В. Гарбарь, Александр В. Колногоров, Алексей Н. Лазутченко

Новгородский государственный университет им. Ярослава Мудрого, 173003, Великий Новгород, ул. Б.С.-Петербургская, 41
Список литературы:
Аннотация: Рассматривается задача о гауссовском одноруком бандите, которая возникает при оптимизации пакетной обработки данных, если имеются два альтернативных метода обработки с априори известной эффективностью первого метода. В процессе обработки необходимо определить более эффективный метод и обеспечить его преимущественное использование. Данная задача оптимального управления имеет интерпретацию как игра с природой. Мы исследуем случаи известной и априори неизвестной дисперсии дохода, соответствующей второму методу. Цель управления рассматривается в минимаксной постановке, а для ее обеспечения используются стратегии UCB. Во всех исследуемых случаях получены инвариантные описания управления на единичном горизонте, которые зависят только от количества пакетов, на которые разбиты данные, но не от их полного числа. Эти описания позволяют определить приблизительно оптимальные параметры стратегий с помощью моделирования методом Монте-Карло. Численные результаты показывают высокую эффективность предложенных стратегий UCB.
Ключевые слова: гауссовский однорукий бандит, минимаксный подход, правило UCB, инвариантное описание, моделирование Монте-Карло.
Финансовая поддержка Номер гранта
Российский научный фонд 23-21-00447
Исследование выполнено за счет гранта Российского научного фонда № 23-21-00447, https://rscf.ru/project/23-21-00447/.
Поступила в редакцию: 07.05.2023
Исправленный вариант: 24.10.2023
Принята в печать: 01.12.2023
Тип публикации: Статья
УДК: 519.832, 519.245
ББК: 22.18
Образец цитирования: Сергей В. Гарбарь, Александр В. Колногоров, Алексей Н. Лазутченко, “Стратегии UCB и оптимизация пакетной обработки в задаче об одноруком бандите”, МТИП, 15:4 (2023), 3–27
Цитирование в формате AMSBIB
\RBibitem{GarKolLaz23}
\by Сергей~В.~Гарбарь, Александр~В.~Колногоров, Алексей~Н.~Лазутченко
\paper Стратегии UCB и оптимизация пакетной обработки в задаче об одноруком бандите
\jour МТИП
\yr 2023
\vol 15
\issue 4
\pages 3--27
\mathnet{http://mi.mathnet.ru/mgta328}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mgta328
  • https://www.mathnet.ru/rus/mgta/v15/i4/p3
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математическая теория игр и её приложения
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024