Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование», 2024, том 17, выпуск 1, страницы 27–36
DOI: https://doi.org/10.14529/mmp240103
(Mi vyuru709)
 

Математическое моделирование

Invariant description of control in a Gaussian one-armed bandit problem
[Инвариантное описание управления в задаче о гауссовском одноруком бандите]

A. V. Kolnogorov

Yaroslav-the-Wise Novgorod State University, Veliky Novgorod, Russian Federation
Список литературы:
Аннотация: Рассматривается задача об одноруком бандите в приложении к пакетной обработке данных, если имеются два альтернативных метода обработки с разной эффективностью, причем эффективность второго метода априори неизвестна. В процессе обработки необходимо определить наиболее эффективный метод и обеспечить его преимущественное использование. Обработка выполняется пакетами, поэтому распределение доходов является гауссовским. Мы рассматриваем случай априори неизвестных математического ожидания и дисперсии одношагового дохода, соответствующих второму действию. Этот случай описывает ситуацию, когда сами пакеты и их количество имеют умеренные или небольшие объемы. Получены рекуррентные уравнения для вычисления байесовского риска и функции потерь, которые затем представлены в инвариантном виде с горизонтом управления, равным единице. Это позволяет получить оценки байесовского и минимаксного рисков, которые справедливы для всех горизонтов управления, кратных количеству обработанных пакетов.
Ключевые слова: однорукий бандит, пакетная обработка, байесовский и минимаксный подходы, инвариантное описание.
Финансовая поддержка Номер гранта
Российский научный фонд 23-21-00447
The research was supported by Russian Science Foundation, project number 23-21-00447, https://rscf.ru/en/project/23-21-00447/.
Поступила в редакцию: 22.11.2023
Тип публикации: Статья
УДК: 519.244, 519.83
MSC: 62C10, 62L05, 91A35
Язык публикации: английский
Образец цитирования: A. V. Kolnogorov, “Invariant description of control in a Gaussian one-armed bandit problem”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 17:1 (2024), 27–36
Цитирование в формате AMSBIB
\RBibitem{Kol24}
\by A.~V.~Kolnogorov
\paper Invariant description of control in a Gaussian one-armed bandit problem
\jour Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование
\yr 2024
\vol 17
\issue 1
\pages 27--36
\mathnet{http://mi.mathnet.ru/vyuru709}
\crossref{https://doi.org/10.14529/mmp240103}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyuru709
  • https://www.mathnet.ru/rus/vyuru/v17/i1/p27
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Статистика просмотров:
    Страница аннотации:53
    PDF полного текста:22
    Список литературы:14
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024