|
Математическое моделирование
Invariant description of control in a Gaussian one-armed bandit problem
[Инвариантное описание управления в задаче о гауссовском одноруком бандите]
A. V. Kolnogorov Yaroslav-the-Wise Novgorod State University, Veliky Novgorod, Russian Federation
Аннотация:
Рассматривается задача об одноруком бандите в приложении к пакетной обработке данных, если имеются два альтернативных метода обработки с разной эффективностью, причем эффективность второго метода априори неизвестна. В процессе обработки необходимо определить наиболее эффективный метод и обеспечить его преимущественное использование. Обработка выполняется пакетами, поэтому распределение доходов является гауссовским. Мы рассматриваем случай априори неизвестных математического ожидания и дисперсии одношагового дохода, соответствующих второму действию. Этот случай описывает ситуацию, когда сами пакеты и их количество имеют умеренные или небольшие объемы. Получены рекуррентные уравнения для вычисления байесовского риска и функции потерь, которые затем представлены в инвариантном виде с горизонтом управления, равным единице. Это позволяет получить оценки байесовского и минимаксного рисков, которые справедливы для всех горизонтов управления, кратных количеству обработанных пакетов.
Ключевые слова:
однорукий бандит, пакетная обработка, байесовский и минимаксный подходы, инвариантное описание.
Поступила в редакцию: 22.11.2023
Образец цитирования:
A. V. Kolnogorov, “Invariant description of control in a Gaussian one-armed bandit problem”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 17:1 (2024), 27–36
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vyuru709 https://www.mathnet.ru/rus/vyuru/v17/i1/p27
|
Статистика просмотров: |
Страница аннотации: | 53 | PDF полного текста: | 22 | Список литературы: | 14 |
|