|
Эта публикация цитируется в 9 научных статьях (всего в 10 статьях)
Теория автоматов
Гауссовский двурукий бандит: предельное описание
А. В. Колногоров Новгородский государственный университет им. Ярослава Мудрого, кафедра прикладной математики и информатики
Аннотация:
Для гауссовского двурукого бандита, который возникает при анализе пакетной обработки данных, изучается предельное поведение минимаксного риска, если горизонт управления $N$ неограниченно растет. Минимаксный риск ищется как байесовский, вычисленный относительно наихудшего априорного распределения. Показано, что наиболее высокие требования к управлению предъявляются в области “близких” распределений, где математические ожидания доходов различаются на величину порядка $N^{-1/2}$. В области “близких” распределений получены рекуррентное интегро-разностное уравнение для нахождения байесовского риска относительно наихудшего априорного распределения в инвариантной форме с горизонтом управления, равным единице, и дифференциальное уравнение в частных производных второго порядка в предельном случае. Результаты позволяют оценить качество пакетной обработки. Например, минимаксный риск, соответствующий пакетной обработке данных, разбитых на $50$ пакетов, может быть лишь на $2\%$ выше своего предельного значения, если число пакетов неограниченно растет. В случае бернуллиевского двурукого бандита показано, что оптимальная обработка данных по одному не является более эффективной, чем пакетная, если $N$ неограниченно растет.
Ключевые слова:
гауссовский двурукий бандит, минимаксный и байесовский подходы, пакетная обработка, асимптотическая минимаксная теорема.
Поступила в редакцию: 06.04.2020 После переработки: 02.06.2020 Принята к печати: 02.06.2020
Образец цитирования:
А. В. Колногоров, “Гауссовский двурукий бандит: предельное описание”, Пробл. передачи информ., 56:3 (2020), 86–111; Problems Inform. Transmission, 56:3 (2020), 278–301
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ppi2323 https://www.mathnet.ru/rus/ppi/v56/i3/p86
|
Статистика просмотров: |
Страница аннотации: | 266 | PDF полного текста: | 24 | Список литературы: | 32 | Первая страница: | 16 |
|