|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Индекс Гиттинса для простого семейства марковских игровых автоматов при штрафах за переход и отсутствии дисконтирования
М. П. Савелов Новосибирский национальный исследовательский государственный университет, Новосибирск, Россия
Аннотация:
В задаче о марковских игровых автоматах, также известной как задача о многоруком бандите, рассматривается случай, когда отсутствует дисконтирование и присутствуют штрафы за переход от одного игрового автомата к другому, а марковские цепи, задающие эволюцию игровых автоматов, имеют конечное пространство состояний. Оптимальной считается стратегия, имеющая наибольшую среднюю прибыль за единицу времени на бесконечном временном отрезке. В статье доказано, что в данной задаче оптимальная стратегия может быть задана с помощью индекса Гиттинса в случае естественного предположения о неотрицательности штрафов.
Ключевые слова:
многокомпонентные системы, индекс Гиттинса, простое семейство марковских игровых автоматов, задача о многоруком бандите, марковский процесс принятия решений, управляемые марковские процессы, средняя прибыль за единицу времени на бесконечном временном отрезке, отсутствие дисконтирования, штрафы за переходы, оптимальная стратегия.
Поступила в редакцию: 26.03.2019 Принята в печать: 20.06.2019
Образец цитирования:
М. П. Савелов, “Индекс Гиттинса для простого семейства марковских игровых автоматов при штрафах за переход и отсутствии дисконтирования”, Теория вероятн. и ее примен., 64:3 (2019), 442–455; Theory Probab. Appl., 64:3 (2019), 355–364
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tvp5303https://doi.org/10.4213/tvp5303 https://www.mathnet.ru/rus/tvp/v64/i3/p442
|
Статистика просмотров: |
Страница аннотации: | 419 | PDF полного текста: | 99 | Список литературы: | 51 | Первая страница: | 24 |
|