|
|
Большой семинар кафедры теории вероятностей МГУ
19 октября 2011 г. 16:45, г. Москва, Ауд. 16-24
|
|
|
|
|
|
Робастное параллельное управление в случайной среде (задаче о двуруком бандите)
А. В. Колногоров Новгородский государственный университет
|
Количество просмотров: |
Эта страница: | 290 | Материалы: | 44 |
|
Аннотация:
Задача о поведении в случайной среде, известная также как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Минимаксные стратегия и риск ищутся как байесовские, соответствующие наихудшему априорному распределению. Для сред с доходами, имеющими нормальные распределения с единичной дисперсией и математическими ожиданиями, зависящими только от выбираемых вариантов, это распределение может быть выбрано симметрическим и асимптотически однородным.
Предложена стратегия параллельного управления, которая обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска методом динамического программирования. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных, например, в бинарных.
Дополнительные материалы:
normal.pdf (2.4 Mb)
|
|