Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Большой семинар кафедры теории вероятностей МГУ
19 октября 2011 г. 16:45, г. Москва, Ауд. 16-24
 


Робастное параллельное управление в случайной среде (задаче о двуруком бандите)

А. В. Колногоров

Новгородский государственный университет
Дополнительные материалы:
Adobe PDF 2.4 Mb

Аннотация: Задача о поведении в случайной среде, известная также как задача о двуруком бандите, рассматривается в робастной (минимаксной) постановке. Минимаксные стратегия и риск ищутся как байесовские, соответствующие наихудшему априорному распределению. Для сред с доходами, имеющими нормальные распределения с единичной дисперсией и математическими ожиданиями, зависящими только от выбираемых вариантов, это распределение может быть выбрано симметрическим и асимптотически однородным.
Предложена стратегия параллельного управления, которая обеспечивает управление, сколь угодно близкое к оптимальному. Получено инвариантное рекуррентное уравнение для нахождения минимаксных стратегии и риска методом динамического программирования. Это позволяет улучшить известные оценки минимаксного риска Фогеля (W. Vogel). Численный анализ показывает, что стратегия хорошо функционирует в средах с распределениями, отличающимися от нормальных, например, в бинарных.

Дополнительные материалы: normal.pdf (2.4 Mb)
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024