|
|
Семинар отдела управляемых систем
15 мая 2014 г., г. Екатеринбург, ул. С. Ковалевской, 16, комн. 322
|
|
|
|
|
|
Стратегии управления с поводырем в марковских играх
Ю. В. Авербух |
Количество просмотров: |
Эта страница: | 185 |
|
Аннотация:
Рассматривается система большого числа частиц, каждая из которых может находится в одном из нескольких состояний. Элементарное событие в этом случае – смена состояния частицы, вероятность этого события определяется колмогоровской матрицей. Динамика вектора населенности каждого состояния (отношение числа частиц, находящихся в данном состоянии к общему числу частиц) в этом случая является марковской цепью. При этом колмогоровская матрица может зависеть от времени и вектора населенности. В.Н. Колокольцов показал, что при стремлении числа частиц к бесконечности марковская цепь сходится к некоторой детерминированной системе. В настоящем докладе мы предполагаем, что колмогоровская матрица является управляемой, т. е. кроме зависимости от времени и фазовой переменой, есть дополнительная зависимость от управлений двух игроков. Такие игры называют марковскими. Мы рассматриваем антагонистический случай. Показано, что по функции цены в детерминированной предельной игре можно построить поводырь, который обеспечивает приближенное решение в марковской игре. Расстояние между реализацией марковской игры и реализацией поводыря пропорционально $N^{-1/3}$ с вероятностью $\thicksim N^{-1/3}$, где $N$ – число частиц.
|
|