Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Большой семинар кафедры теории вероятностей МГУ
25 ноября 2009 г. 16:45, г. Москва, ГЗ МГУ, ауд. 16-24
 


О новом подходе к решению задач об оптимальной остановке

Э. Л. Пресман

Количество просмотров:
Эта страница:375

Аннотация: Рассматривается задача оптимальной остановки цепи Маркова на бесконечном интервале времени с платой за остановку $g(z)$. И. М. Сонин для случая цепи с конечным числом состояний предложил алгоритм, который позволяет найти функцию выигрыша и множество остановки за конечное число шагов (не более чем в два раза превосходящее число состояний). Алгоритм основан на рассмотрении на каждом этапе новой цепи с новым пространством состояний, когда исключаются состояния, в которых заведомо не нужно останавливаться. Оказалось, что при рассмотрении задачи с произвольным пространством состояний удобно несколько видоизменить алгоритм.
Рассмотрим, как и И. М. Сонин, множество $C_1$, на котором выигрыш от мгновенной остановки меньше выигрыша от остановки на первом шаге. На этом множестве заведомо не нужно останавливаться. Пусть $g_1 (z)$ – выигрыш от остановки в момент первого попадания в дополнительное к $C_1 $ множество. Тогда при естественных предположениях $g_1 (z)$ больше, чем $g(z)$ для $z$, принадлежащих $C_1$, и совпадет с $g(z)$ на дополнительном множестве. Рассмотрим для той же цепи задачу с новой платой за остановку, равной $g_1 (z)$. Очевидно, что эта задача эквивалентна исходной. Добавим теперь к множеству $C_1$ те точки, в которых выигрыш от мгновенной остановки меньше выигрыша от остановки на первом шаге для платы $g_1 (z)$. Получим множество $C_2$ и соответствующую функцию $g_2 (z)$. Последовательное применение этой процедуры приводит к последовательности функций $g_n(z)$ и множеств $C_n$, которые не убывают и сходятся соответственно к функции выигрыша исходной задачи и к множеству продолжения исходной задачи.
Иллюстрируется эффективность этой процедуры и возможности обобщения на случай непрерывного времени.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024