Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Общемосковский постоянный научный семинар «Теория автоматического управления и оптимизации»
28 ноября 2023 г. 11:30–13:00, г. Москва, очно: ИПУ РАН, +трансляция ZOOM, идентификатор конференции 425 322 745 Для получения ссылки и пароля напишите e-mail на stefa@ipu.ru (+копия rezkov@ipu.ru)
 


Обучение с подкреплением для управления: проблемы стабилизации динамических систем

Павел Осиненко

Сколковский институт науки и технологий, территория Инновационного Центра "Сколково"

Количество просмотров:
Эта страница:118

Аннотация: Обучение с подкреплением - это общая методология адаптивного оптимального управления, которая находит всё более широкое применение в областях, начиная с видеоигр и заканчивая роботами-манипуляторами. Несмотря на многообещающие результаты, регуляторы на основе обучения с подкреплением не гарантируют устойчивости объекта управления, что снижает их применимость в промышленности. Для обеспечения таких гарантий необходимо принимать меры. В связи с этим возникает область, которую можно назвать стабилизирующим обучением с подкреплением. Конкретные подходы варьируются от задействования людей-контролёров для отсеивания небезопасных управляющий воздействий до так называемых формально верифицированных экранов и интеграции с классическими стабилизирующими контроллерами. На этом семинаре мы рассмотрим некоторые современные подходы к обеспечению стабилизации в регуляторах обучения с подкреплением и обсудим открытые вопросы.
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024