|
|
Общемосковский постоянный научный семинар «Теория автоматического управления и оптимизации»
28 ноября 2023 г. 11:30–13:00, г. Москва, очно: ИПУ РАН, +трансляция ZOOM, идентификатор конференции 425 322 745 Для получения ссылки и пароля напишите e-mail на stefa@ipu.ru (+копия rezkov@ipu.ru)
|
|
|
|
|
|
Обучение с подкреплением для управления: проблемы стабилизации динамических систем
Павел Осиненко Сколковский институт науки и технологий, территория Инновационного Центра "Сколково"
|
Количество просмотров: |
Эта страница: | 118 |
|
Аннотация:
Обучение с подкреплением - это общая методология адаптивного оптимального управления, которая находит всё более широкое применение в областях, начиная с видеоигр и заканчивая роботами-манипуляторами.
Несмотря на многообещающие результаты, регуляторы на основе обучения с подкреплением не гарантируют устойчивости объекта управления, что снижает их применимость в промышленности.
Для обеспечения таких гарантий необходимо принимать меры.
В связи с этим возникает область, которую можно назвать стабилизирующим обучением с подкреплением.
Конкретные подходы варьируются от задействования людей-контролёров для отсеивания небезопасных управляющий воздействий до так называемых формально верифицированных экранов и интеграции с классическими стабилизирующими контроллерами.
На этом семинаре мы рассмотрим некоторые современные подходы к обеспечению стабилизации в регуляторах обучения с подкреплением и обсудим открытые вопросы.
|
|