Аннотация:
Глубокое обучение с подкреплением в приложении к задаче локомоции роботовПоследние несколько лет методы глубокого обучения с подкреплением показывают
впечатляющие результаты в различных задачах локомоции (т.е. движения, перемещения)
роботов в рамках компьютерных симуляций (моделирования). Не смотря на это, применение
этих методов к локомоции реальных роботов пока не получило широкого распространения.
В реальных системах предпочтение отдаётся более традиционным методам управления
и оптимизации, основанных на знании моделей и уравнений движения, (см., например,
роботы Boston Dynamics). В чём причина? На семинаре будут рассмотрены некоторые
современные методы обучения с подкреплением, актуальные для задач с непрерывными
моделями, будут обсуждены их достоинства и недостатки применительно к задаче локомоции.
Также будут указаны некоторые аспекты задач, которым, по нашему мнению, уделяется
недостаточно внимания, но которые важны для успешного перехода от мира симуляций
к реальным роботам.