|
Нелинейная динамика, 2012, том 8, номер 4, страницы 689–704
(Mi nd354)
|
|
|
|
Управление манипулятором с помощью обучения с подкреплением
Н. П. Кошманова, Д. С. Трифонов, В. Е. Павловский Институт прикладной математики им. Келдыша РАН, 125047, Россия, г. Москва, Миусская пл., д. 4
Аннотация:
Рассматривается метод построения системы управления роботом-манипулятором с использованием обучения с подкреплением. Система управления будет строиться с помощью обучающегося алгоритма, где информацией для обучения будут совершаемые действия и «награда», — величина, характеризующая качество работы системы управления. Целью обучения является построение алгоритма управления, максимизирующего суммарную награду за некоторый промежуток времени. Алгоритм обучения и построенная в результате его работы система управления протестированы для задачи уклонения манипулятора от летящего в него предмета.
Ключевые слова:
обучение с подкреплением, манипулятор, управление.
Поступила в редакцию: 17.07.2012 Исправленный вариант: 24.08.2012
Образец цитирования:
Н. П. Кошманова, Д. С. Трифонов, В. Е. Павловский, “Управление манипулятором с помощью обучения с подкреплением”, Нелинейная динам., 8:4 (2012), 689–704
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/nd354 https://www.mathnet.ru/rus/nd/v8/i4/p689
|
Статистика просмотров: |
Страница аннотации: | 565 | PDF полного текста: | 412 | Список литературы: | 59 | Первая страница: | 1 |
|