|
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Исследование нейросетевых алгоритмов прогнозирования движений человека на базе LSTM и трансформеров
С. В. Жиганов, Ю. С. Иванов, Д. М. Грабарь Комсомольский-на-Амуре государственный университет, Комсомольск-на-Амуре, Россия
Аннотация:
Решена задача прогнозирования положения человека на будущих кадрах видеопотока и проведены глубокие экспериментальные исследования по применению традиционных и SOTA блоков для данной задачи. Представлены оригинальная архитектура KeyFNet и ее модификации, основанная на трансформеных блоках, способная предсказать координаты в видеопотоке на 30, 60, 90 и 120 кадров вперед с высокой точностью. Новизна состоит в применении комбинированного алгоритма на основе нескольких блоков FNet с быстрым преобразованием Фурье в качестве механизма внимания, конкатенирующих координаты ключевых точек. Проведенные эксперименты на Human3.6M и на собственных реальных данных подтвердили эффективность предложенного подхода на базе блоков FNet, в сравнении с традиционным подходом, основанным на LSTM. Предлагаемый алгоритм соответствует по точности передовым моделям, но превосходит их по скорости и использует меньше ресурсов для вычисления и может быть применен в коллаборативных робототехнических решениях.
Ключевые слова:
прогнозирование ключевых точек, трансформеры, коллаборативные робототехнические системы, глубокое обучение.
Образец цитирования:
С. В. Жиганов, Ю. С. Иванов, Д. М. Грабарь, “Исследование нейросетевых алгоритмов прогнозирования движений человека на базе LSTM и трансформеров”, Докл. РАН. Матем., информ., проц. упр., 514:2 (2023), 364–374; Dokl. Math., 108:suppl. 2 (2023), S484–S493
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma480 https://www.mathnet.ru/rus/danma/v514/i2/p364
|
Статистика просмотров: |
Страница аннотации: | 62 | Список литературы: | 18 |
|