|
Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)
Методы управления и обработки информации
Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации
Д. В. Иванькоa, А. А. Карповb a Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО)
b Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)
Аннотация:
Рассматриваются актуальные и перспективные направления по использованию высокоскоростных видеокамер. Обсуждается возможность применения высокоскоростных камер в области человеко-машинного взаимодействия для автоматического распознавания динамической видеоинформации (в том числе визуальной речи диктора). Выделяются основные задачи взаимодействия, решаемые с помощью высокоскоростных камер, такие как: автоматическое чтение речи по губам диктора, обнаружение моргания, распознавание микровыражений. Обозначаются возможные проблемы, связанные с внедрением высокоскоростных видеокамер. Анализируется состояние области исследований на настоящий момент и доказывается, что имеется высокая актуальность развития данного научно-технического направления. Предлагаются многообещающие области применения и задачи организации человеко-машинного взаимодействия с применением высокоскоростной видеосъемки. Основными направлениями являются аудиовизуальное распознавание слитной речи и чтение речи по губам диктора. В ходе дальнейших исследований планируется реализация подобной многомодальной системы аудиовизуального распознавания речи для русского языка с использованием микрофона и высокоскоростной видеокамеры JAI Pulnix.
Ключевые слова:
высокоскоростная видеокамера; компьютерное зрение; аудиовизуальное распознавание речи; аудиовизуальная база данных; чтение по губам; динамическая видеоинформация.
Образец цитирования:
Д. В. Иванько, А. А. Карпов, “Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации”, Тр. СПИИРАН, 44 (2016), 98–113
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy857 https://www.mathnet.ru/rus/trspy/v44/p98
|
Статистика просмотров: |
Страница аннотации: | 162 | PDF полного текста: | 57 |
|