Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2016, выпуск 44, страницы 98–113
DOI: https://doi.org/10.15622/sp.44.7
(Mi trspy857)
 

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Методы управления и обработки информации

Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации

Д. В. Иванькоa, А. А. Карповb

a Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО)
b Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)
Аннотация: Рассматриваются актуальные и перспективные направления по использованию высокоскоростных видеокамер. Обсуждается возможность применения высокоскоростных камер в области человеко-машинного взаимодействия для автоматического распознавания динамической видеоинформации (в том числе визуальной речи диктора). Выделяются основные задачи взаимодействия, решаемые с помощью высокоскоростных камер, такие как: автоматическое чтение речи по губам диктора, обнаружение моргания, распознавание микровыражений. Обозначаются возможные проблемы, связанные с внедрением высокоскоростных видеокамер. Анализируется состояние области исследований на настоящий момент и доказывается, что имеется высокая актуальность развития данного научно-технического направления. Предлагаются многообещающие области применения и задачи организации человеко-машинного взаимодействия с применением высокоскоростной видеосъемки. Основными направлениями являются аудиовизуальное распознавание слитной речи и чтение речи по губам диктора. В ходе дальнейших исследований планируется реализация подобной многомодальной системы аудиовизуального распознавания речи для русского языка с использованием микрофона и высокоскоростной видеокамеры JAI Pulnix.
Ключевые слова: высокоскоростная видеокамера; компьютерное зрение; аудиовизуальное распознавание речи; аудиовизуальная база данных; чтение по губам; динамическая видеоинформация.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 15-07-04415_a
Министерство образования и науки Российской Федерации МД-3035.2015.8
Исследование выполнено при финансовой поддержке фонда РФФИ (проект № 15-07-04415-а) и Совета по грантам Президента РФ (проект № МД-3035.2015.8).
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.5
Образец цитирования: Д. В. Иванько, А. А. Карпов, “Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации”, Тр. СПИИРАН, 44 (2016), 98–113
Цитирование в формате AMSBIB
\RBibitem{IvaKar16}
\by Д.~В.~Иванько, А.~А.~Карпов
\paper Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации
\jour Тр. СПИИРАН
\yr 2016
\vol 44
\pages 98--113
\mathnet{http://mi.mathnet.ru/trspy857}
\crossref{https://doi.org/10.15622/sp.44.7}
\elib{https://elibrary.ru/item.asp?id=25616420}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy857
  • https://www.mathnet.ru/rus/trspy/v44/p98
  • Эта публикация цитируется в следующих 4 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:162
    PDF полного текста:57
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024