Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2023, том 47, выпуск 2, страницы 287–305
DOI: https://doi.org/10.18287/2412-6179-CO-1154
(Mi co1128)
 

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

Современные технологии автоматического распознавания средств общения на основе визуальных данных

В. О. Ячнаяab, В. Р. Луцивa, Р. О. Малашинab

a Санкт-Петербургский государственный университет аэрокосмического приборостроения
b Институт физиологии им. И. П. Павлова РАН
Список литературы:
Аннотация: Общение представляет собой широкий спектр различных действий, связанных с приёмом и передачей информации. Процесс общения складывается из вербальных, паравербальных и невербальных компонентов, содержащих информационную часть передаваемого сообщения и его эмоциональную окраску соответственно. Комплексный анализ всех компонентов общения позволяет оценить не только содержательную составляющую, но и ситуативный контекст сказанного, а также выявлять дополнительные факторы, относящиеся к психическому и соматическому состоянию говорящего. Существует несколько методов передачи вербального сообщения, среди которых устная и жестовая речь. Речевые и околоречевые компоненты общения могут содержаться в различных каналах данных, таких как аудио- или видеоканалы. В данном обзоре рассматриваются системы анализа видеоданных ввиду того, что аудиоканал не способен передать ряд околоречевых компонентов общения, вносящих в передаваемое сообщение дополнительную информацию. Проводится анализ существующих баз данных статических и динамических образов и систем, разрабатываемых для распознавания вербальной составляющей в устной и жестовой речи, а также систем, оценивающих паравербальные и невербальные компоненты общения. Обозначены сложности, с которыми сталкиваются разработчики подобных баз данных и систем. Также сформулированы перспективные направления разработок, связанные в том числе с комплексным анализом всех компонентов общения с целью наиболее полной оценки передаваемого сообщения.
Ключевые слова: распознавание речи, распознавание жестовых языков, аффективные вычисления, компьютерное зрение, нейронные сети
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 0134-2019-0006
Работа выполнена при поддержке Госпрограммы 47 ГП «Научно-технологическое развитие Российской Федерации» (2019-2030), тема 0134-2019-0006.
Поступила в редакцию: 27.04.2022
Принята в печать: 29.09.2022
Тип публикации: Статья
Образец цитирования: В. О. Ячная, В. Р. Луцив, Р. О. Малашин, “Современные технологии автоматического распознавания средств общения на основе визуальных данных”, Компьютерная оптика, 47:2 (2023), 287–305
Цитирование в формате AMSBIB
\RBibitem{YacLutMal23}
\by В.~О.~Ячная, В.~Р.~Луцив, Р.~О.~Малашин
\paper Современные технологии автоматического распознавания средств общения на основе визуальных данных
\jour Компьютерная оптика
\yr 2023
\vol 47
\issue 2
\pages 287--305
\mathnet{http://mi.mathnet.ru/co1128}
\crossref{https://doi.org/10.18287/2412-6179-CO-1154}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co1128
  • https://www.mathnet.ru/rus/co/v47/i2/p287
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:22
    PDF полного текста:15
    Список литературы:14
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024