Журнал Сибирского федерального университета. Серия «Математика и физика»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Журн. СФУ. Сер. Матем. и физ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Журнал Сибирского федерального университета. Серия «Математика и физика», 2015, том 8, выпуск 2, страницы 208–216 (Mi jsfu423)  

Automated recognition of paralinguistic signals in spoken dialogue systems: ways of improvement
[Автоматическое распознавание паралингвистических характеристик говорящего: способы улучшения качества классификации]

Maxim Sidorova, Alexander Schmitta, Eugene S. Semenkinb

a Institute of Communications Engineering, Ulm University, Albert Einstein-Allee, 43, Ulm, 89081, Germany
b Institute of Computer Science and Telecommunications, Siberian State Aerospace University, Krasnoyarskiy Rabochiy, 31, Krasnoyarsk, 660014, Russia
Список литературы:
Аннотация: Способность искусственных систем распознавать паралингвистические характеристики говорящего, такие как эмоциональное состояние, наличие и степень депрессии, открытость человека, является полезной для широкого круга приложений. Однако производительность таких систем далека от идеальных значений. В этой статье мы предлагаем подходы, применение которых позволяет существенно улучшить производительность систем распознавания. В работе описывается метод построения адаптивных эмоциональных моделей, позволяющих использовать характеристики конкретного человека для построения точных моделей. В статье представлены алгоритмы выявления наиболее значимых характеристик речевых сигналов, позволяющие одновременно максимизировать точность решения поставленной задачи и минимизировать количество используемых характеристик сигнала. Наконец, предлагается использовать комбинированные аудио визуальные сигналы в качестве входов для алгоритма машинного обучения. Указанные подходы были реализованы и проверены на 9 эмоциональных речевых корпусах. Результаты проведенных экспериментов позволяют утверждать, что предложенные в статье подходы улучшают качество решения поставленных задач с точки зрения выбранных критериев.
Ключевые слова: распознавание паралингвистических характеристик, алгоритмы машинного обучения, адаптивная процедура распознавания эмоций, мультимодальность.
Получена: 19.01.2015
Исправленный вариант: 25.02.2015
Принята: 20.03.2015
Тип публикации: Статья
УДК: 519.87
Язык публикации: английский
Образец цитирования: Maxim Sidorov, Alexander Schmitt, Eugene S. Semenkin, “Automated recognition of paralinguistic signals in spoken dialogue systems: ways of improvement”, Журн. СФУ. Сер. Матем. и физ., 8:2 (2015), 208–216
Цитирование в формате AMSBIB
\RBibitem{SidSchSem15}
\by Maxim~Sidorov, Alexander~Schmitt, Eugene~S.~Semenkin
\paper Automated recognition of paralinguistic signals in spoken dialogue systems: ways of improvement
\jour Журн. СФУ. Сер. Матем. и физ.
\yr 2015
\vol 8
\issue 2
\pages 208--216
\mathnet{http://mi.mathnet.ru/jsfu423}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/jsfu423
  • https://www.mathnet.ru/rus/jsfu/v8/i2/p208
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Журнал Сибирского федерального университета. Серия "Математика и физика"
    Статистика просмотров:
    Страница аннотации:480
    PDF полного текста:70
    Список литературы:42
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024