Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2020, том 44, выпуск 4, страницы 596–605
DOI: https://doi.org/10.18287/2412-6179-CO-621
(Mi co826)
 

Эта публикация цитируется в 8 научных статьях (всего в 8 статьях)

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

Автоматическая верификация диктора по произвольной фразе с применением свёрточных глубоких сетей доверия

И. А. Рахманенко, А. А. Шелупанов, Е. Ю. Костюченко

Томский государственный университет систем управления и радиоэлектроники, 634050, Россия, Томская область, г. Томск, пр. Ленина, д. 40
Список литературы:
Аннотация: Данная статья посвящена применению свёрточных глубоких сетей доверия в качестве средства извлечения речевых признаков из аудиозаписей для решения задачи автоматической, текстонезависимой верификации диктора. В работе описаны область применения и проблемы систем автоматической верификации диктора. Рассмотрены типы современных систем верификации диктора, основные типы речевых признаков, используемых в системах верификации диктора. Описана структура свёрточных глубоких сетей доверия, алгоритм обучения данной сети. Предложено применение речевых признаков, извлекаемых из трёх слоёв обученной свёрточной глубокой сети доверия. Данный подход основан на применении методов анализа изображений как к уже выделенным признакам речевого сигнала, так и для их выделения из слоёв нейронной сети. Произведены экспериментальные исследования предложенных признаков на двух речевых корпусах: собственном речевом корпусе, включающем аудиозаписи 50 дикторов, и речевом корпусе TIMIT, включающем аудиозаписи 630 дикторов. Была произведена оценка точности предложенных признаков с применением классификаторов различного типа. Непосредственное применение данных признаков не дало увеличения точности по сравнению с использованием традиционных речевых признаков, таких как мел-кепстральные коэффициенты. Однако применение данных признаков в составе ансамбля классификаторов позволило достичь уменьшения равной ошибки 1-го и 2-го рода до 0,21% на собственном речевом корпусе и до 0,23% на речевом корпусе TIMIT.
Ключевые слова: распознавание диктора, верификация диктора, Гауссовы смеси, GMM-UBM-система, речевые признаки, обработка речи, глубокое обучение, нейронные сети, распознавание образов.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 8.9628.2017/8.9
Результаты были получены в рамках выполнения базовой части государственного задания Минобрнауки России, проект 8.9628.2017/8.9.
Поступила в редакцию: 20.08.2019
Принята в печать: 13.10.2019
Тип публикации: Статья
Образец цитирования: И. А. Рахманенко, А. А. Шелупанов, Е. Ю. Костюченко, “Автоматическая верификация диктора по произвольной фразе с применением свёрточных глубоких сетей доверия”, Компьютерная оптика, 44:4 (2020), 596–605
Цитирование в формате AMSBIB
\RBibitem{RakSheKos20}
\by И.~А.~Рахманенко, А.~А.~Шелупанов, Е.~Ю.~Костюченко
\paper Автоматическая верификация диктора по произвольной фразе с применением свёрточных глубоких сетей доверия
\jour Компьютерная оптика
\yr 2020
\vol 44
\issue 4
\pages 596--605
\mathnet{http://mi.mathnet.ru/co826}
\crossref{https://doi.org/10.18287/2412-6179-CO-621}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co826
  • https://www.mathnet.ru/rus/co/v44/i4/p596
  • Эта публикация цитируется в следующих 8 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:215
    PDF полного текста:83
    Список литературы:17
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024