Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2017, выпуск 52, страницы 32–50
DOI: https://doi.org/10.15622/sp.52.2
(Mi trspy943)
 

Эта публикация цитируется в 7 научных статьях (всего в 7 статьях)

Теоретическая и прикладная математика

Анализ идентификационных признаков в речевых данных с помощью GMM-UBM системы верификации диктора

И. А. Рахманенко, Р. В. Мещеряков

Томский государственный университет систем управления и радиоэлектроники (ТУСУР)
Аннотация: Данная статья посвящена отбору и оценке речевых признаков, используемых в задаче автоматической текстонезависимой верификации диктора. Для решения поставленной задачи была использована система верификации диктора, основанная на модели Гауссовых смесей и универсальной фоновой модели (GMM-UBM система).
Рассмотрены область применения и проблемы современных систем автоматической идентификации диктора. Произведен обзор современных методов идентификации диктора, основных речевых признаков, используемых при решении задачи идентификации диктора, а также рассмотрен процесс извлечения признаков, использованных далее. К рассмотренным признакам относятся мел-кепстральные коэффициенты (MFCC), пары линейного спектра (LSP), кепстральные коэффициенты перцептивного линейного предсказания (PLP), кратковременная энергия, формантные частоты, частота основного тона, вероятность вокализации (voicing probability), частота пересечения нуля (ZCR), джиттер и шиммер.
Произведена экспериментальная оценка GMM-UBM системы с применением различных наборов речевых признаков на речевом корпусе, включающем в себя записи 50 дикторов. Признаки отобраны с помощью генетического алгоритма и алгоритма жадного добавления-удаления.
Используя 256-компонентные Гауссовы смеси и полученный вектор из 28 признаков, была получена равная ошибка 1-го и 2-го рода (EER), составляющая 0,579 %. По сравнению со стандартным вектором, состоящим из 14 мел-кепстральных коэффициентов, ошибка EER была уменьшена на 42,1 %.
Ключевые слова: распознавание диктора; верификация диктора; Гауссовы смеси; GMM-UBM система; мел-кепстральные коэффициенты; речевые признаки; отбор признаков; обработка речи; генетический алгоритм, жадный алгоритм.
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.934.8'1


Образец цитирования: И. А. Рахманенко, Р. В. Мещеряков, “Анализ идентификационных признаков в речевых данных с помощью GMM-UBM системы верификации диктора”, Тр. СПИИРАН, 52 (2017), 32–50
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy943
  • https://www.mathnet.ru/rus/trspy/v52/p32
  • Эта публикация цитируется в следующих 7 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:587
    PDF полного текста:346
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024