Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2013, выпуск 26, страницы 332–348 (Mi trspy626)  

Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.

Т. В. Ермоленкоab, Н. С. Клименкоa

a Институт проблем искусственного интеллекта НАН Украины и МОН Украины
b Донецкий национальный технический университет
Список литературы:
Аннотация: Статья посвящена разработке комплексной модели диктора в задаче текстонезависимой идентификации по голосу. Комплексная модель базируется на методе гауссовых смесей. Ее формируют по речевому сигналу, который предварительно сегментируется на фрагменты, соответствующие различным фонетическим классам звуков. Предложен способ структурирования моделей дикторов. Модели дикторов структурированы в виде дерева, что позволило проводить идентификацию диктора без выполнения полного перебора всего множества моделей. Проведенные исследования показали, что деление акустического пространства голоса диктора на множество классов, представляющих некоторые фонетические события, приводит к увеличению эффективности идентификации по голосу, а предложенное структурирование множества моделей дикторов ускоряет операцию поиска.
Ключевые слова: кластеризация, гауссовы смеси, модели дикторов, широкие фонетические классы, мел-частотные кепстральные коэффициенты.
Поступила в редакцию: 04.04.2013
Тип публикации: Статья
УДК: 004.89, 004.93
PACS: 43.71.Sy
MSC: 68T50
Образец цитирования: Т. В. Ермоленко, Н. С. Клименко, “Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.”, Тр. СПИИРАН, 26 (2013), 332–348
Цитирование в формате AMSBIB
\RBibitem{YerKly13}
\by Т.~В.~Ермоленко, Н.~С.~Клименко
\paper Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.
\jour Тр. СПИИРАН
\yr 2013
\vol 26
\pages 332--348
\mathnet{http://mi.mathnet.ru/trspy626}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy626
  • https://www.mathnet.ru/rus/trspy/v26/p332
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:182
    PDF полного текста:110
    Список литературы:45
    Первая страница:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024