Т. В. Ермоленко, Н. С. Клименко, “Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.”, Тр. СПИИРАН, 26 (2013), 332

Труды СПИИРАН

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Труды СПИИРАН, 2013, выпуск 26, страницы 332–348 (Mi trspy626)

Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.

Т. В. Ермоленко^ab, Н. С. Клименко^a

^a Институт проблем искусственного интеллекта НАН Украины и МОН Украины
^b Донецкий национальный технический университет

PDF полного текста (722 kB)

Список литературы:

PDF

HTML

Аннотация: Статья посвящена разработке комплексной модели диктора в задаче текстонезависимой идентификации по голосу. Комплексная модель базируется на методе гауссовых смесей. Ее формируют по речевому сигналу, который предварительно сегментируется на фрагменты, соответствующие различным фонетическим классам звуков. Предложен способ структурирования моделей дикторов. Модели дикторов структурированы в виде дерева, что позволило проводить идентификацию диктора без выполнения полного перебора всего множества моделей. Проведенные исследования показали, что деление акустического пространства голоса диктора на множество классов, представляющих некоторые фонетические события, приводит к увеличению эффективности идентификации по голосу, а предложенное структурирование множества моделей дикторов ускоряет операцию поиска.

Ключевые слова: кластеризация, гауссовы смеси, модели дикторов, широкие фонетические классы, мел-частотные кепстральные коэффициенты.

Поступила в редакцию: 04.04.2013

Тип публикации: Статья

УДК: 004.89, 004.93

PACS: 43.71.Sy

MSC: 68T50

Образец цитирования: Т. В. Ермоленко, Н. С. Клименко, “Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.”, Тр. СПИИРАН, 26 (2013), 332–348

Цитирование в формате AMSBIB

\RBibitem{YerKly13}

\by Т.~В.~Ермоленко, Н.~С.~Клименко

\paper Использование сегментации речевого сигнала для построения комплексной модели диктора в системе идентификации говорящего.

\jour Тр. СПИИРАН

\yr 2013

\vol 26

\pages 332--348

\mathnet{http://mi.mathnet.ru/trspy626}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/trspy626

https://www.mathnet.ru/rus/trspy/v26/p332

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	182
PDF полного текста:	110
Список литературы:	45
Первая страница:	1

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы