|
Труды СПИИРАН, 2014, выпуск 32, страницы 5–26
(Mi trspy707)
|
|
|
|
Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами
И. С. Азаров, М. И. Вашкевич, Д. С. Лихачев, А. А. Петровский Белорусский государственный университет информатики и радиоэлектроники
Аннотация:
В статье предлагается решение задачи изменения частоты основного тона речевого сигнала. Необходимость решения данной задачи возникает во многих речевых приложениях таких как конверсия голоса, коррекция акцента, обеспечение конфиденциальности диктора и др. Разработанная схема обработки вокализованной части речевого сигнала основывается на гармонической модели с нестационарными (изменяющимися в каждый момент времени) параметрами. Для повышения частотного разрешения модели оценка параметров выполнятся при помощи узкополосной фильтрации в искривленном масштабе времени, согласованном с контуром мгновенной частоты основного тона. На основании субъективной оценки результатов показано, что разработанный способ обес-печивает высокую натуральность и разборчивость синтезированной речи и может применяться как в широкополосных так и в узкополосных каналах связи с различными стандартами кодирования (в том числе с кодеками G.711 и GSM).
Ключевые слова:
гибридная модель речевого сигнала, оценка основного тона, изменение просодических характеристик речи.
Образец цитирования:
И. С. Азаров, М. И. Вашкевич, Д. С. Лихачев, А. А. Петровский, “Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами”, Тр. СПИИРАН, 32 (2014), 5–26
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy707 https://www.mathnet.ru/rus/trspy/v32/p5
|
Статистика просмотров: |
Страница аннотации: | 300 | PDF полного текста: | 164 | Список литературы: | 62 |
|