|
Формирование персональной модели голоса диктора с универсальным фонетическим пространством признаков на основе искусственной нейронной сети
И. С. Азаров, А. А. Петровский БГУИР, ул. П. Бровки 6, г. Минск, 220013, РБ
Аннотация:
В работе исследуется возможность формирования модели голоса заданного диктора на основе записей образцов его голоса с транскрипцией. В работе предлагается практический способ построения голосовой модели и результаты экспериментов ее применения к задаче конверсии голоса. Модель использует искусственную нейронную сеть, устроенную по принципу автоматического кодера, устанавливающую соответствие между пространством речевых параметров и пространством возможных фонетических состояний, унифицированным для произвольного голоса.
Ключевые слова:
конверсия голоса; синтез речевого сигнала; искусственная нейронная сеть.
Образец цитирования:
И. С. Азаров, А. А. Петровский, “Формирование персональной модели голоса диктора с универсальным фонетическим пространством признаков на основе искусственной нейронной сети”, Тр. СПИИРАН, 36 (2014), 128–150
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy753 https://www.mathnet.ru/rus/trspy/v36/p128
|
|