|
Сравнение алгоритмов клонирования голоса в условиях нулевого и малого количества примеров
О. Оганесян, Д. Саргсян, A. Маладжян Российско-Армянский университет, г. Ереван
Аннотация:
Технология клонирования голоса сделала значительные шаги вперед в последние годы, с применением от персонализированных виртуальных ассистентов до сложных развлекательных систем. В данном исследовании проводится сравнение девяти моделей клонирования голоса, сосредотачиваясь на подходах нулевого и тонкой настройки. Модели клонирования голоса с нулевым обучением привлекают внимание своей способностью генерировать высококачественные синтетические голоса без необходимости в больших объемах обучающих данных для каждого нового голоса, а также возможностью осуществлять онлайн выводы в режиме реального времени. В отличие от них, модели, не относящиеся к нулевому обучению, обычно требуют дополнительных данных, но могут обеспечить улучшенную точность воспроизведения голоса. Исследование включает два ключевых эксперимента. Первый эксперимент оценивает эффективность моделей клонирования голоса с нулевым обучением, анализируя их способность точно воспроизводить целевые голоса без предварительного ознакомления. Второй эксперимент включает тонкую настройку моделей на целевых спикеров для оценки улучшений в качестве голоса и адаптивности. Модели оцениваются на основе ключевых показателей, оценивающих качество голоса, сохранение идентичности спикера, а также субъективные и объективные показатели производительности. Результаты показывают, что, хотя модели с нулевым обучением предлагают большую гибкость и простоту использования, модели с тонкой настройкой могут обеспечить более высокую производительность.
Ключевые слова:
клонирование голоса; клонирование с нулевым обучением; тонкая настройка; синтез речи; адаптация говорящего.
Образец цитирования:
О. Оганесян, Д. Саргсян, A. Маладжян, “Сравнение алгоритмов клонирования голоса в условиях нулевого и малого количества примеров”, Труды ИСП РАН, 36:4 (2024), 7–16
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp904 https://www.mathnet.ru/rus/tisp/v36/i4/p7
|
|