|
Математическое моделирование, 2015, том 27, номер 7, страницы 51–57
(Mi mm3622)
|
|
|
|
Об обучении системы верификации диктора на неразмеченных данных
А. В. Ермилов, И. М. Гостев Национальный исследовательский университет "Высшая школа экономики"
Аннотация:
Исследуются способы получения автоматической разметки речевых данных по дикторам с помощью алгоритмов кластеризации с последующим получением смеси моделей, используемых для распознавания диктора. Такая задача возникает, например, в случае необходимости использования данных из новых каналов, например, данных, полученных с мобильных устройств. Для таких каналов, как правило, отсутствует большая размеченная база по дикторам, которая в дальнейшем может быть использована для построения системы верификации диктора. Кроме того, рассматривается задача верификации диктора и способы её решения на основе моделей GMM-UBM, приведен обзор методов нормализации влияния канала, используемых для увеличения точности распознавания. Изложен обзор современных методов верификации диктора, таких как супервекторы и PLDA. Также в статье исследуется качество разметки, полученной методом иерархической кластеризации с различными метриками, и приводятся результаты численных экспериментов по верификации диктора на базе i-векторов из NIST i-vector Machine Learning Challenge 2014 с помощью модели, обученной на полученной разметке.
Ключевые слова:
распознавание образов, автоматическая верификация диктора, кластеризация, PLDA.
Поступила в редакцию: 30.03.2015
Образец цитирования:
А. В. Ермилов, И. М. Гостев, “Об обучении системы верификации диктора на неразмеченных данных”, Матем. моделирование, 27:7 (2015), 51–57
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mm3622 https://www.mathnet.ru/rus/mm/v27/i7/p51
|
Статистика просмотров: |
Страница аннотации: | 254 | PDF полного текста: | 138 | Список литературы: | 30 | Первая страница: | 9 |
|