Аннотация:
В статье описывается выбор оптимального фонемного набора для системы автоматического распознавания русской речи. При создании акустических моделей был предложен комбинированный метод для выбора наилучшего фонемного набора, объединяющий статистическую информацию и фонетические знания. В результате применения данного метода к русскому фонетическому набору алфавита IPA (International Phonetic Alphabet) был получен набор из 47 фонологических единиц, который был преобразован в несколько фонемных наборов с разным размером от 27 до 47 единиц. Эксперименты по распознаванию речи показали, что использование сокращенных фонемных наборов позволяет увеличить точность распознавания фонем. В ходе экспериментов с применением расширенной языковой модели и сверхбольшим словарем точность распознавания слов составила 73,1%. Полученные результаты соответствуют качеству распознавания слитной русской речи, полученному на настоящий момент другими организациями.
Ключевые слова:
автоматическое распознавание русской речи; акустическое моделирование; выбор фонемного набора.
Тип публикации:
Статья
УДК:
004.522
Образец цитирования:
Д. А. Важенина, И. С. Кипяткова, К. Марков, А. А. Карпов, “Методика выбора фонемного набора для автоматического распознавания русской речи”, Тр. СПИИРАН, 36 (2014), 92–113
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy751
https://www.mathnet.ru/rus/trspy/v36/p92
Эта публикация цитируется в следующих 1 статьяx:
И. С. Кипяткова, А. А. Карпов, “Исследование нейросетевых моделей русского языка для систем автоматического распознавания слитной речи”, Автомат. и телемех., 2017, № 5, 110–122; I. S. Kipyatkova, A. A. Karpov, “A study of neural network Russian language models for automatic continuous speech recognition systems”, Autom. Remote Control, 78:5 (2017), 858–867