|
Препринты Института прикладной математики им. М. В. Келдыша РАН, 2001, 087
(Mi ipmp1139)
|
|
|
|
Нейросетевой анализ и сопоставление частотно-временных векторов на основе краткосрочного спектрального представления и адаптивного преобразования Эрмита
Ю. М. Баяковский, А. О. Жирков, Д. Н. Корчагин, А. С. Крылов, А. С. Лукин
Аннотация:
В данной работе рассматривается метод распознавания речи/дикторов на основе представления речевой информации в виде потока двухмерных частотно-временных векторов. Классификация векторов осуществляется нейронной сетью, на вход к которой поступают низкочастотные двумерные вейвлет-преобразования участков спектрограмм. Исходными представлениями звука являются сонограммы краткосрочного преобразования Фурье и адаптивного преобразования Эрмита. Проведено сравнение этих представлений в задачах диктор-независимого распознавания речи и контекстно-независимого распознавания диктора.
Образец цитирования:
Ю. М. Баяковский, А. О. Жирков, Д. Н. Корчагин, А. С. Крылов, А. С. Лукин, “Нейросетевой анализ и сопоставление частотно-временных векторов на основе краткосрочного спектрального представления и адаптивного преобразования Эрмита”, Препринты ИПМ им. М. В. Келдыша, 2001, 087
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp1139 https://www.mathnet.ru/rus/ipmp/y2001/p87
|
|