|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Искусственный интеллект, инженерия данных и знаний
Определение патологии голосового аппарата на основе анализа модуляционного спектра речи в критических полосах
М. И. Вашкевич, И. С. Азаров Белорусский государственный университет информатики и радиоэлектроники (БГУИР)
Аннотация:
Предложен метод определения патологических изменений голоса на основе анализа модуляционного спектра речевого сигнала. Модуляционный спектр вычисляется при помощи двух последовательных частотно-временных преобразований: первое переводит сигнал в частотную область, второе — в модуляционную. Особенностью предложенного метода является использование неравномерного частотно-временного плана при переводе сигнала в частотную область. Предложен способ оценки модуляционного спектра, основанный на принципах антропоморфической обработки сигналов, имитирующий неравномерное частотно-временное разрешение слуховой системы человека. Использован неравнополосный банк фильтров модулированный дискретным преобразований Фурье, аппроксимирующий шкалу критических частот и повышающий временное разрешение в широких полосах. Банк фильтров использует фазовые (всепропускающие) звенья в качестве элементов задержки, что позволяет получить неравномерный частотно-временной план. Выполнено сравнение предложенного способа с более традиционным способом вычисления модуляционного спектра в критических полосах с фиксированным временным разрешением. Приведены данные экспериментов по использованию параметров модуляционного спектра для определения патологических изменений голоса, обусловленных: 1) боковым амиотрофическим склерозом (БАС); 2) заболеваниями гортани. Отбор и ранжирование параметров модуляционного спектра, использованных в качестве информационных признаков для классификации, выполнен при помощи метода LASSO. Классификация параметров на основе линейного дискриминантного анализа обеспечила высокую точность определения патологии (более 97%). Полученные результаты свидетельствуют о том, что использование неравномерного частотного-временного плана является предпочтительным в случае, когда анализируемый сигнал является протяжным гласным звуком, поскольку обеспечивает более высокую точность обнаружения патологии при меньшем числе модуляционных параметров.
Ключевые слова:
анализ речевого сигнала, критические полосы, модуляционный спектр, модуляционные признаки, извлечение признаков, детектирование патологии по голосу.
Поступила в редакцию: 18.03.2020
Образец цитирования:
М. И. Вашкевич, И. С. Азаров, “Определение патологии голосового аппарата на основе анализа модуляционного спектра речи в критических полосах”, Тр. СПИИРАН, 19:2 (2020), 249–276
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy1098 https://www.mathnet.ru/rus/trspy/v19/i2/p249
|
Статистика просмотров: |
Страница аннотации: | 201 | PDF полного текста: | 63 |
|