А. Г. Шишкин, С. Д. Процеров, “Сегментация зашумленных речевых сигналов”, Искусственный интеллект и принятие решений, 2021, № 1, 75–85; Scientific and Technical Information Processing, 49:5 (2022), 356

Искусственный интеллект и принятие решений

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Правила для авторов

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Искусственный интеллект и принятие решений, 2021, выпуск 1, страницы 75–85
DOI: https://doi.org/10.14357/20718594210107 (Mi iipr93)

Анализ сигналов, аудио и видео информации

Сегментация зашумленных речевых сигналов

А. Г. Шишкин, С. Д. Процеров

Московский государственный университет имени М. В. Ломоносова, г. Москва, Россия

PDF полного текста (971 kB)

DOI: https://doi.org/10.14357/20718594210107

Аннотация: Одной из важнейших задач в области цифровой обработки речевых сигналов является определение во входном акустическом сигнале участков активной речи и фонового шума либо тишины. Решение данной задачи имеет ряд очень важных практических приложений, таких как анализ речи в голосовых командных системах, передача акустических данных по сети, автоматическое распознавание речевых сигналов и др. Однако большинство имеющихся систем автоматического анализа речевых сигналов плохо справляются с этой задачей при малых отношениях “сигнал/шум” и помимо этого требуют индивидуальной настройки в зависимости от уровня шума. Вследствие этого становится невозможной полностью автоматическая сегментация входных акустических сигналов. В настоящей работе рассмотрена задача построения системы автоматической сегментации речевых сигналов, искажённых аддитивным шумом разного рода и разной интенсивности. Разработанная система, которая основана на использовании трёх различных моделей глубоких свёрточных нейронных сетей, способна с высокой эффективностью автоматически определять участки речи и пауз в зашумлённых сигналах в широком диапазоне значений соотношения “сигнал/шум” и для различных видов шума.

Ключевые слова: речевые сигналы, свёрточные нейронные сети, сегментация, цифровая обработка звуковых сигналов.

Англоязычная версия:
Scientific and Technical Information Processing, 2022, Volume 49, Issue 5, Pages 356–363
DOI: https://doi.org/10.3103/S0147688222050100

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: А. Г. Шишкин, С. Д. Процеров, “Сегментация зашумленных речевых сигналов”, Искусственный интеллект и принятие решений, 2021, № 1, 75–85; Scientific and Technical Information Processing, 49:5 (2022), 356–363

Цитирование в формате AMSBIB

\RBibitem{ShiPro21}

\by А.~Г.~Шишкин, С.~Д.~Процеров

\paper Сегментация зашумленных речевых сигналов

\jour Искусственный интеллект и принятие решений

\yr 2021

\issue 1

\pages 75--85

\mathnet{http://mi.mathnet.ru/iipr93}

\crossref{https://doi.org/10.14357/20718594210107}

\elib{https://elibrary.ru/item.asp?id=45149130}

\transl

\jour Scientific and Technical Information Processing

\yr 2022

\vol 49

\issue 5

\pages 356--363

\crossref{https://doi.org/10.3103/S0147688222050100}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/iipr93

https://www.mathnet.ru/rus/iipr/y2021/i1/p75

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Искусственный интеллект и принятие решений

Статистика просмотров:
Страница аннотации:	10
PDF полного текста:	7
Список литературы:	1

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы