Искусственный интеллект и принятие решений
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Искусственный интеллект и принятие решений:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Искусственный интеллект и принятие решений, 2021, выпуск 1, страницы 75–85
DOI: https://doi.org/10.14357/20718594210107
(Mi iipr93)
 

Анализ сигналов, аудио и видео информации

Сегментация зашумленных речевых сигналов

А. Г. Шишкин, С. Д. Процеров

Московский государственный университет имени М. В. Ломоносова, г. Москва, Россия
Аннотация: Одной из важнейших задач в области цифровой обработки речевых сигналов является определение во входном акустическом сигнале участков активной речи и фонового шума либо тишины. Решение данной задачи имеет ряд очень важных практических приложений, таких как анализ речи в голосовых командных системах, передача акустических данных по сети, автоматическое распознавание речевых сигналов и др. Однако большинство имеющихся систем автоматического анализа речевых сигналов плохо справляются с этой задачей при малых отношениях “сигнал/шум” и помимо этого требуют индивидуальной настройки в зависимости от уровня шума. Вследствие этого становится невозможной полностью автоматическая сегментация входных акустических сигналов. В настоящей работе рассмотрена задача построения системы автоматической сегментации речевых сигналов, искажённых аддитивным шумом разного рода и разной интенсивности. Разработанная система, которая основана на использовании трёх различных моделей глубоких свёрточных нейронных сетей, способна с высокой эффективностью автоматически определять участки речи и пауз в зашумлённых сигналах в широком диапазоне значений соотношения “сигнал/шум” и для различных видов шума.
Ключевые слова: речевые сигналы, свёрточные нейронные сети, сегментация, цифровая обработка звуковых сигналов.
Англоязычная версия:
Scientific and Technical Information Processing, 2022, Volume 49, Issue 5, Pages 356–363
DOI: https://doi.org/10.3103/S0147688222050100
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: А. Г. Шишкин, С. Д. Процеров, “Сегментация зашумленных речевых сигналов”, Искусственный интеллект и принятие решений, 2021, № 1, 75–85; Scientific and Technical Information Processing, 49:5 (2022), 356–363
Цитирование в формате AMSBIB
\RBibitem{ShiPro21}
\by А.~Г.~Шишкин, С.~Д.~Процеров
\paper Сегментация зашумленных речевых сигналов
\jour Искусственный интеллект и принятие решений
\yr 2021
\issue 1
\pages 75--85
\mathnet{http://mi.mathnet.ru/iipr93}
\crossref{https://doi.org/10.14357/20718594210107}
\elib{https://elibrary.ru/item.asp?id=45149130}
\transl
\jour Scientific and Technical Information Processing
\yr 2022
\vol 49
\issue 5
\pages 356--363
\crossref{https://doi.org/10.3103/S0147688222050100}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/iipr93
  • https://www.mathnet.ru/rus/iipr/y2021/i1/p75
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Искусственный интеллект и принятие решений
    Статистика просмотров:
    Страница аннотации:10
    PDF полного текста:7
    Список литературы:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024