И. С. Кипяткова, А. А. Карпов, “Разновидности глубоких искусственных нейронных сетей для систем распознавания речи”, Тр. СПИИРАН, 49 (2016), 80

Труды СПИИРАН

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Труды СПИИРАН, 2016, выпуск 49, страницы 80–103
DOI: https://doi.org/10.15622/sp.49.5 (Mi trspy918)

Эта публикация цитируется в 11 научных статьях (всего в 11 статьях)

Методы управления и обработки информации

Разновидности глубоких искусственных нейронных сетей для систем распознавания речи

И. С. Кипяткова, А. А. Карпов

Федеральное государственное бюджетное учреждение науки Санкт-Петербургского института информатики и автоматизации Российской академии наук (СПИИРАН)

PDF полного текста (1224 kB) Список цитирования (11)

DOI: https://doi.org/10.15622/sp.49.5

Аннотация: В статье представлен аналитический обзор основных разновидностей акустических и языковых моделей на основе искусственных нейронных сетей для систем автоматического распознавания речи. Рассмотрены гибридный и тандемный под-ходы объединения скрытых марковских моделей и искусственных нейронных сетей для акустического моделирования, описано построение языковых моделей с применением сетей прямого распространения и рекуррентных нейросетей. Обзор исследований в данной области показывает, что применение искусственных нейронных сетей как на этапе акустического, так и на этапе языкового моделирования позволяет снизить ошибку распознавания слов.

Ключевые слова: автоматическое распознавание речи; нейронные сети; акустические модели; модели языка.

Финансовая поддержка	Номер гранта
Российский фонд фундаментальных исследований	15-07-04322_а 15-07-04415_а
Министерство образования и науки Российской Федерации	МК-5209.2015.8 МД-254.2017.8
Российская академия наук - Федеральное агентство научных организаций	0073-2014-0005 0073-2015-0007
Работа выполнена при частичной финансовой поддержке РФФИ (проекты № 15-07-04322 и 15-07-04415), совета по Грантам Президента РФ (проекты № МК-5209.2015.8 и МД-254.2017.8), а также бюджетных тем № 0073-2014-0005 и № 0073-2015-0007.

Реферативные базы данных:

Тип публикации: Статья

УДК: 004.522

Образец цитирования: И. С. Кипяткова, А. А. Карпов, “Разновидности глубоких искусственных нейронных сетей для систем распознавания речи”, Тр. СПИИРАН, 49 (2016), 80–103

Цитирование в формате AMSBIB

\RBibitem{KipKar16}

\by И.~С.~Кипяткова, А.~А.~Карпов

\paper Разновидности глубоких искусственных нейронных сетей для систем распознавания речи

\jour Тр. СПИИРАН

\yr 2016

\vol 49

\pages 80--103

\mathnet{http://mi.mathnet.ru/trspy918}

\crossref{https://doi.org/10.15622/sp.49.5}

\elib{https://elibrary.ru/item.asp?id=27657124}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/trspy918

https://www.mathnet.ru/rus/trspy/v49/p80

Эта публикация цитируется в следующих 11 статьяx:

Evgeny Kostyuchenko, Ivan Rakhmanenko, Lidiya Balatskaya, Lecture Notes in Computer Science, 13721, Speech and Computer, 2022, 382
Alexey Kashevnik, Igor Lashkov, Alexandr Axyonov, Denis Ivanko, Dmitry Ryumin, Artem Kolchin, Alexey Karpov, “Multimodal Corpus Design for Audio-Visual Speech Recognition in Vehicle Cabin”, IEEE Access, 9 (2021), 34986
A.A. Axyonov, D.V. Ivanko, I.B. Lashkov, D.A. Ryumin, A.M. Kashevnik, A.A. Karpov, “A methodology of multimodal corpus creation for audio-visual speech recognition in assistive transport systems”, I&C, 5 (2020), 87
Dmitrii Levonevskii, Olga Shumskaya, Alena Velichko, Mikhael Uzdiaev, Dmitrii Malov, Smart Innovation, Systems and Technologies, 154, Proceedings of 14th International Conference on Electromechanics and Robotics “Zavalishin's Readings”, 2020, 511
В. В. Кожевников, М. Ю. Леонтьев, В. В. Приходько, В. А. Сергеев, А. Н. Фомин, “Нейросетевые технологии построения интеллектуальных систем управления роботами”, Ученые записки УлГУ. Серия “Математика и информационные технологии”, 2019, № 2, 36–53
Dariya Novokhrestova, Evgeny Kostyuchenko, Roman Meshcheryakov, Lecture Notes in Computer Science, 11096, Speech and Computer, 2018, 461
A. A. Karpov, R. M. Yusupov, “Multimodal Interfaces of Human–Computer Interaction”, Her. Russ. Acad. Sci., 88:1 (2018), 67
Irina Kipyatkova, Lecture Notes in Computer Science, 11096, Speech and Computer, 2018, 291
Evgeny Kostyuchenko, Taisiya Lebedeva, Alexander Goritov, AIP Conference Proceedings, 1899, 2017, 060018
Irina Kipyatkova, Lecture Notes in Computer Science, 10458, Speech and Computer, 2017, 362
Dmitry Ryumin, Alexey A. Karpov, Lecture Notes in Computer Science, 10278, Universal Access in Human–Computer Interaction. Designing Novel Interactions, 2017, 89

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	8512
PDF полного текста:	1165

Что такое QR-код?

Обратная связь:
math-net2025_04@mi-ras.ru

Пользовательское соглашение

Регистрация посетителей портала

Логотипы