|
Труды СПИИРАН, 2011, выпуск 19, страницы 48–64
(Mi trspy467)
|
|
|
|
Многомодальные ассистивные системы для интеллектуального жилого пространства
А. А. Карповa, Л. Акарунb, Ал. Л. Ронжинa a Санкт-Петербургский институт информатики и автоматизации РАН
b Bogazici University, Bebek, Istanbul
Аннотация:
В статье представлен обзор систем, применяемых для ассистивного интеллектуального пространства. Также описывается разработанная многомодальная ассистивная система для интеллектуального жилого пространства, которая состоит из двух комплексов средств. Первый комплекс выполняет обработку видеопотоков для определения положения пользователя и слежения за его перемещением, а также анализа его действий. Ко второму комплексу относится система обработки аудиопотоков, предназначенная для автоматического распознавания речевых команд и акустических событий. Разработанная система автоматического распознавания речи многоязычна и позволяет распознавать слова, произнесенные на английском или русском. В процессе проведения экспериментов было записано 2811 аудиофайлов, содержащих речь и акустические события, средняя точность распознавания составила 96,5% и 93,8% соответственно.
Ключевые слова:
системы видеонаблюдения, сегментация переднего фона, слежение за ключевыми точками, обработка аудиосигнала, распознавание речи, определение акустических событий.
Поступила в редакцию: 16.11.2011 Принята в печать: 29.11.2011
Образец цитирования:
А. А. Карпов, Л. Акарун, Ал. Л. Ронжин, “Многомодальные ассистивные системы для интеллектуального жилого пространства”, Тр. СПИИРАН, 19 (2011), 48–64
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy467 https://www.mathnet.ru/rus/trspy/v19/p48
|
|