Информатика и автоматизация
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и автоматизация, 2024, выпуск 23, том 4, страницы 1173–1198
DOI: https://doi.org/10.15622/ia.23.4.9
(Mi trspy1318)
 

Искусственный интеллект, инженерия данных и знаний

Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода

А. А. Двойникова, И. А. Кагиров, А. А. Карпов

Санкт-Петербургский Федеральный исследовательский центр Российской академии наук (СПб ФИЦ РАН)
Аннотация: В статье рассматривается проблема распознавания сентимента и эмоций пользователей в русскоязычных текстовых транскрипциях речи с использованием словарных методов и машинного перевода. Количество имеющихся информационных ресурсов для анализа сентимента текстовых сообщений на русском языке очень ограничено, что существенно затрудняет применение базовых методов анализа сентимента, а именно, предобработки текстов, векторизации с помощью тональных словарей, традиционных классификаторов. Для решения этой проблемы в статье вводится новый метод на основе автоматического машинного перевода русскоязычных текстов на английский язык. Частичный перевод предполагает перевод отдельных лексем, не включенных в русскоязычные тональные словари, тогда как полный перевод подразумевает перевод всего текста целиком. Переведенный текст анализируется с использованием различных англоязычных тональных словарей. Экспериментальные исследования для решения задачи распознавания сентимента и эмоций были проведены на текстовых транскрипциях многомодального русскоязычного корпуса RAMAS, извлеченных из аудиоданных экспертным путем и автоматически с использованием системы распознавания речи. В результате применения методов машинного перевода достигается значение взвешенной F-меры распознавания семи классов эмоций 31,12 % и 23,74 %, и трех классов сентимента 75,37 % и 71,60 % для экспертных и автоматических транскрипций русскоязычной речи корпуса RAMAS, соответственно. Также в ходе экспериментов было выявлено, что использование статистических векторов в качестве метода преобразования текстовых данных позволяет достичь значение показателя взвешенной F-меры на 1-5 % выше по сравнению с использованием конкатенированного (статистического и тонального) вектора. Таким образом, эксперименты показывают, что объединение всех англоязычных тональных словарей позволяет повысить точность распознавания сентимента и эмоций в текстовых данных. В статье также исследуется корреляция между длиной вектора текстовых данных и его репрезентативностью. По результатам экспериментов можно сделать вывод, что использование лемматизации для нормализации слов текстовых транскрипций речи позволяет достичь большей точности распознавания сентимента по сравнению со стеммингом. Использование предложенных методов с полным и частичным машинным переводом позволяет повысить точность распознавания сентимента и эмоций на 0,65–9,76 % по показателю взвешенной F-меры по сравнению с базовым методом распознавания сентимента и эмоций.
Ключевые слова: машинный перевод, тональные словари, распознавание эмоций, сентимент-анализ, тональные вектора.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации FFZF-2022-0005
Российский научный фонд 22-11-00321
Раздел 4 выполнен в рамках бюджетной темы СПб ФИЦ РАН (№ FFZF-2022-0005), остальные исследования выполнены при финансовой поддержке Российского научного фонда, проект № 22-11-00321.
Поступила в редакцию: 08.11.2023
Тип публикации: Статья
УДК: 004.912
Образец цитирования: А. А. Двойникова, И. А. Кагиров, А. А. Карпов, “Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода”, Информатика и автоматизация, 23:4 (2024), 1173–1198
Цитирование в формате AMSBIB
\RBibitem{DvoKagKar24}
\by А.~А.~Двойникова, И.~А.~Кагиров, А.~А.~Карпов
\paper Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода
\jour Информатика и автоматизация
\yr 2024
\vol 23
\issue 4
\pages 1173--1198
\mathnet{http://mi.mathnet.ru/trspy1318}
\crossref{https://doi.org/10.15622/ia.23.4.9}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1318
  • https://www.mathnet.ru/rus/trspy/v23/i4/p1173
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:31
    PDF полного текста:13
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024