Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2022, том 29, номер 2, страницы 134–147
DOI: https://doi.org/10.18255/1818-1015-2022-2-134-147
(Mi mais772)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Theory of data

Рекурсивный алгоритм определения тональности предложений на русском языке

А. Ю. Полетаев, И. В. Парамонов

Ярославский государственный университет им. П. Г. Демидова, ул. Советская, д. 14, г. Ярославль, 150003 Россия
Список литературы:
Аннотация: В статье рассматривается задача определения тональности русскоязычных предложений. Тональность понимается как отношение автора к теме предложения. В данном исследовании учитываются три варианта тональности — положительная, отрицательная и нейтральная, т. е. решается задача классификации с тремя классами.
В статье предлагается алгоритм определения тональности предложения на русском языке, основанный на семантических правилах. В основе алгоритма лежит предположение о том, что тональность фразы может быть определена на основе тональностей её составляющих с помощью рекурсивного применения семантических правил к составным частям фразы, представленным в виде синтаксического дерева. Набор семантических правил, используемых алгоритмом, был составлен в результате обсуждений с экспертами-филологами. Эксперименты показали, что предложенный рекурсивный алгоритм даёт несколько худший результат на корпусе отзывов на отели по сравнению с подходом, основанным на правилах, ранее адаптированным авторами для русского языка: взвешенная $F_1$-мера составила $0.75$ и $0.78$ соответственно. Для оценки качества работы алгоритма на сложных предложениях был создан корпус OpenSentimentCorpus, основанный на OpenCorpora — открытом корпусе предложений из новостных статей и публицистики. На корпусе OpenSentimentCorpus рекурсивный алгоритм работает лучше, чем адаптированный подход: $F_1$-мера составила $0.70$ и $0.63$ соответственно. Таким образом, предложенный в данной работе алгоритм имеет преимущество в случае более сложных предложений с более тонкими способами выражения тональности.
Ключевые слова: анализ тональности, определение тональности, семантические правила, тональный корпус.
Финансовая поддержка
Исследование выполнено в рамках Программы развития ЯрГУ, проект № П2-ГМ5-2021.
Поступила в редакцию: 30.04.2022
Исправленный вариант: 22.05.2022
Принята в печать: 25.05.2022
Тип публикации: Статья
УДК: 004.912
MSC: 68T50
Образец цитирования: А. Ю. Полетаев, И. В. Парамонов, “Рекурсивный алгоритм определения тональности предложений на русском языке”, Модел. и анализ информ. систем, 29:2 (2022), 134–147
Цитирование в формате AMSBIB
\RBibitem{PolPar22}
\by А.~Ю.~Полетаев, И.~В.~Парамонов
\paper Рекурсивный алгоритм определения тональности предложений на русском языке
\jour Модел. и анализ информ. систем
\yr 2022
\vol 29
\issue 2
\pages 134--147
\mathnet{http://mi.mathnet.ru/mais772}
\crossref{https://doi.org/10.18255/1818-1015-2022-2-134-147}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais772
  • https://www.mathnet.ru/rus/mais/v29/i2/p134
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
    Статистика просмотров:
    Страница аннотации:52
    PDF полного текста:32
    Список литературы:12
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024