|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Theory of data
Рекурсивный алгоритм определения тональности предложений на русском языке
А. Ю. Полетаев, И. В. Парамонов Ярославский государственный университет им. П. Г. Демидова, ул. Советская, д. 14, г. Ярославль, 150003 Россия
Аннотация:
В статье рассматривается задача определения тональности русскоязычных предложений. Тональность понимается как отношение автора к теме предложения. В данном исследовании учитываются три варианта тональности — положительная, отрицательная и нейтральная, т. е. решается задача классификации с тремя классами.
В статье предлагается алгоритм определения тональности предложения на русском языке, основанный на семантических правилах. В основе алгоритма лежит предположение о том, что тональность фразы может быть определена на основе тональностей её составляющих с помощью рекурсивного применения семантических правил к составным частям фразы, представленным в виде синтаксического дерева. Набор семантических правил, используемых алгоритмом, был составлен в результате обсуждений с экспертами-филологами. Эксперименты показали, что предложенный рекурсивный алгоритм даёт несколько худший результат на корпусе отзывов на отели по сравнению с подходом, основанным на правилах, ранее адаптированным авторами для русского языка: взвешенная $F_1$-мера составила $0.75$ и $0.78$ соответственно. Для оценки качества работы алгоритма на сложных предложениях был создан корпус OpenSentimentCorpus, основанный на OpenCorpora — открытом корпусе предложений из новостных статей и публицистики. На корпусе OpenSentimentCorpus рекурсивный алгоритм работает лучше, чем адаптированный подход: $F_1$-мера составила $0.70$ и $0.63$ соответственно. Таким образом, предложенный в данной работе алгоритм имеет преимущество в случае более сложных предложений с более тонкими способами выражения тональности.
Ключевые слова:
анализ тональности, определение тональности, семантические правила, тональный корпус.
Поступила в редакцию: 30.04.2022 Исправленный вариант: 22.05.2022 Принята в печать: 25.05.2022
Образец цитирования:
А. Ю. Полетаев, И. В. Парамонов, “Рекурсивный алгоритм определения тональности предложений на русском языке”, Модел. и анализ информ. систем, 29:2 (2022), 134–147
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mais772 https://www.mathnet.ru/rus/mais/v29/i2/p134
|
Статистика просмотров: |
Страница аннотации: | 52 | PDF полного текста: | 32 | Список литературы: | 12 |
|