|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Artificial intelligence
Методы определения неявно упоминаемых аспектов в публицистических предложениях на русском языке
А. Ю. Полетаев, И. В. Парамонов, Е. М. Колупаев Ярославский государственный университет им. П.Г. Демидова, Ярославль, Россия
Аннотация:
В работе сравнивается качество работы различных методов определения неявно упоминаемых аспектов социально-экономической жизни в публицистических предложениях на русском языке. Задача определения неявно упоминаемых аспектов является вспомогательной для задач аспектно-ориентированного анализа тональности. Эксперименты проводились на корпусе предложений, извлечённых из политической агитации. Лучшие результаты, с F1-мерой, достигающей 0.84, были получены с использованием эмбеддингов Navec и классификаторов, основанных на методе опорных векторов. Достаточно высокие результаты, с F1-мерой до 0.77, были получены при использовании модели «мешок слов» и наивного байесовского классификатора. Остальные методы показали более низкие результаты. Также в ходе экспериментов было выявлено, что качество определения различных аспектов может достаточно сильно отличаться. Лучше всего определяются аспекты, с которыми в речи связаны характерные слова-маркеры, например, «здравоохранение» и «проведение выборов» Хуже всего определяются упоминания достаточно общих аспектов, таких как «качество управления».
Ключевые слова:
определение аспектов, неявные аспекты, анализ тональности, публицистический стиль.
Поступила в редакцию: 01.07.2024 Исправленный вариант: 25.07.2024 Принята в печать: 31.07.2024
Образец цитирования:
А. Ю. Полетаев, И. В. Парамонов, Е. М. Колупаев, “Методы определения неявно упоминаемых аспектов в публицистических предложениях на русском языке”, Модел. и анализ информ. систем, 31:3 (2024), 226–239
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mais826 https://www.mathnet.ru/rus/mais/v31/i3/p226
|
|