|
Искусственный интеллект и принятие решений, 2017, выпуск 2, страницы 78–89
(Mi iipr247)
|
|
|
|
Обработка естественного языка
Методы интеграции лексиконов в машинное обучение для систем анализа тональности
Н. Л. Русначенкоa, Н. В. Лукашевичb a Московский государственный технический университет имени Н. Э. Баумана
b Научно-исследовательский вычислительный центр Московского государственного университета имени М. В. Ломоносова
Аннотация:
Рассмотрена задача анализа тональности русскоязычных сообщений сети Твиттер в банковской и телекоммуникационной сферах. На основе машинного обучения изложены различные способы представления содержания сообщений. Показано, что использование дополнительных признаков сообщений на основе существующих или заранее порожденных словарей оценочных слов позволяет повысить качество классификации сообщений. Исследовано влияние различных типов обучающих коллекций (сбалансированных/не сбалансированных), их объемов, а также преимущества применения нескольких признаков на основе лексиконов на качество классификации. Подход тестировался на данных открытого тестирования систем анализа тональности SentiRuEval-2015 и SentiRuEval-2016. В итоге были получены результаты, превышающие лучшие результаты SentiRuEval-2015, близкие к результатам победителя SentiRuEval-2016.
Ключевые слова:
машинное обучение, SVM, анализ тональности сообщений, лексиконы, SentiRuEval.
Образец цитирования:
Н. Л. Русначенко, Н. В. Лукашевич, “Методы интеграции лексиконов в машинное обучение для систем анализа тональности”, Искусственный интеллект и принятие решений, 2017, № 2, 78–89
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/iipr247 https://www.mathnet.ru/rus/iipr/y2017/i2/p78
|
Статистика просмотров: |
Страница аннотации: | 29 | PDF полного текста: | 20 | Список литературы: | 1 |
|