Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2024, том 31, номер 1, страницы 90–101
DOI: https://doi.org/10.18255/1818-1015-2024-1-90-101
(Mi mais817)
 

Artificial intelligence

Применение глубоких нейронных сетей для автоматического определения иронии в русскоязычных текстах

М. А. Костерин, И. В. Парамонов

Ярославский государственный университет им. П.Г. Демидова, Ярославль, Россия
Список литературы:
Аннотация: В работе исследуются автоматические методы классификации русскоязычных предложений на два класса: содержащие и не содержащие ироничный посыл. Рассматриваемые методы могут быть разделены на три категории: классификаторы на основе эмбеддингов языковых моделей, классификаторы с использованием информации о тональности и классификаторы с обучением эмбеддингов обнаружению иронии. Составными элементами классификаторов являются нейронные сети, такие как BERT, RoBERTa, BiLSTM, CNN, а также механизм внимания и полносвязные слои. Эксперименты по обнаружению иронии проводились с использованием двух корпусов русскоязычных предложений: первый корпус составлен из публицистических текстов из открытого корпуса OpenCorpora, второй корпус является расширением первого и дополнен ироничными предложениями с ресурса Wiktionary.
Лучшие результаты продемонстрировала группа классификаторов на основе чистых эмбеддингов языковых моделей с максимальным значением F-меры 0.84, достигнутым связкой из RoBERTa, BiLSTM, механизма внимания и пары полносвязных слоев в ходе экспериментов на расширенном корпусе. В целом использование расширенного корпуса давало результаты на 2–5% выше результатов на базовом корпусе. Достигнутые результаты являются лучшими для рассматриваемой задачи в случае русского языка и сравнимы с лучшими для английского.
Ключевые слова: обнаружение иронии, обнаружение сарказма, нейросетевой классификатор, глубокое обучение, обработка естественного языка, BERT.
Финансовая поддержка Номер гранта
Российский научный фонд 23-21-00495
Российский научный фонд (проект № 23-21-00495).
Поступила в редакцию: 15.02.2024
Исправленный вариант: 23.02.2024
Принята в печать: 28.02.2024
Тип публикации: Статья
УДК: 004.912
MSC: 68T50
Образец цитирования: М. А. Костерин, И. В. Парамонов, “Применение глубоких нейронных сетей для автоматического определения иронии в русскоязычных текстах”, Модел. и анализ информ. систем, 31:1 (2024), 90–101
Цитирование в формате AMSBIB
\RBibitem{KosPar24}
\by М.~А.~Костерин, И.~В.~Парамонов
\paper Применение глубоких нейронных сетей для автоматического определения иронии в русскоязычных текстах
\jour Модел. и анализ информ. систем
\yr 2024
\vol 31
\issue 1
\pages 90--101
\mathnet{http://mi.mathnet.ru/mais817}
\crossref{https://doi.org/10.18255/1818-1015-2024-1-90-101}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais817
  • https://www.mathnet.ru/rus/mais/v31/i1/p90
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
    Статистика просмотров:
    Страница аннотации:35
    PDF полного текста:37
    Список литературы:12
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024