Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2024, том 31, номер 2, страницы 194–205
DOI: https://doi.org/10.18255/1818-1015-2024-2-194-205
(Mi mais824)
 

Artificial intelligence

Автоматическое определение семантического сходства ответов учащихся с эталонным с помощью современных моделей

Н. С. Лагутина, К. В. Лагутина, В. Н. Копнин

Ярославский государственный университет им. П.Г. Демидова, Ярославль, Россия
Список литературы:
Аннотация: В работе представлены результаты исследования современных моделей текста с целью выявления на их основе семантической близости текстов на английском языке. Задача определения семантического сходства текстов является важной составляющей многих областей обработки естественного языка: машинного перевода, поиска информации, систем вопросов и ответов, искусственного интеллекта в образовании. Авторы решали задачу классификации близости ответов учащихся к эталонному ответу учителя. Для исследования были выбраны нейросетевые языковые модели BERT и GPT, ранее применявшиеся к определению семантического сходства текстов, новая нейросетевая модель Mamba, а так же стилометрические характеристики текста. Эксперименты проводились с двумя корпусами текстов: корпус Text Similarity из открытых источников и собственный корпус, собранный с помощью филологов. Качество решения задачи оценивалось точностью, полнотой и F-мерой. Все нейросетевые языковые модели показали близкое качество F-меры около 86% для большего по размеру корпуса Text Similarity и 50–56% для собственного корпуса авторов. Совсем новым результатом оказалось успешное применение модели mamba. Однако, самым интересным достижением стало применение векторов стилометрических характеристик текста, показавшее 80% F-меры для авторского корпуса и одинаковое с нейросетевыми моделями качество решения задачи для другого корпуса.
Ключевые слова: обработка естественного языка, сходство текстов, классификация текстов, нейросетевые языковые модели, оценка открытых ответов учащихся, искусственный интеллект в образовании.
Финансовая поддержка Номер гранта
Ярославский государственный университет VIP-016
ЯрГУ (проект VIP-016).
Поступила в редакцию: 20.03.2024
Исправленный вариант: 11.04.2024
Принята в печать: 17.04.2024
Тип публикации: Статья
УДК: 004.912
MSC: 68T50
Образец цитирования: Н. С. Лагутина, К. В. Лагутина, В. Н. Копнин, “Автоматическое определение семантического сходства ответов учащихся с эталонным с помощью современных моделей”, Модел. и анализ информ. систем, 31:2 (2024), 194–205
Цитирование в формате AMSBIB
\RBibitem{LagLagKop24}
\by Н.~С.~Лагутина, К.~В.~Лагутина, В.~Н.~Копнин
\paper Автоматическое определение семантического сходства ответов учащихся с эталонным с помощью современных моделей
\jour Модел. и анализ информ. систем
\yr 2024
\vol 31
\issue 2
\pages 194--205
\mathnet{http://mi.mathnet.ru/mais824}
\crossref{https://doi.org/10.18255/1818-1015-2024-2-194-205}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais824
  • https://www.mathnet.ru/rus/mais/v31/i2/p194
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025