А. С. Большина, “Создание псевдоаннотированного обучающего корпуса для задачи разрешения лексической неоднозначности с помощью ансамбля моделей”, Интеллектуальные системы. Теория и приложения, 26:1 (2022), 185

Интеллектуальные системы. Теория и приложения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Интеллектуальные системы. Теория и приложения:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Интеллектуальные системы. Теория и приложения, 2022, том 26, выпуск 1, страницы 185–189 (Mi ista353)

Часть 4. Обработка естественного языка

Создание псевдоаннотированного обучающего корпуса для задачи разрешения лексической неоднозначности с помощью ансамбля моделей

А. С. Большина

филологический ф-т МГУ

PDF полного текста (285 kB)

Список литературы:

PDF

HTML

Аннотация: В настоящее время для задачи разрешения лексической неоднозначности наилучшие результаты на стандартных бенчмарках показывают алгоритмы, которые основаны на обучении с учителем. Однако, использование больших объемов размеченных данных для обучения таких моделей ограничивает их применение для языков с малым количеством ресурсов. Для русского языка также актуальна проблема нехватки аннотированных данных. В данной работе исследуется метод для автоматической разметки текстов, который основан на ансамбле моделей, предварительно обученных на синтетических данных. Результаты экспериментов демонстрируют, что модели, обученные на данных, размеченных предобученными моделями, показывают более высокое качество разрешения неоднозначности.

Ключевые слова: автоматическое разрешение неоднозначности, датасеты на русском языке, ELMo, BERT.

Тип публикации: Статья

Образец цитирования: А. С. Большина, “Создание псевдоаннотированного обучающего корпуса для задачи разрешения лексической неоднозначности с помощью ансамбля моделей”, Интеллектуальные системы. Теория и приложения, 26:1 (2022), 185–189

Цитирование в формате AMSBIB

\RBibitem{Bol22}

\by А.~С.~Большина

\paper Создание псевдоаннотированного обучающего корпуса для задачи разрешения лексической неоднозначности с помощью ансамбля моделей

\jour Интеллектуальные системы. Теория и приложения

\yr 2022

\vol 26

\issue 1

\pages 185--189

\mathnet{http://mi.mathnet.ru/ista353}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ista353

https://www.mathnet.ru/rus/ista/v26/i1/p185

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Интеллектуальные системы. Теория и приложения

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы