Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2021, том 33, выпуск 4, страницы 117–130
DOI: https://doi.org/10.15514/ISPRAS-2021-33(4)-9
(Mi tisp617)
 

Построение нейросетевых моделей морфологического и морфемного анализа текста

А. С. Сапин

Московский государственный университет имени М.В. Ломоносова
Аннотация: Морфологический анализ текстов на естественном языке является одним из важнейших этапов автоматической обработки текстов (АОТ). Традиционные и хорошо исследованные задачи морфологического анализа включают приведение словоформы к нормальной форме (лемме), определение ее морфологических характеристик, а также разрешение (снятие) морфологической омонимии (неоднозначности характеристик). К морфологическому анализу относится также задача морфемного разбора слов (т.е. сегментация слов на составляющие морфы и их классификация), которая востребована в некоторых приложениях АОТ. В последние годы разработан ряд программных моделей на основе машинного обучения, повышающих точность традиционного морфологического анализа и морфемного разбора, однако производительность таких моделей недостаточна для многих практических задач, а для задачи морфемного разбора высокоточные модели построены только для лемм. В данной работе описаны две новые высокоточные нейросетевые модели, реализующие морфемный разбор словоформ русского языка при достаточно высокой производительности. Первая модель основана на сверточной нейронной сети и показывает достойное качество морфемного разбора словоформ. Вторая модель, кроме морфемного разбора словоформы, позволяет предварительно уточнить её морфологические характеристики, решая задачу снятия омонимии. Производительность этой объединенной морфологической модели оказалась наилучшей среди рассмотренных моделей морфемного разбора, при сравнимой точности разбора.
Ключевые слова: морфологический анализ словоформ, автоматический морфемный разбор, нейросетевые модели морфемного разбора.
Тип публикации: Статья
Образец цитирования: А. С. Сапин, “Построение нейросетевых моделей морфологического и морфемного анализа текста”, Труды ИСП РАН, 33:4 (2021), 117–130
Цитирование в формате AMSBIB
\RBibitem{Sap21}
\by А.~С.~Сапин
\paper Построение нейросетевых моделей морфологического и морфемного анализа текста
\jour Труды ИСП РАН
\yr 2021
\vol 33
\issue 4
\pages 117--130
\mathnet{http://mi.mathnet.ru/tisp617}
\crossref{https://doi.org/10.15514/ISPRAS-2021-33(4)-9}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp617
  • https://www.mathnet.ru/rus/tisp/v33/i4/p117
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:16
    PDF полного текста:22
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024