Математическая физика и компьютерное моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Математическая физика и компьютерное моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математическая физика и компьютерное моделирование, 2019, том 22, выпуск 4, страницы 53–63
DOI: https://doi.org/10.15688/mpcm.jvolsu.2019.4.4
(Mi vvgum267)
 

Моделирование, информатика и управление

Автоматизация морфологической разметки архивных документов

А. С. Комендантов, А. Г. Матвеев, А. В. Светлов

Волгоградский государственный университет
Аннотация: Работа посвящена описанию созданной авторами статьи надстройки над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Оно перехватывает вывод утилиты MyStem, специальным образом переформатирует и анализирует его. Кроме того, приложение имеет функционал для снятия омонии вручную, если автоматическими средствами морфологические характеристики слова определены неверно. Основное назначение данного приложения - подготовка морфологической разметки документов архивного фонда «Михайловский станичный атаман» для создания лингвистического корпуса. В ходе работы над приложением была решена задача корректной обработки текстов, содержащих устаревшие кириллические символы.
Ключевые слова: автоматизация лингвистического анализа, автоматизация морфологического анализа, утилита MyStem, графический интерфейс, программная оболочка, корпусная лингвистика.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 19-012-00246
Работа выполнена при финансовой поддержке гранта РФФИ № 19-012-00246.
Поступила в редакцию: 02.07.2019
Тип публикации: Статья
УДК: 004.91, 81’33, 004.42
ББК: 32.973, 81.1
Образец цитирования: А. С. Комендантов, А. Г. Матвеев, А. В. Светлов, “Автоматизация морфологической разметки архивных документов”, Математическая физика и компьютерное моделирование, 22:4 (2019), 53–63
Цитирование в формате AMSBIB
\RBibitem{KomMatSve19}
\by А.~С.~Комендантов, А.~Г.~Матвеев, А.~В.~Светлов
\paper Автоматизация морфологической разметки архивных документов
\jour Математическая физика и компьютерное моделирование
\yr 2019
\vol 22
\issue 4
\pages 53--63
\mathnet{http://mi.mathnet.ru/vvgum267}
\crossref{https://doi.org/10.15688/mpcm.jvolsu.2019.4.4}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vvgum267
  • https://www.mathnet.ru/rus/vvgum/v22/i4/p53
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математическая физика и компьютерное моделирование
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024