|
Моделирование, информатика и управление
Автоматизация морфологической разметки архивных документов
А. С. Комендантов, А. Г. Матвеев, А. В. Светлов Волгоградский государственный университет
Аннотация:
Работа посвящена описанию созданной авторами статьи надстройки над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Оно перехватывает вывод утилиты MyStem, специальным образом переформатирует и анализирует его. Кроме того, приложение имеет функционал для снятия омонии вручную, если автоматическими средствами морфологические характеристики слова определены неверно. Основное назначение данного приложения - подготовка морфологической разметки документов архивного фонда «Михайловский станичный атаман» для создания лингвистического корпуса. В ходе работы над приложением была решена задача корректной обработки текстов, содержащих устаревшие кириллические символы.
Ключевые слова:
автоматизация лингвистического анализа, автоматизация морфологического анализа, утилита MyStem, графический интерфейс, программная оболочка, корпусная лингвистика.
Поступила в редакцию: 02.07.2019
Образец цитирования:
А. С. Комендантов, А. Г. Матвеев, А. В. Светлов, “Автоматизация морфологической разметки архивных документов”, Математическая физика и компьютерное моделирование, 22:4 (2019), 53–63
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vvgum267 https://www.mathnet.ru/rus/vvgum/v22/i4/p53
|
|