|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Линейное упорядочение множества правил в системе извлечения биографических фактов Т-парсер
И. М. Адамович, О. И. Волков Институт проблем информатики Федерального исследовательского центра «Информатика и управление»
Российской академии наук
Аннотация:
Статья посвящена дальнейшему развитию системы автоматического извлечения фактов из текстов историко-биографической направленности Т-парсер — составной части технологии автоматизации историко-биографического исследования. Анализируются недостатки существующей реализации системы, описывается и обосновывается способ их исправления посредством исключения циклов из грамматики и ее линейного упорядочения. Приводится описание обновленного алгоритма парсинга и экспериментальной проверки его эффективности по сравнению с предыдущей версией, осуществленной на реальных текстах историко-биографической направленности. Приводятся результаты экспериментов, подтверждающие высокую эффективность обновленного алгоритма и его применимость в технологии автоматизации историко-биографического исследования, предназначенной для широкого круга не являющихся профессиональными историками и биографами пользователей, что актуально в связи со все увеличивающимся общественным интересом к семейной истории. Намечаются пути дальнейшей модификации алгоритма с целью дополнительного повышения эффективности выделения фактов.
Ключевые слова:
извлечение фактов из текстов; GLR-алгоритм; псевдопорядок; линейное упорядочение; исключение циклов.
Поступила в редакцию: 27.03.2018
Образец цитирования:
И. М. Адамович, О. И. Волков, “Линейное упорядочение множества правил в системе извлечения биографических фактов Т-парсер”, Системы и средства информ., 28:3 (2018), 217–226
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi598 https://www.mathnet.ru/rus/ssi/v28/i3/p217
|
Статистика просмотров: |
Страница аннотации: | 224 | PDF полного текста: | 42 | Список литературы: | 37 |
|