Системы и средства информатики
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Системы и средства информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Системы и средства информатики, 2018, том 28, выпуск 4, страницы 145–155
DOI: https://doi.org/10.14357/08696527180414
(Mi ssi614)
 

Элементы самообучения в системе извлечения биографических фактов Т-парсер

И. М. Адамович, О. И. Волков

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
Список литературы:
Аннотация: Статья посвящена дальнейшему развитию системы автоматического извлечения фактов из текстов историко-биографической направленности Т-парсер — составной части технологии автоматизации историко-биографического исследования. Намечаются пути увеличения скорости обработки за счет использования механизма самообучения. Описываются и обосновываются применяемые формы самообучения, формулируются возможные проблемы. Приводится классификация ветвлений при разборе текстов. Описывается и обосновывается механизм фильтрации при формировании базы данных (БД) прецедентов на основе методов статистического приемочного контроля по альтернативному признаку. Приводится описание обновленного алгоритма парсинга и экспериментальной проверки его эффективности по сравнению с предыдущей версией, осуществленной на реальных текстах историко-биографической направленности. Приводятся результаты экспериментов, подтверждающие высокую эффективность обновленного алгоритма и его применимость в технологии автоматизации историко-биографического исследования, предназначенной для широкого круга не являющихся профессиональными историками и биографами пользователей, что актуально в связи со все увеличивающимся общественным интересом к семейной истории.
Ключевые слова: извлечение фактов из текстов, самообучение, ветвления, статистический приемочный контроль, обучающая выборка.
Поступила в редакцию: 15.05.2018
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: И. М. Адамович, О. И. Волков, “Элементы самообучения в системе извлечения биографических фактов Т-парсер”, Системы и средства информ., 28:4 (2018), 145–155
Цитирование в формате AMSBIB
\RBibitem{AdaVol18}
\by И.~М.~Адамович, О.~И.~Волков
\paper Элементы самообучения в~системе извлечения биографических фактов Т-парсер
\jour Системы и средства информ.
\yr 2018
\vol 28
\issue 4
\pages 145--155
\mathnet{http://mi.mathnet.ru/ssi614}
\crossref{https://doi.org/10.14357/08696527180414}
\elib{https://elibrary.ru/item.asp?id=36511793}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ssi614
  • https://www.mathnet.ru/rus/ssi/v28/i4/p145
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Системы и средства информатики
    Статистика просмотров:
    Страница аннотации:157
    PDF полного текста:33
    Список литературы:23
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024