Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2024, том 36, выпуск 3, страницы 93–104
DOI: https://doi.org/10.15514/ISPRAS-2024-36(3)-7
(Mi tisp890)
 

Automated extraction of facts from tabular data based on semantic table annotation
[Автоматизированное извлечение фактов из табличных данных на основе семантического аннотирования таблиц]

N. O. Dorodnykh, A. Yu. Yurin

Matrosov Institute for System Dynamics and Control Theory of Siberian Branch of Russian Academy of Sciences, Irkutsk
Аннотация: Использование графов знаний при построении интеллектуальных информационно-аналитических систем позволяет эффективно структурировать и анализировать знания, обрабатывать большие объемы данных, повышать качество систем и применять их в различных областях, таких как медицина, производство, торговля и финансы. Однако создание графов знаний для конкретной предметной области по-прежнему остается сложной задачей, требующей создания специализированных методов и программного обеспечения. Одной из основных тенденций в этой области является использование различных источников информации, в частности таблиц, что позволяет существенно повысить эффективность этого процесса. В данной статье предложен подход и программное средство для автоматического извлечения конкретных сущностей (фактов) из табличных данных и пополнения ими целевого графа знаний на основе семантической интерпретации (аннотирования) таблиц. Предложенный подход реализован в виде специализированного обработчика, входящего в состав платформы Talisman. В статье также представлена экспериментальная оценка предлагаемого подхода и демонстрация разработки предметного графа знаний для платформы Talisman.
Ключевые слова: инженерия знаний, граф знаний, пополнение графа знаний, табличные данные, семантическая интерпретация таблиц, извлечение фактов
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 1023110300006-9
Совет по грантам Президента РФ СП-978.2022.5
Работа выполнена в рамках государственного задания Министерства науки и высшего образования Российской Федерации (тема № 1023110300006-9). Автор Дородных Н.О. является стипендиатом Совета по грантам Президента России (проект СП-978.2022.5).
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: N. O. Dorodnykh, A. Yu. Yurin, “Automated extraction of facts from tabular data based on semantic table annotation”, Труды ИСП РАН, 36:3 (2024), 93–104
Цитирование в формате AMSBIB
\RBibitem{DorYur24}
\by N.~O.~Dorodnykh, A.~Yu.~Yurin
\paper Automated extraction of facts from tabular data based on semantic table annotation
\jour Труды ИСП РАН
\yr 2024
\vol 36
\issue 3
\pages 93--104
\mathnet{http://mi.mathnet.ru/tisp890}
\crossref{https://doi.org/10.15514/ISPRAS-2024-36(3)-7}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp890
  • https://www.mathnet.ru/rus/tisp/v36/i3/p93
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:6
    PDF полного текста:5
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024