Информатика и её применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и её применения, 2018, том 12, выпуск 3, страницы 91–98
DOI: https://doi.org/10.14357/19922264180313
(Mi ia552)
 

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Семантическая обработка неструктурированных текстовых данных на основе лингвистического процессора PullEnti

Е. Б. Козеренкоa, К. И. Кузнецовa, Д. А. Романовb

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Национальный исследовательский университет «Высшая школа экономики»
Список литературы:
Аннотация: Представлена методика создания систем извлечения знаний, основанная на подходе, главным инструментом которого является программный пакет PullEnti, включающий алгоритмы морфологического и семантико-синтаксического анализа для выделения сущностей определенных типов из текстов естественного языка (персоны, организации, локации и другие целевые семантические объекты). В системе PullEnti используются динамически подключаемые компоненты (плагины), что позволяет без перекомпилирования активировать различные функциональные возможности. Именно таким образом запускается блок семантического анализа. В процессе анализа выделяются семантические единицы (токены), которые представляют собой типизированные фразы: текстовые, числовые и др. Приводятся примеры реализованных проектов для различных предметных областей.
Ключевые слова: семантическое моделирование; извлечение именованных сущностей; области с интенсивным использованием данных; автоматизированные системы извлечения знаний; семантический поиск; интеллектуальные интернет-технологии.
Поступила в редакцию: 13.07.2018
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: Е. Б. Козеренко, К. И. Кузнецов, Д. А. Романов, “Семантическая обработка неструктурированных текстовых данных на основе лингвистического процессора PullEnti”, Информ. и её примен., 12:3 (2018), 91–98
Цитирование в формате AMSBIB
\RBibitem{KozKuzRom18}
\by Е.~Б.~Козеренко, К.~И.~Кузнецов, Д.~А.~Романов
\paper Семантическая обработка неструктурированных текстовых данных на~основе лингвистического процессора PullEnti
\jour Информ. и её примен.
\yr 2018
\vol 12
\issue 3
\pages 91--98
\mathnet{http://mi.mathnet.ru/ia552}
\crossref{https://doi.org/10.14357/19922264180313}
\elib{https://elibrary.ru/item.asp?id=35670779}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ia552
  • https://www.mathnet.ru/rus/ia/v12/i3/p91
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и её применения
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024