Е. Б. Козеренко, К. И. Кузнецов, Д. А. Романов, “Семантическая обработка неструктурированных текстовых данных на основе лингвистического процессора PullEnti”, Информ. и её примен., 12:3 (2018), 91

Информатика и её применения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Информатика и её применения, 2018, том 12, выпуск 3, страницы 91–98
DOI: https://doi.org/10.14357/19922264180313 (Mi ia552)

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Семантическая обработка неструктурированных текстовых данных на основе лингвистического процессора PullEnti

Е. Б. Козеренко^a, К. И. Кузнецов^a, Д. А. Романов^b

^a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
^b Национальный исследовательский университет «Высшая школа экономики»

PDF полного текста (458 kB) Список цитирования (2)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14357/19922264180313

Аннотация: Представлена методика создания систем извлечения знаний, основанная на подходе, главным инструментом которого является программный пакет PullEnti, включающий алгоритмы морфологического и семантико-синтаксического анализа для выделения сущностей определенных типов из текстов естественного языка (персоны, организации, локации и другие целевые семантические объекты). В системе PullEnti используются динамически подключаемые компоненты (плагины), что позволяет без перекомпилирования активировать различные функциональные возможности. Именно таким образом запускается блок семантического анализа. В процессе анализа выделяются семантические единицы (токены), которые представляют собой типизированные фразы: текстовые, числовые и др. Приводятся примеры реализованных проектов для различных предметных областей.

Ключевые слова: семантическое моделирование; извлечение именованных сущностей; области с интенсивным использованием данных; автоматизированные системы извлечения знаний; семантический поиск; интеллектуальные интернет-технологии.

Поступила в редакцию: 13.07.2018

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: Е. Б. Козеренко, К. И. Кузнецов, Д. А. Романов, “Семантическая обработка неструктурированных текстовых данных на основе лингвистического процессора PullEnti”, Информ. и её примен., 12:3 (2018), 91–98

Цитирование в формате AMSBIB

\RBibitem{KozKuzRom18}

\by Е.~Б.~Козеренко, К.~И.~Кузнецов, Д.~А.~Романов

\paper Семантическая обработка неструктурированных текстовых данных на~основе лингвистического процессора PullEnti

\jour Информ. и её примен.

\yr 2018

\vol 12

\issue 3

\pages 91--98

\mathnet{http://mi.mathnet.ru/ia552}

\crossref{https://doi.org/10.14357/19922264180313}

\elib{https://elibrary.ru/item.asp?id=35670779}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ia552

https://www.mathnet.ru/rus/ia/v12/i3/p91

Эта публикация цитируется в следующих 2 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы