|
Информатика и её применения, 2013, том 7, выпуск 2, страницы 92–99
(Mi ia265)
|
|
|
|
Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)
Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественно-языковых текстов больших объемов для систем извлечения знаний
М. М. Шарнин, Н. В. Сомин, И. П. Кузнецов, Ю. И. Морозова, И. В. Галина, Е. Б. Козеренко Институт проблем информатики Российской академии наук
Аннотация:
Ассоциативные связи между терминами, понятиями и другими элементами естественного языка (ЕЯ) играют важную роль в решении широкого класса прикладных задач, среди которых интеллектуальная обработка текстов, извлечение знаний, их обработка с формированием баз знаний и организация различных видов поиска, в том числе семантических. Предложены методы автоматизированного выявления ассоциативных связей в текстах из Интернета и построения ассоциативных портретов различных предметных областей, ориентированных на решение перечисленных задач. Ассоциативный портрет предметной области (АППО) представляет собой словарь значимых терминов и словосочетаний, элементы которого связаны ассоциативными связями. Ассоциативный портрет предметной области создается автоматически на базе статистического анализа больших объемов текстов. Теоретическая значимость предлагаемого подхода заключается в использовании методов статистики, корпусной лингвистики и дистрибутивной семантики для обработки больших текстовых массивов на ЕЯ (постоянно пополняемых и обновляемых в Интернете) с целью построения модели предметной области в виде АППО.
Ключевые слова:
автоматическая обработка корпусов текстов; статистические методы; интеллектуальные интернет-технологии; лексико-семантический анализ; извлечение знаний из текстов; семантический поиск; семантические векторы; семантическое контекстное пространство.
Образец цитирования:
М. М. Шарнин, Н. В. Сомин, И. П. Кузнецов, Ю. И. Морозова, И. В. Галина, Е. Б. Козеренко, “Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественно-языковых текстов больших объемов для систем извлечения знаний”, Информ. и её примен., 7:2, «Вероятностно-статистические методы и задачи информатики и информационных технологий» (2013), 92–99
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ia265 https://www.mathnet.ru/rus/ia/v7/i2/p92
|
Статистика просмотров: |
Страница аннотации: | 385 | PDF полного текста: | 143 | Список литературы: | 64 | Первая страница: | 3 |
|