|
Вычислительные методы и программирование, 2010, том 11, выпуск 4, страницы 108–116
(Mi vmp345)
|
|
|
|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Программирование
Комбинирование признаков для автоматического извлечения терминов
Н. В. Лукашевич, Ю. М. Логачев Научно-исследовательский вычислительный центр,
Московский государственный университет им. М. В. Ломоносова
Аннотация:
В статье описывается эксперимент по извлечению двухсловных
терминологических словосочетаний на основе комбинирования
различных признаков этих словосочетаний. Признаки
вычисляются на основе трех источников: статистики употребления слов в
текстовой коллекции
предметной области, выдачи глобальных поисковых машин и
тезауруса предметной области. Для оценки качества извлечения терминов
используется терминологические словосочетания из онтологии по естественным
наукам и
технологиям ОЕНТ. Показано, что использование совокупности признаков
словосочетаний значительно улучшает извлечение терминов.
Ключевые слова:
извлечение знаний из текстов; извлечение терминов; тезаурус; машинное обучение; поисковая система; Интернет.
Образец цитирования:
Н. В. Лукашевич, Ю. М. Логачев, “Комбинирование признаков для автоматического извлечения терминов”, Выч. мет. программирование, 11:4 (2010), 108–116
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vmp345 https://www.mathnet.ru/rus/vmp/v11/i4/p108
|
Статистика просмотров: |
Страница аннотации: | 230 | PDF полного текста: | 129 | Список литературы: | 1 |
|