|
Эта публикация цитируется в 5 научных статьях (всего в 5 статьях)
Формы представления нового знания, извлеченного из текстов
И. М. Зацман Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Аннотация:
Рассматривается модель целенаправленного извлечения нового знания из текстов коллективом экспертов, а также формы его представления в лингвистических типологиях и словарях терминов баз медицинских знаний. Использование модели иллюстрируется двумя примерами: извлечение нового знания о значениях немецких модальных глаголов из параллельных текстов и о значениях терминов из медицинских документов. Процесс извлечения нового знания основан на лингвистическом аннотировании текстов экспертами. Основная цель аннотирования состоит в пополнении типологий рубриками (баз знаний (БЗ) — терминами), которые удовлетворяют заданному критерию новизны, согласованы в коллективе экспертов и представляют извлеченное знание. Рассматриваемая модель включает этап согласования понимания экспертами как извлеченного знания, так и форм его представления. В рассматриваемом примере базы знаний используются три формы: новый термин, измененная дефиниция уже существующего термина (без увеличения числа его значений) и расширенная дефиниция уже существующего термина (с увеличением числа его значений).
Ключевые слова:
извлечение знания из текстов, модель ИТО, концепт, рубрика, термин, контекстное значение, немецкие модальные глаголы, типология, база медицинских знаний.
Поступила в редакцию: 14.07.2021
Образец цитирования:
И. М. Зацман, “Формы представления нового знания, извлеченного из текстов”, Информ. и её примен., 15:3 (2021), 83–90
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ia747 https://www.mathnet.ru/rus/ia/v15/i3/p83
|
|