|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ
Выделение знаний и языковых форм их выражения на множестве тематических текстов: подход на основе меры TF-IDF
Д. В. Михайлов, А. П. Козлов, Г. М. Емельянов Новгородский государственный университет имени Ярослава Мудрого, Новгород, Россия
Аннотация:
Статья посвящена проблеме выделения единиц знаний из множеств (корпусов) тематических текстов. Данная проблема актуальна для построения систем обработки, анализа, оценивания и понимания информации, в частности, изображений. Конечной практической целью здесь является поиск наиболее рационального варианта передачи смысла средствами заданного естественного языка (ЕЯ) для последующей фиксации фрагментов знаний в тезаурусе и онтологии предметной области (ПО). В настоящей статье разбиением слов исходной фразы на классы по значению меры TF-IDF относительно текстов корпуса решается задача поиска в корпусе фраз, максимально близких исходной по описываемому фрагменту фактического знания и формам его выражения в языке.
Ключевые слова:
распознавание образов, интеллектуальный анализ данных, теория информации, тест открытой формы, языковое представление экспертных знаний.
Поступила в редакцию: 22.04.2015 Исправленный вариант: 02.06.2015
Образец цитирования:
Д. В. Михайлов, А. П. Козлов, Г. М. Емельянов, “Выделение знаний и языковых форм их выражения на множестве тематических текстов: подход на основе меры TF-IDF”, Компьютерная оптика, 39:3 (2015), 429–438
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/co106 https://www.mathnet.ru/rus/co/v39/i3/p429
|
Статистика просмотров: |
Страница аннотации: | 212 | PDF полного текста: | 80 | Список литературы: | 49 |
|