|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Об основных типах связанности между текстовыми документами
М. М. Шарнин, Н. В. Сомин Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
Аннотация:
Рассматривается вопрос связанности естественно-языковых текстов по текстуальным признакам (фрагментам). Выявлены два типа связанности: явная связанность, когда тексты связаны библиографическими ссылками, и неявная связанность, когда тексты связаны между собой через общие текстовые фрагменты. Обсуждаются преимущества и области применения неявной связанности. Показано, что использование неявной связанности значительно повышает область применения основанных на связанности методов обработки текстов. Предложены меры явной и неявной связанности. Проведен эксперимент с корпусом текстов по предметной области «компьютерная графика». На основе эксперимента показано, что оба типа связанности коррелированны между собой. Найдены параметры обработки текстов, когда корреляция максимальна и достигает примерно 55%. Приводятся планы по дальнейшему развитию предложенного метода сравнения и уточнению полученных результатов.
Ключевые слова:
связанность текстов; явная связанность; неявная связанность; мера связанности; коллекция текстов; корреляция.
Поступила в редакцию: 29.10.2016
Образец цитирования:
М. М. Шарнин, Н. В. Сомин, “Об основных типах связанности между текстовыми документами”, Системы и средства информ., 27:1 (2017), 100–107
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi505 https://www.mathnet.ru/rus/ssi/v27/i1/p100
|
Статистика просмотров: |
Страница аннотации: | 221 | PDF полного текста: | 65 | Список литературы: | 46 |
|