|
Графовые $n$-граммы в задаче атрибуции текстов
Н. Д. Москин, А. А. Рогов, А. А. Лебедев Петрозаводский государственный университет
Аннотация:
Представлены результаты исследований в области моделирования структуры текстов с использованием обобщенной контекстно-зависимой теоретико-графовой модели. Объектом исследования стали в основном литературные и фольклорные тексты, для которых возникает задача атрибуции. Например, таких текстов много в творчестве известного русского писателя Ф. М. Достоевского. Авторы показывают, как можно построить гибридные модели, основанные на деревьях зависимостей, графовых моделях синтаксической структуры связей между простыми предложениями в составе многокомпонентного сложного предложения и графов «сильных связей» сочетаемости слов различных грамматических классов. Такие модели позволяют конструировать новые информативные признаки, потенциально применимые в атрибуции текстов. Примером служит частота встречаемости графовых $n$-грамм, которые представляют собой обобщение обычных $n$-грамм, синтаксических $n$-грамм и других подобных конструкций, применяемых в стилистических исследованиях.
Ключевые слова:
искусственный интеллект, атрибуция текстов, граф, метаграф, гибридный граф, фольклорный текст, литературный текст, графовая $n$-грамма.
Поступила в редакцию: 01.07.2023
Образец цитирования:
Н. Д. Москин, А. А. Рогов, А. А. Лебедев, “Графовые $n$-граммы в задаче атрибуции текстов”, Системы и средства информ., 33:4 (2023), 115–125
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi916 https://www.mathnet.ru/rus/ssi/v33/i4/p115
|
Статистика просмотров: |
Страница аннотации: | 40 | PDF полного текста: | 22 | Список литературы: | 13 |
|