|
Анализ влияния предобработки текстов на идентификацию авторов методом биграмм
М. Ю. Кислицына
Аннотация:
На примере достаточно представительного корпуса авторов и текстов проведен сравнительный анализ влияния программ предобработки текстов на возможность идентификации авторов. Исследован вопрос чувствительности ошибки идентификации по доле изменения исходного текста. Показано, что авторское своеобразие сохраняется после предобработки практически на уровне оригинального текста.
Ключевые слова:
машинная классификация, предобработка текстов, распределение биграмм, идентификация автора.
Образец цитирования:
М. Ю. Кислицына, “Анализ влияния предобработки текстов на идентификацию авторов методом биграмм”, Препринты ИПМ им. М. В. Келдыша, 2022, 067, 18 с.
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp3092 https://www.mathnet.ru/rus/ipmp/y2022/p67
|
Статистика просмотров: |
Страница аннотации: | 40 | PDF полного текста: | 19 | Список литературы: | 15 |
|