|
Препринты Института прикладной математики им. М. В. Келдыша РАН, 2013, 027, 26 стр.
(Mi ipmp1777)
|
|
|
|
Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)
Идентификация автора текста по распределению частот буквосочетаний
Л. А. Борисов, Ю. Н. Орлов, К. П. Осминин
Аннотация:
Исследованы распределения расстояний между распределениями триграмм, получена оценка точности частот буквосочетаний в зависимости от длины текста и даны оценки вероятности правильной идентификации автора текста по близости текста к его средневзвешенному эталону в смысле распределения частот. Построены авторские длины представительности для большого числа писателей и показано, что стабилизация триграмм происходит примерно на половине текста независимо от автора и длины текста. Проведен анализ литературного наследия Е. И. Рерих с целью кластеризации ее произведений и проверки ряда утверждений о возможном соавторстве.
Ключевые слова:
эмпирическая вероятность, минимально достаточная длина текста, идентификация автора.
Образец цитирования:
Л. А. Борисов, Ю. Н. Орлов, К. П. Осминин, “Идентификация автора текста по распределению частот буквосочетаний”, Препринты ИПМ им. М. В. Келдыша, 2013, 027, 26 с.
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp1777 https://www.mathnet.ru/rus/ipmp/y2013/p27
|
Статистика просмотров: |
Страница аннотации: | 581 | PDF полного текста: | 280 | Список литературы: | 59 |
|