|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Статистический анализ полного корпуса художественной литературы на русском языке и распознавание автора
М. Ю. Кислицына, Ю. Н. Орлов
Аннотация:
Собрана статистика эталонных триграмм для полного корпуса литературных текстов на русском языке, включая переводных зарубежных авторов. Построены распределения расстояний от отдельных текстов до эталонов. Протестирован метод ближайшего эталона для распознавания автора текста. Определена ошибка по жанрам, подгруппам авторов и по корпусу в целом. Проведена классификация ошибок для разработки метода коррекции.
Ключевые слова:
триграммы, метод ближайшего соседа, распознавание автора текста.
Образец цитирования:
М. Ю. Кислицына, Ю. Н. Орлов, “Статистический анализ полного корпуса художественной литературы на русском языке и распознавание автора”, Препринты ИПМ им. М. В. Келдыша, 2024, 017, 24 с.
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp3227 https://www.mathnet.ru/rus/ipmp/y2024/p17
|
Статистика просмотров: |
Страница аннотации: | 56 | PDF полного текста: | 32 | Список литературы: | 12 |
|