|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Теоретическая и прикладная математика
Аппроксимация распределений частот буквенных биграмм текста для идентификации букв
Ю. А. Котов Новосибирский государственный технический университет (НГТУ)
Аннотация:
В статье рассмотрены особенности применения методов частотного упорядочивания и аппроксимации для решения задачи идентификации знаков текста. Определены условия реализации метода Якобсена для получения наименьшей погрешности идентификации. Предложен метод аппроксимации одномерных и двумерных распределений частот знаковых биграмм текста и буквенных биграмм эталона языка текста. Приведены экспериментальные данные о погрешностях метода Якобсена и предложенного метода аппроксимации для русскоязычных текстов.
Погрешность предложенного метода меньше, чем у метода Якобсена. Метод может быть использован для идентификации знаков текста любого языка, для которого существует эталонное распределение частот буквенных биграмм.
Ключевые слова:
аппроксимация; идентификация; буква; биграмма; простая замена; шифр.
Образец цитирования:
Ю. А. Котов, “Аппроксимация распределений частот буквенных биграмм текста для идентификации букв”, Тр. СПИИРАН, 50 (2017), 190–208
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy932 https://www.mathnet.ru/rus/trspy/v50/p190
|
Статистика просмотров: |
Страница аннотации: | 136 | PDF полного текста: | 96 |
|