|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Теоретическая и прикладная математика
Детерминированная идентификация буквенных биграмм в русскоязычном тексте
Ю. А. Котов Новосибирский государственный технический университет (НГТУ)
Аннотация:
В статье рассмотрена задача идентификации символов текстов на естественном языке по числовым характеристикам этих текстов. На основе правил языка и частот биграмм предложено решение данной задачи для русских текстов. Решение представляет собой систему идентифицирующих функций для каждого символа алфавита и детерминированную последовательность их применения. Указаны ограничения для полученного решения, область его эффективного применения и возможности расширения.
Ключевые слова:
идентификация; символ; биграмма; русский язык; простая замена.
Образец цитирования:
Ю. А. Котов, “Детерминированная идентификация буквенных биграмм в русскоязычном тексте”, Тр. СПИИРАН, 44 (2016), 181–197
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy861 https://www.mathnet.ru/rus/trspy/v44/p181
|
Статистика просмотров: |
Страница аннотации: | 204 | PDF полного текста: | 151 |
|