|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Программирование
Method for analyzing the structure of noisy images of administrative documents
[Метод анализа структуры зашумленных образов деловых документов]
O. A. Slavina, E. L. Pliskinab a Federal Research Center “Computer Science and Control” of the Russian Academy
b LLC “Smart Engines Service”, Moscow, Russian Federation
Аннотация:
Рассматривается задача извлечения из образа делового документа элементов заполнения (полей) с помощью описаний опорных элементов. Деловые документы содержат статические и переменные элементы (заполнение). Статичными объектами модели являются линии разграфки и слова текста. Описываются наборы объектов, объединенные свойствами и отношениями. Текстовый дескриптор может содержать атрибуты, позволяющие отличать его от сходных дескрипторов. Мы предлагаем применять комбинированные дескрипторы, состоящие из отрезков линий и слов. Экспериментально показано, что извлечение наборов объектов повышает точность распознавания полей документа на 17%, а точность извлечения информации из образа документа – на 16%. В качестве оптического распознавания символов в эксперименте использовалась система SDK Smart Document Engine.
Ключевые слова:
зашумленный образ, распознавание документа, текстовая особая точка, дескриптор.
Поступила в редакцию: 15.09.2022
Образец цитирования:
O. A. Slavin, E. L. Pliskin, “Method for analyzing the structure of noisy images of administrative documents”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 15:4 (2022), 80–89
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vyuru663 https://www.mathnet.ru/rus/vyuru/v15/i4/p80
|
|