|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Программирование
Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents
[Максимальная невязка координат как критерий точности проективной нормализации изображения при оптическом распознавании документов]
I. A. Konovalenkoab, V. V. Kokhanab, D. P. Nikolaevab a Institute for Information Transmission Problems of the RAS, Moscow
b Smart Engines Service LLC, Moscow, Russian Federation
Аннотация:
Общепринято применение проективной нормализации (частный случай ортокоррекции и коррекции перспективы) к фотографиям документов для их последующего оптического распознавания. При этом неточности нормализации могут приводить к ошибкам распознавания. На сегодняшний день в литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры обосновывается равномерная вероятностная модель ошибок распознавания, в соответствии с которой вероятность верного распознавания символа скачком падает до нуля с ростом невязки координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный максимальной по текстовым полям документа невязке координат, монотонно связан с вероятностью верного распознавания всего документа. Показано, что задача вычисления максимальной невязки координат не сводится к ближайшей известной, т.е. задаче дробно-линейного программирования. Наконец, впервые получено аналитическое решение задачи вычисления максимальной невязки координат на объединении многоугольников.
Ключевые слова:
ортокоррекция, коррекция перспективы, проективная нормализация изображений, оптическое распознавание символов, критерии точности, невязка координат, нелинейное программирование.
Поступила в редакцию: 21.11.2019
Образец цитирования:
I. A. Konovalenko, V. V. Kokhan, D. P. Nikolaev, “Maximal coordinate discrepancy as accuracy criterion of image projective normalization for optical recognition of documents”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 13:3 (2020), 43–58
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vyuru556 https://www.mathnet.ru/rus/vyuru/v13/i3/p43
|
Статистика просмотров: |
Страница аннотации: | 163 | PDF полного текста: | 47 | Список литературы: | 32 |
|