Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2021, том 45, выпуск 1, статья опубликована в англоязычной версии журнала
DOI: https://doi.org/10.18287/2412-6179-CO-759
(Mi co885)
 

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

INTERNATIONAL CONFERENCE ON MACHINE VISION

Optimal affine image normalization approach for optical character recognition

I. A. Konovalenkoab, V. V. Kokhanab, D. P. Nikolaevba

a Institute for Information Transmission Problems RAS, 127051, Moscow, Russia, Bolshoy Karetny per. 19, bld. 1
b Smart Engines, 117312, Moscow, Russia, pr-t 60-letiya Oktyabrya, 9
Список литературы:
Аннотация: Optical character recognition (OCR) in images captured from arbitrary angles requires preliminary normalization, i.e. a geometric transformation resulting in an image as if it was captured at an angle suitable for OCR. In most cases, a surface containing characters can be considered flat, and a pinhole model can be adopted for a camera. Thus, in theory, the normalization should be projective. Usually, the camera optical axis is approximately perpendicular to the document surface, so the projective normalization can be replaced with an affine one without a significant loss of accuracy. An affine image transformation is performed significantly faster than a projective normalization, which is important for OCR on mobile devices. In this work, we propose a fast approach for image normalization. It utilizes an affine normalization instead of a projective one if there is no significant loss of accuracy. The approach is based on a proposed criterion for the normalization accuracy: root mean square (RMS) coordinate discrepancies over the region of interest (ROI). The problem of optimal affine normalization according to this criterion is considered. We have established that this unconstrained optimization is quadratic and can be reduced to a problem of fractional quadratic functions integration over the ROI. The latter was solved analytically in the case of OCR where the ROI consists of rectangles. The proposed approach is generalized for various cases when instead of the affine transform its special cases are used: scaling, translation, shearing, and their superposition, allowing the image normalization procedure to be further accelerated.
Ключевые слова: optical character recognition, image registration, image normalization, coordinate discrepancy, projective transformation, affine transformation, approximation, optimization, symbolic computation.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-29-26035 мк
17-29-03370 а
This work was partially financially supported by the Russian Foundation for Basic Research, projects 18-29-26035 and 17-29-03370.
Поступила в редакцию: 25.05.2020
Принята в печать: 28.09.2020
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: I. A. Konovalenko, V. V. Kokhan, D. P. Nikolaev
Цитирование в формате AMSBIB
\RBibitem{KonKokNik21}
\by I.~A.~Konovalenko, V.~V.~Kokhan, D.~P.~Nikolaev
\mathnet{http://mi.mathnet.ru/co885}
\crossref{https://doi.org/10.18287/2412-6179-CO-759}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co885
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:74
    PDF полного текста:44
    Список литературы:18
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024