Eurasian Journal of Mathematical and Computer Applications
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Eurasian Journal of Mathematical and Computer Applications:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Eurasian Journal of Mathematical and Computer Applications, 2020, том 8, выпуск 2, страницы 41–51
DOI: https://doi.org/10.32523/2306-6172-2020-8-2-41-51
(Mi ejmca157)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Selection technique for multiple outputs of optical character recognition

I. Q. Habeeba, Z. Q. Al-Zaydib, H. N. Abdulkhudhurc

a Engineering College, University of Information Technology and Communications, Baghdad, Iraq
b Biomedical Engineering, University of Technology, Baghdad, Iraq
c Directorate of Second Karkh, Ministry of Education, Baghdad, Iraq
Аннотация: The approach of OCR multiple outputs is used to improve accuracy for low scanning resolution images. The idea of this approach is to incorporate information from multiple outputs of OCR to improve the final OCR output. This approach includes a selection process for choosing the best resulting words among multiple outputs of OCR. However, most existing selection techniques used in the selection process are not context-aware. Therefore, this research proposed a selection technique to overcome the drawbacks of existing techniques. It uses context information of sentences collected from the N-gram language model to improve the final OCR output. The proposed selection technique was evaluated against three other related existing techniques. The evaluation metrics used in this research were Character Error Rate (CER) and Word Error Rate (WER). Experiments showed a relative decrease of 18.26% and 14.23% over the CER and WER of the best existing technique. The proposed selection technique will result in better information extraction through the automatic recognition of low scanning documents.
Ключевые слова: Selection technique, low-resolution images, ocr errors, document recognition.
Реферативные базы данных:
Тип публикации: Статья
MSC: 68W01, 68W32, 68T50
Язык публикации: английский
Образец цитирования: I. Q. Habeeb, Z. Q. Al-Zaydi, H. N. Abdulkhudhur, “Selection technique for multiple outputs of optical character recognition”, Eurasian Journal of Mathematical and Computer Applications, 8:2 (2020), 41–51
Цитирование в формате AMSBIB
\RBibitem{HabAl-Abd20}
\by I.~Q.~Habeeb, Z.~Q.~Al-Zaydi, H.~N.~Abdulkhudhur
\paper Selection technique for multiple outputs of optical character recognition
\jour Eurasian Journal of Mathematical and Computer Applications
\yr 2020
\vol 8
\issue 2
\pages 41--51
\mathnet{http://mi.mathnet.ru/ejmca157}
\crossref{https://doi.org/10.32523/2306-6172-2020-8-2-41-51}
\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=000543280900003}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85087015916}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ejmca157
  • https://www.mathnet.ru/rus/ejmca/v8/i2/p41
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Eurasian Journal of Mathematical and Computer Applications
    Статистика просмотров:
    Страница аннотации:228
    PDF полного текста:139
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024