Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2019, том 43, выпуск 5, страницы 818–824
DOI: https://doi.org/10.18287/2412-6179-2019-43-5-818-824
(Mi co708)
 

Эта публикация цитируется в 68 научных статьях (всего в 68 статьях)

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

MIDV-500: a dataset for identity document analysis and recognition on mobile devices in video stream

V. V. Arlazarovabc, K. B. Bulatovbac, T. S. Chernovc, V. L. Arlazarovbca

a Moscow Institute of Physics and Technology (State University), Moscow, Russia
b Institute for Systems Analysis, FRC CSC RAS, Moscow, Russia
c LLC "Smart Engines Service", Moscow, Russia
Список литературы:
Аннотация: A lot of research has been devoted to identity documents analysis and recognition on mobile devices. However, no publicly available datasets designed for this particular problem currently exist. There are a few datasets which are useful for associated subtasks but in order to facilitate a more comprehensive scientific and technical approach to identity document recognition more specialized datasets are required. In this paper we present a Mobile Identity Document Video dataset (MIDV-500) consisting of 500 video clips for 50 different identity document types with ground truth which allows to perform research in a wide scope of document analysis problems. The paper presents characteristics of the dataset and evaluation results for existing methods of face detection, text line recognition, and document fields data extraction. Since an important feature of identity documents is their sensitiveness as they contain personal data, all source document images used in MIDV-500 are either in public domain or distributed under public copyright licenses.
The main goal of this paper is to present a dataset. However, in addition and as a baseline, we present evaluation results for existing methods for face detection, text line recognition, and document data extraction, using the presented dataset.
Ключевые слова: document analysis and recognition, dataset, identity documents, video stream recognition.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 17-29-03170 а
17-29-03370 а
Поступила в редакцию: 20.06.2019
Принята в печать: 21.08.2019
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: V. V. Arlazarov, K. B. Bulatov, T. S. Chernov, V. L. Arlazarov, “MIDV-500: a dataset for identity document analysis and recognition on mobile devices in video stream”, Компьютерная оптика, 43:5 (2019), 818–824
Цитирование в формате AMSBIB
\RBibitem{ArlBulChe19}
\by V.~V.~Arlazarov, K.~B.~Bulatov, T.~S.~Chernov, V.~L.~Arlazarov
\paper MIDV-500: a dataset for identity document analysis and recognition on mobile devices in video stream
\jour Компьютерная оптика
\yr 2019
\vol 43
\issue 5
\pages 818--824
\mathnet{http://mi.mathnet.ru/co708}
\crossref{https://doi.org/10.18287/2412-6179-2019-43-5-818-824}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co708
  • https://www.mathnet.ru/rus/co/v43/i5/p818
  • Эта публикация цитируется в следующих 68 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:330
    PDF полного текста:157
    Список литературы:19
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024