Информационные технологии и вычислительные системы
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



ИТиВС:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информационные технологии и вычислительные системы, 2022, выпуск 4, страницы 13–24
DOI: https://doi.org/10.14357/20718632220402
(Mi itvs782)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов

О. А. Славинab

a Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук", г. Москва, Россия
b ООО "Смарт Энджинс Сервис"
Аннотация: Рассматривается задача извлечения из распознанного образа документа элементов заполнения (полей) с помощью дескрипторов – описаний одного или нескольких структурных элементов. Структурными элементами могут быть слова статического текста и линии разграфки, используемые для оформления дизайна документа. Рассматриваются деловые документы с упрощенной структурой и ограниченным словарем. Рассматриваются гибкие деловые документы, допускающие существенные модификации дизайна страницы. Дескрипторы создаются с учетом значительного числа возможных ошибок распознавания страниц документов. Описываются комбинированные дескрипторы, состоящие из нескольких термов и отрезков линий. Приводится алгоритм привязки, базирующийся на дескрипторах. Экспериментально показывается, что извлечение комбинированных дескрипторов улучшает точность распознавания полей документа при распознавании на 17%, а точность извлечения информации из образа документа – на 16%. В качестве OCR в эксперименте использовалась система SDK Smart Document Engine.
Ключевые слова: зашумленный образ, распознавание документа, текстовая особая точка, дескриптор.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 20-07-00934
Работа выполнена при частичной финансовой поддержке РФФИ (проект 20-07-00934).
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: О. А. Славин, “Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов”, ИТиВС, 2022, № 4, 13–24
Цитирование в формате AMSBIB
\RBibitem{Sla22}
\by О.~А.~Славин
\paper Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов
\jour ИТиВС
\yr 2022
\issue 4
\pages 13--24
\mathnet{http://mi.mathnet.ru/itvs782}
\crossref{https://doi.org/10.14357/20718632220402}
\elib{https://elibrary.ru/item.asp?id=50173543}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/itvs782
  • https://www.mathnet.ru/rus/itvs/y2022/i4/p13
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информационные технологии и вычислительные системы
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024