Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование», 2024, том 17, выпуск 1, страницы 75–85
DOI: https://doi.org/10.14529/mmp240107
(Mi vyuru713)
 

Программирование

Table recognition technology in tax documents of the Russian Federation
[Технология распознавания таблиц в налоговых документах РФ]

O. A. Slavinab

a Federal Research Center “Computer Science and Control” RAS, Moscow, Russian Federation
b LLC “Smart Engines Service”, Moscow, Russian Federation
Список литературы:
Аннотация: Рассматривается известная задача распознавания ячеек таблиц на изображении. Исследуется обработка налогового российского документа 2-НДФЛ. Несмотря на простую структуру таблиц, способ печати основан на гибком шаблоне. Гибкость формы наблюдается как в части модификаций текстовой информации, так и в области таблиц. Гибкость таблиц состоит в изменении числа и размеров столбцов. Для детектирования таблиц был предложен структурный метод. Входными данными метода являются детектированные горизонтальные и вертикальные отрезки. Поиск отрезков проводился механизмами, реализованными в системе Smart Document Reader. Апробация и внедрение предложенного метода также осуществлялось в системе Smart Document Reader. Кроме детектирования области предполагаемого размещения таблиц решены следующие задачи: поиск ячеек таблиц, именование ячеек таблиц, валидация области таблицы. Валидация области таблицы проводилась для отдельных таблиц, а также для совокупностей таблиц. Применение описаний совокупностей таблиц обеспечило высокую надежность привязки набора таблиц.
Ключевые слова: распознавание таблиц, детектирование отрезка, раскладка таблиц.
Поступила в редакцию: 14.11.2023
Тип публикации: Статья
УДК: 004.932.72'1
MSC: 90C35, 90C27
Язык публикации: английский
Образец цитирования: O. A. Slavin, “Table recognition technology in tax documents of the Russian Federation”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 17:1 (2024), 75–85
Цитирование в формате AMSBIB
\RBibitem{Sla24}
\by O.~A.~Slavin
\paper Table recognition technology in tax documents of the Russian Federation
\jour Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование
\yr 2024
\vol 17
\issue 1
\pages 75--85
\mathnet{http://mi.mathnet.ru/vyuru713}
\crossref{https://doi.org/10.14529/mmp240107}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyuru713
  • https://www.mathnet.ru/rus/vyuru/v17/i1/p75
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025