Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2022, том 34, выпуск 6, страницы 137–146
DOI: https://doi.org/10.15514/ISPRAS-2022-34(6)-10
(Mi tisp744)
 

Автоматическая разметка данных для сегментации изображений документов с использованием глубоких нейронных сетей

А. А. Михайловab

a Институт системного программирования им. В.П. Иванникова РАН
b Институт динамики систем и теории управления имени В.М. Матросова Сибирского отделения Российской академии наук
Аннотация: В статье предложен новый метод автоматической аннотации данных для решения задачи сегментации изображений документов с помощью глубоких нейронных сетей обнаружения объектов. В качестве исходных данных для разметки рассматривается формат помеченных файлов PDF. Особенность данного формата заключается в том, что он включает в себя скрытые метки, которые описывают логическую и физическую структуру документа. Для их извлечения разработано инструментальное средство, которое имитирует работу стековой машины вывода на печать согласно спецификации формата PDF. Для каждой страницы документа генерируются изображение, и аннотация в формате PASCAL VOC. Классы и координаты ограничивающих рамок вычисляются в процессе интерпретации помеченного PDF файла на основе меток. Для апробации метода была сформирована коллекция размеченных PDF файлов из которой в автоматическом режиме получены изображения страниц документов и аннотации для трех классов сегментации. На основе этих данных обучена нейронная сеть архитектуры EfficientDet D2. Произведено тестирование модели на данных из того же домена, размеченных вручную, которое подтвердило эффективность применения автоматически сгенерированных данных для решения прикладных задач.
Ключевые слова: сегментация документов, сегментация изображений документов, глубокие нейронные сети, обнаружение объектов
Тип публикации: Статья
Образец цитирования: А. А. Михайлов, “Автоматическая разметка данных для сегментации изображений документов с использованием глубоких нейронных сетей”, Труды ИСП РАН, 34:6 (2022), 137–146
Цитирование в формате AMSBIB
\RBibitem{Mik22}
\by А.~А.~Михайлов
\paper Автоматическая разметка данных для сегментации изображений документов с использованием глубоких нейронных сетей
\jour Труды ИСП РАН
\yr 2022
\vol 34
\issue 6
\pages 137--146
\mathnet{http://mi.mathnet.ru/tisp744}
\crossref{https://doi.org/10.15514/ISPRAS-2022-34(6)-10}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp744
  • https://www.mathnet.ru/rus/tisp/v34/i6/p137
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:17
    PDF полного текста:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024