Компьютерная оптика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерная оптика:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерная оптика, 2022, том 46, выпуск 5, страницы 790–800
DOI: https://doi.org/10.18287/2412-6179-CO-1047
(Mi co1072)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

В. А. Лобанова, Ю. А. Иванова

Национальный исследовательский Томский политехнический университет
Аннотация: Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88.
Ключевые слова: детектирование текстовых областей, U-Net, сегментация изображений, изображения реальных сцен
Поступила в редакцию: 13.09.2021
Принята в печать: 22.04.2022
Тип публикации: Статья
Образец цитирования: В. А. Лобанова, Ю. А. Иванова, “Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен”, Компьютерная оптика, 46:5 (2022), 790–800
Цитирование в формате AMSBIB
\RBibitem{LobIva22}
\by В.~А.~Лобанова, Ю.~А.~Иванова
\paper Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен
\jour Компьютерная оптика
\yr 2022
\vol 46
\issue 5
\pages 790--800
\mathnet{http://mi.mathnet.ru/co1072}
\crossref{https://doi.org/10.18287/2412-6179-CO-1047}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/co1072
  • https://www.mathnet.ru/rus/co/v46/i5/p790
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерная оптика
    Статистика просмотров:
    Страница аннотации:14
    PDF полного текста:14
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024