Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2023, том 35, выпуск 2, страницы 19–34
DOI: https://doi.org/10.15514/ISPRAS-2023-35(2)-2
(Mi tisp767)
 

Генерация изображений рукописного текста на русском языке

А. О. Богатенковаa, О. В. Беляеваb, А. И. Перминовb

a Московский государственный университет имени М. В. Ломоносова
b Институт системного программирования им. В.П. Иванникова РАН
Аннотация: Задача автоматического распознавания рукописного текста является важной составляющей в процессе анализа электронных документов, однако её решение все еще далеко от идеала. Одной из основных причин сложности распознавания рукописного текста на русском языке является недостаточное количество данных, используемых для обучения моделей распознавания. При этом, для русского языка проблема встаёт более остро и усугубляется большим разнообразием сложных почерков. В данной работе исследуется влияние различных методов генерации дополнительных обучающих наборов данных на качество моделей распознавания: метод на основе рукописных шрифтов, метод склейки слов из символов StackMix, метод на основе генеративно-состязательной сети. В рамках данной работы был разработан новый метод создания изображений рукописного текста на русском языке на основе шрифтов. Кроме того, предлагается алгоритм формирования нового кириллического рукописного шрифта на основе имеющихся изображений рукописных символов. Эффективность разработанного метода проверялась с помощью экспериментов, которые проводились на двух общедоступных кириллических наборах данных с помощью двух различных моделей распознавания. Результаты экспериментов показали, что разработанный метод генерации изображений позволил повысить точность распознавания рукописного текста в среднем на 6%, что сравнимо с результатами других, более сложных методов. Исходный код экспериментов, предложенного метода, а также сгенерированные в процессе экспериментов наборы данных выложены в открытый доступ и готовы для скачивания.
Ключевые слова: распознавание рукописного текста, генерация рукописного текста, глубокое обучение, компьютерное зрение
Тип публикации: Статья
Образец цитирования: А. О. Богатенкова, О. В. Беляева, А. И. Перминов, “Генерация изображений рукописного текста на русском языке”, Труды ИСП РАН, 35:2 (2023), 19–34
Цитирование в формате AMSBIB
\RBibitem{BogBelPer23}
\by А.~О.~Богатенкова, О.~В.~Беляева, А.~И.~Перминов
\paper Генерация изображений рукописного текста на русском языке
\jour Труды ИСП РАН
\yr 2023
\vol 35
\issue 2
\pages 19--34
\mathnet{http://mi.mathnet.ru/tisp767}
\crossref{https://doi.org/10.15514/ISPRAS-2023-35(2)-2}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp767
  • https://www.mathnet.ru/rus/tisp/v35/i2/p19
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:39
    PDF полного текста:80
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024