Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, том 514, номер 2, страницы 297–307
DOI: https://doi.org/10.31857/S2686954323601720
(Mi danma474)
 

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Поиск текстовых заимствований в рукописных текстах

А. В. Грабовойab, М. С. Каприеловаabc, А. С. Кильдяковa, И. О. Потяшинa, Т. Б. Сейилa, Е. Л. Финогеевa, Ю. В. Чеховичac

a Компания Антиплагиат, Москва, Россия
b Московский физико-технический институт, Москва, Россия
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
Список литературы:
Аннотация: Поиск заимствований в учебных работах становится в последнее время все более актуальной задачей. Повышение популярности онлайн-образования, активная экспансия онлайн-платформ, ориентированных на среднее образование, формируют потребность в инструменте, способном проверять на заимствования рукописные работы школьников. Существующие подходы к поиску рукописных заимствований не подходят для быстрой проверки значительного количества работ по большими коллекциям потенциальных источников. Это существенно ограничивает их применимость. Кроме того, на практике требуется обрабатывать изображения текстовых страниц посредственного качества, выполненные, как правило, с помощью фотокамер мобильных телефонов. Мы предлагаем метод, который позволяет выявлять заимствованные фрагменты текста в документах, представленных в виде изображений (фотографий) рукописных текстов, при сопоставлении с большими коллекциями источников. Метод включает в себя три этапа: распознавание символов рукописного текста, поиск кандидатов и последующий точный поиск источника заимствований. В работе приведены результаты экспериментов по оценке качества и производительности разработанной системы. Полнота поиска заимствований в рукописных документах достигает 83.3% при обработке изображений высокого качества и 77.4% при обработке изображений худшего качества. Время выполнения поиска для одного документа по коллекции источников из 100 000 документов составляет в среднем 3.2 с при использовании CPU. Результаты показали, что созданная нами система может быть масштабирована и использована для промышленных задач, требующих быстрой проверки сотен тысяч школьных сочинений по большому количеству потенциальных источников заимствований. Все эксперименты проводились на открытом наборе данных HWR200.
Ключевые слова: оптическое распознавание символов, рукописный текст, поиск текстовых заимствований, компьютерное зрение, распознавание рукописного текста.
Финансовая поддержка Номер гранта
Фонд содействия развитию малых форм предприятий в научно-технической сфере 79068
Работа выполнена при поддержке Фонда содействия Инновациям (проект № 79068, заявка № ИИ-208298).
Статья представлена к публикации: А. Л. Семёнов
Поступило: 02.09.2023
После доработки: 15.09.2023
Принято к публикации: 18.10.2023
Англоязычная версия:
Doklady Mathematics, 2023, Volume 108, Issue suppl. 2, Pages S424–S433
DOI: https://doi.org/10.1134/S106456242370120X
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.(89+93)
Образец цитирования: А. В. Грабовой, М. С. Каприелова, А. С. Кильдяков, И. О. Потяшин, Т. Б. Сейил, Е. Л. Финогеев, Ю. В. Чехович, “Поиск текстовых заимствований в рукописных текстах”, Докл. РАН. Матем., информ., проц. упр., 514:2 (2023), 297–307; Dokl. Math., 108:suppl. 2 (2023), S424–S433
Цитирование в формате AMSBIB
\RBibitem{GraKapKil23}
\by А.~В.~Грабовой, М.~С.~Каприелова, А.~С.~Кильдяков, И.~О.~Потяшин, Т.~Б.~Сейил, Е.~Л.~Финогеев, Ю.~В.~Чехович
\paper Поиск текстовых заимствований в рукописных текстах
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2023
\vol 514
\issue 2
\pages 297--307
\mathnet{http://mi.mathnet.ru/danma474}
\crossref{https://doi.org/10.31857/S2686954323601720}
\elib{https://elibrary.ru/item.asp?id=56717840}
\transl
\jour Dokl. Math.
\yr 2023
\vol 108
\issue suppl. 2
\pages S424--S433
\crossref{https://doi.org/10.1134/S106456242370120X}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma474
  • https://www.mathnet.ru/rus/danma/v514/i2/p297
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
    Статистика просмотров:
    Страница аннотации:57
    Список литературы:11
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024