|
КОМПЬЮТЕРНЫЕ НАУКИ
Уточнение результатов распознавания математических формул с использованием расстояния Левенштейна
А. Ю. Сапаров, А. П. Бельтюков, С. Г. Маслов Удмуртский
государственный университет, 426034, Россия, г. Ижевск, ул. Университетская, 1
Аннотация:
Рассматривается задача распознавания сканированных
математических текстов с повторяющимися формулами
либо формулами с общими фрагментами. Описывается метод сравнения результатов
распознавания, позволяющий выделять идентичные элементы из множества вариантов
распознавания. Метод основывается на вычислении расстояний Левенштейна между
отдельными фрагментами с учетом дополнительных параметров. Предложенный метод отличается от обычного метода
тем, что при наличии неопределенностей в процессе сравнения участвуют все возможные
варианты распознавания, представленные в виде пары символ–вес. В случае
нелинейных формул в сравнении участвуют дополнительные числовые параметры, задающие
расположение отдельных символов на плоскости. Такое сравнение позволит сгруппировать формулы, а полученные данные будут полезны
при принятии решений как человеком, так и программой. Использование данного
метода упростит процесс ручного исправления ошибок,
который будет основываться на динамическом управлении промежуточными результатами
в процессе тесного человеко-машинного взаимодействия.
Ключевые слова:
расстояние Левенштейна, вес замены, вес перемещения, множество вариантов распознавания, формулы с общими фрагментами.
Поступила в редакцию: 12.03.2020
Образец цитирования:
А. Ю. Сапаров, А. П. Бельтюков, С. Г. Маслов, “Уточнение результатов распознавания математических формул с использованием расстояния Левенштейна”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 30:3 (2020), 513–529
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vuu739 https://www.mathnet.ru/rus/vuu/v30/i3/p513
|
|