|
Труды СПИИРАН, 2011, выпуск 16, страницы 110–122
(Mi trspy420)
|
|
|
|
Методы сегментации OCR систем в задачах автоматической обработки архивных документов
С. В. Кулешов, С. В. Смирнов Санкт-Петербургский институт информатики и автоматизации РАН
Аннотация:
Настоящая статья описывает сравнение современных систем оптического распознавания, проводимого с целью определения систем наиболее точно выполняющих сегментацию документов по заранее заданным критериям; определение возможностей систем по выделению различных типов областей. В статье анализируются результаты работы методов сегментации OCR систем, оценивается эффективность процесса сегментации. Основываясь на результатах исследования и сделанных наблюдениях, приводится список рекомендаций по выбору OCR систем и методов для обработки различных типов документов.
Ключевые слова:
системы оптического распознавания, методы сегментации, OCR системы, структурный анализ документа, оптическое распознавание, оцифровка архивных документов.
Поступила в редакцию: 24.01.2011
Образец цитирования:
С. В. Кулешов, С. В. Смирнов, “Методы сегментации OCR систем в задачах автоматической обработки архивных документов”, Тр. СПИИРАН, 16 (2011), 110–122
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy420 https://www.mathnet.ru/rus/trspy/v16/p110
|
|