|
Real application of CNN interpretation methods: document image classification model errors’ detection and validation
[Реальное применение методов интерпретации свёрточных нейронных сетей: обнаружение и объяснение ошибок классификатора изображений документов]
A. O. Golodkov, O. V. Belyaeva, A. I. Perminov Ivannikov Institute for System Programming of the RAS
Аннотация:
В данной статье рассматривается случай применения методов интерпретации свёрточных нейронных сетей к модели ResNet 18 с целью обнаружения и объяснения её ошибок. Сама модель используется для решения задачи определения ориентации изображений текстовых документов. Изначально с помощью методов интерпретации было выдвинуто предположение о причине низкого качества предсказаний модели на данных, отличных от примеров из обучающего набора. Предполагаемой причиной оказалось наличие артефактов на тренировочных данных, которые были сгенерированы с использованием функции поворота изображений. Далее, с помощью методов Vanilla Gradient, Guided Backpropagation, Integrated Gradients, GradCAM и предложенной метрики удалось точно обосновать выдвинутое предположение. Полученные результаты помогли значительно улучшить точность модели.
Ключевые слова:
интерпретация свёрточных нейронных сетей, классификация изображений документов, определение ориентации документа
Образец цитирования:
A. O. Golodkov, O. V. Belyaeva, A. I. Perminov, “Real application of CNN interpretation methods: document image classification model errors’ detection and validation”, Труды ИСП РАН, 35:2 (2023), 7–18
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp766 https://www.mathnet.ru/rus/tisp/v35/i2/p7
|
Статистика просмотров: |
Страница аннотации: | 28 | PDF полного текста: | 13 |
|