|
Интеллектуальные системы. Теория и приложения, 2023, том 27, выпуск 2, страницы 20–47
(Mi ista507)
|
|
|
|
Часть 1. Общие проблемы теории интеллектуальных систем
Метод чередования обучаемых параметров
А. А. Хусаенов Московский государственный университет имени М. В. Ломоносова, механико-математический факультет
Аннотация:
В работе предлагается метод повышения качества обучения сверточных искусственных нейронных сетей (ИНС) за счет разделения параметров по их возможности расширения рецептивного поля. При обучении ResNet50 достигается увеличение точности за счет чередуемой остановки обучения в 4-х слоях, расширяющих рецептивное поле.
Показано, что повышение обобщающей способности модели при использовании предложенного метода достигается за счет устранения избыточного вклада отдельных существенных (окклюзивных) элементов изображения при формировании карт признаков. В пользу указанных предположений приводятся результаты экс-периментов в задаче transfer learning и рассуждения относительно существования указанной проблемы.
Предлагаемые подходы могут оказаться полезными, в частности, при обучении ИНС на малых данных или дистилляции обучающего множества, где проблемы переобучения на отдельных окклюзивных признаках имеют высокую значимость.
Ключевые слова:
сверточная искусственная нейронная сеть, рецептивное поле нейрона, проблемы переобучения моделей, окклюзия признаков в сверточных искусственных нейронных сетях.
Образец цитирования:
А. А. Хусаенов, “Метод чередования обучаемых параметров”, Интеллектуальные системы. Теория и приложения, 27:2 (2023), 20–47
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ista507 https://www.mathnet.ru/rus/ista/v27/i2/p20
|
|