|
МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ
Влияние конечности мантиссы на точность безградиентных методов оптимизации
Д. Д. Востриков, Г. О. Конин, А. В. Лобанов, В. В. Матюхин Московский физико-технический институт (национальный исследовательский университет),
Россия, 141701, Московская обл., г. Долгопрудный, Институтский пер., 9
Аннотация:
Безградиентные методы оптимизации, или методы нулевого порядка, широко применяются в обучении нейронных сетей, обучении с подкреплением, а также в промышленных задачах, где доступны лишь значения функции в точке (работа с неаналитическими функциями). В частности, метод обратного распространения ошибки в PyTorch работает именно по этому принципу. Существует общеизвестный факт, что при компьютерных вычислениях используется эвристика чисел с плавающей точкой, и из-за этого возникает проблема конечности мантиссы.
В этой работе мы, во-первых, сделали обзор наиболее популярных методов аппроксимации градиента: конечная прямая/центральная разность (FFD/FCD), покомпонентная прямая/центральная разность (FWC/CWC), прямая/центральная рандомизация на $l_2$ сфере (FSSG2/CFFG2); во-вторых, мы описали текущие теоретические представления шума, вносимого неточностью вычисления функции в точке: враждебный шум, случайный шум; в-третьих, мы провели серию экспериментов на часто встречающихся классах задач, таких как квадратичная задача, логистическая регрессия, SVM, чтобы попытаться определить, соответствует ли реальная природа машинного шума существующей теории. Оказалось, что в реальности (по крайней мере на тех классах задач, которые были рассмотрены в данной работе) машинный шум оказался чем-то средним между враждебным шумом и случайным, в связи с чем текущая теория о влиянии конечности мантиссы на поиск оптимума в задачах безградиентной оптимизации требует некоторой корректировки.
Ключевые слова:
конечность мантиссы, безградиентные методы оптимизации, аппроксимация градиента, градиентный спуск, квадратичная задача, логистическая регрессия.
Поступила в редакцию: 19.02.2023 Принята в печать: 23.02.2023
Образец цитирования:
Д. Д. Востриков, Г. О. Конин, А. В. Лобанов, В. В. Матюхин, “Влияние конечности мантиссы на точность безградиентных методов оптимизации”, Компьютерные исследования и моделирование, 15:2 (2023), 259–280
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/crm1059 https://www.mathnet.ru/rus/crm/v15/i2/p259
|
Статистика просмотров: |
Страница аннотации: | 70 | PDF полного текста: | 24 | Список литературы: | 19 |
|