Компьютерные исследования и моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерные исследования и моделирование, 2023, том 15, выпуск 2, страницы 259–280
DOI: https://doi.org/10.20537/2076-7633-2023-15-2-259-280
(Mi crm1059)
 

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

Влияние конечности мантиссы на точность безградиентных методов оптимизации

Д. Д. Востриков, Г. О. Конин, А. В. Лобанов, В. В. Матюхин

Московский физико-технический институт (национальный исследовательский университет), Россия, 141701, Московская обл., г. Долгопрудный, Институтский пер., 9
Список литературы:
Аннотация: Безградиентные методы оптимизации, или методы нулевого порядка, широко применяются в обучении нейронных сетей, обучении с подкреплением, а также в промышленных задачах, где доступны лишь значения функции в точке (работа с неаналитическими функциями). В частности, метод обратного распространения ошибки в PyTorch работает именно по этому принципу. Существует общеизвестный факт, что при компьютерных вычислениях используется эвристика чисел с плавающей точкой, и из-за этого возникает проблема конечности мантиссы.
В этой работе мы, во-первых, сделали обзор наиболее популярных методов аппроксимации градиента: конечная прямая/центральная разность (FFD/FCD), покомпонентная прямая/центральная разность (FWC/CWC), прямая/центральная рандомизация на $l_2$ сфере (FSSG2/CFFG2); во-вторых, мы описали текущие теоретические представления шума, вносимого неточностью вычисления функции в точке: враждебный шум, случайный шум; в-третьих, мы провели серию экспериментов на часто встречающихся классах задач, таких как квадратичная задача, логистическая регрессия, SVM, чтобы попытаться определить, соответствует ли реальная природа машинного шума существующей теории. Оказалось, что в реальности (по крайней мере на тех классах задач, которые были рассмотрены в данной работе) машинный шум оказался чем-то средним между враждебным шумом и случайным, в связи с чем текущая теория о влиянии конечности мантиссы на поиск оптимума в задачах безградиентной оптимизации требует некоторой корректировки.
Ключевые слова: конечность мантиссы, безградиентные методы оптимизации, аппроксимация градиента, градиентный спуск, квадратичная задача, логистическая регрессия.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 0714-2020-0005
Работа выполнена при поддержке Министерства науки и высшего образования Российской Федерации (госзадание), № 075-00337-20-03, номер проекта 0714-2020-0005.
Поступила в редакцию: 19.02.2023
Принята в печать: 23.02.2023
Тип публикации: Статья
УДК: 519.8
Образец цитирования: Д. Д. Востриков, Г. О. Конин, А. В. Лобанов, В. В. Матюхин, “Влияние конечности мантиссы на точность безградиентных методов оптимизации”, Компьютерные исследования и моделирование, 15:2 (2023), 259–280
Цитирование в формате AMSBIB
\RBibitem{VosKonLob23}
\by Д.~Д.~Востриков, Г.~О.~Конин, А.~В.~Лобанов, В.~В.~Матюхин
\paper Влияние конечности мантиссы на точность безградиентных методов оптимизации
\jour Компьютерные исследования и моделирование
\yr 2023
\vol 15
\issue 2
\pages 259--280
\mathnet{http://mi.mathnet.ru/crm1059}
\crossref{https://doi.org/10.20537/2076-7633-2023-15-2-259-280}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/crm1059
  • https://www.mathnet.ru/rus/crm/v15/i2/p259
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерные исследования и моделирование
    Статистика просмотров:
    Страница аннотации:70
    PDF полного текста:24
    Список литературы:19
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024