|
МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ
О связях задач стохастической выпуклой минимизации с задачами минимизации эмпирического риска на шарах в p-нормах
Д. М. Двинскихab, В. В. Пырэуa, А. В. Гасниковabc a Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
b Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва
c Кавказский математический центр, Адыгейский государственный университет, г. Майкоп
Аннотация:
В данной работе рассматриваются задачи выпуклой стохастической оптимизации, возникающие в анализе данных (минимизация функции риска), а также в математической статистике (минимизация функции правдоподобия). Такие задачи могут быть решены как онлайн-, так и офлайн-методами (метод Монте-Карло). При офлайн-подходе исходная задача заменяется эмпирической задачей — задачей минимизации эмпирического риска. В современном машинном обучении ключевым является следующий вопрос: какой размер выборки (количество слагаемых в функционале эмпирического риска) нужно взять, чтобы достаточно точное решение эмпирической задачи было решением исходной задачи с заданной точностью. Базируясь на недавних существенных продвижениях в машинном обучении и оптимизации для решения выпуклых стохастических задач на евклидовых шарах (или всем пространстве), мы рассматриваем случай произвольных шаров в $p$-нормах и исследуем, как влияет выбор параметра $p$ на оценки необходимого числа слагаемых в функции эмпирического риска.
В данной работе рассмотрены как выпуклые задачи оптимизации, так и седловые. Для сильно выпуклых задач были обобщены уже имеющиеся результаты об одинаковых размерах выборки в обоих подходах (онлайн и офлайн) на произвольные нормы. Более того, было показано, что условие сильной выпуклости может быть ослаблено: полученные результаты справедливы для функций, удовлетворяющих условию квадратичного роста. В случае когда данное условие не выполняется, предлагается использовать регуляризацию исходной задачи в произвольной норме. В отличие от выпуклых задач седловые задачи являются намного менее изученными. Для седловых задач размер выборки был получен при условии $\gamma$-роста седловой функции по разным группам переменных. Это условие при $\gamma=1$ есть не что иное, как аналог условия острого минимума в выпуклых задач. В данной статье было показано, что размер выборки в случае острого минимума (седла) почти не зависит от желаемой точности решения исходной задачи.
Ключевые слова:
выпуклая оптимизация, стохастическая оптимизация, регуляризация, острый минимум, условие квадратичного роста, метод Монте-Карло.
Поступила в редакцию: 01.02.2022 Принята в печать: 13.02.2022
Образец цитирования:
Д. М. Двинских, В. В. Пырэу, А. В. Гасников, “О связях задач стохастической выпуклой минимизации с задачами минимизации эмпирического риска на шарах в p-нормах”, Компьютерные исследования и моделирование, 14:2 (2022), 309–319
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/crm969 https://www.mathnet.ru/rus/crm/v14/i2/p309
|
Статистика просмотров: |
Страница аннотации: | 152 | PDF полного текста: | 74 | Список литературы: | 35 |
|