Компьютерные исследования и моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерные исследования и моделирование, 2022, том 14, выпуск 2, страницы 377–398
DOI: https://doi.org/10.20537/2076-7633-2022-14-2-377-398
(Mi crm974)
 

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

Тензорные методы внутри смешанного оракула для решения задач типа min-min

П. А. Остроуховab

a Московский физико-технический институт, Россия, 141701, Московская область, г. Долгопрудный, Институтский переулок, д. 9
b Институт проблем передачи информации им. А. А. Харкевича Российской академии наук, Россия, 127051, г. Москва, Большой Каретный переулок, д. 19, стр. 1
Список литературы:
Аннотация: В данной статье рассматривается задача типа min-min: минимизация по двум группам переменных. Данная задача в чем-то похожа на седловую (min-max), однако лишена некоторых сложностей, присущих седловым задачам. Такого рода постановки могут возникать, если в задаче выпуклой оптимизации присутствуют переменные разных размерностей или если какие-то группы переменных определены на разных множествах. Подобная структурная особенность проблемы дает возможность разбивать ее на подзадачи, что позволяет решать всю задачу с помощью различных смешанных оракулов. Ранее в качестве возможных методов для решения внутренней или внешней задачи использовались только методы первого порядка или методы типа эллипсоидов. В нашей работе мы рассматриваем данный подход с точки зрения возможности применения алгоритмов высокого порядка (тензорных методов) для решения внутренней подзадачи. Для решения внешней подзадачи мы используем быстрый градиентный метод.
Мы предполагаем, что внешняя подзадача определена на выпуклом компакте, в то время как для внутренней задачи мы отдельно рассматриваем задачу без ограничений и определенную на выпуклом компакте. В связи с тем, что тензорные методы по определению используют производные высокого порядка, время на выполнение одной итерации сильно зависит от размерности решаемой проблемы. Поэтому мы накладываем еще одно условие на внутреннюю подзадачу: ее размерность не должна превышать 1000. Для возможности использования смешанного оракула нам необходимы некоторые дополнительные предположения. Во-первых, нужно, чтобы целевой функционал был выпуклым по совокупности переменных и чтобы его градиент удовлетворял условию Липшица также по совокупности переменных. Во-вторых, нам необходимо, чтобы целевой функционал был сильно выпуклый по внутренней переменной и его градиент по внутренней переменной удовлетворял условию Липшица. Также для применения тензорного метода нам необходимо выполнение условия Липшица $p$-го порядка ($p>1$). Наконец, мы предполагаем сильную выпуклость целевого функционала по внешней переменной, чтобы иметь возможность использовать быстрый градиентный метод для сильно выпуклых функций.
Стоит отметить, что в качестве метода для решения внутренней подзадачи при отсутствии ограничений мы используем супербыстрый тензорный метод. При решении внутренней подзадачи на компакте используется ускоренный проксимальный тензорный метод для задачи с композитом.
В конце статьи мы также сравниваем теоретические оценки сложности полученных алгоритмов с быстрым градиентным методом, который не учитывает структуру задачи и решает ее как обычную задачу выпуклой оптимизации (замечания 1 и 2).
Ключевые слова: тензорные методы, гладкость высокого порядка, сильная выпуклость, смешанный оракул, неточный оракул.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 0714-2020-0005
Исследование выполнено при поддержке Министерства науки и высшего образования Российской Федерации (госзадание), № 075-00337-20-03, номер проекта 0714-2020-0005.
Поступила в редакцию: 11.02.2022
Принята в печать: 13.02.2022
Тип публикации: Статья
УДК: 519.853.62
Образец цитирования: П. А. Остроухов, “Тензорные методы внутри смешанного оракула для решения задач типа min-min”, Компьютерные исследования и моделирование, 14:2 (2022), 377–398
Цитирование в формате AMSBIB
\RBibitem{Ost22}
\by П.~А.~Остроухов
\paper Тензорные методы внутри смешанного оракула для решения задач типа min-min
\jour Компьютерные исследования и моделирование
\yr 2022
\vol 14
\issue 2
\pages 377--398
\mathnet{http://mi.mathnet.ru/crm974}
\crossref{https://doi.org/10.20537/2076-7633-2022-14-2-377-398}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/crm974
  • https://www.mathnet.ru/rus/crm/v14/i2/p377
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерные исследования и моделирование
    Статистика просмотров:
    Страница аннотации:96
    PDF полного текста:32
    Список литературы:18
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024