Математические заметки
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Скоро в журнале
Архив
Импакт-фактор
Правила для авторов
Лицензионный договор
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. заметки:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математические заметки, 2023, том 114, выпуск 6, страницы 945–948
DOI: https://doi.org/10.4213/mzm14132
(Mi mzm14132)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Краткие сообщения

Эффективный алгоритм разложения вектора на два вектора с малой равномерной нормой

Б. С. Кашинab, Д. Г. Ромскийc

a Математический институт им. В. А. Стеклова Российской академии наук, г. Москва
b Московский центр фундаментальной и прикладной математики
c Московский государственный университет им. М. В. Ломоносова
Список литературы:
Ключевые слова: жадный алгоритм, федеративное обучение, поперечник.
Финансовая поддержка Номер гранта
Российский научный фонд 21-11-00131
Фонд развития теоретической физики и математики "БАЗИС"
Исследование по теореме 1 выполнено Б. С. Кашиным за счет гранта Российского научного фонда (проект № 21-11-00131, https://rscf.ru/project/21-11-00131/) в МГУ имени М. В. Ломоносова. Работа по компьютерной реализации и численным экспериментам выполнена Д. Г. Ромским при поддержке Фонда развития теоретической физики и математики.
Поступило: 01.08.2023
Англоязычная версия:
Mathematical Notes, 2023, Volume 114, Issue 6, Pages 1484–1487
DOI: https://doi.org/10.1134/S0001434623110755
Реферативные базы данных:
Тип публикации: Статья

Ниже $\langle \,\cdot\,{,}\,\cdot\,\rangle$ – скалярное произведение в $\mathbb{R}^N$, $N=1,2,\dots$, $\mathrm{O}^N$ – группа ортогональных преобразований $\mathbb{R}^N$ с мерой Хаара $\mu_H$. Пусть также $B_p^N$, $1 \leqslant p \leqslant \infty$, – единичный шар пространства $\ell_p^N$, а $S^{N-1}$ – единичная сфера в $\ell_2^N$.

В работе [1], посвященной в основном оценкам поперечников, были установлены следующие результаты, первый из которых мы приведем в двух двойственных формулировках.

Утверждение A. Существует постоянная $\gamma > 0$ такая, что для всех преобразований $T \in \mathrm{O}^N$, $N=1,2,\dots$, за исключением множества $V \subset \mathrm{O}^N$ меры $\mu_H(V) \leqslant 2^{-N}$ имеет место включение

$$ \begin{equation} \operatorname{conv}\{B_{\infty}^{N}, TB_{\infty}^{N}\} \supset \gamma \sqrt{N}\,B_{2}^{N}. \end{equation} \tag{1} $$

Утверждение A'. При $N=1,2,\dots$ для всех ортогональных преобразований $T \in \mathrm{O}^N$ за исключением множества $V \subset \mathrm{O}^N$, $\mu_H(V) \leqslant 2^{-N}$, имеет место неравенство

$$ \begin{equation} \max\{ \|x\|_{\ell^N_1},\|Tx\|_{\ell^N_1}\} \geqslant c\sqrt{N}\,\|x\|_{\ell^N_2} \qquad \text{для любого}\quad x\in \mathbb{R}^N, \end{equation} \tag{2} $$
где $c > 0$ – абсолютная постоянная.

Утверждение B. Для любого $\varepsilon>0$ существуют постоянная $c_{\varepsilon}>0$ и подпространство $L \subset \mathbb{R}^N$, $N=1,2,\dots$, размерности $n \geqslant N(1-\varepsilon)$ такие, что

$$ \begin{equation} \Pi_L(B_{\infty}^{N}) \supset c_{\varepsilon}\sqrt{N}\,(B_{2}^{N} \cap L), \end{equation} \tag{3} $$
где $\Pi_L$ – оператор ортогонального проектирования на $L$. Более того, при $N \to \infty$ мера тех подпространств, для которых (3) не имеет места, экспоненциально мала.

В работе Любарского и Вершинина [2] было предложено использовать утверждение B в прикладных вопросах обработки сигналов. Точнее, как показано в [2], утверждение B позволяет для произвольного вектора $x\in B_2^n$ и фиксированного случайного жесткого фрейма $\{u_i\}^N_{i=1}$, $u_i\in \mathbb{R}^n$, $i=1,2,\dots$, $N\leqslant (1+\varepsilon)n$, построить разложение

$$ \begin{equation} x=\sum^{N}_{i=1} a_i u_i, \qquad |a_i| \leqslant \frac{c_{\varepsilon}}{\sqrt{N}}\,, \quad i=1,\dots,N. \end{equation} \tag{4} $$

Такое представление затем использовалось рядом авторов, в том числе в задачах оптимальной квантизации сигналов и федеративного обучения (federated learning) (см., например, [3]–[5]). При этом в [2] был предложен эффективный алгоритм представления произвольного вектора в виде (4).

Аналогично, в настоящей заметке построен эффективный алгоритм $A(x,T)$ реализации включения (1) и приведены результаты численного эксперимента по его реализации. Пусть $V_N$ – множество вершин куба $B_{\infty}^{N}$. Указанный алгоритм – жадный алгоритм (см. [6]) в евклидовом пространстве со словарем $W=V_N \cup T^*V_N$, где $T \in \mathrm{O}^N$ – произвольное преобразование, удовлетворяющее соотношению (2), а $T^*$ – обратное к $T$ преобразование.

Пусть задан произвольный вектор $x \in \mathbb{R}^N$. Легко проверить, что максимум скалярного произведения вектора $x$ с элементами из $W$ равен левой части неравенства (2). Поэтому неравенство (2) позволяет оценить сверху расстояние от произвольного вектора $x$ до ближайшей к нему полупрямой $l$ вида $\lambda w$, $\lambda > 0$, где $w$ – элемент словаря:

$$ \begin{equation} \|x-P_{l}(x)\|_2 \leqslant \widetilde{c}\|x\|_2, \end{equation} \tag{5} $$
здесь $P_l$ – оператор ортогонального проектирования на $l$, $\widetilde{c} < 1$ – универсальная постоянная. Применяя описанный шаг алгоритма к $x-P_l(x)$ и так далее, получим представление
$$ \begin{equation} x=\sum_{k=1}^{\infty}\lambda_k w_k, \qquad w_k \in W, \quad 0 \leqslant \lambda_k \leqslant \frac{(\widetilde{c})^{k-1}}{\sqrt{N}}\|x\|_2. \end{equation} \tag{6} $$
Отсюда следует, что жадный алгоритм сходится линейно по логарифмической шкале.

Таким образом, имеет место

Теорема 1. Пусть при $N=2,3,\dots$ матрица $T \in \mathrm{O}^N$ удовлетворяет соотношению (2). Жадный алгоритм, задающий разложение (6), для любого $x \in B^{N}_{2}$ за $k$ шагов, $k=1,2,\dots$, строит векторы $u_k$ и $v_k$ такие, что

$$ \begin{equation} \|x-u_k-v_k\|_2 \leqslant \gamma^k, \qquad \|u_k\|_{\infty} \leqslant \frac{C}{\sqrt{N}}\,, \qquad \|Tv_k\|_{\infty} \leqslant \frac{C}{\sqrt{N}}\,, \end{equation} \tag{7} $$
где $\gamma < 1$ и C – абсолютные постоянные.

Для численных экспериментов ортогональная матрица генерировалось с помощью следующего известного результата (см. [7; теорема 4]):

Теорема 2. Пусть $\boldsymbol{v}_1,\dots,\boldsymbol{v}_N$ – случайные независимые равномерно распределенные векторы на $S^0,\dots,S^{N-1}$ соответственно. Переопределим функцию знака $\operatorname{sgn}$ в нуле, положив $\operatorname{sgn} 0=1$. Определим для данного $\boldsymbol{v}_m \in S^{m-1}$ матрицу отражений $\mathring{H}_m(\boldsymbol{v}_m)$ следующим равенством:

$$ \begin{equation*} \mathring{H}_m(\boldsymbol{v}_m)= -\operatorname{sgn}(x_1)(I-2 \boldsymbol{u}\boldsymbol{u}^{\top}), \qquad \boldsymbol{u}=\frac{\boldsymbol{v}_m+ \operatorname{sgn}(x_1)\boldsymbol{e}_1} {\|\boldsymbol{v}_m+\operatorname{sgn}(x_1)\boldsymbol{e}_1\|_2}\,, \end{equation*} \notag $$
где $x_1$ – первая координата вектора $\boldsymbol{v}$. Пусть $H_m(\boldsymbol{v}_m)$ – блочная матрица размера $N \times N$ вида
$$ \begin{equation*} H_m(\boldsymbol{v}_m)=\begin{pmatrix} I & 0 \\ 0 & \mathring{H}_m \end{pmatrix}. \end{equation*} \notag $$
Тогда произведение
$$ \begin{equation*} O=H_N(\boldsymbol{v}_N)H_{N-1}(\boldsymbol{v}_{N-1})\cdots H_2(\boldsymbol{v}_2) H_1(\boldsymbol{v}_1) \end{equation*} \notag $$
– случайная ортогональная матрица с распределением, заданным мерой Хаара на $\mathrm{O}^N$.

Для численного эксперимента генерировалось 100 случайных ортогональных матриц размерности $N=1024$, и на каждой из них алгоритм был применен для 200 случайных разреженных векторов единичной нормы с мощностью носителя $\operatorname{supp} x=32$ и точностью разложения $\|x-u-v\|_2 \leqslant 10^{-6}$. Были проанализированы следующие величины:

$$ \begin{equation*} \sqrt{N}\,\max(\|u(x)\|_{\infty},\|Tv(x)\|_{\infty}), \qquad \sqrt{N}\,(\|u(x)\|_{\infty}+\|Tv(x)\|_{\infty}), \end{equation*} \notag $$
где $u(x)$, $v(x)$ – векторы, которые получаются в результате работы алгоритма.

Выявлено несколько особенностей: первая величина имеет плотность распределения с тремя различными локальными максимумами в точках 1.61, 1.67 и 1.76, что может свидетельствовать о нетривиальных геометрических свойствах отображения $x \mapsto (u,Tv)$ (см. рис. 1).

Еще одной особенностью является устойчивость второй величины по выбору случайной ортогональной матрицы (см. рис. 2). Среднее значение второй величины, сосчитанной отдельно для каждой матрицы, колебалось около отметки 2.078, а максимальные и минимальные значения отличаются от средних не более чем на 0.1.

Алгоритм был также запущен на матрице Уолша для сравнения эффективности со случайной матрицей. Для этого было сгенерировано 20000 разреженных векторов единичной нормы с мощностью носителя $\operatorname{supp}x=32$. Результаты показали, что среднее значение величины $\sqrt{N}\,\max(\|u(x)\|_{\infty},\|Tv(x)\|_{\infty})$ для матрицы Уолша составило 2.36, а максимальное – 4.03, что гораздо хуже чем аналогичные показатели для случайных матриц. Из этого можно сделать вывод, что выбор матрицы Уолша в качестве входной матрицы для алгоритма, несмотря на вычислительную простоту, негативно влияет на качественные характеристики получаемого разложения.

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

1. Б. С. Кашин, Изв. АН СССР. Сер. матем., 41:2 (1977), 334–351  mathnet  mathscinet  zmath
2. Yu. Lyubarskii, R. Vershynin, IEEE Trans. Inform. Theory, 56:7 (2010), 3491–3501  crossref  mathscinet
3. W. Lim, N. Luong, D. Hoang, IEEE Comm. Surv. Tut., 22:3 (2020), 2031–2063  crossref
4. W. Chen, P. Kairouz, A. Ozgur, IEEE Trans. Inform. Theory, 69:2 (2023), 1261–1281  crossref  mathscinet
5. S. Vargaftik, R. B. Basat, A. Portnoy, G. Mendelson, Y. Ben-Itzhak, M. Mitzenmacher, Adv. Neural Inform. Proc. Sys., 34 (2021)
6. V. N. Temlyakov, Greedy Approximation, Cambridge Monogr. Appl. Comput. Math., 20, Cambridge Univ. Press, Cambridge, 2011  mathscinet
7. F. Mezzadri, Notices Amer. Math. Soc., 54:5 (2007), 592–604  mathscinet

Образец цитирования: Б. С. Кашин, Д. Г. Ромский, “Эффективный алгоритм разложения вектора на два вектора с малой равномерной нормой”, Матем. заметки, 114:6 (2023), 945–948; Math. Notes, 114:6 (2023), 1484–1487
Цитирование в формате AMSBIB
\RBibitem{KasRom23}
\by Б.~С.~Кашин, Д.~Г.~Ромский
\paper Эффективный алгоритм разложения~вектора~на~два~вектора с~малой равномерной нормой
\jour Матем. заметки
\yr 2023
\vol 114
\issue 6
\pages 945--948
\mathnet{http://mi.mathnet.ru/mzm14132}
\crossref{https://doi.org/10.4213/mzm14132}
\transl
\jour Math. Notes
\yr 2023
\vol 114
\issue 6
\pages 1484--1487
\crossref{https://doi.org/10.1134/S0001434623110755}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85187664034}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mzm14132
  • https://doi.org/10.4213/mzm14132
  • https://www.mathnet.ru/rus/mzm/v114/i6/p945
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математические заметки Mathematical Notes
    Статистика просмотров:
    Страница аннотации:291
    PDF полного текста:31
    HTML русской версии:53
    Список литературы:64
    Первая страница:56
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025