Аннотация:
Даже самые мощные компьютеры не могут работать с астрономически большими массивами
(таблицами) данных. В таких случаях данные необходимо задавать специальным образом, с
помощью каких-то разумных моделей представления. Например, если ранг матрицы порядка
n равен r, то для ее представления достаточно задать r строк и r столбцов, то есть всего 2rn
элементов. Аналогичным образом можно ввести понятие ранга для d-мерного массива и
представлять его с помощью drn элементов. Как выбрать эти элементы?
Фактически это вопрос о том, можно ли, а еслии да, то как получить параметры модели
приближенного представления массива данных через малый набор его элементов. Другими
словами, на каких данных нужно проводить “обучение” модели? Достаточно общий и
простой принцип отбора данных существует! Более того, этот принцип можно
распространить на выбор параметров специальных тензорных разложений (например, для
модели тензорного поезда), которые используются для приближенного представления
многомерных массивов данных [1, 2].
1. Oseledets I., Tyrtyshnikov E., TT-cross approximation for multidimensional arrays,
Linear Algebra and Its Applications, 432, 70–88 (2010).
2. Zheltkov D., Tyrtyshnikov E., Global optimization based on TT-decomposition,
Russian Journal of Numerical Analysis and Mathematical Modelling, 25 (4), 247-261 (2020).