Семинары: Александр Новиков, Поиск быстрых алгоритмов умножения матриц при помощи обучения с подкреплением

Семинары

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Календарь
	Поиск
	Регистрация семинара

	RSS
	Ближайшие семинары

Коллоквиум Факультета компьютерных наук НИУ ВШЭ
8 ноября 2022 г. 16:20–17:40, г. Москва, Покровский бульвар 11

Поиск быстрых алгоритмов умножения матриц при помощи обучения с подкреплением

Александр Новиков

DeepMind

Количество просмотров:
Эта страница:	153
Youtube:

https://www.youtube.com/watch?v=Wfuk6JszDuA

Аннотация: В данной работе мы применили модифицированную программу AlphaZero для поиска быстрых алгоритмов умножения матриц в символьном виде. Мы фокусируемся на поиске быстрых алгоритмов умножения матриц небольшого размера, например, 2х2, а затем используем найденные алгоритмы рекурсивно. В результате, в работе получилось уменьшить число скалярных умножений, которое требуется для умножения матриц разных размеров. Умножения матриц – это билинейная операция, и (как любую линейную операцию можно представить при помощи матрицы) ее можно представить при помощи трехмерного тензора. Низкоранговые разложения данного тензора соответствуют алгоритмам умножения матриц, а ранг разложения соответствует числу скалярных умножений. Таким образом, задача генерации алгоритмов умножения матриц трансформируется в эквивалентную задачу поиска низкоранговых разложений фиксированного тензора. Мы обучили AlphaZero искать эти разложения, применив такие приемы, как генерация синтетических данных, эксплуатация симметрий задачи, обучение одного агента раскладывать несколько разных тензоров одновременно, и использовать нейросетевую архитектуру, заточенную под особенности задачи.

Website: https://cs.hse.ru/announcements/790750793.html

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы