M. B. Kuzminsky, “New generation of GPGPU and related hardware: computing systems microarchitecture and performance from servers to supercomputers”, Программные системы: теория и приложения, 15:2 (2024), 139–473; Program Systems: Theory and Applications, 15:2 (2024), 139

Программные системы: теория и приложения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Правила для авторов
	Загрузить рукопись

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Программные системы: теория и приложения:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Программные системы: теория и приложения, 2024, том 15, выпуск 2, страницы 139–473
DOI: https://doi.org/10.25209/2079-3316-2024-15-2-139-473 (Mi ps447)

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

New generation of GPGPU and related hardware: computing systems microarchitecture and performance from servers to supercomputers

[Новое поколение GPGPU и сопутствующего оборудования: микроархитектура и производительность вычислительных систем от серверов до суперкомпьютеров]

M. B. Kuzminsky

Zelinsky Institute of Organic Chemistry of RAS, Moscow, Russia

PDF полного текста (17787 kB) PDF английской версии (16629 kB)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.25209/2079-3316-2024-15-2-139-473

Аннотация: Дан обзор современного состояния GPGPU с ориентацией их применения на традиционные задачи HPC (и в меньшей степени ИИ). К базовым GPGPU в обзоре отнесены Nvidia V100 и A100. В качестве GPGPU нового поколения рассмотрены Nvidia H100, AMD MI100 и MI200, Intel Ponte Vecchio (Data Center GPU Max, а также BR100 от Biren Technology. Проанализированы и сопоставлены микроархитектура и аппаратные показатели этих GPGPU, важные для задач HPC и ИИ, а также важнейших дополнительных аппаратных средств для построения вычислительных систем с применением GPGPU — центральных процессоров, специализированных для работы с GPGPU нового поколения, и межсоединений. Дается краткая информация об использующих их серверах, в том числе multi-GPU, и новых применяющих эти GPGPU суперкомпьютерах, где были получены данные о достигаемой производительности при работе с GPGPU.
Кратко рассмотрены SDK фирм-производителей GPGPU и программные средства других фирм, включая математические библиотеки. Приводятся примеры, демонстрирующие важные для достижения максимальной производительности средства широко используемых моделей программирования, способствующие при этом непереносимости программных кодов на другие модели GPGPU.
Особое внимание обращено на возможности применения тензорных ядер и их аналогов в современных GPGPU разных фирм. Это относится и к расчетам с пониженной (относительно стандартного для HPC формата FP64) и смешанной точностью, актуальным вследствие резкого роста достигаемой производительности при их использовании в тензорных ядрах GPGPU. Анализируются данные о достигаемой ими реальной производительности в тестах и приложениях для HPC и ИИ. Вкратце рассматривается и применение в GPGPU современных библиотек пакетной линейной алгебры, в том числе для HPC-приложений.

Ключевые слова и фразы: GPGPU, V100, A100, H100, Grace, GH200 Grace Hopper, MI100, MI200, Ponte Vecchio, Data Center GPU Max, BR100, CUDA, HIP, DPC++, Fortran, производительность, HPC, ИИ, глубокое обучение.

Поступила в редакцию: 16.10.2023
Подписана в печать : 01.03.2024

Англоязычная версия:
Program Systems: Theory and Applications, 2024, Volume 15, Issue 2, Pages 139–473
DOI: https://doi.org/10.25209/2079-3316-2024-15-2-139-473

Тип публикации: Статья

УДК: 004.272+004.382.2+004.8+004.43

ББК: 32.971.32-04

MSC: Primary 65Y05; Secondary 68M20

Язык публикации: русский и английский

Образец цитирования: M. B. Kuzminsky, “New generation of GPGPU and related hardware: computing systems microarchitecture and performance from servers to supercomputers”, Программные системы: теория и приложения, 15:2 (2024), 139–473; Program Systems: Theory and Applications, 15:2 (2024), 139–473

Цитирование в формате AMSBIB

\RBibitem{Kuz24}

\by M.~B.~Kuzminsky

\paper New generation of GPGPU and related hardware: computing systems microarchitecture and performance from servers to supercomputers

\jour Программные системы: теория и приложения

\yr 2024

\vol 15

\issue 2

\pages 139--473

\mathnet{http://mi.mathnet.ru/ps447}

\crossref{https://doi.org/10.25209/2079-3316-2024-15-2-139-473}

\transl

\jour Program Systems: Theory and Applications

\yr 2024

\vol 15

\issue 2

\pages 139--473

\crossref{https://doi.org/10.25209/2079-3316-2024-15-2-139-473}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ps447

https://www.mathnet.ru/rus/ps/v15/i2/p139

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Программные системы: теория и приложения

Статистика просмотров:
Страница аннотации:	190
PDF русской версии:	115
PDF английской версии:	41
Список литературы:	37

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы