|
Эта публикация цитируется в 5 научных статьях (всего в 5 статьях)
High performance FDTD code implementation for GPGPU supercomputers
[Высокопроизводительная реализация конечно-разностного метода FDTD для суперкомпьютеров с графическими процессорами]
A. V. Zakirov, V. D. Levchenko, A. Yu. Perepelkina, Yasunari Zempo
Аннотация:
Описана реализация конечно-разностного метода на сдвинутых сетках (FDTD) для решения задач электродинамики, в том числе нанооптики, требующих больших вычислительных ресурсов. Реализация основана на локально-рекурсивном нелокально-асинхронном (LRnLA) алгоритме DiamondTorre, эффективном при расчетах на графических процессорах общего назначения (GPGPU).
Обсуждаются особенности алгоритма DiamondTorre для задач на сдвинутых сетках (на основе ячейки Йи) при реализации на многопроцессорном кластере с гибридной архитектурой. Алгоритмы реализованы с использованием технологий CUDA, OpenMP и MPI в программном комплексе, предназначенном для решения реальных физических задач. Пределы производительности оценены из параметров алгоритма и модели roofline суперкомпьютера TSUBAME2.5. Полученные оценки сравниваются с реальной производительностью программного комплекса как на одном вычислительном устройстве, так и при параллельном масштабировании в слабой и сильной метриках. При этом достигнута производительность до $0.65\cdot10^{12}$ обновлений ячеек в секунду для трëхмерной области с количеством ячеек $0.3\cdot10^{12}$.
Образец цитирования:
A. V. Zakirov, V. D. Levchenko, A. Yu. Perepelkina, Yasunari Zempo, “High performance FDTD code implementation for GPGPU supercomputers”, Препринты ИПМ им. М. В. Келдыша, 2016, 044, 22 pp.
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp2120 https://www.mathnet.ru/rus/ipmp/y2016/p44
|
Статистика просмотров: |
Страница аннотации: | 300 | PDF полного текста: | 257 | Список литературы: | 29 |
|