|
Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)
Программирование
New features of parallel implementation of $N$-body problems on GPU
[Особенности параллельной реализации численных моделей $N$-тел на GPU]
S. S. Khrapova, S. A. Khoperskovb, A. V. Khoperskova a Volgograd State University, Volgograd, Russian Federation
b Institute of Astronomy, Russian Academy of Sciences, Moscow, Russian Federation
Аннотация:
Рассмотрены особенности параллельной реализации прямого гравитационного моделирования $N$-тел на нескольких GPU с использованием технологии GPU-Direct.
Подробно описан параллельный алгоритм решения задачи $N$-тел, основанный на гибридной технологии распараллеливания OpenMP-CUDA с количеством частиц $N\sim 10^5\div 10^7$.
Исследована эффективность распараллеливания нашего алгоритма для различных GPU линейки Nvidia Tesla (K20, K40, K80) при моделировании динамики гравитационно-неустойчивого звездного галактического диска.
Изучена производительность и точность моделирования при использовании чисел одинарной и двойной точности. Так, например, для процессора Nvidia Tesla K80 время вычислений с двойной точностью оказалась всего лишь в $1,85$ раз больше чем для одинарной точности. Показано, что использовать числа с одинарной точностью при моделировании на GPU сильно несимметричных систем взаимодействующих $N$-тел схемами второго порядка точности по времени некорректно, так как это приводит к значительным количественным и качественным искажениям результата.
Так, например, для чисел одинарной точности после $10^4$ шагов по времени полные энергия, импульс и момент импульса системы $N$-тел ($N=2^{20}$) сохранились с точностью менее $2\cdot 10^{-3}$, $4\cdot 10^{-2}$ и $7\cdot 10^{-3}$, соответственно.
Для чисел двойной точности эти законы сохранения выполнялись с точностью более $5\cdot 10^{-5}$, $10^{-15}$ и $10^{-13}$, соответственно. Наши оценки показывают, что по шкале производительность–точность использование схем второго порядка точности по времени наряду с числами двойной точности оказывается на $20$–$30\%$ более эффективно, чем схем четвертого порядка с числами одинарной точности.
Ключевые слова:
Multi-GPU; OpenMP-CUDA; GPU-Direct; Nvidia Tesla; задача $N$-тел; одинарная и двойная точность численных решений; звездный галактический диск; гравитационная неустойчивость.
Поступила в редакцию: 22.01.2018
Образец цитирования:
S. S. Khrapov, S. A. Khoperskov, A. V. Khoperskov, “New features of parallel implementation of $N$-body problems on GPU”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 11:1 (2018), 124–136
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vyuru423 https://www.mathnet.ru/rus/vyuru/v11/i1/p124
|
Статистика просмотров: |
Страница аннотации: | 202 | PDF полного текста: | 164 | Список литературы: | 36 |
|