S. S. Khrapov, S. A. Khoperskov, A. V. Khoperskov, “New features of parallel implementation of $N$-body problems on GPU”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 11:1 (2018), 124

Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование»

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Правила для авторов
	Загрузить рукопись

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование», 2018, том 11, выпуск 1, страницы 124–136
DOI: https://doi.org/10.14529/mmp180111 (Mi vyuru423)

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Программирование

New features of parallel implementation of $N$-body problems on GPU

[Особенности параллельной реализации численных моделей $N$-тел на GPU]

S. S. Khrapov^a, S. A. Khoperskov^b, A. V. Khoperskov^a

^a Volgograd State University, Volgograd, Russian Federation
^b Institute of Astronomy, Russian Academy of Sciences, Moscow, Russian Federation

PDF полного текста (7905 kB) Список цитирования (4)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14529/mmp180111

Аннотация: Рассмотрены особенности параллельной реализации прямого гравитационного моделирования $N$-тел на нескольких GPU с использованием технологии GPU-Direct. Подробно описан параллельный алгоритм решения задачи $N$-тел, основанный на гибридной технологии распараллеливания OpenMP-CUDA с количеством частиц $N\sim 10^5\div 10^7$. Исследована эффективность распараллеливания нашего алгоритма для различных GPU линейки Nvidia Tesla (K20, K40, K80) при моделировании динамики гравитационно-неустойчивого звездного галактического диска. Изучена производительность и точность моделирования при использовании чисел одинарной и двойной точности. Так, например, для процессора Nvidia Tesla K80 время вычислений с двойной точностью оказалась всего лишь в $1,85$ раз больше чем для одинарной точности. Показано, что использовать числа с одинарной точностью при моделировании на GPU сильно несимметричных систем взаимодействующих $N$-тел схемами второго порядка точности по времени некорректно, так как это приводит к значительным количественным и качественным искажениям результата. Так, например, для чисел одинарной точности после $10^4$ шагов по времени полные энергия, импульс и момент импульса системы $N$-тел ($N=2^{20}$) сохранились с точностью менее $2\cdot 10^{-3}$, $4\cdot 10^{-2}$ и $7\cdot 10^{-3}$, соответственно. Для чисел двойной точности эти законы сохранения выполнялись с точностью более $5\cdot 10^{-5}$, $10^{-15}$ и $10^{-13}$, соответственно. Наши оценки показывают, что по шкале производительность–точность использование схем второго порядка точности по времени наряду с числами двойной точности оказывается на $20$–$30\%$ более эффективно, чем схем четвертого порядка с числами одинарной точности.

Ключевые слова: Multi-GPU; OpenMP-CUDA; GPU-Direct; Nvidia Tesla; задача $N$-тел; одинарная и двойная точность численных решений; звездный галактический диск; гравитационная неустойчивость.

Финансовая поддержка	Номер гранта
Министерство образования и науки Российской Федерации	2.852.2017/4.6
Российский фонд фундаментальных исследований	16-07-01037_а 16-02-00649_а 16-32-60043_мол_а_дк
Работа выполнена при финансовой поддержки Министерства образования и науки Российской Федерации (гос. задание № 2.852.2017/4.6) и РФФИ (гранты 16-07-01037, 16-02-00649, 16-32-60043).

Поступила в редакцию: 22.01.2018

Реферативные базы данных:

Тип публикации: Статья

УДК: 502.57

MSC: 34N05, 37M05, 68U20

Язык публикации: английский

Образец цитирования: S. S. Khrapov, S. A. Khoperskov, A. V. Khoperskov, “New features of parallel implementation of $N$-body problems on GPU”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 11:1 (2018), 124–136

Цитирование в формате AMSBIB

\RBibitem{KhrKhoKho18}

\by S.~S.~Khrapov, S.~A.~Khoperskov, A.~V.~Khoperskov

\paper New features of parallel implementation of $N$-body problems on GPU

\jour Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование

\yr 2018

\vol 11

\issue 1

\pages 124--136

\mathnet{http://mi.mathnet.ru/vyuru423}

\crossref{https://doi.org/10.14529/mmp180111}

\elib{https://elibrary.ru/item.asp?id=32711856}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/vyuru423

https://www.mathnet.ru/rus/vyuru/v11/i1/p124

Эта публикация цитируется в следующих 4 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	202
PDF полного текста:	164
Список литературы:	36

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы