Препринты Института прикладной математики им. М. В. Келдыша РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Препринты ИПМ им. М. В. Келдыша:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Препринты Института прикладной математики им. М. В. Келдыша РАН, 2018, 225, 23 стр.
DOI: https://doi.org/10.20948/prepr-2018-225-e
(Mi ipmp2583)
 

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

The DiamondCandy algorithm for maximum performance vectorized cross-stencil computation
[Алгоритм DiamondCandyV для повышения производительности конечноразностных вычислений c применением векторизации]

A. Yu. Perepelkina, V. D. Levchenko
Список литературы:
Аннотация: На основе поиска оптимальной пространственно-временной декомпозиции 3D1T пространства операций построен новый алгоритм DiamondCandyV для эффективной реализации конечно-разностных вычислений с использованием аппаратной векторизации. Базовый элемент разбиения пространства операций DiamondCandy получен пересечением областей зависимостей и влияния (конусоидов) для схем с шаблоном типа крест. Благодаря этому алгоритм характеризуется высокой вычислительной интенсивностью и локализует обрабатываемые данные на верхних уровнях иерархии памяти современных компьютеров. Ключевой особенностью алгоритма является легко реализуется в программном коде поддержка двух основных средств повышения производительности современных процессоров, а именно аппаратной векторизации (с использованием SIMD расширения AVX) и вычислительных потоков с общей памятью (many-core CPU). Обсуждаются детали программной реализации поддержки параллельности различных уровней на примере численного решения волнового уравнения. Результаты тестирования реализации алгоритма показывают повышение производительности на порядок по сравнению с традиционными алгоритмами с пошаговой синхронизацией. Также, в отличие от традиционного подхода, с увеличением размера обрабатываемых данных производительность не деградирует.
Ключевые слова: конечно-разностные вычисления, LRnLA, волновое уравнение, time skewing, многоядерные процессоры, векторизация.
Тип публикации: Препринт
УДК: 519.688
Язык публикации: английский
Образец цитирования: A. Yu. Perepelkina, V. D. Levchenko, “The DiamondCandy algorithm for maximum performance vectorized cross-stencil computation”, Препринты ИПМ им. М. В. Келдыша, 2018, 225, 23 pp.
Цитирование в формате AMSBIB
\RBibitem{PerLev18}
\by A.~Yu.~Perepelkina, V.~D.~Levchenko
\paper The DiamondCandy algorithm for maximum performance vectorized cross-stencil computation
\jour Препринты ИПМ им.~М.~В.~Келдыша
\yr 2018
\papernumber 225
\totalpages 23
\mathnet{http://mi.mathnet.ru/ipmp2583}
\crossref{https://doi.org/10.20948/prepr-2018-225-e}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ipmp2583
  • https://www.mathnet.ru/rus/ipmp/y2018/p225
  • Эта публикация цитируется в следующих 4 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Препринты Института прикладной математики им. М. В. Келдыша РАН
    Статистика просмотров:
    Страница аннотации:173
    PDF полного текста:122
    Список литературы:16
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024