|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Программное и аппаратное обеспечение для суперЭВМ
Моделирование параллельной работы ядер векторного потокового процессора с общей памятью
Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв Межведомственный суперкомпьютерный центр РАН
Аннотация:
Процессор с архитектурой управления потоком данных может выполнять до 16 команд в такт по сравнению с 4–6 командами в такт у лучших процессоров фон/неймановской архитектуры.
Моделирование векторного потокового процессора показало, что его производительность может быть доведена до 256 флоп в такт на ядро, и при изготовлении на кристалле с современными технологическими нормами можно разместить до 4 таких ядер.
Приводятся результаты моделирования системы из нескольких ядер векторного потокового процессора с общей памятью на программах перемножения матриц и решения систем дифференциальных уравнений 2D Stencil.
Показано, что программа перемножения матриц масштабируется пропорционально числу ядер процессора, в то время как производительность 2D Stencil ограничивается пропускной способностью к общей оперативной памяти
Ключевые слова и фразы:
суперкомпьютер, векторный процессор, архитектура управления потоком данных, оценка производительности, перемножение матриц, 2D Stancil.
Поступила в редакцию: 24.11.2017 Подписана в печать : 01.02.2017
Образец цитирования:
Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв, “Моделирование параллельной работы ядер векторного потокового процессора с общей памятью”, Программные системы: теория и приложения, 9:1 (2018), 37–52
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ps295 https://www.mathnet.ru/rus/ps/v9/i1/p37
|
Статистика просмотров: |
Страница аннотации: | 265 | PDF полного текста: | 88 | Список литературы: | 36 |
|