|
Реализация функций управления задачами и ресурсами высокопроизводительной вычислительной системы в "СПО Супер-ЭВМ"
А. О. Игнатьев, А. А. Калинин, С. Ю. Мокшин Всероссийский НИИ технической физики им. академика Е. И. Забабахина
Аннотация:
В данной работе приводится общее описание программного обеспечения Slurm-ВНИИТФ, разработки ФГУП РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина, включая его архитектуру и возможности по управлению ресурсами и планированию прохождения задач на высокопроизводительных вычислительных системах, предназначенных для решения задач численного моделирования (ВВС). Проведенные в ходе многолетних работ, связанных с эксплуатацией ВВС, исследования, показывают, что базовых возможностей программного обеспечения Slurm (Simple linux utility for resource management) явно недостаточно для эффективного использования вычислительных ресурсов в крупных вычислительных центрах, поэтому авторами данной публикации предлагается усовершенствованная политика управления задачами и ресурсами, описываются модули расширения (плагины) к Slurm, разработанные в ФГУП РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина и реализующие эту политику.
Ключевые слова:
высокопроизводительная вычислительная система, кластер, подсистема управления задачами и ресурсами, Slurm, Slurm-ВНИИТФ, высокопроизводительные вычисления, моделирование
Образец цитирования:
А. О. Игнатьев, А. А. Калинин, С. Ю. Мокшин, “Реализация функций управления задачами и ресурсами высокопроизводительной вычислительной системы в "СПО Супер-ЭВМ"”, Труды ИСП РАН, 34:2 (2022), 159–178
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp685 https://www.mathnet.ru/rus/tisp/v34/i2/p159
|
Статистика просмотров: |
Страница аннотации: | 19 | PDF полного текста: | 14 |
|