Вычислительные методы и программирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Выч. мет. программирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вычислительные методы и программирование, 2019, том 20, выпуск 3, страницы 182–191
DOI: https://doi.org/10.26089/NumMet.v20r317
(Mi vmp958)
 

Всесторонний анализ качества работы больших суперкомпьютерных комплексов

Вад. В. Воеводин

Научно-исследовательский вычислительный центр Московского государственного университета имени М. В. Ломоносова
Аннотация: В настоящее время проблема недостаточной эффективности работы суперкомпьютерных комплексов во многом связана с тем, что администраторы таких систем не всегда могут своевременно обнаруживать и устранять причины снижения эффективности. Это в большей степени касается не выхода из строя оборудования (такие случаи можно отслеживать с помощью систем мониторинга), а неявного снижения эффективности работы определенных компонентов суперкомпьютера при условии, что внешне они продолжают работать корректно. Возникновение подобной ситуации связано с тем, что на данный момент нет достаточно гибких и удобных средств для оперативного и комплексного анализа всех характеристик качества работы вычислительных систем. Существующие решения либо позволяют анализировать только небольшую часть таких характеристик, либо представляют собой не универсальные решения, удовлетворяющие только небольшой набор конкретных нужд администраторов определенной системы. В настоящей статье описывается системный подход к решению этого вопроса, который позволит проводить комплексный анализ различных аспектов работы суперкомпьютеров, связанных в первую очередь с выполнением суперкомпьютерных приложений. Разрабатываемый на основе этого подхода программный инструмент предназначен для сбора в рамках единой модели всех наиболее важных данных о свойствах и качестве выполняющихся на суперкомпьютере задач - данные об эффективности их выполнения, размере и длительности, наличии характерных или аномальных сценариев поведения, использовании прикладных пакетов и библиотек и др. С помощью гибких возможностей по агрегации будет задаваться нужная степень детализации, с какой необходимо предоставлять полученную информацию - по отдельным пользователям, проектам, прикладным пакетам, предметным областям, разделам суперкомпьютера, временным диапазонам и др. Это позволит создавать сотни и тысячи различных представлений для анализа состояния суперкомпьютера, что поможет администраторам выбирать наиболее подходящий для них вариант.
Ключевые слова: суперкомпьютер, параллельные вычисления, суперкомпьютерные приложения, производительность, анализ эффективности, данные мониторинга.
Поступила в редакцию: 25.04.2019
Реферативные базы данных:
УДК: 519.68
Образец цитирования: Вад. В. Воеводин, “Всесторонний анализ качества работы больших суперкомпьютерных комплексов”, Выч. мет. программирование, 20:3 (2019), 182–191
Цитирование в формате AMSBIB
\RBibitem{Voe19}
\by Вад.~В.~Воеводин
\paper Всесторонний анализ качества работы больших суперкомпьютерных комплексов
\jour Выч. мет. программирование
\yr 2019
\vol 20
\issue 3
\pages 182--191
\mathnet{http://mi.mathnet.ru/vmp958}
\crossref{https://doi.org/10.26089/NumMet.v20r317}
\elib{https://elibrary.ru/item.asp?id=39540771}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vmp958
  • https://www.mathnet.ru/rus/vmp/v20/i3/p182
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вычислительные методы и программирование
    Статистика просмотров:
    Страница аннотации:124
    PDF полного текста:81
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024