Программные системы: теория и приложения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Программные системы: теория и приложения:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Программные системы: теория и приложения, 2021, том 12, выпуск 2, страницы 73–103
DOI: https://doi.org/10.25209/2079-3316-2021-12-2-73-103
(Mi ps383)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Мониторинг приложений на кластере ZHORES в Сколтехе

И. Е. Захаров, О. А. Панарин, С. Г. Рыкованов, Р. Р. Загидуллин, А. К. Малютин, Ю. Н. Шкандыбин, А. Е. Ермекова

Сколковский институт науки и технологий
Список литературы:
Аннотация: Стандартные инструменты мониторинга для кластерных вычислительных систем позволяют оценить работу системы в целом, но не позволяют анализировать работу приложений по отдельности. Система мониторинга для измерения ресурсов, затребованных каждым приложением в отдельности разработана в Сколтехе для высокопроизводительного кластера ZHORES. Система мониторинга собирает как обычные метрики загрузки процессоров и графических ускорителей, так и счетчики событий ЦПУ/ГПУ, которые позволяют более детально анализировать тип ресурса, затребованный приложением. Сервисные программы, развернутые на каждом узле кластера, посылают результаты измерений в единую базу данных временных рядов с шагом в одну секунду. Эти данные затем анализируются статистическими методами в режиме оффлайн для выделения характеристик, связанных с использованием вычислительных ресурсов каждым приложением. Мониторинг позволяет выявлять неэффективное программное обеспечение, производить тонкую настройку работы кластера, а также улучшать работу высокопроизводительной системы в целом.
Ключевые слова и фразы: кластер, высокопроизводительные вычисления, мониторинг приложений, счетчики событий ЦПУ/ГПУ, база данных временных рядов.
Поступила в редакцию: 26.01.2021
29.03.2021
Подписана в печать : 05.06.2021
Тип публикации: Статья
УДК: 004.451
ББК: 32.972.11
MSC: Primary 65Y05; Secondary 68M20, 68M99
Образец цитирования: И. Е. Захаров, О. А. Панарин, С. Г. Рыкованов, Р. Р. Загидуллин, А. К. Малютин, Ю. Н. Шкандыбин, А. Е. Ермекова, “Мониторинг приложений на кластере ZHORES в Сколтехе”, Программные системы: теория и приложения, 12:2 (2021), 73–103
Цитирование в формате AMSBIB
\RBibitem{ZakPanRyk21}
\by И.~Е.~Захаров, О.~А.~Панарин, С.~Г.~Рыкованов, Р.~Р.~Загидуллин, А.~К.~Малютин, Ю.~Н.~Шкандыбин, А.~Е.~Ермекова
\paper Мониторинг приложений на кластере ZHORES в Сколтехе
\jour Программные системы: теория и приложения
\yr 2021
\vol 12
\issue 2
\pages 73--103
\mathnet{http://mi.mathnet.ru/ps383}
\crossref{https://doi.org/10.25209/2079-3316-2021-12-2-73-103}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ps383
  • https://www.mathnet.ru/rus/ps/v12/i2/p73
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Программные системы: теория и приложения
    Статистика просмотров:
    Страница аннотации:130
    PDF полного текста:73
    Список литературы:31
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024