Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Выч. матем. информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика», 2014, том 3, выпуск 3, страницы 20–36 (Mi vyurv46)  

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Информатика, вычислительная техника и управление

Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек

А. А. Бондаренко, М. В. Якобовский

Институт прикладной математики им. М.В. Келдыша РАН (Москва, Российская Федерация)
Список литературы:
Аннотация: Рассматриваются вопросы, связанные с проведением расчетов в распределенных вычислительных системах, компоненты которых подвержены отказам. В работе приводятся: определения системы, сбоя, ошибки, отказа и модели сбоя; наиболее важные результаты исследований отказов в параллельных вычислительных системах, в том числе с большими группами дисков; основные существующие методы восстановления и распространенные программные реализации обеспечения отказоустойчивости. Развивается подход обеспечения отказоустойчивости на уровне пользователя. Данный подход требует непосредственного участия разработчика прикладной программы в реализации метода обеспечения отказоустойчивости, в частности в формировании контрольных точек и процедур восстановления. Предложена схема сохранения в памяти вычислительных узлов данных прикладной программы, формирующих согласованную глобальную контрольную точку. В её рамках осуществляется дублирование локальных контрольных точек, что позволяет восстановить вычислительный процесс, если число отказов не превосходит допустимого для данной схемы уровня. Она может быть использована в различных протоколах восстановления и их модификациях.
Ключевые слова: параллельные вычисления, отказоустойчивость, контрольные точки, MPI.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 13-01-12073 офи_м
Работа выполнена при поддержке Российского фонда фундаментальных исследований по гранту 13-01-12073 офи_м.
Поступила в редакцию: 05.08.2014
Тип публикации: Статья
УДК: 004.052.3
Образец цитирования: А. А. Бондаренко, М. В. Якобовский, “Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 3:3 (2014), 20–36
Цитирование в формате AMSBIB
\RBibitem{BonIak14}
\by А.~А.~Бондаренко, М.~В.~Якобовский
\paper Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек
\jour Вестн. ЮУрГУ. Сер. Выч. матем. информ.
\yr 2014
\vol 3
\issue 3
\pages 20--36
\mathnet{http://mi.mathnet.ru/vyurv46}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyurv46
  • https://www.mathnet.ru/rus/vyurv/v3/i3/p20
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
    Статистика просмотров:
    Страница аннотации:266
    PDF полного текста:91
    Список литературы:34
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024