|
Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование», 2010, выпуск 6, страницы 91–103
(Mi vyuru231)
|
|
|
|
О восстановлении программ из контрольных точек
А. Ю. Поляков Институт физики полупроводников им. А. В. Ржанова СО РАН
Аннотация:
В работе описаны два подхода к проблеме восстановления распределенных программ из контрольных точек. Предложен алгоритм восстановления взаимосвязей типа «родитель-потомок» и алгоритм принадлежности к группам и сеансам для набора процессов в рамках элементарной машины распределенной вычислительной системы. Предложен алгоритм координированного восстановления набора связанных процессов, перезапускаемых раздельно (на различных элементарных машинах или терминалах). Описанные подходы реализованы в системе создания контрольных точек DMTCP (Distributed MultiThreaded CheckPointing).
Ключевые слова:
распределенные вычислительные системы, контрольные точки восстановления, отказоустойчивость.
Поступила в редакцию: 16.04.2010
Образец цитирования:
А. Ю. Поляков, “О восстановлении программ из контрольных точек”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2010, № 6, 91–103
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vyuru231 https://www.mathnet.ru/rus/vyuru/y2010/i6/p91
|
|