JP3258228B2

JP3258228B2 - チェックポイント生成方法

Info

Publication number: JP3258228B2
Application number: JP05918896A
Authority: JP
Inventors: 敏雄白木原; 達徳金井; 俊樹岐津
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-03-15
Filing date: 1996-03-15
Publication date: 2002-02-18
Anticipated expiration: 2016-03-15
Also published as: JPH09251404A; US5923832A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、分散処理環境下
において相互にプロセス間通信を行いながら動作する複
数のプロセスのチェックポイントを生成するチェックポ
イント生成方法に関し、特に障害発生時にロールバック
するプロセス数を削減するための改良がなされたチェッ
クポイント生成方法に関する。

【０００２】

【従来の技術】従来から、計算機上のプログラム実行の
信頼性を高める方法の一つとして、プロセスのチェック
ポイントを定期的に設け、障害発生時には、設定したチ
ェックポイント時点での状態（チェックポイント状態）
から再実行するという方法が知られている。チェックポ
イント状態とはプログラム実行中のプロセス状態であ
り、チェックポイントからの再実行を可能にするための
情報を保存したものである。

【０００３】障害発生時に再実行を開始する時点をチェ
ックポイントと呼び、そのチェックポイントでチェック
ポイント状態を保存することをチェックポイント生成と
呼ぶ。

【０００４】単独で動作するプログラムはそのプロセス
の途中状態のみのチェックポイント生成を行なえばよい
が、複数のプログラムがプロセス間通信を行ないながら
動作する環境下では、単一のプロセスのチェックポイン
ト生成のみでは不十分である。すなわち、プロセス間通
信によって関係ができた複数のプロセスについて、矛盾
なく再実行できるように、それらのチェックポイント生
成を行なう必要がある。以降では、各プロセス毎に生成
されるものを単にチェックポイント、関係のあるプロセ
スそれぞれのチェックポイントの集合を分散チェックポ
イントと呼ぶ。また、障害発生によりロールバックする
プロセスを故障プロセス、それ以外のプロセスを無故障
プロセスと表す。

【０００５】分散環境でのプロセス間のプロセス間通信
の手段としては、メッセージ送受信、共有メモリ、ファ
イル共有等によるデータ交換がある。メッセージ送受信
はメッセージの送信側と受信側で同期してデータ交換を
行なう手段である。共有メモリは複数のプロセス間で共
有されるメモリで、各プロセスから直接読み書きを行な
うことができ、書き込みの結果は他のプロセスからも見
ることができる。また、複数のプロセス間でファイルを
共有し、ファイル上で情報交換することができる。

【０００６】メッセージ送受信は同期的なプロセス間通
信であるのに対して、共有メモリやファイル共有等は非
同期的なプロセス間通信である。このようなプロセス間
通信を行なって相互に影響を及ぼしたプロセスの集合
（チェックポイントグループ）に対して分散チェックポ
イント生成を行なう必要がある。

【０００７】メッセージ送受信によるプロセス間通信を
行なうプロセスの分散チェックポイント生成例を図１２
に示す。図１２には、３つのプロセスｐ１、ｐ２、ｐ３
がそれぞれメッセージ送受信を行ないながら処理を進め
ている場合の３種類の分散チェックポイントＣＨ1 、Ｃ
Ｈ2 、ＣＨ3 が示されている。また、図１２において、
記号ｍはメッセージを示し、その記号ｍに付けられた２
つの添字はそれぞれメッセージ送信側プロセスの番号お
よびメッセージ受信側プロセスの番号を示している。

【０００８】図１２（ａ）において、ＣＨ1 では、プロ
セスｐ１、ｐ２、ｐ３はそれぞれｃｈ１１、ｃｈ１２、
ｃｈ１３のチェックポイント生成を行なうが、メッセー
ジｍ３２について注目すると、ｃｈ１３ではプロセスｐ
３はまだメッセージを送っていない状態であるにも関わ
らず、ｃｈ１２ではプロセスｐ２はメッセージをすでに
受けた状態にある。そのため、どれかのプロセスに障害
が発生して分散チェックポイントＣＨ1 までロールバッ
クして、再実行を行なう場合、ｍ３２に関して矛盾した
状態になる。図１２（ｃ）のＣＨ3 に関しても、同様に
メッセージｍ２３に関して矛盾した状態になる。

【０００９】これらに対して、図１２（ｂ）のＣＨ2 は
各メッセージに関して矛盾した状態がなく、ロールバッ
ク、再実行時にも正常にメッセージ送受信が行なわれ
る。従来の分散チェックポイント生成を行なう方式は以
下の２種類に大別できる。

【００１０】１）同期型チェックポイント生成２）非同期型チェックポイント生成それぞれの処理の様子を図１３（ａ）、（ｂ）に示す。
図１３（ａ）、（ｂ）は３つのプロセスＡ、Ｂ、Ｃがそ
れぞれメッセージ送受信を行ないながら処理を進めてい
る場合の同期型および非同期型チェックポイント生成の
様子をそれぞれ示したものである。

【００１１】同期型チェックポイント生成方式ではチェ
ックポイントグループに属するプロセス間で同期をとっ
てチェックポイント生成を行なう。すなわち、プロセス
間で同期をとってプロセス間通信に関して矛盾のない状
態にし、図１３（ａ）のＣＨ1 のようなチェックポイン
トを生成する。“Ｋ．Ｍ．ＣｈａｎｄｙａｎｄＬ．
Ｌａｍｐｏｒｔ：ＤｉｓｔｒｉｂｕｔｅｄＳｎａｐｓ
ｈｏｔｓ：ＤｅｔｅｒｍｉｎｉｎｇＧｌｏｂａｌＳ
ｔａｔｅｓｏｆＤｉｓｔｒｉｂｕｔｅｄＳｙｓｔｅ
ｍｓ，ＡＣＭＴｒａｎｓ．ＣｏｍｐｕｔｅｒＳｙｓ
ｔ．，Ｖｏｌ．３，Ｎｏ．１，ｐｐ．６３−７５，Ｆｅ
ｂ１９８５”に開示されている方式では、分散チェッ
クポイント生成時にマーカと呼ばれるメッセージを送り
合うことで矛盾を引き起こすメッセージを検出し、それ
らを保存することで全体で一貫性のある状態をつくり、
チェックポイント生成を行なう。

【００１２】また、“Ｊ．Ｓ．Ｐｌａｎｋ，Ｋ．Ｌｉ：
ｉｃｋｐ：ＡＣｏｎｓｉｓｔｅｎｔＣｈｅｃｋｐｏ
ｉｎｔｅｒｆｏｒＭｕｌｔｉｃｏｍｐｕｔｅｒｓ，
ＩＥＥＥＰａｒａｌｌｅｌＤｉｓｔｒｉｂ．Ｔｅｃ
ｈｎｏｌ．，Ｓｙｓｔ．Ａｐｐｌ．，Ｖｏｌ．２，Ｎ
ｏ．２，ｐｐ．６２−６７，Ｓｕｍｍｅｒ１９９４”
では、Ｃｈａｎｄｙらが提案している方式の他に二相コ
ミットプロトコルにより同期をとってローカルチェック
ポイントを生成する方法を提案している。この方法で
は、一相目で関係しているプロセス全てを停止し、メッ
セージに関する状態がない状態にし、すべてのプロセス
のチェックポイント生成後、二相目ですべてのプロセス
の処理を再開させる。

【００１３】同期型チェックポイントでは、障害発生時
にすべてのプロセスがチェックポイントからリスタート
する。図１４は１つのサーバプロセスＳに対して複数の
クライアントプロセスＣ１、Ｃ２がメッセージ送受信に
より処理要求を出すクライアント・サーバ型の処理の様
子を示したものである。各プロセスは同期型チェックポ
イントＣＰ１を生成後、再びメッセージ通信を行ない処
理を継続する。このような場合に、Ｆ１時点でクライア
ントＣ１に障害が発生してＣＰ１までロールバックする
場合、サーバＳはクライアントＣ１との間に通信があっ
たためロールバックする。さらにサーバＳと通信を行な
ったＣ２もＣＰ１までロールバックしなければならな
い。通常、クライアント・サーバモデルのシステムで動
作する複数のクライアントプロセスは互いに異なるユー
ザにより使用されていることが多く、ある一人のユーザ
のクライアントの障害が他のユーザのクライアントにま
で影響を与えてしまう。

【００１４】非同期型チェックポイント生成方式では図
１３（ｂ）に示すように、各プロセスの任意の時点でチ
ェックポイント生成を行なう。非同期型チェックポイン
ト生成方式を実現する方法の１つが、“Ｒ．Ｅ．Ｓｔｒ
ｏｍａｎｓＳ．Ｙｅｍｉｎｉ：Ｏｐｔｉｍｉｓｔｉ
ｃＲｅｃｏｖｅｒｙｉｎＤｉｓｔｒｉｂｕｔｅｄ
Ｓｙｓｔｅｍｓ，ＡＣＭＴｒａｎｓ．Ｃｏｍｐｕｔ
ｅｒＳｙｓｔ．，Ｖｏｌ．３，Ｎｏ．３，ｐｐ．２０
４−２２８，１９８５”に開示されている。図１３
（ｂ）において、プロセスＢに×印で示される時点で障
害が発生した場合、プロセスＢはＣＨb までロールバッ
クする。プロセスＢではメッセージｍ５、ｍ６が再現さ
れる必要があるため、プロセスＡ、Ｃもそれぞれ、ＣＨ
a 、ＣＨc までロールバックする。するとプロセスＣは
ｍ４が再現される必要があるため、プロセスＢはさらに
ＣＨb 以前のチェックポイントまでロールバックする必
要がある。このように各プロセスが連鎖的にロールバッ
クする状態をカスケードロールバックと呼ぶ。

【００１５】非同期型チェックポイント生成方式では、
このカスケードロールバックを防ぐために各プロセス毎
に受信したメッセージを保存するメッセージロギングと
呼ばれる方法をとる。すなわち、図１３（ｂ）におい
て、□で示したものは保存が完了した受信メッセージで
あり、△で示したものが、まだ保存していないメッセー
ジである。図１３（ｂ）において×印で示される時点で
プロセスＢに障害が発生した場合、プロセスＢはＣＨb
からリスタートし、メッセージｍ５は保存されているた
め、メッセージｍ６を受信する前の状態まで再実行でき
るが、メッセージｍ６の内容は失われているため、プロ
セスＣもＣＨc から再実行され、保存したｍ４を元に受
信を再実行し、ｍ６を送信する。プロセスＡに関しては
ロールバックすることなく実行を継続する。ここで、各
プロセスはリスタート後の受信処理を保存したメッセー
ジを元に行なうため、各プロセスの動作が決定的（なん
ど同じ処理を行なっても再現される）でなければならな
い。なぜなら、プロセスの動作が非決定的な場合、保存
している受信メッセージとは異なるメッセージが送信側
プロセスで生成される可能性があるためである。

【００１６】同期型チェックポイント生成と非同期型チ
ェックポイント生成の両者を比較した利点／欠点を以下
に挙げる。＜＜同期型チェックポイント生成＞＞・リスタートポイントが容易に確定できる（○）・各プロセスの動作が非決定的でもよい（○）・メッセージ保存処理が不要（○）・障害発生時にはチェックポイントグループすべてがロ
ールバック（×）＜＜非同期型チェックポイント生成＞＞・無故障プロセスはロールバック不要な場合がある
（○）・メッセージ保存処理が必要（×）・各プロセスの動作は決定的でなければならない（×）

【００１７】

【発明が解決しようとする課題】上述したように、相互
にプロセス間通信を行なう複数のプロセスの分散チェッ
クポイントを生成する場合、同期型チェックポイント生
成では、リスタートポイントを容易に確定できるもの
の、故障プロセスか無故障プロセスかに限らず、チェッ
クポイントグループ全体でロールバックしなければなら
ないという問題点があった。また、非同期型チェックポ
イント生成では、受信メッセージを保存しなければなら
ないという問題点や各プロセスの処理が決定的でなけれ
ばならないという問題点があった。

【００１８】本発明はこのような点に鑑みてなされたも
のであり、同期型チェックポイントを利用しつつ、且つ
その欠点を補えるようにし、リスタートポイントが容易
に確定でき、各プロセスの動作が非決定的でも良く、受
信メッセージ保存処理を必要とせず、且つ無故障プロセ
スのロールバックを削減することが可能なチェックポイ
ント生成方法を提供することを目的とする。

【００１９】

【課題を解決するための手段】本発明は、プロセス間通
信を行なう複数のプロセスのチェックポイントを生成す
るチェックポイント生成方法において、前記各プロセス
のプロセス間通信を監視し、分散チェックポイント生成
の対象となるプロセス間で同期して第１のチェックポイ
ントを生成し、前記各プロセス毎のタイミングでプロセ
ス毎にローカルな第２のチェックポイントを生成し、障
害発生時に、少なくともその障害が発生した故障プロセ
スに関するプロセス間通信の監視結果に応じて、前記第
１および／または第２のチェックポイントの有効性を調
べることを特徴とする。

【００２０】このチェックポイント生成方法において
は、同期型チェックポイントを利用した分散チェックポ
イントとプロセス毎のローカルなチェックポイントとの
２種類のチェックポイント生成とが組み合わせられて利
用されており、各プロセスについて、第１および第２の
互いに異なるチェックポイントが生成される。

【００２１】障害が発生したときには、少なくとも故障
プロセスに関するプロセス間通信の監視結果が調べら
れ、プロセス間通信の有無などに応じて第１または第２
のチェックポイントの有効性が調べられる。

【００２２】ここで、チェックポイントが有効であると
は、そのプロセスがそのチェックポイントまでロールバ
ックすれば、プロセス間通信に関して全体が矛盾無くリ
スタート可能なチェックポイントであることを意味す
る。また、ここで、「そのプロセス」は１つである場合
も複数である場合もある。

【００２３】したがって、例えば、故障プロセスの最も
最近のチェックポイント生成以降にその故障プロセスが
一切のプロセス間通信を行っていなければ、そのチェッ
クポイントが有効であると判断できる。この場合、故障
プロセスだけをその最も最近のチェックポイントにロー
ルバックするだけで済み、他の無故障プロセスをロール
バックする必要はない。

【００２４】一方、プロセス間通信が行われていれば、
その最も最近のチェックポイントは無効と判断される。
この場合には、第１チェックポイントを全てのプロセス
のリスタートポイントとして利用することにより、カス
ケードロールバックなどの事態を招くことなく全てのプ
ロセスを矛盾無くリスタートさせることができる。

【００２５】また、この発明のチェックポイント生成方
法では、前記各プロセスのプロセス間通信の監視結果に
基づいて前記各プロセス毎にプロセス間通信の履歴の管
理と、前記分散チェックポイント生成の対象となるプロ
セスそれぞれについての前記第１および第２のチェック
ポイント生成の履歴の管理とを行うことが好ましい。

【００２６】この場合には、前記分散チェックポイント
生成の対象となるプロセスそれぞれのプロセス間通信お
よびチェックポイント生成の履歴に応じて、前記プロセ
スそれぞれについてロールバックすべき最適なチェック
ポイントを決定することができるので、故障プロセスの
最も最近のチェックポイントが無効であっても、全ての
プロセスを必ずしも第１チェックポイントにロールバッ
クする必要が無くなり、ロールバックするプロセスを最
小にし、且つロールバックする範囲を小さくすることが
可能となる。例えば、故障プロセスが最も最近のチェッ
クポイント生成以降に行ったプロセス間通信の影響が及
ぶ範囲の各プロセスにつき、有効性を有する第１または
第２のチェックポイントまでロールバックする。

【００２７】なお、最大でも、最も最近の第１チェック
ポイントまでロールバックすれば、全てのプロセスを矛
盾無く実行させることができるので、第１チェックポイ
ントの履歴については最も最近の第１チェックポイント
だけ管理すればよい。したがって、履歴の管理が必要な
チェックポイントは、最も最近の第１チェックポイント
と、それ以降に生成された第２チェックポイントでよ
い。

【００２８】

【発明の実施の形態】以下、図面を参照して、この発明
の実施形態を説明する。図１には、この発明の第１の実
施形態に係る分散チェックポイント生成方法を適用した
分散システムの機能構成が示されている。この分散シス
テムは複数の計算機から構成されており、それら計算機
は互いに協調しながら動作する。それら複数の計算機
上、またはその中の任意の１以上の計算機上では互いに
関係をもった複数のプロセスＰ１〜Ｐｎが実行される。
これらプロセスＰ１〜Ｐｎそれぞれの分散チェックポイ
ント生成タイミングの指定、および障害発生時における
リスタート時点の決定は、プロセス管理部Ｍによって行
われる。

【００２９】このプロセス管理部Ｍは、例えばこの分散
システムのオペレーティングシステム、またはオペレー
ティングシステムとは独立した専用のプロセスとして実
現されるものであり、プロセスＰ１〜Ｐｎ間のチェック
ポイントグループに関する関係を管理し、障害時にどの
プロセスがどのチェックポイントからリスタートするか
を決定するチェックポイント管理部１０１と、チェック
ポイントグループに対して、同期したチェックポイント
生成を指示するグローバルチェックポイント指示部１０
２を備えている。

【００３０】プロセスＰ１〜Ｐｎは、互いにプロセス間
通信を行いながら動作する。これら各プロセスは、チェ
ックポイント生成制御のための機能として、グローバル
チェックポイント生成部２０１、ローカルチェックポイ
ント生成部２０２、および通信監視部２０３を備えてい
る。

【００３１】これらグローバルチェックポイント生成部
２０１、ローカルチェックポイント生成部２０２、およ
び通信監視部２０３がプログラムにリンクするライブラ
リとして実現されている。

【００３２】グローバルチェックポイント生成部２０１
は、グローバルチェックポイント指示部１０２からの同
期型チェックポイント生成指示に応答して、プロセス間
通信に関して矛盾のない同期型チェックポイント（以
下、グローバルチェックポイントと称する）を生成す
る。また、ローカルチェックポイント生成部２０２は、
同期型チェックポイントの生成タイミングとは無関係
に、その対応するプロセス固有のタイミングでメッセー
ジロギングを伴わないチェックポイント（以下、ローカ
ルチェックポイントと称する）を生成する。ローカルチ
ェックポイントは、グローバルチェックポイント生成の
間の任意の時点で少なくとも１つのローカルチェックポ
イントが生成されるように、グローバルチェックポイン
ト生成の間隔よりも短い間隔で生成される。また、グロ
ーバルチェックポイントの間隔とは無関係に、プロセス
間通信などのイベント発生状況を生成条件としてローカ
ルチェックポイントを生成してもよい。

【００３３】通信監視部２０３は、対応するプロセスと
他のプロセスとの間のプロセス間通信を監視し、プロセ
ス間通信の発生をチェックポイント管理部１０１に通知
する。

【００３４】チェックポイント管理部１０１はどのプロ
セスが同一のチェックポイントグループに属するかを管
理し、グローバルチェックポイント指示部１０２は、チ
ェックポイント管理部１０１のチェックポイントグルー
プ情報を元に、任意の間隔で同期型チェックポイントの
生成指示を繰り返し出す。各プロセスＰ１〜Ｐｎでは、
グローバルチェックポイント指示部１０１からの指示に
より、グローバルチェックポイント生成部２０１でグロ
ーバルチェックポイントが生成され、またローカルチェ
ックポイント生成部２０２によりグローバルチェックポ
イント生成の間の任意の時点でローカルチェックポイン
トの生成が行われる。

【００３５】これら２種類のチェックポイント生成部２
０１，２０２は、チェックポイント生成後、その旨をチ
ェックポイント管理部１０１および通信監視部２０３に
通知する。通信監視部２０３は、対応するプロセスが通
信を行なう場合に、それがローカルチェックポイント生
成部２０２およびグローバルチェックポイント生成部２
０１からの生成通知後の最初の通信であれば、その旨を
チェックポイント管理部１０１に通知する。

【００３６】チェックポイント管理部１０１は障害発生
時には、故障プロセスが最も最近のチェックポイント生
成後にプロセス間通信を行なったかどうかを調べ、プロ
セス間通信を行なっていれば、チェックポイントグルー
プ全体を最も最近生成したグローバルチェックポイント
にロールバックさせてそこからリスタートさせる。ま
た、通信を行なっていなければ、故障プロセスのみを最
新のローカルまたはグローバルチェックポイントにロー
ルバックさせてそこからリスタートさせる。

【００３７】このように、グローバルチェックポイント
とローカルチェックポイントとの２種類のチェックポイ
ント生成を組合せ、故障プロセスのプロセス間通信状態
に応じて各プロセスのリスタート時点が決定される。

【００３８】したがって、故障プロセスか無故障プロセ
スかに限らずチェックポイントグループ全体でロールバ
ックしなければならないという従来の同期型チェックポ
イント生成と比較した場合には、故障プロセスが最も最
近のチェックポイント以降にプロセス間通信を行なって
いなければ、他の無故障プロセスは一切ロールバックす
る必要がないので、無故障プロセスのロールバックを抑
制することが出来る。また、従来の非同期型チェックポ
イント生成と比較した場合、メッセージロギングを行な
わないため、プロセスの処理は非決定的でよく、さらに
グローバルチェックポイントによりロールバックポイン
トが保証されているため、カスケードロールバックの発
生も抑制できる。

【００３９】また、図１のグローバルチェックポイント
生成部２０１、ローカルチェックポイント生成部２０
２、および通信監視部２０３は、図２および図３にそれ
ぞれ示すように、専用の状態監視プロセスやオペレーテ
ィングシステム内の機能として実現することもできる。

【００４０】図２において、状態監視プロセスは各計算
機上に１つずつ存在し、同一計算機上のプロセスの状態
を監視する。また、計算機の構成に関わらず、１つの状
態監視プロセスで、任意の計算機上の複数のプロセスの
状態を監視しても良い。

【００４１】図３においては、グローバルチェックポイ
ント生成部２０１、ローカルチェックポイント生成部２
０２、および通信監視部２０３はオペレーティングシス
テム内に実現されているが、これらはオペレーティング
システムのコードの一部として実現することもできる
し、マイクロカーネル形式のオペレーティングシステム
においてはサーバプロセスとして実現することもでき
る。さらに、新たな機能をモジュールとして実行時に組
み込み可能なオペレーティングシステムにおいては、こ
れらをモジュールとして実現することができる。

【００４２】次に図４〜図８を参照して、プロセス管理
部Ｍおよび各プロセスＰ１〜Ｐｎの動作を説明する。図
４はチェックポイント管理部１０１内のチェックポイン
トグループ情報および障害発生時の処理のフローチャー
トを表したものである。図５、図６、図７、図８はそれ
ぞれ、グローバルチェックポイント指示部１０２、グロ
ーバルチェックポイント生成部２０１、ローカルチェッ
クポイント生成部２０２、通信監視部２０３の処理の手
順を表したフローチャートである。

【００４３】チェックポイント管理部１０１は、例えば
図４（ａ）に示すようなチェックポイントグループテー
ブルを用いて、どのプロセスが同じチェックポイントグ
ループに属するかを管理する。図４（ａ）では、チェッ
クポイントグループ１には、計算機Ａ上のプロセスＩＤ
が１００，８９のプロセスと、計算機Ｂ上のプロセスＩ
Ｄが１０２のプロセスと、計算機Ｃ上のプロセスＩＤが
１５４のプロセスとが属している。また、チェックポイ
ントグループ２には、計算機Ａ上のプロセスＩＤが１９
３，２００のプロセスと、計算機Ｂ上のプロセスＩＤが
２００のプロセスと、計算機Ｃ上のプロセスＩＤが１０
１のプロセスとが属している。

【００４４】図４（ｂ）のフローチャートに示されてい
るように、チェックポイント管理部１０１は、プロセス
に障害が発生した場合、その故障プロセスの最も最近の
チェックポイント生成以降に通信が行なわれているかど
うかを調べ（ステップＳ１０１）、通信が行なわれてい
れば、故障プロセスが属するチェックポイントグループ
全体を最近のグローバルチェックポイントからリスター
トさせ（ステップＳ１０２）、通信を行なっていなけれ
ば、故障プロセスのみをそのチェックポイントからリス
タートさせる（ステップＳ１０３）。

【００４５】図５のフローチャートに示されているよう
に、グローバルチェックポイント指示部１０２は任意の
時間経過やユーザからの指示を待機後（ステップＳ２０
１）、チェックポイント管理部１０１からチェックポイ
ントグループ情報を獲得し（ステップＳ２０２）、同一
グループに属する各プロセスのチェックポイント生成を
指示し、再び任意の時間経過やユーザからの指示を待機
する（ステップ２０１）。

【００４６】図６のフローチャートに示されているよう
に、グローバルチェックポイント生成部２０１はグロー
バルチェックポイント指示部１０２からの指示を待機
し、その指示が来た時にチェックポイント生成を行なう
（ステップＳ３０１、Ｓ３０２）。そして、チェックポ
イント生成を完了した旨をチェックポイント管理部１０
１および通信監視部２０３に通知する（ステップＳ３０
３、Ｓ３０４）。

【００４７】図７のフローチャートに示されているよう
に、ローカルチェックポイント生成部２０２は、任意の
時間経過後、グローバルチェックポイント生成中かどう
かをグローバルチェックポイント生成部２０１に問い合
わせ（ステップＳ４０１、Ｓ４０２）、生成中ならば再
びＳ４０１に戻って任意の時間経過を待つ。生成中でな
ければ、チェックポイントを生成し（ステップＳ４０
３）、生成した旨をチェックポイント管理部および通信
監視部に通知する（ステップＳ４０４、Ｓ４０５）。

【００４８】図８のフローチャートに示されているよう
に、通信監視部２０３はプロセスの通信を監視し、それ
がチェックポイント生成後の最初の通信であれば（ステ
ップＳ６０１、Ｓ６０２）、その旨をチェックポイント
管理部に通知する（ステップＳ６０３）。

【００４９】図９は前述のプロセスＰ１〜Ｐｎの中の５
つのプロセス、プロセスＰ１、Ｐ２、Ｐ３、Ｐ４、Ｐ５
がプロセス間通信を行なっている場合の、チェックポイ
ント生成の様子を示した図である。

【００５０】以下、この図９を参照して、実施形態１の
動作を具体的に説明する。図９では、各プロセスのグロ
ーバルチェックポイントＧＣ１、ＧＣ２の間に各プロセ
ス毎のタイミングでローカルチェックポイントを生成し
ている。すなわち、グローバルチェックポイントＧＣ
１、ＧＣ２間において、プロセスＰ１についてはローカ
ルチェックポイントｃａ１、ｃａ２、ｃａ３が生成さ
れ、プロセスＰ２についてはローカルチェックポイント
ｃｂ１、ｃｂ２が生成され、プロセスＰ３についてはロ
ーカルチェックポイントｃｃ１、ｃｃ２が生成され、プ
ロセスＰ４についてはローカルチェックポイントｃｄ
１、ｃｄ２が生成され、プロセスＰ５については、ロー
カルチェックポイントｃｅ１、ｃｅ２、ｃｅ３が生成さ
れている。

【００５１】Ｆ４時点でプロセスＰ３に障害が発生した
場合、ローカルチェックポイントｃｃ２以降に通信を行
なっていないため、その故障プロセスＰ３のみがｃｃ２
にロールバックされ、そこからリスタートする。Ｆ２時
点でプロセスＰ２に障害が発生した場合、ｃｂ１生成
後、プロセスＰ１との間でプロセス間通信を行なってい
るため、ｃｂ１は有効でなく、全てのプロセスＰ１〜Ｐ
５がＧＣ１からリスタートする。Ｆ３、Ｆ５時点の障害
もＦ２の場合と同様に、チェックポイントグループ全体
がＧＣ１からリスタートする。Ｆ１時点でプロセスＰ１
に障害が発生した場合、プロセスＡはＧＣ１生成後に通
信を行なっていないため、単独でＧＣ１からリスタート
する。

【００５２】次に、この発明の第２実施形態を説明す
る。ここでは、通信監視部２０３とチェックポイント管
理部１０１の機能だけが実施形態１と異なっており、他
の点は全て実施形態１と同じである。

【００５３】すなわち、実施形態２においては、通信監
視部２０３はチェックポイント生成後の最初の通信だけ
でなく、すべての通信が行なわれる場合にその旨を逐次
チェックポイント管理部１０１に通知する。チェックポ
イント管理部１０１は通信監視部２０３、グローバルチ
ェックポイント生成部２０１、ローカルチェックポイン
ト生成部２０２からの通知を元に各プロセス毎にグロー
バルチェックポイント間での通信およびローカルチェッ
クポイント生成の履歴を保存および管理し、障害発生時
には、保存した履歴を元に、ロールバック対象のプロセ
スおよびそれらプロセス毎にロールバックすべき最適な
チェックポイントを決定する。

【００５４】実施形態２によれば、ローカルチェックポ
イント生成の後に通信を行なった場合でも、故障プロセ
スおよび無故障プロセスそれぞれのロールバックを最小
限に抑え、しかも、もっとも最近の有効なチェックポイ
ントを定められるため、ロールバックにより処理がさか
のぼる区間を短くできる。

【００５５】以下、図９の例に基づいて具体的な動作を
説明する。図１０は、図９のような処理を行なった場合
にチェックポイントグループ管理部１０１で保存した各
プロセスの履歴（グローバルチェックポイント、ローカ
ルチェックポイント、プロセス間通信）の内容を示した
ものである。メッセージを送信した場合は、ｓ（メッセージ番号：送信先）受信した場合は、ｒ（メッセージ番号：送信元）と表している。

【００５６】図１１は、図１０のような各プロセスの履
歴を元に各プロセスのリスタートポイントを求める処理
のフローチャートを示したものである。図１１（ａ）に
示すように、チェックポイント管理部１０１は、まず、
各プロセスのリスタートポイントを格納する変数ｒｅｓ
ｔａｒｔを初期化し（ステップＳ７０１）、各プロセス
の障害発生時の最後のイベントをｃｈｋ−ｅｖに格納す
る（ステップＳ７０２）。ｃｈｋ−ｅｖは、各プロセス
のイベントをチェックするときの最後のイベントとして
使用される。

【００５７】次いで、故障プロセスの最後のイベントが
チェックポイント生成か否かを調べる（ステップＳ７０
３）、故障プロセスの最後のイベントがチェックポイン
ト生成であるならば、故障プロセスの最も最近のチェッ
クポイント生成以降に通信が行なわれていない事になる
ので、ステップＳ７０４にてｒｅｓｔａｒｔ［故障プロ
セス］をその最新のチェックポイントに設定して終了す
る（実施形態１と同じ）。そうでないならば、故障プロ
セスの最後のイベントと、故障プロセスのプロセスＩＤ
（ＰＩＤ）を指定して、関数ｓｅａｒｃｈを呼び出す
（ステップＳ７０５）。

【００５８】図１１（ｂ）に示すように、関数ｓｅａｒ
ｃｈでは最初に通信相手のプロセスをチェックしたかど
うかを記録する変数ｃｈｅｃｋを初期化し（ステップＳ
８０１）、パラメタで指定されたｓｔ−ｅｖから最も最
近のチェックポイントを探し、そのチェックポイント
を、ｒｅｓｔａｒｔ［Ｐｉｄ］にセットする（ステップ
Ｓ８０２）。次にＰｉｄで指定された履歴のｒｅｓｔａ
ｒｔ［Ｐｉｄ］からｃｈｋ−ｅｖまでの各通信イベント
について以下の処理（ステップＳ８０３〜Ｓ８０７）を
行なう。

【００５９】・ｃｈｅｃｋ［通信相手］＝０ならば、ま
だ通信相手をチェックしていないため、通信相手の対応
したイベントと通信相手を指定して関数ｓｅａｒｃｈを
再帰的に呼び出しチェックを行なった後、ｃｈｅｃｋ
［通信相手］＝１とし、次のイベントを調べる。

【００６０】・ｃｈｅｃｋ［通信相手］＝１ならばすで
に通信相手を調べているため、次のイベントを調べる。・イベントがｓｔ−ｅｖの場合はスキップする。

【００６１】以上の処理を行なうことより、各プロセス
のリスタートポイントを求めることができる。なお、上
記のアルゴリズムで、変数ｃｈｅｃｋは関数ｓｅａｒｃ
ｈ内のローカル変数であり、変数ｒｅｓｔａｒｔは大域
変数である。

【００６２】図９のＦ５時点で障害が発生した場合を例
に、上記の処理の主要部を具体的に説明する。ｒｅｓｔａｒｔ［Ｐ１…Ｐ５］＝０ｃｈｋ−ｅｖ＝｛ｃａ１，ｃｂ１，ｒ（ｍ７：Ｐ４），ｓ（ｍ１０：Ｐ５），ｒ（ｍ１０：Ｐ４）｝ｓｅａｒｃｈ（“ｓ（ｍ１０：Ｐ５）”，Ｐ４）ｒｅｓｔａｒｔ［Ｐ４］＝ｃｈｋ−ｅｖ［Ｐ４］＝ｃｄ１（ｓ（ｍ７：Ｐ３）をチェック）ｓｅａｒｃｈ（“ｒ（ｍ７：Ｐ４）”、Ｐ３）ｒｅｓｔａｒｔ［Ｐ３］＝ｃｈｋ−ｅｖ［Ｐ３］＝ｃｃ１（ｓ（ｍ４：Ｐ２）をチェック）ｓｅａｒｃｈ（“ｒ（ｍ４：Ｐ３）”、Ｐ２）ｒｅｓｔａｒｔ［Ｐ２］＝ｃｈｋ−ｅｖ［Ｐ２］＝ＧＣ１（ｓ（ｍ４：Ｐ３）をチェック）ｓｅａｒｃｈ（“ｒ（ｍ３：Ｐ２）”、Ｐ３）ｒｅｓｔａｒｔ［Ｐ３］＝ｃｈｋ−ｅｖ［Ｐ３］＝ＧＣ１ｒｅｔｕｒｎｒｅｔｕｒｎｒｅｔｕｒｎ（ｓ（ｍ１０：Ｐ５）をチェック）ｓｅａｒｃｈ（“ｒ（ｍ１０：Ｐ４）”，Ｐ５）ｒｅｓｔａｒｔ［Ｐ５］＝ｃｈｋ−ｅｖ［Ｐ５］＝ｃｅ１ｒｅｔｕｒｎｒｅｔｕｒｎすなわち、まず変数リスタートを初期化し（ｒｅｓｔａ
ｒｔ［Ｐ１…Ｐ５］＝０）、その後、各プロセスＰ１〜
Ｐ５の障害発生時の最後のイベントをｃｈｋ−ｅｖに格
納した後、故障プロセスＰ４についての障害発生時点Ｆ
５以前の最後のイベントとその故障プロセスのプロセス
ＩＤをパラメタとして関数Ｓｅａｒｃｈを実行する（ｓ
ｅａｒｃｈ（“ｓ（ｍ１０：Ｐ５）”，Ｐ４））。そし
て、ｒｅｓｔａｒｔ［Ｐ４］＝ｃｈｋ−ｅｖ［Ｐ４］＝
ｃｄ１にセットした後、メッセージｍ７についての通信
相手であるプロセスＰ３の対応するイベント（ｒ（ｍ
７：Ｐ４））とそのプロセスＰ３のプロセスＩＤ（Ｐ
３）をパラメタとして関数Ｓｅａｒｃｈを再帰的に呼び
出す（ｓｅａｒｃｈ（“ｒ（ｍ７：Ｐ４）”、Ｐ３）。

【００６３】そして、プロセスＰ３がｍ７を受けとった
時点から最も最近のチェックポイント（ｃｃ１）をｒｅ
ｓｔａｒｔ［Ｐ３］とｃｈｋ−ｅｖ［Ｐ３］にセットす
る（ｒｅｓｔａｒｔ［Ｐ３］＝ｃｈｋ−ｅｖ［Ｐ３］＝
ｃｃ１）。

【００６４】次いで、ｃｃ１からプロセスＰ３の最後の
イベントであるｍ７の受信までの間のイベントのなか
で、未チェックのメッセージｍ４について、その通信相
手であるプロセスＰ２の対応するイベント（ｒ（ｍ４：
Ｐ３））とそのプロセスＰ２のプロセスＩＤ（Ｐ２）を
パラメタとして関数Ｓｅａｒｃｈを再帰的に呼び出す
（ｓｅａｒｃｈ（“ｒ（ｍ４：Ｐ３）”、Ｐ２））。そ
して、プロセスＰ２がｍ４を受けとった時点から最も最
近のチェックポイント（ＧＣ１）をｒｅｓｔａｒｔ［Ｐ
２］とｃｈｋ−ｅｖ［Ｐ２］にセットする（ｒｅｓｔａ
ｒｔ［Ｐ２］＝ｃｈｋ−ｅｖ［Ｐ２］＝ＧＣ１）。

【００６５】次いで、ＧＣ１からプロセスＰ２の最後の
イベントであるｃｂ１までに行われたイベントであり、
且つ未チェックのイベントであるメッセージｍ３につい
て、その通信相手であるプロセスＰ３の対応するイベン
ト（“ｒ（ｍ３：Ｐ２））とそのプロセスＰ３のプロセ
スＩＤ（Ｐ３）をパラメタとして関数Ｓｅａｒｃｈを再
帰的に呼び出す（ｓｅａｒｃｈ（“ｒ（ｍ３：Ｐ
２）”、Ｐ３））。そして、プロセスＰ３がｍ３を受け
とった時点から最も最近のチェックポイント（ＧＣ１）
をｒｅｓｔａｒｔ［Ｐ３］とｃｈｋ−ｅｖ［Ｐ３］にセ
ットする（ｒｅｓｔａｒｔ［Ｐ３］＝ｃｈｋ−ｅｖ［Ｐ
３］＝ＧＣ１）。

【００６６】以上で、故障プロセスＰ４に関するメッセ
ージｍ７についてのチェック処理が全て終了し、次にメ
ッセージｍ１０についてのチェック処理が行われる。こ
こでは、メッセージｍ１０について、その通信相手であ
るプロセスＰ５の対応するイベント（“ｒ（ｍ１０：Ｐ
４））とそのプロセスＰ５のプロセスＩＤ（Ｐ５）をパ
ラメタとして関数Ｓｅａｒｃｈを再帰的に呼び出す（ｓ
ｅａｒｃｈ（“ｒ（ｍ１０：Ｐ４）”，Ｐ５））。そし
て、プロセスＰ５がｍ１０を受けとった時点から最も最
近のチェックポイント（ｃｅ１）をｒｅｓｔａｒｔ［Ｐ
５］とｃｈｋ−ｅｖ［Ｐ５］にセットする（ｒｅｓｔａ
ｒｔ［Ｐ５］＝ｃｈｋ−ｅｖ［Ｐ５］＝ｃｅ１）。プロ
セスＰ５は、最後のイベントがｍ１０であるので、これ
以上のチェックは行われない。

【００６７】このようにして、故障プロセスが最も最近
のチェックポイント生成以降に行ったプロセス間通信の
影響が及ぶ範囲の各プロセスについて、それら各プロセ
スが行った故障発生時の最後の通信イベントまでが順に
調べられる。

【００６８】上記の処理により、プロセスＰ１、Ｐ２、
Ｐ３、Ｐ４、Ｐ５のリスタートポイントは（０、ＧＣ
１、ＧＣ１、ｃｄ１、ｃｅ１）となる。すなわち、Ｆ５
でプロセスＰ４に障害が発生した場合、プロセスＰ１は
ロールバックせず、プロセスＰ２、Ｐ３、Ｐ４、Ｐ５は
それぞれＧＣ１、ＧＣ１、ｃｄ１、ｃｅ１からリスター
トする。

【００６９】以上のように、この第２実施形態において
は、分散チェックポイント生成の対象となるプロセスＰ
１からＰ５それぞれのプロセス間通信およびチェックポ
イント生成の履歴を用いて、故障プロセスが最も最近の
チェックポイント生成以降に行ったプロセス間通信の影
響が及ぶ範囲の各プロセスについて、それら各プロセス
が行った故障発生時の最後の通信イベントまでを順に調
べることにより有効性を有するチェックポイントを決定
しているので、プロセスそれぞれについてロールバック
すべき最適なチェックポイントを決定することができ
る。よって、故障プロセスの最も最近のチェックポイン
トが無効であっても、全てのプロセスを必ずしもグロー
バルチェックポイントまでロールバックする必要が無く
なり、ロールバックするプロセスを最小にし、且つロー
ルバックする範囲を小さくすることが可能となる。

【００７０】

【発明の効果】以上説明したように、本発明によれば、
リスタートポイントが容易に確定でき、各プロセスの動
作が非決定的でも良く、受信メッセージ保存処理を必要
とせず、無故障プロセスのロールバックを削減すること
を可能にするチェックポイント生成方法が実現される。

【図面の簡単な説明】

【図１】本発明の第１実施形態に係るチェックポイント
生成方法を実現するためのシステム構成を示すブロック
図。

【図２】本発明の第１実施形態に係るチェックポイント
生成方法を実現するための第２のシステム構成を示すブ
ロック図。

【図３】本発明の第１実施形態に係るチェックポイント
生成方法を実現するための第３のシステム構成を示すブ
ロック図。

【図４】同第１実施形態のシステムに設けられているチ
ェックポイント管理部によって管理されるチェックポイ
ントグループ情報と障害時の処理手順を示す図。

【図５】同第１実施形態のシステムに設けられているグ
ローバルチェックポイント指示部の処理手順を示すフロ
ーチャート。

【図６】同第１実施形態のシステムに設けられているグ
ローバルチェックポイント生成部の処理手順を示すフロ
ーチャート。

【図７】同第１実施形態のシステムに設けられているロ
ーカルチェックポイント生成部の処理手順を示すフロー
チャート。

【図８】同第１実施形態のシステムに設けられている通
信監視部の処理手順を示すフローチャート。

【図９】同第１実施形態のシステムのチェックポイント
生成方法の適用例を示す図。

【図１０】本発明の第２実施形態に係るチェックポイン
ト生成方法を実現するために使用されるチェックポイン
ト管理部で管理されるプロセス履歴を表した図。

【図１１】同第２実施形態におけるチェックポイント管
理部のリスタートポイント決定処理の手順を示すフロー
チャート。

【図１２】従来のシステムにおける分散チェックポイン
ト生成例を示す図。

【図１３】従来のシステムにおける同期型チェックポイ
ント生成処理と非同期型チェックポイント生成処理を説
明するための図。

【図１４】従来の非同期型チェックポイント生成処理の
適用例を示す図。

【符号の説明】

Ｍ…プロセス管理部、Ｐ１〜Ｐ５…プロセス、１０１…
チェックポイント管理部、１０２…グローバルチェック
ポイント指示部、２０１…グローバルチェックポイント
生成部、２０２…ローカルチェックポイント生成部、２
０３…通信監視部。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平１−113805（ＪＰ，Ａ) 特開昭61−296461（ＪＰ，Ａ) 特開平２−287858（ＪＰ，Ａ) 特開平９−138754（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 11/34 G06F 9/46 330 G06F 11/30 320

Claims

(57)【特許請求の範囲】

【請求項１】プロセス間通信を行なう複数のプロセス
のチェックポイントを生成するチェックポイント生成方
法において、前記各プロセスのプロセス間通信を監視し、分散チェックポイント生成の対象となるプロセス間で同
期して第１のチェックポイントを生成し、前記各プロセス毎のタイミングでプロセス毎にローカル
な第２のチェックポイントを生成し、障害発生時に、少なくともその障害が発生した故障プロ
セスに関するプロセス間通信の監視結果に応じて、前記
第１および／または第２のチェックポイントの有効性を
調べることを特徴とするチェックポイント生成方法。
【請求項２】前記各プロセスのプロセス間通信を監視
では、前記各プロセスについて、前記第１または第２の
最も最近のチェックポイントの生成以降にプロセス間通
信が行われたか否かが監視され、前記故障プロセスについて、前記第１または第２の最も
最近のチェックポイントの生成以降にプロセス間通信を
行ったか否かにより、前記最も最近のチェックポイント
の有効性を調べることを特徴とする請求項１記載のチェ
ックポイント生成方法。
【請求項３】前記最も最近のチェックポイントの生成
以降に前記故障プロセスがプロセス間通信を行ってない
と判断したとき、前記故障プロセスのみを、前記最も最
近のチェックポイントにロールバックさせることを特徴
とする請求項２記載のチェックポイント生成方法。
【請求項４】前記最も最近のチェックポイントの生成
以降に前記故障プロセスがプロセス間通信を行っている
と判断したとき、前記分散チェックポイント生成の対象
となるプロセスそれぞれを前記第１のチェックポイント
にロールバックさせることを特徴とする請求項２記載の
チェックポイント生成方法。
【請求項５】前記各プロセスのプロセス間通信の監視
結果に基づいて前記各プロセス毎にプロセス間通信の履
歴を管理し、前記分散チェックポイント生成の対象となるプロセスそ
れぞれについての前記第１および第２のチェックポイン
ト生成の履歴を管理し、前記障害発生時に、前記分散チェックポイント生成の対
象となるプロセスそれぞれのプロセス間通信およびチェ
ックポイント生成の履歴に応じて、前記プロセスそれぞ
れについてロールバックの必要性およびロールバックす
べき最適なチェックポイントを決定することを特徴とす
る請求項１記載のチェックポイント生成方法。
【請求項６】前記各プロセスのプロセス間通信の監視
結果に基づいて前記各プロセス毎にプロセス間通信の履
歴を管理し、前記分散チェックポイント生成の対象となるプロセスそ
れぞれについての前記第１および第２のチェックポイン
ト生成の履歴を管理し、前記障害発生時に、前記故障プロセスについて、前記第
１または第２の最も最近のチェックポイントの生成以降
にプロセス間通信を行ったか否かを前記故障プロセスに
関するプロセス間通信の履歴に応じて判断し、前記最も
最近のチェックポイントの生成以降に前記故障プロセス
がプロセス間通信を行ってないとき、前記故障プロセス
のみを、前記最も最近のチェックポイントにロールバッ
クさせ、前記最も最近のチェックポイントの生成以降に前記故障
プロセスがプロセス間通信を行っているとき、前記分散
チェックポイント生成の対象となるプロセスそれぞれの
プロセス間通信およびチェックポイント生成の履歴に応
じて、ロールバックが必要なプロセス、およびそのプロ
セスがロールバックすべき最適なチェックポイントを決
定することを特徴とする請求項１記載のチェックポイン
ト生成方法。
【請求項７】分散チェックポイント生成の対象となる
複数のプロセス間で同期をとってプロセス間通信に関し
て矛盾のない状態のリスタートが可能な同期型チェック
ポイントを生成し、前記プロセス毎のタイミングでプロセス毎にローカルな
チェックポイントを生成し、前記複数のプロセスそれぞれについて、前記同期型チェ
ックポイントまたは前記ローカルチェックポイントの生
成後におけるプロセス間通信の有無を監視し、障害発生時に、その障害が発生された故障プロセスにつ
いて、最も最近の前記同期型チェックポイントまたは前
記ローカルチェックポイントの生成以後にプロセス間通
信が行なわれたか否かを検出し、プロセス間通信が行なわれていない場合は、前記故障プ
ロセスについてのみ前記最も最近のチェックポイントに
ロールバックし、プロセス間通信が行なわれていた場合
は、前記複数のプロセスそれぞれを前記同期型チェック
ポイントにロールバックすることを特徴とするチェック
ポイント生成方法。
【請求項８】分散チェックポイント生成の対象となる
複数のプロセス間で同期をとってプロセス間通信に関し
て矛盾のない状態のリスタートが可能な同期型チェック
ポイントを生成し、前記プロセス毎のタイミングでプロセス毎にローカルな
チェックポイントを生成し、前記複数のプロセスそれぞれについてプロセス間通信の
履歴を管理し、前記複数のプロセスそれぞれについての前記同期型チェ
ックポイントおよびローカルチェックポイント生成の履
歴を管理し、障害発生時に、その障害が発生された故障プロセスにつ
いて、最も最近の前記同期型チェックポイントまたは前
記ローカルチェックポイントの生成以後にプロセス間通
信が行なわれたか否かを、前記故障プロセスの通信履歴
に基づいて検出し、プロセス間通信が行なわれていない場合は、前記故障プ
ロセスについてのみ前記最も最近のチェックポイントに
ロールバックし、プロセス間通信が行なわれていた場合は、前記複数のプ
ロセスそれぞれのプロセス間通信およびチェックポイン
ト生成の履歴に応じて、前記プロセスそれぞれについて
ロールバックの必要性およびロールバックすべき最適な
チェックポイントを決定することを特徴とするチェック
ポイント生成方法。