JP3154942B2

JP3154942B2 - 分散チェックポイント生成方法および同方法が適用される計算機システム

Info

Publication number: JP3154942B2
Application number: JP20733996A
Authority: JP
Inventors: 敏雄白木原; 達徳金井; 秀昭平山
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-09-11
Filing date: 1996-08-06
Publication date: 2001-04-09
Anticipated expiration: 2016-08-06
Also published as: JPH09138754A; US5802267A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、分散処理環境下
でプロセス間通信を行いながら動作する複数のプロセス
それぞれのチェックポイントを生成するチェックポイン
ト生成方法およびそのチェックポイント生成方法が適用
される計算機システムに関する。

【０００２】

【従来の技術】一般に、計算機システムにおいては、プ
ログラム実行の信頼性を高めるために、各種の回復機能
が設けられている。回復機能の１つとして、従来より、
チェックポイントリスタート方法が知られている。この
チェックポイントリスタート方法では、プロセスの実行
の途中の状態からの再実行に必要な情報が定期的に保存
される。この情報を保存する時点をチェックポイントと
呼び、その情報を保存することをチェックポイントの生
成と呼ぶ。障害発生によってプログラム実行が中断され
たとき、その中断されたプロセスの状態は障害発生前の
チェックポイントまでロールバックされ、そのチェック
ポイントから再実行される。

【０００３】ある１つのプロセスが単独で動作するシス
テムにおいては、そのプロセスの途中状態のみのチェッ
クポイントを生成すればよいが、複数のプロセスが互い
にプロセス間通信を行いながら並行して動作する分散シ
ステムでは、チェックポイントは単一のプロセスについ
てとったのみでは不十分である。すなわち、プロセス間
通信によって関係ができた複数のプロセスについて、矛
盾なく再実行できるように、それらのチェックポイント
を生成する必要がある。以降では、プロセス毎に生成さ
れるチェックポイントをローカルチェックポイント、関
係のあるプロセスそれぞれの対応するローカルチェック
ポイントの集合を分散チェックポイントと呼ぶ。

【０００４】分散環境におけるプロセス間のプロセス間
通信手段としては、メッセージ送受信、および共有メモ
リやファイルによるデータ交換がある。メッセージ送受
信はメッセージの送信側と受信側で同期してデータ交換
を行う手段である。共有メモリは複数のプロセス間で共
有されるメモリで、各プロセスから直接読み書きを行う
ことができ、書き込みの結果は他のプロセスからも見る
ことができる。ファイルは複数のプロセスからアクセス
可能であり、あるプロセスがファイルに情報を書き込
み、他のプロセスがそのファイルから情報を読み出すこ
とにより、情報交換を行うことができる。メッセージ送
受信は同期的なプロセス間通信であるのに対して、共有
メモリおよびファイルによる情報交換は非同期的なプロ
セス間通信である。

【０００５】また、共有メモリは同一計算機内のプロセ
ス間で通信されるのに対し、メッセージ送受信は異なる
計算機間および同一計算機内のプロセス間通信に使用す
ることができる。ファイルは同一計算機内のプロセス間
で共有可能であり、またネットワークファイルシステム
を利用することにより、異なる計算機間のプロセス間で
も共有でき、計算機間のプロセス間通信に利用すること
もできる。ただし、あるプロセスが書き込んだ情報が即
時に他のプロセスに有効になることを保証しないファイ
ルシステムもある。以下では、計算機間で行われるプロ
セス間通信を計算機間ＩＰＣ、同一計算機内で行われる
プロセス間通信を計算機内ＩＰＣと呼ぶ。

【０００６】分散チェックポイントの生成時に保存しな
ければならない情報には、以下のものがある。ａ）プロセスのアドレス空間の内容および実行状態をも
っているハードウェアレジスタの内容ｂ）ファイル入出力の状態ｃ）メッセージ送受信で使われる通信路の状態ｄ）共有メモリの状態（ａ）はプロセスローカルな状態であり、（ｃ），
（ｄ）は他のプロセスから影響される状態である。
（ｂ）は他のプロセスとファイル共有を行わない場合は
プロセスローカルな状態であり、共有する場合は他のプ
ロセスから影響される状態である。すなわち、他のプロ
セスとプロセス間通信を行わないプロセスについては
（ａ），（ｂ）についての状態を保存すればよい。
（ａ），（ｂ）についての状態保存の方法は、文献“M.
Litzkow and M.Solomon : Supporting checkpointing a
nd Process Migration Outsize The Unix Kernel,USENI
X Winter,Jan. 1992”、および“森山、多田：利用者レ
ベルで実現したプロセス移送ライブラリ、情報処理学会
研究報告、91-OS-51-6. Apr.1991”に開示されている。

【０００７】通常、プロセスのアドレス空間は、実行コ
ードを格納するテキスト領域、実行のためのデータを格
納するデータ領域、実行中の一時変数を格納するための
スタック領域からなる。

【０００８】上記文献の方法では、ローカルチェックポ
イント生成時には、通常の処理を停止後、アドレス空間
の内容を保存する。さらに、通常の処理停止時の実行場
所等を保存するために、ハードウェアレジスタの内容を
保存する。ファイル入出力に関してはオープンしたファ
イルパスおよび通常の処理停止時のファイルの操作位置
をしめすシークポインタを保存する。ローカルチェック
ポイントからの実行再開時には、１）アドレス空間を回復し、２）ファイルの再オープンおよびシークポインタをセッ
トし、３）保存していたハードウェアレジスタの内容をセット
し、実行を再開する。

【０００９】一方、（ｂ），（ｃ），（ｄ）については
分散処理を行う複数のプロセスの状態を一貫性を保つよ
うにとらなければならない。メッセージ送受信によるプ
ロセス間通信を行うプロセスの分散チェックポイント生
成例を図２５に示す。

【００１０】図２５では、３つのプロセスｐ１、ｐ２、
ｐ３がそれぞれメッセージ送受信を行いながら処理を進
めている場合における３種類の分散チェックポイントの
タイミングＣＨ１、ＣＨ２、ＣＨ３の例が示されてい
る。これらタイミングＣＨ１、ＣＨ２、ＣＨ３はそれぞ
れ同期型のチェックポイント生成タイミングであり、こ
のタイミングはプロセスｐ１、ｐ２，ｐ３に対してチェ
ックポイント生成を指示する管理プロセスによって与え
られる。また、図２５において、記号ｍはメッセージを
示し、その記号ｍに付けられた２つの添字はメッセージ
送信側プロセスの番号、受信側プロセスの番号を示す。

【００１１】図２５（ａ）において、ＣＨ１では、プロ
セスｐ１、ｐ２、ｐ３はそれぞれｃｈ１１、ｃｈ１２、
ｃｈ１３でローカルチェックポイントを生成するが、メ
ッセージｍ３２について注目すると、ｃｈ１３ではプロ
セスｐ３はまだメッセージを送っていない状態であるに
も関わらず、ｃｈ１２ではプロセスｐ２はメッセージを
すでに受けた状態にある。そのため、どれかのプロセス
に障害が発生してＣＨ１までロールバックして再実行を
行なう場合、メッセージｍ３２に関して矛盾した状態に
なる。図２５（ｃ）のＣＨ３に関しても、同様にメッセ
ージｍ２３に関して矛盾した状態になる。

【００１２】これらに対して、図２５（ｂ）のＣＨ２で
は、各メッセージに関して矛盾した状態がなく、ロール
バックおよび再実行を正常に行う事ができる。分散チェ
ックポイントの一貫性を保証するための方式の一つとし
て、文献“K.M.Chandy and L.Lamport: Distributed Sn
apshots: Determining Global Statesof Distributed S
ystems ， ACM Trans. Computer Syst., Vol. 3，No.
1， pp.63-75 ，Feb 1985”に開示されている方法があ
る。この方法は上記の例と同様に、プロセス間通信とし
てメッセージ送受信を対象にしており、一貫性のある分
散チェックポイントとは“未送信かつ受信済みのメッセ
ージが存在しない状態”であると定義している。ＣＨ１
のタイミングで分散チェックポイントを生成する図２５
（ａ）におけるメッセージｍ３２が未送信かつ受信済み
のメッセージであり、ＣＨ１は一貫性のないタイミング
である。また、この方法では、一貫性保持のためにメッ
セージの再送が行われる。例えば、図２５（ｃ）のメッ
セージｍ２３はＣＨ３にロールバックしたときに送信済
みで未受信のメッセージとなるが、このメッセージｍ２
３の再送によって一貫性のある障害回復が行われる。ま
た、この方法では、マーカと呼ばれるメッセージをプロ
セス間で送り合う事により、一貫性のある状態の実現を
図っている。これにより、メッセージ送受信を行なうプ
ロセスの分散チェックポイントを一貫性を保持した状態
で生成できる。

【００１３】しかし、この方法では、メッセージ送受信
のような同期型のプロセス間通信を前提にしており、非
同期的なプロセス間通信である共通メモリやファイルに
よる情報交換には対応できないという問題点がある。

【００１４】また、文献“J.S. Plank. K. Li: ickp: A
Consistent Checkpointer for Multicomputers, IEEE
Parallel Distrib.Technol., Syst.Appl., Vol.2., No.
2, pp.62-67, Summer 1994”には、Chandyらが提案して
いる方式の他に、２相コミットプロトコルにより同期を
とってローカルチェックポイントを生成する方法を提案
している。この方法では、１相目で関係しているプロセ
ス全てを停止して、メッセージに関する状態がない状態
にし、すべてのプロセスのローカルチェックポイント生
成後、２相目ですべてのプロセスの処理を再開させる。

【００１５】すなわち、図２５（ｂ）に示したＣＨ２の
状態で分散チェックポイントを生成することになる。こ
の方法では、１相目で共有メモリやファイルへのアクセ
スを禁止することにより、メッセージ送受信、共有メモ
リ／ファイルによる情報交換の双方に対応できるが、１
相目で互いに関係するプロセスの全ての処理が停止され
てしまうため、これによってプロセス停止時間が長くな
るという問題がある。

【００１６】

【発明が解決しようとする課題】プロセス間通信を行い
ながら動作する複数のプロセスの分散チェックポイント
を生成する場合、Chandyらの方法では、メッセージ送受
信には対応できるが、共有メモリやファイルによる情報
交換には対応できないという問題点があった。また、 p
lankらの方法では、関係するプロセスの全ての処理を同
期して停止した後にローカルチェックポイントを生成す
るため、分散チェックポイント生成中に通常の処理が完
全に停止してしまうという問題があった。

【００１７】この発明はこのような点に鑑みてなされた
もので、メッセージ送受信や共有メモリ、ファイル共有
による情報交換を行うプロセスの分散チェックポイント
生成が可能で、かつ、分散チェックポイント生成による
プロセスの停止時間を短縮することができるチェックポ
イント生成方法および計算機システムを提供することを
目的とする。

【００１８】

【課題を解決するための手段】この発明は、分散処理環
境下でプロセス間通信を行いながら動作する複数のプロ
セスのチェックポイントを生成するチェックポイント生
成方法において、前記各プロセスの通常処理を継続させ
た状態で前記各プロセスのプロセス間通信を停止し、全
てのプロセスがプロセス間通信を停止したとき、前記各
プロセスのチェックポイントを生成することを特徴とす
る。

【００１９】このチェックポイント生成方法において
は、まず、複数のプロセスそれぞれのプロセス間通信の
実行を停止させる処理が行われ、すべてのプロセス間通
信が停止された事が確認されたときに、通常処理を停止
し、各プロセスのチェックポイント生成が開始される。
そして、チェックポイント生成が終了したプロセス毎に
通常処理およびプロセス間通信が再開される。この場
合、チェックポイント生成が開始されるまでの期間に停
止されるのはプロセス間通信だけである。このため、各
プロセスは、プロセス間通信を行うステップまでは正常
に処理を進めることができ、プロセス間通信を行うステ
ップまで到着したときに初めてウェイトステートとな
る。また、プロセスがマルチスレッド環境で動作してい
る場合には、プロセス間通信を行うスレッドがウェイト
状態になっても、プロセス間通信に関係しない他のスレ
ッドについては動作可能である。したがって、従来のよ
うに各プロセスの全ての動作を停止した後にチェックポ
イント生成を開始する方法に比べ、プロセス全体の動作
停止時間を短縮することができる。

【００２０】また、プロセス間通信には、異なる計算機
上のプロセス間で行われるプロセス間通信（計算機間Ｉ
ＰＣ）と同一計算機上のプロセス間で行われるプロセス
間通信（計算機内ＩＰＣ）とがある。通常、計算機間Ｉ
ＰＣを停止するために要する時間に比べ計算機内ＩＰＣ
を停止するために要する時間の方が短く、また複数の計
算機間で同期をとる処理に比べて、同一計算機内のプロ
セス間で同期をとる処理の方がその同期に要する時間が
短いことを考慮して、プロセス間通信を停止する処理に
おいては、最初にメッセージ送受信等の計算機間ＩＰＣ
を停止し、その後、共有メモリ等を用いた計算機内ＩＰ
Ｃを停止することが好ましい。これにより、プロセス間
通信の内、計算機内ＩＰＣの停止時間を短縮することが
できる。

【００２１】また、各プロセス等に通常処理で書き込み
が行われたダーティーページを記録しておき、各プロセ
スのチェックポイント生成処理では、プロセス毎に前記
記録されているダーティーページのみを保存するチェッ
クポイント生成処理を通常処理と並行して実行すること
が好ましい。これにより、チェックポイント生成処理に
要する時間を短縮できると共に、チェックポイント生成
に伴う通常処理およびプロセス間通信の停止時間も短縮
できるようになる。また、チェックポイント生成処理中
においては、通常処理によってダーティーページに対す
るアクセス要求が発行された時は、そのダーティーペー
ジが保存されるまでそのアクセスの実行が待たされるこ
とになるため、チェックポイント生成処理中に通常処理
によって未保存のダーティーページに対するアクセス要
求が発生した場合は、その部分を優先して保存すること
が好ましい。これにより、そのダーティーページに対す
るアクセス待ちが早く解放され、通常処理の停止時間を
さらに低減できる。

【００２２】

【発明の実施の形態】以下、図面を参照してこの発明の
実施の形態について説明する。図１には、この発明の第
１の実施形態に係る分散チェックポイント生成方法を適
用した分散システムの機能構成が示されている。この分
散システムは、複数の計算機から構成されており、それ
ら計算機は互いに協調しながら動作する。それら複数の
計算機上では互いに関係をもった複数のプロセスＰ１〜
Ｐｎが実行される。これらプロセスＰ１〜Ｐｎそれぞれ
のチェックポイント生成タイミングは、チェックポイン
ト指示プロセスＭによって与えられる。すなわち、ここ
では前述した同期型チェックポイントが採用されてい
る。

【００２３】チェックポイント指示プロセスＭは、この
分散システムのある計算機上で実行されるものであり、
例えばオペレーティングシステム、またはオペレーティ
ングシステムとは独立したプロセスとして実現されてい
る。チェックポイント指示プロセスＭは、プロセスＰ１
〜Ｐｎに対してローカルチェックポイントの生成タイミ
ングを指示する。チェックポイント生成指示は、例え
ば、数秒間隔で定期的に発行される。

【００２４】チェックポイント生成のタイミング制御
は、２相方式を利用して行われる。１相目では、プロセ
スＰ１〜Ｐｎそれぞれに対してプロセス間通信の停止指
示が発行される。全てのプロセス間通信の停止が確認さ
れると、２相目で、プロセスＰ１〜Ｐｎそれぞれに対し
てローカルチェックポイントの生成が指示される。

【００２５】プロセスＰ１〜Ｐｎは、互いにプロセス間
通信を行いながら動作する。これら各プロセスは、チェ
ックポイント生成制御のための機能として、通信制御部
１１、およびローカルチェックポイント生成部１２を有
している。

【００２６】通信制御部１１は、例えば通信ライブラリ
やマイクロカーネル上の通信マネージャとして実現され
るものであり、プロセス間通信の停止および再開を行
う。この場合、プロセス間通信の停止はチェックポイン
ト指示プロセスＭからの通信停止指示に応答して行わ
れ、またプロセス間通信の再開はローカルチェックポイ
ント生成部１２からの通信再開指示に応答して行われ
る。ローカルチェックポイント生成部１２は、チェック
ポイント指示プロセスＭからのチェックポイント生成指
示に応答して、対応するプロセスのローカルチェックポ
イントを生成する。

【００２７】以下、図２〜図４のフローチャートを参照
して、分散チェックポイント生成時におけるこれらチェ
ックポイント指示プロセスＭ、通信制御部１１、および
ローカルチェックポイント生成部１２による一連の動作
を説明する。図２、図３、図４は、それぞれチェックポ
イント指示プロセスＭ、通信制御部１１、ローカルチェ
ックポイント生成部１２のアルゴリズムを示したもので
ある。

【００２８】チェックポイント指示プロセスＭは、分散
チェックポイント生成時に、関係のあるプロセスＰ１〜
Ｐｎそれぞれの通信制御部１１に対して通信停止指示を
通知して、通信停止を要求する（ステップＳ１１）。

【００２９】各プロセスの通信制御部１１は、通信制御
指示を待機しており（ステップＳ２１）、通信停止指示
を受けると（ステップＳ２２）、プロセス間通信を停止
する（ステップＳ２３）。そして、チェックポイント指
示プロセスＭに対して応答を返して、プロセス間通信を
停止したことを通知する（ステップＳ２４）。

【００３０】チェックポイント指示プロセスＭは、すべ
ての通信制御部１１から応答がかえってくるのを待ち
（ステップＳ１２）、そして、すべての応答がそろった
ところで、各プロセスのローカルチェックポイント生成
部１２にローカルチェックポイント生成要求を出す（ス
テップＳ１３）。

【００３１】ローカルチェックポイント生成部１２は、
ローカルチェックポイント生成要求の発行を待機してお
り（ステップＳ３１）、ローカルチェックポイント生成
要求を受けると、対応するプロセスの通常処理を停止し
（ステップＳ３２）、ローカルチェックポイントの生成
を開始する（ステップＳ３３）。ローカルチェックポイ
ント生成が終了すると、ローカルチェックポイント生成
部１２は、通常の処理を再開するとともに通信制御部１
１に対して通信の再開を要求する（ステップＳ３４、Ｓ
３５）。

【００３２】通信制御部１１は、通信再開要求を受ける
と（ステップＳ２５）、通信を再開する（ステップＳ２
６）。さらに、ローカルチェックポイント生成部１２
は、チェックポイント指示プロセスＭに応答を返して、
ローカルチェックポイント生成終了を通知する（ステッ
プＳ３６）。

【００３３】チェックポイント指示プロセスＭは、すべ
てのローカルチェックポイント生成部１２からの応答を
待機し（ステップＳ１４）、そろった時点で分散チェッ
クポイント生成が完了する。

【００３４】このように、実施形態１においては、１相
目でプロセスＰ１〜Ｐｎそれぞれのプロセス間通信の実
行を停止させる処理が行われ、すべてのプロセス間通信
が停止された事が確認されたときに、２相目で通常処理
も停止させ、各プロセスのチェックポイント生成が開始
される。そして、チェックポイント生成が完了されたプ
ロセス毎にプロセス間通信および通常処理が再開され
る。この場合、チェックポイント生成が開始されるまで
の期間に停止されるのはプロセス間通信だけである。

【００３５】このため、各プロセスは、プロセス間通信
を行うステップまでは正常に処理を進めることができ、
プロセス間通信を行うステップまで到着したときに初め
てウェイトステートとなる。また、プロセスがマルチス
レッド環境で動作している場合には、プロセス間通信を
行うスレッドがウェイト状態になっても、プロセス間通
信に関係しない他のスレッドについては動作可能であ
る。したがって、従来のように各プロセスの全ての動作
を停止した後にチェックポイント生成を開始し、そして
全てのプロセスのチェックポイント生成が終了したとき
に通常処理の再開を各プロセスに指示するplankらの方
法に比べ、プロセス全体の動作停止時間を短縮すること
ができる。

【００３６】図５には、実施形態１における２つのプロ
セスＰ１，Ｐ２とチェックポイント指示プロセスＭとの
間の動作の関係が模式的に示されている。図５におい
て、ｃｏｍｓｔｏｐは、分散チェックポイント生成処
理の第１相目で、チェックポイント指示プロセスＭから
発行される通信停止指示であり、ＡＣＫはそれに対する
各プロセスからの応答である。また、ＣＨｃｒｃａｔ
ｅは、分散チェックポイント生成処理の第２相目で、チ
ェックポイント指示プロセスＭから発行されるローカル
チェックポイント生成開始指示である。

【００３７】したがって、時点ＡでプロセスＰ１からＰ
２へのメッセージｍ１の送信要求が発生しても、そのメ
ッセージｍ１の送信は行われず、チェックポイント生成
処理が完了して通常処理および通信が再開された後に、
時点Ｂでメッセージｍ１の送信が行われる。

【００３８】よって、プロセスＰ１，Ｐ２それぞれのロ
ーカルチェックポイント設定タイミングｃｈの間でそれ
らプロセスＰ１，Ｐ２が通信することがなくなり、一貫
性を保持した状態で分散チェックポイントを生成するこ
とができる。

【００３９】また、前述したようにｃｏｍｓｔｏｐが
発行されてもプロセスＰ１，Ｐ２はプロセス間通信以外
の処理は実行できるので、通常処理全体が停止される時
間は大幅に短縮される。

【００４０】次に、この発明の第２の実施形態に係る分
散チェックポイント生成方法について説明する。図６に
は、第２の実施形態に係る分散チェックポイント生成方
法を適用した分散システムの機能構成が示されている。
この分散システムにおいては、各プロセスＰ１〜Ｐｎそ
れぞれには、図１の構成に加え、新たにページ管理部１
３が設けられており、またローカルチェックポイント生
成部１２は通常処理と並行してローカルチェックポイン
ト生成処理を実行できるように構成されている。

【００４１】ページ管理部１３は、対応するプロセスの
通常処理でメモリアドレス空間内のどのページに書き込
みが行なわれたかを検出する機能を有しており、前回の
チェックポイントから現在までの間に書き換えられたペ
ージ（ダーティページ）のアドレスを記録するダーティ
ページリストを備える。

【００４２】チェックポイント生成部１２は、通常の処
理と並行してローカルチェックポイントを生成する機能
により、ダーティページリストに記録されたページのみ
をローカルチェックポイント情報として保存する。これ
により、ローカルチェックポイント生成時間が短縮され
ると共に、分散チェックポイント生成による通常処理お
よびプロセス間通信の停止時間の短縮を図ることができ
る。

【００４３】次に、図７および図８のフローチャートを
参照して、実施形態２における分散チェックポイント生
成処理の手順を説明する。ここで、図７、図８は、それ
ぞれローカルチェックポイント生成部１２、ページ管理
部１３のアルゴリズムを示したものである。また、チェ
ックポイント指示プロセスＭ、通信制御部１１について
は実施形態１と同様の処理を行う。

【００４４】ページ管理部１３は、対応するプロセスの
処理開始時にオペレーティングシステム（ＯＳ）の機能
を使って、アドレス空間を書き込み禁止の状態にする
（ステップＳ５１）。通常処理時にあるページに対する
書き込みが行なわれた場合、ＯＳの機能によりページ保
護違反が発生するため、ページ管理部１３はそれを検知
し、そのページのアドレスをダーティページリストに記
録し、その後、そのページを書き込み可にして通常の処
理の書き込みを許可する（ステップＳ５２，Ｓ５４，Ｓ
５５）。

【００４５】また、ローカルチェックポイント生成部１
２からのダーティページリスト要求に対して、ページ管
理部１３は、アドレス空間を書き込み禁止にし（ステッ
プＳ５６）、ダーティページリストの内容を返した後、
ダーティページリストをクリアする（ステップＳ５
７）。

【００４６】ローカルチェックポイント生成部１２は、
チェックポイント指示プロセスＭからのローカルチェッ
クポイント生成要求を受けて、プロセスの処理を停止す
る（ステップＳ４１，Ｓ４２）。停止後、ローカルチェ
ックポイント生成部１２は、ぺージ管理部１３にダーテ
ィページリストを要求し、それを取得する（ステップＳ
４３）。この後、ローカルチェックポイント生成部１２
は、ダーティページリストに記録されているページだけ
をローカルチェックポイント情報として保存する処理を
開始し（ステップＳ４４）、ローカルチェックポイント
生成処理の実行（ステップＳ４５）と並行して、通常処
理の再開、および通信制御部１１への通信再開要求を行
う（ステップＳ４６，Ｓ４７）。

【００４７】通常の処理と並行して行なったローカルチ
ェックポイント生成が終了した時点で、ローカルチェッ
クポイント生成部１２は、チェックポイント指示プロセ
スＭに対して応答を返す（ステップＳ４８，Ｓ４９）。
以上の手順により、通常の処理が停止する期間はダーテ
ィページリストを取得してローカルチェックポイント生
成を開始するまでであり、プロセス間通信およびそれ以
外の通常の処理の停止時間をさらに短縮することができ
る。

【００４８】この実施形態２における２つのプロセスＰ
１，Ｐ２とチェックポイント指示プロセスＭとの間の動
作の関係は、図９の通りである。図９から分かるよう
に、図５の場合と比べて停止時間が短縮されており、プ
ロセス間通信の遅延も小さくなっている。

【００４９】次に、この発明の第３の実施形態に係る分
散チェックポイント生成方法について説明する。実施形
態２では、通常の処理と並行してローカルチェックポイ
ント生成処理を行っている間に通常の処理により書き込
みのあったダーティーページがチェックポイントに保存
されていない場合、そのダーティーページを保存するま
で通常の処理が停止される。そこで、実施形態３では、
未保存のダーティーページに通常の処理からの書き込み
要求が起こった場合、そのダーティーページを優先的に
保存する機能をローカルチェックポイント生成部１２に
追加されている。

【００５０】図１０には、第３の実施形態に係る分散チ
ェックポイント生成方法を適用した分散システムの機能
構成が示されている。この分散システムにおいては、各
プロセスＰ１〜Ｐｎそれぞれには、図６の実施形態２の
構成に加え、新たに優先保存キュー１４が設けられてお
り、ここには優先して保存するページのアドレスが記録
される。

【００５１】次に、図１１および図１２のフローチャー
トを参照して、実施形態３における分散チェックポイン
ト生成処理の手順を説明する。ここで、図１１はページ
管理部１３のアルゴリズムを示し、図１２は図７のステ
ップＳ４５に相当するローカルチェックポイント生成部
１２のローカルチェックポイント生成処理のアルゴリズ
ムを示したものである。また、チェックポイント指示プ
ロセスＭ、通信制御部１１については実施形態１，２と
同様の処理を行う。

【００５２】ページ管理部１３は、対応するプロセスの
処理開始時にオペレーティングシステム（ＯＳ）の機能
を使って、アドレス空間を書き込み禁止の状態にする
（ステップＳ６１）。また、ローカルチェックポイント
生成部１２からのダーティページリスト要求に対して
は、ページ管理部１３は、実施形態２の場合と同様に、
アドレス空間を書き込み禁止にし（ステップＳ６９）、
ダーティページリストの内容を返した後、ダーティペー
ジリストをクリアする（ステップＳ７０）。

【００５３】また、通常処理時にあるページに対する書
き込みが行なわれた場合、ＯＳの機能によりページ保護
違反が発生するため、ページ管理部１３はそれを検知す
る。保護違反を検知した場合、ページ管理部１３は、ロ
ーカルチェックポイント生成部１２がローカルチェック
ポイント生成中か否かを調べ（ステップＳ６５）、生成
中ならば、検出したページのアドレスを優先保存キュー
１４に記録し（ステップＳ６６）、ローカルチェックポ
イント生成部１２からの保存完了通信を待ち（ステップ
Ｓ６７）、通知を受けた後、検出したページアドレスを
ダーティページリストに記録し、そのページを書き込み
可にする（ステップＳ６８）。一方、ローカルチェック
ポイント生成中でないときは、ページ管理部１３は、ス
テップＳ６６、Ｓ６７は行わず、検出したページアドレ
スをダーティページリストに記録し、ページを書き込み
可にするのみである（ステップＳ６８）。

【００５４】ローカルチェックポイント生成部１２は、
ローカルチェックポイント生成中に、未保存ダーティー
ページが無くなった時点で生成を完了する。もし未保存
ダーティーページがあるならば（ステップＳ７１）、優
先保存キュー１４にページアドレスが登録されているか
否かを調べ（ステップＳ７２）、あれば、それを優先し
て保存し（ステップＳ７３）、ページ管理部１３に保存
完了を通知する（ステップＳ７４）。優先保存キュー１
４にページ情報が存在しない場合は、ダーティページリ
スト内のページを保存する（ステップＳ７５）。

【００５５】図１３は本実施形態の効果を示したもので
ある。図１３（ａ）の従来の方法は、前述した Plankら
の方法を示したものである。従来方法では、チェックポ
イント生成中に通信および通常の処理の全てが停止する
のに比べて、図１３（ｂ）の本実施形態の方法では、通
常処理の停止時間が大幅に短縮されていることがわか
る。また、通常の処理と並行してチェックポイントを生
成することで、通常処理、プロセス間通信ともに停止時
間がさらに短縮されている。

【００５６】図１４は、本発明の第４の実施形態の構成
を示したものである。図１４では、複数の計算機がネッ
トワークで接続されており、これら計算機上には、その
計算機上のプロセスを管理するプロセス管理部ＰＭ１，
ＰＭ２，…がそれぞれ存在する。また、各プロセスは実
施形態１と同様に通信制御部１１とチェックポイント生
成部１２を持つ。また、ある計算機上には、複数の計算
機それぞれのプロセス管理部ＰＭ１，ＰＭ２…それぞれ
にチェックポイント生成要求を発行するシステム管理部
ＳＭが存在する。

【００５７】図１５はシステム全体のチェックポイント
生成のためのメッセージの流れを示したものである。全
体のプロトコルは２相からなり、１相目でプロセス間通
信を停止し、２相目でローカルチェックポイントを生成
する。また、図１６，図１７はそれぞれシステム管理部
ＳＭ、プロセス管理部ＰＭ１，ＰＭ２，…の処理の流れ
を示したフローチャートである。なお、通信制御部１１
およびチェックポイント生成部１２は実施形態１で説明
した図３，４と同様の処理を行う。

【００５８】システム管理部ＳＭは各計算機上のプロセ
ス管理部ＰＭ１，ＰＭ２…に対して、チェックポイント
生成の１相目の要求を行う（ステップＳ１０１）。プロ
セス管理部ＰＭ１，ＰＭ２…の各々は、システム管理部
ＳＭからの要求を待機しており（ステップＳ１１１）、
１相目の要求を受け取ると（ステップＳ１１２）、同一
計算機内部の対応する各プロセスの通信制御部１１にプ
ロセス間通信の停止を要求する（ステップＳ１１３）。
各通信制御部１１は、プロセス間通信を停止した後、応
答を返して、プロセス間通信を停止したことを通知す
る。

【００５９】各プロセス管理部は、対応するすべての通
信制御部１１から応答がかえってくるのを待ち（ステッ
プＳ１１４）、そして、すべての応答がそろったところ
で、システム管理部ＳＭに対して１相目の要求に対する
応答を返す（ステップＳ１１５）。

【００６０】システム管理部ＳＭは、全てのプロセス管
理部ＰＭ１，ＰＭ２…からの応答を待機し（ステップＳ
１０２）、すべての応答がそろったところで、各計算機
上のプロセス管理部ＰＭ１，ＰＭ２…に対して、チェッ
クポイント生成の２相目の要求を行う（ステップＳ１０
３）。

【００６１】プロセス管理部ＰＭ１，ＰＭ２…の各々
は、システム管理部ＳＭからの要求を待機しており（ス
テップＳ１１１）、２相目の要求を受け取ると（ステッ
プＳ１１６）、同一計算機内部の対応する各プロセスの
ローカルチェックポイント生成部１２に対してローカル
チェックポイントの生成を要求する（ステップＳ１１
７）。ローカルチェックポイント生成部１２は、ローカ
ルチェックポイント生成要求を受けると、対応するプロ
セスの通常処理を停止し、ローカルチェックポイントの
生成を開始する。そして、ローカルチェックポイント生
成が終了すると、ローカルチェックポイント生成部１２
は、通常の処理を再開するとともに通信制御部１１に対
して通信の再開を要求する。さらに、ローカルチェック
ポイント生成部１２は、プロセス管理部に応答を返し、
ローカルチェックポイントの生成終了を通知する。

【００６２】プロセス管理部は、すべてのローカルチェ
ックポイント生成部１２からの応答を待機し（ステップ
Ｓ１１８）、そろった時点でシステム管理部ＳＭに対し
て２相目の要求に対する応答を返す（ステップＳ１１
５）。

【００６３】システム管理部ＳＭは、全てのプロセス管
理部ＰＭ１，ＰＭ２…からの応答を待機し（ステップＳ
１０４）、すべての応答がそろったところで、チェック
ポイント処理を終了する。

【００６４】以上の方法により、分散システム上の複数
のプロセスを効率的に管理し、分散チェックポイント生
成を可能にしている。以下では、各プロセス間通信の停
止方法について説明する。

【００６５】各プロセスは通信停止フラグをもち、通信
制御部１１は、プロセス管理部からの通信停止要求に対
し、通信停止フラグをセットし、チェックポイント生成
部１２からの再開要求に対しては通信停止フラグをリセ
ットする。

【００６６】各プロセスがメッセージ送受信、ファイル
入出力を行う場合、オペレーティングシステム（ＯＳ）
に対するシステムコールを発行する。これらの通信シス
テムコールを行う際に、上記通信停止フラグがセットさ
れていれば、リセットされるまで待機すればよい。ただ
し、メッセージ送受信に関してはメッセージ送信、ファ
イル入出力に関しては、ファイル出力のみを停止する。

【００６７】共有メモリに関しては共有メモリへの書き
込みを禁止する。ただし、メッセージ送受信、ファイル
入出力と異なり、システムコールを発行するのではな
く、通常のメモリアクセスと同様にアクセスされる。そ
のため、通信停止フラグをセットする時点で、ＯＳの提
供する機能により、共有メモリを書き込み禁止にする。
この状態で共有メモリに書き込みが発生すると、ページ
フォールトが発生するため、その処理ルーチンで上記通
信停止フラグがセットされていなければ、書き込み禁止
を解除し、書き込みを許可する。通信停止フラグがセッ
トされていれば、通信フラグがリセットされるまで待機
する。

【００６８】また、メッセージ送受信では、メッセージ
送信を行うシステムコールを行っても、実際の送信はＯ
Ｓにより遅延されることがある。タイミングの例を図１
８に示す。

【００６９】図１８（ａ）は、プロセスＡが送信システ
ムコールを発行した後に、チェックポイント生成が開始
され、チェックポイント生成、実際の送信がＯＳ内で行
われ、プロセスＢではメッセージを受信した後チェック
ポイントを生成した場合である。この場合、図に示すよ
うに“送信していないが、受信したメッセージ”が存在
するように見える。しかし、実際にチェックポイントか
らリスタートした場合を考えてみると、送信システムコ
ールを発行した後の状態からリスタートするため、破線
で示したタイミングで送られたのと同様の処理になり、
リスタート後には送信も受信も行われないため、矛盾し
た状態にはならない。

【００７０】図１８（ｂ）では、プロセスＡが送信後、
プロセスＡとＢの両方でチェックポイントが生成され、
その後で実際のメッセージ送信が行われた場合である。
障害が発生して、このチェックポイントからリスタート
した場合、プロセスＡはメッセージ送信を完了し、プロ
セスＢは受信状態にはいるため、このチェックポイント
は一貫性のないチェックポイントとなる。

【００７１】図１９は上記の問題を解決する方法を解決
するための処理を示したものである。プロセスＡはチェ
ックポイント生成の１相目の応答時にプロセスＢに送信
した送信量を通知する。送信量はプロセス管理部、シス
テム管理部を通じて、２相目の要求でプロセスＢに通知
される。プロセスＢは受信量が通知された送信量のデー
タを受信するまで、ローカルチェックポイント生成を遅
延させる。このような処理により、図１８（ｂ）のよう
なタイミングは発生しなくなるため、一貫性のある分散
チェックポイントの生成が可能になる。なお、図１９で
は、プロセスＡ，Ｂが同一計算機上にある場合である。
異なる計算機上にある場合は、図１５に示したプロトコ
ルによって同様の処理が行われる。

【００７２】また、ＯＳでは信頼性のあるプロトコルに
基づくメッセージ送受信と信頼性のないプロトコルに基
づくメッセージ送受信を提供していることが多い。すな
わち、前者はメッセージロストがなく、後者はメッセー
ジロストが起こり得るものである。信頼性のあるプロト
コルに対しては、上記の方法により、一貫性のあるチェ
ックポイントを生成すればよい。

【００７３】信頼性のないプロトコルに関しても上記の
方法を用いてもよいが、メッセージロストを許している
ため、“送信したが、受信していないメッセージ”の存
在しないことを保証すればよい。そのため、上記の送信
量の交換を行うことなく、単に送信のみを停止してもよ
い。

【００７４】図２０は、本発明の第５の実施形態の構成
を示したものである。これまでの説明では、１相目です
べてのプロセス間通信を停止し、２相目でローカルチェ
ックポイントの生成を行っていた。しかし、共有メモリ
等の計算機内ＩＰＣに関しては、その計算機内でのみ同
期をとればよい。そのため、本実施形態では、各計算機
に計算機内のプロセスの同期をとる計算機内同期部１０
１，１０２…を設け、１相目において、計算機間ＩＰＣ
を停止し、２相目には最初に計算機内同期部を用いて、
計算機内ＩＰＣを停止したのち、ローカルチェックポイ
ントを生成する。これにより、プロセス間通信のうち、
計算機内ＩＰＣの停止時間をさらに短縮することができ
る。前述の実施形態４の１相目は計算機間での同期手段
を実現しているものであり、本実施形態５の計算機内同
期部は計算機間の同期に比べて要する時間が短いという
特徴を利用したものである。

【００７５】以下、図２１〜図２３を参照して、この実
施形態５におけるチェックポイント生成処理を説明す
る。図２１，２２，２３は通信制御部、ローカルチェッ
クポイント生成部、計算機内同期部の処理を示したフロ
ーチャートである。

【００７６】通信制御部１１は、通信制御指示を待機し
（ステップＳ１２１）、計算機間ＩＰＣ停止要求が来た
場合は計算機間ＩＰＣを停止し（ステップＳ１２３，Ｓ
１２４）、計算機内ＩＰＣ停止要求の場合は計算機内Ｉ
ＰＣを停止し（ステップＳ１２５，Ｓ１２６）、通信再
開要求の場合はすべての通信を再開し（ステップＳ１２
７，Ｓ１２８）、そしてそれぞれの処理を終えると、要
求に対する応答を返す（ステップＳ１２４）。

【００７７】ローカルチェックポイント生成部１２はロ
ーカルチェックポイント生成要求を受けて（ステップＳ
１３１）、通信制御部１１に計算機内ＩＰＣの停止要求
をだす（ステップＳ１３２）。その後、計算機内同期部
を呼び出し計算機内での同期を行う（ステップＳ１３
３）。その後、通常の処理の停止、ローカルチェックポ
イント生成、通常の処理の再開、通信制御部への通信再
開要求を行い（ステップＳ１３４、Ｓ１３５、Ｓ１３
６、Ｓ１３７）、プロセス管理部に応答を返す（ステッ
プＳ１３８）。

【００７８】ここで示したローカルチェックポイント生
成部の処理は、プロセスがマルチスレッド環境で動作す
ることを前提としている。すなわち、チェックポイント
生成中にもチェックポイント生成を行っているスレッド
以外のスレッドが動作しているため、計算機内ＩＰＣの
停止処理を行っている。しかし、プロセスがシングルス
レッドで動作している場合は、チェックポイント生成中
にはプロセス内の他の処理は行われないため、計算機内
ＩＰＣの停止は不必要で、単に計算機内同期部により同
期をとればよい。

【００７９】計算機内同期部では、計算機内ＩＰＣを行
うプロセスがすべて待機状態に入っているかをチェック
し（ステップＳ１４１）、入っていれば待機しているプ
ロセスすべてを再開する（ステップＳ１４２）。すべて
のプロセスが待機状態になければ、待機状態に入る（ス
テップＳ１４３）。

【００８０】図２４は本実施形態５の効果を示したもの
である。実施形態５では、１相目で計算機間ＩＰＣだけ
を停止し、２相目で計算機内ＩＰＣの停止とローカルチ
ェックポイントの生成を行っており、またローカルチェ
ックポイントの生成処理では、実施形態２，３と同様に
ダーティーページの保存を通常処理と並行して行ってい
る。この方法においては、１相目で全てのプロセス間通
信を停止させる実施形態１〜４の方法に比べ、計算機内
ＩＰＣの停止時間がさらに短縮される。

【００８１】

【発明の効果】以上説明したように、この発明によれ
ば、メッセージ送受信、共有メモリ、ファイル共有等に
よりプロセス間通信を行なう複数のプロセスの分散チェ
ックポイントを生成可能であり、かつ、分散チェックポ
イント生成に伴うプロセスの停止時間の短縮を図ること
ができる。

【図面の簡単な説明】

【図１】この発明の第１の実施形態に係る分散チェック
ポイント生成方法を適用した分散システムの機能構成を
示すブロック図。

【図２】同実施形態１におけるチェックポイント指示プ
ロセスの処理手順を示すフローチャート。

【図３】同実施形態１における通信制御部の処理手順を
示すフローチャート。

【図４】同実施形態１におけるローカルチェックポイン
ト生成部の処理手順を示すフローチャート。

【図５】同実施形態１における２つのプロセスとチェッ
クポイント指示プロセスとの間の動作の関係を模式的に
示す図。

【図６】この発明の第２の実施形態に係る分散チェック
ポイント生成方法を適用した分散システムの機能構成を
示すブロック図。

【図７】同実施形態２におけるローカルチェックポイン
ト生成部の処理手順を示すフローチャート。

【図８】同実施形態２におけるページ管理部の処理手順
を示すフローチャート。

【図９】同実施形態２における２つのプロセスとチェッ
クポイント指示プロセスとの間の動作の関係を模式的に
示す図。

【図１０】この発明の第３の実施形態に係る分散チェッ
クポイント生成方法を適用した分散システムの機能構成
を示すブロック図。

【図１１】同実施形態３におけるページ管理部の処理手
順を示すフローチャート。

【図１２】同実施形態３におけるローカルチェックポイ
ント生成部の処理手順を示すフローチャート。

【図１３】実施形態１から３のチェックポイント生成方
法の効果を説明するための図。

【図１４】この発明の第４の実施形態に係る分散チェッ
クポイント生成方法を適用した分散システムの機能構成
を示すブロック図。

【図１５】同実施形態４におけるシステム管理部とプロ
セス管理部とプロセスとの間の動作の関係を模式的に示
す図。

【図１６】同実施形態４におけるシステム管理部の処理
手順を示すフローチャート。

【図１７】同実施形態４におけるプロセス管理部の処理
手順を示すフローチャート。

【図１８】メッセージ送受信が遅延された場合のタイミ
ング例を示す図。

【図１９】遅延送信に対応するための処理の様子を示す
図。

【図２０】この発明の第５の実施形態に係る分散チェッ
クポイント生成方法を適用した分散システムの機能構成
を示すブロック図。

【図２１】同実施形態５における通信制御部の処理手順
を示すフローチャート。

【図２２】同実施形態５におけるローカルチェックポイ
ント生成部の処理手順を示すフローチャート。

【図２３】同実施形態５における計算機内同期部の処理
手順を示すフローチャート。

【図２４】同実施形態５の効果を説明するための図。

【図２５】従来の分散チェックポイント生成のタイミン
グを示す図。

【符号の説明】

Ｍ…チェックポイント指示プロセス、Ｐ１〜Ｐｎ…分散
処理プロセス、ＳＭ…システム管理部、ＰＭ１，ＰＭ２
…プロセス管理部、１１…通信制御部、１２…ローカル
チェックポイント生成部、１３…ページ管理部、１４…
優先保存キュー、１０１…計算機内同期部。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平２−287858（ＪＰ，Ａ) 特開平７−271620（ＪＰ，Ａ) 情報処理Ｖｏｌ．34 Ｎｏ．11 （1993．11）ｐ．1366−1374 電子情報通信学会誌Ｖｏｌ．73 Ｎｏ．11（1990．11）ｐ．1174−1178 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 11/14 G06F 15/16 - 15/177 G06F 9/46 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】分散処理環境下でプロセス間通信を行い
ながら動作する複数のプロセスのチェックポイントを生
成するチェックポイント生成方法において、前記各プロセスの通常処理を継続させた状態で前記各プ
ロセスのプロセス間通信を停止し、全てのプロセスがプロセス間通信を停止したとき、前記
各プロセスのチェックポイントを生成することを特徴と
するチェックポイント生成方法。
【請求項２】分散処理環境下でプロセス間通信を行い
ながら動作する複数のプロセスのチェックポイントを生
成するチェックポイント生成方法において、前記各プロセスの通常処理を継続させた状態で前記各プ
ロセスにプロセス間通信の停止を指示し、全てのプロセスのプロセス間通信の停止が確認されたと
き、前記各プロセスにチェックポイント生成を指示する
ことを特徴とするチェックポイント生成方法。
【請求項３】分散処理環境下でプロセス間通信を行い
ながら動作する複数のプロセスのチェックポイントを生
成するチェックポイント生成方法において、各プロセスは、プロセス間通信の停止指示を受けて、通常処理を継続さ
せた状態でプロセス間通信を停止し、チェックポイントの生成指示を受けて、チェックポイン
トの生成を開始することを特徴とするチェックポイント
生成方法。
【請求項４】分散処理下でプロセス間通信を行いなが
ら動作する複数のプロセスのチェックポイントを生成す
るチェックポイント生成方法において、前記各プロセスの通常処理を継続させた状態で、前記各
プロセスの計算機間でのプロセス間通信を停止し、全てのプロセスが計算機間でのプロセス間通信を停止し
たとき、前記各プロセスの計算機内でのプロセス間通信
を停止させた後に、前記各プロセスのチェックポイント
を生成することを特徴とするチェックポイント生成方法
【請求項５】分散処理下でプロセス間通信を行いなが
ら動作する複数のプロセスのチェックポイントを生成す
るチェックポイント生成方法において、前記各プロセスの通常処理を継続させた状態で、前記各
プロセスに計算機間で行われるプロセス間通信の停止を
指示し、全てのプロセスの計算機間でのプロセス間通信の停止が
確認されたとき、前記各プロセスに、計算機内で行われ
るプロセス間通信の停止とチェックポイント生成を指示
することを特徴とするチェックポイント生成方法。
【請求項６】分散処理下でプロセス間通信を行いなが
ら動作する複数のプロセスのチェックポイントを生成す
るチェックポイント生成方法において、各プロセスは、計算機間で行われるプロセス間通信の停止指示を受け
て、通常処理を継続させた状態で、計算機間でのプロセ
ス間通信を停止し、計算機内で行われるプロセス間通信の停止とチェックポ
イント生成の指示を受けて、計算機内でのプロセス間通
信を停止し、チェックポイントの生成を開始することを
特徴とするチェックポイント生成方法。
【請求項７】前記チェックポイントの生成処理を、前
記各プロセスの通常処理を停止した状態で行うことを特
徴とする請求項１乃至６のいずれか１項記載のチェック
ポイント生成方法。
【請求項８】前記チェックポイント生成処理が終了し
たプロセス毎に、各プロセスの通常処理およびプロセス
間通信を再開することを特徴とする請求項７記載のチェ
ックポイント生成方法。
【請求項９】前記各プロセスの通常処理ではその通常
処理によって書き込みが実行されたダーティーページを
記録し、前記各プロセスのチェックポイント生成処理では、前記
ダーティーページのみを保存する処理と、通常処理とを
並行して実行することを特徴とする請求項１乃至６のい
ずれか１項記載のチェックポイント生成方法。
【請求項１０】前記各プロセスのチェックポイント生
成処理中に、各プロセスの通常処理によって未保存ダー
ティーページへのアクセス要求が発生されたとき、前記
アクセス要求された未保存ダーティーページをそれ以外
の他のダーティーページよりも優先的に保存することを
特徴とする請求項９記載のチェックポイント生成方法。
【請求項１１】複数のプロセスがプロセス間通信を行
いながら動作する計算機システムにおいて、プロセス間通信の停止を指示するプロセス間通信停止指
示を各プロセスに発行し、前記複数のプロセスそれぞれ
からの前記プロセス間通信停止指示に対する応答が揃っ
たとき、チェックポイントの生成を指示するチェックポ
イント生成指示を前記各プロセスに発行するチェックポ
イント生成指示手段を具備し、前記各プロセスは、前記プロセス間通信停止指示を受けて、通常処理を継続
させた状態でプロセス間通信を停止し、プロセス間通信が停止されたときに、前記プロセス間通
信停止指示に対する応答を返し、前記チェックポイント生成指示を受けてチェックポイン
トの生成を開始することを特徴とする計算機システム。
【請求項１２】前記計算機システムを構成する複数の
計算機のうちの少なくとも一部の各計算機上に設けら
れ、各計算機上で実行されるプロセスを管理するための
プロセス管理手段をさらに具備し、前記チェックポイント生成指示手段は、前記計算機シス
テムを構成する複数の計算機のうちの少なくとも１つに
設けられており、前記プロセス間通信停止指示および前
記チェックポイント生成指示を前記各計算機のプロセス
管理手段を介して発行することを特徴とする請求項１３
記載の計算機システム。
【請求項１３】複数のプロセスがプロセス間通信を行
いながら動作する計算機システムにおいて、前記プロセス間通信には、計算機間で行われる計算機間
プロセス間通信と、１計算機内で行われる計算機内プロ
セス間通信とがあり、前記計算機間プロセス間通信の停止を指示する計算機間
プロセス間通信停止指示を各プロセスに発行し、前記複
数のプロセスそれぞれからの前記計算機間プロセス間通
信停止指示に対する応答が揃ったとき、チェックポイン
トの生成を指示するチェックポイント生成指示を前記各
プロセスに発行し、各プロセスの計算機内でのプロセス
間通信を停止させるチェックポイント生成指示手段を具
備し、前記各プロセスは、前記計算機間プロセス間通信停止指示を受けて、通常処
理および計算機内プロセス間通信を継続させた状態で前
記計算機間プロセス間通信を停止し、前記計算機間プロセス間通信が停止されたときに、前記
計算機間プロセス間通信停止指示に対する応答を返し、前記チェックポイント生成指示を受けて、前記計算機内
プロセス間通信を停止させた状態でチェックポイントの
生成を開始することを特徴とする計算機システム。