JP3516428B2 - 計算機 - Google Patents

計算機

Info

Publication number
JP3516428B2
JP3516428B2 JP08028297A JP8028297A JP3516428B2 JP 3516428 B2 JP3516428 B2 JP 3516428B2 JP 08028297 A JP08028297 A JP 08028297A JP 8028297 A JP8028297 A JP 8028297A JP 3516428 B2 JP3516428 B2 JP 3516428B2
Authority
JP
Japan
Prior art keywords
rollback
terminal
restart
transaction
checkpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08028297A
Other languages
English (en)
Other versions
JPH10275133A (ja
Inventor
記代子 佐藤
敏雄 白木原
秀昭 平山
達徳 金井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP08028297A priority Critical patent/JP3516428B2/ja
Publication of JPH10275133A publication Critical patent/JPH10275133A/ja
Application granted granted Critical
Publication of JP3516428B2 publication Critical patent/JP3516428B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、プロセスの再実
行処理方法に関し、特に、分散チェックポイントを利用
した分散システムにおいて、ロールバック・リスタート
の発生事実をユーザに通知するためのプロセスの再実行
処理方法に関するものである。
【0002】
【従来の技術】計算機におけるプログラム実行の信頼性
を向上させる方法として、チェックポイントに基づくプ
ログラムの実行方法が知られている。これは、プログラ
ムの実行に際し、所定のチェックポイント・タイミング
に従ってプログラムの実行体であるプロセスの状態等
(以下「チェックポイント情報」という)を定期・不定
期に取得し、プログラムの実行中に障害が発生した場合
には、直近のチェックポイントに取得したチェックポイ
ント情報に基づいて、当該プログラムを再実行(ロール
バック・リスタート)するというものである。ここで、
チェックポイントとは、プログラムの実行を経時的に見
た場合に、チェックポイント情報を取得するための処理
を行う時点をいうものとする。
【0003】ところで、単独で動作するプログラムにお
いては、そのプロセスの途中状態のみのチェックポイン
トで、チェックポイント情報を取得すればよいが、複数
のプログラムがプロセス間通信等の関係をもって動作す
るような場合においては、1つのプロセスについて、チ
ェックポイントに従って当該プロセスの状態を取得する
のみでは不十分である。すなわち、再実行した場合に矛
盾が生じないようにするためには、チェックポイントご
とに相互に関係がある複数のチェックポイント情報を取
得する必要がある。以下では、便宜上、各プロセスごと
についてのチェックポイントをローカルチェックポイン
トといい、相互に関係があるプロセスについてのローカ
ルチェックポイントの集合を分散チェックポイントとい
うものとする。そして、分散チェックポイントでは、障
害が発生した場合に、複数のプロセスに対して直近のチ
ェックポイントに戻って、再実行する必要がある。この
ように、チェックポイントに基づくロールバック・リス
タートを分散システムに適用した場合を分散チェックポ
イント・リスタート方法というものとする。
【0004】ロールバック・リスタートが行なわれるの
は、以下のような場合がある。 (1)単独のプログラムで、チェックポイントを生成し
ながら、処理を行なっている場合 a)ハードウェアの故障、またはOSのバグによるマシ
ンフォールトが原因で、プロセスが中断する場合 b)アプリケーションのバグによるプログラムフォール
トが原因で、プロセスが中断する場合。 (2)複数のプロセスについて分散チェックポイント情
報を生成しながら、分散処理を行なう環境において、関
係する他のプロセスに障害が発生する場合 上記(1) a)の場合、ユーザーは計算機の障害発生を認識
しているので、プロセスがロールバックしたことを理解
することができる。
【0005】しかしながら、同(1) b)の場合にあって
は、ユーザーは計算機の障害発生を認識できないので、
プロセスがロールバックしたことを理解できない。ま
た、同(2) の場合、例えば、クライアント・サーバーシ
ステムで、サーバに障害が発生した場合、各ユーザーが
使っている計算機には何も異常がないのに、プロセスは
ロールバック・リスタートしてしまうことになる。かか
る場合、ユーザーには何が起こったか分からない。
【0006】このように、従来の分散チェックポイント
・リスタート方法においては、プロセスがロールバック
・リスタートした場合のユーザへの通知を何ら考慮に入
れていなかったので、ロールバック・リスタートしたか
否かについて、ユーザーが直接的に理解できないという
問題があった。
【0007】
【発明が解決しようとする課題】チェックポイント・リ
スタート方法において、ユーザプログラム自体のプログ
ラムフォールトや、分散処理下での他のプロセスの障害
によりロールバックが発生した場合、その事実が各ユー
ザに通知されていなかったため、ユーザーは実行中のプ
ロセスに何が起こったのか分からない、という問題が生
じていた。
【0008】本発明は、このような点に鑑みてなされた
もので、チェックポイント・リスタート方法において、
プロセスのロールバックが行なわれたことを、ユーザー
に通知する方法を提供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、複数の端末とネットワークを介して接続
され、各端末からの要求によりプロセスを実行する計算
機であって、記憶装置と、実行中のプロセスについて、
所定のチェックポイントタイミングでチェックポイント
情報を生成し、前記記憶装置へ記憶するチェックポイン
ト管理手段と、各端末からのプロセスの起動要求により
要求されたプロセスを起動するとともに、起動したプロ
セスと要求を行った端末との対応付けを通知するプロセ
ス起動手段と、前記プロセス起動手段からの通知の内容
を保持する端末情報管理手段と、実行中のプロセスの障
害発生を検出すると、前記記憶装置に記憶されるチェッ
クポイント情報に従って該プロセスのロールバック・リ
スタート処理を行い、該ロールバック・リスタート処理
の完了するとその旨の通知を行うロールバック・リスタ
ート手段と、前記ロールバック・リスタート手段から
の、ロールバック・リスタート処理の完了の通知を受
け、前記端末情報管理手段を参照し、ロールバック・リ
スタート処理されたプロセスの起動要求を行った端末を
特定し、その特定された端末へロールバックが行われた
ことを示す情報を通知するロールバック通知手段とを備
えるようにした。
【0010】
【0011】
【0012】
【0013】
【0014】
【0015】
【0016】
【0017】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態について説明する。 [第1の実施形態]図1は、本発明に係る計算機システ
ムの構成を示す図である。
【0018】本発明に係る計算機システムは、計算機1
と端末T1,T2,T3,…(以下「端末T」というこ
ともある。)がネットワーク2を介して接続されてい
る。また、同図においては、計算機1のみ図示している
が、ネットワーク2を介してさらに他の計算機が接続さ
れていてもよい。
【0019】計算機1は、オペレーティングシステムの
管理の下、本来実行すべきプログラム(アプリケーショ
ンプログラム等)の実行体であるプロセスを実行する機
能を有するとともに、後述する本実施形態の機能実現手
段が設けられている。本実施形態における機能実現手段
は、プログラムとして実現してもよいし、その全部また
は一部をハードウェアとして実現するようにしてもよ
い。例えば、計算機のオペレーティングシステム内部の
機能として実現することができる。また、オペレーティ
ングシステム上で動作するいわゆるデーモンプロセス
や、プログラムに静的または動的にリンクされるライブ
ラリとして実現することも可能である。
【0020】次に、本実施形態における各機能実現手段
について説明する。同図において、プロセス管理部11
は、当該計算機内で実行されるアプリケーションプログ
ラム等のプロセスの実行およびその実行状態等を管理す
るものである。ここで、実行状態の管理としては、実行
中のプロセスに障害が発生した場合、内包する障害検出
部により、障害を検出する処理等があげられる。同図
は、各端末T1,T2,T3からプロセス管理部11へ
の図示しないプロセスの起動要求に従って、プロセス管
理部11がプロセスP1,P2,P3を起動し、当該プ
ロセス群の実行を管理している状態を示している。
【0021】プロセス管理部11は、端末Tからのプロ
セス起動要求があった場合、上述のようにプロセスを起
動するとともに、どのプロセスがどの端末によって起動
されたかに関する情報を端末情報管理部12に通知す
る。
【0022】端末情報管理部12は、プロセス管理部1
1からの通知に基づき、どのプロセスがどの端末によっ
て起動されたかに関する情報(以下「プロセス−端末情
報」という。)を保持する。図2は、プロセス−端末情
報の一例を示す図である。
【0023】チェックポイント管理部13は、実行中の
プロセスについて、所定のチェックポイントタイミング
でチェックポイント情報を生成、取得する。このチェッ
クポイント情報は、例えば、ローカルディスク等の記憶
装置に記憶される。
【0024】プロセス管理部11は、実行中のプロセス
の障害発生を検出した場合、分散処理を行っている他の
計算機へ、当該障害が発生した旨を通知するとともに、
記憶装置14に保持されているチェックポイント情報に
従ってプロセスのロールバック・リスタート処理を行
う。プロセス管理部11は、このロールバック・リスタ
ート処理が完了すると、その旨をロールバック通知部1
5に通知する。
【0025】ロールバック通知部15は、プロセス管理
部11からの通知を受け取ると、端末情報管理部12を
参照し、ロールバック・リスタートしたプロセスを起動
した端末を特定し、当該端末に対してプロセスがロール
バック・リスタートされた旨を通知する。
【0026】図3は、プロセス管理部11の動作処理を
説明するための図である。プロセス管理部11は、障害
検出部によってプロセスの障害を検出した場合(STE
P31)、分散チェックポイントについて、分散処理を
行っている他の計算機のプロセス管理部に、ロールバッ
ク・リスタートを行うよう指示する(STEP32)。
STEP31においてプロセスの障害の検出がない場合
であっても、分散処理を行っている他の計算機からのロ
ールバック・リスタート指示を受けた場合、または、S
TEP32の処理を経て、プロセス管理部11は、ロー
ルバック・リスタート処理を行なう(STEP34)。
ロールバック・リスタート処理を行った後、プロセス管
理部11は、ロールバック通知部15にロールバック・
リスタートが完了した旨を通知する(STEP35)。
【0027】図4は、端末情報管理部12の動作処理を
説明するための図である。同図に示すように、端末情報
管理部12は、プロセス管理部11によりプロセスが起
動された旨の通知があるまで待機する(STEP4
1)。そして、。プロセスが起動された旨の通知を受け
取ると、プロセスとそのプロセスを起動した端末との対
応関係を、プロセス−端末情報として記憶する。
【0028】図5は、ロールバック通知部15の動作処
理を説明するための図である。ロールバック通知部15
は、プロセス管理部11よりロールバック・リスタート
が完了した旨の通知を受けとると(STEP51)、端
末情報管理部12に保持されているプロセス−端末情報
を参照して、当該障害の発生に基づくロールバック・リ
スタートされたプロセスを起動した端末を特定し(ST
EP52)、当該端末にその旨を表示すべく通知する。
【0029】図6は、当該通知のあった端末の画面表示
の一例を示す図である。同図は、ディスプレイ(画面)
に、ロールバック通知アイコン61が常時表示されてお
り、ユーザは、エディタ等の作業ウィンドウ62により
作業を行っていると状態を示している。そのときに、ロ
ールバック通知部15により、ロールバック・リスター
トが発生し、完了した旨の通知を発せられると、例え
ば、PoPUpウィンドウ63のようにウィンドウが開
いて、ロールバックが行われた旨が表示される。
【0030】また、図7は、当該通知された端末の画面
表示の他の例を示す図である。同図(a)は、プロセス
監視モニタウィンドウを示す図であり、プロセスの実行
が経時的に、また、メッセージ通信が同時に表示されて
いる状態を示している。ここで、例えば、プロセスP2
において障害が検出された場合には、当該ウィンドウは
同図(b)のような表示に切り替わる。すなわち、同図
(b)は、分散チェックポイントに従って各プロセスが
直近のチェックポイントCPまでロールバックして、リ
スタートした状態をマーク(点線)で示している。この
マークは、例えば、次のチェックポイントを通過した時
点で、当該ウィンドウから消去される。
【0031】以上のように、本実施形態によれば、障害
の発生に基づきロールバック・リスタート処理が行われ
た場合には、当該プロセスを起動した端末においてその
旨が表示されるので、ロールバック・リスタートの事実
を知ることができるようになる。
【0032】[第2の実施形態]次に実施例2について
説明する。図8は、本実施形態に係る計算機システムの
構成を示す図である。本実施形態に係る計算機1は、ロ
ールバック・リスタート処理を行った後は、トランザク
ション管理部81に、ロールバックが完了した旨を通知
する。
【0033】トランザクション管理部81は、コミット
されたトランザクションのIDとそのトランザクション
が実行されたプロセスを対応づけて記録し、次回のチェ
ックポイントまで保存する。そして、ロールバックが完
了した旨の通知を受けとると、保存しているトランザク
ションのIDとプロセスとの対応関係を、ロールバック
通知部15に通知する。すなわち、このとき通知される
トランザクションは、プロセスのロールバックによって
無効になったものである。
【0034】ロールバック通知部15は、トランザクシ
ョン管理部81からの通知を受け取ると、端末情報管理
部12を参照し、プロセス−端末情報に基づいて、当該
プロセスを起動した端末を特定し、特定された端末に対
して、プロセスのロールバックにより無効になったトラ
ンザクションのIDをディスプレイに表示するため通知
を行う。
【0035】チェックポイント管理部82は、各プロセ
スについてのチェックポイント情報を生成すると、トラ
ンザクション管理部81にチェックポイント情報の生成
を完了した旨を通知する。
【0036】図9は、プロセス管理部11の動作処理を
説明するための図である。プロセス管理部11は、障害
検出部によってプロセスの障害を検出した場合(STE
P91)、分散チェックポイントについて、分散処理を
行っている他の計算機のプロセス管理部に、ロールバッ
ク・リスタートを行うよう指示する(STEP92)。
STEP91においてプロセスの障害の検出がない場合
であっても、分散処理を行っている他の計算機からのロ
ールバック・リスタート指示を受けた場合、または、S
TEP92の処理を経て、プロセス管理部11は、ロー
ルバック・リスタート処理を行なう(STEP94)。
ロールバック・リスタート処理を行った後、プロセス管
理部11は、トランザクション管理部81にロールバッ
ク・リスタートが完了した旨を通知する(STEP9
5)。
【0037】図10は、トランザクション管理部81の
動作処理を説明するための図である。トランザクション
管理部81は、トランザクションがコミットされたか否
かを判断する(STEP101)このトランザクション
がコミットされたか否かの判断は、例えば、コミットす
る旨のメッセージの受け取りがあった場合にコミットさ
れたと判断する。コミットされたと判断した場合には、
トランザクションのIDと、そのトランザクションを実
行したプロセスとを対応づけて記録する(STEP10
2)。次に、トランザクション管理部81は、チェック
ポイント管理部83からチェックポイント情報を生成し
た旨の通知を受け取ったか否かを判断する(STEP1
03)。STEP103において、当該通知を受け取っ
たと判断した場合には、記録したトランザクションのI
Dとプロセスとの対応関係を削除する(STEP10
4)。次に、トランザクション管理部81は、プロセス
管理部11からロールバック終了の通知を受け取ったか
否かを判断し(STEP105)、受け取ったと判断し
た場合には、記録しているトランザクションのIDとプ
ロセスとの対応関係を、ロールバック通知部15に通知
する(STEP106)。また、STEP105におい
て、通知を受け取っていないと判断した場合には、ST
EP101に戻り、上記処理を繰り返す。
【0038】図11は、ロールバック通知部の動作処理
を説明するための図である。ロールバック通知部15
は、トランザクション管理部81から無効になったトラ
ンザクションのIDの通知を受け取るまで待機する(S
TEP111)。当該IDの通知を受け取った場合に
は、端末情報管理部12を参照することにより、プロセ
ス−端末情報に基づき、プロセスを起動した端末を特定
する(STEP112)。そして、ロールバック通知部
15は、当該端末のディスプレイに、ロールバックした
トランザクションのIDを表示するため、通知を行う。
なお、図12は、当該通知のあった端末の画面表示の一
例を示す図である。同図は、ディスプレイ(画面)に、
ロールバック通知アイコン121が常時表示されてお
り、ユーザは、エディタ等の作業ウィンドウ122によ
り作業を行っていると状態を示している。このような状
況において、ロールバック通知部15により、ロールバ
ック・リスタートが発生し、無効となったトランザクシ
ョンが通知されると、例えば、PoPUpウィンドウ1
23のようにウィンドウが開いて、トランザクションが
取り消された旨の表示が行われる。
【0039】図13は、チェックポイント管理部82の
動作処理を説明するための図である。チェックポイント
管理部82は、例えば、OSのタイマ機構により決定さ
れる所定のチェックポイントタイミングでチェックポイ
ント情報を生成し、記憶装置14に記憶するとともに
(STEP131)、トランザクション管理部81にそ
の旨を通知する(STEP132)。
【0040】本実施形態によれば、ロールバック・リス
タート処理が行なわれた場合に、その処理結果だけでな
く、データベースシステムにおいて、当該ロールバック
・リスタートにより無効になったトランザクションのI
Dについても通知、表示されるので、ユーザはその事実
を知ることができる。
【0041】[第3の実施形態]図14は、第3の実施
形態に係る計算機システムの構成を示す図である。本実
施形態では、ユーザの入力操作(ユーザアクション)
と、その操作に対するプロセスの対応関係を記録してお
き、ロールバック・リスタート処理が行われた場合に、
その対応関係を端末に通知することを特徴とする。
【0042】同図において、ユーザアクション管理部1
41は、ユーザの入力操作と、その操作が行われたプロ
セスの対応関係を記録し、次回のチェックポイントまで
保存する。そして、ロールバックが完了した旨の通知を
受け取ると、保存しているユーザアクションとプロセス
との対応関係をロールバック通知部へ通知する。
【0043】ここで、ユーザアクションとは、プロセス
からの入力要求やプロセスに対する制御命令等がある。
入力要求としては、例えば、入力フィールドにキーボー
ド等から直接的にデータを入力するような場合があげら
れ、制御命令としては、例えば、ウィンドウの移動操作
等があげられる。このようなユーザアクションは、所定
のフォーマットで、ユーザアクション管理部141の管
理の下、メモリ等に記録される。
【0044】ロールバック通知部15は、無効になった
入力操作とプロセスとの対応関係をユーザアクション管
理部141から受け取ると、端末情報管理部12に保存
されているプロセス−端末情報を参照することにより、
プロセスを起動した端末を特定し、当該端末にプロセス
のロールバックにより無効になった入力操作をディスプ
レイに表示するよう、通知を行う。
【0045】図15は、ユーザアクション管理部141
の動作処理を説明するための図である。ユーザアクショ
ン管理部141は、実行中のプロセスについて、ユーザ
の入力操作をトレースし、入力操作とその操作が行われ
たプロセスとの対応関係を記録する(STEP15
1)。次に、ユーザアクション管理部141は、チェッ
クポイント管理部142からチェックポイント情報を生
成した旨の通知を受け取ったか否かを判断する(STE
P152)。STEP152において、当該通知を受け
取ったと判断した場合には、記録されている入力操作と
プロセスとの対応関係を削除する(STEP153)。
【0046】記録を削除した後、または、STEP15
2において通知を受け取っていないと判断された場合に
は、ユーザアクション管理部141は、プロセス管理部
からロールバックが完了した旨の通知があったか否かを
判断する(STEP154)。STEP154におい
て、当該通知があったと判断された場合には、入力操作
とプロセスとの対応関係をロールバック通知部15に通
知する(STEP155)。つまり、記録されている入
力操作は、ロールバックにより無効になったものであ
る。
【0047】図16は、ロールバック通知部15の動作
処理を説明するための図である。ロールバック通知部1
5は、無効になった入力操作とプロセスとの対応関係を
ユーザアクション管理部141から通知されるまで待機
する(STEP161)。ロールバック通知部15は、
当該通知があったと判断した場合には、端末情報管理部
12に保存されているプロセス−端末情報を参照するこ
とにより、当該プロセスを起動した端末を特定し(ST
EP162)、その端末に対してプロセスのロールバッ
クにより無効になった入力操作を表示するように通知す
る(STEP163)。
【0048】図17は、当該通知のあった端末の画面表
示の一例を示す図である。同図は、ディスプレイ(画
面)に、ロールバック通知アイコン171が常時表示さ
れており、ユーザは、エディタ等の作業ウィンドウ17
2により作業を行っている状態を示している。このよう
な状況において、ロールバック通知部15により、ロー
ルバック・リスタートが発生し、無効となったトランザ
クションが通知されると、例えば、PoPUpウィンド
ウ173のようにウィンドウが開いて、入力操作による
データが取り消された旨の表示が行われる。同図に示す
ように、ユーザアクションは、入力されたデータのほ
か、制御命令等も表示するようにしてもよい。
【0049】以上のように本実施形態によれば、例え
ば、ウィンドウシステム等のインタラクティブな環境に
おいて、ロールバック・リスタート処理が行なわれた場
合に、当該ロールバック・リスタート処理により無効に
なった入力操作が通知されるので、ユーザはその内容を
知ることができるようになる。
【0050】
【発明の効果】本発明によれば、計算機に障害が発生し
た場合、分散チェックポイント・リスタート方法におい
て、プロセスのロールバック・リスタート処理が行なわ
れる際、当該プロセスがロールバックしたことをユーザ
ーが知ることが可能となる。
【0051】また、データベースシステムの場合は、プ
ロセスのロールバックにより無効になったトランザクシ
ョンを知ることが可能となる。さらに、ウィンドウシス
テム等の環境において、ユーザーの入力操作のうち、プ
ロセスのロールバック・リスタート処理によって無効に
なった入力操作を知ることが可能となる。
【図面の簡単な説明】
【図1】 第1の実施形態に係る計算機システムの構成
を示す図。
【図2】 プロセス−端末情報の一例を示す図。
【図3】 プロセス管理部の動作処理を説明するための
図。
【図4】 端末情報管理部の動作処理を説明するための
図。
【図5】 ロールバック通知部の動作処理を説明するた
めの図。
【図6】 通知のあった端末の画面表示の一例を示す
図。
【図7】 通知のあった端末の画面表示の他の例を示す
図。
【図8】 第2の実施形態に係る計算機システムの構成
を示す図。
【図9】 プロセス管理部の動作処理を説明するための
図。
【図10】 トランザクション管理部の動作処理を説明
するための図。
【図11】 ロールバック通知部の動作処理を説明する
ための図。
【図12】 通知のあった端末の画面表示の一例を示す
図。
【図13】 チェックポイント管理部の動作処理を説明
するための図。
【図14】 第3の実施形態に係る計算機システムの構
成を示す図。
【図15】 ユーザアクション管理部の動作処理を説明
するための図。
【図16】 ロールバック通知部の動作処理を説明する
ための図。
【図17】 通知のあった端末の画面表示の一例を示す
図。
【符号の説明】
1…計算機 11…プロセス管理部 12…端末情報管理部 13…チェックポイント管理部 14…記憶装置 15…ロールバック通知部 81…トランザクション管理部 141…ユーザアクション管理部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 金井 達徳 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝 研究開発センター内 (56)参考文献 特開 昭60−252964(JP,A) 特開 平9−34762(JP,A) 特開 昭63−24347(JP,A) 特開 平2−51740(JP,A) 特開 平5−67011(JP,A) 白木原、外2名著,”高信頼化ミドル ウェア”ARTEMIS”の設計と実 装”,情報処理学会研究報告,日本, (社)情報処理学会,1997年 2月27 日,第97巻、第20号,p.183−188 (58)調査した分野(Int.Cl.7,DB名) G06F 15/00 G06F 11/32 G06F 12/00

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の端末とネットワークを介して接続さ
    れ、各端末からの要求によりプロセスを実行する計算機
    であって、 記憶装置と、 実行中のプロセスについて、所定のチェックポイントタ
    イミングでチェックポイント情報を生成し、前記記憶装
    置へ記憶するチェックポイント管理手段と、 各端末からのプロセスの起動要求により要求されたプロ
    セスを起動するとともに、起動したプロセスと要求を行
    った端末との対応付けを通知するプロセス起動手段と、 前記プロセス起動手段からの通知の内容を保持する端末
    情報管理手段と、 実行中のプロセスの障害発生を検出すると、前記記憶装
    置に記憶されるチェックポイント情報に従って該プロセ
    スのロールバック・リスタート処理を行い、該ロールバ
    ック・リスタート処理の完了するとその旨の通知を行う
    ロールバック・リスタート手段と、 前記ロールバック・リスタート手段からの、ロールバッ
    ク・リスタート処理の完了の通知を受け、前記端末情報
    管理手段を参照し、ロールバック・リスタート処理され
    たプロセスの起動要求を行った端末を特定し、その特定
    された端末へロールバックが行われたことを示す情報を
    通知するロールバック通知手段とを備えたことを特徴と
    する計算機。
  2. 【請求項2】トランザクションがコミットされた場合
    に、該トランザクションのIDとそのトランザクション
    を実行したプロセスを示す情報とを対応付けて、次のチ
    ェックポイントタイミングまで保持するものであって、
    前記ロールバック・リスタート手段からの、ロールバッ
    ク・リスタート処理の完了の通知を受けると、保持して
    いる該トランザクションのIDとプロセスを示す情報と
    を前記ロールバック通知手段へ通知を行うトランザクシ
    ョン管理手段を更に備え、 前記ロールバック通知手段は、該トランザクション管理
    手段からの該トランザクションのIDと該プロセスを示
    す情報との通知を受け、前記端末情報管理手段を参照し
    て端末を特定し、その特定された端末へロールバックし
    たトランザクションのIDを通知するようにしたことを
    特徴とする請求項1記載の計算機。
  3. 【請求項3】ユーザの入力操作があった場合に、該入力
    操作の内容と該入力操作が行われたプロセスを示す情報
    とを対応付けて、次のチェックポイントタイミングまで
    保持するものであって、前記ロールバック・リスタート
    手段からの、ロールバック・リスタート処理の完了の通
    知を受けると、保持している該入力操作の内容と該プロ
    セスを示す情報とを前記ロールバック通知手段へ通知を
    行うユーザアクション管理手段を更に備え、 前記ロールバック通知手段は、該ユーザアクション管理
    手段からの該入力操作の内容と該プロセスを示す情報と
    の通知を受け、前記端末情報管理手段を参照して端末を
    特定し、その特定された端末へ該入力操作の内容を無効
    になった入力操作として通知するようにしたことを特徴
    とする請求項1記載の計算機。
JP08028297A 1997-03-31 1997-03-31 計算機 Expired - Fee Related JP3516428B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08028297A JP3516428B2 (ja) 1997-03-31 1997-03-31 計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08028297A JP3516428B2 (ja) 1997-03-31 1997-03-31 計算機

Publications (2)

Publication Number Publication Date
JPH10275133A JPH10275133A (ja) 1998-10-13
JP3516428B2 true JP3516428B2 (ja) 2004-04-05

Family

ID=13713928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08028297A Expired - Fee Related JP3516428B2 (ja) 1997-03-31 1997-03-31 計算機

Country Status (1)

Country Link
JP (1) JP3516428B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169515A (ja) * 2008-01-11 2009-07-30 Denso Corp コンピュータシステム及びシステム回復装置
WO2011080910A2 (en) 2010-01-04 2011-07-07 Nec Corporation Method, distributed system and computer program for failure recovery

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
白木原、外2名著,"高信頼化ミドルウェア"ARTEMIS"の設計と実装",情報処理学会研究報告,日本,(社)情報処理学会,1997年 2月27日,第97巻、第20号,p.183−188

Also Published As

Publication number Publication date
JPH10275133A (ja) 1998-10-13

Similar Documents

Publication Publication Date Title
JP3072048B2 (ja) 計算機システムおよび計算機システムのソフトウェア故障回復方法
JP4321705B2 (ja) スナップショットの取得を制御するための装置及び記憶システム
JP3675802B2 (ja) 計算の状態を再構成する方法ならびにシステム
JP3253883B2 (ja) プロセスリスタート方法及びプロセス監視装置
US7516361B2 (en) Method for automatic checkpoint of system and application software
US8965929B2 (en) Manipulating electronic backups
US7636741B2 (en) Online page restore from a database mirror
US10042695B1 (en) Program exception recovery
JP4363676B2 (ja) コンピュータシステム
US6708288B1 (en) Compiler-based checkpointing for support of error recovery
US9996378B2 (en) Managing a check-point based high-availability backup virtual machine
US20060123211A1 (en) Method for optimizing a snapshot operation on a file basis
US5734896A (en) Recovery of a remotely initiated distributed prepared transaction by status report from a second database to an external coordinator
JP3094888B2 (ja) 採番機構、データ整合性確認機構、トランザクション再実行機構及び分散トランザクション処理システム
US20120117421A1 (en) System and method for remote recovery with checkpoints and intention logs
US20100287407A1 (en) Computer Storage Synchronization and Backup System
Le et al. Applying microreboot to system software
JP3516428B2 (ja) 計算機
Smith et al. Surviving peripheral failures in embedded systems
JP3463020B2 (ja) ワークフロー実行方法および装置とワークフロー実行プログラムを記録した記録媒体
JPH06139087A (ja) チェックポイントリスタート方式
US5655072A (en) Method and apparatus for testing a sytem component with test checkpointing
JP3357777B2 (ja) プログラム制御システム
JP3338724B2 (ja) データベースセーブ方式
JP3437789B2 (ja) コンピュータのプログラムシステム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees