JPH09198269A - 耐故障性型コンピュータシステム及び通信処理方法 - Google Patents

耐故障性型コンピュータシステム及び通信処理方法

Info

Publication number
JPH09198269A
JPH09198269A JP8009399A JP939996A JPH09198269A JP H09198269 A JPH09198269 A JP H09198269A JP 8009399 A JP8009399 A JP 8009399A JP 939996 A JP939996 A JP 939996A JP H09198269 A JPH09198269 A JP H09198269A
Authority
JP
Japan
Prior art keywords
communication processing
communication
processing request
checkpoint
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8009399A
Other languages
English (en)
Inventor
Hideaki Hirayama
秀昭 平山
Akira Honda
亮 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8009399A priority Critical patent/JPH09198269A/ja
Publication of JPH09198269A publication Critical patent/JPH09198269A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】 【課題】コンピュータシステムのオーバヘッドを増加さ
せることなく、通信処理のレイテンシを改善することを
可能にする。 【解決手段】故障発生時にシステムをリスタートできる
ように、チェックポイントを採取しながら処理を進め、
最後のチェックポイント採取以降に発生した通信処理要
求を蓄積しておき、次のチェックポイント採取時に実行
確定して通信処理要求を実行する耐故障型コンピュータ
システムにおいて、最後のチェックポイント採取で実行
確定された通信処理要求の通信相手を保持するための最
終確定通信処理要求リスト22aと、新たに通信処理要
求が発生した時に、同通信処理要求の通信相手が最終確
定通信処理要求リスト22aに保持された通信相手に一
致するか否かを判定する制御部20と、通信相手が一致
すると判定された際に、次のチェックポイント採取の開
始を早めるチェックポイント処理部20aとを具備す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、故障発生時にシス
テムをリスタートできるように、チェックポイントを採
取しながら処理を進め、最後のチェックポイント採取以
降に発生した通信処理要求を蓄積しておき、次のチェッ
クポイント採取時に実行確定し、実行確定した通信処理
要求を実際に実行していく耐故障性型コンピュータシス
テム及び同システムに適用して好適なる通信処理方法に
関する。
【0002】
【従来の技術】従来、故障発生時にシステムをリスター
トできるように、チェックポイントを採取しながら処理
を進める耐故障性型のコンピュータシステムにおいて
は、最後のチェックポイント採取以降に実行要求された
通信処理要求を蓄積しておき、次のチェックポイント採
取時に実行確定し、実行確定した通信処理要求を、チェ
ックポイント採取後に実際に実行していく。
【0003】これは、故障が発生した場合に、コンピュ
ータシステムが直前のチェックポイントの処理に戻るた
め、故障が発生するまでに生成された情報等も全てキャ
ンセルしなければ、一貫性を保証できないためである。
【0004】図11は、こうしたタイプのコンピュータ
システムにおける、通信処理の様子を示す図である。コ
ンピュータシステムは、時刻Tn でチェックポイントを
採り終えた後、次に時刻Tn+1 でチェックポイントを採
るまでの間に要求された通信処理要求A,B,Cを、実
行することなく蓄積しておく。
【0005】蓄積された通信処理要求A,B,Cは、次
に時刻Tn+1 でチェックポイントを採る時に、実行確定
される。コンピュータシステムは、時刻Tn+1 でチェッ
クポイントを採り終えた後、通常処理が再開されると、
実行確定された通信処理要求A,B,Cを、順次、実際
に発行していく。
【0006】図12は、コンピュータシステムに故障が
発生し、蓄積された通信処理がキャンセルされる様子を
示す図である。時刻Tn でチェックポイントを採り終え
た後、次にチェックポイントを採るまでの間に要求され
た通信処理要求A,B,Cは、実行されることなく蓄積
されている。
【0007】蓄積された通信処理要求A,B,Cは、次
にチェックポイントを採る時に、実行確定され、実際に
実行されるが、次にチェックポイントを採る前に故障が
発生した場合には、蓄積している通信処理要求A,B,
Cをキャンセルする必要がある。
【0008】すなわち、時刻Tn+1 の前に故障が発生し
た場合、コンピュータシステムは、時刻Tn で採取した
チェックポイントの状態にロールバック、つまり通信処
理要求A,B,Cが要求されていない状態にしてスター
トするので、故障発生前に蓄積した通信処理要求A,
B,Cをキャンセルしてしまう。
【0009】このように、通常時では通信処理要求を蓄
積しておき、チェックポイント採取時に、実行確定させ
るタイプのコンピュータシステムにおいては、どうして
も通信処理のレイテンシが悪く、つまり通信処理要求が
あってから実際に発行されるまでに要する時間が長くか
かってしまうという問題がある。この問題を多少なりと
も緩和するために、従来は、以下の様な条件が成立した
時には、強制的にチェックポイントの採取を行なってい
た。
【0010】(1)最後チェックポイント採取後、一定
時間を経過した。 (2)蓄積された通信処理要求が、一定量を超過した。 しかし、この方法では、通常時、通信処理要求を蓄積し
ておき、チェックポイント採取時に、実行確定させるタ
イプのコンピュータシステムにおいては、送信処理のレ
イテンシの悪化を十分に防ぐことができなかった。
【0011】
【発明が解決しようとする課題】このように従来のコン
ピュータシステムにおいて実行される通信処理方法で
は、通信処理のレイテンシが悪く、また強制的にチェッ
クポイントの採取を、(1)最後チェックポイント採取
後、一定時間を経過した時、(2)蓄積された通信処理
要求が、一定量を超過した時に実行しても、送信処理の
レイテンシの悪化を十分に防ぐことができなかった。ま
た、前述した(1)(2)の条件に基づいて、チェック
ポイントを頻繁に採取することで、送信処理のレイテン
シの悪化を低減させることができるが、コンピュータシ
ステムのオーバヘッドが増加してしまうという問題があ
った。
【0012】本発明は前記のような事情を考慮してなさ
れたもので、コンピュータシステムのオーバヘッドを増
加させることなく、通信処理のレイテンシを改善するこ
とが可能な耐故障性型コンピュータシステム及び通信処
理方法を提供することを目的とする。
【0013】
【課題を解決するための手段】本発明は、故障発生時に
システムをリスタートできるように、チェックポイント
を採取しながら処理を進め、最後のチェックポイント採
取以降に発生した通信処理要求を蓄積しておき、次のチ
ェックポイント採取時に実行確定し、実行確定した通信
処理要求を実際に実行していく耐故障型コンピュータシ
ステムにおいて、最後のチェックポイント採取によっ
て、実行確定された通信処理要求の通信相手を保持する
ための最終確定通信処理要求リストと、新たに通信処理
要求が発生した時に、同通信処理要求の通信相手が、前
記最終確定通信処理要求リストに保持された通信相手に
一致するか否かを判定する制御手段と、前記制御手段に
よって通信相手が一致すると判定された際に、次のチェ
ックポイント採取の開始を早めるチェックポイント処理
手段とを具備したことを特徴とする。
【0014】これにより、同じ通信相手に対する通信処
理要求の発生頻度とチェックポイント採取の実行間隔と
の関係が判別され、チェックポイント採取に比較して通
信処理要求の発生頻度が高い場合には、チェックポイン
ト採取の開始を促進させることで、通信処理のレイテテ
ンシが改善される。
【0015】また本発明は、最後のチェックポイント採
取によって、実行確定された通信処理要求の通信相手を
保持するための最終確定通信処理要求リストと、次のチ
ェックポイント採取によって実行確定した通信処理要求
のうち、前記最終確定通信処理要求リストに保持された
通信相手と一致する通信処理要求を優先的に処理する制
御手段とを具備したことを特徴とする。
【0016】これにより、チェックポイント採取の制御
によらず、通信処理要求の実行順位を変更することで通
信処理のレイテテンシが改善される。チェックポイント
採取の実行頻度が通常と比較して増加させる必要がない
ため、システムのオーバヘッドの増加を招かない。
【0017】また本発明は、それぞれ通信処理要求に対
して遅延限界時間を付加して記録するための通信処理要
求蓄積リストと、前記通信処理要求蓄積リストに記録さ
れた通信処理要求に付加された遅延限界時間に基づい
て、通信処理要求が遅延限界時間を経過したにも関わら
ず未実行であるか否かを判別する制御手段と、前記制御
手段による判別の結果、未実行の通信処理要求がある場
合に、次のチェックポイント採取の開始を早めるチェッ
クポイント処理手段とを具備したことを特徴とする。
【0018】また、前記チェックポイント処理手段は、
CPU利用率が指示値よりも低い場合に、次のチェック
ポイント採取の開始を早めることにより、チェックポイ
ント採取を早めることでシステムのオーバヘッドの増加
を回避することができる。
【0019】また本発明は、それぞれ通信処理要求に対
して遅延限界時間を付加して記録するための通信処理要
求蓄積リストと、前記通信処理要求蓄積リストに記録さ
れた通信処理要求に付加された遅延限界時間に基づい
て、次のチェックポイント採取によって実行確定した通
信処理要求のうち、遅延限界時間の早いものを優先的に
処理する制御手段とを具備したことを特徴とする。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。本実施形態においては、図
1に示すようなシステムにおいて、コンピュータシステ
ム10間で通信を行なう場合を例にして説明する。
【0021】コンピュータシステム10は、故障発生時
にシステムをリスタートできるように、チェックポイン
トを採取しながら処理を進め、最後のチェックポイント
採取以降に発生した通信出力要求を蓄積しておき、次の
チェックポイント採取時に実行確定し、実行確定した通
信出力要求を実際に実行していく耐故障性型のコンピュ
ータシステムである。
【0022】図1に示すシステムは、複数のコンピュー
タシステム10(10−1,10−2,10−3,10
−4,…)が、ネットワーク12を介して相互に接続さ
れて構成された分散処理システムである。
【0023】図2は図1中におけるコンピュータシステ
ム10の機能構成を示すブロック図である。図2に示す
ように、コンピュータシステム10は、制御部20、記
憶部22、及び通信処理部24が設けられている。
【0024】制御部20は、通信処理制御を含むコンピ
ュータシステム10の全体の制御を司るもので、例えば
CPUにおいてOS(オペレーティングシステム)を実
行することによって実現される。制御部20は、通信処
理部24からの通信処理要求を、記憶部22に設けられ
る各リスト22a〜22cを用いて制御する。
【0025】制御部20には、チェックポイント処理部
20aが設けられている。チェックポイント処理部20
aは、システムにおけるチェックポイント採取を、予め
設定された所定の条件に基づいて制御する。また、制御
部20は、通信処理部24の他、各種処理を実行するた
めに要するCPUに対する負担を示すCPU利用率20
bを管理している。
【0026】記憶部22は、制御部20による制御のも
とで、通信処理を含む各種処理を実行する際に、各種デ
ータを格納するためのものである。記憶部22には、通
信処理部24からの通信処理要求に対する通信処理を制
御するために、通信処理要求蓄積リスト22a、通信処
理要求確定リスト22b、及び最終確定通信処理要求リ
スト22cが設けられる。
【0027】通信処理要求蓄積リスト22aは、最後の
チェックポイント採取以降に発生した蓄積通信処理部2
4からの通信出力要求を蓄積するために用いられる。通
信処理要求確定リスト22bは、通信処理要求蓄積リス
ト22aに格納された通信処理要求で、チェックポイン
ト採取によって実行が確定された通信処理要求を蓄積す
るために用いられる。最終確定通信処理要求リスト22
cは、最後のチェックポイント採取によって実行確定さ
れた通信処理要求のみを蓄積するために用いられる。
【0028】通信処理部24は、他のコンピュータシス
テムとの間の通信の要求(通信処理要求)を発生するも
ので、例えばCPUにおいて通信用アプリケーションプ
ログラムを実行することによって実現される。通信処理
部24は、特定のプロトコルに基づいて通信を行なう。
【0029】次に、本発明の第1実施形態の動作につい
て、図3に示すフローチャート、及び図4に示す通信処
理要求に対する操作を説明するための図を用いて説明す
る。まず、通信処理部24が、通信相手をJ(コンピュ
ータシステムを示す)とする通信処理要求を発生したも
のとする。制御部20は、通信処理部24からの通信処
理要求を通信処理要求蓄積リスト22aに接続する(ス
テップA1)。
【0030】また制御部20は、通信処理要求蓄積リス
ト22aに接続した通信処理要求と同じ通信相手Jに対
する通信処理要求が、前回のチェックポイント採取時に
存在していなかったか否かを調べるために、最終確定通
信処理要求リスト22cを検索する(ステップA2)。
【0031】該当する通信処理要求が最終確定通信処理
要求リスト22cに存在していなかった場合、制御部2
0は、通信処理要求の処理を終える。一方、該当する通
信処理要求が存在していた場合には、制御部20は、現
在のCPU利用率20bが、ある指定値より低いか否か
を調べる(ステップA3)。
【0032】ここで、CPU利用率20bが指定値より
低くなかった場合には、制御部20は、それで通信処理
要求の処理を終える。もし低かった場合には、制御部2
0は、チェックポイント処理部20aによってチェック
ポイントの採取を促進する(ステップA4)。
【0033】ステップA2において制御部20によって
検索される最終確定通信処理要求リスト22cを、どの
ようにして作成するかについて説明する。通信処理要求
蓄積リスト22aに接続されていた通信処理要求は、図
4に示すように、チェックポイント採取時に、通信処理
要求蓄積リスト22aから通信処理要求確定リスト22
bへと移動され実行確定される。
【0034】図4に示す例では通信処理要求蓄積リスト
22aに記録されていた通信処理要求D,E,F(D,
E,Fは通信相手を示す)が実行確定され、通信処理要
求確定リスト22bに記録されている。従って、通信処
理要求確定リスト22bには、実行確定された全ての処
理要求が記録される。
【0035】一方、通信処理要求蓄積リスト22aから
通信処理要求確定リスト22bに通信処理要求が移動さ
れる際に、実行確定された通信処理要求が、その通信相
手と共に最終確定通信処理要求リスト22cに記録され
る。
【0036】図4に示す例では、通信処理要求確定リス
ト22bに新たに追加して記録された通信処理要求D,
E,Fが、最終確定通信処理要求リスト22cに記録さ
れる。従って、最終確定通信処理要求リスト22cに
は、最後に採取されたチェックポイントによって実行確
定された通信処理要求のみが記録される。
【0037】図5には最終確定通信処理要求リスト22
cのデータ構造を示している。図5に示すように、前回
のチェックポイントで実行確定された通信処理要求(R
1,R2,…)が、その通信相手を示すデータ(各コン
ピュータシステムに付与された名前、「kawasaki」「yo
kohama」…)と対応づけられて記録されている。
【0038】ここで、通信処理要求と同じ通信相手Jに
対する通信処理要求が、前回のチェックポイント採取時
に存在していなかったか否か(最終確定通信処理要求リ
スト22cに記録されているか否か)を調べる理由につ
いて説明する。
【0039】図6に示すように、時刻Tn-1 にチェック
ポイントが採取された後に発生した通信相手Jに対する
通信処理要求は、チェックポイント採取時(時刻Tn )
に実行確定されて発行される。最終確定通信処理要求リ
スト22cには、通信相手Jに対する通信処理要求が記
録される。
【0040】さらに、同じ送信相手Jに対する通信処理
要求が次のチェックポイント採取時(Tn+1 )以前に発
生した場合、この通信処理要求に応じて最終確定通信処
理要求リスト22cを検索した結果、同じ通信相手Jに
対する通信処理要求が記録されていることが判別され
る。
【0041】この場合、図6に示すように、通信相手J
に対する通信処理要求の発生が、現実のチェックポイン
ト採取の実行間隔より短いことになる。従って、通信処
理のレイテンシを考えると、チェックポイント間隔をも
っと短くすることによって、レイテンシを改善すること
ができる。
【0042】ただし、チェックポイント採取の実行間隔
を短くするということは、コンピュータシステムのスル
ープットを考えると、オーバヘッドの増加を招くため好
ましくない。しかし、CPU利用率20bが低い場合に
は、オーバヘッドが増加しても大きな問題は発生しな
い。
【0043】従って、通信処理要求と同じ通信相手Jに
対する通信処理要求が、前回のチェックポイント採取時
に存在していた場合で、CPU利用率が低い場合には、
チェックポイントの採取を促進すれことによって、スル
ープットを悪化させることなく、通信処理のレイテンシ
を改善することができる。
【0044】また、チェックポイントの採取が促進され
たとしても、それによって、あまりに短い間隔でチェッ
クポイントが採られてしまうと好ましくないのため、チ
ェックポイントの採取が促進されたとしても、前回のチ
ェックポイント採取時点から、ある指定時間を経過しな
ければ、チェックポイントの採取は行なわれないように
しておく。また、場合によって、例えば頻繁に発生する
通信処理要求ではないが、通信処理要求が発生した場合
には直ちに実行する必要がある場合には、指定値を0に
セットしておくことも可能である。
【0045】次に、本発明の第2実施形態の動作につい
て、図7に示す通信処理要求に対する操作を説明するた
めの図を用いて説明する。まず、通信処理部24が、通
信相手をJ(コンピュータシステムを示す)とする通信
処理要求を発生したものとする。制御部20は、通信処
理部24からの通信処理要求を通信処理要求蓄積リスト
22aに接続する。
【0046】制御部20は、通信処理要求を通信処理要
求蓄積リスト22aに蓄積する際に、その通信処理要求
に対して、遅延限界時間を示す情報を付加する。遅延限
界時間は、通信処理のタイプ毎、例えば通信相手との間
で通信を行なう際の通信プロトコルの違いに応じて、あ
るいは通信相手毎、例えば通信相手に対する処理要求の
処理内容の違いに応じて設定する。
【0047】制御部20は、一定時間間隔毎、あるいは
特定のイベント発生時に通信処理要求蓄積リスト22a
に蓄積された通信処理要求の中に、それぞれに付加され
た遅延限界時間を経過したものが存在しないかどうか監
視する。
【0048】ここで、該当する通信処理要求が存在した
場合、制御部20は、チェックポイント処理部20aに
よってチェックポイントの採取を促進する。また、前述
した第1実施形態の場合と同様にして、制御部20は、
CPU利用率20bと指定値とを比較して、CPU利用
率20bが指定値より低い場合に、チェックポイントの
採取を促進するようにしても良い。
【0049】図8には通信処理要求蓄積リスト20aの
データ構造を示している。図8に示すように、各通信処
理要求(R1,R2,…)に、それぞれの遅延限界時間
が付加されて記録されている。
【0050】このようにして、各通信処理要求に対し
て、通信処理要求に応じた遅延限界時間を付加し、実際
の時間経過に応じて遅延限界時間を越えた通信処理要求
が存在する場合に、チェックポイントの採取を促進させ
ることで、オーバベッドを増加させることなくレイテン
シを改善することができる。
【0051】なお、前述した第1実施形態、第2実施形
態では、何れも早く実行すべき通信処理要求が存在する
場合に、チェックポイントの採取を促進させることで、
通信処理のレイテンシを改善させている。早く実行すべ
き通信処理要求とは、これまで記述してきたように、以
下の様な通信処理要求(1)(2)である。
【0052】(1)前回のチェックポイント採取時に実
行確定された通信処理要求の通信相手と同じ相手に対す
る通信処理要求。 (2)設定された遅延限界時間を経過した通信処理要
求。
【0053】次に、通信処理要求(1)(2)に対して
チェックポイントの採取を促進させる第1実施形態、第
2実施形態とは異なる第3の実施形態について説明す
る。図9は第3実施形態における動作を示すフローチャ
ートである。
【0054】まず、通信処理部24が、通信相手をJ
(コンピュータシステムを示す)とする通信処理要求を
発生したものとする。制御部20は、通信処理部24か
らの通信処理要求を通信処理要求蓄積リスト22aに接
続する(ステップB1)。
【0055】また制御部20は、通信処理要求蓄積リス
ト22aに接続した通信処理要求と同じ通信相手Jに対
する通信処理要求が、前回のチェックポイント採取時に
存在していなかったか否かを調べるために、最終確定通
信処理要求リスト22cを検索する(ステップB2)。
【0056】該当する通信処理要求が最終確定通信処理
要求リスト22cに存在していなかった場合、制御部2
0は、通信処理要求の処理を終える。一方、該当する通
信処理要求が存在していた場合には、制御部20は、通
信処理要求蓄積リスト22aに接続した通信処理要求の
実行順位を高めて記録する(ステップB3)。
【0057】このようにして、通信処理要求(1)
(2)が存在する場合に、チェックポイントを採取する
のではなく、該当する通信処理要求の実行順位を高める
ことによってレイテンシを改善する。
【0058】さらに、第2実施形態と同様にして、制御
部20は、通信処理要求蓄積リスト22aに通信処理要
求を記録する際に(ステップB1)、各通信処理要求毎
に遅延限界時間を付加するようにしても良い。
【0059】すなわち、制御部20は、通信処理部24
から通信処理要求を受けた際に、図9に示す処理を実行
すると共に、一定時間間隔毎、あるいは特定のイベント
発生時に通信処理要求蓄積リスト22aに蓄積された通
信処理要求の中に、それぞれに付加された遅延限界時間
を経過したものが存在しないかどうか検査する。ここ
で、該当する通信処理要求が存在した場合には、制御部
20は、該当する通信処理要求の実行順位を高める。
【0060】図10にはチェックポイントの採取を促進
させる方法と、通信処理要求の実行順位を変更する方法
を併用する場合の動作を説明するための例を示してい
る。図10に示すように、時刻Tn-1 にチェックポイン
トが採取された後に通信相手A,D,Eに対する通信処
理要求が発生し、チェックポイント採取時(時刻Tn )
に実行確定されて発行されたものとする。最終確定通信
処理要求リスト22cには、通信相手A,D,Eに対す
る通信処理要求が記録される。
【0061】さらに、次のチェックポイント採取時(T
n+1 )以前に、同じ送信相手A,D,Eを含む通信処理
要求A,B,C,D,E,Fが、それぞれの通信相手に
対して順次に発生したものとする。制御部20は、各通
信処理要求A,B,C,D,E,Fに対して、それぞれ
の通信処理のタイプ毎、あるいは通信処理相手毎に応じ
た遅延限界時間を付加して通信処理要求蓄積リスト22
aに記録する。
【0062】この際、制御部20は、各通信処理要求
A,B,C,D,E,Fに応じて最終確定通信処理要求
リスト22cを検索する。この結果、制御部20は、通
信相手A,D,Eに対する通信処理要求が記録されてい
ることを判別する。
【0063】このため、制御部20は、通信処理要求蓄
積リスト22aに記録されている通信相手A,D,Eに
対する通信処理要求の実行順位を上位にする。従って、
通信処理要求蓄積リスト22aには、通信処理要求A,
D,E,B,C,Fの順に接続されることになる。
【0064】さらに、制御部20は、各通信処理要求に
付加された遅延限界時間をもとに、遅延限界時間を経過
したものが存在しないかどうかを監視し、該当する通信
処理要求が判別された場合には、その通信処理要求を優
先して実行順位を変更する。
【0065】このようにして、チェックポイントの採取
を促進させる方法と、通信処理要求の実行順位を変更す
る方法を併用することで、より適確にレイテンシの改善
を図ることができる。
【0066】なお、チェックポイント採取を実行するた
めの条件は、前述した本発明によって得られる採取条件
の他に、以下に示す採取条件(1)(2)を加えること
も可能である。
【0067】(1)最終チェックポイント採取後、一定
時間を経過した場合。 (2)蓄積された通信処理要求が、一定量を超過した場
合。 なお、採取条件(2)は、システム全体で蓄積された通
信処理要求が、一定量を超過した時のものなので、さら
に以下の条件(3)も加えておく。
【0068】(3)蓄積された「特定の通信相手に対す
る通信処理要求」が一定量を超過した場合。 なお、前述した各実施形態においては、通信処理部24
が発生した全ての通信処理要求を一旦、通信処理要求蓄
積リスト22aに蓄積する場合の処理の流れについて説
明してきたが、受信処理は必ずしも一旦蓄積して、チェ
ックポイントを採取するタイミングを待って実行する必
要が無い場合もある。この場合は、送信処理のみを一旦
蓄積して、チェックポイントのタイミングを待って実行
する。本発明は、勿論、このように場合に適用すること
もできる。
【0069】また、本発明は、特定の通信処理装置のみ
に適用したり、特定のプロトコルに基づく通信のみに適
用したり、特定の通信相手のみに適用したりして、それ
以外の通信処理装置あるいは通信プロトコルあるいは通
信相手には、従来の手法を用いたり、あるいは別の手法
を用いたりして、組み合わせて適用することもできる。
【0070】また、本発明は、コンピュータシステム間
での通信処理のみにしか適用できない方法ではなく、外
部記憶装置(ハードディスク装置等)、プリンタ装置等
のI/O装置にも適用することができる。
【0071】
【発明の効果】以上詳述したように本発明によれば、通
常時、通信処理要求を蓄積しておき、チェックポイント
採取時に、実行確定させるタイプのコンピュータシステ
ムであっても、コンピュータシステムのオーバヘッドを
増加させることなく、通信処理のレイテンシを改善する
ことができるものである。
【図面の簡単な説明】
【図1】本発明の実施形態における通信処理方法を適用
するシステムの構成の一例を示すブロック図。
【図2】本実施形態におけるコンピュータシステム10
の機能構成を示すブロック図。
【図3】本発明の第1実施形態の動作を説明するための
フローチャート。
【図4】本発明の第1実施形態における通信処理要求に
対する操作を説明するための図。
【図5】第1実施形態における最終確定通信処理要求リ
スト22cのデータ構造を示す図。
【図6】第1実施形態の動作を説明するための通信処理
要求のタイミングを示す図。
【図7】本発明の第2実施形態における通信処理要求に
対する操作を説明するための図。
【図8】本発明の第2実施形態における通信処理要求蓄
積リスト20aのデータ構造を示す図。
【図9】本発明の第3実施形態における動作を示すフロ
ーチャート。
【図10】本発明の第1実施形態によるチェックポイン
トの採取を促進させる方法と第2実施形態による通信処
理要求の実行順位を変更する方法を併用する場合の動作
を説明するための例を示す図。
【図11】耐故障性型コンピュータシステムにおける通
信処理の様子を示す図。
【図12】耐故障性型コンピュータシステムに故障が発
生し、蓄積された通信処理がキャンセルされる様子を示
す図。
【符号の説明】
10…コンピュータシステム 20…制御部 20a…チェックポイント処理部 20b…CPU利用率 22…記憶部 22a…通信処理要求蓄積リスト 22b…通信処理要求確定リスト 22c…最終確定通信処理要求リスト 24…通信処理部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていく耐故障型コンピュータシステムにおいて、 最後のチェックポイント採取によって、実行確定された
    通信処理要求の通信相手を保持するための最終確定通信
    処理要求リストと、 新たに通信処理要求が発生した時に、同通信処理要求の
    通信相手が、前記最終確定通信処理要求リストに保持さ
    れた通信相手に一致するか否かを判定する制御手段と、 前記制御手段によって通信相手が一致すると判定された
    際に、次のチェックポイント採取の開始を早めるチェッ
    クポイント処理手段とを具備したことを特徴とする耐故
    障型コンピュータシステム。
  2. 【請求項2】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていく耐故障型コンピュータシステムにおいて、 最後のチェックポイント採取によって、実行確定された
    通信処理要求の通信相手を保持するための最終確定通信
    処理要求リストと、 次のチェックポイント採取によって実行確定した通信処
    理要求のうち、前記最終確定通信処理要求リストに保持
    された通信相手と一致する通信処理要求を優先的に処理
    する制御手段とを具備したことを特徴とする耐故障型コ
    ンピュータシステム。
  3. 【請求項3】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていく耐故障型コンピュータシステムにおいて、 それぞれ通信処理要求に対して遅延限界時間を付加して
    記録するための通信処理要求蓄積リストと、 前記通信処理要求蓄積リストに記録された通信処理要求
    に付加された遅延限界時間に基づいて、通信処理要求が
    遅延限界時間を経過したにも関わらず未実行であるか否
    かを判別する制御手段と、 前記制御手段による判別の結果、未実行の通信処理要求
    がある場合に、次のチェックポイント採取の開始を早め
    るチェックポイント処理手段とを具備したことを特徴と
    する耐故障型コンピュータシステム。
  4. 【請求項4】 前記チェックポイント処理手段は、CP
    U利用率が指示値よりも低い場合に、次のチェックポイ
    ント採取の開始を早めることを特徴とする請求項1また
    は請求項3記載の耐故障型コンピュータシステム。
  5. 【請求項5】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていく耐故障型コンピュータシステムにおいて、 それぞれ通信処理要求に対して遅延限界時間を付加して
    記録するための通信処理要求蓄積リストと、 前記通信処理要求蓄積リストに記録された通信処理要求
    に付加された遅延限界時間に基づいて、次のチェックポ
    イント採取によって実行確定した通信処理要求のうち、
    遅延限界時間の早いものを優先的に処理する制御手段と
    を具備したことを特徴とする耐故障型コンピュータシス
    テム。
  6. 【請求項6】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていく耐故障型コンピュータシステムの通信処理方法で
    あって、 最後のチェックポイント採取によって、実行確定された
    通信処理要求の通信相手を保持し、 新たに通信処理要求が発生した時に、同通信処理要求の
    通信相手が、保持していた通信相手に一致するか否かを
    判定し、 一致する場合には次のチェックポイント採取の開始を早
    めることを特徴とする通信処理方法。
  7. 【請求項7】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていくタイプのコンピュータシステムの通信処理方法で
    あって、 最後のチェックポイント採取によって、実行確定された
    通信処理要求の通信相手を保持し、 次のチェックポイント採取によって実行確定した通信処
    理要求のうち、保持していた通信相手と一致する通信処
    理要求を優先的に処理することを特徴とした通信処理方
    法。
  8. 【請求項8】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていくタイプのコンピュータシステムの通信処理方法で
    あって、 それぞれの通信処理要求に対して遅延限界時間を付加
    し、 この付加した遅延限界時間に基づいて、通信処理要求が
    遅延限界時間を経過したにも関わらず未実行であるか否
    かを判別し、 この判別の結果、未実行の通信処理要求がある場合に、
    次のチェックポイント採取の開始を早めることを特徴と
    する通信処理方法。
  9. 【請求項9】 故障発生時にシステムをリスタートでき
    るように、チェックポイントを採取しながら処理を進
    め、最後のチェックポイント採取以降に発生した通信処
    理要求を蓄積しておき、次のチェックポイント採取時に
    実行確定し、実行確定した通信処理要求を実際に実行し
    ていくタイプのコンピュータシステムの通信処理方法で
    あって、 それぞれの通信処理要求に対して遅延限界時間を付加
    し、 この付加した遅延時間に基づいて、次のチェックポイン
    ト採取によって実行確定した通信処理要求のうち、遅延
    限界時間の早いものを優先的に処理することを特徴とし
    た通信処理方法。
JP8009399A 1996-01-23 1996-01-23 耐故障性型コンピュータシステム及び通信処理方法 Pending JPH09198269A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8009399A JPH09198269A (ja) 1996-01-23 1996-01-23 耐故障性型コンピュータシステム及び通信処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8009399A JPH09198269A (ja) 1996-01-23 1996-01-23 耐故障性型コンピュータシステム及び通信処理方法

Publications (1)

Publication Number Publication Date
JPH09198269A true JPH09198269A (ja) 1997-07-31

Family

ID=11719352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8009399A Pending JPH09198269A (ja) 1996-01-23 1996-01-23 耐故障性型コンピュータシステム及び通信処理方法

Country Status (1)

Country Link
JP (1) JPH09198269A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012517042A (ja) * 2009-02-03 2012-07-26 インターナショナル・ビジネス・マシーンズ・コーポレーション I/oを中断しないマルチサーバ・アプリケーション同期の方法、プログラム、及び、システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012517042A (ja) * 2009-02-03 2012-07-26 インターナショナル・ビジネス・マシーンズ・コーポレーション I/oを中断しないマルチサーバ・アプリケーション同期の方法、プログラム、及び、システム

Similar Documents

Publication Publication Date Title
US5065311A (en) Distributed data base system of composite subsystem type, and method fault recovery for the system
Sarin et al. Discarding obsolete information in a replicated database system
US6816860B2 (en) Database load distribution processing method and recording medium storing a database load distribution processing program
US5396613A (en) Method and system for error recovery for cascaded servers
US7055053B2 (en) System and method for failover
US7610511B2 (en) Journal migration method and data recovery management method
US7328213B2 (en) Transaction processing method, transaction control apparatus and program thereof
US20100036894A1 (en) Data synchronization method, data synchronization program, database server and database system
CN110895484A (zh) 任务调度方法及装置
CN110895487B (zh) 分布式任务调度系统
CN110895483A (zh) 任务恢复方法及装置
US20090157767A1 (en) Circular log amnesia detection
CN110895486B (zh) 分布式任务调度系统
JP2019169109A (ja) 情報処理装置、情報処理システムおよび情報処理プログラム
KR100243461B1 (ko) 프로세스 전환 장치 및 프로세스 전환 방법
US20100162112A1 (en) Reproduction processing method, computer system, and program
JP3986346B2 (ja) 処理装置、サーバ、およびプログラム
JP2010176303A (ja) バッチ処理システムおよびこれに用いる情報端末装置、バッチ処理のリカバリ方法
CN112905106B (zh) 一种数据处理方法、装置、系统、设备及存储介质
CN106776153B (zh) 作业控制方法及服务器
JPS6041160A (ja) 計算機システムの制御方式
JPH09198269A (ja) 耐故障性型コンピュータシステム及び通信処理方法
JPH11232145A (ja) ログ情報記録装置
JP3627619B2 (ja) 二相コミット回避方式およびそのプログラム記録媒体
JP2002099510A (ja) 複数トランザクション処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Effective date: 20060221

Free format text: JAPANESE INTERMEDIATE CODE: A621

A977 Report on retrieval

Effective date: 20080425

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Effective date: 20080617

Free format text: JAPANESE INTERMEDIATE CODE: A131

A02 Decision of refusal

Effective date: 20080909

Free format text: JAPANESE INTERMEDIATE CODE: A02

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081030

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Effective date: 20081114

Free format text: JAPANESE INTERMEDIATE CODE: A911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20081209

Free format text: JAPANESE INTERMEDIATE CODE: A01

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090106

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 5

Free format text: PAYMENT UNTIL: 20140116