JPH07306794A - 分散システム及び分散システムの高信頼化方法 - Google Patents

分散システム及び分散システムの高信頼化方法

Info

Publication number
JPH07306794A
JPH07306794A JP6098611A JP9861194A JPH07306794A JP H07306794 A JPH07306794 A JP H07306794A JP 6098611 A JP6098611 A JP 6098611A JP 9861194 A JP9861194 A JP 9861194A JP H07306794 A JPH07306794 A JP H07306794A
Authority
JP
Japan
Prior art keywords
processing
server
request
computer
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6098611A
Other languages
English (en)
Inventor
Toshiji Aiura
利治 相浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP6098611A priority Critical patent/JPH07306794A/ja
Publication of JPH07306794A publication Critical patent/JPH07306794A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 クライアント・サーバモデルで動作するシス
テムにおいて、サーバ計算機に障害が発生した場合で
も、クライアントプロセスの処理が停止することなく正
常に動作をつづける高信頼なクライアント・サーバシス
テムを得る。 【構成】 クライアント計算機2からの処理要求を複数
のサーバ計算機3,4,5へ送信する。サーバ計算機
3,4,5は処理結果をクライアント計算機に返送す
る。クライアントプロセス9の処理結果比較手段は得ら
れた処理結果を多数決回路により検査し正しい処理結果
を出力する。 【効果】 サーバ・プロセスの動作するサーバ計算機を
冗長化させることによって、サーバ計算機に障害が発生
しても、クライアントプロセス9へのサービスの提供が
中断されることがない。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、計算機がネットワー
クで接続された分散計算機環境で、クライアント・サー
バモデルで動作するシステムにおいて、サーバ計算機に
障害が発生した場合でもその障害を隠蔽して、冗長化さ
せた他のサーバ計算機によって処理の継続が可能な分散
システムの高信頼化方式に関するものである。
【0002】
【従来の技術】
従来例1.従来の技術の例として、ネットワークに複数
の計算機が接続されている分散計算機環境のクライアン
ト・サーバモデルがある。クライアント・サーバモデル
とは、高速な演算能力を持つ、あるいは、大容量のディ
スクなどを備えたサーバ計算機の計算資源を、複数のク
ライアント計算機からネットワークを介して利用するシ
ステム形態をいう。クライアント計算機は、サーバ計算
機の計算機資源を共有して利用するため、安価なエンジ
ニアリング・ワーク・ステーションEWSが用いられ
る。従来の汎用計算機による集中方式で同様のシステム
を構築する場合と比較すると少ない費用で実現可能とな
る。また、クライアント計算機は、ネットワークさえ設
置してある場所ならば、自由に設置場所を変更すること
が可能となり、システム設定後の構成変更にも容易に対
応できる。
【0003】図21に、クライアント・サーバモデルの
システム構成を示す。1は、通信回線である。2、9
3、94は、クライアント計算機である。3は、サーバ
計算機である。95から97は、クライアントプロセス
である。6は、サーバ・プロセスである。
【0004】クライアントプロセス95は、通信回線1
を介してサーバ・プロセス6にサービス要求を送信し、
サーバ・プロセス6の処理結果が返送されるのを待つ。
クライアントプロセス95のサービス要求を受信したサ
ーバ・プロセス6は、要求された処理を実行後、処理結
果をクライアントプロセス95に返送する。クライアン
トプロセス96、97も同様の方法で、サーバ・プロセ
ス6のサービスを受ける。
【0005】従来例2.また、データ処理の信頼性を高
めるために多数決回路を利用したプロセッサーが従来か
ら知られている。多数決回路を利用したプロセッサーは
複数のCPUからのデータを多数決回路に入力し、正し
い処理結果を選択して出力するというものである。この
様な多数決回路を利用したプロセッサーを用いることに
より、データの信頼性が向上するが、多くの場合この技
術は一つの計算機内部、あるいは、一つの基盤上(ボー
ド)、あるいは、一つのLSIの中で実現されているも
のである。
【0006】従来例3.また、高い信頼性が要求される
ような工業制御システムなどでは、2台の制御用計算機
を用意し、一方の制御用計算機に障害が発生した場合で
も、正常に動作している計算機で、障害の発生した計算
機の処理を引き継ぐ方法を用いている。このような計算
機システムはホットスタンバイ型システムなどと呼ばれ
ている。
【0007】図22に、ホットスタンバイ型システムの
構成を示す。98、99は、制御用計算機である。10
0は、制御用計算機によって制御される工場の生産ライ
ンや発電プラントなどの制御対象システムである。10
1は、制御用計算機98、99と制御対象システム10
0間で、制御データを通信するための制御用通信路であ
る。102は、制御用計算機に異常が発生した場合、そ
の異常を正常に動作しているもう一方の制御用計算機に
通知するための計算機異常高速通知装置である。103
は、2台の制御用計算機から共有して利用可能な計算機
間共有メモリ装置である。104は、2台の制御用計算
機から共有して利用可能な計算機間共有ディスク装置で
ある。105、106、107は、制御用計算機の処理
結果を入力し表示等の処理を行うクライアント計算機で
ある。108は、制御用計算機とクライアント計算機間
で、データを通信するための計算機間通信路であり、通
常LANなどが用いられる。109は、制御対象システ
ム100のデータ、あるいはクライアント105、10
6、107からの要求を入力し、処理を行い、結果を制
御対象システム100、あるいはクライアント105、
106、107へ出力する実行中の制御処理プロセスで
ある。110は、制御処理プロセス109あるいは制御
用計算機99に障害が発生した場合、制御処理プロセス
109の処理を引き継ぐために待機状態となっている制
御処理プロセスである。
【0008】制御処理プロセス109は、制御対象シス
テム100、あるいはクライアント105、106、1
07からのデータを入力すると、入力したデータとデー
タ入力元に関する情報を計算機間共有メモリ装置10
3、あるいは計算機間共有ディスク装置104に記録す
る。
【0009】制御処理プロセス109は、制御対象シス
テム100、あるいはクライアント105、106、1
07から入力したデータに対する処理を行った後、制御
対象システム100、あるいはクライアント105、1
06、107に処理結果を返送する。
【0010】制御処理プロセス109は、制御対象シス
テム100、あるいはクライアント105、106、1
07へ処理結果を返送した後、処理結果を計算機間共有
メモリ装置103、あるいは計算機間共有ディスク装置
104に記録する。
【0011】制御用計算機98が障害の発生により異常
停止した場合、計算機異常高速通知装置102によっ
て、制御用計算機98の停止が瞬時に制御用計算機99
へ通知される。
【0012】制御用計算機98の異常停止を検出した制
御処理プロセス110は、計算機間共有メモリ装置10
3、あるいは計算機間共有ディスク装置104から、停
止した制御用計算機98で動作していた制御処理プロセ
ス109の処理情報を読み込む。
【0013】制御処理プロセス109が、制御対象シス
テム100、あるいはクライアント105、106、1
07からのデータを入力した後、処理結果を出力する前
に停止した場合、制御処理プロセス110は、計算機間
共有メモリ装置103、あるいは計算機間共有ディスク
装置104から読み込んだ未処理データを処理し、制御
対象システム100、あるいはクライアント105、1
06、107に処理結果を返送する。
【0014】以上のような方式によって、2台用意した
制御用計算機のうち1台に障害が発生しても、正常に動
作している制御用計算機によって処理を継続することが
可能である。
【0015】
【発明が解決しようとする課題】従来のクライアント・
サーバシステムは、以上のように構成されているので、
サーバ・プロセスの動作するサーバ計算機に障害が発生
し、サーバ・プロセスが動作不可能になってしまった場
合、サーバ・プロセスのサービスによって処理を行なっ
ている複数のクライアントプロセス全ての処理が、継続
不可能な状態になってしまうという問題点あった。
【0016】また、従来の多数決回路を利用したプロセ
ッサーは、一つのシステムユニットやボードやLSIの
中というような限られた空間の中で実現されているもの
である。従って、この多数決回路を利用したプロセッサ
ーの考えをそのままクライアント・サーバシステムのよ
うな広範囲で、かつ、柔軟なシステムに適用することは
できない。また、クライアント・サーバシステムは、処
理要求に対して処理結果を返すという動作が基本になっ
ているのに対し、多数決回路を利用したプロセッサー
は、単に複数のCPUからの処理結果の多数決をとっ
て、正しい処理結果を出力するという一方通行の処理を
行なうのみである。従って、多数決回路を利用したプロ
セッサーのシステムを、処理要求に対して処理結果を返
すクライアント・サーバシステムに対して、応用するこ
とは出来ない。
【0017】また、ホットスタンバイ型のようなシステ
ムでは、一方の計算機の異常停止を高速に検出する必要
があるため、計算機異常高速通知装置といった特殊な装
置が必要になる。さらに、停止した計算機の処理情報を
引き継ぐため、複数の計算機から共有可能なメモリ装置
やディスク装置が必要になる。そして、制御処理プロセ
スには、処理の進行状況を共有ディスク等に書き込む処
理を追加しなければならない。ホットスタンバイ型のよ
うなシステムは、ハードウェアコストが高かった場合に
有効な方式であったが、現在ハードウェアコストの低下
は著しいものがある。また、計算機異常高速通知装置
や、複数の計算機から共有可能なメモリ装置やディスク
装置などの特殊な装置の装備は、オープン化/標準化さ
れた計算機との接続性を困難なものとしている。
【0018】この発明は、上記のような問題点を解消す
るためになされたもので、サーバ・プロセスが動作する
サーバ計算機に障害が発生しても、サーバ・プロセスの
サービスを利用するクライアントプロセスは、停止する
ことなくシステムとして正常に動作が可能となるような
高信頼なクライアント・サーバシステムを得ることを目
的としている。さらにこの発明は、システム運用後、シ
ステムの構成変更依頼があった場合でも、サーバ・プロ
セス、クライアントプロセス開発者は、システムを改修
することなく構成変更に対応可能なシステムを提供する
ものである。
【0019】
【課題を解決するための手段】この発明に係わる分散シ
ステムは、処理要求を送信してその処理結果を受信する
要求手段を有する要求計算機と、処理要求を受信して処
理要求を実行しその処理結果を送信する処理手段を有す
る処理計算機と、上記要求計算機と処理計算機を接続し
処理要求と処理結果を伝送するネットワークを備えた分
散システムにおいて、上記を処理計算機を複数備えると
ともに、上記要求計算機は複数の処理手段に対して同一
の処理要求をそれぞれ送信し複数の処理計算機の処理手
段からその処理結果を受信する送受信手段と、受信した
複数の処理結果を比較して正しい処理結果を出力する結
果比較手段を備えたことを特徴とする。
【0020】この発明に係わる分散システムは、処理要
求を送信してその処理結果を受信する要求手段を有する
要求計算機と、処理要求を受信して処理要求を実行しそ
の処理結果を送信する処理手段を有する処理計算機と、
上記要求計算機と処理計算機を接続し処理要求と処理結
果を伝送するネットワークを備えた分散システムにおい
て、上記処理計算機を複数備えるとともに、上記要求計
算機の要求手段からの処理要求を受信する要求受信手段
と、その処理要求を複数の処理計算機の処理手段に対し
てそれぞれ送信し上記複数の処理計算機の処理手段から
処理結果を受信する送受信手段と、受信した処理結果を
比較して正しい処理結果を出力する結果比較手段と、そ
の結果比較手段からの出力を要求計算機に送信する結果
送信手段を有する中継手段を備えたことを特徴とする。
【0021】上記分散システムは3台以上の処理計算機
を備え、上記結果比較手段は3台以上の処理計算機から
の処理結果を入力して多数決をとり正しい処理結果を得
ることを特徴とする。
【0022】上記複数の処理計算機は、計算機の誤りを
検出するための試験要求を受信して受信した試験要求を
実行し試験結果を送信する誤り検出手段をそれぞれ備
え、上記送受信手段は、上記複数の処理計算機の誤り検
出手段に対して試験要求をそれぞれ送信し複数の処理計
算機の誤り検出手段からその試験結果を受信するととも
に、上記結果比較手段は受信した複数の試験結果を比較
して処理計算機の異常を検出することを特徴とする。
【0023】上記の分散システムは、3台以上の処理計
算機を備え、上記結果比較手段は3以上の誤り検出手段
からの試験結果を入力して多数決をとり処理計算機の異
常を検出するを特徴とする。
【0024】上記の分散システムは、さらに、ネットワ
ークに接続され予備計算機を備え、上記結果比較手段
は、上記処理計算機を予備計算機で代替する必要が生じ
た場合、上記予備計算機を起動する予備資源起動手段を
備えたことを特徴とする。
【0025】上記の分散システムは、上記中継手段を上
記ネットワークに接続された中継計算機に備えたことを
特徴とする。
【0026】上記の分散システムは、上記中継計算機を
複数備えたことを特徴とする。
【0027】上記要求手段は、処理要求を生成する実行
プロセスと、実行プロセスと結合して上記中継手段との
インタフェースをとるインタフェース手段を備えたこと
を特徴とする。
【0028】上記処理手段は、処理結果を生成する処理
プロセスと処理プロセスと、結合して、上記中継手段と
のインタフェースをとるインタフェース手段を備えたこ
とを特徴とする。
【0029】この発明に係わる分散システムの高信頼化
方法は、以下の工程を備えたことを特徴とする。 (a)要求計算機において処理要求を発生する工程、
(b)上記処理要求を複数の処理計算機にそれぞれ送信
する工程、(c)上記複数の処理計算機において処理要
求に対する処理をそれぞれ実行する工程、(d)上記複
数の処理計算機から処理結果を要求計算機に送信する工
程、(e)要求計算機において受信した複数の処理結果
から正しい処理結果を選択して、上記処理要求に対する
する処理結果とする工程。
【0030】
【作用】この発明における分散システムは、冗長化させ
た2台以上の処理計算機を備え、要求計算機は処理計算
機に処理要求を送信し、要求計算機は返送された処理結
果を比較することにより正しい処理結果を選択する。し
たがって冗長化させた処理計算機の一方に障害が発生し
ても正常に動作している処理計算機によって処理を継続
する。
【0031】また、この発明における分散システムにお
いては、要求計算機と複数の処理計算機の間に中継手段
を備え、中継手段により要求計算機から複数の処理計算
機に対して要求を送信するとともに、複数の計算機から
受信した処理結果の中から正しい処理結果を選択して要
求計算機に返送する。したがって、中継手段を介在させ
ることにより要求計算機及び処理計算機は従来どおりの
処理を継続するだけでよく、なおかつ中継手段を介在さ
せることによりシステムの信頼性が向上する。
【0032】また、上記分散システムに3台以上の処理
計算機を備えることにより、結果比較手段は3以上の処
理結果を入力して多数決をとることができ信頼性がさら
に向上するとともに正しい処理結果を容易に選択するこ
とが可能になる。
【0033】さらに、上記分散システムにおいて、複数
の処理計算機に誤り計算手段を設け、要求計算機からの
誤り検出要求に基づき誤り検出を行なうので障害の発生
した、あるいは、障害の発生させる可能性のある処理計
算機を検出することができる。
【0034】また、誤り検出の場合も、処理計算機を3
台以上備えることにより誤り検出手段からの試験結果の
多数決をとることができ、処理計算機の異常を容易に検
出することができる。
【0035】また、処理計算機の予備計算機を備え、障
害が発生した場合に処理計算機を予備計算機で代替させ
ることにより、常に複数の処理計算機により処理が継続
できる。
【0036】さらに、前述した中継手段を独立した中継
計算機に備えることにより、要求計算機と処理計算機の
負荷を軽減するとともに、要求計算機と処理計算機の変
更を最小減に止めながら信頼性を向上させる。
【0037】さらに、中継計算機を複数備えることによ
りいずれかの中継計算機が故障した場合においても、か
ならず中継処理を継続することができる。
【0038】さらに、中継手段を備えている場合には、
従来通り処理の要求を生成する実行プロセスに対して中
継手段とのインタフェースをとるインタフェース手段を
備えることにより、中継処理を行なえ要求手段の開発を
軽減する。
【0039】同様に、従来通り処理結果を生成する処理
プロセスに対して、中継手段とのインタフェースをとる
インタフェース手段を備えることにより、処理手段の開
発負荷を軽減する。
【0040】また、この発明における分散システムの高
信頼化方法においては、要求計算機から複数の処理計算
機に対して処理要求を送信し、複数の処理計算機からの
処理結果の中から正しい処理結果を選択するため処理結
果の信頼性が向上する。
【0041】
【実施例】
実施例1.図1は、この発明の実施例1を示す図であ
り、1〜2は、上記従来と同様である。3〜5は、サー
バ・プロセスが動作するサーバ計算機である。6〜8
は、クライアントプロセスの要求を入力し処理結果を出
力するサーバ・プロセスである。9は、複数のサーバ計
算機上で動作する全てのサーバ・プロセスに要求を送信
し、サーバ・プロセスから返送された複数の処理結果に
多数決を適用し、正しい結果を得る処理結果比較手段を
備えたクライアントプロセスである。
【0042】図2は、クライアント計算機の詳細を示す
ブロック図である。クライアントプロセス9の中には、
実行プロセス191と、送信手段193と、受信手段1
94と、処理結果比較手段195が設けられている。処
理結果比較手段195の内部には、多数決回路196と
エラー情報出力手段197が設けられている。実行プロ
セス191において処理要求192が発生すると、実行
プロセス191は送信手段193に対して処理要求19
2を引き渡す。送信手段193は、通信回線1を使って
サーバ計算機に対して処理要求を送信する。この処理要
求は、複数のサーバ計算機に対してそれぞれ送信され
る。一方受信手段194は、複数のサーバ計算機からの
処理結果を受信し、複数の処理結果を多数決回路196
に送り込む。多数決回路196では、処理結果の多数決
をとり、選択された正しい結果を処理結果190として
実行プロセス191に伝える。多数決回路196におい
て、すべの処理結果が一致しない場合、あるいは、いず
れかの処理結果が一致しない場合には、これをエラー情
報としてエラー情報出力手段197に伝える。エラー情
報出力手段197は、サーバ計算機に異常があったこと
を表示装置に出力する。
【0043】次に、この実施例の動作を図1〜図3を参
照しながら説明する。図3は、クライアントプロセス9
がサーバ・プロセスのサービスを受けるため、複数のサ
ーバ・プロセスに要求を送信してから、返送された処理
結果に対して処理結果比較手段を適用し、正しい処理結
果を得るまでを示したフローチャートである。
【0044】先ずクライアントプロセス9は、サーバ・
プロセスのサービスを受けるために、図3に示すステッ
プ10を実行し、サーバ・プロセス6〜8へ要求を送信
する。要求を送信したクライアントプロセス9は、図3
に示すステップ11に進み、サーバ・プロセスの処理結
果を待つ。
【0045】クライアントプロセス9からの要求を受信
したサーバ・プロセス6〜8は、要求に対する処理を行
ない処理結果をクラアントプロセス9へ出力する。
【0046】ステップ11は、要求を送信したサーバ・
プロセス6〜8から処理結果を受信するか、もしくは、
サーバ・プロセス6〜8から処理結果が返送されなくと
も、ある一定時間が経過した場合、次の処理であるステ
ップ12へ進む。ステップ11で、サーバ・プロセス6
〜8からの処理結果を待つ時間間隔の設定は、クライア
ントプロセス9によって、サーバ・プロセス6〜8へ要
求を送信する前に決められているものとする。
【0047】ステップ12は、ステップ11が終了した
条件の判定を行なう。要求を送信したサーバ・プロセス
6〜8全てから処理結果を受信した場合、ステップ13
へ進む。要求を送信したサーバ・プロセス6〜8全てか
ら処理結果を受信する前に、一定時間が経過したためス
テップ11が終了した場合には、ステップ15へ進む。
【0048】ステップ12の条件判定によってステップ
13へ進んだ場合、ステップ13では、サーバ・プロセ
ス6〜8の出力した処理結果が等しい値であるかどうか
を比較する。サーバ・プロセス6〜8の出力した処理結
果が等しい値であったならば、ステップ14へ進む。サ
ーバ・プロセス6〜8の出力した処理結果を比較し、異
なる処理結果を出力していたサーバ・プロセスが存在し
ていた場合には、ステップ17へ進む。
【0049】ステップ13におけるサーバ・プロセス6
〜8の処理結果比較によってステップ14へ進んだ場
合、ステップ14では、サーバ・プロセス6〜8全ての
処理結果が等しい値であるため、任意のサーバ・プロセ
スの処理結果を正しいサーバ・プロセスの出力とし、サ
ーバへのサービス要求処理を終える。
【0050】ステップ12の判定によって、ステップ1
5へ進んだ場合、ステップ15では、ステップ11の待
ち時間内に処理結果を返送したサーバ・プロセスが存在
したかどうかを判定する。サーバ・プロセス6〜8のど
れからも処理結果の返送がなかった場合には、ステップ
16に進む。ステップ11の待ち時間内に、処理結果を
返送したプロセスが存在した場合には、ステップ17へ
進む。
【0051】ステップ15の判定によって、ステップ1
6へ進んだ場合、ステップ16では、サーバへの要求処
理が実行されなかったため、システムエラーとなりエラ
ー情報を出力した後サーバへのサービス要求処理を終え
る。
【0052】ステップ15の判定によって、もしくは、
ステップ13の判定によって、ステップ17へ進んだ場
合、ステップ17では、処理結果比較手段としてサーバ
・プロセス6〜8の出力した処理結果を比較し、同じ値
を出力したサーバの数が最も多いものを正しい結果とす
る多数決方式を適用し、サーバ・プロセスの処理結果と
する。次にステップ18に進む。
【0053】ステップ18では、ステップ13、ステッ
プ15で検出された、異なった処理結果を出力した、あ
るいは、処理結果を返送しなかったサーバ・プロセスが
存在したことを示すエラー情報を出力し、サーバへのサ
ービス要求処理を終える。
【0054】以上のように、この実施例はネットワーク
に複数の計算機が接続されている分散計算機環境のクラ
イアント・サーバモデルで動作するシステムにおいて、
クライアントプロセスからの要求を入力し処理結果を出
力するサーバ・プロセス、サーバ・プロセスを動作させ
る復数台のサーバ計算機、複数のサーバ・プロセスに要
求を送信するクライアントプロセス、サーバ・プロセス
から複数の処理結果を処理結果手段によって正しい処理
結果を得ることを特徴とした分散システムの高信頼化方
法について説明した。
【0055】この実施例による分散システムの高信頼化
方式は、サーバ計算機を冗長化させ、3台以上のサーバ
計算機でサーバ・プロセスを動作させる。冗長化させて
全てサーバ・プロセスに要求を送信するクライアントプ
ロセスと、サーバ・プロセスが出力した処理結果に多数
決を適用して正しい処理結果を得る処理結果比較手段と
を設けたものである。
【0056】この実施例におけるクライアントプロセス
は、冗長化させた3台以上のサーバ計算機で動作するサ
ーバ・プロセスに要求を送信し、返送されたサーバ・プ
ロセスの処理結果に対し多数決を適用することで、正し
い処理結果を得ると同時に、障害の発生したサーバ計算
機も検出する。冗長化させたサーバ計算機の1台に障害
が発生しても正常に動作しているサーバ計算機によって
サーバ・プロセスの処理を継続する。
【0057】この実施例によればサーバ計算機が冗長構
成をとっているので、1台のサーバ計算機に障害が発生
しても、他のサーバ計算機で動作しているサーバ・プロ
セスによって、クライアントプロセスからの要求に対
し、サービスを継続して提供することが可能となる。
【0058】実施例2.図4は、実施例2を示す図であ
り、1〜8は、上記実施例1と同様のものである。19
〜21は、クライアントプロセスからの試験手続き実行
命令を受け、サーバ計算機に対して浮動小数点演算、フ
ァイルアクセス等の試験手続きを実行し、試験結果を出
力する誤り検出プロセスである。22は、サーバ計算機
3〜5上で動作する全てのサーバ・プロセスに要求を送
信し、サーバ計算機3〜5上で動作する誤り検出プロセ
スへ試験手続き実行命令を送信し、サーバ・プロセス及
び誤り検出プロセスの処理結果に対して、処理結果及び
試験結果比較手段を適用し正しい結果を得るクライアン
トプロセスである。
【0059】図5は、処理結果試験結果比較手段の詳細
を示す図である。処理結果試験結果比較手段198の内
部には、処理結果多数決回路195と試験結果多数決回
路199が設けられている。受信手段194から処理結
果試験結果比較手段198に、複数の処理結果と複数の
試験結果が入力される。複数の処理結果は、処理結果多
数決回路195に入力され、多数決を取られ処理結果1
83として実行プロセス191に渡される。一方の複数
の試験結果は試験結果多数決回路199に入力され、エ
ラーがあったかどうかが判定される。処理結果多数決回
路195及び、試験結果多数決回路199のいずれかか
らエラーが検出された場合には、エラー情報出力手段1
97はエラーがあったことを表示する。
【0060】次にこの実施例の動作を図4〜6を参照し
ながら説明する。図6は、クライアントプロセス22
が、サーバ・プロセスのサービスを受けるため、サーバ
・プロセス6〜サーバ・プロセス8へ要求を送信し、か
つ、同時に誤り検出プロセス19〜21へ試験手続き実
行命令を送信してから、サーバ・プロセスから返送され
た処理結果と、誤り検出プロセスから返送された試験結
果に対して、処理結果及び試験結果比較手段を適用し、
正しい処理結果を得るまでを示したフローチャートであ
る。
【0061】先ずクライアントプロセス22は、サーバ
・プロセスのサービスを受けるために図6に示すステッ
プ23を実行し、サーバ・プロセス6〜8へサービス要
求を送信する。また、その送信と同時に誤り検出プロセ
ス19〜21へ試験手続き実行命令を送信する。要求、
及び、試験手続き実行命令を送信したクライアントプロ
セス22は、図6に示すステップ24に進み、サーバの
処理結果を待つ。
【0062】クライアントプロセス22からの要求を受
信したサーバ・プロセス6〜8は、要求に対する処理を
行ない処理結果をクライアントプロセス22へ出力す
る。また、クライアントプロセス22からの試験手続き
実行命令を受信した誤り検出プロセス19〜21は、サ
ーバ計算機に対して浮動小数点演算、ファイルアクセス
等の試験手続きを実行し、試験結果を上記要求に対する
処理結果とともにクライアントプロセス22へ出力す
る。
【0063】ステップ24は、要求を送信したサーバ・
プロセス6〜8からの処理結果と誤り検出プロセス19
〜21からの試験結果を全て受信するか、もしくは、サ
ーバ・プロセス6〜8と誤り検出プロセス19〜21か
らの処理結果が返送されなくとも、ある一定時間が経過
した場合、次の処理であるステップ25へ進む。ステッ
プ24で、サーバ・プロセス6〜8と誤り検出プロセス
19〜21からの処理結果を待つ時間間隔の設定は、ク
ライアントプロセス22によって、サーバ・プロセスと
誤り検出プロセスへ要求を送信する前に決められている
ものとする。
【0064】ステップ25は、ステップ24が終了した
条件の判定を行なう。要求を送信したサーバ・プロセス
6〜8と、誤り検出プロセス19〜21の全てから処理
結果を受信した場合、ステップ26へ進む。要求を送信
したサーバ・プロセス6〜8と誤りプロセス19〜21
の全てから処理結果を受信する前に、一定時間が経過し
たためステップ24が終了した場合には、ステップ28
へ進む。
【0065】ステップ25の条件判定によってステップ
26へ進んだ場合、ステップ26では、サーバ・プロセ
ス6〜8の出力した処理結果が、全て等しい値であり、
かつ、誤り検出プロセス9〜21の出力した試験結果が
全て等しい値であるかどうかを判定する。サーバ・プロ
セス6〜8の出力した処理結果が全て等しい値であり、
かつ、誤り検出プロセス19〜21の出力した試験結果
が全て等しい値であったならば、ステップ27へ進む。
サーバ・プロセス6〜8の出力した処理結果と誤り検出
プロセス19〜21の出力した試験結果を比較し、異な
る処理結果を出力していたサーバ・プロセスもしくは誤
り検出プロセスが存在した場合には、ステップ30へ進
む。
【0066】ステップ26におけるサーバ・プロセスと
誤り検出プロセスの処理結果比較によってステップ27
へ進んだ場合、ステップ27では、サーバ・プロセス6
〜8全ての処理結果が等しい値であるため、任意のサー
バ・プロセスの処理結果を正しいサーバ・プロセスの出
力とし、サーバへのサービス要求処理を終える。
【0067】ステップ25の判定によって、ステップ2
8へ進んだ場合、ステップ28では、ステップ24の待
ち時間内に処理結果を返送したサーバ・プロセスが存在
したかどうかを判定する。サーバ・プロセス6〜8のど
れからも処理結果の返送がなかった場合には、ステップ
29に進む。ステップ24の待ち時間内に、処理結果を
返送したサーバ・プロセスが存在した場合には、ステッ
プ30へ進む。
【0068】ステップ28の判定によって、ステップ2
9へ進んだ場合、ステップ29では、サーバ・プロセス
への要求処理が実行されなかったため、システムエラー
となりエラー情報を出力した後サーバ・プロセスへのサ
ービス要求処理を終える。
【0069】ステップ28の判定によって、もしくは、
ステップ26の判定によって、ステップ30へ進んだ場
合、ステップ30では、処理結果及び試験結果比較手段
としてサーバ・プロセス6〜8出力した処理結果を比較
する。同じ値を出力したサーバの数が最も多いものを正
しい結果とする多数決方式を適用し、サーバ・プロセス
の正しい処理結果を得る。同様に、誤り検出プロセス1
9〜21の出力した試験結果を比較する。同じ値を出力
したサーバの数が最も多いものを正しい試験結果とする
多数決方式を適用し、誤り検出プロセスの正しい試験結
果を得る。異なった試験結果を出力した誤り検出プロセ
スが存在した場合は、その誤り検出プロセスが動作して
いた計算機に障害が発生したものとする。次にステップ
31に進む。
【0070】ステップ31では、ステップ26、ステッ
プ28で検出された、異なった処理結果、試験結果を出
力した、あるいは、処理結果、試験結果を返送しなかっ
たサーバ・プロセス、誤り検出プロセスが存在したこと
を示すエラー情報を出力し、サーバへのサービス要求処
理を終える。
【0071】以上のように、この実施例においては、複
数のサーバ計算機上で動作し、計算機に対する試験手続
きを実行してその結果を出力する誤り検出プロセス、サ
ーバ・プロセスに要求と誤り検出プロセスに試験手続き
実行命令を送信し、サーバ・プロセス、誤り検出プロセ
スから返送された複数の処理結果、試験結果に対して、
多数決を適用し正しい結果を得る処理結果及び試験結果
比較手段を備えたクライアントプロセスによって、サー
バ・プロセスの処理で検出可能な障害以外のサーバ計算
機の以上を検出し、重大な障害が発生する以前にシステ
ムから障害の発性したサーバ計算機を切り離すことを特
徴とする分散システムの高信頼化方式を説明した。
【0072】すなわち、この実施例は冗長化させた3台
以上のサーバ計算機でサーバ・プロセスの他に、試験手
続きを実行する誤り検出プロセスを動作させ、冗長化さ
せた全てのサーバ・プロセスに要求を送信し、同時に全
ての誤り検出プロセスに試験手続き実行命令を送信する
クライアントプロセスと、サーバ・プロセスが出力した
処理結果、誤り検出プロセスが出力した試験結果に多数
決を適用して、正しい処理結果を得る処理結果及び試験
結果比較手段とを設けたものである。
【0073】この実施例では、サーバ・プロセスが利用
しないサーバ計算機の計算機資源を利用した処理を行う
誤り検出プロセスを同時に動作させることによって、サ
ーバ・プロセスの処理結果のみからでは得られない、サ
ーバ計算機の障害情報を検出可能とする。
【0074】したがって冗長化させたサーバ計算機で、
誤り検出プロセス動作させることで、サーバ・プロセス
の処理で使用しないサーバ計算機の計算機資源に対する
試験手続きが実施でき、サーバ計算機に発生した障害
が、サーバ・プロセスの処理結果に影響する前に、サー
バ計算機の障害をマスクすることが可能となる。
【0075】実施例3.図7は、実施例3を示す図であ
り、1〜8、19〜21は、上記実施例2と同様のもの
である。32、33は、サーバ計算機3〜5が障害によ
って異常停止した場合、異常停止したサーバ計算機に代
わってサービスを供給するサーバ・プロセスを起動する
ための予備サーバ計算機である。34、35は、サーバ
計算機3〜5の障害によってサーバ・プロセスが停止し
た場合に、サーバ・プロセスに代わってサービスを供給
する予備サーバ・プロセスである。36、37は、サー
バ計算機3〜5の障害によって、サーバ・プロセスが停
止した場合に、サーバ・プロセスに代わってサービスを
供給する予備サーバ計算機に対して、浮動小数点演算、
ファイルアクセス等の試験手続きを実行し、試験結果を
出力する予備誤り検出・プロセスである。38は、サー
バ計算機3〜5上で動作する全てのサーバ・プロセスに
要求を送信し、かつ、同時に、サーバ計算機3〜5上で
動作誤り検出プロセスへ試験手続き実行命令を送信し、
サーバ・プロセス及び誤り検出プロセスの処理結果に対
して、多数決を適用し正しい結果を得る処理結果及び試
験結果比較手段を備え、処理結果及び試験結果比較手段
によって障害の発性したサーバ計算機の存在を検出した
ならば、システムにあらかじめ用意してある予備サーバ
計算機、予備サーバ・プロセス、予備誤り検出・プロセ
スを起動する予備資源起動手段を備えたクライアントプ
ロセスである。
【0076】図8はクライアント計算機の詳細を示すブ
ロック図である。処理結果試験結果比較手段198の内
部には、予備資源起動手段400が設けられている。前
述したように処理結果試験結果比較手段198の内部に
は、エラー情報出力手段197が設けられているがエラ
ー情報出力手段は、単にエラーが有ったことを表示する
だけである。一方予備資源起動手段400はエラーが報
告されに場合に待機しているサーバ計算機(予備資源)
を起動させるものである。
【0077】次に、この実施例の動作を図7〜図10を
参照しながら説明する。図9は、サーバ計算機5に障害
が発生した場合、クライアントプロセス38の予備資源
起動手段によって予備サーバ計算機33、予備サーバ・
プロセス35、予備誤り検出・プロセス37が起動さ
れ、サーバ計算機の冗長構成数を維持したままサーバ・
プロセスがサービスを供給していることを示している。
図10は、クライアントプロセス38が、サーバ・プロ
セスのサービスを受けるため、サーバ・プロセス6〜8
へ要求を送信し、かつ、誤り検出プロセス19〜21試
験手続き実行命令を送信してから、サーバ・プロセスか
ら返送された処理結果と、誤り検出プロセスから返送さ
れた試験結果に対して、処理結果及び試験結果比較手段
を適用し、正しい処理結果を得るまでを示したフローチ
ャートである。
【0078】先ずクライアントプロセス38は、サーバ
・プロセスのサービスを受けるために、図10に示すス
テップ39を実行し、サーバ・プロセス6〜8へサービ
ス要求を、誤り検出プロセス19〜21へ試験手続き実
行命令を送信する。要求、及び、試験手続き実行命令を
送信したクライアントプロセス38は、図10に示すス
テップ40に進み、サーバの処理結果を待つ。
【0079】クライアントプロセス38からの要求を受
信したサーバ・プロセス6〜8は、要求に対する処理を
行ない処理結果をクライアントプロセス38へ出力す
る。クライアントプロセス38からの試験手続き実行命
令を受信した誤り検出プロセス19〜21は、サーバ計
算機に対して浮動小数点演算、ファイルアクセス等の試
験手続きを実行し、試験結果をクライアントプロセス3
8へ出力する。
【0080】ステップ40は、要求を送信したサーバ・
プロセス6〜8から処理結果と誤り検出プロセス19〜
21から試験結果を全て受信するか、もしくは、サーバ
・プロセス6〜8と誤り検出プロセス19〜21からの
処理結果が全て返送されなくとも、ある一定時間が経過
した場合、次の処理であるステップ41へ進む。ステッ
プ40で、サーバ・プロセス6〜8、誤り検出プロセス
19〜21から処理結果を待つ時間間隔の設定は、クラ
イアントプロセス38によって、サーバ・プロセスと誤
り検出プロセスへ要求を送信する前にきめられているも
のとする。
【0081】ステップ41は、ステップ40が終了した
条件の判定を行なう。要求を送信したサーバ・プロセス
6〜8と誤り検出プロセス19〜21の全てからの処理
結果を受信した場合ステップ42へ進む。要求を送信し
たサーバ・プロセス6〜8と誤り検出プロセス19〜2
1の全てからの処理結果を受信する前に、一定時間が経
過したためにステップ40が終了した場合には、ステッ
プ44へ進む。
【0082】ステップ41の条件判定によってステップ
42へ進んだ場合、ステップ42では、サーバ・プロセ
ス6〜8の出力した処理結果、誤り検出プロセス19〜
21の出力した試験結果が等しい値であるかどうかを比
較する。サーバ・プロセス6〜8の出力した処理結果、
誤り検出プロセス19〜21の出力した試験結果が等し
い値であったならば、ステップ43へ進む。サーバ・プ
ロセス6〜8の出力した処理結果、誤り検出プロセス1
9〜21の出力した試験結果を比較し、異なる処理結果
を出力していたサーバ・プロセス、誤り検出プロセスが
存在した場合には、ステップ48へ進む。
【0083】ステップ42におけるサーバ・プロセス、
誤り検出プロセスの処理結果比較によってステップ43
へ進んだ場合、ステップ43では、サーバ・プロセス6
〜8全ての処理結果が等しい値であるため、任意のサー
バプロセスの処理結果を正しいサーバ・プロセスの出力
とし、サーバへのサービス処理を終える。
【0084】ステップ41の判定によって、ステップ4
4へ進んだ場合、ステップ44ではステップ40の待ち
時間内に処理結果を返送したサーバ・プロセスが存在し
たかどうかを判定する。サーバ・プロセス6〜8のどれ
からも処理結果の返送がなかった場合には、ステップ4
5に進む。ステップ40の待ち時間内に、処理結果を返
送したサーバ・プロセスが存在した場合には、ステップ
48へ進む。
【0085】ステップ44の判定によって、ステップ4
5へ進んだ場合、ステップ45では、予備資源手段によ
って起動可能な未起動の予備サーバ計算機が存在するか
判定する。未起動の予備サーバ計算機が存在した場合に
は、ステップ46へ進む。全ての予備サーバ計算機が予
備資源起動手段によって起動ずみであった場合には、ス
テップへ進む。
【0086】ステップ45の判定によって、ステップ4
6へ進んだ場合、ステップ46では、予備資源起動手段
によって未起動の予備サーバ計算機、予備サーバ・プロ
セス、予備誤り検出・プロセスを起動する。起動した予
備サーバ計算機の予備サーバ・プロセスからサービスを
受けるためステップ39に戻り再度サービス要求を送信
する。
【0087】ステップ45の判定によって、ステップ4
7へ進んだ場合、ステップ47では、サーバ・プロセス
への要求処理が実行されず、予備資源起動手段によって
起動可能な予備サーバ計算機も存在しないため、システ
ムエラーとなりエラー情報を出力した後サーバ・プロセ
スへのサービス要求処理を終える。
【0088】ステップ44の判定によって、もしくは、
ステップ42の判定によって、ステップ48へ進んだ場
合、ステップ48では、処理結果及び試験結果比較手段
としてサーバ・プロセス6〜8の出力した処理結果を比
較する。同じ値を出力したサーバの数が最も多いものを
正しい結果とする多数決方式を適用し、サーバ・プロセ
スの正しい処理結果を得る。同様に、誤り検出プロセス
19〜21の出力した試験結果を比較する。同じ値を出
力したサーバの数が最も多いものを正しい試験結果とす
る多数決方式を適用し、誤り検出プロセスの正しい試験
結果を得る。異なった試験結果を出力した誤り検出プロ
セスが存在した場合には、その誤り検出プロセスが動作
していた計算機に障害が発生したものとする。次にステ
ップ49に進む。
【0089】ステップ49では、ステップ42、ステッ
プ44で検出された、異なった処理結果、試験結果を出
力した、あるいは、処理結果、試験結果を返送しなかっ
たサーバ・プロセス、誤り検出プロセスが存在したこと
を示すエラー情報を出力する。次にステップ50へ進
む。
【0090】ステップ50では、予備資源起動手段によ
って起動可能な未起動のサーバ計算機が存在するか判定
する。未起動の予備サーバ計算機が存在した場合には、
ステップ51へ進む。全ての予備サーバ計算機が予備資
源起動手段によって起動ずみであつた場合には、サーバ
へのサービス要求処理を終える。
【0091】ステップ50の判定によって、ステップ5
1へ進んだ場合、ステップ51では、予備資源起動手段
によって未起動の予備サーバ計算機、予備サーバ・プロ
セス、予備誤り検出・プロセスを起動し、サーバへのサ
ビース要求処理を終える。次にクライアントがサーバ・
プロセスのサービスを受けるため、要求をサーバへ送信
する場合、障害の発生したサーバ計算機のサーバ・プロ
セスへ要求を送信せず、予備資源起動手段によって新た
に起動した予備サーバ計算機の予備サーバ・プロセスへ
送信する。予備サーバ計算機起動した予備サーバ計算機
サーバ・プロセスからサービスを受けるためステップ3
9に戻り再度サービス要求を送信する。
【0092】以上のように、この実施例は、サーバ計算
機に障害が発生した場合に起動させる予備サーバ計算
機、予備サーバ計算機上で動作する予備サーバ・プロセ
ス、予備サーバ計算機上で動作する予備誤り検出・プロ
セス、サーバ・プロセスに要求、及び誤り検出プロセス
に試験手続き実行命令を送信し、サーバ・プロセス、誤
り検出プロセスから返送された複数の処理結果、試験結
果に対し、多数決を適用し正しい結果を得る処理結果及
び試験結果手段を備えた、また、処理結果及び試験結果
比較手段によって障害の発生したサーバ計算機を検出し
たならば、予備サーバ計算機、予備サーバ・プロセス、
予備誤り検出・プロセスを起動する予備資源起動手段を
備えたクライアントプロセスによって、障害の発生した
サーバ計算機をシステムから切り離し、さらに、起動し
た予備資源を利用することによって、障害発生後も冗長
構成をとりながらサーバ・プロセスのサービスを提供す
ることを特徴とする分散システムの高信頼化方式につい
て説明した。
【0093】この実施例は、冗長化させた3台以上のサ
ーバ計算機とそこで動作するサーバ・プロセス、誤り検
出プロセスの他に、サーバ計算機に障害が発生した場合
バックアップとして起動する予備サーバ計算機と、処理
結果及び試験結果比較手段によって障害の発生を検知し
たクライアントプロセスが、予備サーバ計算機を起動す
る予備資源起動手段とを設けたものである。
【0094】この実施例によれば、予備計算機を用意
し、サーバ計算機を常に3台以上の構成で動作させるこ
とにより、障害の発生したサーバ計算機を復旧する前
に、別のサーバ計算機に障害が発生した場合でも、クラ
イアントプロセスに多数決による正しいプロセスの処理
結果の提供を可能とする。
【0095】すなわち、冗長化させたサーバ計算機の他
に予備サーバ計算機を用意し、作動中のサーバ計算機に
障害が発生した場合、予備サーバ計算機を起動すること
で、常に複数台のサーバ計算機の冗長構成が可能とな
り、システムとしての信頼性が向上する。
【0096】実施例4.図11は、実施例4を示す図で
あり、1〜5、19〜21は、上記実施例2と同様のも
のである。52は、クライアントプロセスである。53
〜55は、サーバ・プロセスである。56、57は、フ
ォールト・トレラント・サーバである。フォールト・ト
レラント・サーバ56、57は、クライアントプロセス
52のサービス要求を入力したならば、サーバ・プロセ
ス53〜55へ転送し、同時に誤り検出プロセス19〜
21へ、試験手続き実行命令を送信する。また、サーバ
・プロセス53〜55から出力された処理結果と、誤り
検出プロセス19〜21から出力された試験結果に対し
て、処理結果及び試験結果比較手段を適用し、正しいサ
ーバ・プロセス53〜55の処理結果をクライアントプ
ロセス52へ返送する。さらに、障害の発性したサーバ
計算機を検出したならば、サーバ計算機の障害情報をユ
ーザに通知する。58、59はフォールト・トレラント
・サーバ56、57が動作する中継計算機である。
【0097】60は、フォールト・トレラント・サーバ
56、57との通信機能を提供するクライアント・アプ
リケーション・インタフェースである。クライアントプ
ロセス開発者は、クライアント・アプリケーション・イ
ンタフェース60をリンクすることでフォールト・トレ
ラント・サーバ56、57ととの通信手段を記述不要と
なる。61〜63は、フォールト・トレラント・サーバ
56、57との通信機能をもつサーバ・アプリケーショ
ン・インタフェースである。サーバ・プロセス開発者
は、サーバ・アプリケーション・インターフース61〜
63をリンクすることでフォールト・トレント・サーバ
56、57との通信手段を記述不要となる。64は、フ
ォールト・トレラント・サーバ56、57が動作してい
る中継計算機58、59の位置情報を格納しているフォ
ールト・トレラント・サーバ・テーブルである。
【0098】クライアントプロセス52がサーバ・プロ
セス53〜55に対してサービス要求を送信する場合、
クライアント・アプリケーション・インタフェース60
を呼び出す。クライアント・アプリケーシュン・インタ
ーフェス60は、フォールト・トレラント・サーバ・テ
ーブル64を参照し、フォールト・トレラント・サーバ
56、57が動作している中継計算機58、59の位置
情報を得た後、フォルト・トレラント・サーバ56、5
7のどちらか一方にサービス要求を送信する。65〜6
6は、サービスを供給しているサーバ・プロセスが動作
しているサーバ計算機の位置情報を格納しているサーバ
・テーブルである。フォールト・トレラントサーバ5
6、57は、クライアントプロセス52からのサービス
要求を入力すると、サーバ・プロセス65〜66を参照
し、サーバ・プロセス53〜55の動作しているサーバ
計算機3〜5の位置情報を得た後、サーバ・プロセス5
3〜55へ、クライアントプロセス52のサービス要求
を転送する。
【0099】図12は中継計算機58の詳細を示すブロ
ック図である。フォールト・トレラント・サーバ56に
は、クライアント計算機にから要求を受信する要求受信
手段561と、受信した要求を複数のサーバ計算機に送
信する送信手段562が、設けられており、クライアン
ト計算機からの要求を複数のサーバ計算機に中継する。
また、フォールト・トレラント・サーバ56には、複数
のサーバ計算機から処理結果を受信する受信手段563
と、処理結果試験結果比較手段564と、結果をクライ
アント計算機に送信する結果送信手段564がもうけら
れており、複数のサーバ計算機からの処理結果の中か
ら、正しい処理結果を選択しクライアント計算機に中継
する。
【0100】次に、この実施例4の動作を図11〜図1
9を参照しながら説明する。図13〜図16は、フォー
ルト・トレラント・サーバ56、57がクライアントプ
ロセス52のサービス要求を入力してから、正しい処理
結果を返送するまでの処理を示したフローチャートであ
る。図17は、フォールト・トレラント・サーバのロー
カル記憶領域に割り当てられた、クライアントプロセス
要求、サーバ・プロセスの処理結果、誤り検出プロセス
の試験結果を管理するめの要求管理リストに登録される
情報を示している。図18はフォールト・トレラント・
サーバテーブル64の内容を示している。図19はサー
バテーブル65の内容を示している。
【0101】先ずクライアントプロセス52は、サーバ
・プロセスのサービスを受けるために、クライアント・
アプリケーション・インタフェース60を呼び出す。ク
ライアント・アプリケーション・インタフェース60
は、図18に示すようなフォールト・トレラント・サー
バ・テーブル64を参照しフォールト・トレラント・サ
ーバ56、57が動作する中継計算機58、59の位置
情報を獲得し、どちらか一方の中継計算機上で動作する
フォールト・トレラント・サーバへサービス要求を送信
する(ここでは、フォールト・トレラント・サーバ56
へ要求を送信したものとする)。
【0102】フォールト・トレラント・サーバ56は、
起動されると、フォールト・トレラント・サーバ56の
処理をループさせる一定時間(例えば1秒)と、要求に
対して処理結果を待つ最大要求待ち時間(例えば10
秒)の2つの時間を設定する。そして、図13に示す処
理を開始する。ステップ67で、クライアントプロセス
52、サーバ・プロセス53〜55、誤り検出プロセス
19〜21からの入力待ち状態になる。ステップ67
は、クライアントプロセス52、誤り検出プロセス19
〜21、サーバ・プロセス53〜55からの要求、処理
結果、試験結果を入力するか、フォールト・トレラント
・サーバ56起動時に設定された一定時間が経過した場
合、次の処理であるステップ68へ進む。
【0103】ステップ68では、ステップ67が終了し
た条件がクライアントプロセスからの要求であるか判定
する。クライアントプロセスからの要求であったなら
ば、ステップ69へ進む。クライアントプロセスからの
要求以外の事象で、ステップ67が終了したならば、ス
テップ74へ進む。
【0104】ステップ68の条件判定によってステップ
69に進んだ場合、ステップ69では、図14に示す処
理が行なわれる。図14ステップ70では、入力したク
ライアントプロセスの要求ごとに、異なった識別子を生
成する。ステップ71では、ステップ70で生成された
識別子と、クライアントプロセス52からの要求を入力
した受け付け時刻を要求管理リストに登録するる。ステ
ップ72では、図19に示すようなサーバ・テーブル6
5を参照し、サーバ・プロセス53〜55、誤り検出プ
ロセス19〜21の動作しているサーバ計算機3〜5の
位置情報を得る。ステップ73では、サーバ・プロセス
53〜55へクライアントプロセス52のサービス要求
と、ステップ70で生成した識別子を送信する。また、
誤り検出プロセス19〜21へ、試験手続き実行命令と
ステップ70で生成した識別子を同時に送信する。次
に、ステップ85へ進む。
【0105】サーバ・プロセス53〜55は、起動後、
サーバ・アプリケーション・インタフェースで、フォー
ルト・トレラント・サーバ56、57から入力待ち状態
になつている。サーバ・プロセス53〜55は、フォー
ルト・トレラント・サーバ56から転送されたクライア
ントプロセス52の要求とフォールト・トレラント・サ
ーバ56のステップ70で生成された識別子を入力する
と、入力した要求に対する処理を行い、処理結果をフォ
ールト・トレラント・サーバ56に返送する。この時フ
ォールト・トレラント・サーバ56のステップ70で生
成された識別子も一緒にフォールト・トレラント・サー
バ56へ送信する。
【0106】誤り検出プロセス19〜21は、起動後、
フォールト・トレラント・サーバ56〜57からの試験
手続き実行命令入力待ち状態になっている。誤り検出プ
ロセス19〜21は、フォールト・トレラント・サーバ
56から送られた試験手続き実行命令と、フォールト・
トレラント・サーバ56のステップ70で生成された識
別子を入力すると、試験手続きを実行し試験結果をフォ
ールト・トレラント・サーバ56に返送する。この時に
フォールト・トレラント・サーバ56のステップ70で
生成された識別子も一緒にフォールト・トレラント・サ
ーバ56へ返送する。
【0107】フォールト・トレラント・サーバ56のス
テップ68の条件判定によってステップ74に進んだ場
合、ステップ74では、ステップ67が終了した条件
が、サーバ・プロセス53〜55からの処理結果受信で
あるかを判定する。サーバ・プロセス53〜55からの
処理結果受信であったならば、ステップ75へ進む。サ
ーバ・プロセス53〜55からの処理結果受信以外の事
象で、ステップ67が終了したならば、ステップ76へ
進む。
【0108】フォールト・トレラント・サーバ56のス
テップ74の条件判定によって、ステップ75に進んだ
場合、ステップ75では、サーバ・プロセスから返送さ
れた処理結果を要求管理リストに登録する。サーバ・プ
ロセスから返送された処理結果には、処理結果の他に要
求送信時に送信した識別子が付加されている。その識別
子を基に、要求管理リストにおけるクライアントプロセ
ス52の要求が格納してあるリストにサーバ・プロセス
からの処理結果を追加する。次にステップ78に進む。
【0109】ステップ74の条件判定によって、ステッ
プ76に進んだ場合、ステップ76では、ステップ67
が終了した条件が誤り検出プロセス19〜21からの試
験結果であるかを判定する。誤り検出プロセス19〜2
1からの試験結果であったならば、ステップ77へ進
む。誤り検出プロセス19〜21からの試験結果受信以
外の事象でステップ67が終了したならば(この場合の
ステップ67が終了した条件は、フォールト・トレラン
ト・サーバ56起動時に設定された一定時間が経過した
ことによる)、ステップ85へ進む。
【0110】ステップ76の判定によって、ステップ7
7へ進んだ場合、ステップでは、誤り検出プロセスから
返送された試験結果を要求管理リストに登録する。誤り
検出プロセスから返送された試験結果には、試験結果の
他に試験手続き実行命令送信時に送信した識別子が追加
されている。その識別子を基に、要求管理リストにおけ
るクライアントプロセス52の要求が格納してあるリス
トに誤り検出プロセスから処理結果を追加する。次にス
テップ78に進む。
【0111】ステップ78では、ステップ75もしくは
ステップ77で操作したリストにおいて、クライアント
プロセスの要求に対するサーバ・プロセスの処理結果、
及び、誤り検出プロセスの試験結果が、全てのサーバ・
プロセス53〜55、誤り検出プロセス19〜21から
返送されたか判定を行なう。クライアントプロセスの要
求に対して、全てのサーバ・プロセス53〜55、誤り
検出プロセス19〜21から処理結果、試験結果が返送
されているならば、ステップ79へ進む。未返送の処理
結果あるいは試験結果があるのならば、ステップ85へ
進む。
【0112】ステップ78の条件判定によって、ステッ
プ79に進んだ場合、ステップ79では、図15に示す
処理が行われる。ステップ80では、処理結果、試験結
果に対して多数決を適用する処理結果及び試験結果比較
手段によって正しいサーバ・プロセスの処理結果を得
る。ステップ81では、ステップ80の処理結果及び試
験結果比較手段によって、異なった処理結果、試験結果
を出力したサーバ・プロセス、誤り検出プロセスが存在
したかを判定する。異なった処理結果、試験結果を出力
したサーバ・プロセス、誤り検出プロセスが存在した場
合には、ステップ82へ進む。異なった処理結果、試験
結果を出力したサーバ・プロセス、誤り検出プロセスが
存在しなかった場合には、ステップ83へ進む。ステッ
プ82では、異なった処理結果、試験結果を出力したサ
ーバ・プロセス、誤り検出プロセスが存在したことを示
すエラー情報と、そのサーバ・プロセス、誤り検出プロ
セスが動作していたサーバ計算機の情報をユーザに対し
て出力し、ステップ83へ進む。ステップ83では、ス
テップ80の処理結果及び試験結果比較手段によって得
られた正しいサーバ・プロセスの処理結果をクライアン
トプロセス52へ返送する。ステップ84では、処理結
果の返送が終了したクライアントプロセス52の要求
と、それに対する処理結果、試験結果情報を要求管理リ
ストから削除する。ステップ79が終了したならば、ス
テップ85へ進む。
【0113】ステップ85では、図16に示す処理が行
なわれる。ステップ86では、要求管理リストのクライ
アント要求情報を全て参照する。要求管理リストにおけ
るクライアント要求情報の受け付け時刻と現在の時刻よ
り、クライアントプロセスの要求を受け付けてから経過
した時間を要求待ち経過時間として算出する。算出した
要求待ち経過時間とフォールト・トレラント・サーバ5
6起動時に設定された最大要求待ち時間を比較する。フ
ォールト・トレラント・サーバ56起動時に設定された
最大要求待ち時間が、クライアントプロセスの要待ち経
過時間よりも大きいならば、ステップ67に進む。フォ
ールト・トレラント・サーバ56起動時に設定された最
大要求待ち時間が、クライアントプロセスの要求待ち経
過時間よりも小さい、または、等しいならば、ステップ
87に進む。
【0114】ステップ86の条件判定によって、ステッ
プ87に進んだ場合、ステップ87では、最大要求待ち
時間を越えてしまったクライアントプロセスの要求に対
して、処理結果を返送したサーバ・プロセスが存在する
かどうかを判定する。処理結果を返送したサーバ・プロ
セスが存在するならば、ステップ88へ進む。処理結果
を返送したサーバ・プロセスが存在しないならば、ステ
ップ90へ進む。ステップ88では、返送されたサーバ
・プロセスの処理結果、誤り検出プロセスの試験結果に
対して処理結果及び比較手段を適用しサーバ・プロセス
の正しい処理結果を得る。ステップ88の処理結果及び
試験結果比較手段によって得られた正しいサーバ・プロ
セスの処理結果をクライアントプロセスへ返送する。ス
テップ90では、返送可能なサーバ・プロセスの処理結
果を得ることが出来なかったため、クライアントプロセ
スに対してシステムエラーの発性を通知する。
【0115】ステップ91では、処理結果の返送が終了
したクライアントプロセスの要求、処理結果、試験結果
情報を要求管理リストから削除する。ステップ92で
は、異なった処理結果、試験結果を出力した、あるい
は、処理結果を返送しなかったサーバ・プロセス、誤り
検出プロセスが存在したことを示すエラー情報と、その
サーバ・プロセス、誤り検出プロセスが動作していたサ
ーバ計算機の情報をユーザに対して出力し、ステップ6
7へ進む。
【0116】以上のように、この実施例はクライアント
プロセスからの要求を入力しサーバ・プロセスに転送
し、また、誤り検出プロセスに試験手続き実行命令を送
信し、さらに、サーバ・プロセスの処理結果、誤り検出
プロセスの試験結果を入力し多数決によって正しいサー
バ・プロセスの処理結果を得る処理結果及び試験結果比
較手段を備え、正しいサーバ・プロセスの処理結果をク
ライアントプロセスに返送する。そして、障害の発生し
たサーバ計算機の情報をユーザに通知するフォールト・
トレラント・サーバ、フォールト・トレラント・サーバ
の動作する中継計算機、クライアントプロセスとフォー
ルト・トレラント・サーバとの通信手段を備えクライア
ント・アプリケーションにリンクし使用するクライアン
ト・アプリケーション・インタフェース、サーバ・プロ
セスとフォールト・トレラント・サーバとの通信手段を
備えサーバ・アプリケーションにリンクし使用するサー
バ・アプリケーション・インタフェース、クライアント
計算機に設置されフォールト・トレラント・サーバが動
作する中継計算機の位置情報を格納しているフォールト
・トレラント・サーバ・テーブル、フォールト・トレラ
ント・サーバが動作する中継計算機に設置され、サーバ
・プロセスが動作するサーバ計算機の位置の情報を格納
しているサーバ・テーブルを備えることを特徴とした分
散システムの高信頼化方法について説明した。
【0117】この実施例は、クライアントプロセスの処
理結果及び試験結果比較手段手段をクライアントプロセ
スから分離し、1つのプロセスとしたフォールト・トレ
ラント・サーバを設け、クライアントプロセス、サーバ
・プロセスとの通信処理インタフェース化することで、
クライアントプロセス、サーバ・プロセスの通信部分を
開発不要とし、サーバ・プロセス、フォールト・トレラ
ント・サーバの動作する計算機の位置情報をファイルに
登録するサーバ・テーブル、フォールト・トレラント・
サーバ・テーブルを設けたものである。
【0118】この実施例によればシステム運用後に、構
成変更要求があった場合でも、位置情報が記録してある
ファイルを修正することによって、動作中のプログラム
を改修することなく対応可能とする。通信処理部分をイ
ンタフェースとして提供することで、プログラムか開発
者の開発負荷を軽減する。
【0119】すなわち、サーバ・プロセス、クライアン
トプロセスにアプリケーションインタフェースを持たせ
ることで、ソフトウエア開発負荷の軽減が可能となる。
また、システム構成の変更もサーバ・テーブル、フォー
ルト・トレラント・サーバ・テーブルを書き換えること
で対応することが可能となる。
【0120】実施例5.なお、上記実施例では、誤り検
出プロセス19〜21へ試験手続き実施命令を送信する
タイミングを、クライアントプロセスからサービス要求
が出された時としていたが、クライアントプロセスから
の要求がなくとも、フォールト・トレラント・サーバが
定期的に試験手続き実行命令を発行しサーバ計算機の状
態を監視しても良い。
【0121】上記実施例では、サーバ計算機が3台以上
ある場合について説明したが図20に示すようにサーバ
計算機は、2台以上複数台存在している場合であっても
かまわない。2台しか存在していない場合には、処理結
果比較手段多数決を用いて正しい処理結果を選択するこ
とができないが、2つの処理結果を比較して一致した処
理結果を最終的な処理結果とすることにより信頼性が向
上する。
【0122】
【発明の効果】以上のように、この発明によれば、処理
計算機が冗長構成をとっているので1台の処理計算機に
障害が発生しても、他の処理計算機が処理要求に対して
サービスを継続して提供することができる。
【0123】また、この発明によれば中継手段が要求計
算機と処理計算機の間で処理要求と処理結果を中継する
ようにしたので、要求計算機と処理計算機の変更を最小
減にすることができ、分散システムの信頼性を向上する
ことができる。
【0124】また、この発明によれば、3台以上の処理
計算機を備えることにより多数決による処理結果の選択
を行なえ容易に正しい処理結果を得ることができる。
【0125】また、この発明によれば、処理計算機に誤
り検出手段を設けているので、要求に基づき処理計算機
の誤り検出を行なうことができ、処理計算機に発生する
障害が処理結果に影響する前に検出することができる。
【0126】また、この発明によれば、誤りを検出する
場合も3台以上の処理計算機を備えているため、多数決
により試験結果の正常異常を正しく判断することができ
る。
【0127】また、この発明によれば、予備計算機を用
意し処理計算機に障害が発性した場合でも、予備計算機
を起動させることで常に復数台の処理計算機の冗長構成
をとることができ、システムとしての信頼性が向上す
る。
【0128】また、この発明によれば、中継手段を独立
の中継計算機に備えることにより要求計算機と処理計算
機の処理負荷を軽減させる。さらに、中継計算機を独立
してあらかじめ準備することにより、要求計算機処理計
算機のソフトウエア開発及びハードウエア開発の負荷を
軽減させる。
【0129】また、この発明によれば、中継計算機を複
数備えることにより、いずれかの中継計算機に障害が発
性した場合でも継続して中継処理を行なうことができ
る。
【0130】また、この発明によれば、要求計算機に中
継手段とのインタフェースをとるインタフェース手段を
持たせることで要求計算機のシステム開発負荷が軽減す
る。
【0131】また、この発明によれば、処理計算機の中
に中継手段とのインタフェースをとるインタフェース手
段を備えたので処理計算機のシステム開発の負荷が軽減
する。
【0132】また、この発明による分散システムの高信
頼化方法によれば、要求計算機からの要求を複数の処理
計算機で処理させ、その処理結果を比較選択することに
より正しい処理結果を選ぶことができ、分散システムの
信頼性が向上する。
【図面の簡単な説明】
【図1】 この発明の実施例1におけるクライアント・
サーバシステムのシステム構成図である。
【図2】 この発明の実施例1におけるクライアント計
算機の構成図である。
【図3】 この発明の実施例1におけるクライアントプ
ロセスの動作を示すフローチャート図である。
【図4】 この発明の実施例2におけるクライアント・
サーバシステムのシステム構成図である。
【図5】 この発明の実施例2における処理結果試験結
果比較手段の構成図である。
【図6】 この発明の実施例2におけるクライアントプ
ロセスの動作を示すフローチャート図である。
【図7】 この発明の実施例3におけるよびサーバ計算
機を備えたクライアント・サーバシステムのシステム構
成図である。
【図8】 この発明の実施例3におけるクライアント計
算機の構成図である。
【図9】 この発明の実施例3において、サーバ計算機
に障害が発生した後、予備資源を起動した冗長構成でサ
ービスを提供しているクライアント・サーバシステムの
システム構成図である。
【図10】 この発明の実施例3におけるクライアント
プロセスの動作を示すフローチャート図である。
【図11】 この発明の実施例4におけるクライアント
・サーバシステムのシステム構成図である。
【図12】 この発明の実施例4における中継計算機の
構成図である。
【図13】 この発明の実施例4におけるフォールト・
トレラント・サーバの動作を示すフローチャート図であ
る。
【図14】 この発明の実施例4におけるフォールト・
トレラント・サーバの動作としてクライアントからの要
求を入力した場合の詳細を示しているフローチャート図
である。
【図15】 この発明の実施例4におけるフォールト・
トレラント・サーバの動作としてクライアントへ処理結
果を返送する場合の詳細を示しているフローチャート図
である。
【図16】 この発明の実施例4におけるフォールト・
トレラント・サーバの動作として要求待ちタイムオーバ
となった場合の詳細を示しているフローチャート図であ
る。
【図17】 この発明の実施例4におけるフォールト・
トレラント・サーバが管理している要求管理リストに登
録されている情報を示す図である。
【図18】 この発明の実施例4におけるフォールト・
トレラント・サーバ・テーブルの一例を示す図である。
【図19】 この発明の実施例4におけるサーバ・テー
ブルの一例を示す図である。
【図20】 この発明の実施例5におけるクライアント
・サーバシステムのシステム構成図である。
【図21】 従来のクライアント・サーバシステムのシ
ステム構成図である。
【図22】 従来のホットスタンバイ型システムのシス
テム構成図である。
【符号の説明】
1 通信回線、2 クアイアント計算機、3 サーバ計
算機、4 サーバ計算機、5 サーバ計算機、6 サー
バ・プロセス、7 サーバ・プロセス、8サーバ・プロ
セス、9 クライアントプロセス、19 誤り検出プロ
セス、20誤り検出プロセス、21 誤り検出プロセ
ス、22 クライアントプロセス、32 予備のサーバ
計算機、33 予備のサーバ計算機、34 予備のサー
バ・プロセス、35 予備のサーバ・プロセス、36
予備の誤り検出・プロセス、37 予備の誤り検出・プ
ロセス、38 クライアントプロセス、52 クライア
ントプロセス、53 サーバ・プロセス、54 サーバ
・プロセス、55 サーバ・プロセス、56 フォール
ト・トレラント・サーバ、57 フォールト・トレラン
ト・サーバ、58 中継計算機、59 中継計算機、6
0 クライアント・アプリケーション・インタフェー
ス、61 サーバ・アプリケーション・インタフェー
ス、62 サーバ・アプリケーション・インタフェー
ス、63 サーバ・アプリケーション・インタフェー
ス、64 フォールト・トレラント・サーバ・テーブ
ル、65 サーバ・テーブル、66 サーバ・テーブ
ル、93 クライアント計算機、94 クライアント計
算機、95 クライアントプロセス、96 クライアン
トプロセス、97 クライアントプロセス。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 処理要求を送信してその処理結果を受信
    する要求手段を有する要求計算機と、処理要求を受信し
    て処理要求を実行しその処理結果を送信する処理手段を
    有する処理計算機と、上記要求計算機と処理計算機を接
    続し処理要求と処理結果を伝送するネットワークを備え
    た分散システムにおいて、 上記処理計算機を複数備えるとともに、 上記要求計算機は複数の処理手段に対して同一の処理要
    求をそれぞれ送信し複数の処理計算機の処理手段からそ
    の処理結果を受信する送受信手段と、受信した複数の処
    理結果を比較して正しい処理結果を出力する結果比較手
    段を備えたことを特徴とする分散システム。
  2. 【請求項2】 処理要求を送信してその処理結果を受信
    する要求手段を有する要求計算機と、処理要求を受信し
    て処理要求を実行しその処理結果を送信する処理手段を
    有する処理計算機と、上記要求計算機と処理計算機を接
    続し処理要求と処理結果を伝送するネットワークを備え
    た分散システムにおいて、 上記処理計算機を複数備えるとともに、 上記要求計算機の要求手段からの処理要求を受信する要
    求受信手段と、その処理要求を複数の処理計算機の処理
    手段に対してそれぞれ送信し上記複数の処理計算機の処
    理手段から処理結果を受信する送受信手段と、受信した
    処理結果を比較して正しい処理結果を出力する結果比較
    手段と、その結果比較手段からの出力を要求計算機に送
    信する結果送信手段を有する中継手段を備えたことを特
    徴とする分散システム。
  3. 【請求項3】 上記分散システムは3台以上の処理計算
    機を備え、上記結果比較手段は3台以上の処理計算機か
    らの処理結果を入力して多数決をとり正しい処理結果を
    得ることを特徴とする請求項1又は2記載の分散システ
    ム。
  4. 【請求項4】 上記複数の処理計算機は、計算機の誤り
    を検出するための試験要求を受信して受信した試験要求
    を実行し試験結果を送信する誤り検出手段をそれぞれ備
    え、上記送受信手段は、上記複数の処理計算機の誤り検
    出手段に対して試験要求をそれぞれ送信し複数の処理計
    算機の誤り検出手段からその試験結果を受信するととも
    に、上記結果比較手段は受信した複数の試験結果を比較
    して処理計算機の異常を検出することを特徴とする請求
    項1又は2記載の分散システム。
  5. 【請求項5】 上記の分散システムは、3台以上の処理
    計算機を備え、上記結果比較手段は、3以上の誤り検出
    手段からの試験結果を入力して多数決をとり処理計算機
    の異常を検出するを特徴とする請求項4記載の分散シス
    テム。
  6. 【請求項6】 上記の分散システムは、さらに、ネット
    ワークに接続された予備計算機を備え、上記結果比較手
    段は、上記処理計算機を予備計算機で代替する必要が生
    じた場合、上記予備計算機を起動する予備資源起動手段
    を備えたことを特徴とする請求項1、2、3、4、又は
    5記載の分散システム。
  7. 【請求項7】 上記中継手段を上記ネットワークに接続
    された中継計算機に備えたことを特徴とする請求項2記
    載の分散システム。
  8. 【請求項8】 上記中継計算機を複数備えたことを特徴
    とする請求項7記載の分散システム。
  9. 【請求項9】 上記要求手段は、処理要求を生成する実
    行プロセスと、実行プロセスと結合して上記中継手段と
    のインタフェースをとるインタフェース手段を備えたこ
    とを特徴とする請求項2、7、または8記載の分散シス
    テム。
  10. 【請求項10】 上記処理手段は、処理結果を生成する
    処理プロセスと、処理プロセスと結合して、上記中継手
    段とのインタフェースをとるインタフェース手段を備え
    たことを特徴とする請求項2、7、又は8記載の分散シ
    ステム。
  11. 【請求項11】 以下の工程を備えた分散システムの高
    信頼化方法 (a)要求計算機において処理要求を発生する工程、 (b)上記処理要求を複数の処理計算機にそれぞれ送信
    する工程、 (c)上記複数の処理計算機において処理要求に対する
    処理をそれぞれ実行する工程、 (d)上記複数の処理計算機から処理結果を要求計算に
    送信する工程、 (e)要求計算機において受信した複数の処理結果から
    正しい処理結果を選択して、上記処理要求に対するする
    処理結果とする工程。
JP6098611A 1994-05-12 1994-05-12 分散システム及び分散システムの高信頼化方法 Pending JPH07306794A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6098611A JPH07306794A (ja) 1994-05-12 1994-05-12 分散システム及び分散システムの高信頼化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6098611A JPH07306794A (ja) 1994-05-12 1994-05-12 分散システム及び分散システムの高信頼化方法

Publications (1)

Publication Number Publication Date
JPH07306794A true JPH07306794A (ja) 1995-11-21

Family

ID=14224394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6098611A Pending JPH07306794A (ja) 1994-05-12 1994-05-12 分散システム及び分散システムの高信頼化方法

Country Status (1)

Country Link
JP (1) JPH07306794A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005050298A (ja) * 2003-07-11 2005-02-24 Ns Solutions Corp 計算機システム、計算機、データ通信方法及びプログラム
JP2009217504A (ja) * 2008-03-10 2009-09-24 Hitachi Ltd 計算機システム、計算機制御方法及び計算機制御プログラム
JP2010509677A (ja) * 2006-11-10 2010-03-25 マイクロソフト コーポレーション 分散型サーバーシステムにおいてバックアップマネージャを転送するメッセージ
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
US7958549B2 (en) 2002-08-20 2011-06-07 Nec Corporation Attack defending system and attack defending method
WO2012127652A1 (ja) * 2011-03-23 2012-09-27 株式会社日立製作所 計算機システム、データ処理方法、及びデータ処理プログラム
WO2012160690A1 (ja) * 2011-05-26 2012-11-29 株式会社日立製作所 多重化システム、方法、およびプログラム
JP2013111438A (ja) * 2011-12-01 2013-06-10 Nintendo Co Ltd ゲームシステム、ゲーム装置、ゲームプログラムおよびゲーム制御方法
US9501326B2 (en) 2013-03-19 2016-11-22 Hitachi, Ltd. Processing control system, processing control method, and processing control program
CN113064748A (zh) * 2021-04-08 2021-07-02 中国第一汽车股份有限公司 进程接替的方法、装置、电子设备及存储介质
CN113076065A (zh) * 2021-04-14 2021-07-06 中国人民解放军国防科技大学 一种高性能计算系统中数据输出故障容错方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958549B2 (en) 2002-08-20 2011-06-07 Nec Corporation Attack defending system and attack defending method
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
JP2005050298A (ja) * 2003-07-11 2005-02-24 Ns Solutions Corp 計算機システム、計算機、データ通信方法及びプログラム
JP2010509677A (ja) * 2006-11-10 2010-03-25 マイクロソフト コーポレーション 分散型サーバーシステムにおいてバックアップマネージャを転送するメッセージ
JP2009217504A (ja) * 2008-03-10 2009-09-24 Hitachi Ltd 計算機システム、計算機制御方法及び計算機制御プログラム
JP5416863B2 (ja) * 2011-03-23 2014-02-12 株式会社日立製作所 計算機システム、データ処理方法、及びデータ処理プログラム
WO2012127652A1 (ja) * 2011-03-23 2012-09-27 株式会社日立製作所 計算機システム、データ処理方法、及びデータ処理プログラム
WO2012160690A1 (ja) * 2011-05-26 2012-11-29 株式会社日立製作所 多重化システム、方法、およびプログラム
JP5703375B2 (ja) * 2011-05-26 2015-04-15 株式会社日立製作所 多重化システム、方法、およびプログラム
JP2013111438A (ja) * 2011-12-01 2013-06-10 Nintendo Co Ltd ゲームシステム、ゲーム装置、ゲームプログラムおよびゲーム制御方法
US9501326B2 (en) 2013-03-19 2016-11-22 Hitachi, Ltd. Processing control system, processing control method, and processing control program
CN113064748A (zh) * 2021-04-08 2021-07-02 中国第一汽车股份有限公司 进程接替的方法、装置、电子设备及存储介质
CN113064748B (zh) * 2021-04-08 2023-02-28 中国第一汽车股份有限公司 进程接替的方法、装置、电子设备及存储介质
CN113076065A (zh) * 2021-04-14 2021-07-06 中国人民解放军国防科技大学 一种高性能计算系统中数据输出故障容错方法
CN113076065B (zh) * 2021-04-14 2022-12-09 中国人民解放军国防科技大学 一种高性能计算系统中数据输出故障容错方法

Similar Documents

Publication Publication Date Title
US20190303255A1 (en) Cluster availability management
EP1650653B1 (en) Remote enterprise management of high availability systems
EP1099164B1 (en) Method and program for processing administrative requests of a distributed network application executing in a clustered computing environment
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
US20070245167A1 (en) Managing failover of j2ee compliant middleware in a high availability system
US5621885A (en) System and method for providing a fault tolerant computer program runtime support environment
US5121486A (en) Network control system for dynamically switching a logical connection between an identified terminal device and an indicated processing unit
EP0319034B1 (en) Method of recovering failure of online control program
US6212649B1 (en) System and method for providing highly-reliable coordination of intelligent agents in a distributed computing system
JPH07306794A (ja) 分散システム及び分散システムの高信頼化方法
JPH0934809A (ja) 高信頼化コンピュータシステム
US7373542B2 (en) Automatic startup of a cluster system after occurrence of a recoverable error
JPS6375963A (ja) システム回復方式
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP3211878B2 (ja) 通信処理制御手段及びそれを備えた情報処理装置
JPH06242979A (ja) 二重化コンピュータ装置
KR19990050460A (ko) 고 가용성 시스템의 장애 복구방법 및 장치
JPH05314075A (ja) オンラインコンピュータ装置
JP3332098B2 (ja) 二重化プロセッサ装置
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
JP2000066913A (ja) 任意プロセッサのプログラム・データ無中断更新システム
CN116991637B (zh) 嵌入式系统的运行控制方法及装置、电子设备及存储介质
US20220308563A1 (en) Controller and control method
KR19990050461A (ko) 고 가용성 시스템의 오류 처리방법
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体