JP2001223765A - 耐故障性システム及びその故障検出方法 - Google Patents

耐故障性システム及びその故障検出方法

Info

Publication number
JP2001223765A
JP2001223765A JP2000034986A JP2000034986A JP2001223765A JP 2001223765 A JP2001223765 A JP 2001223765A JP 2000034986 A JP2000034986 A JP 2000034986A JP 2000034986 A JP2000034986 A JP 2000034986A JP 2001223765 A JP2001223765 A JP 2001223765A
Authority
JP
Japan
Prior art keywords
information processing
data
bus
fault
peripheral circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000034986A
Other languages
English (en)
Other versions
JP3597748B2 (ja
Inventor
Takeshi Mishima
健 三島
Etsuo Masuda
悦夫 増田
Michihiro Aoki
道宏 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000034986A priority Critical patent/JP3597748B2/ja
Publication of JP2001223765A publication Critical patent/JP2001223765A/ja
Application granted granted Critical
Publication of JP3597748B2 publication Critical patent/JP3597748B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

(57)【要約】 【課題】 一つの情報処理装置の故障による影響を最小
限に留め、データの破壊や他の情報処理装置への影響を
与えない耐故障性システム及びその故障検出方法を提供
する。 【解決手段】 情報処理装置10,20からI/O装置
36へのデータをそれぞれ第1バッファ32a,32b
に記憶し、比較回路37により両バッファに記憶されて
いるデータの整合性を照合する。整合性を有している場
合にはデータをI/O装置36に転送し、整合性を有し
ていない場合には故障系を切り離して正常系で処理を継
続するようにしたので、故障が生じた際にI/O装置3
6に不適切なデータが転送されることがない。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、24時間連続運転
が要求される通信網のノードシステムや企業内のサーバ
などに利用する耐故障性システムに関するものである。
【0002】
【従来の技術】従来、この種の耐故障性システムを実現
する方式として、図10に示すようなものが知られてい
る。図10は従来の耐故障性システムの構成図である。
【0003】図10に示すように、この耐故障性システ
ムは、2つの情報処理装置110及び120を備えてい
る。各情報処理装置110,120は、それぞれバス1
11,121を介して中央処理装置(以下CPU(Cent
ral Processing Unit)と言う)112,122、主記
憶装置113,123、I/O装置114,124等が
接続されており、一対の情報処理装置110及び120
はそれぞれ同一の処理を行っている。
【0004】各情報処理装置110及び120のバス1
11,121には、照合回路130が接続されている。
この照合回路130は、各バス111及び121をモニ
タし、各バス111及び121に流れる情報を比較す
る。その結果、両者に流れる情報に不一致が生じた場合
には、各CPU112,122に割込を上げて障害処理
を行っている。
【0005】
【発明が解決しようとする課題】しかし、従来の耐故障
性システムには、以下のような問題点があった。すなわ
ち、照合回路130で障害を検出した際に、故障した情
報処理装置を切り離すとともに正常な情報処理装置で処
理を継続できたとしても、そのときには既に主記憶装置
のアクセスの他に、外部記憶装置やネットワークインタ
フェイスなどI/O装置のアクセスが終了している。こ
のため、一つの情報処理装置の障害による影響が大きく
なってしまい、障害復旧が困難となる場合があった。
【0006】本発明は、上記事情に鑑みてなされたもの
であり、その目的とするところは、一つの情報処理装置
の故障による影響を最小限に留め、データの破壊や他の
情報処理装置への影響を与えない耐故障性システム及び
その故障検出方法を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明では、それぞれ中央処理装置とバス
とを有し互いに同一の処理を行う複数の情報処理装置
と、各情報処理装置のバスと接続するとともに各情報処
理装置における処理の同一性を照合する照合手段とを有
する耐故障性システムにおいて、前記照合手段を介して
各情報処理装置と接続する周辺回路を備え、前記照合手
段は、各情報処理装置に対応して設けた第1の記憶手段
と、各情報処理装置のバスに流れる周辺回路へのデータ
を該情報処理装置に対応する前記第1の記憶手段に転送
する第1の転送手段と、各第1の記憶手段に記憶されて
いるデータの整合性を照合する整合性照合手段と、整合
性照合手段により各第1の記憶手段に記憶されているデ
ータが整合性を有していると判定した場合には該データ
を周辺回路側に転送する第2の転送手段とを備えたこと
を特徴とするものを提案する。
【0008】本発明によれば、各情報処理装置から周辺
回路へのデータは第1の転送手段により該情報処理装置
に対応する第1の記憶手段に記憶され、照合回路により
該第1の記憶手段に記憶された各情報処理装置に対応す
るデータの整合性が照合される。そして、各データが整
合性を有している場合には該データは周辺回路側に転送
される。したがって、データが整合性を有していない場
合には、あらかじめ用意された判断手法により疑わしい
データを判別し該データを周辺回路へ転送しないように
すれば、一つの情報処理装置の故障による影響を最小限
に留め、データの破壊や他の情報処理装置への影響を回
避することができる。
【0009】また、請求項2の発明では、請求項1記載
の耐故障性システムにおいて、各情報処理装置から周辺
回路へのデータ書き込み時において、前記第1の転送手
段は、第1の記憶手段へのデータ転送が終了すると情報
処理装置に対して周辺回路へのデータ書き込みが終了し
たことを通知することを特徴とするものを提案する。
【0010】本発明によれば、各情報処理装置から周辺
回路へのデータ書き込みを行う場合には、情報処理装置
は、第1の記憶手段にデータが記憶された時点で書き込
み終了の通知を受ける。すなわち、周辺回路への実際の
データ書き込みが終了していなくても書き込み終了通知
を受けることができるので、情報処理装置における周辺
回路へのデータ書き込みを高速化することができる。
【0011】さらに、請求項3の発明では、請求項1又
は2何れか1項記載の耐故障性システムにおいて、前記
照合手段は、周辺回路側から各情報処理装置へのデータ
を記憶する第2の記憶手段と、該第2の記憶手段に記憶
されているデータを各情報処理装置へ転送するととも
に、周辺回路から各情報処理装置へのデータ書き込み時
において、第2の記憶手段へのデータ転送が終了すると
周辺回路に対して情報処理装置へのデータ書き込みが終
了したことを通知する第3の転送手段とを備えたことを
特徴とするものを提案する。
【0012】本発明によれば、周辺回路から情報処理装
置へのデータ書き込み時には、第3の転送手段により該
データが第2の記憶手段に転送され、該転送が終了する
と、周辺回路に対して情報処理装置へのデータ書き込み
が終了したことが通知される。すなわち、情報処理装置
への実際のデータ書き込みが終了していなくても書き込
み終了通知を受けることができるので、周辺回路におけ
る情報処理装置へのデータ書き込みを高速化することが
できる。
【0013】さらに、請求項4の発明では、それぞれ中
央処理装置とバスとを有し互いに同一の処理を行う複数
の情報処理装置と、各情報処理装置のバスと接続すると
ともに各情報処理装置における処理の同一性を照合する
照合手段とを有する耐故障性システムの故障検出方法に
おいて、前記照合手段を介して各情報処理装置と周辺回
路とを接続し、各情報処理装置に対応して第1の記憶手
段を設けるとともに、各情報処理装置のバスを流れる周
辺回路へのデータを該情報処理装置に対応する第1の記
憶手段に転送し、各第1の記憶手段に照合すべきデータ
が揃った際に該第1の記憶手段に記憶されているデータ
の整合性を照合し、該照合の結果整合性を有していない
場合には各情報処理装置に対して結果を報告し、整合性
を有している場合には該データを前記周辺回路に転送す
ることを特徴とするものを提案する。
【0014】本発明によれば、各情報処理装置から周辺
回路へのデータは該情報処理装置に対応する第1の記憶
手段に記憶され、該第1の記憶手段に記憶された各情報
処理装置に対応するデータの整合性が照合される。そし
て、各データが整合性を有している場合には該データは
周辺回路側に転送される。また、データが整合性を有し
ていない場合には、各情報処理装置に対して該結果が報
告される。したがって、一つの情報処理装置の故障によ
る影響を最小限に留め、データの破壊や他の情報処理装
置への影響を回避することができる。
【0015】さらに、請求項5の発明は、請求項4記載
の耐故障性システムの故障検出方法において、各情報処
理装置から周辺回路へのデータ書き込み時において、第
1の記憶手段へのデータ転送が終了すると情報処理装置
に対して周辺回路へのデータ書き込みが終了したことを
通知することを特徴とするものを提案する。
【0016】本発明によれば、各情報処理装置から周辺
回路へのデータ書き込みを行う場合には、情報処理装置
は、第1の記憶手段にデータが記憶された時点で書き込
み終了の通知を受ける。すなわち、周辺回路への実際の
データ書き込みが終了していなくても書き込み終了通知
を受けることができるので、情報処理装置における周辺
回路へのデータ書き込みを高速化することができる。
【0017】
【発明の実施の形態】本発明の一実施の形態に係る耐故
障性システムについて図面を参照して説明する。図1は
耐故障性システムの構成図、図2及び図3はバッファの
構造を説明する図である。
【0018】図1に示すように、この耐故障性システム
は、同一の処理を行う情報処理装置10及び20と、各
情報処理装置10及び20と接続する耐故障性機構30
とを備えている。
【0019】各情報処理装置10,20は、それぞれ第
1バス11,21と、第1バス11,21に接続した中
央処理装置(以下CPUと言う)12,22、主記憶装
置13,23を備えるとともに、該第1バス11,21
にI/O装置を有する耐故障性機構30を接続してい
る。このように、この耐故障性システムでは、耐故障性
を考慮してI/O装置を耐故障性機構30側に配置する
とともに、性能低下を防止するために主記憶装置を各情
報処理装置10,20側に配置している。
【0020】耐故障性機構30は、それぞれ情報処理装
置10,20に対応して設けられた第1バスコントロー
ラ31a,31bと、各第1バスコントローラ31a,
31bに接続された第1バッファ32a,32bとを備
えている。第1のバスコントローラ31a,31bは、
それぞれ情報処理装置10,20の第1バス11,21
と接続している。また、第1バスコントローラ31a,
31bは、各情報処理装置10,20に設けられている
アービタ(図示省略)が行う調停により、対応する各第
1バス11,21の使用権を獲得・解放可能となってい
る。
【0021】また、耐故障性機構30は、第1バスコン
トローラ31a,31bと接続するとともに第2バス3
3と接続する第2コントローラ34を備えている。この
第2バスコントローラ34は、第2バス33を調停する
アービタ(図示省略)を有している。また、この第2コ
ントローラ34は、第2バッファ35を備えている。
【0022】さらに、耐故障性機構30は第2バス33
に接続された周辺回路である外部記憶装置などのI/O
装置36を備えている。このI/O装置36はDMA
(Direct Memory Access)コントローラを備えており、
レジスタにCPU11,21から制御情報を書き込まれ
ることによって自律的にデータ送受信を行う。
【0023】さらに、耐故障性機構30は、第1バッフ
ァ32a,32bに記憶されているデータを相互に比較
する比較回路37を備えている。この比較回路37に
は、第2バスコントローラ34からの指示に基づき第1
バスコントローラ31a,31bを介して第1バッファ
32a,32bからデータが入力される。比較回路37
による比較結果は第2バスコントローラ34に対して出
力される。
【0024】第1バスコントローラ31a,31b、第
2バスコントローラ34は、それぞれ制御情報であるバ
スコマンドから、(A)CPUがI/O装置へデータ・
制御情報を書き込む場合、(B)CPUがI/O装置か
らデータ・ステータス情報を読み込む場合、(C)I/
O装置が主記憶装置へデータを書き込む場合、(D)I
/O装置が主記憶装置からデータを読み込む場合の以上
4つのケースを識別可能である。
【0025】第1バッファ32a,32bは、図2に示
すように、上記(A)用・(B)用・(D)用の3つの
バッファを備えている。上記(A)用のバッファ32a
(A),32b(A)は、データ・I/O制御情報・バ
ス制御情報・アドレスを格納するFIFO(First In F
irst Out)バッファ、上記(B)用のバッファ32a
(B),32b(B)は、バス制御情報・アドレスを格
納する一面のバッファ、上記(D)用のバッファ32a
(D),32b(D)は、データ・アドレスを格納する
一面のバッファである。なお、第1バッファ32a及び
32bの構造は互いに同じなので、図2では第1バッフ
ァ32aのみを図示した。
【0026】第2バッファ35は、図3に示すように、
上記(C)用・(D)用の2つのバッファを備えてい
る。上記(C)用のバッファ35(C)は、データ・I
/O制御情報・バス制御情報・アドレスを格納するFI
FOバッファ、上記(D)用のバッファ35(D)は、
バス制御情報・アドレスを格納する一面のバッファであ
る。
【0027】以下、上記(A)〜(D)の4つのケース
に分けて耐故障性システムの動作について説明する。
【0028】まず、上記(A)CPUがI/O装置へデ
ータ・制御情報を書き込む場合について図4を参照して
説明する。図4は耐故障性システムの動作を説明する図
である。
【0029】[ステップSA1]まず、CPU12は情
報処理装置10の第1バス11のバス権を獲得し、該第
1バス11にI/O装置36に対するライトコマンドを
投げる。情報処理装置20と情報処理装置10は同一の
処理を行うので、CPU22は情報処理装置20の第1
バス21のバス権を獲得し、該第1バス21にI/O装
置36に対するライトコマンドを投げる。
【0030】[ステップSA2]第1バスコントローラ
31aは、第1バッファ32aにバス制御情報・データ
・ライトアドレスを格納する。格納が完了したら第1バ
スコントローラ31aは第1バス11に終了信号を出力
する。この時点で、CPU12はライト動作を終了し第
1バス11のバス権を解放する。同様に、第1バスコン
トローラ31bは、第1バッファ32bにバス制御情報
・データ・ライトアドレスを格納する。格納が完了した
ら第1バスコントローラ31bは第1バス21に終了信
号を出力する。この時点で、CPU22はライト動作を
終了し第1バス11のバス権を解放する。
【0031】[ステップSA3]第2バスコントローラ
34は、第2バス33のバス権を獲得する。また、第2
バスコントローラ34は、第1バスコントローラ31a
及び31bの使用権を獲得する。次いで、第2バスコン
トローラ34は、第1バスコントローラ31aに対し
て、第1バッファ32aからライトアドレス・データな
どを比較回路37に入力するよう指示を出す。同様に、
第2バスコントローラ34は、第1バスコントローラ3
1bに対して、第1バッファ32bからライトアドレス
・データなどを比較回路37に入力するよう指示を出
す。
【0032】[ステップSA4]比較回路37によりデ
ータの整合性を照合した結果、両データが「不一致」で
ある場合には、第2バスコントローラ34は第1バスコ
ントローラ31a及び31bに対して当該結果を通知す
る。第1バスコントローラ31a,31bは、それぞれ
CPU12,22へ割込を上げ、障害処理を行い、故障
系を切り離して正常系で処理を継続する。例えば障害処
理としては、それぞれの情報処理装置において、あらか
じめ用意した自律試験項目により診断を実施し、その結
果に基づいてより疑わしい方の情報処理装置を切り離し
正常系で処理を継続させるようにする。一方、前記結果
が「一致」である場合には、第2バスコントローラ34
は第2バス33へライトコマンドを出力する。
【0033】[ステップSA5]該当するI/O装置3
6は、データ・制御情報等を受け取り、第2バス33に
終了信号を出力する。
【0034】[ステップSA6]第2バスコントローラ
34は、I/O装置36からの終了信号を受けて第2バ
ス33のバス権を解放する。次いで、第2バスコントロ
ーラ34は、第1バスコントローラ31a,31bを解
放する。
【0035】次に、上記(B)CPUがI/O装置から
データ・ステータス情報を読み込む場合について図5を
参照して説明する。図5は耐故障性システムの動作を説
明する図である。
【0036】[ステップSB1]まず、CPU12は情
報処理装置10の第1バス11のバス権を獲得し、該第
1バス11にI/O装置36に対するリードコマンドを
投げる。情報処理装置20と情報処理装置10は同一の
処理を行うので、CPU22は情報処理装置20の第1
バス21のバス権を獲得し、該第1バス21にI/O装
置36に対するリードコマンドを投げる。
【0037】[ステップSB2]第1バスコントローラ
31aは、第1バッファ32aにバス制御情報とリード
アドレスを格納する。ここで、第1バスコントローラ3
1aは当該格納が終了しても終了信号を出力しないの
で、CPU12のリード動作は終了しない。同様に、第
1バスコントローラ31bは、第1バッファ32bにバ
ス制御情報とリードアドレスを格納する。ここで、第1
バスコントローラ31bは当該格納が終了しても終了信
号を出力しないので、CPU22のリード動作は終了し
ない。
【0038】[ステップSB3]第2バスコントローラ
34は、第2バス33のバス権を獲得する。また、第2
バスコントローラ34は、第1バスコントローラ31a
及び31bの使用権を獲得する。次いで、第2バスコン
トローラ34は、第1バスコントローラ31aに対し
て、第1バッファ32aからリードアドレスなどを比較
回路37に入力するよう指示を出す。同様に、第2バス
コントローラ34は、第1バスコントローラ31bに対
して、第1バッファ32bからリードアドレスなどを比
較回路37に入力するよう指示を出す。
【0039】[ステップSB4]比較回路37によりデ
ータの整合性を照合した結果、両データが「不一致」で
ある場合には、第2バスコントローラ34は第1バスコ
ントローラ31a及び31bに対して当該結果を通知す
る。第1バスコントローラ31a,31bは、それぞれ
CPU12,22へ割込を上げ、障害処理を行い、故障
系を切り離して正常系で処理を継続する。例えば障害処
理としては、それぞれの情報処理装置において、あらか
じめ用意した自律試験項目により診断を実施し、その結
果に基づいてより疑わしい方の情報処理装置を切り離し
正常系で処理を継続させるようにする。一方、前記結果
が「一致」である場合には、第2バスコントローラ34
は第2バス33へリードコマンドを出力する。
【0040】[ステップSB5]第1バスコントローラ
31a,31b、第2バスコントローラ34は解放状態
となり、すべてのバス33,11,21に流れる情報が
通過する状態となる。
【0041】[ステップSB6]該当するI/O装置3
6は第2バス33にデータを出力する。このデータは、
第2バス33、第1バス11,21を介してCPU1
2,CPU22に入力される。
【0042】[ステップSB7]データを受け取ったC
PU12,22は第1バス11,バス21に終了信号を
出力する。
【0043】[ステップSB8]第2バスコントローラ
34は、CPU12,22両方からの終了信号を確認し
て、第2バス33のバス権を解放する。次いで、第2バ
スコントローラ34は、第1バスコントローラ31a,
31bを解放する。
【0044】次に、上記(C)I/O装置が主記憶装置
へデータを書き込む場合について図6を参照して説明す
る。図6は耐故障性システムの動作を説明する図であ
る。
【0045】[ステップSC1]まず、I/O装置36
は第2バス33のバス権を獲得する。また、I/O装置
36は第2バスコントローラ34の使用権も獲得する。
次いで、第2バス33に主記憶装置13,23に対する
ライトコマンドを投げる。
【0046】[ステップSC2]第2バスコントローラ
34は、第2バッファ35にバス制御情報・データ・ラ
イトアドレスを格納する。格納が終了したら第2バスコ
ントローラ34は第2バス33に終了信号を出力する。
この時点でI/O装置36はライト動作を終了し、第2
バス33のバス権を解放する。
【0047】[ステップSC3]第2バスコントローラ
34は、第1バスコントローラ31a及び31bの使用
権を獲得し、第1バスコントローラ31a及び31bを
介して第1バス11,21のバス権も獲得する。
【0048】[ステップSC4]第1バスコントローラ
31a及び31bは解放状態となり、すべての第1バス
11,21に流れる情報が通過する状態となる。次い
で、第2バスコントローラ34は、第1バスコントロー
ラ31a,31bを介して第1バス11,21に主記憶
装置13,23に対するライト信号及びデータ等を出力
する。
【0049】[ステップSC5]主記憶装置13,23
のメモリアクセスコントローラは、第1バス11,21
からのデータを記憶すると、それぞれ第1バス11,2
1に終了信号を出力する。
【0050】[ステップSC6]第2バスコントローラ
34は、二つの終了信号を受けて第1バス11,21の
バス権を解放する。次いで、第2バスコントローラ34
は、第1バスコントローラ31a及び31bを解放す
る。
【0051】次に、上記(D)I/O装置が主記憶装置
からデータを読み込む場合について図7を参照して説明
する。図7は耐故障性システムの動作を説明する図であ
る。
【0052】[ステップSD1]まず、I/O装置36
は第2バス33のバス権を獲得する。また、I/O装置
36は第2バスコントローラ34の使用権も獲得する。
次いで、第2バス33に主記憶装置13,23に対する
リードコマンドを投げる。
【0053】[ステップSD2]第2バスコントローラ
34は、第2バッファ35にバス制御情報及びリードア
ドレスを格納する。ここで、上記(C)のケースと異な
る点は、当該格納が終了しても第2バスコントローラ3
4は第2バス33に終了信号を出力しないことである。
【0054】[ステップSD3]第2バスコントローラ
34は、第1バスコントローラ31a及び31bの使用
権を獲得し、第1バスコントローラ31a及び31bを
介して第1バス11,21のバス権も獲得する。
【0055】[ステップSD4]第1バスコントローラ
31a,31bは、第2バスコントローラ34からのリ
ード信号のみを通過させるとともに主記憶装置13,2
3からのデータを待つ状態にする。ここで、第2バスコ
ントローラ34は第1バスコントローラ31a,31b
を介して第1バス11,21にリード信号を出力する。
【0056】[ステップSD5]主記憶装置13,23
のメモリアクセスコントローラは、第2バスコントロー
ラ34からのリード信号に対応してデータを第1バス1
1,21に出力する。
【0057】[ステップSD6]第1バスコントローラ
31a,31bは、第1バス11,21からのデータを
それぞれ第1バッファ32a,32bに格納する。
【0058】[ステップSD7]第2バスコントローラ
34は、第1バスコントローラ31aに対して、第1バ
ッファ32aからデータを比較回路37に入力するよう
指示を出す。同様に、第2バスコントローラ34は、第
1バスコントローラ31bに対して、第1バッファ32
bからデータを比較回路37に入力するよう指示を出
す。
【0059】[ステップSD8]比較回路37によりデ
ータの整合性を照合した結果、両データが「不一致」で
ある場合には、第2バスコントローラ34は第1バスコ
ントローラ31a及び31bに対して当該結果を通知す
る。第1バスコントローラ31a,31bは、それぞれ
CPU12,22へ割込を上げ、障害処理を行い、故障
系を切り離して正常系で処理を継続する。例えば障害処
理としては、それぞれの情報処理装置において、あらか
じめ用意した自律試験項目により診断を実施し、その結
果に基づいてより疑わしい方の情報処理装置を切り離し
正常系で処理を継続させるようにする。一方、前記結果
が「一致」である場合には、第2バスコントローラ34
は第2バス33へデータを出力する。
【0060】[ステップSD9]該当するI/O装置3
6は、データ・制御情報を受け取り、第2バス33に終
了信号を出力する。
【0061】[ステップSD10]終了信号を受けた第
2バスコントローラ34は、第1バス11,21を解放
する。次いで、第2バスコントローラ34は、第1バス
コントローラ31a,31bを解放する。
【0062】[ステップSD11]最後に、第2バスコ
ントローラ34は、第2バス33を解放する。
【0063】以上のように、この耐故障性システムで
は、CPU・I/O装置などのバスマスタによるI/O
装置・主記憶装置などのターゲットへのバスアクセス時
点ごとに、第1バスコントローラ31a,31b、第2
バスコントローラ34がバスマスタ・ターゲット間のア
クセスを仲介する。つまり、バスマスタがターゲットへ
アクセスするコマンドをバスに発行すると、ターゲット
の代わりに第1バスコントローラ31a,31b、第2
バスコントローラ34が受信する。そして、第1バスコ
ントローラ31a,31b、第2バスコントローラ34
は、これをバッファに記憶する。このバッファを利用す
ることにより、ライトアクセスの場合はバスコントロー
ラによるバッファへの書き込み終了時点でバスマスタの
トランザクションが終了するので、バスマスタのライト
アクセスを高速化できる。
【0064】一方、第2バスコントローラ34は、情報
処理装置10及び20からの2つの情報が第1バッファ
31a及び第2バッファ31bにそろったことを確認す
ると、比較回路37を用いて情報の整合性を照合する。
照合の結果、情報が一致している場合には第2バスコン
トローラ34はI/O装置36などのターゲットにアク
セスし適切なタイミングでトランザクションを終了させ
る。前記照合の結果、情報が不一致だった場合は、障害
と判断し、第2バスコントローラ34はCPU12,2
2に当該結果を知らせ、その後、正常系だけで処理を継
続する。
【0065】このように、バスコントローラがターゲッ
トの代わりにトランザクションを制御することにより、
データの破壊や他の情報処理装置への影響を与えること
を防止することができる。具体的には、比較回路37の
照合の結果、データが整合性を有していないと判断され
た場合であっても、当該判断の時点ではI/O装置36
などの周辺回路にはデータが出力されていないので、デ
ータの破壊等を防止することができる。
【0066】また、バスマスタのライト動作において、
バスコントロールのバッファへの書き込み終了時にトラ
ンザクションが終了するので、バスマスタのライト動作
を高速化することができる。具体的には、上記(A)及
び(C)におけるCPUのライト動作及びI/O装置の
ライト動作が高速化される。
【0067】なお、上記実施の形態は例示的なものであ
り、本発明はこれに限定されるものではない。本発明の
範囲は特許請求の範囲によって示されており、この特許
請求の範囲の意味の中に入るすべての変形例は本発明に
含まれるものである。例えば、本実施の形態ではI/O
装置36のみを耐故障性機構30に配置しているが、例
えば主記憶装置なども耐故障性機構30側に配置し、メ
モリアクセスに関しても本発明による制御を行ってもよ
い。
【0068】また、本実施の形態では情報処理装置の障
害のみを対象としているが、図8に示すように、第2バ
ス33を多重化することによりI/O装置の障害に対処
できるように構成してもよい。図8の例に係る耐故障性
機構30aでは、第2バスコントローラ34に第2バス
33と並行して第2バス33aを設けるとともに、該第
2バス33aにI/O装置36aを接続している。すな
わち、第2バス33と第2バス33a、I/O装置36
とI/O装置36aは互いに同一のものとする冗長構成
である。このように構成することにより、さらに耐故障
性が向上する。
【0069】さらに、本実施の形態では耐故障性機構3
0を1台のみ設けたが、図9に示すように複数台(図8
では2台)の耐故障性機構30,30bを接続するよう
にしてもよい。また、情報処理装置も3台以上設けるよ
うにしてもよい。このように構成することにより、さら
に耐故障性が向上する。
【0070】さらに、本実施の形態では、情報処理装置
10,20から周辺回路であるI/O装置36へのデー
タ書き込み時において、第1バスコントローラ31a,
31bが第1バッファ32a,32bへのデータ転送を
終了すると、情報処理装置10,20に対して書き込み
終了を通知していたが、当該通知を行わなくても本発明
を実施することができる。同様に、周辺回路であるI/
O装置36から情報処理装置10,20へのデータ書き
込み時において、第2バスコントローラ34が第2バッ
ファ35へのデータ転送を終了すると、I/O装置36
に対して書き込み終了を通知していたが、当該通知を行
わなくても本発明を実施することができる。
【0071】さらに、本実施の形態では、図1などにお
いて第1バスコントローラ31a及び31b,第1バッ
ファ32a及び32b,第2バス33,第2バスコント
ローラ34,第2バッファ35,比較回路37を機能毎
に分けて記載しているが、これらは複数装置で実現して
も同一装置で実現してもよい。例えば、これら全てを一
つのチップに集積したり、バスコントローラとバッファ
の組をそれぞれ一つのチップに集積したり、複数のバッ
ファを一つのチップに集積するとともに複数のバスコン
トローラを一つのチップに集積するようにしてもよい。
【0072】さらに、本発明は、第1バス11及び21
と第2バス31の種類が一致していても異なるものであ
ってもよい。
【0073】
【発明の効果】以上詳述したように、本発明によれば、
各情報処理装置から周辺回路へのデータは該情報処理装
置に対応する第1の記憶手段に記憶され、該第1の記憶
手段に記憶された各情報処理装置に対応するデータの整
合性が照合される。そして、各データが整合性を有して
いる場合には該データは周辺回路側に転送される。した
がって、データが整合性を有していない場合には、あら
かじめ用意された判断手段により疑わしいデータを判別
し該データを周辺回路へ転送しないようすれば一つの情
報処理装置の故障による影響を最小限に留め、データの
破壊や他の情報処理装置への影響を回避することができ
る。また、各情報処理装置にとっては第1の記憶手段に
データが記憶された時点で周辺回路へのデータ転送が完
了したとみなすことができるので、情報処理装置から周
辺回路へのデータ書き込みを高速化することができる。
【図面の簡単な説明】
【図1】耐故障性システムの構成図
【図2】バッファの構造を説明する図
【図3】バッファの構造を説明する図
【図4】耐故障性システムの動作を説明する図
【図5】耐故障性システムの動作を説明する図
【図6】耐故障性システムの動作を説明する図
【図7】耐故障性システムの動作を説明する図
【図8】他の例に係る耐故障性システムの構成図
【図9】他の例に係る耐故障性システムの構成図
【図10】従来の耐故障性システムの構成図
【符号の説明】
10,20…情報処理装置、11,21…第1バス、1
2,22…中央処理装置(CPU)、13,23…主記
憶装置、30…耐故障性機構、31a,31b…第1バ
スコントローラ、32a,32b…第1バッファ、33
…第2バス、34…第2バスコントローラ、35…第2
バッファ、36…I/O装置、37…比較回路
フロントページの続き (72)発明者 青木 道宏 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B083 AA04 AA09 CC06 CD09 CE00 DD01 DD13 EE02 EE03 EE11 GG04 5K014 AA01 CA02 EA01 FA01 5K035 AA03 BB02 CC01 CC10 DD01 EE02 EE04 FF01 LL13 LL14

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 それぞれ中央処理装置とバスとを有し互
    いに同一の処理を行う複数の情報処理装置と、各情報処
    理装置のバスと接続するとともに各情報処理装置におけ
    る処理の同一性を照合する照合手段とを有する耐故障性
    システムにおいて、 前記照合手段を介して各情報処理装置と接続する周辺回
    路を備え、 前記照合手段は、各情報処理装置に対応して設けた第1
    の記憶手段と、各情報処理装置のバスに流れる周辺回路
    へのデータを該情報処理装置に対応する前記第1の記憶
    手段に転送する第1の転送手段と、各第1の記憶手段に
    記憶されているデータの整合性を照合する整合性照合手
    段と、整合性照合手段により各第1の記憶手段に記憶さ
    れているデータが整合性を有していると判定した場合に
    は該データを周辺回路側に転送する第2の転送手段とを
    備えたことを特徴とする耐故障性システム。
  2. 【請求項2】 各情報処理装置から周辺回路へのデータ
    書き込み時において、前記第1の転送手段は、第1の記
    憶手段へのデータ転送が終了すると情報処理装置に対し
    て周辺回路へのデータ書き込みが終了したことを通知す
    ることを特徴とする請求項1記載の耐故障性システム。
  3. 【請求項3】 前記照合手段は、周辺回路側から各情報
    処理装置へのデータを記憶する第2の記憶手段と、該第
    2の記憶手段に記憶されているデータを各情報処理装置
    へ転送するとともに、周辺回路から各情報処理装置への
    データ書き込み時において、第2の記憶手段へのデータ
    転送が終了すると周辺回路に対して情報処理装置へのデ
    ータ書き込みが終了したことを通知する第3の転送手段
    とを備えたことを特徴とする請求項1又は2何れか1項
    記載の耐故障性システム。
  4. 【請求項4】 それぞれ中央処理装置とバスとを有し互
    いに同一の処理を行う複数の情報処理装置と、各情報処
    理装置のバスと接続するとともに各情報処理装置におけ
    る処理の同一性を照合する照合手段とを有する耐故障性
    システムの故障検出方法において、 前記照合手段を介して各情報処理装置と周辺回路とを接
    続し、各情報処理装置に対応して第1の記憶手段を設け
    るとともに、各情報処理装置のバスを流れる周辺回路へ
    のデータを該情報処理装置に対応する第1の記憶手段に
    転送し、各第1の記憶手段に照合すべきデータが揃った
    際に該第1の記憶手段に記憶されているデータの整合性
    を照合し、該照合の結果整合性を有していない場合には
    各情報処理装置に対して結果を報告し、整合性を有して
    いる場合には該データを前記周辺回路に転送することを
    特徴とする耐故障性システムの故障検出方法。
  5. 【請求項5】 各情報処理装置から周辺回路へのデータ
    書き込み時において、第1の記憶手段へのデータ転送が
    終了すると情報処理装置に対して周辺回路へのデータ書
    き込みが終了したことを通知することを特徴とする請求
    項4記載の耐故障性システムの故障検出方法。
JP2000034986A 2000-02-14 2000-02-14 耐故障性システム及びその故障検出方法 Expired - Fee Related JP3597748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000034986A JP3597748B2 (ja) 2000-02-14 2000-02-14 耐故障性システム及びその故障検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000034986A JP3597748B2 (ja) 2000-02-14 2000-02-14 耐故障性システム及びその故障検出方法

Publications (2)

Publication Number Publication Date
JP2001223765A true JP2001223765A (ja) 2001-08-17
JP3597748B2 JP3597748B2 (ja) 2004-12-08

Family

ID=18559246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000034986A Expired - Fee Related JP3597748B2 (ja) 2000-02-14 2000-02-14 耐故障性システム及びその故障検出方法

Country Status (1)

Country Link
JP (1) JP3597748B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230277A (ja) * 2008-03-19 2009-10-08 Nomura Research Institute Ltd 情報処理システム
JP6270950B1 (ja) * 2016-09-26 2018-01-31 東芝エレベータ株式会社 エレベータ、非常用マシンルームレスエレベータ、およびエレベータの制御盤接続切替方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230277A (ja) * 2008-03-19 2009-10-08 Nomura Research Institute Ltd 情報処理システム
JP6270950B1 (ja) * 2016-09-26 2018-01-31 東芝エレベータ株式会社 エレベータ、非常用マシンルームレスエレベータ、およびエレベータの制御盤接続切替方法

Also Published As

Publication number Publication date
JP3597748B2 (ja) 2004-12-08

Similar Documents

Publication Publication Date Title
US7024509B2 (en) Passive release avoidance technique
US5218690A (en) Vme-multibus ii interface adapter for protocol conversion and for monitoring and discriminating accesses on the multibus ii system bus
JP2005353041A (ja) データ処理システム内のバス・トランザクション管理
US7350026B2 (en) Memory based cross compare for cross checked systems
US9891981B2 (en) Information processing apparatus and switch failure detection method
US20020029358A1 (en) Method and apparatus for delivering error interrupts to a processor of a modular, multiprocessor system
JP2001223765A (ja) 耐故障性システム及びその故障検出方法
JP2002269029A (ja) 高信頼性情報処理装置及びそれに用いる情報処理方法並びにそのプログラム
JP3626667B2 (ja) 拡張スロットホットプラグ制御装置
US20020174282A1 (en) Multiprocessor system
US7802041B2 (en) Information processing apparatus including transfer device for transferring requests
JPH1118122A (ja) データ転送方式
JPH0281255A (ja) マルチプロセッサコンピュータ複合装置
JPS5845116B2 (ja) 二重化記憶装置
JPS60502073A (ja) ワンチツプ・マイクロプロセツサを結合する回路装置
US8423699B2 (en) Information processing apparatus and method for controlling information processing apparatus
JP2522855B2 (ja) システム記憶装置の制御システム
JPS6292064A (ja) 並列処理計算機
JPS6159565A (ja) マルチコンピユ−タシステムの割込入力装置
JP2876676B2 (ja) プロセッサ間通信制御方法
JPS63266548A (ja) 二重化計算機システム
JPS6321217B2 (ja)
JP2021166424A (ja) 保護リレー装置
JPS59165171A (ja) マルチプロセツサシステムにおける個別リセツト方式
JPH07210471A (ja) 情報処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees