JP3313667B2 - 二重化システムの障害検出方式及びその方法 - Google Patents

二重化システムの障害検出方式及びその方法

Info

Publication number
JP3313667B2
JP3313667B2 JP17402699A JP17402699A JP3313667B2 JP 3313667 B2 JP3313667 B2 JP 3313667B2 JP 17402699 A JP17402699 A JP 17402699A JP 17402699 A JP17402699 A JP 17402699A JP 3313667 B2 JP3313667 B2 JP 3313667B2
Authority
JP
Japan
Prior art keywords
bus
failure
communication
intersection control
control units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17402699A
Other languages
English (en)
Other versions
JP2001005683A (ja
Inventor
高志 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP17402699A priority Critical patent/JP3313667B2/ja
Publication of JP2001005683A publication Critical patent/JP2001005683A/ja
Application granted granted Critical
Publication of JP3313667B2 publication Critical patent/JP3313667B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、二重化システムの
障害検出方式に関し、特に、他系バスの重大障害を検出
する二重化システムの障害検出方式及びその方法に関す
る。
【0002】
【従来の技術】図4は、従来の二重化システムの障害検
出方式の動作を示す機能ブロック図である。
【0003】図5は、従来の二重化システムの障害検出
方式の動作を示すフローチャートである。
【0004】従来の二重化システムの障害検出方式で
は、自系プロセッサが他系の装置に対して通信要求を出
した際に通信障害の応答が返り、このサイクルを他系全
ての装置の各々に対して繰り返して、他系全ての装置で
の通信障害が応答された時に、他系バス障害と判断して
いた。
【0005】すなわち、従来の二重化システムの障害検
出方式において、他系バス49の重大障害を検出する方
法としては、自系プロセッサ41は、他系の各装置52
乃至54に対してバス交差制御部47,48を介して通
信要求を出しており、バス交差制御部47は、上記通信
要求が出された時点から経過時間のカウントを開始する
と共に、所定の一定の時間を限度とする監視時間内に限
定して通信を正常終了する監視機能を有し、上記監視時
間内に通信が正常に終了しない場合には、通信要求を出
した自系プロセッサ41に対して通信障害の応答を返
す。このサイクルを他系の全ての装置に対して繰り返
し、他系の全ての装置が、通信障害又は監視時間オーバ
ーとなった時点で、自系プロセッサ41は、他系バス障
害が発生しているものと判断し、バス交差制御部47
が、他系との通信を止める方式であった。
【0006】実際には、上記監視時間内に通信が正常に
終了しない場合には、バス交差制御部47は、その後、
さらに2回のリトライを行っていることと、自系プロセ
ッサ41が、常に他系の各装置に対して通信を行う訳で
はないために、バス交差通信の遮断までにはもっと時間
がかかる。
【0007】
【発明が解決しようとする課題】しかし、上記の従来方
式では、他系バス49に重大障害が起きた際に、上記障
害が起きた時点から、自系プロセッサ41がそれを判断
してバス交差制御部47に他系との通信を止める命令を
出すまでの期間に時間がかかり過ぎ、回復処理が迅速に
実施されない欠点があった。
【0008】なお、特開平5−88787号公報(特願
平3−250726号)において本発明の分野に関連す
る「二重化データ処理装置」が開示されているが、この
発明はデータ処理装置状態情報をレジスタに書きこみ、
中央処理装置が所定時期に読み取る方法であり、本発明
では、バス交差制御部が自系プロセッサ1に対し障害割
り込みを行うので、この点で相異がある。また、この発
明に対する本発明の優位性は通常状態でもプロセッサが
所定時期にレジスタアクセスをする必要がないことと、
バス交差制御部が自立的に障害を検出することと、強制
的なバス交差通信の遮断および障害割り込みの為に処理
時間が早いことである。
【0009】本発明は、以上のような従来の二重化シス
テムの障害検出方式における問題点に鑑みてなされたも
のであり、他系バスに生じた重大障害を迅速に検出する
ことができる二重化システムの障害検出方式及びその方
法を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明による二重化シス
テムの障害検出方式は、第1のバスに接続されたプロセ
ッサ,外部記憶装置,通信装置,バス交差制御部をそれ
ぞれ1つ又は2つ以上含む第1の系と、第2のバスに接
続されたプロセッサ,外部記憶装置,通信装置,バス交
差制御部をそれぞれ1つ又は2つ以上含む第2の系とを
有し、上記第1のバスに接続されたバス交差制御部と上
記第2のバスに接続されたバス交差制御部が互いに接続
されて成る二重化システムの障害検出方式であって、前
記バス交差制御部の各々は、互いに他系装置宛のアドレ
スを設定して互いに他系装置と順次通信を行う通信手段
と、前記通信手段による通信中に、他系のいずれかの連
続する2つ以上のアドレスの装置で通信のタイムアウ
ト、シーケンスエラー又は障害割込み通知のいずれかが
発生した際に、他系バス障害と判断する他系バス障害判
定手段とを有すること、を特徴とする。
【0011】また、本発明による二重化システムの障害
検出方式は、上記の二重化システムの障害検出方式にお
いて、前記バス交差制御部の各々は、前記他系バス障害
判定手段により、他系バス障害が発生しているとの判断
をなした後で、強制的にバス交差通信を遮断し、自系の
プロセッサに前記他系バス障害発生の通知をする手段を
有することを特徴とする。
【0012】更に、本発明による二重化システムの障害
検出方式は、上記の二重化システムの障害検出方式にお
いて、前記プロセッサの各々は、自系の前記バス交差制
御部からの前記他系バス障害発生の通知を受けた後で、
他系への通信を止めて、回復処理を開始する手段を有す
ることを特徴とする。
【0013】本発明による二重化システムの障害検出方
法は、第1のバスに接続されたプロセッサ,外部記憶装
置,通信装置,バス交差制御部をそれぞれ1つ又は2つ
以上含む第1の系と、第2のバスに接続されたプロセッ
サ,外部記憶装置,通信装置,バス交差制御部をそれぞ
れ1つ又は2つ以上含む第2の系とを有し、上記第1の
バスに接続されたバス交差制御部と上記第2のバスに接
続されたバス交差制御部が互いに接続されて成る二重化
システムのための障害検出方法であって、前記バス交差
制御部の各々が、互いに他系装置宛のアドレスを設定し
て互いに他系装置と順次通信を行う通信ステップと、前
記通信ステップを実行中に、他系のいずれかの連続する
2つ以上のアドレスの装置で通信のタイムアウト又はシ
ーケンスエラー又は障害割込み通知のいずれかが発生し
た際に、他系バス障害と判断する他系バス障害判定ステ
ップとを実行することを特徴とする。
【0014】また、本発明による二重化システムの障害
検出方法は、上記の二重化システムの障害検出方法にお
いて、前記バス交差制御部の各々は、前記他系バス障害
判定ステップの実行により、他系バス障害が発生してい
るとの判断をなした後で、強制的にバス交差通信を遮断
し、自系のプロセッサに前記他系バス障害発生の通知を
するステップを有することを特徴とする。
【0015】更に、本発明による二重化システムの障害
検出方法は、上記の二重化システムの障害検出方法にお
いて、前記プロセッサの各々は、自系の前記バス交差制
御部からの前記他系バス障害発生の通知を受けた後で、
他系への通信を止めて、回復処理を開始するステップを
有することを特徴とする。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
【0017】図1は、本発明の実施の形態に係る二重化
システムの障害検出方式の全体構成を示すブロック図で
ある。
【0018】本実施の形態に係る二重化システムの障害
検出方式は、バス6に接続された自系に含まれるプロセ
ッサ1と、外部記憶装置2と、通信制御装置3,4,5
と、バス9に接続された他系に含まれるプロセッサ11
と、外部記憶装置12と、通信制御装置13,14,1
5と、上記の自系と他系とを接続するバス交差制御部
7,8を備えている。
【0019】上記の自系と他系の二つの系は、バス交差
制御部7,8から交差バス通信を行い相互にデータを転
送する。なお、上記の二重化システムのバス交差制御部
7,8に他系バス障害検出機能を追加的に設置してい
る。この機能は、他系装置宛のアドレスを設定し、上位
アドレスの装置から順次通信を行うことで各装置の正常
性をチェックする。障害検出の条件は、各装置に対する
通信のタイムアウト又はシーケンスエラーと各装置から
の障害割込み通知(割り込みによって通知される障害の
通知)とのいずれかが、連続する2つ以上のアドレスの
装置で発生した時に、他系バス障害と判断する仕組みで
ある。障害検出後、バス交差制御部7は、強制的にバス
交差通信を遮断し、自系のプロセッサ1への障害割込通
知を送信する。
【0020】図2は、本発明の実施の形態に係る二重化
システムの動作を示す機能ブロック図である。
【0021】以下、本実施の形態に係る二重化システム
の障害検出方式の基本機能を説明する。
【0022】本実施の形態に係る二重化システムでは、
自系の交差バス制御部に、他系装置をアクセスするた
めのアドレスを設定し、かつ交差バス制御部に、交差
バス制御部が、上記アドレスの上位アドレスに位置す
る装置から順次に通信を行うことで各装置の正常性をチ
ェックすることができるバス障害検出機能を追加した。
これにより、自系のバス交差制御部は、他系の各装置
に対する通信のタイムアウト又はシーケンスエラー、若
しくは、各装置からの障害割込み通知のいずれかが連続
する2つ以上のアドレスの装置で発生した時に、他系バ
スの重大障害と判断し、強制的にバス交差通信を遮断し
て、自系プロセッサ1に対して障害割込通知を行う。
【0023】すなわち、図2に示すように、片系(他
系)のシステムにおいて、装置の物理的破損や電源装置
故障などシステム機能のほとんどを同時に失ってしまう
ような重大故障が発生した場合、上記したように、他系
バス障害検出機能を追加した交差バス制御部7は、他系
において、通信のタイムアウト又はシーケンスエラー、
若しくは、各装置からの障害割込み通知のいずれかが、
連続するアドレスで示される2つ以上の装置で生じた時
に、他系バスの重大障害と判断する。
【0024】この時、バス交差制御部7は、強制的にバ
ス交差通信を遮断し、自系プロセッサ1に対して障害割
り込み通知を行う。自系プロセッサ1は、この障害割り
込み通知を受け、他系への通信を止めて、回復処理を開
始する。
【0025】なお、障害通知から障害割り込み通知まで
の処理は、全て他系から独立したハードウェアのみで行
うことで、処理速度と信頼性を向上させている。
【0026】図3は、本発明の実施の形態に係る二重化
システムの動作を示すフローチャートである。
【0027】以下、図1,2を参照しつつ、図3に示す
フローチャートを使用して本実施の形態に係る二重化シ
ステムの動作を説明する。
【0028】まず、ステップS1では、他系バスに重大
障害が発生する。すると、ステップS2にて、他系バス
障害検出機能を追加されている交差バス制御部7が、他
系において、通信のタイムアウト又はシーケンスエラ
ー、若しくは、各装置からの障害割込み通知のいずれか
が、連続するアドレスで示される2つ以上の装置で生じ
たことを検出する。
【0029】ステップS3では、交差バス制御部7が、
上記検出結果から他系バスに重大障害が発生したと判断
する。
【0030】ステップS4では、交差バス制御部7が、
強制的にバス交差通信を遮断し、自系プロセッサ1に対
して障害割り込み通知を行う。
【0031】ステップS5では、自系プロセッサ1が、
上記の障害割り込み通知を受け、他系への通信を止め
て、回復処理を開始する。
【0032】
【発明の効果】以上説明した本発明によれば、他系バス
に重大障害が発生してから、自系プロセッサが他系への
通信を止めるまでの期間において、システムが障害検出
のために必要とする処理時間は、連続するアドレスの2
装置に対する通信と、その結果の検証のみであるので、
障害による処理中断時間を短縮することができる。その
結果、二重化システムに対して信頼性の高い障害検出シ
ステムを構築することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る二重化システムの障
害検出方式の全体構成を示すブロック図である。
【図2】本発明の実施の形態に係る二重化システムの動
作を示す機能ブロック図である。
【図3】本発明の実施の形態に係る二重化システムの動
作を示すフローチャートである。
【図4】従来の二重化システムの障害検出方式の動作を
示す機能ブロック図である。
【図5】従来の二重化システムの障害検出方式の動作を
示すフローチャートである。
【符号の説明】
1,11 プロセッサ 2,12 外部記憶装置 3,4,5,13,14,15 通信制御装置 6,9 バス 7,8 バス交差制御部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G06F 15/177 678 G06F 15/177 678A (58)調査した分野(Int.Cl.7,DB名) G06F 11/16 - 11/20 G06F 13/00 G06F 13/20 - 13/378 G06F 15/16 - 15/177

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1のバスに接続されたプロセッサ,外
    部記憶装置,通信装置,バス交差制御部をそれぞれ1つ
    又は2つ以上含む第1の系と、第2のバスに接続された
    プロセッサ,外部記憶装置,通信装置,バス交差制御部
    をそれぞれ1つ又は2つ以上含む第2の系とを有し、上
    記第1のバスに接続されたバス交差制御部と上記第2の
    バスに接続されたバス交差制御部が互いに接続されて成
    る二重化システムの障害検出方式であって、 前記バス交差制御部の各々は、互いに他系装置宛のアド
    レスを設定して互いに他系装置と順次通信を行う通信手
    段と、前記通信手段による通信中に、他系のいずれかの
    連続する2つ以上のアドレスの装置で通信のタイムアウ
    ト、シーケンスエラー又は障害割込み通知のいずれかが
    発生した際に、他系バス障害と判断する他系バス障害判
    定手段とを有すること、 を特徴とする二重化システムの障害検出方式。
  2. 【請求項2】 前記バス交差制御部の各々は、前記他系
    バス障害判定手段により、他系バス障害が発生している
    との判断をなした後で、強制的にバス交差通信を遮断
    し、自系のプロセッサに前記他系バス障害発生の通知を
    する手段を有することを特徴とする請求項1記載の二重
    化システムの障害検出方式。
  3. 【請求項3】 前記プロセッサの各々は、自系の前記バ
    ス交差制御部からの前記他系バス障害発生の通知を受け
    た後で、他系への通信を止めて、回復処理を開始する手
    段を有することを特徴とする請求項1又は請求項2記載
    の二重化システムの障害検出方式。
  4. 【請求項4】 第1のバスに接続されたプロセッサ,外
    部記憶装置,通信装置,バス交差制御部をそれぞれ1つ
    又は2つ以上含む第1の系と、第2のバスに接続された
    プロセッサ,外部記憶装置,通信装置,バス交差制御部
    をそれぞれ1つ又は2つ以上含む第2の系とを有し、上
    記第1のバスに接続されたバス交差制御部と上記第2の
    バスに接続されたバス交差制御部が互いに接続されて成
    る二重化システムのための障害検出方法であって、 前記バス交差制御部の各々が、互いに他系装置宛のアド
    レスを設定して互いに他系装置と順次通信を行う通信ス
    テップと、前記通信ステップを実行中に、他系のいずれ
    かの連続する2つ以上のアドレスの装置で通信のタイム
    アウト又はシーケンスエラー又は障害割込み通知のいず
    れかが発生した際に、他系バス障害と判断する他系バス
    障害判定ステップとを実行することを特徴とする二重化
    システムの障害検出方法。
  5. 【請求項5】 前記バス交差制御部の各々は、前記他系
    バス障害判定ステップの実行により、他系バス障害が発
    生しているとの判断をなした後で、強制的にバス交差通
    信を遮断し、自系のプロセッサに前記他系バス障害発生
    の通知をするステップを有することを特徴とする請求項
    4記載の二重化システムの障害検出方法。
  6. 【請求項6】 前記プロセッサの各々は、自系の前記バ
    ス交差制御部からの前記他系バス障害発生の通知を受け
    た後で、他系への通信を止めて、回復処理を開始するス
    テップを有することを特徴とする請求項4又は請求項5
    記載の二重化システムの障害検出方法。
JP17402699A 1999-06-21 1999-06-21 二重化システムの障害検出方式及びその方法 Expired - Fee Related JP3313667B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17402699A JP3313667B2 (ja) 1999-06-21 1999-06-21 二重化システムの障害検出方式及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17402699A JP3313667B2 (ja) 1999-06-21 1999-06-21 二重化システムの障害検出方式及びその方法

Publications (2)

Publication Number Publication Date
JP2001005683A JP2001005683A (ja) 2001-01-12
JP3313667B2 true JP3313667B2 (ja) 2002-08-12

Family

ID=15971346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17402699A Expired - Fee Related JP3313667B2 (ja) 1999-06-21 1999-06-21 二重化システムの障害検出方式及びその方法

Country Status (1)

Country Link
JP (1) JP3313667B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5537403B2 (ja) * 2010-12-24 2014-07-02 株式会社東芝 二次電池装置、および、車両
JP5590022B2 (ja) * 2011-12-28 2014-09-17 富士通株式会社 情報処理装置、制御方法および制御プログラム
JP5800058B2 (ja) * 2014-05-26 2015-10-28 富士通株式会社 情報処理装置、制御方法および制御プログラム
JP6680030B2 (ja) 2016-03-24 2020-04-15 富士通株式会社 制御プログラム、制御方法、および制御装置

Also Published As

Publication number Publication date
JP2001005683A (ja) 2001-01-12

Similar Documents

Publication Publication Date Title
US6802023B2 (en) Redundant controller data storage system having hot insertion system and method
US6715101B2 (en) Redundant controller data storage system having an on-line controller removal system and method
US6708285B2 (en) Redundant controller data storage system having system and method for handling controller resets
JP5347414B2 (ja) 同期制御装置,情報処理装置及び同期管理方法
JP3313667B2 (ja) 二重化システムの障害検出方式及びその方法
JP3420919B2 (ja) 情報処理装置
JPS6146543A (ja) 転送装置の障害処理方式
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
JPH10232704A (ja) 二重化プログラマブルコントローラ
JPH04360242A (ja) 二重化システムの系切替装置およびその方法
JP2746184B2 (ja) 障害ロギングシステム
JPS59119451A (ja) 電子計算機システムの診断方式
JPH0588944A (ja) 情報処理システムの入出力制御監視方式
JPS6375843A (ja) 異常監視方式
JPH11265321A (ja) 障害復旧方法、中央処理装置及び中央処理システム
JP2814988B2 (ja) 障害処理方式
JP2815730B2 (ja) アダプタ及びコンピュータシステム
JP3033640B2 (ja) Cpu動作監視回路
JPH04305758A (ja) 情報処理装置
JP2002182994A (ja) 情報処理システム及びそれに用いる転送制御方法
JPH0575136B2 (ja)
JP2000330829A (ja) 系間通信処理装置
JPS6134654A (ja) バスマスタ制御装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees