JPH04211841A - 二重化処理装置 - Google Patents

二重化処理装置

Info

Publication number
JPH04211841A
JPH04211841A JP3053659A JP5365991A JPH04211841A JP H04211841 A JPH04211841 A JP H04211841A JP 3053659 A JP3053659 A JP 3053659A JP 5365991 A JP5365991 A JP 5365991A JP H04211841 A JPH04211841 A JP H04211841A
Authority
JP
Japan
Prior art keywords
error
cpu
processing
memory
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3053659A
Other languages
English (en)
Inventor
Takao Hayashi
孝雄 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3053659A priority Critical patent/JPH04211841A/ja
Publication of JPH04211841A publication Critical patent/JPH04211841A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、2つの処理系が互いに
同期して命令を実行する二重化処理装置に関する。
【0002】
【従来の技術】確実なデジタル処理を行う方法に、二つ
の処理系が互いに同期して同一の命令を実行する二重化
処理装置が提案されている。このような構成にすると仮
に一方の系のデータが異常となっても、他方の系のデー
タは正常であるのでそのまま処理を実行できる。また、
一方の系がダウンしても他方の系で処理を実行すること
ができる。
【0003】このためには一方の処理系でエラーを検出
すると、その処理系を即座に切り離すことが必要となる
が、この方法は例えば、米国特許第4453215号、
第4654857号、第4750177号に開示されて
いる。
【0004】
【発明が解決しようとする課題】しかしながらこの先行
技術は一方の系に一時的なエラーが発生してもその系を
切り離さなければならない。また、一過性のエラーであ
っても再試行を行うとエラーを検出した処理系だけで再
試行が行われるため両系の動作が不一致となり、二重化
できないためやはり、切り離さなければならない。この
ように一過性のエラーであっても二重化処理が継続でき
ないことは、システムのアベイラビリティの低下を招く
ことになり、また一方が切り離された後に稼働中の装置
が障害を起こすと、仮に他方が正常であってもシステム
ダウンとなってしまうという課題があった。
【0005】
【課題を解決するための手段】このような課題を解決す
るために本発明は、2つの処理系を有し各処理系が互い
に同期して命令を実行する二重化処理装置のうち、いず
れかの処理系にエラーが発生したとき、双方の処理系の
動作を前記エラーを検出したステップで停止させ、各処
理系の再試行を行わせるようにしたものである。
【0006】
【作用】エラーが発生したステップで処理が停止し、そ
の段階で再試行が行われ、それによってエラーが消滅す
ればそのまま運転を再開し、その再試行でもエラーが消
滅しない場合は、エラーの発生した処理系を切り離して
運転を再開する。
【0007】
【実施例】図1は本発明の一実施例を示すブロック図で
あり、2台の演算処理部11A、11B(以下、CPU
11A、11Bと称する)と、それに対応する2台のメ
モリ12A、12Bとの間の情報転送に関し、本発明を
適用したものである。
【0008】今、図の左側をA系、右側をB系と呼ぶこ
とにする。この装置は電源投入時点において、一方を待
機系とする必要があるが、それは図示しない装置によっ
て後述するアクティブ系装置指定レジスタのセットによ
って行っている。
【0009】また、メモリ12A,12BとCPU11
A,11Bとの間にそれぞれアドレスバス13A,13
B、データバス14A,14B、コントロールバス15
A,15B、が設けられている。コントロールバス15
A,15Bはアドレスストローブ線、データアクノリッ
ジ、エラー通知線からなる。
【0010】アドレスバス13A,13B、データバス
14A,14B、コントロールバス15A,15Bは、
バス制御ユニット16A,16Bを介してそれぞれ制御
される。また、エラーが発生した場合や、これらバス制
御の都合上、CPU11A,11Bを停止させるための
停止判定論理手段17A,17Bがそれぞれの処理系に
設けられている。
【0011】バス制御ユニット16A,16Bと、自系
の停止判定論理手段17A,17Bの間は、アクノリッ
ジ信号を伝送するデータアクノリッジ線21A,21B
、エラーステータスを伝送する自系エラー通知線22A
,22B、再試行要求線24A,24Bで結ばれ、他系
の停止判定論理手段17A,17Bとの間は他系エラー
通知線25A,25Bで結ばれている
【0012】バス
制御ユニット16A,16BとCPU11A,11Bと
の間は自系リセット線26A,26Bとアドレス・デー
タ・コントロールバス27A,27Bで結ばれている。 CPU11A,11Bは他系リセット線28A,28B
で結ばれている。
【0013】いま、アクティブ系をA系として、2重化
運転の概要について説明し、その後に細部の動作に付い
て説明する。
【0014】CPU11A,11Bは一般の情報処理装
置と同じようにそれぞれのメモリ12A、12Bから命
令を読んだり、データを読み書きして処理を行う。この
ときのアドレスバス13、データバス14、コントロー
ルバス15のタイミングをCPU11からのメモリリー
ドアクセスについて示したものが図2である。このタイ
ミング制御はバス制御ユニット16で行われる。
【0015】CPU11は図2(b)に示すアドレス信
号を送出した後、(a)に示すアドレスストローブ信号
を出す。メモリ12はアドレスストローブ信号のタイミ
ングによりアドレス信号を受け取り、メモリ動作を開始
する。メモリデータが準備できるとメモリ12は図2(
d)に示すデータをデータバス14に送出し、図2(c
)に示すデータアクノリッジ信号をCPU11に返す。
【0016】CPU11はデータアクノリッジ信号によ
って、図2(d)で示すデータバス14上のデータを取
り込む。CPU11は図2(c)に示すデータアクノリ
ッジ信号が返送されるまで、または再試行完了まで停止
する。これはCPU11の停止判定論理手段17で行わ
れる。
【0017】メモリ11内で何らかのエラーを検出した
ならば、図2(e)に示すエラーステータスを0にして
バス制御ユニット16へメモリ12でエラーが発生した
ことを伝える。2重化処理としてはCPU11Aがメモ
リ12Aを使用し、CPU11Bがメモリ12Bを使用
して、各系は全く同一の動作を行う。この時B系でエラ
ーが検出されると、図2(f)の停止要求信号と図2(
e)のエラーステータス信号は停止判断論理手段17A
,17Bを介した停止要求線23に送出される停止要求
信号によって、CPU11A,11Bを共に停止させる
【0018】エラーが発生するとバス制御ユニット16
A,16Bは再試行を行い、それによってバス上のエラ
ーが消えることを期待する。エラーが一過性のものであ
り再試行によってバス上のエラーが消滅すると、停止判
定論理手段17A,17Bが停止要求線23の信号レベ
ルを1に戻すことによってCPU11A,11Bの命令
実行停止が解除され、先へ進む。
【0019】B系のエラーステータスがA系CPU11
Aの停止判定論理手段17Aに入力されているため、エ
ラーが発生したとき、A系のCPU11Aも停止させる
。つまり、A系ではエラーが発生していないのであるが
、両系を2重化運転のまま再試行し、成功すればそのま
ま処理を続行するようにしている。
【0020】もし、再試行が失敗した場合、すなわち固
定的なエラーの場合は、A系のCPU11Aは処理を継
続し、B系のCPU11Bは運転から切り離される。こ
の切り離しはB系のCPU11Bが割り込みを発生する
ことで行われる。また、A系のCPU11AはB系で再
試行が行われたことを知っているので、一重化運転に入
ったことがわかる。
【0021】以上が二重化運転の概略であるが、次に細
部の動作をについて説明を行う。前述の概略説明での動
作は次のようになっているものとする (a)両系に供給されるクロック信号は一つのクロック
源から供給されているものとする。 (b)起動時は先ず一方の系が動作を開始する。これは
どちらが先に動作を開始するかを決めておいても良いし
、偶然性に委ねても良い。ただし、起動時は一方の系が
動作を開始すると他方の系は待機状態となり、オンライ
ンソフウェアを実行していない状態である。先に動作す
る系をACT系と呼び、待機している系をSBY系と呼
ぶ。このSBY系も命令が与えられればその命令は実行
できる。 (c)ACT系のCPUは自系メモリを読み出し、自系
および他系に書き込む。他系へのメモリデータは図1の
他系交差線を介して送出される。 (d)ACT系から自系および他系リセット線により、
リセット信号を自系および他系に送出する。 (e)両系のメモリ内容が同一であり、クロックも同一
で、リセットが同時にかかるため、両系は全く同じ動き
を行うため、リセット以降は並列運転となる。なお、こ
れは必ずしもリセットでなくても、例えば割り込みを両
系にたいして行っても良い。また、並列運転中は自系/
他系障害が自系/他系障害通知線で通知された場合、停
止要求線により、CPUの動作を停止させる。ここで停
止とは停止要求が解除され、正しいデータが準備できる
までCPUが待つことを意味している。
【0022】以下の説明中で、障害検出は次の条件を満
たすものとする。 (a)並列運転中は自系で発生する障害は自系で検出す
るものとする。 (b)他系で発生した障害をする手段は、他系エラー通
知線だけである。 図3は停止判断論理手段17の内部構成を示すブロック
図である。図3において、171はアクティブ系装置指
定レジスタ、172は自系障害表示レジスタ、173は
他系障害表示レジスタ、174は状態カウンタ、175
はデコーダである。このデコーダ175は状態カウンタ
174のカウント結果が1のときに端子aからHレベル
、端子bからLレベルの信号を出力する。また、状態カ
ウンタ174のカウント結果が2のとき端子aからLレ
ベルの信号を出力し、端子bからHレベルの信号を出力
する。そして状態カウンタ174のカウント結果が3以
上の時は端子a,bともにLレベルの信号を出力するよ
うになっている。記号176〜178はオア回路、記号
179〜185はアンド回路である。
【0023】図4はバス制御ユニット16の内部構成を
示すブロック図であり、161〜163はセレクタ16
4はアドレスレジスタ、165はデータレジスタ、16
6はコントロールレジスタ、167はタイミング制御回
路、168はパリティチェック回路である。
【0024】このように構成された装置において、一つ
の系でエラーが発生すると、その情報はエラーを発した
系と、他系に自系/他系エラー通知線25で通知される
。自系と他系は物理的に接近して配置され、自系エラー
と他系エラーは同時に報告される。これにより、両系の
CPUはデータバスに与えられたデータが自系あるいは
他系で異常であるとして両系に正しいデータが揃うまで
待ち合わせを行う。
【0025】バス制御ユニット16は最も新しいメモリ
アクセスのアドレス/データおよびアクセス種別を保持
しており、同じステップにおいて両方の系で再試行を行
う。同じステップで行っているのはこのエラーしたバス
サイクルを繰り返すことを意味している。
【0026】例えばのCPUからメモリの100番地を
読み出したとき、パリティエラーが発生したとする。こ
れによりエラーを検出したバス制御ユニット16は再度
、メモリの100番地を読み出し動作を行う。もし、1
回の試行でエラーが消滅すれば、正しいメモリデータが
両系CPUに与えられると共に、停止要求は解除される
ために、CPUは動作を先に進めることができる。
【0027】障害は一過性のものだけではなく、固定的
なものもあるため、ここでは1回の再試行が失敗すると
以下の手順で失敗した系を切り離し、並列運転を解除す
る。
【0028】停止判定論理手段17は状態カウンタ17
4を持っており、その初期値はリセットにより0になっ
ている。CPU11からのバス要求の後、メモリ12か
らのアクノリッジで自系/他系エラーが報告されると、
状態カウンタ174はカウントをインクリメントする 
(オア回路176、アンド回路181、オア回路177
による)。ただし、メモリからのアクノリッジが与えら
れただけで、自系/他系エラーが無ければ、状態カウン
タ174は変化しない。
【0029】停止判定論理手段17はアクノリッジが与
えられたとき自系/他系エラーがあると、バス制御ユニ
ット16に対して再試行要求を送出する。再試行中に(
つまり状態カウンタが1の時に)メモリ12からアクノ
リッジが返送されたとき、自系/他系エラーが無ければ
状態カウンタ174はリセットされ(アンド回路183
、オア回路178により)、停止要求線23に送出され
る停止要求信号もHレベルとなって停止要求を解除する
【0030】メモリ12からアクノリッジが返送されて
きたとき、自系エラーがあれば、状態カウンタ174は
更にインクリメントされ(アンド回路182、オア回路
177による)その系が固定障害を持つと判断される。 このとき、自系のアクティブ系装置指定レジスタ171
がHレベルの信号を出力していると、リセットされるた
め、自系がSBY系となる(アンド回路182および1
80による)。
【0031】メモリ12からアクノリッジが返送された
とき、他系エラーがあれば状態カウンタ174はリセッ
トされるとともに、他系障害表示レジスタ173がセッ
トされ、他系が固定障害を持つと判断される(アンド回
路184、オア回路178による)。このとき自系アク
ティブ系装置指定レジスタ171がLレベルを送出して
いるとHレベルの信号を送出するようになり(セットさ
れるため)自系がACT系となる。他系障害表示レジス
タ173がセットされると他系障害通知線25はアンド
回路185により遮断される。これにより正常な系は再
試行後、先に進むことができる。従って、他系障害表示
レジスタ173がセットされると自系の一時障害だけが
停止判定対象となる。なお、以上の説明は一回の再試行
でエラーが快復しない場合、エラーを発生した系を切り
離すようにしたが、これは複数回行っても良い。
【0032】
【発明の効果】以上説明したように本発明は、エラーが
発生したときはそのステップで処理を一時停止し、その
段階で再試行を行い、その結果エラーが消滅すればその
まま二重化運転を再開するようにしたので、一過性のエ
ラーによって二重化が切り離されてしまうことがなく、
システムダウンの可能性が少なくかつ、システムのアベ
イラビリティが良いという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図
【図2】図
1の装置のタイミングダイヤグラム
【図3】図1の装置
に用いられている停止判定論理手段の内部構成を示す回
路図
【図4】図1の装置に用いられているバス制御ユニット
の内部構成を示すブロック図
【符号の説明】
11A,11B  CPU 12A,12B  メモリ 16A,16B  バス制御ユニット 17A,17B  停止判定論理手段 161〜163  セレクタ 164〜166、171〜173  レジスタ167 
         タイミング制御回路168    
      パリティチェック回路174      
    状態カウンタ175          デコ
ーダ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】    2つの処理系を有し各処理系が互
    いに同期して命令を実行する二重化処理装置において、
    前記いずれかの処理系にエラーが発生したとき双方の処
    理系の動作を前記エラーを検出したステップで停止させ
    る停止判定論理手段と、前記各処理系の再試行を行う再
    試行手段とを備えたことを特徴とする二重化処理装置。
JP3053659A 1990-03-09 1991-02-27 二重化処理装置 Pending JPH04211841A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3053659A JPH04211841A (ja) 1990-03-09 1991-02-27 二重化処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2-56472 1990-03-09
JP5647290 1990-03-09
JP3053659A JPH04211841A (ja) 1990-03-09 1991-02-27 二重化処理装置

Publications (1)

Publication Number Publication Date
JPH04211841A true JPH04211841A (ja) 1992-08-03

Family

ID=26394366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3053659A Pending JPH04211841A (ja) 1990-03-09 1991-02-27 二重化処理装置

Country Status (1)

Country Link
JP (1) JPH04211841A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5572662A (en) * 1994-08-23 1996-11-05 Fujitsu Limited Data processing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5572662A (en) * 1994-08-23 1996-11-05 Fujitsu Limited Data processing apparatus

Similar Documents

Publication Publication Date Title
JP2532317B2 (ja) プロセス制御システムにおける汎用入出力冗長方式のバックアップ方法
JP5347414B2 (ja) 同期制御装置,情報処理装置及び同期管理方法
JPH01154242A (ja) 二重ゾーンの耐欠陥コンピュータシステム
JPH0792765B2 (ja) 入/出力コントローラ
JP2006178636A (ja) フォールトトレラントコンピュータ、およびその制御方法
US20040193735A1 (en) Method and circuit arrangement for synchronization of synchronously or asynchronously clocked processor units
WO2010100757A1 (ja) 演算処理システム、再同期方法、およびファームプログラム
JPH0375834A (ja) パリティの置換装置及び方法
JP3063334B2 (ja) 高信頼度化情報処理装置
JPH04211841A (ja) 二重化処理装置
JP3536293B2 (ja) 二重化コンピュータ装置
JPS6128141B2 (ja)
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JPH07114521A (ja) マルチマイクロコンピュータシステム
JPH0471037A (ja) 電子計算機の二重化方式
JPS6113627B2 (ja)
JPS60140438A (ja) 情報処理系の系切替制御方式
JPH05233576A (ja) 二重システム
JP2815730B2 (ja) アダプタ及びコンピュータシステム
JPH06124242A (ja) 二重化共有メモリ等価性保証方式
JP3055906B2 (ja) 緊急動作方式
JPH0430224A (ja) タスクの実行継続方法
JPH01284947A (ja) 二重化バス切り替え方法
JPH11265321A (ja) 障害復旧方法、中央処理装置及び中央処理システム
JPS61150041A (ja) 二重化情報処理システム