JPH0916535A - マルチプロセッサ計算機 - Google Patents

マルチプロセッサ計算機

Info

Publication number
JPH0916535A
JPH0916535A JP7160866A JP16086695A JPH0916535A JP H0916535 A JPH0916535 A JP H0916535A JP 7160866 A JP7160866 A JP 7160866A JP 16086695 A JP16086695 A JP 16086695A JP H0916535 A JPH0916535 A JP H0916535A
Authority
JP
Japan
Prior art keywords
input
output
processing unit
processors
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7160866A
Other languages
English (en)
Inventor
Hiroshi Okamoto
弘 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP7160866A priority Critical patent/JPH0916535A/ja
Publication of JPH0916535A publication Critical patent/JPH0916535A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 1モジュールに障害が発生しても動作するフ
ォールトトレラント性を有し、かつ構成が容易で高速動
作が必要ないマルチプロセッサ計算機を得る。 【構成】 異なる処理を行う複数のプロセッサと、これ
らプロセッサに接続されるシステムバスと、このシステ
ムバスに接続される主記憶と、システムバスに接続され
て入出力バスとのインタフェースをとる入出力インタフ
ェースとを1つのプロセッシングユニットとして、同一
の動作を行う複数のプロセッシングユニットと、このプ
ロセッシングユニットの外部にあって各入出力インタフ
ェースからの出力を比較して選択結果を入出力バスに出
力する入出力アダプタと、入出力バス経由で入出力アダ
プタとデータの授受を行う入出力装置を備えた。また更
に、入出力アダプタは、各入出力インタフェースからの
出力を多数決比較をして入出力バスに出力する入出力ア
ダプタとした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、多重化による高信頼
化マルチプロセッサにおいて、障害発生時に、システム
として処理を続行可能ならしめるフォールトトレラント
計算機に関するものである。
【0002】
【従来の技術】フォールトトレラント計算機の分野にお
いて、計算機の信頼性を高める方法として、故障率の高
いモジュールを多重化し、あるモジュールが故障しても
残りのモジュールで正しい動作を行う方式が一般的にと
られている。この、多重化の範囲はCPU、メモリ、バ
スなどであり、これらに種々のエラーチェック機能を付
加して、高信頼化を行っている。
【0003】従来例として、例えば、特開昭58−13
7054号では、プロセッシングボード、主記憶、入出
力制御装置が、通称ペア&スペアとよばれる二重化され
た2枚のボードで構成され(プロセッシングユニットと
しては、全体で4個のプロセッサを必要とする)、完全
に同期動作を行う。各ボード内では、出力段の比較照合
を行い、一致しなければ、そのボードは故障したものと
みなし、外部バスへのアクセスをしない。故障したボー
ドの情報はスペア側に伝えられ、スペア側のみでシステ
ムは動作を実行し続けることができる。マルチプロセッ
サ構成は、上記プロセッシングユニット(ペア&スペア
構成をとる4個のプロセッサの組)が複数台システムバ
ス上に接続することにより実現することができる。
【0004】また、特開平4−241039号では、同
一プロセッシングボードに3つのプロセッサを実装し、
同一クロックで完全同期して動作する。該プロセッサの
うち、選択回路により選択された2つの出力をそれぞれ
外部に出力する。プロセッサからキャッシュメモリや外
部へのアクセス経路は、選択回路の判定結果に従って内
部バスのゲートの開閉することで決定される。マルチプ
ロセッサ構成は、上記プロセッシングボード(3つのプ
ロセッサを実相したボード)が複数台システムバス上に
接続することにより実現することができる。
【0005】さらに、特開平2−202636号公報で
は、マルチプロセッサ構成ではなく、シングルプロセッ
サの構成であるが、ほぼ同一周波数のクロックで動作す
る3つのプロセッサを実装し、多数決をとるグローバル
メモリへのアクセスにて同期をとる。
【0006】
【発明が解決しようとする課題】上記従来例において
は、マルチプロセッサ構成にした場合に、プロセッサ
間、およびプロセッサと主記憶間に比較回路や多数決回
路が存在し、処理の高速化に不向きであるという課題が
あった。また、プロセッサ間に比較照合回路をプロセッ
サ搭載基板より外部に設ける方式では、1つのLSIに
複数の異なる動作をするプロセッサを実装したマイクロ
プロセッサを用いて冗長構成のマルチプロセッサを構築
するのは困難であるという課題があった。また、プロセ
ッサ間を接続するバスは、高速化のため、信号の振幅電
圧レベルの縮小化、高ビット幅化などが要求され、従来
例の方式では、オンラインで故障のユニットを交換する
際に、活線挿抜時のノイズの問題が顕著となるという課
題があった。一方、シングルプロセッサで主メモリへの
書き込み時に多数決をとる方式はあっても、外部入出力
装置とのインタフェースで多数決をとり、低速動作を図
ったものはない。また、シングルプロセッサの場合は、
自己診断に先立ちデータを退避しなければならず、時間
がかかるという課題もあった。
【0007】この発明は、上記のような課題を解消する
ためになされたものであり、マルチプロセッサ内の1つ
のモジュールに障害が発生しても、計算機として動作し
続けるというフォールトトレラント性を有しつつ、高い
周波数で動作することを目的とする。
【0008】
【課題を解決するための手段】この発明に係るマルチプ
ロセッサ計算機は、異なる処理を行う複数のプロセッサ
と、これらプロセッサに接続されるシステムバスと、こ
のシステムバスに接続される主記憶と、システムバスに
接続されて入出力バスとのインタフェースをとる入出力
インタフェースとを1つのプロセッシングユニットとし
て、同一の動作を行う複数のプロセッシングユニット
と、このプロセッシングユニットの外部にあって各入出
力インタフェースからの出力を比較して選択結果を入出
力バスに出力する入出力アダプタと、入出力バス経由で
入出力アダプタとデータの授受を行う入出力装置を備え
た。
【0009】また更に、入出力アダプタは、各入出力イ
ンタフェースからの出力を多数決比較をして入出力バス
に出力する入出力アダプタとした。
【0010】また更に、入出力アダプタと入出力装置を
それぞれ多重化した。
【0011】また更に、あるプロセッシングユニットで
エラーが発生しても他のプロセッシングユニットは処理
を続行し、エラー回復後のプロセッシングユニットは、
他のプロセッシングユニットのデータをコピーするよう
にした。
【0012】また更に、あるプロセッシングユニットで
エラーが発生すると、そのプロセッシングユニット中の
複数のプロセッサはそせぞれ自己診断を行ってエラーの
プロセッサを特定するようにし、エラー回復後は他のプ
ロセッシングユニットのデータをコピーするようにし
た。
【0013】また更に、書き込み監視回路を備え、エラ
ー回復後のプロセッシングユニットが他のプロセッシン
グユニットのデータをコピー中に他のプロセッシングユ
ニットに書き込み動作があると、この書き込み情報をエ
ラー回復プロセッシングユニットに伝達して追加書き込
みするようにした。
【0014】また更に、エラー監視回路を備え、入出力
アダプタが各入出力インタフェースからの出力を比較
し、比較が一致しない場合は更にエラー監視回路からの
エラー情報を調べて不検出側のプロセッサユニットの出
力を入出力バスに出力するようにした。
【0015】
【作用】この発明に係るマルチプロセッサ計算機は、複
数のプロセッサによるプロセッサユニットの入出力動作
を比較し、比較一致がとれると、所定のプロセッシング
ユニットの出力を出力する。
【0016】また更に、入出力アダプタは、各入出力イ
ンタフェースからの出力を多数決比較をして多数決論理
に従って入出力バスに出力する。
【0017】また更に、入出力アダプタと入出力装置は
それぞれ多重化され、各入出力アダプタは、各入出力イ
ンタフェースからの出力をそれぞれ多数決比較をして多
数決論理に従って入出力バスに出力する。
【0018】また更に、あるプロセッシングユニットで
エラーが発生しても他のプロセッシングユニットは処理
を続行し、エラー回復後には、そのプロセッシングユニ
ットは、他のエラーが発生しなかったプロセッシングユ
ニットのデータをコピーして処理が再開される。
【0019】また更に、あるプロセッシングユニットで
エラーが発生すると、そのプロセッシングユニット中の
複数のプロセッサはそせぞれ自己診断を行ってエラーの
プロセッサが特定され、エラー回復後は他のプロセッシ
ングユニットの対応するプロセッサのデータをコピーし
て処理が再開される。
【0020】また更に、エラー回復後のプロセッシング
ユニットが他のプロセッシングユニットのデータをコピ
ー中に他のプロセッシングユニットに書き込み動作があ
ると、この書き込み情報がエラー回復プロセッシングユ
ニットに伝達されて追加書き込みがされる。
【0021】また更に、入出力アダプタが各入出力イン
タフェースからの出力を比較し、比較が一致しない場合
は更にエラー監視回路からのエラー情報を調べられて不
検出側のプロセッサユニットの出力情報がを入出力バス
に出力される。
【0022】
【実施例】
実施例1.図1は、本発明の第1実施例に係る高信頼化
マルチプロセッサの全体構成を示すブロック図である。
また図2は、入力アダプタユニットの構成図、図3は入
出力インタフェースの構成図、図4はマルチプロセッサ
の瞬時故障時の回復動作の時間説明図、図5は同じく固
定故障時の回復動作の時間説明図である。
【0023】このブロック図において、各プロセッシン
グユニット51即ち51−1、51−2、51−3にあ
る、複数の(本実施例では、4個の場合を示す)同一の
プロセッサ1ないし4が、即ち1−1、1−2、1−
3、1−4ないし4−1、4−2、4−3、4−4が、
システムバス31、即ち31−1、31−2、31−3
で結合される。各プロセッサ1ないし4は、システムバ
ス31に接続される主記憶インタフェース21(21−
1、21−2、21−3以下同様に表現)および、主記
憶バス32(32−1、32−2、32−3)を介し
て、主記憶11(11−1、11−2、11−3)をア
クセスする。また、各プロセッサ1ないし4は、主記憶
11上にある、同一のオペレーティングシステム(図示
せず)のもとで、各々異なる動作を行ない、密結合マル
チプロセッサ構成をとる。
【0024】3つのプロセッシングユニット51−1な
いし51−3は、クロック回路12−1ないし12−3
の間を結合するクロック同期バス62を用いて完全に同
期したクロック信号33−1ないし33−3により、全
く同一動作を行なう。システムバス31−1ないし31
−3にそれぞれ接続される入出力インタフェース22−
1ないし22−3は、入出力インタフェース信号61−
1ないし61−3を介して、二重化された入出力アダプ
タユニット52−1ないし52−2に接続される。2つ
の入出力アダプタユニット52−1ないし52−2は、
入出力インタフェース信号61−1ないし61−3の各
信号レベルで比較照合し、多数決の結果をそれぞれ入出
力バス63−1ないし63−2を介して入出力装置53
−1ないし53−2にアクセスする。
【0025】次に上記構成のマルチプロセッサの入出力
装置への書き込み動作の説明をする。3個のプロセッシ
ングユニット51は、入出力装置53への書き込み動作
を行う時、書き込み先のアドレスと書き込みデータを送
出し、図2で表される入出力アダプタユニット52にあ
る多数決回路部74で比較照合される。多数決回路74
自体はこの例ではビット対応で3入力1出力で少なくと
も2入力の状態が出力される素子群である。プロセッシ
ングユニット51−1ないし51−3のうち、入出力ア
ダプタユニット52−1にて正しい動作であることが保
証された1つのプロセッシングユニットが選択され、こ
の選択されたプロセッシングユニットのアドレスとデー
タが、入出力バス63−1を経由して、入出力装置53
−1にデータが書き込まれる。
【0026】同様に、プロセッシングユニット51−1
ないし51−3のうち、正しい動作であることが保証さ
れた1つのプロセッシングユニットのアドレスとデータ
が、入出力バス63−2を経由して、入出力装置53−
2に対して、入出力装置53−1と同一データが書き込
まれる。なお、コンソールなど二重化されない入出力装
置は、入出力バス63−1側にのみ接続される場合もあ
る。
【0027】更に入出力装置からの読込み動作の説明を
する。3個のプロセッシングユニット51は、入出力装
置53から読込み動作を行う時、入出力アダプタユニッ
ト52−1ないし52−2に対して読み込み先のアドレ
スを送出し、入出力アダプタユニット52−1ないし5
2−2にある多数決回路群74で比較照合される。プロ
セッシングユニット51のうち、入出力アダプタユニッ
ト52−1にて正しく動作しているとして選択されたプ
ロセッシングユニットのアドレスが、入出力バス63−
1を経由して、入出力装置53−1に送出され、入出力
装置53−1の該当データが入出力アダプタユニット5
2−1に返送される。
【0028】同様に、プロセッシングユニット51のう
ち、入出力アダプタユニット52−2にて正しく動作し
ているとして選択されたプロセッシングユニットのアド
レスが、入出力バス63−2を経由して、入出力装置5
3−2に送出され、入出力装置53−2の該当データが
入出力アダプタユニット52−1に返送される。この
時、入出力アダプタユニット52−1および52−2の
どちらがプロセッシングユニット51−1ないし51−
3に該当データを返送するかの選択は、電源投入時にど
ちらか一方に固定され、その後選択されている入出力ア
ダプタユニットにて障害が発生した場合、他方の入出力
アダプタユニットが選択され、処理を継続することがで
きる。このように、2つの入出力53−1ないし53−
2はともに同一データをそれぞれ入出力バス63−1な
いし63−2経由で、2つの入手力アダプタユニット5
2−1ないし52−2にそれぞれ返送し、選択されたど
ちらか一方の入出力アダプタユニットからのデータが、
システムバス31を経て各プロセッサに読み込まれる。
【0029】次に、障害検出/切り離し動作を説明す
る。入出力アダプタユニット52にて、多数決回路で一
致せず、誤動作していると判定されたプロセッシングユ
ニットは、入出力アダプタユニット52における多数決
の対象から除外される。そしてシステム全体の処理の中
で影響の無い時に、故障原因を特定するための自己診断
処理と、復帰のための処理を実行し、自己診断の結果が
良好であり復旧可能と考えられる場合は、再度3つのプ
ロセッシングユニットによる同期動作に再開する。この
ようにして、1つのプロセッシングユニットが誤動作し
ても、システム全体としては正常動作が継続される。
【0030】瞬時故障時の回復動作を説明する。図4
は、1つのプロセッサにおいて、一時的な故障、つまり
瞬時故障が発生した場合の、全プロセッサおよび入出力
アダプタユニット52−1の回復動作を示した図であ
る。
【0031】プロセッサ1−1ないし1−3は処理A
を、プロセッサ2−1ないし2−3は処理Bを、プロセ
ッサ3−1ないし3−3は処理Cを、プロセッサ4−1
ないし4−3は処理Dを行ない、正常に動作していると
きに、プロセッサ2−1にて瞬時故障が発生したとす
る。本実施例において、障害は、入出力装置53へのア
クセスの際に判れば良いという考え方から、入出力アダ
プタユニット52−1にて、1つの入出力インタフェー
ス信号が他の2つの入出力インタフェース信号と異なっ
た時に障害発生が判明する。
【0032】入出力アダプタ52−1は、入出力インタ
フェース信号61−1ないし61−3の対応する各信号
ごとの多数決を行ない、故障したプロセッシングユニッ
トを特定し、このプロセッシングユニットを以後の多数
決の対象から切り離す。その後、故障したプロセッシン
グユニット51−1にあるプロセッサ1−1ないし4−
1に対しては、割込待ちを指示する割り込みを送信し、
プロセッサ1−1ないし4−1の論理的な処理を停止さ
せる。一方、プロセッサ1−2ないし1−3に対して
は、障害の原因は何で、固定的な故障、つまり固定故障
か否かを認識する処理を行なう指示割り込みを送信す
る。
【0033】プロセッサ1−2ないし1−3は、実行中
の処理Aを一時中断する。また、プロセッサ1−1ない
し4−1に対して、自己診断を指示する割り込みを、入
出力アダプタユニット52−1を経由して送出した後、
処理Aを再開する。プロセッサ1−1ないし4−1は、
プロセッサ1−2ないし1−3からの自己診断指示に従
い、自己診断を行ない、診断終了後、各々プロセッサ1
−2ないし1−3に割り込みを送信する。固定故障の有
無、など診断結果は、入出力装置53のディスクなどを
介して伝達する。
【0034】瞬時故障の場合には、プロセッサ1−1な
いし4−1から図4のイで示すように、自己診断が正常
に終了したことを伝える割り込みを受けたプロセッサ1
−2ないし1−3は、入出力インタフェース22−2な
いし22−3、および入出力アダプタユニット52−1
に対して、メモリコピー開始を指示する。メモリコピー
開始の指示を受けた入出力アダプタユニットは、プロセ
ッシングユニット51−2ないし51−3上にある主記
憶11−2ないし11−3の内容を読み出し、プロセッ
シングユニット51−1上にある主記憶11−1に書き
込む動作(以下メモリコピー動作と呼ぶ)を行なう。た
だし、メモリコピー動作中にもプロセッシングユニット
51−2ないし51−3は処理を続行しており、主記憶
11−2ないし11−3は、随時更新される可能性があ
る。そのため、メモリコピー開始の指示を受けた入出力
インタフェース22−2ないし22−3にある図3で表
される書き込み監視部71は、主記憶11−2ないし1
1−3への書き込み動作を監視し、書き込み動作があっ
た場合は、入出力インタフェース信号61−2ないし6
1−3を経由して入出力アダプタユニット52−1に主
記憶への書き込み情報を伝達する。入出力アダプタユニ
ットは、メモリコピー動作中に主記憶11−2ないし1
1−3への書き込み情報を検出すると、そのつど入出力
インタフェース22−1を経由して主記憶11−1へ、
同一書き込み情報を転送する。この、入出力インタフェ
ース22−2ないし22−3における書き込み監視部7
1の監視機能と入出力アダプタユニット52における主
記憶複写制御部75の転送機能をメモリ監視機能と呼
ぶ。
【0035】主記憶11−2ないし11−3の全領域に
対して、メモリコピー動作を終了した時、図4のロで示
されるように、プロセッサ1−2ないし1−3は、プロ
セッサ1−2ないし4−2、およびプロセッサ1−3な
いし4−3に対して、各プロセッサに内蔵されるキャッ
シュ(図示せず)のフラッシュおよびプロセッサの内部
レジスタ類(図示せず)すべてを主記憶の特定領域に退
避することを指示する割り込みを発行する。プロセッサ
1−2ないし4−2、およびプロセッサ1−3ないし4
−3が、キャッシュのフラッシュ、およびレジスタの退
避を行なう動作は、主記憶11−2ないし11−3への
書き込み動作であるから、メモリ監視機能により、主記
憶11−1に対しても同一データが書き込まれ、レジス
タ類退避の処理が完了すると、主記憶11−1ないし1
1−3の内容はすべて一致することになる。レジスタ類
の退避が終了したプロセッサ1−2ないし4−2、およ
びプロセッサ1−3ないし4−3は、入出力アダプタユ
ニットに対して、全プロセッサへの同期を指示する割り
込みを発行し、自らへの割り込みが発生するのを待つ。
【0036】プロセッサ1−2ないし4−2、およびプ
ロセッサ1−3ないし4−3からの同期を指示する割り
込みを全て受け付け、かつ、メモリ監視機能の処理が完
了したと認識した入出力アダプタユニットは、図4のハ
で示すように、全プロセッサに対して再同期を指示する
割り込みを発行する。
【0037】再同期を指示する割り込みを受けた全プロ
セッサは、メモリ監視機能を解除し、レジスタ類をロー
ドした後、中断していた処理を(プロセッサ1−1ない
し1−3は処理Aを、プロセッサ2−1ないし2−3は
処理Bを、プロセッサ3−1ないし3−3は処理Cを、
プロセッサ4−1ないし4−3は処理Dを)再開する。
【0038】以上の動作により、1つのプロセッシング
ユニットが誤動作(瞬時故障)しても、システム全体と
しては正常動作が遅れなく継続される。従来例のシング
ルプロセッサと外部比較回路の構成では、自己診断のま
えにデ−タを退避し、照合後に正常ユニットのデータを
コピーするという時間が必要になり所要時間が長くな
る。勿論1ユニット内のマルチプロセッシングもないの
で、動作も遅くなる。
【0039】次に、固定故障時の回復動作を説明する。
図5は、1つのプロセッサにおいて、固定故障が発生し
た場合の、全プロセッサおよび入出力アダプタユニット
52−1の回復動作を示した図である。
【0040】プロセッサ1−1ないし1−3は処理A
を、プロセッサ2−1ないし2−3は処理Bを、プロセ
ッサ3−1ないし3−3は処理Cを、プロセッサ4−1
ないし4−3は処理Dを行ない、正常に動作していると
きに、図5のニで示す時点でプロセッサ2−1にて瞬時
故障が発生したとする。障害は入出力装置53へのアク
セスの際に判れば良いので、入出力アダプタユニット5
2−1にて、1つの入出力インタフェース信号が他の2
つの入出力インタフェース信号と異なった時に初めて障
害発生が判明する。
【0041】入出力アダプタ52−1は、入出力インタ
フェース信号61−1ないし61−3の対応する各信号
ごとの多数決を多数決回路74で行ない、故障したプロ
セッシングユニットを特定し、このプロセッシングユニ
ットを以後の多数決の対象から切り離す。その後、故障
したプロセッシングユニット51−1にあるプロセッサ
1−1ないし4−1に対しては、割込待ちを指示する割
り込みを送信し、プロセッサ1−1ないし4−1の論理
的な処理を停止させる。一方、プロセッサ1−2ないし
1−3に対しては、障害の原因は何で、固定的な故障、
つまり固定故障か否かを認識するための処理を行なうた
めの割り込みを送信する。
【0042】プロセッサ1−2ないし1−3は、実行中
の処理Aを一時中断し、プロセッサ1−1ないし4−1
に対して、自己診断を指示する割り込みを、入出力アダ
プタユニット52−1を経由して送出した後、処理Aを
再開する。プロセッサ1−1ないし4−1は、プロセッ
サ1−2ないし1−3からの自己診断指示に従い、自己
診断を行ない、診断終了後、各々プロセッサ1−2ない
し1−3に割り込みを送信する。診断結果は、入出力装
置53のディスクなどを介して伝達する。プロセッサ1
−1ないし4−1から、図5のホの時点で自己診断が終
了したものの、プロセッサ2−1にて固定故障が発生し
たことを伝える割り込みを受けたプロセッサ1−2ない
し1−3は、プロセッサ2−1が固定故障状態であるこ
とを示すメッセージないしは表示を行なう。
【0043】固定故障となったプロセッサ2−1は、プ
ロセッサ単位(プロセッサ2−1自身)またはプロセッ
シングユニット単位(プロセッシングユニット51−
1)で、オンライン状態での修理/交換を行なう。交換
が終了すると、コンソール(図示せず)などから、図5
のヘの時点でプロセッサ1−2ないし1−3への割り込
みにより、メモリコピー動作を開始する。以下は、瞬時
故障時の回復動作と同様な動作を行なう。以上の動作に
より、1つのプロセッシングユニットが誤動作(固定故
障)しても、システム全体としては正常動作が継続され
る。
【0044】実施例2.実施例1における多数決を行う
入出力アダプタユニット52を一重化構成にして低コス
ト構成としてもよい。図6は本実施例のマルチプロセッ
サ計算機の構成を示すもので、入出力アダプタユニット
52を簡略化することにより低コストで高信頼性を得る
ようにしたものである。マルチプロセッサ計算機の瞬時
故障時、固定故障時の回復動作は、実施例1と変わりが
ないので記述を省略する。
【0045】実施例3.実施例1におけるプロセッシン
グユニット51を2枚構成とし、入出力ユニット152
−1における比較回路部76により、比較照合のみをお
こなうようにした例を説明する。図7はマルチプロセッ
サの全体構成図であり、図8は入出力アダプタユニット
の構成図である。図9は故障からの回復動作の時間説明
図である。
【0046】2つの入出力アダプタユニット152−1
ないし152−2は、入出力インタフェース信号61−
1ないし61−2の各信号レベルを図8の比較回路部7
6で比較照合し、一致したならばそれぞれ入出力バス6
3−1ないし63−2を介して入出力装置53−1ない
し53−2にアクセスする。一致しなかった場合は、プ
ロセッシングユニット51−1ないし51−2における
バスパリティ監視部72(図3)にて検出したエラー情
報の有無を調べる。エラーがあると、非エラー側のデー
タを選択し出力する。一致せずしかもエラー情報が無い
場合は、どちらのプロセッシングユニットに故障が発生
したか分からないため、誤った出力を出さないためにシ
ステムダウンとする。
【0047】次に障害検出と切り離し動作を説明する。
エラー情報(バスパリティエラー等)を調べて、どちら
かのプロセッシングユニットにエラーの発生したことが
分かると、システム全体の処理の中で影響の無い時に、
故障原因を特定するための自己診断処理と、復帰のため
の処理を実行し、自己診断の結果が良好であり復旧可能
と考えられる場合は、再度2つのプロセッシングユニッ
トによる同期動作に再開する。このようにして、1つの
プロセッシングユニットが誤動作しても、システム全体
としては正常動作が継続される。
【0048】次に瞬時故障時の回復動作について説明す
る。図9は、1つのプロセッサにおいて、瞬時故障が発
生した場合の、全プロセッサおよび入出力アダプタユニ
ット152−1の回復動作を示した図である。入出力ア
ダプタユニット152−1は、入出力インタフェース信
号61−1ないし61−3の対応する各ビットつまり各
信号ごとの比較を行ない、不一致が生じると、全プロセ
ッサに対して、エラーの報告を指示する割り込みを送信
する。全プロセッサは、該割り込みを受けると、内部に
保持していたエラー情報を入出力装置53のディスクな
どに書き込み、入出力アダプタユニット152−1に報
告完了の割り込みを送信する。報告完了を受け取った入
出力アダプタユニット152−1は、故障したプロセッ
シングユニットを特定し、このプロセッシングユニット
を以後の比較の対象から除外する。
【0049】その後、故障したプロセッシングユニット
51−1にあるプロセッサ1−1ないし4−1に対して
は、割込待ちを指示する割り込みを送信し、プロセッサ
1−1ないし4−1の論理的な処理を停止させる。一
方、プロセッサ1−2に対しては、障害の原因は何で、
固定故障か否かを認識するための処理を行なうことを指
示する割り込みを送信する。プロセッサ1−2は、実行
中の処理Aを一時中断し、プロセッサ1−1ないし4−
1に対して、自己診断を指示する割り込みを、入出力ア
ダプタユニット152−1を経由して送出した後、処理
Aを再開する。以下は、実施例1と同様の動作を行う。
以上の動作により、1つのプロセッシングユニットが誤
動作(瞬時故障)しても、システム全体としては正常動
作が継続される。
【0050】固定故障時の回復動作を説明する。固定故
障時の回復動作についても、上記瞬時故障と同様な方法
で自己診断を行い、あとは実施例1と同様な処理を行
う。
【0051】
【発明の効果】以上のようにこの発明によれば、異なる
処理を行う複数のプロセッサを搭載したプロセッシング
ユニットを複数ユニット備え、同一の動作を行わせ、こ
れら複数のプロセッシングユニットの外部でプロセッサ
ユニットからの出力を比較し選択出力する入出力アダプ
タを備えたので、低速動作で信頼性の高いマルチプロセ
ッサが得られる効果がある。
【0052】また更に、入出力アダプタは多数決比較を
して入出力バスに出力するようにしあたので、更に信頼
性の高いマルチプロセッサが得られる効果がある。
【0053】また更に、入出力アダプタと入出力装置を
それぞれ多重化したので、更に信頼性の高いマルチプロ
セッサが得られる効果がある。
【0054】また更に、あるユニットでエラーが発生し
ても他のプロセッシングユニットは処理を続行し、エラ
ー回復後のプロセッシングユニットはこれをコピーする
ようにしたので、信頼性が高く、しかも回復時間が短縮
される効果もある。
【0055】また更に、あるユニットでエラーが発生す
ると、そのプロセッシングユニット中の複数のプロセッ
サはそせぞれ自己診断を行ってエラーのプロセッサを特
定するようにし、エラー回復後は他のプロセッシングユ
ニットのデータをコピーするようにしたので、瞬時故障
に対しては回復時間が短縮される効果もある。
【0056】また更に、エラー回復後のプロセッシング
ユニットが他のプロセッシングユニットのデータをコピ
ー中に他のプロセッシングユニットに書き込み動作があ
ると、この書き込み情報をエラー回復プロセッシングユ
ニットに伝達して追加書き込みするので、正しい並列動
作が得られる効果がある。
【0057】また更に、入出力アダプタが各入出力イン
タフェースからの出力を比較し、比較が一致しない場合
は更にエラー監視回路からのエラー情報を調べて正しい
出力をするようにしたので、小規模な回路で高い信頼性
が得られる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施例1の装置の全体構成を示す
ブロック図である。
【図2】 実施例1の入出力アダプタユニットの構成ブ
ロック図である。
【図3】 実施例1の入出力インタフェースの構成ブロ
ック図である。
【図4】 この発明の実施例1の装置の瞬時故障時の回
復動作を示すタイミングチャート図である。
【図5】 この発明の実施例1の装置の固定故障時の回
復動作を示すタイミングチャート図である。
【図6】 この発明の実施例2の装置の全体構成を示す
ブロック図である。
【図7】 この発明の実施例3の装置の全体構成を示す
ブロック図である。
【図8】 実施例3の入出力アダプタユニットの構成ブ
ロック図である。
【図9】 この発明の実施例3の装置の瞬時故障時の回
復動作を示すタイミングチャート図である。
【符号の説明】
1−1,2−1,3−1,4−1,1−2,2−2,3
−2,4−2,1−3,2−3,3−3,4−3 プロ
セッサ、11−1,11−2,11−3 主記憶、12
−1,12−2,12−3 クロック回路,21−1,
21−2,21−3 主記憶インタフェース、22,2
2−1,22−2,22−3 入出力インタフェース、
31,31−1,31−2,31−3 システムバス、
32−1,32−2,32−3 主記憶バス、33−
1,33−2,33−3 クロック信号,51−1,5
1−2,51−3 プロセッシングユニット、52,5
2−1,52−2 入出力アダプタユニット、53−
1,53−2 入出力装置、61,61−1,61−
2,61−3 入出力インタフェース信号、62 クロ
ック同期バス、63,63−1,63−2 入出力バ
ス、71 書き込み監視部、72 バスパリティ監視
部、73 バッファ、74 多数決回路、75 主記憶
複写制御部、76 比較回路、152−1,152−2
入出力アダプタユニット。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 異なる処理を行う複数のプロセッサと、
    該プロセッサに接続されるシステムバスと、該システム
    バスに接続される主記憶と、上記システムバスに接続さ
    れて入出力バスとのインタフェースをとる入出力インタ
    フェースとを1つのプロセッシングユニットとして、同
    一の動作を行う複数の上記プロセッシングユニットと、 上記プロセッシングユニットの外部にあり、上記各入出
    力インタフェースからの出力を比較して選択結果を入出
    力バスに出力する入出力アダプタと、 上記入出力バス経由で上記入出力アダプタとデータの授
    受を行う入出力装置を備えたマルチプロセッサ計算機。
  2. 【請求項2】 また更に、入出力アダプタは、各入出力
    インタフェースからの出力を多数決比較をして入出力バ
    スに出力するようにしたことを特徴とする請求項1記載
    のマルチプロセッサ計算機。
  3. 【請求項3】 また更に、入出力アダプタと入出力装置
    を多重化したことを特徴とする請求項1または請求項2
    記載のマルチプロセッサ計算機。
  4. 【請求項4】 また更に、あるプロセッシングユニット
    でエラーが発生しても他のプロセッシングユニットは処
    理を続行し、エラー回復後のプロセッシングユニットは
    上記他のプロセッシングユニットのデータをコピーする
    ようにしたことを特徴とする請求項1または請求項2記
    載のマルチプロセッサ計算機。
  5. 【請求項5】 また更に、あるプロセッシングユニット
    でエラーが発生すると、該プロセッシングユニット中の
    複数のプロセッサはそせぞれ自己診断を行ってエラーの
    プロセッサを特定するようにし、エラー回復後は他のプ
    ロセッシングユニットのデータをコピーするようにした
    ことを特徴とする請求項1または請求項2記載のマルチ
    プロセッサ計算機。
  6. 【請求項6】 また更に、書き込み監視回路を備え、エ
    ラー回復後のプロセッシングユニットが他のプロセッシ
    ングユニットのデータをコピー中に他のプロセッシング
    ユニットに書き込み動作があると、該書き込み情報をエ
    ラー回復プロセッシングユニットに伝達して追加書き込
    みするするようにしたことを特徴とする請求項4または
    請求項5記載のマルチプロセッサ計算機。
  7. 【請求項7】 また更に、エラー監視回路を備え、入出
    力アダプタが各入出力インタフェースからの出力を比較
    し、比較が一致しない場合は更に上記エラー監視回路か
    らのエラー不検出側のプロセッサユニットの出力を入出
    力バスに出力するようにしたことを特徴とする請求項1
    記載のマルチプロセッサ計算機。
JP7160866A 1995-06-27 1995-06-27 マルチプロセッサ計算機 Pending JPH0916535A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7160866A JPH0916535A (ja) 1995-06-27 1995-06-27 マルチプロセッサ計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7160866A JPH0916535A (ja) 1995-06-27 1995-06-27 マルチプロセッサ計算機

Publications (1)

Publication Number Publication Date
JPH0916535A true JPH0916535A (ja) 1997-01-17

Family

ID=15724073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7160866A Pending JPH0916535A (ja) 1995-06-27 1995-06-27 マルチプロセッサ計算機

Country Status (1)

Country Link
JP (1) JPH0916535A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167599A (ja) * 1997-12-05 1999-06-22 Fujitsu Ltd 電子現金金庫
JP2000029966A (ja) * 1998-07-10 2000-01-28 Fujitsu Ltd 電子現金用金庫および電子マネーシステム
JP2008112444A (ja) * 2006-10-10 2008-05-15 Robert Bosch Gmbh 信号処理システムを起動/再起動する方法及び信号処理システム
JP2009009200A (ja) * 2007-06-26 2009-01-15 Hitachi Ltd ストレージシステム及びストレージシステムの制御方法
JP2009199275A (ja) * 2008-02-20 2009-09-03 Nec Corp ブレードサーバ、及びスイッチブレード
EP2192489A1 (en) 2008-11-28 2010-06-02 Hitachi Automotive Systems Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
US20200401442A1 (en) * 2019-06-20 2020-12-24 Fujitsu Limited Information processor, method for controlling information processor, and non-transitory computer-readable storage medium for storing control program for information processor

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11167599A (ja) * 1997-12-05 1999-06-22 Fujitsu Ltd 電子現金金庫
JP2000029966A (ja) * 1998-07-10 2000-01-28 Fujitsu Ltd 電子現金用金庫および電子マネーシステム
JP2008112444A (ja) * 2006-10-10 2008-05-15 Robert Bosch Gmbh 信号処理システムを起動/再起動する方法及び信号処理システム
JP2009009200A (ja) * 2007-06-26 2009-01-15 Hitachi Ltd ストレージシステム及びストレージシステムの制御方法
JP2009199275A (ja) * 2008-02-20 2009-09-03 Nec Corp ブレードサーバ、及びスイッチブレード
US8635370B2 (en) 2008-02-20 2014-01-21 Nec Corporation Blade server and switch blade
EP2192489A1 (en) 2008-11-28 2010-06-02 Hitachi Automotive Systems Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
US8417990B2 (en) 2008-11-28 2013-04-09 Hitachi Automotive Systems, Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
US20200401442A1 (en) * 2019-06-20 2020-12-24 Fujitsu Limited Information processor, method for controlling information processor, and non-transitory computer-readable storage medium for storing control program for information processor

Similar Documents

Publication Publication Date Title
US5384906A (en) Method and apparatus for synchronizing a plurality of processors
US5317726A (en) Multiple-processor computer system with asynchronous execution of identical code streams
US5005174A (en) Dual zone, fault tolerant computer system with error checking in I/O writes
US5845060A (en) High-performance fault tolerant computer system with clock length synchronization of loosely coupled processors
US4965717A (en) Multiple processor system having shared memory with private-write capability
EP0201356B1 (en) High level self-checking intelligent i/o controller
US4907228A (en) Dual-rail processor with error checking at single rail interfaces
US5249187A (en) Dual rail processors with error checking on I/O reads
US5890003A (en) Interrupts between asynchronously operating CPUs in fault tolerant computer system
US7890797B2 (en) Vehicle including a processor system having fault tolerance
JPH01152543A (ja) 欠陥分離及び修理機能を有する耐欠陥コンピュータシステム
JPH07129426A (ja) 障害処理方式
US6785763B2 (en) Efficient memory modification tracking with hierarchical dirty indicators
US6961826B2 (en) Processor state reintegration using bridge direct memory access controller
EP1380950B1 (en) Fault tolerant information processing apparatus
US6950907B2 (en) Enhanced protection for memory modification tracking with redundant dirty indicators
US5473770A (en) Fault-tolerant computer system with hidden local memory refresh
US6785777B2 (en) Control logic for memory modification tracking with hierarchical dirty indicators
JPH0916535A (ja) マルチプロセッサ計算機
US6981172B2 (en) Protection for memory modification tracking
JPH05313930A (ja) 高信頼度化情報処理装置
JPH04241039A (ja) ベーシックプロセッシングユニット及び高信頼化コンピュータシステム
JPH07105037A (ja) プロセッシングボード及び計算機及び障害復旧方法