JPS6139138A - 多重化システム - Google Patents

多重化システム

Info

Publication number
JPS6139138A
JPS6139138A JP16046984A JP16046984A JPS6139138A JP S6139138 A JPS6139138 A JP S6139138A JP 16046984 A JP16046984 A JP 16046984A JP 16046984 A JP16046984 A JP 16046984A JP S6139138 A JPS6139138 A JP S6139138A
Authority
JP
Japan
Prior art keywords
processor
processors
main
monitoring
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP16046984A
Other languages
English (en)
Other versions
JPH0630069B2 (ja
Inventor
Shinya Kimura
真也 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59160469A priority Critical patent/JPH0630069B2/ja
Publication of JPS6139138A publication Critical patent/JPS6139138A/ja
Publication of JPH0630069B2 publication Critical patent/JPH0630069B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)  発明め属する技術分野 本発明は情報処理装置に関し、特に複数のプロセッサで
構成するマルチプロセッサシステムに関する。
(2)従来技術の説明 マイクロプロセッサはその高性能化に伴い様々な分野で
応用されている。中でも銀行のオンライン端末、通信網
制御器、医療電子機器といった分野では非常に高い信頼
性が要求される。
従来のマイクロプロセッサで高信頼性の要求されるシス
テムを構成する場合、誤シ訂正コードをつけてデータ転
送する方法や同一のマイクロプロセッサを数ケ用いてこ
れらに対して同時に同じ処理をさせ、得られた出力を比
較し誤動作(障害)を検知する方法等が提案されている
J−1rfi4’n”’j;辻If F −h kJP
宜1^層1mf M4v −At 411 rれるが、
同時に同一処理を実行させる複数のマイクロプロセッサ
の各出力毎の一致・不一致を検出する回路が出力ビン毎
に必要である。
また多重化を考慮したマイクロプロセッサシステムとし
て、主モード用プロセッサと監視モード用プロセッサと
を用いて監視モード用プロセッサで主モードのプロセッ
サの動作状態を監視し、誤動作が検出されると誤動作信
号を出力するものもある。
しかしながらかかる多重化システムでは誤動作が検出さ
れた後、誤動作を起こした故障プロセッサの切はなしを
行ない、かつIJ 4ット信号を発注してシステムの再
起動処理がなされなければならない。
すなわち、システムにおいて誤動作が検出された場合、
システムの破壊を防ぐために可能な限シすみやかにシス
テムを停止させる必要があるためリセット信号が用いら
れている。しかしながらリセット信号によればシステム
全体が初期化されてしまう。誤動作前の処理を続行させ
るためには、誤動作前のシステムの処理状態を記憶して
おくだめのハードウェアが必要となる。
さらにリセット直後の処理として、そのリセット信号が
システムの本来の初期化のためなのか、それとも誤動作
によるものかを判定する必要がある。従来、この処理は
ソフトウェアによって実行されていたためソフトウェア
の負担が大きく、実行速度が遅いという欠点を有してい
た。
(3)発明の詳細な説明 本発明は高信頼性が要求される多重化システムにおいて
、誤動作検出後の処理をソフトウェアの負担表しに高速
に実行するシステムを提供することを目的とする。
(4)発明の構成 本発明によれば複数台のプロセッサを用い、そのうちの
少なくとも1つを主プロセッサとし、他のプロセッサを
監視プロセッサとして有する多重化プロセッサと、監視
プロセッサからの誤動作信号を受け、誤動作の判定を行
なう判定回路と、誤動作プロセッサの停止とシステムの
再構成、再起動を行なうシーケンスプロセッサとを含む
多重化システムを得る。
ここで主プロセッサとは与えられたプログラムを実行す
るプロセッサを意味し、監視プロセッサとは主プロセッ
サの動作状態を監視し異常が生じた場合に誤動作検出信
号を発生する機能を有するプロセッサを意味する。本発
明の好適な実施態様によれば、監視プロセッサは主プロ
セッサと同等の機能、すなわち主プロセッサが実行する
プログラムを実行すべき機能と主プロセッサの実行状態
を監視する機能との両方を有するものとして提供されて
いる。監視機能は主プロセッサの処理と監視プロセッサ
自身の処理(これらは同一内容の処理)と遂次比較し、
途中不一致処理が検出された場合、その時点で誤動作検
出信号を発生することによって実現される。シーケンス
プロセッサはこの信号をうけて全プロセッサを停止させ
る。判定回路は誤動作検出信号をうけて異常を認識する
。しかしこの異常が主プロセッサで起きたか、監視プロ
セッサで起きたものかを調べる必要がある。本発明の好
適な実施例によればこれは以下のようにして調べられる
。すなわち、システムの中に監視プロセッサが少なくと
も2つ用意される。かかる2つの監視プロセッサは夫々
主プロセッサと同一の処理を実行し、かつ主プロセッサ
の処理との比較を実行する。このようになれば、誤動作
検出信号が2つの監視プロセッサから共に発生された場
合、異常は主プロセッサで生じたことがわかる。一方、
いずれか一方の監視プロセッサからのみ誤動作検出信号
が発生された場合は、それを発生した監視プロセッサ自
身に異常が生じたことがわかる。従って、判定回路は前
者ノ場合は主プロセッサのダウンを判定し、残シの2つ
の監視プロセッサのうちの一方を主プロセッサとして使
うことをシーケンスプロセッサに知らせる。一方、後者
の場合は誤動作検出信号を発生した監視プロセッサをシ
ステムから切シ離すことをシーケンスプロセッサに知ら
せる。シーケンスプロセッサはそれに従って異常プロセ
ッサの切)離し、システムの再構築、再起動を制御する
(5)発明の効果 本発明によれば異常プロセッサの検出、およびその切り
I’ltしが容易で、かつソフトウェアの負担を借シず
にシステムの再構築ができる。しかも、主プロセッサに
異常がなければシステム再構築後、プログ2ム処理を継
続することができる。さらに、主プロセッサダウンの時
は、監視プロセッサの少なくとも1つを主プロセッサと
して扱うことができ、プログラム処理高速に再開するこ
とができる。従って、システムのダウンを最小にとどめ
ることができる。
(6)実施例の説明 まず、第1図および第2図を参照して従来のマルチプロ
セッザシステムについて説明する。
高信頼性を実現するために、同一機能を有するn個のマ
イクロプロセッサ101乃至103を有し、各プロセッ
サはm本の出力ピンを有する。
各ピン対応にm個の比較器104乃至106が設けられ
ている。比較器の入力端にはn個のプロセッサの各間−
の出力ピンが接続され、計n個の信号が入力される。比
較器の内部は第2図のようになっている。すなわち、m
本の入力信号はNANDゲート201に入力されるとと
もに、それらの反転信号がNANDゲート202に入力
される。各NANDゲートの出力はANDグー)203
に入力される。従って、n個の入力信号のうち1個でも
他とレベルの異なる信号が混っていればANDゲー)2
03から  、誤動作検出信号が発生される。誤動作積
信号は第1図のORゲート107を介してシステムコン
トローラ(図示せず)に送られる。システムコントロー
ラはORゲート107からの検出信号をうけると、全部
のプロセッサにリセット信号を送シシステムを停止状態
にする。システムの回復はシステムコントローラとソフ
トウェアとによって制御される。従って、ソフトウェア
の負担が大きく、かつまだ、回復までに相当の時間を要
する。
これに対して本発明の一実施例によれば第3図のように
システムが構成される。
第3図は本発明の一実施例として三重化システムの一構
成を示すブロック図である。図において301,302
,303は同一の機能を有7 するプロセッサであり、
304はメモリ及びI10装置である。各プロセッサと
メモリ及びI10装置304とはバス305で接続され
る。
アドレス、データ、コントロール信号はこのバス305
を介して転送される。306はシステム制御部で、シー
ケンスプロセッサ307と誤動作プロセッサ判定回路3
08とを含む。
プロセッサ301,302.303はそれ自体がプログ
ラムに基つく情報処理を行なう主モードと、主モードで
動作しているプロセッサの動作を監視する監視モードを
持つプロセッサでM/C端子に入力される信号によって
主モードと監視モードとが切換えられる。監視モードの
場合、プロセッサは主モードの動作以外に主モードで動
いている他のプロセッサの実行状態と自身の実行状態と
が比較される。主モードで動作している他のプロセッサ
(これが未来のプログラム処理プロセッサとして割シ当
てられている)と監視モードで動作しているプロセッサ
との間に異なる動作が生じた時には、監視モードで動い
ているプロセッサのER端子がアクティブとなシ誤動作
検出信号を発生する。まだこれらのプロセッサはE:a
HALT入力端子を有しておシ、この端子がアクティブ
になるとプロセッサは処理を停止する。次いでERHA
LT端子がインアクティブとなるとC/E端子(続行/
障害)の状態により異なった動作をする。つまF)C/
B端子に1続行”を示す信号が入力されている時には中
断していた命令から続行し、C/E端子に障害を示す信
号が入力されている時にはあらかじめ定められたプログ
ラムを実行する。
システム制御部306のシーケンスプロセッサ(以下シ
ーケンスという)307は監視モードで動いているプロ
セッサから送られるER信号に応答する判定回路の制御
のもとに、全プロセッサの停止、システム再構成、再起
動の制御を行なう。誤動作プロセッサ判定回路は監視プ
ロセッサからのER倍信号基に、誤動作したプロセッサ
を判定し、システム再構成に必要となる情報を生成する
以下にその動作を説明する。
システムが起動された時点ではプロセッサ301が主モ
ードで動作し、プロセッサ302及び303が監視モー
ドで動作すると仮定する。
処理進行中に監視モードのプロセッサのうち1台でも主
モードのプロセッサと異なった動作を検知した場合には
、そのプロセッサのER倍信号アクティブとなシステム
再構成へ通知される。ER倍信号受けたシステム制御部
はシーケンサ307に起動がかかる。シーケンサ307
はシステムの破壊を最少にとどめるためHALT 1 
、HALT2 、HALT3の全信号をアクティブにす
る。これらの信号は各プロセッサのERHALT端子に
入力され、これをうけて各プロセッサは直ちに動作を停
止する。次いでシーケンサ307は誤動作プロセッサの
判定回路308で生成された情報をもとに、システムの
再構成を行なう。
第4図は誤動作プロセッサ判定回路308において生成
される情報のフォーマット図を示している。監視モード
プロセッサ302,303のうちいずれか一方のみが誤
動作を検出した場合には、主モードプロセッサと他の監
視モードプロセッサとは同一の処理を行なっていたこと
になるため、誤動作を検出した監視モードプロセッサ自
体に障害が発生したことになる。よってそのプロセッサ
をシステムから切はなし、システムを再起動させる。ま
た、この場合には、主モードプロセッサは中断されてい
た命令を続行してもよいため、塩プロセッサのC/E信
号として1続行”を表わす信号を出力する。
一方、監視モードプロセッサ302,303の両方が供
にER償号を出力した場合には、主モードプロセッサ3
01に障害が発生したことになシ、主モードプロセッサ
301が切は、なされる。この時、次の主モードプロセ
ッサとして302を用いることができる。プロセッサ3
02のM/C端子には主モード指示信号を与えればよい
。またこの場合、中断していた命令の再会が不可能な時
には誤動作解析プログラムを実行する必要があるために
、プロセッサへのC/E信号としてパ障害°′を表わす
信号を出力する。  5 再構成を終えるとシーケンサ307はシステムを再起動
させるため、障害のないプロセッサに対してのみERH
ALT端子をインアクティブとする信号を与える。
この結果、障害のないプロセッサによりシステムが再構
築され、各プロセッサはそのC/E端子上の信号に応じ
て動作を開始する。つま夛C/E端子が”続行”を表わ
す信号をうけていれば中断していた命令を再開し、反対
に“障害”を表わす信号をうけていれば誤動作解析処理
プ  (ログラムを実行する。誤動作解析処理プ?グラ
ムでは誤動作の発生した命令が再実行可能か否かを判定
し、再実行可能であれば再実行し、再実行不可能な場合
にはシステムに応じて、システム停止処理やシステム回
復処理等適当な処理単位で再起動がかけられる。
以上の処理の後に、2重化システムとして動作が開始さ
れる。この時はプロセッサ301が主モードで動作し、
プロセッサ303が監視モードで動作する。再び監視モ
ードのプロセッサ303が誤動作を検出した場合にはい
ずれのプロセッサに障害が発生したかは判断不可能であ
る。よってシーケンサ307は両プロセッサを停止させ
、システムの破壊を最少にとどめる。
以上のシーケンサ307の状態遷移を第5図に示す。
ここでは3重化システムの場合を説明したがさらにプロ
セッサの台数を増した場合にも同様の考え方で拡張可能
である。
7) 実施例の効果の説明 本実施例は以上説明したように、少なくとも1台の主モ
ードプロセッサと複数台の監視モードプロセッサで多重
化システムを構成することによって、誤動作が検知され
た時点で総てのプロセッサを直ちに停止させ、誤動作し
たプロセッサをシステムから除去し、主モードプロセッ
サが正常でめった場合には中断した命令を再開し、主モ
ードプロセッサに障害が認められた場合には監視モード
プロセッサの中の1台を主モードに切替え誤動作処理を
実行することにより、誤動作検出後のシステム回復処理
を容易かつ高速に実行することができる。
【図面の簡単な説明】
第1図は従来の多重化システムの構成ブロック図である
。101.102,103・・・・・・マイクロプロセ
ッサ、104,105.106・・・・・・比較器。 107・・・・・・ORゲート。第2図は第1図の比較
器の回路図でおる。201・・・・・・NANDゲート
。 202・・・・・・ORゲート、203・・・・・・A
NDゲート。 第3図は本発明の一実施例として3重化システムを構成
したブロック図である。301,302゜303・・・
・・・マイクロプロセッサ、304・・・・・・メモリ
及びIO装置、3o5・・・・・・バス、3o6・・間
システム制御部、3o7・曲・シーケンサ、308・・
・・・・誤動作プロセッサ判定回路、第4図は誤動作検
出後のシステム再構成のために生成される情報フォーマ
ット図である。第5図は第3図のシーケンサの状態遷移
を示すフローチャートである。

Claims (2)

    【特許請求の範囲】
  1. (1)少なくとも一個の主プロセッサと、1個以上の監
    視プロセッサと、前記監視プロセッサからの異常検出信
    号により異常が生じたプロセッサを判定する判定回路と
    、前記判定回路の出力に基いてシステムを再構築する制
    御回路とを含むことを特徴とする多重化システム。
  2. (2)前記異常信号を検知すると前記制御回路は直ちに
    前記主プロセッサおよび前記監視プロセッサの動作を停
    止させ、前記判定回路により監視プロセッサの異常が検
    出されたとき、該監視プロセッサを切りはなし、前記主
    プロセッサは中断した命令から処理を続行し、前記主プ
    ロセッサの異常が検出されたときは前記監視プロセッサ
    の1つが主プロセッサとして動作するようにしたことを
    特徴とする特許請求の範囲第1項記載の多重化システム
JP59160469A 1984-07-31 1984-07-31 多重化システム Expired - Lifetime JPH0630069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59160469A JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59160469A JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Publications (2)

Publication Number Publication Date
JPS6139138A true JPS6139138A (ja) 1986-02-25
JPH0630069B2 JPH0630069B2 (ja) 1994-04-20

Family

ID=15715619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59160469A Expired - Lifetime JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Country Status (1)

Country Link
JP (1) JPH0630069B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4832673A (en) * 1986-09-01 1989-05-23 Mitsuboshi Belting, Ltd. Toothed belt having improved tooth cover fabric
US8155824B2 (en) 2008-02-04 2012-04-10 Denso Corporation Electronic control apparatus for vehicles, which is provided with plural microcomputers
JP2013025570A (ja) * 2011-07-21 2013-02-04 Denso Corp 電子制御ユニット
JP2013242708A (ja) * 2012-05-21 2013-12-05 Denso Corp 電子制御装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518729A (en) * 1978-07-26 1980-02-09 Hitachi Ltd Parallel triple system constituting method of computer system
JPS55154639A (en) * 1979-05-18 1980-12-02 Sanyo Electric Co Ltd Control system for microcomputer
JPS56108161A (en) * 1980-01-31 1981-08-27 Nec Corp Operation control system for multiprocessor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518729A (en) * 1978-07-26 1980-02-09 Hitachi Ltd Parallel triple system constituting method of computer system
JPS55154639A (en) * 1979-05-18 1980-12-02 Sanyo Electric Co Ltd Control system for microcomputer
JPS56108161A (en) * 1980-01-31 1981-08-27 Nec Corp Operation control system for multiprocessor

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4832673A (en) * 1986-09-01 1989-05-23 Mitsuboshi Belting, Ltd. Toothed belt having improved tooth cover fabric
US8155824B2 (en) 2008-02-04 2012-04-10 Denso Corporation Electronic control apparatus for vehicles, which is provided with plural microcomputers
JP2013025570A (ja) * 2011-07-21 2013-02-04 Denso Corp 電子制御ユニット
JP2013242708A (ja) * 2012-05-21 2013-12-05 Denso Corp 電子制御装置

Also Published As

Publication number Publication date
JPH0630069B2 (ja) 1994-04-20

Similar Documents

Publication Publication Date Title
US7877627B1 (en) Multiple redundant computer system combining fault diagnostics and majority voting with dissimilar redundancy technology
US7900087B2 (en) Method and apparatus for correlating an out-of-range condition to a particular power connection
US6058490A (en) Method and apparatus for providing scaleable levels of application availability
US8935569B2 (en) Control computer system, method for controlling a control computer system, and use of a control computer system
US6915441B2 (en) Computer system with multiple backup management processors for handling embedded processor failure
US20090070761A1 (en) System and method for data communication with data link backup
EP2590072A1 (en) System control device, information processing system, and data migration and restoration method for information processing system
JPH11143729A (ja) フォールトトレラントコンピュータ
CN109358982B (zh) 硬盘自愈装置、方法以及硬盘
CN115617550A (zh) 处理设备、控制单元、电子设备、方法和计算机程序
US20030023887A1 (en) Computer system with backup management for handling embedded processor failure
JPS6139138A (ja) 多重化システム
KR100279204B1 (ko) 자동제어시스템에서현장제어장치의콘트롤러이중화제어방법및그장치
US6832331B1 (en) Fault tolerant mastership system and method
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
US20050028021A1 (en) Distributed systems for determining card status
JPH044444A (ja) 通信制御システム
JP6710128B2 (ja) 通信装置及び通信装置の復旧方法
JPH11134211A (ja) 二重化コンピュータシステムおよびその運用方法
CN114509981A (zh) 控制器硬件冗余控制方法及系统
JPS60142431A (ja) 計算機
JPS6113627B2 (ja)
JPH01310422A (ja) マイクロコンピュータのリセット回路
JPS6238916A (ja) デ−タ処理システムの立上げ方式
CN116483631A (zh) 一种基于冷热双备份机制的综合化电气系统及其运行方法