JP3423732B2 - 情報処理装置及び情報処理装置における障害処理方法 - Google Patents

情報処理装置及び情報処理装置における障害処理方法

Info

Publication number
JP3423732B2
JP3423732B2 JP24813392A JP24813392A JP3423732B2 JP 3423732 B2 JP3423732 B2 JP 3423732B2 JP 24813392 A JP24813392 A JP 24813392A JP 24813392 A JP24813392 A JP 24813392A JP 3423732 B2 JP3423732 B2 JP 3423732B2
Authority
JP
Japan
Prior art keywords
failure
processor
processing
fault
internal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24813392A
Other languages
English (en)
Other versions
JPH0695902A (ja
Inventor
浩 大黒
公一 池田
高明 西山
博志 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP24813392A priority Critical patent/JP3423732B2/ja
Publication of JPH0695902A publication Critical patent/JPH0695902A/ja
Priority to US08/686,486 priority patent/US5748873A/en
Application granted granted Critical
Publication of JP3423732B2 publication Critical patent/JP3423732B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マスタプロセッサ及び
チェッカプロセッサに同一動作を行わせ、チェッカプロ
セッサがマスタプロセッサの出力結果をチェックするこ
とにより障害検出を行うプロセッサ二重化方式の情報処
理装置に関し、特に内部障害を自己検出するプロセッサ
を用いた場合の障害検出から障害回復までの制御方式、
及び障害検出機能自体のテスト方式に関するものであ
る。
【0002】
【従来の技術】従来、装置の高度の信頼性を確保するた
めに、マスタプロセッサ及びチェッカプロセッサを設
け、これらのマスタプロセッサ及びチェッカプロセッサ
に同一動作を行わせ、かつチェッカプロセッサにマスタ
プロセッサの出力結果をチェックさせ、出力結果が
「否」の場合には処理を停止させて、再度最初からやり
直すようにしたプロセッサ二重化方式の情報処理装置が
ある。
【0003】このようなプロセッサ二重化方式の情報処
理装置では、マスタプロセッサに障害が発生した場合お
よびチェッカプロセッサに障害が発生した場合のいずれ
においても、チェッカプロセッサによるチェック結果は
「否」となる。
【0004】しかし、従来は、誤った出力が送出される
ことを未然に防止することを主たる目的として構成され
ているので、チェッカプロセッサによるチェック結果が
「否」であったとしても、いずれのプロセッサが障害を
起こしたかを特に追及するようなことはしていない。
【0005】また、追及したとしても、特開平2−47
731号に示されているように、別個に診断プロセッサ
を設けている。
【0006】一方、出力結果のチェックは、チェッカプ
ロセッサが出力しようとするタイミングで行われるの
で、マスタプロセッサがバス上にデータを出力してもチ
ェッカプロセッサがチェックしないという状態が発生
し、障害検出が遅れてしまうという問題があった。この
問題を解決するために、特開平3−217944号に示
すようにチェッカプロセッサにマスタプロセッサのバス
イネーブルタイミングで出力結果をチェックさせるべ
く、マスタプロセッサとチェッカプロセッサ間に制御信
号を追加したり、特開平3−175538号に示すよう
にプロセッサ内部の演算結果をチェックさせるべく、マ
スタプロセッサから比較指示を行うための制御信号を追
加したものがある。
【0007】
【発明が解決しようとする課題】ところで、最近のプロ
セッサの動向として、チップ内にRAMを内蔵させた
り、大容量のRAMを外付けにし、プロセッサがバスを
介さずに直接制御するのが一般的となってきている。そ
して、RAMに発生する間欠障害に対処するために、R
AMに格納するデータに冗長ビットを追加し、間欠障害
を検出したり、間欠障害を訂正する機能を持たせたもの
が現れている。
【0008】しかし、このようなプロセッサを用いて二
重化構成を実現した場合、RAMに間欠障害が発生する
度にマスタプロセッサとチェッカプロセッサに不一致が
発生してしまう。すなわち、間欠障害が発生した場合、
これを訂正するための時間が必要になるので、間欠障害
が発生したプロセッサは出力タイミングが遅れ、結果的
に、出力の不一致が発生し、同期動作が行われなくな
る。
【0009】従って、RAMに間欠障害が発生すると、
その都度、マスタプロセッサとチェッカプロセッサに出
力の不一致が発生する。
【0010】しかしながら、上記従来技術においては、
障害が発生したプロセッサを特に特定し、かつ障害発生
時点の状態に回復させることを行っていないため、シス
テムを一旦停止させて再度やり直すといった事象が多発
し、結果的には、信頼性の向上を期待できないという問
題が生じている。
【0011】また、障害が発生したプロセッサを特定す
る場合であっても、別の診断プロセッサを用いているた
め、構成が複雑化する。また、障害発生時点の内部情報
を把握するのが困難であるため、障害発生時点の状態に
回復させることできず、上記と同様に、処理を再度やり
直すといった事象が多発し、結果的には、信頼性の向上
を期待できないという問題がある。
【0012】さらに、障害検出タイミングを早めるため
に特別の信号を追加しているため、プロセッサ間の結合
関係が複雑になるという問題がある。
【0013】本発明の第1の目的は、プロセッサ二重化
構成において不一致障害が発生した場合、障害の発生し
たプロセッサを診断プロセッサ等を用いることなく簡単
な構成で特定し、かつ不一致障害発生時に行っていた処
理を、システムを停止させることなく継続させることが
できるプロセッサ二重化方式の情報処理装置を提供する
ことである。
【0014】本発明の第2の目的は、プロセッサ間に特
別な信号を追加することなく、障害検出タイミングを早
めることができるプロセッサ二重化方式の情報処理装置
を提供することである。
【0015】本発明の第3の目的は、訂正可能な間欠障
害等の発生に対し、不一致障害の発生する回数を減少さ
せ、障害回復に費やす時間を減少させることができるプ
ロセッサ二重化方式の情報処理装置を提供することであ
る。
【0016】本発明の第4の目的は、訂正可能な間欠障
害等に起因する同期外れに対し、この同期外れを容易に
再同期させることができるプロセッサ二重化方式の情報
処理装置を提供することである。
【0017】本発明の第5の目的は、一方のプロセッサ
に固定障害が発生した場合、固定障害が発生したプロセ
ッサを切離して運用することができるプロセッサ二重化
方式の情報処理装置を提供することである。
【0018】本発明の第6の目的は、不一致検出機能の
正当性を容易に確認することができるプロセッサ二重化
方式の情報処理装置を提供することである。
【0019】
【課題を解決するための手段】第1の発明は、同じ処理
を行なう第一、第二のプロセッサと、前記第一、第二の
プロセッサに対して障害発生後の対応を指示する制御手
段を有する情報処理装置において、前記第一、第二のプ
ロセッサは、各々のプロセッサの内部障害検出に関し、
発生した内部障害の種類を識別するための情報を含む第
一の信号を前記制御手段に出力する第一の出力部と、各
々のプロセッサで行なった処理結果に関する第二の信号
を出力する第二の出力部をそれぞれ備え、前記制御手段
は、前記第一の信号、第二の信号を入力し、前記第一の
信号から前記第一、又は前記第二のプロセッサに内部障
害が発生したか否かを確認し、前記第二の信号から前記
第一のプロセッサと前記第二のプロセッサの処理結果に
不一致障害が生じたか否かを確認し、前記内部障害の発
生と前記不一致障害の発生の有無に応じて障害が発生し
たプロセッサを特定すると共に、前記発生した内部障害
の種類によって必要な障害発生後の処理を選択すること
を特徴とするものである。
【0020】また、第2の発明は、第1の発明におい
て、各種データを格納する記憶手段を有し、前記制御手
段は、障害が発生していないプロセッサの内部状態を前
記記憶手段に格納し、障害発生後の再同期処理を行なう
ことを特徴とするものである。また、第3の発明は、第
1の発明において、さらに処理を継続するために必要な
情報を格納する記憶手段を有し、前記制御手段は、発生
した内部障害が訂正不可能な内部障害であると識別した
場合に障害が発生していないプロセッサの内部状態を前
記記憶手段に格納させることを特徴とするものである。
また、第4の発明は、第1の発明において、前記制御手
段は、発生した内部障害が固定障害であると識別した場
合に障害が発生していないプロセッサによる縮退動作を
行なう指示を出力することを特徴とするものである。ま
た、第5の発明は、第4の発明において、前記制御手段
は、障害が発生したことを通知する障害報告を出力する
ことを特徴とするものである。
【0021】また、第6の発明は、各々RAMを有し相
互に同期して同じ動作を行なう第一、第二の処理装置
と、前記第一、第二の処理装置の障害発生時の処理を制
御する制御手段を有する情報処理システムであって、前
記制御手段は、前記第一、第二の処理装置の各々の内部
における第一の障害の発生を認識し、前記第一、第二の
処理装置が処理したデータ間における第二の障害の発生
を認識し、認識した前記第一の障害と前記第二の障害か
ら障害が発生した処理装置を特定すると共に、前記第
一、第二の処理装置の各々で発生した前記第一の障害の
程度を認識し、前記認識した程度に応じて前記第一、第
二の処理装置に必要な処理を選択することを特徴とする
ものである。
【0022】また、第7の発明は、第6の発明におい
て、さらに処理を継続するために必要な情報を格納する
記憶手段を有し、前記制御手段は、前記必要な情報とし
て障害が発生していない処理装置の内部状態を前記記憶
手段に格納することを特徴とするものである。また、第
8の発明は、第7の発明において、前記第一、第二の処
理装置は前記記憶手段に格納した情報を用いて再同期処
理を行なうことを特徴とするものである。また、第9の
発明は、第6の発明において、前記制御手段が認識した
前記第一の障害が固定障害の場合に前記障害が発生した
処理装置をシステムから切り離すことを特徴とするもの
である。また、第10の発明は、第9の発明において、
前記制御手段は前記第一、第二の処理装置における障害
検知を報告することを特徴とするものである。
【0023】また、第11の発明は、各々RAMを有し
相互に同期して同じ動作を行なう第一、第二の処理装置
と前記第一、第二の処理装置に対する障害発生時の制御
を行なう制御手段を備えた情報処理システムにおける障
害処理方法であって、前記第一、第二の処理装置の各々
の内部における第一の障害の発生を認識し、前記第一、
第二の処理装置が処理したデータ間における第二の障害
の発生を認識し、認識した前記第一の障害と前記第二の
障害から障害が発生した処理装置を特定し、前記制御手
段は発生した前記第一の障害の種別を識別し、前記識別
した種別に応じて前記第一、第二の処理装置が行なうべ
き処理を選択し、前記制御手段から前記発生した障害に
必要な処理を前記第一、第二の処理装置に行なう指示を
出力することを特徴とするものである。
【0024】また、第12の発明は、第11の発明にお
いて、前記制御手段は発生した前記第一の障害が固定障
害である場合に、特定した前記障害が発生した処理装置
を切り離し他方の処理装置において処理を継続すること
を特徴とするものである。また、第13の発明は、第1
1の発明において、前記制御手段は前記第一、又は第二
の処理装置いずれかの障害の発生を特定した後に当該障
害報告を出力することを特徴とするものである。また、
第14の発明は、第11の発明において、前記制御手段
は障害が発生していない処理装置の内部状態を記憶手段
に格納するように前記障害が発生していない処理装置に
指示することを特徴とするものである。
【0025】
【作用】上記手段によれば、互いに同期させて動作させ
ていた2つのプロセッサのいずれかに内部障害が生じ、
双方の出力が不一致となる不一致障害が発生した場合、
制御手段が障害の発生したプロセッサを特定し、不一致
障害発生時に行っていた処理を、障害の発生していない
プロセッサの内部情報を用い、かつ二重化構成で継続さ
せるため、間欠障害が発生し易いRAMを内蔵したシス
テムであっても、システム障害となる事象を減少させ、
信頼性を向上させることができる。
【0026】また、2つのプロセッサがバスを使用する
に先立ち出力するバス使用権要求信号を監視し、そのタ
イミングが不一致の時は、出力の不一致検出に先立って
両プロセッサに通知し、記憶手段に保存された内部情報
を取り込ませて両プロセッサの内部情報を同化させ、こ
の同化状態で両プロセッサに障害発生時点で行っていた
情報処理を継続させるため、特別な信号を追加すること
なく、障害検出を早めることができる。
【0027】さらに、訂正可能な内部障害に対しては、
その内部障害を訂正した後、予め指定された処理を行う
のに要する処理サイクル数と、内部障害が発生しない場
合に予め指定された処理を行うのに要する処理サイクル
数とを同一にするため、訂正可能な内部障害に対して不
一致障害の発生する回数を減少させることができる。
【0028】さらに、バス使用権要求不一致信号に対し
て、内部障害検出信号が訂正可能な障害を表わしている
時は、両プロセッサからのバス使用権要求信号に対する
バス使用権許可信号を同期して両プロセッサに返信する
ため、訂正可能な内部障害に起因する同期外れを容易に
再同期させることができる。
【0029】さらに、訂正不可能な内部障害および固定
障害等に対しては、リセット動作を実行させないか、ま
たはリセット動作を実行させた後、新たな不一致障害検
出信号が入力されるのを禁止するため、一方のプロセッ
サのみで情報処理を継続することができる。
【0030】さらに、2つのプロセッサの一方に、特定
の命令列を挿入することによって内部障害を簡単に注入
し、その結果として強制的に出力の不一致状態を発生さ
せ、不一致検出機能の正当性を簡単に確認することがで
きる。
【0031】
【実施例】以下、本発明によるプロセッサ二重化方式の
情報処理装置を図示する実施例に基づいて詳細に説明す
る。
【0032】図1は本発明の一実施例の構成を示すブロ
ック図、図2,図3は障害発生時の処理動作を説明する
制御フロー図である。
【0033】図1において、バス700には2台のプロ
セッサA100およびプロセッサB200が接続され、
さらに二重化制御回路300、割込み制御回路400、
主記憶装置600が接続されている。
【0034】プロセッサA100およびプロセッサB2
00は、バス700から同一データを入力しており、マ
スタモード/チェッカモード指示信号(M/Cモード指
示信号)120,220による指示により、マスタモー
ド時にはバス700にデータを出力し、チェッカモード
時にはバス700への出力を抑止し、その抑止した出力
データとバス700上にマスタモードのプロセッサから
出力されているデータとを比較し、不一致を検出した時
には不一致障害検出表示信号113、213を二重化制
御回路300に出力するようになっている。
【0035】また、プロセッサA100およびプロセッ
サB200は、RAMの間欠障害等の訂正可能な内部障
害、および訂正不可能な内部障害、固定障害を検出する
機能を有し、これらの障害を検出した場合、その障害が
訂正不可能な障害であれば、このことを表わす訂正不可
能内部障害表示信号110,210を出力し、2重化制
御回路300に入力するようになっている。さらに、プ
ロセッサA100,B200は現在の動作モードを表示
するモード表示レジスタ103,203を備えている。
【0036】二重化制御回路300は、不一致障害検出
表示信号113,213,訂正不可能内部障害表示信号
110,210により、障害が発生したプロセッサ(プ
ロセッサAまたはプロセッサB)を特定し、マスタモー
ド/チェッカモード指示信号120,130を用いてプ
ロセッサA100およびプロセッサB200のモード制
御を行うものである。
【0037】この二重化制御回路300は、不一致状態
にあるプロセッサA100,B200の再同期を指示す
るための再同期指示レジスタ302、いずれのプロセッ
サにて障害が発生したかを表示する障害ログレジスタ3
03を備えている。
【0038】割込み制御回路400は、周辺入出力装置
(図示せず)からの割込み信号及び二重化制御回路30
0からの不一致障害割込み要求信号310により報告さ
れた障害割込みを、割込み信号140,240により各
プロセッサA100,B200に報告する回路である。
【0039】この割込み制御回路400は、プロセッサ
A100,B200に対する一切の割込みを抑止するこ
とを指示する割込み抑止指示レジスタ401を備えてい
る。
【0040】(第1の実施例) プロセッサB200に訂正不可能な内部障害が発生し
た場合の動作 次に、不一致障害をチェッカプロセッサでのみ検出する
場合において、プロセッサA100がマスタモード,プ
ロセッサB200がチェッカモードの構成で、プロセッ
サB200に訂正不可能な内部障害が発生した場合の処
理動作を図2に示す制御フロー図を用いて説明する。
【0041】(1)まず、プロセッサB200は訂正不
可能な内部障害が発生したことを検出すると、内部障害
表示信号210を出力する。この時、プロセッサA10
0とプロセッサB200との同期が外れるため、プロセ
ッサB200はバス700への出力結果の不一致をも検
出し、不一致障害検出表示信号213を出力する。
【0042】(2)二重化制御回路300は、内部障害
表示信号210,不一致障害検出表示信号213により
プロセッサB200に障害が発生したことを確認し、障
害ログレジスタ303にログを採取し、不一致障害割込
み要求信号310により割込み制御回路400に対し、
プロセッサA100,B200に対する障害割込みを要
求する。
【0043】そこで、割込み制御回路400は割込み信
号140,240を用い、各プロセッサ100,B20
0に対し障害割込みを行う。
【0044】なお、二重化制御回路300は、不一致障
害を報告した後、再同期指示がなされるまでの間に、次
の不一致障害検出表示信号213を検出しても障害報告
は行わない。
【0045】(3)割込み信号140,240によって
障害を報告されたプロセッサA100は、障害ログレジ
スタ303の内容を解析することにより、プロセッサB
200に訂正不可能な内部障害が発生したこと、及びそ
のためにプロセッサA100,B200間の同期外れが
発生したことを認識する。この場合、プロセッサB20
0は、障害割込みがあっても、それに対する処理は行わ
ない。
【0046】(4)プロセッサA100,B200間の
同期外れを認識したプロセッサA100は、処理を継続
するために必要な情報として、プログラムカウンタや汎
用レジスタといったプロセッサA100の内部状態を主
記憶装置600にセーブする。
【0047】(5)プロセッサA100は、プロセッサ
B200との間の再同期を行うべく、再同期指示レジス
タ302に再同期指示情報を設定する。すると、二重化
制御回路300は同期リセット指示信号150,250
を出力し、プロセッサA100,プロセッサB200を
同期してリセットする。
【0048】(6)同期リセット指示信号150,25
0により再度同期状態となったプロセッサA100,プ
ロセッサB200は、主記憶装置600から同期外れ前
のプロセッサA100の内部状態をリストアすることに
より、障害が発生する前の構成であるマスタモードのプ
ロセッサA100,チェッカモードのプロセッサB20
0という二重化構成で不一致障害発生時に行っていた処
理を継続する。
【0049】プロセッサA100に訂正不可能な内部
障害が発生した場合の動作 次に、不一致障害をチェッカプロセッサでのみ検出する
場合において、プロセッサA100がマスタモード,プ
ロセッサB200がチェッカモードの構成で、プロセッ
サA100に訂正不可能な内部障害が発生した場合の処
理動作を図3に示す制御フロー図を用いて説明する。
【0050】(1)まず、プロセッサA100は訂正不
可能な内部障害が発生したことを検出すると、内部障害
表示信号110を出力し、二重化制御回路300に入力
する。
【0051】この時、プロセッサA100とプロセッサ
B200との同期が外れるため、プロセッサB200は
バス700への出力結果の不一致を検出し、不一致障害
検出表示信号213を出力し、2重化制御回路300に
入力する。
【0052】(2)二重化制御回路300は、内部障害
表示信号110,不一致障害検出表示信号213により
プロセッサA100に障害が発生したものと確認し、マ
スタモード/チェッカモード指示信号120,220を
用い、障害の発生していないプロセッサB200をマス
タモードに、障害の発生したプロセッサA100をチェ
ッカモードに切り替える。そして,障害ログレジスタ3
03にログを採取し、不一致障害割込み要求信号310
により割込み制御回路400に対し、プロセッサA10
0,B200に対する障害割込みを要求する。
【0053】そこで、割込み制御回路400は割込み信
号140,240を用い、プロセッサA100,B20
0に対し障害割込みを行う。
【0054】なお,二重化制御回路300は、不一致障
害を報告後、再同期指示がなされるまでの間に新たな不
一致障害検出表示信号113を検出しても障害報告は行
わない。
【0055】(3)マスタプロセッサとして障害割込み
を報告されたプロセッサB200は、障害ログレジスタ
303の内容を解析することにより、プロセッサA10
0に訂正不可能な内部障害が発生したためにプロセッサ
間A100,B200に同期外れが発生したことを認識
する。
【0056】(4)プロセッサA100,B200間の
同期外れを認識したプロセッサB200は処理を継続す
るために必要な情報として、自分自身のプログラムカウ
ンタや汎用レジスタといった内部状態の情報を主記憶装
置600にセーブする。
【0057】(5)続いて、プロセッサB200はプロ
セッサA100,B200間の再同期を行うべく、再同
期指示レジスタ302に再同期指示情報を設定する。す
ると、二重化制御回路300は同期リセット指示信号1
50,250を用い、プロセッサA100,B200を
同期してリセットする。
【0058】(6)再度同期状態になったプロセッサA
100,プロセッサB200は、主記憶装置600より
障害発生前の内部状態をリストアし、障害が発生する前
とは反対のマスタモードのプロセッサB200、チェッ
カモードのプロセッサA100という二重化構成で、不
一致障害発生時に行っていた処理を継続する。
【0059】このように本実施例にあっては、互いに同
期して動作させていた2つのプロセッサA100,B2
00のいずれかに内部障害が生じたことにより、双方の
出力が不一致となる不一致障害が発生した場合、二重化
制御回路300が障害の発生したプロセッサを特定し、
不一致障害発生時に行っていた処理を、障害の発生して
いないプロセッサの内部状態を用い、かつ二重化構成で
継続させるようにしたため、間欠障害が発生し易いRA
Mを内蔵したシステムであっても、システム障害となる
事象を減少させ、システムの信頼性を向上させることが
できるといった効果がある。
【0060】(第2の実施例)ところで、前記制御フロ
ー例では、再同期後に即座に内部状態をリストアして処
理を継続する例を示したが、同期リセット指示信号15
0,250を用いた同期化リセットでは、プロセッサA
100,B200内に保有するプロセッサ内部障害詳細
ログ情報はリセットされない。そこで、図1のように、
マスタモード時には出力を抑止し、チェッカモード時に
は出力の抑止を解除することを指示する出力モード制御
レジスタ101,201をプロセッサA100,B20
0内に設ける。そして、各プロセッサ上の命令列によっ
て“1”をこれらのレジスタ101,201に一時的に
(図4のTの間)設定する。すると、プロセッサA10
0はマスタモードであるので、図4の制御フロー図に示
すように、出力抑止状態となり、プロセッサB200は
チェッカモードであるので出力抑止状態が解除された状
態となる。
【0061】このようにすることにより、チェッカモー
ドのプロセッサB200が有するプロセッサ内部障害詳
細ログ情報を、同期状態を保ち、かつ不一致障害を検出
することなく主記憶装置600に転送することができ
る。
【0062】このようにすれば、後で主記憶装置600
の内容を分析することにより、障害の原因を究明するの
に極めて有効なものとなる。
【0063】(第3の実施例)また、前記制御フロー例
では、プロセッサA100,B200に訂正不可能な内
部障害が発生した例を示したが、プロセッサA100,
B200に固定障害が発生した場合には、図5のブロッ
ク図に示すように、プロセッサA100,B200から
固定障害表示信号111,211を二重化制御回路30
0に入力させるように構成したうえ、図6の制御フロー
図に示すように、障害割込みを報告されたマスタモード
のプロセッサ(図6ではプロセッサA100)に障害ロ
グレジスタ303を解析させ、チェッカプロセッサ(図
6ではプロセッサB200)の固定障害を認識した時、
それ以後の再同期処理を行わないようにすることによ
り、マスタモードのプロセッサ(図6ではプロセッサA
100)のみが稼動する縮退動作を実現できる。
【0064】このようにすることにより、固定障害が発
生しても、緊急避難的に片系のプロセッサのみで処理を
継続することができる。
【0065】(第4の実施例)あるいは、二重化制御回
路300に不一致障害報告抑止指示レジスタ301(図
5)を設けたうえ、図7の制御フローに示すように、再
同期処理後にプロセッサ内部の障害詳細ログ情報を解析
することでチェッカプロセッサまたはマスタプロセッサ
の固定障害を認識した時、不一致障害報告抑止指示レジ
スタ301に障害報告抑止指示情報を設定し、それ以後
に発生する不一致障害に対する障害報告の割込みを禁止
することにより、マスタモードのプロセッサ(図7では
プロセッサB200)のみが稼動する縮退動作を実現で
きる。
【0066】すなわち、固定障害が発生したプロセッサ
については、第6図の場合と異なり、再同期指示を行っ
て動作を継続させるが、この後に不一致障害が発生して
も、これを無視することにより、実質的にマスタモード
のプロセッサのみを稼動させるようにする。
【0067】なお、図7の制御フローにおいては、プロ
セッサA100がマスタモードで動作していた時に内部
障害が発生した例を示しており、図4の制御フローと同
様にして、障害解析を行った後、プロセッサA100を
チェッカモードに、プロセッサB200をマスタモード
に切り替えて再同期指示を行い、さらにプロセッサA1
00の出力モード制御レジスタ101には“1”を設定
し、出力抑止解除状態状態とし、新たにマスタモードと
なったプロセッサB200の出力モード制御レジスタ2
01には“1”を設定して出力抑止状態とする(図7の
Tの間)ことにより、チェッカモードのプロセッサA1
00が有するプロセッサ内部障害詳細ログ情報を、主記
憶装置600に転送し、この主記憶装置600に転送さ
れたプロセッサ内部障害詳細ログ情報をプロセッサA1
00,B200の両方で詳細に解析し、プロセッサA1
00に固定障害が発生したものとの認識を得、この後
に、不一致障害報告抑止指示レジスタ301に障害報告
抑止指示情報を設定し、それ以後に発生する不一致障害
に対する障害報告の割込みを禁止することを示してい
る。
【0068】(第5の実施例)また、前記制御フロー例
では不一致状態にあるプロセッサの内部状態を障害の発
生していないプロセッサの内部状態に一致させるため
に、障害の発生していないプロセッサの内部状態を主記
憶装置600にセーブし、同期化リセットを行った後に
主記憶装置600から内部状態をリストアしている。し
かし、割込み制御回路400からの割込みをプロセッサ
内部で一時保留する手段を備えたプロセッサでは、内部
状態を主記憶装置600にセーブしてから同期化リセッ
トを行う間に、別の割込みが発生した場合、この割込み
は失なわれてしまうことが起こり得る。
【0069】すなわち、図8の制御フローに示すよう
に、障害の発生していないプロセッサの内部状態を主記
憶装置600にセーブしてから同期化リセットを行う間
(図8のTで示す期間)に、別の割込みが発生したとし
ても、この割込みはプロセッサ内部の割込み保留手段に
よって対応する処理が保留されることによって失われて
しまう。
【0070】一方、割込みが失われたことは、割込み発
生源では認識できない。
【0071】そこで、割込み抑止指示レジスタ401
(図5)を割込み制御回路400に設け、障害の発生し
ていないプロセッサの内部状態を主記憶装置600にセ
ーブしてから同期化リセットを行う間(図8のTで示す
期間)は、割込みの発生を抑止する情報を設定し、この
情報によって割込みを抑止することにより回避できる。
【0072】このようにすることにより、割込み発生源
では、割込み要求が受付けられなかったことにより、割
込み抑止状態が解除された段階で改めて割込み要求を発
生することになり、不一致障害を回復している最中の割
込み要求を無視することなく、回復処理を行うことがで
きる。
【0073】(第6の実施例)また、図5に示すよう
に、プロセッサA100,B200に特有命令の実行時
に同期状態表示信号160,260を出力させ、これら
の同期状態表示信号160,260を互いに監視し合う
ことにより、早期に、かつ確実に同期障害の発生を検出
することができる。
【0074】図9に同期状態監視回路の一例を示す。こ
の同期状態監視回路は、プロセッサA100,B200
にデコーダ170,270、フリップフロップ171,
271、比較器172,272を設け、特有の命令をデ
コーダ170,270で解読し、その解読結果の信号で
フリップフロップ171,271をセットし、そのセッ
ト出力信号を同期状態表示信号160,260としてそ
れぞれ出力すると共に、比較器172,272に入力
し、比較器172,272において相手プロセッサから
入力された同期状態表示信号260,160とを比較
し、一致する時はフリップフロップ171,271をリ
セットし、不一致の時は同期障害が発生したものとして
プロセッサ内部で障害割込みを行い、図2または図3に
示したような手順で同期障害を回復する。
【0075】(第7の実施例)また、前記制御フロー例
では不一致障害をチェッカモードのプロセッサでのみ検
出する場合の例を示したが、プロセッサA100,B2
00は同期して同じ処理を行っているので、両方が正常
であれば、まったく同じタイミングでバス700の使用
権を要求する筈である。そこで、図10に示すように、
バス700の使用権を調停するバス使用権調停回路50
0にバス使用権要求信号の不一致を検出する回路を設け
ることにより、誤データがバス700上に出力される前
に、すなわちチェッカモードのプロセッサが不一致障害
を検出する前のバス使用権を要求した段階で不一致障害
を検出することができる。
【0076】すなわち、バス使用権調停回路500は図
11のタイムチャートに示すように、プロセッサA10
0,B200のバス使用権要求信号130,230に従
い、バス使用権許可信号131,231を要求元のプロ
セッサに出力し、バス使用権要求信号130,230が
不一致の時にはバス使用権要求不一致表示信号510を
二重化制御回路300に出力するものであるが、両プロ
セッサA100,B200はデータをバス700に出力
するタイミングに先立ち、バス使用権要求信号130,
230を出力するので、これらの信号の一致、不一致を
バス使用権調停回路500で検出させる。すると、図1
1のタイミングt1で示すように、例えばチェッカモー
ドのプロセッサB200に内部障害が生じ、バス使用権
要求信号230が出力されず、不一致となる。
【0077】このようにバス使用権要求信号130,2
30が不一致となった場合はバス使用権調停回路500
が直ちに不一致を検出し、バス使用権要求不一致表示信
号510を二重化制御回路300に入力する。
【0078】二重化制御回路300はバス使用権要求不
一致表示信号510が入力されると、ログ情報を採取
し、さらに割込み制御回路400に対しプロセッサA1
00,B200に対し不一致障害割込み要求信号310
を入力し、障害割込みを要求する。
【0079】割込み制御回路400は割込み信号14
0,240を用いプロセッサA100,B200に対す
る障害割込みを行う。
【0080】このように構成することにより、チェッカ
モードのプロセッサ以外のバス使用権調停回路500を
用いて、チェッカモードのプロセッサが不一致障害を検
出する前のバス使用権を要求した段階で、すなわちマス
タモードのプロセッサからのデータがバス700に出力
される前に、不一致障害を検出し、しかも特別の信号を
追加することなく検出することができる。このことは、
チェッカモードのプロセッサがデータを出力しようとす
る以外のタイミングでも不一致障害を検出することがで
きることを意味し、障害検出を早めるだけでなく、検出
能力を向上させられるという利点がある。
【0081】(第8の実施例)ところで、プロセッサA
100,B200に訂正可能内部障害として、汎用レジ
スタ等の内部状態が不一致になる場合と、汎用レジスタ
等の内部状態は一致しているが、同期のみが外れている
場合がある。後者の場合にも図11のタイムチャートで
説明したような回復手順をとると、時間がかかる。
【0082】そこで、汎用レジスタ等の内部状態は一致
しているが、同期のみが外れている場合には、マスタモ
ードおよびチェッカモードのプロセッサA100および
B200から訂正可能内部障害表示信号(112または
212(図10))をバス使用権調停回路500に入力
する。
【0083】例えば、図12のタイムチャートに示すよ
うに、チェッカモードのプロセッサB200が訂正可能
な内部障害をタイミングt1で起こし、バス使用権許可
信号230を出力するタイミングがマスタモードのプロ
セッサA100に比べてTd時間遅れたとすると、この
状態から両プロセッサは同期外れ状態になる。
【0084】そこで、プロセッサB200から訂正可能
内部障害表示信号212を出力し、バス使用権調停回路
500においてバス使用権要求信号130,230の不
一致を検出したとしても不一致障害と判断させないよう
にし、かつ、両プロセッサのバス使用権許可信号13
0,230を同期して出力することにより、すなわち、
タイミングが早い方のバス使用権許可信号を故意に遅ら
せ、両プロセッサのバス使用権許可信号130,230
を同時タイミングt2に出力することで、強制同期をと
るようにする。
【0085】このようにすることにより、汎用レジスタ
等の内部状態は一致しているが、同期のみが外れている
状態のプロセッサA100,プロセッサB200を極め
て簡単に同期化させることができる。
【0086】(第9の実施例)ところで、第8の実施例
に示したように訂正可能な内部障害が発生したが容易に
同期化できた場合は、同期状態を保ったまま、かつ不一
致障害を検出することなく、該当障害の詳細な要因を採
取することが望ましい。
【0087】そこで、訂正可能な内部障害がマスタモー
ドのプロセッサA100で発生した場合、チェッカモー
ドのプロセッサB100での不一致障害を検出する機能
を抑止し、逆に、チェッカモードのプロセッサB200
に訂正可能な内部障害が発生した時には、マスタモード
のプロセッサA100からの出力の抑止及びチェッカプ
ロセッサB200での出力の抑止を一時的に解除するこ
とにより、プロセッサ内部の詳細ログ情報を同期状態を
保ち、かつ不一致障害を検出することなく主記憶装置6
00に転送することができる。
【0088】そのために、図10に示すように、プロセ
ッサA100、B200に不一致障害を検出する機能を
一時的に抑止する指示を行う出力比較抑止指示レジスタ
102,202を設け、訂正可能な内部障害がマスタモ
ードのプロセッサA100で発生した場合、マスタモー
ドのプロセッサA100の出力比較抑止指示レジスタ1
02には内部命令列によって“1”を設定して出力抑止
解除状態とし、チェッカモードのプロセッサB200の
出力比較抑止指示レジスタ202には内部命令列によっ
て“1”を設定して出力抑止状態とし、不一致障害を検
出しないようにする。逆に、チェッカモードのプロセッ
サB200に訂正可能な内部障害が発生した時には、マ
スタモードのプロセッサA100を出力抑止状態とし、
さらにチェッカモードのプロセッサB200を出力抑止
解除状態とすることにより、プロセッサ内部の詳細ログ
情報を同期状態を保ち、かつ不一致障害を検出すること
なく主記憶装置600に転送し、その後に障害の原因を
分析することができる。
【0089】図13に、マスタモードのプロセッサA1
00に訂正可能な内部障害が発生した場合の制御フロー
を示している。
【0090】(第10の実施例)ところで、訂正可能な
内部障害が発生した場合には、プロセッサA100、B
200の同期が外れる例を説明したが、図10に示すよ
うに、プロセッサA100及びプロセッサB200のそ
れぞれに同期外れ防止指示レジスタ104,204を設
け、このレジスタ104,204に内部命令列によって
同期外れ防止指示情報(“1”)を予め設定することに
より、一方のプロセッサに訂正可能な内部障害が発生し
てもプロセッサA100及びプロセッサB200間の同
期が外れることを防止できる。
【0091】すなわち、プロセッサA100及びプロセ
ッサB200はその内部動作において、図14(A)−
aに示すように、命令フェッチの後、命令デコードとE
CCチェックを行い、ECCチェックの結果が「良」で
あれば、デコードした命令を実行する。しかし、ECC
チェックの結果が「否」であり、、かつ訂正可能であれ
ば、図14(A)−bに示すように、命令を再度デコー
ドして実行する。このECCチェックの結果が「否」で
あり、かつ訂正可能であった場合に訂正可能な内部障害
が発生したものとして内部障害表示信号113,213
が出力される。
【0092】従って、プロセッサA100またはプロセ
ッサB200において、ECCチェックの結果が「否」
であり、かつ訂正可能であった場合は、命令実行タイミ
ングがずれてしまうので、両プロセッサの同期が外れ
る。
【0093】そこで、同期外れ防止指示レジスタ10
4,204を設け、このレジスタ104,204に内部
命令列によって同期外れ防止指示情報(“1”)を設定
する。すると、プロセッサA100およびプロセッサB
200はその内部動作において、図14(B)−a,b
に示すように、命令フェッチの後、ECCチェックを行
い、その結果に基づいて命令デコードを行う。もし、E
CCチェックの結果が「否」であり、かつ訂正可能であ
った場合は、ECCによって命令データを訂正して命令
デコード部に渡してデコードさせる。
【0094】従って、命令実行タイミングは同じにな
り、同期は外れなくなる。
【0095】すなわち、内部障害を訂正した後に命令に
よって予め指定された処理を行うのに要する処理サイク
ル数と、障害が発生しない場合に命令によって予め指定
された処理を行うのに要する処理サイクル数とを同一に
することにより、同期は外れなくなる。
【0096】(第11の実施例)上記各実施例において
は、二重化制御回路300において障害が発生したプロ
セッサの特定を行う例を示したが、不一致障害を検出し
た時には構成制御を行わず、障害報告を受けたプロセッ
サがプロセッサ内部の障害詳細ログ及び不一致障害検出
情報から障害プロセッサを特定し、二重化制御回路40
0に指示をすることにより、構成切替を行うことも可能
である。
【0097】この場合の制御フローを図15に示す。
【0098】図15において、マスタモードのプロセッ
サA100に訂正不可能な内部障害が発生した場合、こ
のことを示す内部障害表示信号110が出力され、二重
化制御回路300に入力される。
【0099】一方、チェッカモードのプロセッサB20
0は同期が外れることにより、不一致障害を検出し、こ
のことを表わす不一致障害検出表示信号213を出力
し、二重化制御回路300に入力する。
【0100】そこで、二重化制御回路300はマスタモ
ードのプロセッサA100に訂正不可能な内部障害が発
生したものと確認し、障害ログ情報をログレジスタ30
3に採取すると共に、不一致障害割込み要求信号310
を割込み制御回路400に入力する。すると、割込み制
御回路400は内部障害が発生したプロセッサA100
に対してのみ割込み信号140を入力し、割込みをかけ
る。
【0101】割込みを受けたプロセッサA100は、ロ
グレジスタ303から障害ログ情報を取り込み、この内
容を解析することによって自分自身に内部障害が発生し
たことを認識する。この後、プロセッサA100は二重
化制御回路300に対し、構成切り替え指示を行い、さ
らに再同期指示を行う。
【0102】すると、二重化制御回路300はマスタモ
ード/チェッカモード指示信号120,220によっ
て、障害の発生したプロセッサA100をチェッカモー
ドに、障害の発生していないプロセッサB200をマス
タモードに切り替える。
【0103】(第12の実施例)ところで、実用に際し
ては、上記のような動作が正常に行われるかどうかをテ
ストする必要があるが、同期動作中のプロセッサA10
0,B200におけるモード表示レジスタ103,20
3は、マスタモードにおいて“1”、チェッカモードに
おいて“0”を示し、互いに異なる内容となっているの
で、このことを利用し、片方のプロセッサにのみ特別に
用意した命令列による内部障害注入動作を実行させるこ
とにより、故意に不一致状態が発生するようにすること
により、障害回復動作が正常に実行されるかを簡単にテ
ストすることができる。
【0104】すなわち、図10に示すように、各プロセ
ッサA100,B200に内部障害注入モード指示レジ
スタ105,205を設け、これらのレジスタ105,
205にモード表示レジスタ103,203の内容を命
令列によって設定する手段を設ける。
【0105】一方、プロセッサA100,B200にお
いては、レジスタ105,205の内容が“1”となっ
ている場合には、予め用意した命令列により指示される
内部障害注入動作を実行し、“0”となっている場合に
は予め用意した命令列により指示される内部障害注入動
作を実行しないような処理を組み込んでおく。
【0106】そして、テストに際し、図16のフローに
示すように、通常処理の適当な位置にモード表示レジス
タ103,203の内容を内部障害注入モード指示レジ
スタ105,205に設定する命令列および内部障害注
入動作を指示する命令列が挿入される。
【0107】図16の例ではプロセッサA100がマス
タモードになっているので、モード表示レジスタ103
に“1”が設定され、チェッカモードのプロセッサB2
00のモード表示レジスタ203には“0”が設定され
る。
【0108】すると、プロセッサA100においては、
予め用意した命令列により内部障害が注入される。これ
に対し、チェッカモードのプロセッサB200において
は内部障害が注入されない。そこで、上記内部障害が注
入された部位をアクセスする命令をプロセッサA100
とB200とが実行すると、プロセッサA100のみで
障害が検出され、両プロセッサA100とB200とは
出力が不一致状態となる。すなわち、強制的に不一致状
態が作り出される。
【0109】このようにして作り出した不一致状態に対
して、上述したような制御によって障害回復が行われた
ならば、正常であると認めることができる。
【0110】(第13の実施例)本発明を応用し、2台
のプロセッサを1組として、バス700にN組接続した
マルチプロセッサシステムの実施例を示すブロック図で
あり、各組はマスタモードのプロセッサK(但し、K=
1〜N)100−1〜100−Nとチェッカモードのプ
ロセッサK’200−1〜200−Nおよびキャッシュ
メモリK(800−1〜800−N),K’(900−
1〜900−N)で構成され、またバス700には二重
化制御回路300、割込み制御回路400、バス使用権
調停回路500、主記憶装置600が接続され、これら
二重化制御回路300、割込み制御回路400、バス使
用権調停回路500、主記憶装置600は各組のプロセ
ッサを共通に制御するようになっている。
【0111】このようなマルチプロセッサシステムにお
いて、キャッシュメモリK,K’のの内容を常に一致さ
せておく一致化制御を行う場合、同期化リセットを行っ
た後で主記憶装置600から内部状態をリストアしてい
る間に、他の組のプロセッサがデータを送出した場合、
異なった状態のキャシュメモリに対し制御を行うためプ
ロセッサ間の同期が外れてしまうことが発生しうる。
【0112】そこで、バス使用権占有指示レジスタ50
1をバス使用権調停回路500に設け、このレジスタ5
01にバス使用権占有指示情報を設定し、主記憶装置6
00から内部状態情報をリストアしているプロセッサの
組についてのみバス700を占有させるようにする。
【0113】この場合、バス使用権調停回路500はレ
ジスタ501にバス使用権占有指示情報が設定された時
には、他のプロセッサからのバス使用権要求を拒否す
る。
【0114】図18に、この場合の制御フローを示して
いる。図18において、障害解析後、内部状態を主記憶
装置600にセーブしたならば、再同期指示を行う前
に、バス使用権占有指示レジスタ501にバス使用権占
有指示情報を設定し、この後に内部状態を主記憶装置6
00からリストアし、リストアが終了したならば、レジ
スタ501をリセットし、通常処理に回復させる。
【0115】これにより、キャッシュメモリK,K’の
内容を常に一致させておく一致化制御を実現することが
できる。
【0116】
【発明の効果】以上説明したように本発明においては、 (1)互いに同期させて動作させていた2つのプロセッ
サのいずれかに内部障害が生じ、双方の出力が不一致と
なる不一致障害が発生した場合、制御手段が障害の発生
したプロセッサを特定し、不一致障害発生時に行ってい
た処理を、障害の発生していないプロセッサの内部情報
を用い、かつ二重化構成で継続させるため、間欠障害が
発生し易いRAMを内蔵したシステムであっても、シス
テム障害となる事象を減少させ、信頼性を向上させるこ
とができる。
【0117】(2)また、2つのプロセッサがバスを使
用するに先立ち出力するバス使用権要求信号を監視し、
そのタイミングが不一致の時は、出力の不一致検出に先
立って両プロセッサに通知し、記憶手段に保存された内
部情報を取り込ませて両プロセッサの内部情報を同化さ
せ、この同化状態で両プロセッサに障害発生時点で行っ
ていた情報処理を継続させるため、特別な信号を追加す
ることなく、障害検出を早めることができる。
【0118】(3)さらに、訂正可能な内部障害に対し
ては、その内部障害を訂正した後、予め指定された処理
を行うのに要する処理サイクル数と、内部障害が発生し
ない場合に予め指定された処理を行うのに要する処理サ
イクル数とを同一にするため、訂正可能な内部障害に対
して不一致障害の発生する回数を減少させることができ
る。
【0119】(4)さらに、バス使用権要求不一致信号
に対して、内部障害検出信号が訂正可能な障害を表わし
ている時は、両プロセッサからのバス使用権要求信号に
対するバス使用権許可信号を同期して両プロセッサに返
信するため、訂正可能な内部障害に起因する同期外れを
容易に再同期させることができる。
【0120】(5)さらに、訂正不可能な内部障害およ
び固定障害等に対しては、リセット動作を実行させない
か、またはリセット動作を実行させた後、新たな不一致
障害検出信号が入力されるのを禁止するようにしたの
で、固定障害が発生したプロセッサを切離し、正常なプ
ロセッサのみの単独で情報処理を継続させることができ
る。
【0121】(6)さらに、2つのプロセッサの一方
に、特定の命令列の挿入を指示し、特定の命令列の挿入
によって内部障害を発生させ、強制的に出力の不一致状
態を発生させるようにしたので、不一致検出機能の正当
性を極めて簡単に確認することができる。
【図面の簡単な説明】
【図1】本発明によるプロセッサ二重化方式の情報処理
装置の一実施例を示すブロック図である。
【図2】図1においてチェッカモードのプロセッサに障
害が発生した場合の処理動作を示す制御フロー図であ
る。
【図3】図1においてマスタモードのプロセッサに障害
が発生した場合の処理動作を示す制御フロー図である。
【図4】チェッカモードのプロセッサが有する障害ログ
情報を主記憶装置に転送する場合の制御フロー図であ
る。
【図5】固定障害が発生した場合にマスタモードのプロ
セッサのみを動作させる場合の構成を示すブロック図で
ある。
【図6】図5においてマスタモードのプロセッサのみを
動作させる場合の制御フロー図である。
【図7】図5においてマスタモードのプロセッサのみを
動作させる場合の別の例を示す制御フロー図である。
【図8】割込みを保留する手段を設けたプロセッサにお
ける再同期処理を示す制御フロー図である。
【図9】同期状態表示信号によって同期状態を監視する
部分の構成図である。
【図10】バス調停回路を設けた構成を示すブロック図
である。
【図11】図10においてバス使用権要求信号の不一致
によって障害を早期に検出する場合の制御フロー図であ
る。
【図12】図10においてバス使用許可信号を同期して
出力することによって再同期指せる場合の制御フロー図
である。
【図13】不一致障害を検出する機能を一時的に停止し
て再同期させる場合の制御フロー図である。
【図14】訂正可能な内部障害が発生した時と発生しな
い時とで処理サイクルを同一にして同期外れを防止する
場合の制御フロー図である。
【図15】障害プロセッサの特定をマスタプロセッサで
行う場合の制御フロー図である。
【図16】障害検出機能を検査するために強制的に出力
の不一致状態を作り出す場合の制御フロー図である。
【図17】本発明を応用したマルチプロセッサシステム
の一実施例を示すブロック図である。
【図18】図17における再同期処理を示す制御フロー
図である。
【符号の説明】
100…プロセッサA、101…出力モード制御レジス
タ、102…出力比較抑止指示レジスタ、103…モー
ド表示レジスタ、104…同期外れ防止モード指示レジ
スタ、105…内部障害注入モード指示レジスタ、11
0…訂正不可能内部障害表示信号、111…内部固定障
害表示信号、112…訂正可能内部障害表示信号、11
3…不一致障害検出表示信号、120…マスタモード/
チェッカモード指示信号、130…バス使用権要求信
号、131…バス使用権許可信号、140…割込み信
号、150…同期リセット指示信号、160…同期状態
表示信号、200…プロセッサB、201…出力モード
制御レジスタ、202…出力比較抑止指示レジスタ、2
03…モード表示レジスタ、204…同期外れ防止モー
ド指示レジスタ、205…内部障害注入モード指示レジ
スタ、210…訂正不可能内部障害表示信号、211…
内部固定障害表示信号、212…訂正可能内部障害表示
信号、213…不一致障害検出表示信号、220…マス
タモード/チェッカモード指示信号、230…バス使用
権要求信号、231…バス使用権許可信号、240…割
込み信号、250…同期リセット指示信号、260…同
期状態表示信号、300…二重化制御回路、301…不
一致障害報告抑止指示レジスタ、302…再同期指示レ
ジスタ、303…障害ログレジスタ、310…不一致障
害割込み要求信号、400…割込み制御回路、401…
割込み抑止指示レジスタ、500…バス使用権調停回
路、501…バス使用権占有指示レジスタ、510…バ
ス使用権要求不一致表示信号、600…主記憶装置、7
00…バス。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩本 博志 神奈川県秦野市堀山下1番地 株式会社 日立製作所 神奈川工場内 (56)参考文献 特開 平3−15946(JP,A) 特開 平2−171837(JP,A) 特開 平1−145734(JP,A) 特開 平1−297734(JP,A) 特開 昭58−109944(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 11/16 - 11/20 G06F 15/16 - 15/177 G06F 11/10 JICSTファイル(JOIS)

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】 同じ処理を行なう第一、第二のプロセッ
    サと、 前記第一、第二のプロセッサに対して障害発生後の対応
    を指示する制御手段を有する情報処理装置において、 前記第一、第二のプロセッサは、 各々のプロセッサの内部障害検出に関し、発生した内部
    障害の種類を識別するための情報を含む第一の信号を前
    記制御手段に出力する第一の出力部と、 各々のプロセッサで行なった処理結果に関する第二の信
    号を出力する第二の出力部をそれぞれ備え、 前記制御手段は 前記第一の信号、第二の信号を入力し、 前記第一の信号から前記第一、又は前記第二のプロセッ
    サに内部障害が発生したか否かを確認し、 前記第二の信号から前記第一のプロセッサと前記第二の
    プロセッサの処理結果に不一致障害が生じたか否かを確
    認し、 前記内部障害の発生と前記不一致障害の発生の有無に応
    じて障害が発生したプロセッサを特定すると共に、 前記発生した内部障害の種類によって必要な障害発生後
    の処理を選択する ことを特徴とする情報処理装置。
  2. 【請求項2】 請求項1に記載の情報処理装置におい
    て、 各種データを格納する記憶手段を有し、 前記制御手段は、障害が発生していないプロセッサの内
    部状態を前記記憶手段に格納し、 障害発生後の再同期処理を行なうことを特徴とする情報
    処理装置。
  3. 【請求項3】 請求項に記載の情報処理装置におい
    て、 さらに処理を継続するために必要な情報を格納する記憶
    手段を有し、 前記制御手段は、発生した内部障害が訂正不可能な内部
    障害であると識別した場合に障害が発生していないプロ
    セッサの内部状態を前記記憶手段に格納させることを特
    徴とする情報処理装置。
  4. 【請求項4】 請求項に記載の情報処理装置におい
    て、 前記制御手段は、発生した内部障害が固定障害であると
    識別した場合に障害が発生していないプロセッサによる
    縮退動作を行なう指示を出力することを特徴とする情報
    処理装置。
  5. 【請求項5】 請求項に記載の情報処理装置におい
    て、 前記制御手段は、障害が発生したことを通知する障害報
    告を出力することを特徴とする情報処理装置。
  6. 【請求項6】 各々RAMを有し相互に同期して同じ動
    作を行なう第一、第二の処理装置と、 前記第一、第二の処理装置の障害発生時の処理を制御す
    る制御手段を有する情報処理システムであって、 前記制御手段は、 前記第一、第二の処理装置の各々の内部における第一の
    障害の発生を認識し、 前記第一、第二の処理装置が処理したデータ間における
    第二の障害の発生を認識し、 認識した前記第一の障害と前記第二の障害から障害が発
    生した処理装置を特定すると共に前記第一、第二の処理装置の各々で発生した前記第一の
    障害の程度を認識し、 前記認識した程度に応じて前記第一、第二の処理装置に
    必要な処理を選択する ことを特徴とする情報処理システ
    ム。
  7. 【請求項7】 請求項に記載の情報処理システムにお
    いて、 さらに処理を継続するために必要な情報を格納する記憶
    手段を有し、 前記制御手段は、前記必要な情報として障害が発生して
    いない処理装置の内部状態を前記記憶手段に格納するこ
    とを特徴とする情報処理システム。
  8. 【請求項8】 請求項に記載の情報処理システムにお
    いて、 前記第一、第二の処理装置は前記記憶手段に格納した情
    報を用いて再同期処理を行なうことを特徴とする情報処
    理システム。
  9. 【請求項9】 請求項に記載の情報処理システムにお
    いて、 前記制御手段が認識した前記第一の障害が固定障害の場
    合に前記障害が発生した処理装置をシステムから切り離
    すことを特徴とする情報処理システム。
  10. 【請求項10】 請求項に記載の情報処理システムに
    おいて、 前記制御手段は前記第一、第二の処理装置における障害
    検知を報告することを特徴とする情報処理システム。
  11. 【請求項11】 各々RAMを有し相互に同期して同じ
    動作を行なう第一、第二の処理装置と前記第一、第二の
    処理装置に対する障害発生時の制御を行なう制御手段を
    備えた情報処理システムにおける障害処理方法であっ
    て、 前記第一、第二の処理装置の各々の内部における第一の
    障害の発生を認識し、 前記第一、第二の処理装置が処理したデータ間における
    第二の障害の発生を認識し、 認識した前記第一の障害と前記第二の障害から障害が発
    生した処理装置を特定し、前記制御手段は発生した前記第一の障害の種別を識別
    し、 前記識別した種別に応じて前記第一、第二の処理装置が
    行なうべき処理を選択し、 前記制御手段から前記発生した障害に必要な処理を前記
    第一、第二の処理装置に行なう指示を出力することを特
    徴とする障害処理方法。
  12. 【請求項12】 請求項11に記載の障害処理方法にお
    いて、 前記制御手段は発生した前記第一の障害が固定障害であ
    る場合に、 特定した前記障害が発生した処理装置を切り離し他方の
    処理装置において処理を継続することを特徴とする障害
    処理方法。
  13. 【請求項13】 請求項11に記載の障害処理方法にお
    いて、 前記制御手段は前記第一、又は第二の処理装置いずれか
    の障害の発生を特定した後に当該障害報告を出力するこ
    とを特徴とする障害処理方法。
  14. 【請求項14】 請求項11に記載の障害処理方法にお
    いて、 前記制御手段は障害が発生していない処理装置の内部状
    態を記憶手段に格納するように前記障害が発生していな
    い処理装置に指示することを特徴とする障害処理方法。
JP24813392A 1992-09-17 1992-09-17 情報処理装置及び情報処理装置における障害処理方法 Expired - Fee Related JP3423732B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP24813392A JP3423732B2 (ja) 1992-09-17 1992-09-17 情報処理装置及び情報処理装置における障害処理方法
US08/686,486 US5748873A (en) 1992-09-17 1996-07-26 Fault recovering system provided in highly reliable computer system having duplicated processors

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24813392A JP3423732B2 (ja) 1992-09-17 1992-09-17 情報処理装置及び情報処理装置における障害処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001400603A Division JP3539687B2 (ja) 2001-12-28 2001-12-28 プロセッサ二重化方式の情報処理装置

Publications (2)

Publication Number Publication Date
JPH0695902A JPH0695902A (ja) 1994-04-08
JP3423732B2 true JP3423732B2 (ja) 2003-07-07

Family

ID=17173723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24813392A Expired - Fee Related JP3423732B2 (ja) 1992-09-17 1992-09-17 情報処理装置及び情報処理装置における障害処理方法

Country Status (1)

Country Link
JP (1) JP3423732B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4555713B2 (ja) * 2005-03-17 2010-10-06 富士通株式会社 エラー通知方法及び情報処理装置
DE102005037246A1 (de) * 2005-08-08 2007-02-15 Robert Bosch Gmbh Verfahren und Vorrichtung zur Steuerung eines Rechnersystems mit wenigstens zwei Ausführungseinheiten und einer Vergleichseinheit
EP2407885A4 (en) * 2009-03-09 2013-07-03 Fujitsu Ltd INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING DEVICE CONTROL METHOD, AND INFORMATION PROCESSING DEVICE CONTROL PROGRAM
JP2011095837A (ja) * 2009-10-27 2011-05-12 Toshiba Corp フェールセーフシステム
CN112015599B (zh) * 2019-05-31 2022-05-13 华为技术有限公司 错误恢复的方法和装置

Also Published As

Publication number Publication date
JPH0695902A (ja) 1994-04-08

Similar Documents

Publication Publication Date Title
US9052887B2 (en) Fault tolerance of data processing steps operating in either a parallel operation mode or a non-synchronous redundant operation mode
KR100566338B1 (ko) 폴트 톨러런트 컴퓨터 시스템, 그의 재동기화 방법 및 재동기화 프로그램이 기록된 컴퓨터 판독가능 기억매체
US7496786B2 (en) Systems and methods for maintaining lock step operation
US6938183B2 (en) Fault tolerant processing architecture
JPH01154242A (ja) 二重ゾーンの耐欠陥コンピュータシステム
EP1703401A2 (en) Information processing apparatus and control method therefor
JPH0833874B2 (ja) 複数のプロセッサを同期する装置
JPH01154240A (ja) 単一レールインターフェイスにエラーチェック機能を有する二重レールプロセッサ
US9170907B2 (en) Method of providing high integrity processing
KR20220010040A (ko) 에러 복구 방법 및 장치
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
JP2003015900A (ja) 追走型多重化システム、及び追走により信頼性を高めるデータ処理方法
US20040153731A1 (en) Information processing apparatus
JP3423732B2 (ja) 情報処理装置及び情報処理装置における障害処理方法
JPH0375834A (ja) パリティの置換装置及び方法
US7159152B2 (en) System with a monitoring device that monitors the proper functioning of the system, and method of operating such a system
JP3063334B2 (ja) 高信頼度化情報処理装置
JP3539687B2 (ja) プロセッサ二重化方式の情報処理装置
JPH0916535A (ja) マルチプロセッサ計算機
JP2000298594A (ja) フォールトトレラント制御方法および冗長コンピュータシステム
JPH086800A (ja) データ処理装置及びマイクロプロセッサ
JPS5931738B2 (ja) 計算機システムの並列三重系構成方法
JP2002108638A (ja) マイクロコンピュータのエラー検出方法及びエラー検出回路及びマイクロコンピュータシステム
JP3055249B2 (ja) プロセッサのデバッグ方式
JP2922981B2 (ja) タスクの実行継続方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees