JPH0863365A - データ処理装置 - Google Patents

データ処理装置

Info

Publication number
JPH0863365A
JPH0863365A JP6197125A JP19712594A JPH0863365A JP H0863365 A JPH0863365 A JP H0863365A JP 6197125 A JP6197125 A JP 6197125A JP 19712594 A JP19712594 A JP 19712594A JP H0863365 A JPH0863365 A JP H0863365A
Authority
JP
Japan
Prior art keywords
unit
processing
built
ram error
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6197125A
Other languages
English (en)
Inventor
Hidenobu Ota
秀信 大田
Tatsuki Nakada
達己 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6197125A priority Critical patent/JPH0863365A/ja
Priority to US08/455,723 priority patent/US5572662A/en
Publication of JPH0863365A publication Critical patent/JPH0863365A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • G06F11/141Saving, restoring, recovering or retrying at machine instruction level for bus or memory accesses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/165Error detection by comparing the output of redundant processing systems with continued operation after detection of the error

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 本発明は、多重化した処理部(CPU)に同
一動作を行なわせ各処理部からの出力を比較して同一動
作を行なっていることを確認しながら処理を実行するデ
ータ処理装置に関し、内蔵RAMの障害を検出した場合
には出力比較チェックによるシステム停止を抑止しなが
らその障害を修復できるようにして、システムの信頼性
および可用性の向上をはかることを目的とする。 【構成】 各処理部1の内蔵RAM1aについてエラー
が発生したことを検出する内蔵RAMエラー検出部4
と、この内蔵RAMエラー検出部4により少なくとも一
つの処理部1での内蔵RAMエラーの発生を検出した場
合にその内蔵RAMエラーの発生に起因する比較結果が
比較手段2から出力されるのを抑止する抑止部5とをそ
なえて構成する。

Description

【発明の詳細な説明】
【0001】(目次) 産業上の利用分野 従来の技術 発明が解決しようとする課題 課題を解決するための手段(図1) 作用(図1) 実施例(図2〜図8) 発明の効果
【0002】
【産業上の利用分野】本発明は、処理部(CPU)を多
重化してそなえ、各処理部に同一動作を行なわせるとと
もに各処理部からの出力を比較することにより、同一動
作を行なっていることを確認しながら処理を実行してい
くデータ処理装置に関する。
【0003】
【従来の技術】近年、データ処理装置における処理速度
向上のため、CPU(処理部)内に、例えばキャッシュ
メモリ,TLB(Translation Lookaside Buffer,変換
索引バッファ)等として用いられるRAMを内蔵するこ
とは一般的に行なわれているが、このようなRAMはゲ
ートで構成されている部分に比べて故障の発生頻度が高
いほか、α線やノイズなどによる一時的な故障(ビット
反転エラー)が発生することもある。
【0004】ところで、データ処理装置としての信頼性
を向上させるために、データ処理装置をなすCPUを二
重化してそなえ、各CPUに同一動作を行なわせるとと
もに各CPUからの出力を比較することにより、同一動
作を行なっていることを確認しながら処理を実行してい
くことも一般的に行なわれている。このようにCPUを
二重化したデータ処理装置において、一方のCPUにの
み上述のような内蔵RAMの障害(ソフトエラー;以
下、内蔵RAMエラーという場合もある)が発生した場
合、当然2つのCPUの動作は異なり、2つのCPUの
出力ピンから出力される値にずれが生じてしまい、同期
エラーが発生する。
【0005】従来、このような同期エラー発生時の対処
手法としては、故障箇所をハードウエア交換等により修
復すべくシステム全体を停止させるものや、内蔵RAM
エラーが発生したCPUを切り離して一方のCPUのみ
で処理を続行させるものなどがある。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
たデータ処理装置における従来の同期エラー発生時の対
処手法のうち前者のものでは、発生頻度の高い内蔵RA
Mエラーが生じる度にシステム停止という最悪の状態に
なってしまい、信頼性,可用性(availability)に欠け
るなどの課題があった。また、後者の手法では、システ
ム停止という最悪の状態にはならないが、一方のCPU
で運用を続行することになるので、信頼性の低下を招い
てしまう。
【0007】CPUの内蔵RAMの一時的な障害の発生
頻度は一般に高いが、キャッシュメモリの内容は主記憶
装置(MSU)から正しい内容を再度読み出すことで、
修復可能であるし、またTLBの内容も再度アドレス変
換を起動することで修復することができる。ただし、ラ
イトバック(ストアイン)方式で制御しているキャッシ
ュメモリの場合、最新のデータが主記憶装置に保持され
ていない場合があるので、上述の手法で修復できないこ
ともあるが、ECC(Error Checking and Correction)
等の手法によりデータを復元することで修復を行なうこ
とができる。
【0008】しかし、CPUを二重化した場合には、一
方のCPUが内蔵RAMに障害を検出し修復処理に入っ
た場合に、他方のCPUにおいても内蔵RAMエラーが
発生しない場合には同期がずれ、2つのCPUの出力ピ
ンからの値がずれてしまい、システムが停止してしま
う。このように内蔵RAMの障害により、単一CPUで
あれば修復することができシステムの停止を招かなかっ
たものが、CPUを二重化したためにシステムの停止を
招くことになる。つまり、データ処理装置の信頼性を向
上すべくCPUを二重化したにもかかわらず、発生頻度
の高い内蔵RAMエラーについては、二重化して出力比
較チェック(同期チェック)を行なうことにより逆に頻
繁にシステム停止を発生させることになるために信頼性
や可用性を低下させてしまう。
【0009】本発明は、このような課題に鑑み創案され
たもので、内蔵RAMの障害を検出した場合には出力比
較チェックによるシステム停止を抑止しながら、その内
蔵RAMの障害を修復できるようにして、システムの信
頼性および可用性の向上をはかったデータ処理装置を提
供することを目的とする。
【0010】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図で、この図1において、1は多重化された複数
(少なくとも2つ)の処理部、2は各処理部1からの出
力を比較する比較部、3は制御部で、この制御部3は、
各処理部1に同一動作を行なわせ、比較部2による比較
結果に基づき各処理部1が同一動作を行なっていること
を確認しながら処理を実行する一方、比較部2による比
較結果に基づき各処理部1からの出力不一致を確認した
場合に処理を停止するように制御を行なうものである。
【0011】また、4は各処理部1の内蔵RAM1aで
エラーが発生したことを検出する内蔵RAMエラー検出
部、5は抑止部で、この抑止部5は、内蔵RAMエラー
検出部4により少なくとも一つの処理部1で内蔵RAM
エラーが発生したことを検出した場合に、この内蔵RA
Mエラーの発生に起因して比較部2が出力した比較結果
を抑止するものである(請求項1)。
【0012】そして、比較部2からの比較結果を抑止部
5により抑止した場合に、その内蔵RAMエラーに対す
る修復処理を行なってから、再び、比較部2による出力
比較を行ないながら処理を実行する(請求項2)。な
お、抑止部5は、後述の論理和ゲートおよび論理積ゲー
トから構成することができる。ここで、論理和ゲート
は、各処理部1からの内蔵RAMエラー検出信号の論理
和を算出し、比較抑止信号として出力するものであり、
論理積ゲートは、その内蔵RAMエラー検出信号と同一
タイミングで比較部2から出力された比較結果と、論理
和ゲートからの比較抑止信号の反転信号との論理積を算
出し、出力比較エラー信号として出力するものである
(請求項3)。
【0013】また、制御部3は、複数の処理部1の中で
予め定められた主処理部(図1中の複数の処理部1のう
ちの一つ)における情報に基づいて、その内蔵RAMエ
ラーに対する修復処理を行なうように複数の処理部1を
制御する(請求項4)。このとき、内蔵RAMエラー検
出時に主処理部以外の従処理部をリセットするリセット
部をそなえ(請求項5)、このリセット部によるリセッ
ト処理が内蔵RAMエラーに起因するものであるか否か
を示すフラグをそなえてもよい(請求項6)。なお、こ
のようなフラグをそなえる代わりに、内蔵RAMエラー
検出時に、制御部3が、従処理部に対し割込みを行な
い、その割込みアドレスとして内蔵RAMエラー発生時
専用のものを用いるようにしてもよい(請求項7)。
【0014】また、制御部3は、主処理部および従処理
部の停止を確認してから、主処理部および従処理部を同
時に再起動し、その内蔵RAMエラーに対する修復処理
を開始するようにする(請求項8)。そして、その内蔵
RAMエラーに対する修復処理として、後述のデータ退
避処理およびデータ書込処理を行なってもよい。ここ
で、データ退避処理では、主処理部の内蔵制御レジス
タ,内蔵ステータスレジスタにおけるデータを主記憶部
に一旦退避させ、データ書込処理では、データ退避処理
後に、主記憶部に退避させたデータを主処理部以外の従
処理部の内蔵制御レジスタ,内蔵ステータスレジスタに
書き込む(請求項9)。このデータ書込処理時に、主記
憶部に退避させたデータを主処理部および従処理部に同
時に書き込んでもよい(請求項10)。 また、内蔵R
AMエラーに対する修復処理時に、内蔵RAM1aのう
ち変換検索バッファ,キャッシュメモリとして用いられ
る内蔵RAMについては、主処理部および従処理部にお
いて無効化する(請求項11)。このような内蔵RAM
エラーに対する修復処理をOS(Operating System)よ
りも上流側のファームウエア上で行なう(請求項1
2)。
【0015】
【作用】図1により上述した本発明のデータ処理装置で
は、内蔵RAMエラー検出部4により少なくとも一つの
処理部1で内蔵RAMエラーが発生したことを検出する
と、抑止部5により、この内蔵RAMエラーの発生に起
因して比較部2から出力された比較結果が抑止される。
これにより、内蔵RAMエラー発生時には、比較部2の
出力比較チェック(同期チェック)に応じて制御部3に
よりシステムが停止されるのを抑止することができる
(請求項1)。
【0016】そして、比較部2からの比較結果を抑止部
5により抑止してシステム停止を抑止した状態で、処理
部1により、その内蔵RAMエラーに対する修復処理が
行なわれた後、比較部2の出力比較チェック(同期チェ
ック)を行ないながら実行される処理が再開されるの
で、システム停止を招くことなくその内蔵RAM1aの
障害を修復することができる(請求項2)。
【0017】なお、前述のごとく論理和ゲートおよび論
理積ゲートから構成された抑止部5では、内蔵RAMエ
ラー検出部4により内蔵RAMエラーの発生が検出され
ると、内蔵RAMエラー検出信号が“0”から“1”に
なり、論理和ゲートからの比較抑止信号が“0”から
“1”になる。このように比較抑止信号が“1”になる
と、その反転信号は“0”の状態で論理積ゲートに入力
される。
【0018】従って、この論理積ゲートに入力される、
内蔵RAMエラー検出信号と同一タイミングの比較部2
による比較結果は、論理積ゲートを通過することができ
なくなって、出力比較エラー信号の出力が抑止される。
一方、論理和ゲートからの比較抑止信号が“0”の状態
では、その反転信号は“1”になっているので、論理積
ゲートに入力される比較部2からの比較結果は論理積ゲ
ートから出力比較エラー信号として出力される(請求項
3)。
【0019】また、制御部3による内蔵RAMエラーに
対する修復処理は、複数の処理部1の中で主処理部にお
ける情報に基づいて行なわれ、制御部3により、主処理
部以外の従処理部における情報を主処理部における情報
と一致させることで、同一の修復処理ソフトウエアを多
重化した状態で実行可能となり、修復処理を行なうこと
ができる(請求項4)。
【0020】このとき、内蔵RAMエラー検出時にリセ
ット部により従処理部をリセットすることで、内蔵RA
Mエラー検出時に従処理部が突き放しロードアクセスを
出力している場合、この従処理部が突き放しロードアク
セスの完了を待つことなくがなくなる(請求項5)。ま
た、このリセット部によるリセット処理が内蔵RAMエ
ラーに起因するものであるか否かを示すフラグをそなえ
ることにより、そのフラグを参照するだけで、システム
初期化時等の本来のリセット処理であるか内蔵RAMエ
ラーに起因するリセット処理であるかを判別できるの
で、各リセット処理に応じた対処(即ち、内蔵RAMエ
ラーに起因するリセット処理である場合には所定の修復
処理)を施すことができる(請求項6)。
【0021】なお、このようなフラグに代えて、内蔵R
AMエラー検出時の制御部3による従処理部への割込み
処理時の割込みアドレスとして内蔵RAMエラー発生時
専用のものを用いることで、フラグを用いた場合と同様
に、システム初期化時等の本来のリセット処理であるか
内蔵RAMエラーに起因するリセット処理であるかを判
別できるので、各リセット処理に応じた対処を施せる
(請求項7)。
【0022】また、制御部3により、主処理部および従
処理部の停止を確認してから、主処理部および従処理部
が同時に再起動されて修復処理が開始され、主処理部に
対する修復処理,従処理部に対する修復処理,両処理部
に対する修復処理に切り分けることなく、内蔵RAMエ
ラーに対する修復処理が行なわれる(請求項8)。そし
て、主処理部の内蔵制御レジスタ,内蔵ステータスレジ
スタにおけるデータを主記憶部に一旦退避させてから、
主記憶部に退避させたデータを主処理部以外の従処理部
の内蔵制御レジスタ,内蔵ステータスレジスタに書き込
むことにより、これらの処理部における内蔵RAMのデ
ータを一致させることができる(請求項9)。また、デ
ータ書込処理時に、主記憶部に退避させたデータを主処
理部および従処理部に同時に書き込んでも、これらの処
理部における内蔵RAMのデータを一致させることがで
き、特に、この場合、主処理部と従処理部とを切り分け
た制御が不要になる(請求項10)。
【0023】また、内蔵RAMエラーに対する修復処理
時に、変換検索バッファ,キャッシュメモリとして用い
られる内蔵RAMについては、主処理部および従処理部
において無効化することで、これらの処理部における内
蔵RAMのデータを一致させることができる(請求項1
1)。さらに、内蔵RAMエラーに対する修復処理を、
OSよりも上流側のファームウエア上で行なうことで、
OSに一切の変更を加えることなく、内蔵RAMエラー
に対する修復処理が可能になる(請求項12)。
【0024】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図2は本発明の一実施例としてのデータ処理装置
を示すブロック図であり、この図2に示すように、本実
施例では、CPUを二重化したデータ処理装置が示され
ている。
【0025】図2において、10AはマスタCPU(主
処理部)、10BはスレーブCPU(従処理部)、11
はMCU(Memory access Control Unit;制御部)、1
2はMSU(Main Strage Unit;主記憶部)であり、二
重化されたCPU10A,10Bは、MCU11により
制御されて同一動作を実行するようになっている。ま
た、MCU11は、CPU10A,10BとMSU12
との間にそなえられて、各CPU10A,10Bからの
アクセスに応じてMSU12との間でデータのやり取り
(読出/書込)を制御するためのものである。
【0026】なお、本実施例では、マスタCPU10A
からMCU11には、ストアデータMSDおよびそのパ
リティMSDPと、アクセスアドレスMAAおよびその
パリティMAAPと、制御信号C2とが送られる一方、
MCU11からマスタCPU10Aには、フェッチデー
タFDおよびそのパリティFDPと、制御信号C1とが
送られるようになっている。これに対して、スレーブC
PU10BからMCU11には、データ,アドレス,制
御信号等は送信されず、多重化したCPU10A,10
Bが同一動作を行なっているかどうかを確認するために
パリティ信号のみ送信され、MCU11からスレーブC
PU10Bには、マスタCPU10Aと同様に、フェッ
チデータFDおよびそのパリティFDPと、制御信号C
1とが送られるようになっている。
【0027】つまり、MCU11には、マスタCPU1
0Aからの制御信号C2およびアクセス情報のみが入力
され、マスタCPU10Aからアクセス要求されたデー
タMSDおよびそのパリティMSDPのみがMSU12
へ送られる一方、マスタCPU10Aからフェッチ(読
出)要求されたデータFDおよびそのパリティFDP
は、MSU12から読み出され、マスタCPU10Aお
よびスレーブCPU10Bの両方へ送られる。
【0028】従って、マスタCPU10Aおよびスレー
ブCPU10Bには、全く同一のフェッチデータFDお
よび制御信号C1が入力されるので、これらのCPU1
0A,10Bは同一動作を実行するが、MCU11に対
するアクセスはマスタCPU10Aのみが行なう。ただ
し、スレーブCPU10Bからは、ストアデータパリテ
ィSSDPおよびアクセスアドレスパリティSAAPの
みが出力され、後述する出力比較回路13に入力されて
いる。即ち、スレーブCPU10Bは、マスタCPU1
0Aと同一の動作を行なって、後述する出力比較チェッ
ク(同期チェック)のために必要なデータを得るために
用いられる。なお、本実施例の説明中、出力比較チェッ
クと同期チェックとは同義である。
【0029】このように、本実施例では、スレーブCP
U10Bについては、MCU11に対するアクセス関連
の書込信号ライン等が省略され、これによりシステムを
構成するハードウエア量を少なくしている。また、図2
において、13は出力比較回路(比較部)で、この出力
比較回路13は、マスタCPU10Aの出力とスレーブ
CPU10Bの出力とを比較して、出力比較チェック
(同期チェック)を行なうもので、本実施例では、マス
タCPU10AからのストアデータパリティMSDPと
スレーブCPU10BからのストアデータパリティSS
DPとを比較すると同時に、マスタCPU10Aからの
アクセスアドレスパリティMAAPとスレーブCPU1
0BからのアクセスアドレスパリティSAAPとを比較
し、いずれか一方に不一致が生じた場合に“0”から
“1”になる出力比較エラー信号として、同期チェック
結果SYNC-CHKを出力するものである。
【0030】なお、本実施例では、構成を簡素化するた
めにパリティの比較のみを行なっているが、ストアデー
タどうしやアクセスアドレスどうしの比較を行なうよう
にしてもよい。また、出力比較回路13の詳細構成につ
いては図4により後述する。さらに、19はCPU10
Aからアクセス可能なMCU11内のステータスレジス
タで、このステータスレジスタ19には、後述する領域
19Aのほか、出力比較回路13による同期チェックを
有効/無効にするための同期チェックイネーブル設定領
域(SYNC-CHK-EN)19Bが設けられている。この領域1
9Bに“1”が設定され同期チェックイネーブルが設定
されている場合、同期チェックが有効になっており、図
4により後述するごとく、出力比較回路13による同期
チェック結果SYNC-CHKが、後述する出力比較チェック抑
止回路18において有効化され、MCU11に入力され
るようになっている。
【0031】そして、MCU11は、その同期チェック
結果SYNC-CHKに基づきCPU10A,10Bが同一動作
を行なっていることを確認しながら処理を実行する一
方、その同期チェック結果SYNC-CHKに基づきCPU10
A,10Bの出力不一致を確認した場合に処理を停止
(システム停止)するように制御する機能を有してい
る。上述した領域19Bに“0”が設定され同期チェッ
クイネーブルが未設定の場合には、同期チェックは無効
になっており、図4により後述するごとく、出力比較回
路13による同期チェック結果SYNC-CHKは、後述する出
力比較チェック抑止回路18において無効化され、MC
U11には入力されず、CPU10A,10Bの出力不
一致によるシステム停止が行なわれないようになってい
る。
【0032】一方、本実施例の各CPU10A,10B
には、それぞれ、CPU10A,10Bに内蔵されるR
AMでエラーが発生したことを検出する内蔵RAMエラ
ー検出回路14がそなえられている。各CPU10A,
10Bには、例えば、図3に示すように、内蔵RAMと
してキャッシュメモリ15AおよびTLB15Bを有し
ている。
【0033】そして、この内蔵RAMエラー検出回路1
4は、これらの内蔵RAM15A,15Bでエラー(ビ
ット反転エラー等の障害)が発生したことを検出するも
ので、例えば図3に示すように、複数(図中2つ)のパ
リティチェック回路(PCK)16と、論理和ゲート1
7とから構成されている。ここで、各パリティチェック
回路16は、各内蔵RAM15A,15Bのリードポー
トRに接続され、リードポートRから読み出されるデー
タのパリティをチェックするもので、パリティエラー発
生時(内蔵RAMエラー発生時)に“0”から“1”に
なるパリティチェック信号を出力するものである。
【0034】また、論理和ゲート17は、各パリティチ
ェック回路16からのパリティチェック信号の論理和を
算出し、内蔵RAMエラー検出信号IRX-DETECTとして出
力するものである。つまり、CPU10Aもしくは10
Bの内蔵RAMのいずれか一つにでも内蔵RAMエラー
が発生すると、内蔵RAMエラー検出回路14からの内
蔵RAMエラー検出信号IRX-DETECTが“0”から“1”
になる。この内蔵RAMエラー検出信号IRX-DETECTは、
CPU10A,10Bに設けられた外部端子から、他方
のCPU10Aまたは10Bのほか、MCU11,後述
する比較チェック抑止回路18および後述するシステム
制御回路20へ出力される。
【0035】なお、図2において、マスタCPU10A
からの内蔵RAMエラー検出信号は“M-IRX-DETECT”と
して示し、スレーブCPU10Bからの内蔵RAMエラ
ー検出信号は“S-IRX-DETECT”として示されている。た
だし、“IRX”は、“Internal RAM Exception(内蔵
RAM障害,内蔵RAM例外)”の略である。また、図
2に示すように、MCU11のステータスレジスタ19
には、内蔵RAMエラー検出フラグ設定領域(IRX-FLA
G)19Aが設けられており、マスタCPU10Aから
の内蔵RAMエラー検出信号M-IRX-DETECTもしくはスレ
ーブCPU10Bからの内蔵RAMエラー検出信号S-IR
X-DETECTのいずれか一方が“1”になると、この領域1
9Aのフラグが“1”に設定されるようになっている。
従って、本実施例のシステムを制御するためのソフトウ
エアは、このステータスレジスタ19の領域19Aのフ
ラグを参照することにより、スレーブCPU10Bに対
してリセット処理(後述)を行なう際に、そのリセット
処理が、システム初期化時等の本来のリセット処理であ
るか内蔵RAMエラーに起因するリセット処理であるか
を判別できるようになっている。
【0036】さて、図2において、18は出力比較チェ
ック抑止回路で、この出力比較チェック抑止回路18
は、CPU10A,10Bの少なくとも一方で内蔵RA
Mエラーが発生した場合に、この内蔵RAMエラーの発
生に起因して出力比較回路13が出力した比較結果(同
期チェック結果SYNC-CHK)を抑止するものである。以下
に、図4を参照しながら、出力比較回路13および出力
比較チェック抑止回路18の詳細な構成について説明す
る。
【0037】出力比較回路13は、2つの一致比較回路
21A,21Bと、論理和ゲート22と、タイミング調
整回路23とから構成されている。一致比較回路21A
は、マスタCPU10AからのストアデータパリティM
SDPとスレーブCPU10Bからのストアデータパリ
ティSSDPとを比較し、一致しない場合に“0”から
“1”になる信号を出力するものであり、同様に、一致
比較回路21Bは、マスタCPU10Aからのアクセス
アドレスパリティMAAPとスレーブCPU10Bから
のアクセスアドレスパリティSAAPとを比較し、一致
しない場合に“0”から“1”になる信号を出力するも
のである。
【0038】そして、論理和ゲート22は、これらの一
致比較回路21A,21Bからの信号の論理和を算出す
るものである。従って、この論理和ゲート22からの信
号、つまり同期チェック結果SYNC-CHKは、一致比較回路
21A,21Bの少なくとも一方でパリティの不一致
(CPU出力不一致)が検出された場合に“0”から
“1”になる。
【0039】タイミング調整回路23は、2段のレジス
タ(Dフリップフロップ)23A,23Bから構成され
ており、これらのレジスタ23A,23Bにより、論理
和ゲート22からの同期チェック結果SYNC-CHKを、本実
施例では2サイクル分だけ遅延させて、その出力タイミ
ングが調整されるようになっている。この出力タイミン
グ調整は以下のような理由により行なわれる。つまり、
内蔵RAMエラー発生時には、内蔵RAMエラー検出回
路14によりその内蔵RAMエラーを検出するのと同時
に、論理和ゲート22からの同期チェック結果SYNC-CHK
も“0”から“1”になる。しかし、内蔵RAMエラー
が発生してから、出力比較チェック抑止回路18により
同期チェック結果SYNC-CHKを実際に抑止するまでに、本
実施例では2サイクル分の遅れがある(図5参照)。そ
こで、出力比較チェック抑止回路18により抑止すべき
同期チェック結果SYNC-CHKが、その内蔵RAMエラーに
起因するものとなるように、その出力タイミングがタイ
ミング調整回路23により調整されるようになっている
のである。
【0040】一方、出力比較チェック抑止回路18は、
論理和ゲート24,同期型SRフリップフロップ25お
よび論理積ゲート26から構成されている。論理和ゲー
ト24は、マスタCPU10Aからの内蔵RAMエラー
検出信号M-IRX-DETECTとスレーブCPU10Bからの内
蔵RAMエラー検出信号S-IRX-DETECTとの論理和を算出
し、比較抑止信号として出力するもので、CPU10
A,10Bのいずれか一方で内蔵RAMエラーが発生す
ると、その比較抑止信号が“1”になる。
【0041】SRフリップフロップ25は、R端子に論
理和ゲート24からの比較抑止信号を入力され、S端子
にMCU11のステータスレジスタ19からの同期チェ
ックイネーブルSYNC-CHK-EN を入力されるもので、この
SRフリップフロップ25のQ端子出力は、同期チェッ
クイネーブルSYNC-CHK-EN が“1”の場合、論理和ゲー
ト24からの比較抑止信号が“0”である限り“1”で
あるが、この比較抑止信号が“1”になると“0”にな
る。つまり、SRフリップフロップ25のQ端子から
は、同期チェックイネーブルSYNC-CHK-EN が“1”の場
合に、論理和ゲート24からの比較抑止信号の反転信号
が出力されているものとみることもできる。
【0042】そして、論理積ゲート26は、内蔵RAM
エラー検出信号と同一タイミングで出力比較回路13か
ら出力された同期チェック結果SYNC-CHKと、SRフリッ
プフロップ25のQ端子出力との論理積を算出し、その
論理積を同期チェック結果SYNC-CHK(出力比較エラー信
号)として出力するものである。この論理積ゲート26
の出力は、同期チェックイネーブルSYNC-CHK-EN が
“0”の場合つまり同期チェック無効の場合、SRフリ
ップフロップ25のQ端子出力が“0”であるため、常
時“0”になり出力比較回路13からの同期チェック結
果SYNC-CHKは無効化されることになるが、同期チェック
イネーブルSYNC-CHK-EN が“1”の場合つまり同期チェ
ック有効の場合には、SRフリップフロップ25のQ端
子出力が“1”になるため、出力比較回路13からの同
期チェック結果SYNC-CHKは、論理積ゲート26を通過可
能になる、つまり有効化されることになる。 このよう
な同期チェック有効の状態で、CPU10A,10Bの
いずれか一方で内蔵RAMエラーが発生し論理和ゲート
24からの比較抑止信号が“1”になると、SRフリッ
プフロップ25のQ端子出力が“0”に切り換わり、出
力比較回路13からの同期チェック結果SYNC-CHKは、論
理積ゲート26を通過不能になる、つまり無効化される
ことになる。
【0043】従って、本実施例では、同期チェックイネ
ーブルSYNC-CHK-EN によりシステムが同期チェック有効
の状態になっていても、CPU10A,10Bで内蔵R
AMエラーが発生すると、出力比較回路13からの同期
チェック結果SYNC-CHKが無効化され、実質的に同期チェ
ック無効の状態になり、内蔵RAMエラーによってシス
テムが停止するのを抑止できるようになっている。
【0044】なお、図4中、Dフリップフロップ23
A,23BおよびSRフリップフロップ25におけるク
ロック端子(CLK)の図示は省略されているがこれら
のフリップフロップ23A,23B,25は、実際には
クロックを入力されて、すべてそのクロックに同期して
動作する。次に、図5を参照しながら、上述のように構
成された出力比較回路13および出力比較チェック抑止
回路18の動作について簡単に説明する。なお、図5に
おいて、27は命令コードレジスタ、28はデコーダ、
29は汎用レジスタ(GR)、30は加算器(AD
D)、31A〜31C,32,33はレジスタである。
【0045】マスタCPU10Aにおいて、命令コード
レジスタ27に命令コード(opcode)が入力されると、
その命令コードをデコーダ28によりデコード(decod
e)するとともに、演算に必要なデータが汎用レジスタ
29から読み出される。デコーダ28によるデコード結
果は、処理サイクル毎にレジスタ31A,31B,31
Cに順次格納され、各処理サイクルではそのデコード結
果に応じた処理が実行されるようになっている。
【0046】命令コードのデコード処理後、そのデコー
ド結果に応じて加算器30によるアドレス演算処理を行
なってから、そのアドレス演算結果を、TLB(内蔵R
AM)15Aによりアドレス変換している。そして、こ
のアドレス変換時に、TLB15Aからの読出データ
(アクセスアドレス等)について、内蔵RAMエラー検
出回路14のパリティチェック回路16Aによりパリテ
ィチェックが行なわれる。
【0047】以上の動作は、図5には図示しないスレー
ブCPU10Bにおいても全く同様に行なわれており、
パリティチェックを行なうのと同時に、アドレス変換時
に得られたマスタCPU10Aからのアクセスアドレス
パリティMAAPとスレーブCPU10Bからのアクセ
スアドレスパリティSAAPとは出力比較回路13の一
致比較回路21Bに入力されてこれらのパリティの一致
(match)チェックが行なわれる。
【0048】パリティチェック回路16Aによるパリテ
ィチェック結果は、レジスタ32に一旦格納された後、
内蔵RAMエラー検出信号M-IRX-DETECT,S-IRX-DETECT
として出力比較チェック抑止回路18の論理和ゲート2
4に入力され、その論理和結果が比較抑止信号としてS
Rフリップフロップ25のR端子に入力され、このSR
フリップフロップ25のQ端子出力と、出力比較回路1
3からの同期チェック結果SYNC-CHKとの論理積が論理積
ゲート26で算出されて同期チェック結果SYNC-CHKとし
て出力される。
【0049】このとき、前述したように、タイミング調
整回路23のレジスタ23A,23Bにより、出力比較
回路13からの同期チェック結果SYNC-CHKは、論理和ゲ
ート24およびSRフリップフロップ25の動作期間だ
け遅延されるため、出力比較チェック抑止回路18によ
り、内蔵RAMエラーに起因する同期チェック結果SYNC
-CHKが抑止される。
【0050】ところで、図2において、20はシステム
制御回路(リセット部)で、このシステム制御回路20
は、内蔵RAMエラー検出時にスレーブCPU10Bを
リセットすべくスレーブリセット信号(SLAVE-RESET)を
出力するリセット部としての機能を有するとともに、C
PU10A,10Bの停止を確認してからCPU10
A,10Bを同時に再起動して内蔵RAMエラーに対す
る修復処理(リカバリ処理)を開始すべく再起動信号
(CPU-START)を出力する機能も有している。
【0051】このシステム制御回路20は、図6に示す
ように、論理和ゲート34,同期型SRフリップフロッ
プ35,Dフリップフロップ(レジスタ)36,論理積
ゲート37,インバータ回路38,論理積ゲート39お
よびDフリップフロップ(レジスタ)40から構成され
ている。なお、図6中、SRフリップフロップ35,D
フリップフロップ36,40のクロック端子(CLK)
の図示は省略されているが、これらのフリップフロップ
35,36,40は、実際にはクロックを入力されて、
すべてそのクロックに同期して動作する。
【0052】ここで、論理和ゲート34は、マスタCP
U10Aからの内蔵RAMエラー検出信号M-IRX-DETECT
(図6中、IRX-DETECT-MASTER)とスレーブCPU10B
からの内蔵RAMエラー検出信号S-IRX-DETECT(図6
中、IRX-DETECT-SLAVE)との論理和を算出して出力する
もので、その出力は、論理和ゲート24からの比較抑止
信号と全く同様に、CPU10A,10Bのいずれか一
方で内蔵RAMエラーが発生すると“1”になる。
【0053】SRフリップフロップ35は、S端子に論
理和ゲート34の出力を入力されるとともに、R端子に
論理積ゲート39の出力(図6,図7中の符号C参照)
を入力されるものである。Dフリップフロップ36は、
D端子にSRフリップフロップ35のQ端子出力図6,
図7中の符号A参照)を入力され、このSRフリップフ
ロップ35のQ端子出力を1クロック分遅延(図6,図7
中の符号B参照)させて出力するものである。
【0054】論理積ゲート37は、インバータ回路38
を介してDフリップフロップ36のQ端子出力を入力さ
れ、そのDフリップフロップ36のQ端子出力の反転信
号と、SRフリップフロップ35のQ端子出力との論理
積を算出してスレーブリセット信号(SLAVE-RESET)とし
て出力するものである。論理積ゲート39は、SRフリ
ップフロップ35のQ端子出力と、マスタCPU10A
の停止信号(CPU-STOP-MASTER)と、スレーブCPU10
Bの停止信号(CPU-STOP-SLAVE)との論理積を算出して
出力するもので、その出力(図6,図7中の符号C参
照)は、SRフリップフロップ35のQ端子出力が
“1”になってから(つまり内蔵RAMエラーが発生し
てから)、CPU10A,10Bがいずれも停止した場
合(停止信号がいずれも“1”になった場合)に“1”
になる。
【0055】Dフリップフロップ40は、D端子に論理
積ゲート39の出力を入力され1クロック分保持し、そ
の出力をQ端子からCPU10A,10Bに対する再起
動信号(CPU-START)として出力するものである。次に、
図7を参照しながら、上述のように構成されたシステム
制御回路20の動作について簡単に説明する。この図7
では、例えばマスタCPU10Aで内蔵RAMエラーが
発生した場合、つまり、内蔵RAMエラー検出信号IRX-
DETECT-M積ASTER(論理和ゲート34の出力)がタイミン
グt1 で“1”になった場合を示している。
【0056】論理和ゲート34の出力が“1”になって
から最初のクロック信号CLKの立ち上がりタイミング
2 で、その論理和ゲート34の出力がSRフリップフ
ロップ35にS端子から取り込まれ、このSRフリップ
フロップ35のQ端子出力Aが“1”になる。この時点
で、Dフリップフロップ36のQ端子出力Bは“0”
で、インバータ回路38を介して論理積ゲート37に入
力される信号は“1”の状態であるので、論理積ゲート
37に入力されるもう一方の信号であるSRフリップフ
ロップ35のQ端子出力Aが“1”になることにより、
この論理積ゲート37の出力つまりスレーブリセット信
号は“1”になり、スレーブCPU10Bに対するリセ
ット処理が行なわれる。
【0057】そして、次のクロック信号CLKの立ち上
がりタイミングt3 で、SRフリップフロップ35のQ
端子出力AがDフリップフロップ36にD端子から取り
込まれ、このDフリップフロップ36のQ端子出力Bが
“1”になる。これにより、NOT端子38を介して論
理積ゲート37に入力される信号は“0”になり、論理
積ゲート37からのスレーブリセット信号は“0”にな
る。従って、スレーブリセット信号は1クロック分の期
間だけ“1”になる。
【0058】内蔵RAMエラーの発生および上記スレー
ブリセット信号の出力に伴って、まずタイミングt4
マスタCPU10Aが停止してその停止信号が“1”に
なった後、タイミングt5 でスレーブCPU10Bが停
止してその停止信号が“1”になると、論理積ゲート3
9への3入力(SRフリップフロップ35のQ端子出力
Aおよび2つの停止信号)が全て“1”の状態になるの
で、論理積ゲート39の出力Cが“1”になる。
【0059】論理積ゲート39の出力Cが“1”になっ
てから最初のクロック信号CLKの立ち上がりタイミン
グt6 で、その論理積ゲート39の出力CがSRフリッ
プフロップ35にR端子から取り込まれ、このSRフリ
ップフロップ35のQ端子出力Aが“0”になる。これ
と同時に、論理積ゲート39の出力CがDフリップフロ
ップ40にD端子から取り込まれ、このDフリップフロ
ップ40のQ端子出力つまり再起動信号は1クロック分
の期間だけ“1”になり、CPU10A,10Bに対す
る再起動処理が行なわれる。
【0060】そして、SRフリップフロップ35のQ端
子出力Aが“1”から“0”になるのに応じて論理積ゲ
ート39の出力Cも“0”になるとともに、再起動信号
が“1”になるのに応じて各CPU10A,10Bの停
止信号が“0”になる。また、次のクロック信号CLK
の立ち上がりタイミングt7 で、SRフリップフロップ
35のQ端子出力AがDフリップフロップ36にD端子
から取り込まれ、このDフリップフロップ36のQ端子
出力Bも再び“0”になる。
【0061】なお、論理積ゲート37からのスレーブリ
セット信号(SLAVE-RESET)およびDフリップフロップ4
0からの再起動信号(CPU-START)は、それぞれ、従来か
らの機能により生成される本来のCPUリセット信号お
よび本来のCPU起動信号との論理和を算出され、その
論理和結果として出力される。ここでいう本来のCPU
リセット信号とは、初期化等のリセット処理時に出力さ
れるものであり、本来のCPU起動信号とは、システム
立ち上げ等の起動処理時に出力されるものである。
【0062】さて、図2に示す本実施例のMCU11
は、内蔵RAMエラーの発生に伴って出力比較回路13
からの同期チェック結果SYNC-CHKを出力比較チェック抑
止回路18で抑止した場合に、リカバリ処理ソフトウエ
アに従って、その内蔵RAMエラーに対する修復処理
(リカバリ処理)を行なってから、再び、同期チェック
を伴うCPU10A,10Bによる処理を実行させる機
能を有している。
【0063】このとき、内蔵RAMエラーの発生および
システム制御回路18からのスレーブリセット信号に応
じてCPU10A,10Bが停止した後、システム制御
回路18からの再起動信号によりCPU10A,10B
を再起動してこれらのCPU10A,10Bの同期状態
を合わせ直してから、MCU11は、予め定められたマ
スタCPU(MCU11との間にMSU12へのストア
情報の信号ラインを設けられたCPU)10Aにおける
情報に基づいて、内蔵RAMエラーに対する修復処理を
行なうようになっている。
【0064】即ち、本実施例のMCU11は、その修復
処理として、マスタCPU10A内のプログラムカウン
タや割込み原因レジスタ等を含む内蔵制御レジスタ,内
蔵ステータスレジスタ(図示せず)におけるデータをM
SU12に一旦退避させるデータ退避処理を行なった
後、MSU12に退避させたデータをCPU10Aおよ
び10Bの内蔵制御レジスタ,内蔵ステータスレジスタ
に同時に書き込むデータ書込処理を行なっている。この
ようにしてCPU10Aおよび10Bの内蔵制御レジス
タ,内蔵ステータスレジスタにおけるデータを一致させ
る。
【0065】ただし、上記データ書込処理に際しては、
一旦MSU12に退避させたデータはスレーブCPU1
0Bの内蔵制御レジスタ,内蔵ステータスレジスタのみ
に書き込んでもよいが、CPU10Aおよび10Bの両
方に書き込むことにより、マスタCPU10Aとスレー
ブCPU10Bとを切り分けた制御が不要になって、修
復処理のための制御を容易かつ確実に行なえる利点があ
る。なお、前記データ退避処理を行なった後、出力比較
回路13による同期チェックを伴う処理を再開する。そ
のために、図2のMCU11内のステータスレジスタ1
9の領域19B(SYNC-CHK-EN)に書き込みを行なって、
図4のSYNC-CHK-EN 信号を“1”にし、SRフリップフ
ロップ25のS端子入力を“1”にすることで、SYNC-C
HK=1として、同期チェックを再開する。
【0066】また、内蔵RAMエラーに対する修復処理
時に、内蔵RAMであるキャッシュメモリ15Aおよび
TLB15Bについては、その内部のデータをCPU1
0A,10Bにおいて全て一致させるために、ソフトウ
エアにより、各CPU10A,10Bのキャッシュメモ
リ15AおよびTLB15Bの内容を消去して無効化す
る。
【0067】そして、上述したMCU11による内蔵R
AMエラーの修復処理は、OSよりも上流のファームウ
エア上で行なうようにすることで、OSに一切の変更を
加えることなく実現され、内蔵RAMエラーに対する修
復処理を確実かつ容易に行なえる利点がある。なお、C
PUで実行される修復処理ソフトウエア(プログラム)
はMSU12上にあり、そのソフトウエアをCPU10
A,10Bが同時に実行する。また、そのソフトウエア
は、システム制御回路20によるリセット処理時に、ス
テータスレジスタ19の領域19Aにおけるフラグ(IR
X-FLAG)を参照することにより、そのリセット処理が、
システム初期化時等の本来のリセット処理であるか内蔵
RAMエラーに起因するリセット処理であるかを判別し
て切り分けることができるので、各リセット処理に応じ
た対処を施すことができる。
【0068】つまり、リセット処理時にステータスレジ
スタ19の領域19Aにおけるフラグが“1”である場
合、内蔵RAMエラーに起因するリセット処理であるた
め、その内蔵RAMエラーを修復するためのリカバリ処
理ソフトウエアの実行が開始されるようになっている。
上述のようなフラグをステータスレジスタ19にそなえ
る代わりに、内蔵RAMエラー検出時に、MCU11
が、スレーブCPU10Bに対し割込みを行ない、その
割込みアドレスとして内蔵RAMエラー発生時専用のも
のを用いることで、フラグを用いた場合と同様の作用効
果を得ることができる。
【0069】次に、上述のごとく構成され、各種機能や
作用を有する本実施例のデータ処理装置による全体的な
動作を、図2〜図7を参照しながら、図8(ステップS
1〜S14)に従って説明する。なお、図8では、マス
タCPU10Aで内蔵RAMエラーが発生した場合の動
作例が示されている。まず、マスタCPU〔CPU
(M)〕10Aの内蔵RAMエラー検出回路14(図3
参照)により内蔵RAMエラーの発生を検出すると(ス
テップS1)、その検出信号M-SYNC-DETECT が、図2に
示すように、MCU11,出力比較チェック抑止回路1
8,システム制御回路20,スレーブCPU10Bに通
知される。このとき、MCU11のステータスレジスタ
19(領域19A)におけるフラグ“IRX-FLAG”が
“1”に設定される。
【0070】そして、出力比較チェック抑止回路18に
より、同期チェック有効状態であれば図4,図5により
説明した通り、出力比較回路13からの同期チェック結
果SYNC-CHKを抑止して同期チェックを無効の状態にする
とともに、システム制御回路20により、図6,図7に
より説明した通り、スレーブリセット信号(SLAVE-RESE
T)がスレーブCPU10Bに出力されてこのスレーブC
PU10Bがリセットされる(ステップS2)。
【0071】また、マスタCPU10Aは、ステップS
3の“restore-state(前半)”に移行し、非同期動作
(突き放したロードアクセスやコプロセッサアクセス)
の終了待ちを行なった後に停止する一方、スレーブCP
U10Bは、スレーブリセット信号を受けてリセットさ
れた後、ステップS4の“restore-state(前半)”に移
行し、やはり非同期動作の終了待ちを行なった後に停止
する。非同期動作があるか否かは、CPU−コプロセッ
サ間信号にビジー信号があるので、その信号をモニタす
ることにより判定可能である。
【0072】ここで、ステップS2による上述のような
スレーブCPU10Bのリセット処理の必要性について
説明する。本実施例のデータ処理装置において、内蔵R
AMエラー発生時に、マスタCPU10Aが突き放した
ロードアクセスあるいはコプロセッサアクセスを行なっ
ていた場合には、その完了を待たなければならない。マ
スタCPU10Aで内蔵RAMエラーが発生してからス
レーブCPU10Bが停止するまでには、数サイクルの
ずれ(滑り)が生じる。そのずれの間にスレーブCPU
10Bが次命令を発行する可能性がある。
【0073】そのずれの間に、ロード命令のようにCP
U外部にアクセスする命令をスレーブCPU10Bが発
行した場合、スレーブCPU10Bに停止を指示しても
スレーブCPU10Bは命令の完了を待ってから停止状
態になる。何故ならば、スレーブCPU10Bは、命令
発行の後で停止要求を受け付けたため、命令の完了を待
つことになる。
【0074】図2に示すように、本実施例のデータ処理
装置では、スレーブCPU10Bから外部に対するリク
エストは一切受け付けられない構成になっているため、
スレーブCPU10Bから停止前に出力されたロード命
令はMCU11では無視されてしまい、その要求は決し
て受け付けられることはなく、スレーブCPU10B
は、非同期動作完了待ちの状態で無限ループに陥ってし
まう。
【0075】このような状況が考えられるため、本実施
例では、内蔵RAMエラー発生時には、システム制御回
路20によりスレーブリセット信号を生成して、スレー
ブCPU10Bに対するリセット処理を行なっている。
従って、内蔵RAMエラー発生時にスレーブCPU10
Bが突き放しロードアクセスを出力している場合でも、
リセット処理によりスレーブCPU10Bが突き放しロ
ードアクセスの完了を待つことがなくなるため、スレー
ブCPU10Bが無限ループの状態に陥るのを防止で
き、修復処理に直ちに且つ確実に移行することができ
る。
【0076】なお、突き放しロードアクセスを行なわな
いCPUであれば、内蔵RAMエラーで停止(割込み)
が発生すれば、命令をキャンセルするだけでよいので、
上述のようなシステム制御回路20によるスレーブリセ
ット信号の生成の必要はなくなり、適当な割込みを発生
させるなどすればよい。次に、コプロセッサアクセスを
行なった場合に、ステップS3,S4において、その命
令の完了(非同期動作の完了)を待つ必要がある理由に
ついて以下に説明する。ここで、コプロセッサがVPU
(Vector Processor Unit)であり、以下のような命令
〜が順次発行されたものとする。
【0077】vadd vr1, vr2, vr3 add r1, r2, r3 or r3, r4, r5 ld r2, r3, r6 sub r1, r2, r3 ただし、がVPUに対する加算命令であり、例えば
のロード命令時に内蔵RAMエラーが発生したものとす
る。なお、〜において、vadd,add, or, ld, subは
それぞれ命令の種類を示し、vr1,vr2,vr3,r1〜r6は、各
命令の処理用のデータを格納するレジスタ番号を示して
いる。
【0078】のようなベクトル命令は、データ数が多
く(例えば1024個のペアの浮動小数点加算を行なう)、
その終了を待ってから次命令動作を始めると処理時間が
長くなってしまうので、一般に非同期動作になり、CP
U10A,10Bはあたかもそのコプロセッサ命令(ベ
クトル命令)が終了したとみなして次命令以降を実
行し続ける。
【0079】しかし、そのコプロセッサ命令が未だ終
了していないにもかかわらず、後続命令で内蔵RAM
エラーが生じた場合、そのコプロセッサ命令の終了を
待たずにリカバリ処理に移行するような手法にすると、
リカバリ作業内で未終了のコプロセッサ命令を再実行
しなければならない。また、そのコプロセッサ命令の
次命令から、内蔵RAMエラーが起きた命令の前の
命令までは既にCPU10A,10Bで実行済みであ
るので、再実行してはならないといったような極めて複
雑な制御が必要になってしまう。このような理由から、
非同期処理が終了するまで待ってから各CPU10A,
10Bの停止を行なっている。
【0080】さて、ステップS3,S4の処理によって
CPU10A,10Bがいずれも停止すると、図6,図
7により説明した通り、再起動信号(CPU-START)がCP
U10A,10Bに出力され、これらのCPU10A,
10Bが同時に再起動される(ステップS5)。内蔵R
AMエラーが発生してからステップS5でCPU10
A,10Bが同時に再起動されるまでは、2つのCPU
10A,10Bの間にはタイミングのずれが生じている
が、ステップS5でCPU10A,10Bが同時に再起
動されると、後述のステップS9までストアデータは異
なるが、タイミングのずれは解消される。
【0081】そして、再起動後、マスタCPU10A
は、ステップS6の“restore-state(後半)”に移行す
る。この“restore-state(後半)”では、内蔵RAMエ
ラー発生と同時に他のプログラム割込みが起きる場合が
あり、その場合は他のプログラム割込み要因がCPU内
部のステータスレジスタIRD(InterRuption Designa
tion)にセットされている。つまり、割込みが複数発生
していることになるので、まず割込みのプライオリティ
(優先順位)をとる。このとき、当然、内蔵RAMエラ
ーの方がプライオリティが高い。プライオリティをとっ
た後、PC(プログラムカウンタ)PEV(Processing
EnVironment;プロセス環境)等を退避し、リカバリ作
業のための新しいPCへジャンプする。
【0082】また、同様に、再起動後、スレーブCPU
10Bも、ステップS7の“restore-state(後半)”に
移行し、マスタCPU10Aと同様の処理を行なうが、
ストアデータ線が接続されていないので、退避したPC
やPEVは使用されることはない。ステップS6,S7
の処理を終了すると、MCU11は、リカバリ処理ソフ
トウエアに従って、マスタCPU10Aの内蔵制御レジ
スタ,内蔵ステータスレジスタのデータ(内部状態;例
えば内部レジスタのデータ,コントロール系のジャンプ
フラグ等)をMSU12に退避させた後(ステップS
8)、同期チェックの再開を指示する(ステップS
9)。この指示に応じて出力比較チェック抑止回路18
による抑止状態が解除され、再び出力比較回路13によ
る同期チェックが有効状態に戻る(ステップS10)。
【0083】そして、ステップS8によりMSU12に
退避した情報を、今度はマスタCPU10Aおよびスレ
ーブCPU10Bの内蔵制御レジスタ,内蔵ステータス
レジスタへ同時に書き込むことにより、各CPU10
A,10Bの内蔵制御レジスタ,内蔵ステータスレジス
タにおけるデータ内容を一致させる(ステップS1
1)。
【0084】このとき、マスタCPU10Aに対する修
復処理,スレーブCPU10Bに対する修復処理,両C
PU10A,10Bに対する修復処理を切り分け、各C
PU10A,10B毎に起動/停止するのは制御上極め
て面倒である。そこで、本実施例では、前述したよう
に、各CPU10A,10Bに対しては全く同じ修復処
理が同時に施され、修復処理のためのCPU10A,1
0Bのstart-stop制御を容易かつ確実に行なっている。
【0085】まだこの段階では、内蔵RAMエラーが生
じたのであるから、当然、内蔵RAMであるキャッシュ
メモリ15AまたはTLB15Bの状態は、CPU10
A,10Bで一致していない場合がある(ソフトエラー
の場合にはもう一度読み出せば正しく読み出せるた
め)。そこで、これらのキャッシュメモリ15Aおよび
TLB15Bの状態も強制的に一致させるために、本実
施例では、CPU10A,10Bにおける全てのキャッ
シュメモリ15AおよびTLB15Bの内容を消去して
無効化する(ステップS12)。
【0086】もしキャッシュメモリ15AおよびTLB
15Bの状態が不一致のままである場合には、一方のC
PUのみでアドレス変換が発生したり、キャッシュミス
によるムーブインが生じたりする。従って、同期がず
れ、出力比較回路13の同期チェックによってシステム
が停止してしまう。また当然、エラーの発生した内蔵R
AMのエントリを無効化するためにも、ステップS12
による消去・無効化処理が必要になる。
【0087】以上の処理により両CPU10A,10B
は、マスタCPU10Aが停止したときと同じ内部レジ
スタ等の状態を再現されることになる。なお、両CPU
10A,10Bは、割込み原因レジスタへの書込が行な
えない場合には、MSU12に退避されたマスタCPU
10Aの割込み原因に従ってIRX(InterRuption eXc
eption;割込み例外)などの割込み処理を行なう。
【0088】また、本実施例では、IRXは命令を完了
していて、アクセスのアドレス,サイズなど再実行に必
要な情報がCPU内のステータスレジスタであるLAX
(Logical Access eXeption;論理アクセス例外)レジス
タに格納されているので、その情報を用いてエミュレー
ションを行なう。このレジスタへの書込が行なえない場
合にも、MSU12に退避されたマスタCPU10Aの
割込み原因に従ってIRXなどの割込み処理を行なう。
また、先行した内蔵RAMエラーで後続のロード命令の
実行が抑止されてLAXレジスタに入っている場合もあ
り、これについてもエミューレションする(ステップS
13)。なお、ステップS8によるデータ(内部状態)
の退避後のステップS9〜S13の処理順序は、図8に
示すものに限定されない。
【0089】以上のようなリカバリ処理でエミュレーシ
ョンを実行した後に、内部RAMエラーで割り込まれた
プログラムに復帰する(ステップS14)。上述のリカ
バリ処理では、マスタCPU10Aで内蔵RAMエラー
が発生した場合について説明したが、スレーブCPU1
0Bで内蔵RAMエラーが発生した場合には、図8に示
した処理手順とほぼ同様にしてリカバリ処理が行なわれ
る。つまり、スレーブCPU10Bの内蔵RAMエラー
検出回路14により内蔵RAMエラーが検出されると、
その検出信号S-SYNC-DETECT が、図2に示すように、M
CU11,出力比較チェック抑止回路18,システム制
御回路20,マスタCPU10Aに通知される。これと
同時に、内蔵RAMエラー割込みによるリストア・ステ
ート(restore-state )のシーケンスが開始される。
【0090】このとき、マスタCPU10Aは、内蔵R
AMエラー検出信号S-SYNC-DETECTを受け取って、リス
トア・ステート(restore-state)に移行し、非同期動作
の完了を待って停止する。また、内蔵RAMエラー検出
信号S-SYNC-DETECT に応じて、出力比較チェック抑止回
路18により出力比較回路13からの同期チェック結果
が抑止され、同時に、システム制御回路20によりスレ
ーブCPU10Bに対してリセット信号が出力される。
【0091】スレーブCPU10Bは、リセット割込み
によりリストア・ステート(restore-state )に移行
し、非同期動作の完了を待って停止状態になり、システ
ム制御回路20からの再起動信号を待つ。そして、シス
テム制御回路20は、スレーブリセット後に両方のCP
U10A,10Bが停止したことを確認してから、両方
のCPU10A,10Bに再起動をかけて、上述したス
テップS8〜S14の処理を実行することより、スレー
ブCPU10Bで内蔵RAMエラーが発生した場合も修
復処理が行なわれる。
【0092】ただし、ステップS13は、マスタCPU
10Aの前記LAX情報によって行なわれるため、スレ
ーブCPU10Bで内蔵RAMエラーが発生したからと
いって、必ずしもオペランドアクセスのエミュレーショ
ン行なわれるとは限らない。このように、本発明の一実
施例によれば、内蔵RAMエラー発生時には、出力比較
回路13による同期チェックが抑止され、システム停止
を防止しながら、内蔵RAMの障害を修復してから同期
チェックを伴う処理実行を再開できるので、システムの
信頼性および可用性を大幅に向上できる利点がある。
【0093】また、本実施例によれば、論理和ゲート2
4,論理積ゲート26等からなる簡素な構成の出力比較
チェック抑止回路18を用いることにより、内蔵RAM
エラー検出信号と同一タイミングの同期チェック結果を
簡易かつ確実に抑止できる。さらに、本実施例によれ
ば、マスタCPU10Aの内部状態を両CPU10A,
10Bに同時に書き込むとともに、全てのキャッシュメ
モリ15AおよびTLB15Bの無効化を行なうことに
より、両CPU10A,10Bにおける全ての内蔵RA
M15A,15Bおよび内蔵制御レジスタ,内蔵ステー
タスレジスタの内部状態を一致させることにより、マス
タCPU10AとスレーブCPU10Bとを切り分けた
制御が不要になり、修復処理のための制御を容易かつ確
実に行なえる利点もある。
【0094】なお、上述した実施例では、出力比較回路
13,出力比較チェック抑止回路18およびシステム制
御回路20をMCU11とは別個にそなえた場合につい
て説明しているが、これらの出力比較回路13,出力比
較チェック抑止回路18およびシステム制御回路20の
機能は、MCU11に内蔵してもよい。また、上述した
実施例では、CPU(処理部)を二重化した場合につい
て説明しているが、本発明はこれに限定されるものでな
く、3個以上のCPUを多重化した場合にも同様に適用
され、上述した実施例と同様の作用効果を得ることがで
きる。
【0095】
【発明の効果】以上詳述したように、本発明のデータ処
理装置によれば、内蔵RAMエラー発生時には、比較部
の出力比較チェックに応じてシステムが停止されるのを
抑止しながら、その内蔵RAMの障害を修復して、出力
比較チェックを伴う処理実行を再開できるので、システ
ムの信頼性および可用性が大幅に向上する効果がある
(請求項1,2)。
【0096】なお、論理和ゲートおよび論理積ゲートか
らなる簡素な構成の抑止部を用いることにより、内蔵R
AMエラー検出信号と同一タイミングの比較部による比
較結果を簡易かつ確実に抑止することができる(請求項
3)。また、内蔵RAMエラーに対する修復処理は、主
処理部における情報に基づいて、従処理部における情報
と主処理部における情報とを一致させることにより、極
めて容易に修復処理を行なうことができる(請求項4,
9)。
【0097】このとき、従処理部が突き放しロードアク
セスを出力している場合でも、リセット処理により従処
理部が突き放しロードアクセスの完了を待つことがなく
なるため、修復処理に直ちに且つ確実に移行することが
できる(請求項5)。また、リセット処理が内蔵RAM
エラーに起因するものであるか否かを、フラグや内蔵R
AMエラー検出時専用の割込みアドレスを用いることに
より、システム初期化時等の本来のリセット処理である
か内蔵RAMエラーに起因するリセット処理であるかを
容易に判別でき、各リセット処理に応じた対処を施すこ
とが可能で、システムの信頼性をより高めることができ
る(請求項6,7)。
【0098】さらに、内蔵エラーに対する修復処理を、
主処理部に対する修復処理,従処理部に対する修復処
理,両処理部に対する修復処理に切り分けることなく、
主処理部および従処理部に対して同時に行なわれるの
で、主処理部と従処理部とを切り分けた制御が不要にな
り、修復処理のための制御を容易かつ確実に行なうこと
ができる(請求項8,10)。
【0099】また、変換検索バッファ,キャッシュメモ
リとして用いられる内蔵RAMについては無効化するこ
とだけで、全処理部についてデータを一致させることが
でき、内蔵RAMエラーに対する修復処理を簡易化でき
る(請求項11)。さらに、内蔵RAMエラーに対する
修復処理をファームウエア上で行なうことで、OSに一
切の変更を加えることなく本発明の装置を実現して、内
蔵RAMエラーに対する修復処理を確実かつ容易に行な
うことができる(請求項12)。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の一実施例としてのデータ処理装置を示
すブロック図である。
【図3】本実施例の内蔵RAMエラー検出回路の構成を
示すブロック図である。
【図4】本実施例の出力比較回路および出力比較チェッ
ク抑止回路の構成を示すブロック図である。
【図5】本実施例の出力比較回路および出力比較チェッ
ク抑止回路の動作を説明すべく、処理タイミングに、そ
の処理を行なう装置の構成部分を対応させて示すタイム
チャートである。
【図6】本実施例のシステム制御回路の構成を示すブロ
ック図である。
【図7】本実施例のシステム制御回路の動作を説明する
ためのタイムチャートである。
【図8】本実施例の動作を説明するためのフローチャー
トである。
【符号の説明】
1 処理部 1a 内蔵RAM 2 比較部 3 制御部 4 内蔵エラー検出部 5 抑止部 10A マスタCPU(主処理部) 10B スレーブCPU(従処理部) 11 MCU(制御部) 12 MSU(主記憶部) 13 出力比較回路(比較部) 14 内蔵RAMエラー検出回路 15A キャッシュメモリ(内蔵RAM) 15B TLB(内蔵RAM) 16 パリティチェック回路(PCK) 17 論理和ゲート 18 出力比較チェック抑止回路 19 ステータスレジスタ 19A 内蔵RAMエラー検出フラグ設定領域(IRX-FL
AG) 19B 同期チェックイネーブル設定領域(SYNC-CHK-E
N) 20 システム制御回路(リセット部) 21A,21B 一致比較回路 22 論理和ゲート 23 タイミング調整回路 23A,23B レジスタ(Dフリップフロップ) 24 論理和ゲート 25 同期型SRフリップフロップ 26 論理積ゲート 27 命令コードレジスタ 28 デコーダ 29 汎用レジスタ(GR) 30 加算器(ADD) 31A〜31C,32,33 レジスタ 34 論理和ゲート 35 同期型SRフリップフロップ 36 Dフリップフロップ(レジスタ) 37 論理積ゲート 38 インバータ回路 39 論理積ゲート 40 Dフリップフロップ(レジスタ)

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数の処理部を多重化してそなえるとと
    もに、 各処理部からの出力を比較する比較部と、 前記の各処理部に同一動作を行なわせ、該比較部による
    比較結果に基づき前記の各処理部が同一動作を行なって
    いることを確認しながら処理を実行する一方、該比較部
    による比較結果に基づき前記の各処理部からの出力不一
    致を確認した場合に処理を停止する制御部とをそなえて
    なるデータ処理装置において、 前記の各処理部の内蔵RAMでエラーが発生したことを
    検出する内蔵RAMエラー検出部と、 該内蔵RAMエラー検出部により少なくとも一つの処理
    部で内蔵RAMエラーが発生したことを検出した場合
    に、当該内蔵RAMエラーの発生に起因して該比較部が
    出力した比較結果を抑止する抑止部とをそなえたことを
    特徴とする、データ処理装置。
  2. 【請求項2】 該比較部からの比較結果を該抑止部によ
    り抑止した場合に、当該内蔵RAMエラーに対する修復
    処理を行なってから、再び、該比較部による出力比較を
    行ないながら処理を実行することを特徴とする、請求項
    1記載のデータ処理装置。
  3. 【請求項3】 該抑止部が、 前記の各処理部からの内蔵RAMエラー検出信号の論理
    和を算出し、比較抑止信号として出力する論理和ゲート
    と、 当該内蔵RAMエラー検出信号と同一タイミングで該比
    較部から出力された比較結果と、該論理和ゲートからの
    比較抑止信号の反転信号との論理積を算出し、出力比較
    エラー信号として出力する論理積ゲートとから構成され
    ていることを特徴とする、請求項1記載のデータ処理装
    置。
  4. 【請求項4】 該制御部が、前記複数の処理部の中で予
    め定められた主処理部における情報に基づいて、当該内
    蔵RAMエラーに対する修復処理を行なうことを特徴と
    する、請求項2記載のデータ処理装置。
  5. 【請求項5】 該内蔵RAMエラー検出部により少なく
    とも一つの処理部で内蔵RAMエラーが発生したことを
    検出した場合に、該主処理部以外の従処理部をリセット
    するリセット部がそなえられていることを特徴とする、
    請求項4記載のデータ処理装置。
  6. 【請求項6】 該リセット部による当該リセット処理が
    内蔵RAMエラーに起因するものであるか否かを示すフ
    ラグがそなえられていることを特徴とする、請求項5記
    載のデータ処理装置。
  7. 【請求項7】 該内蔵RAMエラー検出部により少なく
    とも一つの処理部で内蔵RAMエラーが発生したことを
    検出した場合に、該制御部が、該主処理部以外の従処理
    部に対し割込みを行ない、その割込みアドレスとして内
    蔵RAMエラー発生時専用のものを用いることを特徴と
    する、請求項4記載のデータ処理装置。
  8. 【請求項8】 該制御部が、該主処理部および該従処理
    部の停止を確認してから、該主処理部および該従処理部
    を同時に再起動し、当該内蔵RAMエラーに対する修復
    処理を開始することを特徴とする、請求項5記載のデー
    タ処理装置。
  9. 【請求項9】 該制御部による当該内蔵RAMエラーに
    対する修復処理として、 該主処理部の内蔵制御レジスタ,内蔵ステータスレジス
    タにおけるデータを主記憶部に一旦退避させるデータ退
    避処理と、 該データ退避処理後に、該主記憶部に退避させたデータ
    を該主処理部以外の該従処理部の内蔵制御レジスタ,内
    蔵ステータスレジスタに書き込むデータ書込処理とを行
    なうことを特徴とする、請求項4記載のデータ処理装
    置。
  10. 【請求項10】 該データ書込処理時に、該主記憶部に
    退避させたデータを該主処理部および該従処理部に同時
    に書き込むことを特徴とする、請求項9記載のデータ処
    理装置。
  11. 【請求項11】 当該内蔵RAMエラーに対する修復処
    理時に、前記内蔵RAMのうち変換検索バッファ,キャ
    ッシュメモリとして用いられる内蔵RAMについては、
    該主処理部および該主処理部以外の従処理部において無
    効化することを特徴とする、請求項4記載のデータ処理
    装置。
  12. 【請求項12】 当該内蔵RAMエラーに対する修復処
    理をOSよりも上流側のファームウエア上で行なうこと
    を特徴とする、請求項2記載のデータ処理装置。
JP6197125A 1994-08-23 1994-08-23 データ処理装置 Pending JPH0863365A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6197125A JPH0863365A (ja) 1994-08-23 1994-08-23 データ処理装置
US08/455,723 US5572662A (en) 1994-08-23 1995-05-31 Data processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6197125A JPH0863365A (ja) 1994-08-23 1994-08-23 データ処理装置

Publications (1)

Publication Number Publication Date
JPH0863365A true JPH0863365A (ja) 1996-03-08

Family

ID=16369162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6197125A Pending JPH0863365A (ja) 1994-08-23 1994-08-23 データ処理装置

Country Status (2)

Country Link
US (1) US5572662A (ja)
JP (1) JPH0863365A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260291A (ja) * 2005-03-17 2006-09-28 Fujitsu Ltd エラー通知方法及び情報処理装置
JP2008186352A (ja) * 2007-01-31 2008-08-14 Nec Computertechno Ltd コンピュータシステム、コンピュータシステムにおける命令リトライ方法及びプログラム
JP2010262432A (ja) * 2009-05-01 2010-11-18 Mitsubishi Electric Corp 安全制御装置
JP2011014011A (ja) * 2009-07-03 2011-01-20 Hitachi Ltd 多重系システムの高信頼性制御装置
JP2011523474A (ja) * 2008-04-23 2011-08-11 エーティーラブ・インコーポレーテッド 誤動作時に自動復元する通信システム及びその復元方法
WO2016113774A1 (ja) * 2015-01-14 2016-07-21 三菱電機株式会社 データ処理装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119248A (en) * 1998-01-26 2000-09-12 Dell Usa L.P. Operating system notification of correctable error in computer information
US8185812B2 (en) * 2003-03-20 2012-05-22 Arm Limited Single event upset error detection within an integrated circuit
US8650470B2 (en) 2003-03-20 2014-02-11 Arm Limited Error recovery within integrated circuit
EP1604281B1 (en) * 2003-03-20 2006-08-09 ARM Limited Systematic and random error detection and recovery within processing stages of an integrated circuit
US7278080B2 (en) * 2003-03-20 2007-10-02 Arm Limited Error detection and recovery within processing stages of an integrated circuit
US7260001B2 (en) * 2003-03-20 2007-08-21 Arm Limited Memory system having fast and slow data reading mechanisms
US7308605B2 (en) * 2004-07-20 2007-12-11 Hewlett-Packard Development Company, L.P. Latent error detection
DE102005037217A1 (de) * 2005-08-08 2007-02-15 Robert Bosch Gmbh Verfahren und Vorrichtung zum Vergleich von Daten bei einem Rechnersystem mit wenigstens zwei Ausführungseinheiten
WO2007113346A1 (es) * 2006-03-31 2007-10-11 Intel Corporation Deteccion de errores transitorios mediante nueva ejecucion selectiva
TWI334536B (en) * 2006-12-28 2010-12-11 Accton Technology Corp Portable communication device with dual configuration storage and the method for the same
WO2008114093A1 (en) * 2007-03-20 2008-09-25 Koninklijke Philips Electronics N.V. Data reliability in storage architectures
US8171386B2 (en) * 2008-03-27 2012-05-01 Arm Limited Single event upset error detection within sequential storage circuitry of an integrated circuit
JP5104479B2 (ja) * 2008-03-31 2012-12-19 富士通株式会社 情報処理装置
CN101580073B (zh) * 2008-05-12 2012-01-25 卡斯柯信号有限公司 计算机联锁系统码位级冗余方法
US8161367B2 (en) * 2008-10-07 2012-04-17 Arm Limited Correction of single event upset error within sequential storage circuitry of an integrated circuit
US8493120B2 (en) 2011-03-10 2013-07-23 Arm Limited Storage circuitry and method with increased resilience to single event upsets
JP6337676B2 (ja) * 2014-07-29 2018-06-06 富士通株式会社 情報処理システム及び方法
US11656945B2 (en) * 2020-12-24 2023-05-23 Advanced Micro Devices, Inc. Method and apparatus to support instruction replay for executing idempotent code in dependent processing in memory devices
CN113687986A (zh) * 2021-08-31 2021-11-23 上海商汤阡誓科技有限公司 一种芯片和处理单元的恢复方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5378748A (en) * 1976-12-23 1978-07-12 Toshiba Corp Constitution control device
US4288658A (en) * 1979-11-06 1981-09-08 Frederick Electronics Corporation Apparatus for generating telex signaling sequences in a distributed processing telex exchange
US4442502A (en) * 1981-03-30 1984-04-10 Datapoint Corporation Digital information switching system
JPS58221453A (ja) * 1982-06-17 1983-12-23 Toshiba Corp 多重系情報処理装置
US4757442A (en) * 1985-06-17 1988-07-12 Nec Corporation Re-synchronization system using common memory bus to transfer restart data from non-faulty processor to failed processor
US4914657A (en) * 1987-04-15 1990-04-03 Allied-Signal Inc. Operations controller for a fault tolerant multiple node processing system
CA2003338A1 (en) * 1987-11-09 1990-06-09 Richard W. Cutts, Jr. Synchronization of fault-tolerant computer system having multiple processors
US5295258A (en) * 1989-12-22 1994-03-15 Tandem Computers Incorporated Fault-tolerant computer system with online recovery and reintegration of redundant components
US5327553A (en) * 1989-12-22 1994-07-05 Tandem Computers Incorporated Fault-tolerant computer system with /CONFIG filesystem
JPH04211841A (ja) * 1990-03-09 1992-08-03 Nec Corp 二重化処理装置
US5261092A (en) * 1990-09-26 1993-11-09 Honeywell Inc. Synchronizing slave processors through eavesdrop by one on periodic sync-verify messages directed to another followed by comparison of individual status
CA2068048A1 (en) * 1991-05-06 1992-11-07 Douglas D. Cheung Fault tolerant processing section with dynamically reconfigurable voting
US5339404A (en) * 1991-05-28 1994-08-16 International Business Machines Corporation Asynchronous TMR processing system

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260291A (ja) * 2005-03-17 2006-09-28 Fujitsu Ltd エラー通知方法及び情報処理装置
JP4555713B2 (ja) * 2005-03-17 2010-10-06 富士通株式会社 エラー通知方法及び情報処理装置
JP2008186352A (ja) * 2007-01-31 2008-08-14 Nec Computertechno Ltd コンピュータシステム、コンピュータシステムにおける命令リトライ方法及びプログラム
JP2011523474A (ja) * 2008-04-23 2011-08-11 エーティーラブ・インコーポレーテッド 誤動作時に自動復元する通信システム及びその復元方法
US8656208B2 (en) 2008-04-23 2014-02-18 Atlab Inc. Communication system with automatic restoring function against faulty operation and restoring method thereof
JP2010262432A (ja) * 2009-05-01 2010-11-18 Mitsubishi Electric Corp 安全制御装置
JP2011014011A (ja) * 2009-07-03 2011-01-20 Hitachi Ltd 多重系システムの高信頼性制御装置
WO2016113774A1 (ja) * 2015-01-14 2016-07-21 三菱電機株式会社 データ処理装置
JPWO2016113774A1 (ja) * 2015-01-14 2017-04-27 三菱電機株式会社 データ処理装置

Also Published As

Publication number Publication date
US5572662A (en) 1996-11-05

Similar Documents

Publication Publication Date Title
JPH0863365A (ja) データ処理装置
US5384906A (en) Method and apparatus for synchronizing a plurality of processors
JP2858140B2 (ja) パイプラインプロセッサ装置および方法
US5317726A (en) Multiple-processor computer system with asynchronous execution of identical code streams
US5317752A (en) Fault-tolerant computer system with auto-restart after power-fall
US4965717A (en) Multiple processor system having shared memory with private-write capability
US5890003A (en) Interrupts between asynchronously operating CPUs in fault tolerant computer system
US20060190702A1 (en) Device and method for correcting errors in a processor having two execution units
US20090044044A1 (en) Device and method for correcting errors in a system having at least two execution units having registers
JP2000029857A (ja) 個々のプロセッサの早期リリ―スによるシステム・シリアル化方法
US20050246578A1 (en) Method and system of exchanging information between processors
US9594648B2 (en) Controlling non-redundant execution in a redundant multithreading (RMT) processor
JP2012198803A (ja) 演算処理装置及び演算処理方法
US6125443A (en) Interrupt processing system and method for information processing system of pipeline control type
US5898867A (en) Hierarchical memory system for microcode and means for correcting errors in the microcode
JPH08137751A (ja) プロセッサ装置及びその制御方法
JP3628265B2 (ja) マルチプロセッサシステム装置
JP3240660B2 (ja) データ処理装置
JPH05100883A (ja) データ処理用半導体装置
CN112506701B (zh) 一种基于三模lockstep的多处理器芯片错误恢复方法
JPH0635880A (ja) マイクロプロセッサ装置
JPH0133856B2 (ja)
JPH05165663A (ja) データ処理装置
JP2002215421A (ja) デバッグ装置およびデバッグ装置のブレーク方法
JP2572821B2 (ja) 命令再実行による演算処理方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030325