JP3087678B2 - 障害処理システム - Google Patents

障害処理システム

Info

Publication number
JP3087678B2
JP3087678B2 JP09050194A JP5019497A JP3087678B2 JP 3087678 B2 JP3087678 B2 JP 3087678B2 JP 09050194 A JP09050194 A JP 09050194A JP 5019497 A JP5019497 A JP 5019497A JP 3087678 B2 JP3087678 B2 JP 3087678B2
Authority
JP
Japan
Prior art keywords
fault
failure
notification signal
error
minor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP09050194A
Other languages
English (en)
Other versions
JPH10247148A (ja
Inventor
進一 河口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09050194A priority Critical patent/JP3087678B2/ja
Publication of JPH10247148A publication Critical patent/JPH10247148A/ja
Application granted granted Critical
Publication of JP3087678B2 publication Critical patent/JP3087678B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置の障
害処理システムに関する。
【0002】
【従来の技術】従来の情報処理装置は1ビット誤り訂正
回路を制御回路に設けたり、あるいは、性能は低下する
が故障箇所を自動的に切り離したりすることにより、軽
度障害が発生した場合には処理を続行できるように構成
されている。また、そのような軽度障害が多発連続した
場合でも、システム停止することなく処理が続行できる
よう構成されている。
【0003】障害が検出されると、エラー処理回路から
割込み発生回路を通して割り込みが演算処理装置に対し
て送られ、演算処理装置は、その割込みに応答して、一
旦通常処理を中断し、エラー情報の採取等のエラー処理
を行なう。
【0004】したがって、例えば、ある固定箇所におい
て1ビットの固定障害が発生したような場合等、誤り訂
正の可能な軽度障害が連続多発した場合には、演算処理
装置は連続してエラー通知の割込みを受信し、エラー情
報の採取等のエラー処理に殆どの時間を使われてしま
い、この結果、通常処理の性能が著しく低下してしま
う。
【0005】かかる問題を解決するため、従来、図4に
示すような障害処理システムが用いられていた。このシ
ステムは、演算処理装置401と、軽度障害が発生した
ことを演算処理装置401に伝え、実行中の処理を中断
し、エラー処理を開始させるための割込みを発生する割
り込み発生回路402と、軽度障害を検出する回路40
3と、発生したエラー情報を記録しておくステータス保
持回路404と、軽度障害検出回路403において軽度
障害を検出するごとに(+1)ずつインクリメントされ
るカウンタ405とから構成される。
【0006】エラー検出回路403において軽度障害が
検出されると、エラー情報がエラーステータス保持回路
404に記憶される。また、軽度障害検出信号410が
割り込み発生回路402およびカウンタ回路405に送
られる。
【0007】割り込み発生回路402は、エラー検出回
路403から軽度障害検出信号410を受信したときに
カウンタ回路405から出力される割込み抑止信号41
1が割込み出力状態であれば、演算処理装置401に対
して、割り込みを要求し、エラー情報収集等のエラー処
理を演算処理装置401に実行させる。
【0008】この場合、エラー検出回路403において
軽度障害が連続的に検出されたときには、演算処理装置
401は連続して割り込みを受信することになるが、軽
度障害検出信号410を受信するたびにインクリメント
しているカウンタ回路405の計数値がある値Nに到達
すると、カウンタ回路405から割り込み発生回路40
2に対して出力される割り込み抑止信号411が抑止状
態となり、割込み発生回路402はこれ以上の割込み
を、演算処理装置に発行しないようになる。
【0009】ただし、この方式を用いた場合、カウンタ
405の計数値がNに達するまでは、演算処理装置の通
常処理を妨害してしまう。また、カウンタ405の計数
値がNに到達したあとは全く別のエラー事象が発生した
場合でも、そのエラーの報告はされないことになるとい
う問題がある。
【0010】また、別の従来の障害処理システムとし
て、図4と同様な構成で、カウンタの計数値がNに到達
するまでは、エラーの報告を行なわずに、カウンタの計
数値がNに到達した時点で、演算処理装置に対し、割り
込みを送出し、演算処理装置にエラー処理を行なわせる
システムも存在する。このシステムの問題点としては、
カウンタの計数値がNに到達しないと割込みが発行され
ないために、エラー発生の頻度にエラー報告が依存して
しまうことから、障害発生後の処理が時間的に遅れてし
まう場合があることや、頻度の少ない間欠故障が速やか
に報告されないため、軽度障害から重度障害に陥るよう
なケースにおいて事前に、軽度障害の段階で障害箇所を
見極めることができないこと、また軽度障害を検出し
て、自動的にその箇所を切り離し、性能を低下させなが
らも処理を続行させるような場合には、障害検出は1度
のみ行なわれることより、本システムを適用することが
できない。
【0011】
【発明が解決しようとする課題】従来の情報処理装置に
おいては、障害が発生しても誤り訂正回路による訂正が
可能であるものや、故障箇所を切り離すことにより性能
を低下させながらも処理の続行が可能であるような軽度
障害が発生した場合、演算処理装置に対して割込みを発
行し、エラー情報収集などエラー処理を行ったのち、中
断して通常処理を再開するが、上記のような軽度障害が
多発、連続した場合、エラー検出からエラー処理、通常
処理復帰のサイクルを繰り返すことになり、演算処理装
置は上記エラー処理のみで占有されてしまいシステム性
能が著しく低下するという欠点がある。
【0012】これに対し、上述した従来の障害処理シス
テムのように、軽度障害の発生回数をカウントし、発生
回数が設定したある数に達するまでは、演算処理装置へ
の報告を行い、障害発生回数がある数に達した後は、演
算処理装置への報告を抑止するシステムが存在するが、
本システムでは、障害発生回数が設定したある回数に達
するまでは、エラー発生ごとにエラー処理を行うため、
通常処理性能を低下させてしまう欠点がある。
【0013】また、別の従来の障害処理システムとし
て、同様な構成において、障害発生回数をカウントし、
発生回数が設定したある回数に達するまでは、演算処理
装置に対してエラー報告を行わず、障害発生回数が設定
したある回数に達した時点で、演算処理装置に対しエラ
ー報告の割込みを発行させるシステムが存在するが、本
システムでは、エラー発生頻度に演算処理装置へのエラ
ー報告のタイミングが依存してしまうために、障害発生
後の処理が時間的に遅れる場合があり、また頻度の少な
い間欠故障は即座には報告されないため、軽度障害から
重度障害へと陥る可能性のある場合において、軽度な障
害の段階で事前に障害箇所を見極めることができないと
いうことや、さらに、軽度障害を1度検出したのち、自
動的に障害箇所を切り離し、一時的に性能を低させて通
常処理を続行させようとした場合、検出が一度のみであ
るため、本システムでは、演算処理装置への報告ができ
ないという欠点がある。
【0014】本発明の目的は、上述の問題点を除去した
障害処理システムを提供することにある。
【0015】
【課題を解決するための手段】本発明のシステムは、障
害報告時限タイマーに従い、一定周期ごとに一度開くゲ
ート回路を、軽度障害検出フラグと割込み発生回路の間
に設け、軽度な障害が発生した場合でも、ゲート回路が
開くまでは、割込み発生回路へ障害検出信号を入力させ
ない構成を有する。
【0016】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0017】図1は、本発明の実施の形態を示すブロッ
ク図である。図1において、プロセッサエージェント
(#n)1および演算処理装置(#n)2は、図2に示
すような、システムバス100に対して接続された複数
のプロセッサモジュールのうちのn番目のプロセッサモ
ジュール(#n)0を構成する。システムバス100に
は、さらに、I/Oモジュール101、メモリモジュー
ル102等が接続されている。また、ここでは障害が発
生しても誤り訂正や、自動的に故障箇所を切り離し、シ
ステム性能を低下させながらも通常処理の続行が可能で
あるような障害を軽度障害と呼ぶ。プロセッサエージェ
ント1は軽度障害を検出する回路3をn個有している。
また、軽度障害通知線24には、システムバス上の他の
モジュール(I/Oモジュール等)で発生した軽度障害
の通知信号が伝播する。障害フラグ制御回路4は各軽度
障害検出回路のいずれかからエラー検出信号を受信した
場合に、内部の軽度障害フラグ5を立て、エラー詳細情
報を障害ステータスレジスタ6へ格納する。通知ゲート
回路7は、軽度障害フラグ5からの軽度障害フラグ信号
21を割込み発生回路10へ入力するかどうかを制御す
る。この通知ゲート回路7は通常は閉じているが、基本
クロックパルスに同期して1ずつ減算動作する軽度障害
通知時限タイマー8のタイマー値22が0となった時の
み開かれる。軽度障害通知時限タイマー8は、タイマー
初期値設定レジスタ9の値を初期値とし、基本クロック
パルスに同期して1づつ減算されて行き、その値が0と
なった時点でまた初期値が設定され、再度減算されてゆ
くといった動作を繰り返している。割込み発生回路10
は、通知ゲート回路7から入力される軽度障害通知信号
23が入力されたのを契機に、演算処理装置2に対し
て、実行中の通常処理を中断しエラー処理を開始させる
ための割込みを発行する。タイマー初期値設定レジスタ
9および障害ステータスレジスタ6は、演算処理装置2
によりレジスタアクセス制御回路11を通してアクセス
可能なソフトウェアビジブルレジスタである。
【0018】次に、本実施の形態の動作について説明す
る。図1において、軽度障害検出回路(#n)3におい
て軽度障害が検出されるか、または、システムバスの他
モジュール(I/Oモジュール等)からの軽度障害発生
信号24を受信すると、軽度障害フラグ制御回路4が、
障害ステータスレジスタ6にエラーの詳細情報を記録
し、軽度障害フラグ5が1となり、軽度障害フラグ信号
21が図3のようにレベル信号としてアサートされる。
軽度障害通知時限タイマー8は、演算処理装置2があら
かじめ設定したタイマー初期値設定レジスタ9の値を初
期値として、基本クロックパルスに同期して1ずつ減算
されていく、その値が0に達すると、再度初期値からの
減算動作を繰り返す。図3において、軽度障害フラグ信
号21がアサートされた時点ではタイマー値22の値が
0でないために、通知ゲート回路9が閉じており、軽度
障害通知信号23は変化をしないが、図3のようにタイ
マ値が0となった時点で、通知ゲート回路7が開き、軽
度障害通知信号23がパルスとして、割込み発生回路1
0に入力される。軽度障害通知信号23がアサートする
と、その元となった軽度障害フラグ5は0にもどり、レ
ベル信号としてアサートしていた軽度障害フラグ信号2
1は0に戻る。なお、図3に示すように軽度障害フラグ
5が0で、軽度障害フラグ信号21が0であった場合
は、通知ゲート回路7が開いても、割込み発生回路10
には何も入力されないため、演算処理装置2への割込み
は発行されない。
【0019】演算処理装置2は割込み25を受信する
と、今まで実行していた通常処理を中断し、障害ステー
タスレジスタ6の読みだし等のエラー処理を実行する。
エラー処理終了後、中断していた通常処理が再開され
る。このように、軽度障害を検出しても、あらかじめ設
定される一定周期ごとに一度しか、エラー検出報告を演
算処理装置に行わないために、たとえ障害が多発したと
しても演算処理装置での通常処理の性能を著しく低下す
ることを抑え、システムとしての機能を向上させること
ができ、また1度のみしか検出されないような軽度障害
があっても、タイマー設定時間内には必ず演算処理装置
に報告されるという効果も得られる。
【0020】
【発明の効果】以上詳細に説明したように、本発明に
は、システムの処理続行が可能な軽度障害が、システム
内で多発、連続した場合でも、通常処理の性能がエラー
処理の実行のために、低下することを防止し、システム
機能の向上をはかれるという効果がある。その理由は、
軽度障害が検出されていても軽度障害通知時限タイマー
により制御されるゲート回路が開くまでは、演算処理装
置への割込みが行われないことによるものである。さら
に本発明には、検出回数の少ない軽度障害についても、
ある一定時間以内には、必ず演算処理装置へ報告できる
という効果もある。
【0021】
【図面の簡単な説明】
【図1】本発明の実施の形態を示すブロック図である。
【図2】本発明が使用されるシステムの一例を示すブロ
ック図である。
【図3】本実施の形態の動作を示す波形図である。
【図4】従来の軽度障害通知装置の一例を示すブロック
図である。
【符号の説明】
1 プロセッサエージェント 2 演算処理装置 3 軽度障害検出回路 4 軽度障害フラグ制御回路 5 軽度障害フラグ 6 障害ステータスレジスタ 7 通知ゲート回路 8 軽度障害通知時限タイマー 9 タイマー初期値設定レジスタ 10 割り込み発生回路 11 レジスタアクセス制御回路
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 11/00 G06F 11/30 G06F 11/34

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 予め定めた第1の時間が経過する毎に予
    め定めた第2の時間だけ開くゲート手段と、 障害の発生に応答して障害通知信号を前記ゲート手段に
    送出する障害通知手段と、 前記ゲート手段が開いたときに前記ゲート手段から出力
    される前記障害通知信号を受信し障害回復処理を行なう
    処理手段とを備え、前記障害通知手段は、前記障害の発生に応答して前記障
    害通知信号を記憶する記憶手段を含み、前記記憶手段に
    前記障害通知信号がすでに記憶されている場合には他の
    障害が発生しても新たに障害通知信号を前記記憶手段に
    記憶せず、前記ゲート手段から前記障害通知信号が前記
    処理手段に通知されるまで前記障害通知信号を送出する
    ことを特徴とする障害処理システム。
  2. 【請求項2】 予め定めた第1の時間が経過する毎に予
    め定めた第2の時間だけ開くゲート手段と、 障害の発生に応答して障害通知信号を前記ゲート手段に
    送出する障害通知手段と、 前記ゲート手段が開いたときに前記ゲート手段から出力
    される前記障害通知信号を受信し障害回復処理を行なう
    処理手段とを備え、 前記障害通知手段は、前記ゲート手段から前記障害通知
    信号が前記処理手段に通知されるまで前記障害通知信号
    を送出し、前記障害通知信号が前記ゲート手段から出力
    されたあと新たな障害が発生するまで前記障害通知信号
    の送出を停止することを特徴とする障害処理システム。
  3. 【請求項3】 前記障害通知手段は、障害の内容を記憶
    する記憶手段を含むことを特徴とする請求項記載の障
    害処理システム。
JP09050194A 1997-03-05 1997-03-05 障害処理システム Expired - Lifetime JP3087678B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09050194A JP3087678B2 (ja) 1997-03-05 1997-03-05 障害処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09050194A JP3087678B2 (ja) 1997-03-05 1997-03-05 障害処理システム

Publications (2)

Publication Number Publication Date
JPH10247148A JPH10247148A (ja) 1998-09-14
JP3087678B2 true JP3087678B2 (ja) 2000-09-11

Family

ID=12852352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09050194A Expired - Lifetime JP3087678B2 (ja) 1997-03-05 1997-03-05 障害処理システム

Country Status (1)

Country Link
JP (1) JP3087678B2 (ja)

Also Published As

Publication number Publication date
JPH10247148A (ja) 1998-09-14

Similar Documents

Publication Publication Date Title
JP2758742B2 (ja) 誤動作検出方式
JPS5983254A (ja) ウオツチドツグタイマ
EP0125797B1 (en) Interrupt signal handling apparatus
JP3087678B2 (ja) 障害処理システム
JPH11259340A (ja) コンピュータの再起動制御回路
JP2870250B2 (ja) マイクロプロセッサの暴走監視装置
JPH06175934A (ja) 1ビットエラー処理方式
GB2310514A (en) Watchdog circuit
JP3252345B2 (ja) 処理信号保護回路
JPH064301A (ja) 時分割割込制御方式
JP2834062B2 (ja) 情報処理システム
JPS61226843A (ja) 割込み異常検出装置
JPH04148246A (ja) ウオツチドツグタイマ
JP2731386B2 (ja) 制御装置
JPS6142220A (ja) デジタル保護リレ−の再スタ−ト方法
JP2605440B2 (ja) データ処理装置
SU1383371A1 (ru) Устройство дл контрол выполнени программ на эвм
CN118033391A (zh) 在集成电路中对时钟网络进行监控的方法、装置和设备
JPH02259845A (ja) プロセッサ
JP2752814B2 (ja) ウォッチドッグ断アラーム処理装置
SU590833A1 (ru) Оперативное запоминающее устройство с защитной информации
CN118569193A (zh) 保护电路、安全保护方法、存储介质及电子设备
JPH08292901A (ja) ウォッチドッグタイマ及びこれを用いたコンピュータシステム
JPH01231153A (ja) 障害処理方式
JPH041831A (ja) プログラム暴走監視方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000613

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070714

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10