JPS6191732A - デ−タ処理システムにおける故障処理方式 - Google Patents

デ−タ処理システムにおける故障処理方式

Info

Publication number
JPS6191732A
JPS6191732A JP59212862A JP21286284A JPS6191732A JP S6191732 A JPS6191732 A JP S6191732A JP 59212862 A JP59212862 A JP 59212862A JP 21286284 A JP21286284 A JP 21286284A JP S6191732 A JPS6191732 A JP S6191732A
Authority
JP
Japan
Prior art keywords
error
instruction
data processing
trouble
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59212862A
Other languages
English (en)
Inventor
Shuichi Hanatani
花谷 修一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59212862A priority Critical patent/JPS6191732A/ja
Publication of JPS6191732A publication Critical patent/JPS6191732A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明はデー?処理システムにおける故障処理方式、と
くにデータ処理装置とこれを診断する診断装置とを含む
データ処理システムにおける故障処理方式に関する。
(従来技術) この種データ処理システムにおける故障処理は従来以下
に示すよう罠行なわれている。
第1図は従来例を示すブロック図である。
データ処理装置2′の中に含まれる命令供給回路21′
は、主記憶装at’から命令語を取り出して命令バッフ
ァ22′に命令語の待行列(キーm:Queue )を
形成せしめる。
命令実行回路23′は、この命令バッファ22′から命
令語の供給を受け、順次命令語の実行を行ない、その結
果金、ソフトウェアから見えるレジスタ(ソフトウェア
ビジプルなレジスタ8VR)232’、または、ライン
2300’を介して主記憶装置1t’に格納する。
さて、このような動作において、データ処理装置2′内
でエラーが発生すると、このエラーは、前記命令供給回
路21′、命令バッファ22′および命令実行回路23
′のそれぞれに備えられているエラー検出器211’、
 221’および231′のいずれかにより検出され、
論理和ゲート24′により、これら出力の論理和かとら
れた合成出力によってフリ。
プフロップ25′がセットされ、この結果工2−報告線
2500’を介して診断装置3’に対してエラー報告が
行なわれる。
診断装置3′は、この報告を受けると、ライン3001
’?介して、データ処理装置2′に対してエラーログ(
故障情報)の収集要求を出す。
これを受けるとデータ処理装置2′は、直ちに正常な動
作を停止して、データ処理装ff11.2’内の必要な
レジスタやフリップ70ツグを従続に接続してシフトハ
スを形成し、これらの内容(エラーログ)をライン20
00’を介して診断装置3′に転送する。
診断装置3′はこうして転送されたエラーログを解析し
、この結果、再試行可能ならば、ライン3002’を介
してデータ処理装置2′に対し、再試行の指示を与える
さて、こうして再試行の指示が与えられ、それに従って
再試行が行なわれてからある時間が経過した後、再びエ
ラーが発生すると、上述と同じシーケンスが開始され、
これが診断装置3′の解析により再試行可能であると判
断されると同様に再試行の指示が与えられる。
このようにして再試行可能なエラーの発生が繰り返され
る場合、これが固定エラーかまたはンフトエラー(確率
的に生ずるエラー)かを区別するために、診断装置3′
中に設けられた再試行カウンタ(図示せず)によシ、上
述のようにして発生する再試行数がカウントされる。再
試行可能なニジ−が断念に発生し念場合にはこの再試行
カウンタの内容が参照され、このカウント値が一定時間
に予め定めた一定数を越える場合には固定エラーと判定
される。固定エラーと判定され九場合には、対応するハ
ードウェアが切離してディグレード運転を行なう等の処
置がとられる。
以上のシーケンスを第2図に示す。
さて、以上に述べた従来例の方式によると、エラーが検
出されるごとに診断装置3’に報告されるため、第2図
に示すように、その都度診断装置3′のエラーログ収集
およびエラー解析が必要となシ、その間データ処理装置
2′は正常の動作を停止していなければならず、そのた
めにそれだけ性能が低下するという欠点を有している。
(発明の目的) 本発明の目的は、データ処理装置に適当な機能を付加す
ることにより上述の従来の欠点を大幅に緩和したデータ
処理システムにおける故障処理方式を提供することにあ
る。
(発明の構成) 本発明の方式は、データ処理装置とこれを診断する診断
装置と全含むデータ処理システムにおいて、前記データ
処理装置の再試行可能である故障に対しこの故障を検出
する第1の手段と、前記第1の手段によシ検出された故
障に対し前記データ処理装置の再試行を実行せしめる第
2の手段と、前記第2の手段による再試行の結果に応答
して前記故障が固定的故障であるか否かを判定する第3
の手段と、前記第3の手段により固定的故障と判定され
たときこれを前記診断装置に報告する第4の手段とを含
み、前記第1の手段から前記第4の手段までが前記デー
タ処理装置内に構成される。
(実施例) 次に図面を参照して本発明の詳細な説明する。
第3図は本発明の一実施例を示すプロ、り図である。本
実施例は、主記憶装置l、データ処理装置2および診断
装置ft3を有している。
データ処理装置2は、さらに、命令供給回路21゜命令
バッファ22、命令実行回路23および付加機能回路2
4t−含み、前記命令供給回路21には、エラー検出器
211 を有し1.まt前記命令実行回路23には命令
力炒ンタ(IC)231 を有している。
さらに前記付加機能回路24は、フリ、プ7aツブ24
1,243,248,249、アンドゲート24224
6.247、エラーカウンタ(EC)244、および比
較器245を有している。
さて、本実施例の動作は下記の通りである。
データ処理装置2の中の命令供給回路21は、主記憶装
@1から命令語を取り出してこれを命令バッファ22に
供給する。
命令パ、ファ22は、先入れ先出しくFIFO)のパ、
ファで、供給された命令語を、待行列の形で収容し、命
令実行回路23において一つの命令語の実行が終了する
ごとに、待行列の先頭の命令語を行列から取りはずして
命令実行回路23に供給し、こうして久々の命令語が命
令実行回路23によって実行される。
こうして実行され定命令語の実行結果は、あるいは回路
23中罠あるソフトウェアビジプルなレジスタ(図示せ
ず)に書込まれ、あるいはライン2300を介して主記
憶装置l中は書きこまれる。
さて、こうして、命令語が次々に実行されている途中に
おいて、命令供給回路21に含まれているエラー検出器
211がエラー(故障)を検出したとする。検出器21
1の出力は直ちに付加機能回路24中の7リツプフロツ
プ241をセットし、以後出力ライン241(l正常状
態の60#から′l”に変化した状態で保持する。
このライン241Oの出力はアンドゲート242を介し
て7す、プ7o、プ243の入力側圧供給されているが
、アンドゲート 242の他方の入力には、命令実行回
路23からの命令終了指示パルス2300が供給されて
いる。この命令終了指示パルス2300は、命令実行回
路23において、一つの命令語の実行が終了し、次の命
令語の実行が始まる前に出力される論理w1mの幅の狭
いパルスである。
今、ある時点で、前述のように命令供給回路21のエラ
ー検出器211がエラーを検出し、その結果、ライン2
41Oが′l”になったとする。この時点で命令実行回
路23中において実行中の命令語の実行が終了すると、
上述の命令終了指示パルス2300が出力され、これに
よってライン2410の′l#はアンドゲート 242
を通過し、正常状態では′0″にリセットされているフ
リ、プフロ、プ243を、この命令語の処理が終了した
時点で′1”Kセットする。
フリ、プフロップ243がこうして1#にセットされる
と、出力ライン2430は11”Kなり、またエラーカ
ウンタ(EC)244はこのエラー検出(フリップ7o
、プ243のセット)に応答してlが加算される。なお
、この工2−カウンタ(EC)244は、フリ、プフロ
ップ243のセットにより1が加算されるばかりでなく
、予め定めた一定時間間隔TごとKOにリセットされる
ように構成されている。従って、エラーカウンタ(EC
)244の内容は1時間内に発生するエラーの回数まで
積算されることになる。
さて、エラーカウンタ(EC)244の出力は比較器2
45に供給され、ここで予め定められている定数Nと比
較される。
もしエラーカウンタ(EC)244の内容がこの定数N
よりも大きいか等しい場合には、比較器245の出力ラ
イン2450から′1”が出力され、また小さい場合に
は出力ライン2451から′l#が出力され、この結果
、それぞれの場合に応じてフリ、プフロップ248また
はクリップ70ツブ249が′1”Kセットされる。
さて、フリ、プフロップ248がl”にセットされた場
合には、この情報はライン2480を介して診断装置3
へ固定エラーとして報告される。診断装置3はこれに応
答してエラーログ金収集し、これを解析してデグレード
運転を行なう等の処置管とる。
一方、フリップフロ、プ249がセットされた場合には
、診断装置3に報告されることなく、再試行可能なソフ
トエラーとして以下のよう洗処理される。
すなわち、命令実行回路23中にある命令カウンタ(I
C)231 e参照して現在、命令実行回路23中で実
行が終了した命令語の次の順番にある命令語を、命令供
給回路21があらためて主記憶装置lから読出す命令語
の再読出しから再試行が行なわれるように制御される。
なお、この再試行が始まる前に前述のl”にセットされ
た各7リツプフロツプ241,243,249は適当な
時点で0”にリセットされ次のエラー検出に対して準備
される。
このように、本実施例によると、命令供給回路21中の
エラー検出器211で検出され次エラーは、そのと色命
令実行回路23で実行中の命令語の実行終了をまって7
リツプ70ツブ243を″l”にセットし、これが再試
行可能なエラーの検出となって以後の処理を始動する。
そしてこの再試行可能なエラーの検出が、1時間内に個
数Nに至らない場合には、診断装置3を煩られすことな
く、データ処理装置2と主記憶装置lとの間だけで再試
行処理が実行されるため、前述した従来例に比しデータ
処理装置2のクロック停止等の処理が不要となり、遥か
に迅速に処理されることは明らかである。
第4図に、第2図に示した従来例のシーケンスに対応す
る本実施例のシーケンスを示す。
なお、上述し友ように、本実施例においては、7す、グ
フロップ243のセラH−もって、再試行可能なエラー
の検出として以後の処理がなされるが、これは下記の理
由によるものである。
一般に、再試行不可能という判定は、エラーを含む命令
語の実行によってソフトウェアビジプルなレジスタまた
は主記憶装置lの内容がすでに更新されてしまった時点
でなされる。しかるに、本実施例の7す、プフロ、プ2
43が′l#にセットされた時点で実行が終了した命令
語は、少くも命令供給回路21のエラー検出器211で
エラーが検出されるよシも充分以前に命令供給回路21
で取扱われた命令語であり、今回検出されたエラーの影
響を全く受けていないことは明らかでるる。また、次の
命令語に対しては、この命令語がまだソフトフェアビジ
プルなレジスタや主記憶装置lの内容を更新する前にエ
ラー検出が行なわれているので、上述のようにこの命令
語の再読出しから再試行を実行すれば問題が起らないこ
とも明らかである。
以上の理由から本実施例においては、スリップ70ツグ
243がl#にセットされるのをもって再試行可能な工
2−の検出として取シ扱われている。
なお、第5図に以上のシーケンスをタイムチャートとし
て示す。この図においては、命令供給回路21により、
各命令語はA、B、C,D、E・・・の順序で主記憶装
置lから読出され、命令バッファ22に供給されるが、
この命令供給回路21が命令語Cの処理中に最初のエラ
ーが命令供給回路21中のエラー検出器211 で検出
されたときの状況金示している。
このとき、命令実行回路23中では最初の命令語AがA
t、A2.A3の3マシンサイクルにわたる3ステツプ
で処理されているが、この命令語Aの終了を待って(す
なわちA3の終了した時点で)、フリップフ、aツブ2
43がセットされ、これが上述のように再試行可能な工
2−の検出として以後の処理を起動する。すなわち、エ
ラーカウンタ(EC)244のそのときの内容に応答し
て、再試行の実行(7す、プフロップ2490セット)
か、診断装置3に対する固定エラーの報告(フリップ7
o、プ248のセット)かが決定される。
上述の最初のエラー検出に対しては、フリップフロップ
249がセットされ、この結果、命令供給回路21が命
令カウンタ(IC)231の内容を参照してAの次の命
令語Bft主記憶装置1から読出す処理から再試行が行
なわれる。
なお、上述の各7リツプフロツプ241 、243 。
249はセットされた情報が下位の7リツプフロツプに
転送された後適轟にリセットされ、次の工2−の検出お
よびその処理に備えられる。
こうして1時間内にN個のエラーが検出されると7す、
グフロップ248がセットされ診断装置3に対し固定エ
ラーの報告が行なわれる。
なお、以上は本発明の一実施例を示したもので本発明は
以上の実施例に限定されるものではない。
例えは、本実施例においては、命令供給回路21中に設
けたエラー検出器211で検出されたエラ−にもとづき
、前述のようにして7リツプフロツプ243がIt、”
に設定されるのをもって再試行可能なエラーの検出とし
たが、他の伺等かの方法により診断装置金煩わすことな
く再試行可能なエラーの検出が行なえるようにし、この
再試行可能なエラーが検出されると再施行を実行し、こ
うして実際に起る再試行の頻度を本実施例と同様にして
ガウントし、この頻度が予め定めた一定の値を越えた場
合に診断装置に固定エラーとして報告するようにしても
よい。
なお、本実施例で示した故障処理方式は複雑な構成の命
令供給回路を有するデータ処理装置の故障処理に適用し
て効果がある。とくに命令供給回路の一部として特開昭
56−87282号で示される命令中ヤッシュおよび特
願昭57−201555で示される分岐ヒストIJルー
プ(BHT)等を有するデータ処理装置の故障処理に有
効である。
(発明の効果) 以上述べたように、本発明全用いると、データ処理装置
とこれを診断する診断装置とを含むデータ処理システム
において、データ処理装置側に、データ処理装置の再試
行可能である故障を検出する手段と、この手段により検
出された故障に対しデータ処理装置の再試行を実行させ
る手段と、この再試行の実行結果に従ってこの故障が固
定的故障か否かを判定する手段と、これが固定的故障と
判定され之ときに診断装置に報告する手段とを設け、こ
うして検出された再試行可能な故障に対しては、診断装
置を煩わすことなく再試行を行ない、これが固定故障と
判定されたときに診断装置に報告して診断装置の介入し
た故障処理を行なう。このような故障処理方式をとるこ
とにより、上記のようにして検出される故障に対し故障
検出時におけるデータ処理装置の故障処理を迅速化しこ
れによる性能低下を大幅に改善できるという効果がある
【図面の簡単な説明】
第1図は従来例全説明する定めのプロ、り図、第2図は
従来例の故障処理のシーケンスを説明するための図、第
3図は本発明の一実施例を示すプロ、り図、第4図は本
実施例の故障処理のシーケンスを説明する定めの図およ
び第5図は本実施例の動作を説明するためのタイムチャ
ートである。 図において、 l・・・・・・主記憶装置、2・・・・・・データ処理
装置、3・・・・・・診断装置、21・・・・・・命令
供給回路、22・・・・・・命令バッファ、23・・・
・・・命令実行回路、24・・・・・・付加機能回路、
211・・・・・・エラー検出器、231・・・・・・
命令カウンタ(IC)、241,243,248,24
9・・・・・・フリップフロップ、242,246,2
47・・・・・・アンドゲート、244・・・・・・エ
ラーカウンタ(EC)、245・・・・・・比較器。 第1図 デ゛−タ処」里琥 置     を今凶斥装 置デ′−
タ処J里装置       を食!’/1装置第4図

Claims (1)

  1. 【特許請求の範囲】 データ処理装置とこれを診断する診断装置とを含むデー
    タ処理システムにおいて、 前記データ処理装置の再試行可能である故障に対しこの
    故障を検出する第1の手段と、 前記第1の手段により検出された故障に対し前記データ
    処理装置の再試行を実行せしめる第2の手段と、 前記第2の手段による再試行の結果に応答して前記故障
    が固定的故障であるか否かを判定する第3の手段と、 前記第3の手段により固定的故障と判定されたときこれ
    を前記診断装置に報告する第4の手段とを含み、 前記第1の手段から前記第4の手段までが前記データ処
    理装置内に構成されることを特徴とするデータ処理シス
    テムにおける故障処理方式。
JP59212862A 1984-10-11 1984-10-11 デ−タ処理システムにおける故障処理方式 Pending JPS6191732A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59212862A JPS6191732A (ja) 1984-10-11 1984-10-11 デ−タ処理システムにおける故障処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59212862A JPS6191732A (ja) 1984-10-11 1984-10-11 デ−タ処理システムにおける故障処理方式

Publications (1)

Publication Number Publication Date
JPS6191732A true JPS6191732A (ja) 1986-05-09

Family

ID=16629528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59212862A Pending JPS6191732A (ja) 1984-10-11 1984-10-11 デ−タ処理システムにおける故障処理方式

Country Status (1)

Country Link
JP (1) JPS6191732A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100498150B1 (ko) * 1996-12-20 2005-09-09 지멘스 악티엔게젤샤프트 프로세서의기능체크방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100498150B1 (ko) * 1996-12-20 2005-09-09 지멘스 악티엔게젤샤프트 프로세서의기능체크방법

Similar Documents

Publication Publication Date Title
US5388254A (en) Method and means for limiting duration of input/output (I/O) requests
US4852092A (en) Error recovery system of a multiprocessor system for recovering an error in a processor by making the processor into a checking condition after completion of microprogram restart from a checkpoint
EP0397471B1 (en) Initialization system amd methods for input/output processing units
JPS6191732A (ja) デ−タ処理システムにおける故障処理方式
JPH02294739A (ja) 障害検出方式
JPH1115661A (ja) Cpuの自己診断方法
JPS58181160A (ja) 緊急動作制御方式
JPS6111855A (ja) デ−タ処理装置の機能診断方式
JP3381756B2 (ja) 並列プロセッサシステム
JPH0561734A (ja) 並列プログラムの非決定的動作テスト方法
JPH0415834A (ja) コンピュータの試験方式
JP2922981B2 (ja) タスクの実行継続方法
JP2979553B2 (ja) 障害診断方式
JPS6146535A (ja) 擬似エラ−設定制御方式
JPH0149975B2 (ja)
JPS62278642A (ja) 再試行制御方式
JPS5850049A (ja) 多重論理装置システム
JPS6155748A (ja) 電子計算機システム
JP2919457B1 (ja) 二重化装置i/o制御方式およびそのプログラム記録媒体
JPH0621993B2 (ja) 命令再実行制御方式
JPH0218505B2 (ja)
JPS648379B2 (ja)
JPS61269746A (ja) 情報処理装置
JPH011041A (ja) 障害早期検出方式
JPS60254331A (ja) デ−タ処理システムにおける障害処理方式