JPS6061838A - 論理装置の故障診断処理方式 - Google Patents

論理装置の故障診断処理方式

Info

Publication number
JPS6061838A
JPS6061838A JP58168705A JP16870583A JPS6061838A JP S6061838 A JPS6061838 A JP S6061838A JP 58168705 A JP58168705 A JP 58168705A JP 16870583 A JP16870583 A JP 16870583A JP S6061838 A JPS6061838 A JP S6061838A
Authority
JP
Japan
Prior art keywords
instruction
fault
execution
internal state
cpu10
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58168705A
Other languages
English (en)
Inventor
Noritaka Umeno
典隆 梅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP58168705A priority Critical patent/JPS6061838A/ja
Publication of JPS6061838A publication Critical patent/JPS6061838A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の属する技術分野〕 本発明は論理装置の故障診断処理方式、特に間欠故障に
対し有効な故障診断処理方式に関する。
〔従来技術〕
従来論理装置に故障が起きると、該装置を一旦運転中の
システムから切離し、予じめ作成されている診断データ
を用いて故障個所の指摘を行っている。診断データとし
ては、例えば、IEEETransactions o
n C(JMPUTER8C−20Number7(1
971年7月発行)第798頁−802頁に記載されて
いるマイクロ診断プログラムが挙げられるがここではそ
の詳細については省略する。
一般に診断データは、論理装置のあらゆる故障に対する
振舞いを予見して作成する必要があるため膨大な作成費
用全必要とする。しかしこのような予じめ作成された診
断データを使用して故障指摘を行う場合でも何らかの原
因で一時的に故障状態になる間欠故障に対しては有効で
ないという欠点がある。それは診断データ全使用して故
障指摘全行おうとした時には一時的な故障は回復して装
置は正常状態に戻っているCとがあるからである。
又、最近のシステムでは前述の間欠故障対策として、論
理装置に故障が発生しても、再度同じ動作を行わせるよ
うな再試行等の障害処理全行い工きる丈その装置の可用
性を高めるように工夫されている。しかし、Cの障害処
理と、前述の故障個所の指摘処理とは別に行われている
ため処理時間が2Mに必要となる欠点がある。又、たと
え障害処理の一環として故障個所の指摘の為の情報収集
を行うとしても従来方式では故障全検出した時点の情報
しか収集していない為、故障指摘に必ずしも充分な情報
ではないという欠点がある。
〔発明の目的〕
本発明の目的は、論理装置に故障が発生した時に起動さ
れる障害処理に故障診断機能全組込み。
障害処理の過程として故障診断ケ行うOとにより、間欠
故障に対しても有効で、かつ処理時間に対しても効率の
よい故障診断処理方式を提供することにある。又1本発
明は障害処理の過程で故障個所指摘のための情報全収集
するため、故障指摘に充分々情報が得られ、かつ特別の
診断データを不要とする故障診断処理方式を提供するこ
とにある。
〔発明の構成〕
本発明の方式は、命令全実行中に発生した論理装置の故
障通知に応答して前記命令の実行を停止させる命令実行
停止手段と、前記命令実行停止に応答して前記論理装置
の内部状態情報を収集する第1の内部状態情報収集手段
と、前記停止された命令の再実行ができるか否か?表示
する命令再実行可否表示手段と、前記命令再実行可否表
示手段の表示が再実行可能である場合に前記故障通知に
5答して前記第1の内部状態情報収集手段により収集さ
れた内部状態情報に対すして前記論理装置の前記命令の
再実行を1りaツクステップづつ実行する命令再実行手
段と、前記命令再実行の1クロツクステツプ毎に前記論
理装置の内部状態情報全収集する第2の内部状態収集手
段とを含んで構成される。
〔実施例の説明〕
次に本発明について図面全参照して詳細に説明する。
第1図は本発明の一実施例のブロック図である。
第1図の故障診断処理方式は、エラーケ検出した論理装
置(以下CPUと略称す)CPU10とエラーの回復制
御を行う回復制御装置30とにより実現される。今CP
Ul0に障害が発生すると、エラー検出回路群130の
いづれかのエラー検出回路によ!ll検出される。どの
エラー検出回路で(炙出されたかで、ある程度の障害内
容は分る。エラー検出回路群130にて検出されると制
御信号123でクロック発振回路131が停止され、エ
ラー検出時点のCPUI Oの内部状態が凍結されると
ともに、制御信号124及びインタフェース:l114
仰回路133全弁して回復制御装置30にエラー検出報
告が行われる。回復制御装置30は退避角インタフェー
ス121 ’e介してCPUI Oのプログラム操作可
能レジスタ群111〜119の内容を読込む。
CPUl0内のプログラム操作可能レジスタ群111−
119、そO他の作業用レジスタ群151〜159 の
読出し動作について説明する。データバス137は32
ビット幅であり、選択レジスゲ136で指定されたレジ
スタの値がデータバス137に設定される。外部インタ
フェースは8ビツトであるため外部から読出す場合読出
し指令を出す毎にデータバス13フ上のデータが選択ゲ
ート群138全介して上位から8ビツトづつ4回インタ
フェースに送出されて、選択レジスタ136で指定され
たレジスタの値、すなわち、データバス137の値を読
出すことができる。このレジスタ読出し処理中はCPU
10のクロック全停止させてbるため、読出し動作によ
りC1)UIOの内部状態は変化しない。
回復制御装置30ではエラー検出時点でCP U10に
て実行されていた命令が再試行可能か否か全命令再試行
不可インディケータ132の内容で判断する。再試行不
可インディケーク132は各命令実行開始時点でオフに
リセットされ、命令実行中メモリ書変え、プログラム操
作可能レジスタの書変え等の条件により命令再試行不可
となった場合にはオンにセットされる。従って、CPU
l0でエラー検出された時点の該命令再試行不可インデ
ィケータ132がオフの場合、中断された命令の再試行
可能であるので、回復制御装置30はCPUI Oの命
令再試行制御に入する。
回復制御装置30は、CPUl0に対し内部レジスタの
読出し、プログラム操作可能レジスタの匝設定、クロッ
ク制御等の保守パネル制御の機能?有しており、それ全
駆使して第2図に示す70−全実行する。まず障害CP
UI Oの内部状態音読み出−j(処理2010)。次
にCPUl0の再試行不可インディケータ132全チェ
ックし、オンであれば再試行不可能としてシステムダウ
ンに、オフであれば再試行可能と判断して(処理202
0)再試行の制御に入いる。そこでは現在エラー状態に
なっているCPUl0の状態tリセットした(処理20
30 )後処理2010で読み出しているCPUl0の
内部状態のうちプログラム操作可能レジスタの回復會行
う(処理2040 )。その後lクロックずつ再試行制
御全行いながら処理2060〜2100で示されている
ように、再試行途中の内部状態をも読み出す。ここでC
PUl0の内部状態の情報量が多いことが考えられるの
で、そのような場合には処理2050で示すように、エ
ラー検出回路の状態で読み出すべき内部レジスタ全校っ
ておく。例えば、エラー検出が命令制御部のエラー検出
回路からの報告であれば、命令制御部回りのレジスタ全
貌み出しの対象にする。クロックステップがエラー検出
(処理2090)もなく該エラーを起した命令の実行終
了血路れば(処理2100でYの判断)、再試行成功と
なシ、そのときの命令再試行は成功した旨のマークを読
出し情報に付与しく処理2110)障害情報の収集を終
えるとともにクロックを正規にスタートさせその後は回
復1I11」御装置30の処理を介在しない正常運転に
復帰する。
再試行制御中、即ち処理2060〜2100 全実行中
に再びチェック回路によるエラー検出があれば(処理2
090ハそれが予じめ与えられている再試行回数(N)
以内であれば再び処理2030から再試打金やり直す。
もし、再試行回数だけ再試行7行った結果まだエラーが
検出される場合は間欠障害ではないので他の診断手段で
障害処理が行なわれることとなる。
以上の処理中に行われる内部レジスタの読出しデータは
70ツピーデイスクに順編成ファイル形式で順次格納さ
れる。このダンプ情報は障害CPUでの再試行でn回目
(〉1)に成功した場合に。
再試行失敗の場合の内部レジスタダンプ情報と再試行成
功の場合の内部レジスタダンプ情報と全比較することに
よりどの時点でどの個所のダンプデータが異っている等
の情報で故障診断処理うことができる。
本実施例では、命令再実行の制御は全て回復制御装置3
0で行うとしているが、障害CPU自身でリセットし、
プログラム操作可能レジスタの回復全行うとしても容易
に実現できる。
〔発明の効果〕
本発明には障害処理の過程に故障診断を組み込み命令再
試行1行う際に、■ステップづつの内部状態情報全採集
するよう構成することにより、間欠故障に対し有効な診
断情報が採集でき、効率のよい故障診断処理が行なえる
という効果がある。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図、第2図は本
発明の処理内容を示すフローチャートである。 10、令啼・・・・・・、fSCPU、30・・・・・
・回復制御装置、31・・・・−・制御部、111〜1
19・・・・・・プログラム操作可能レジスタ群、12
0・・・・・・エラー報告用イングアエース、121−
・・・・退避用インタフェ−2,122・・・・・・回
復用インク7エース、123゜124.125・・・・
・・制御線、130・・・・・・エラー検出回路群、1
31・・・・・・クロック発振回路、132−・・・・
・命令再試行不可インディケータ、133・・・・・・
インタフェースffdJfil11回L 134・・・
・・・インタフェース信号、135・・・・・・書込み
データバス、136・・・・・・選択レジスタ、137
・・・・・・読込みデータバス、138・・・・・・選
択制御ゲート群、139・・・・・・データレジスタ、
140・・・・・・選択制御ゲート群、151〜159
・・・・・・プログラム操作不可内部レジスタ群。

Claims (1)

  1. 【特許請求の範囲】 命令全実行中に発生した論理装置の故障通知に応答して
    前記命令の実行全停止させる命令実行停と手段と。 前記命令実行停止に応答して前記論理装置の内部状態情
    報を収集する第1の内部状態情報収集手段と。 前記停屯された命令の再実行ができるか否か全表示する
    命令再実行可否表示手段と。 前記命令再実行可否表示手段の表示が再実行可能である
    場合に前記故障通知に応答して前記第1の内部状態情報
    収集手段によシ収集された内部状態情報に対しして前記
    論理装置の前記命令の再実行を1クロツクステツプづつ
    実行する命令再実行手段と。 前記命令再実行の1クロツクステツプ毎に前記論理装置
    の内部状態情報を収集する第2の内部状態情報収集手段
    と’を含むことを特徴とする論理装置の故障診断処理方
    式。
JP58168705A 1983-09-13 1983-09-13 論理装置の故障診断処理方式 Pending JPS6061838A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58168705A JPS6061838A (ja) 1983-09-13 1983-09-13 論理装置の故障診断処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58168705A JPS6061838A (ja) 1983-09-13 1983-09-13 論理装置の故障診断処理方式

Publications (1)

Publication Number Publication Date
JPS6061838A true JPS6061838A (ja) 1985-04-09

Family

ID=15872918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58168705A Pending JPS6061838A (ja) 1983-09-13 1983-09-13 論理装置の故障診断処理方式

Country Status (1)

Country Link
JP (1) JPS6061838A (ja)

Similar Documents

Publication Publication Date Title
US5948112A (en) Method and apparatus for recovering from software faults
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US5056091A (en) Method for handling errors detected in a computer system
KR100319852B1 (ko) 장애복구기능을갖는컴퓨터시스템및그방법
JPS6061838A (ja) 論理装置の故障診断処理方式
JPS6061839A (ja) 論理装置の故障診断処理方式
JP3357777B2 (ja) プログラム制御システム
JPH1115661A (ja) Cpuの自己診断方法
JPS6229820B2 (ja)
JP3381756B2 (ja) 並列プロセッサシステム
JP2679575B2 (ja) 入出力チャネルの障害処理システム
JPS6156537B2 (ja)
KR19990057809A (ko) 오류 방지 시스템
JP2713250B2 (ja) Cpu保守システム
JPS592585Y2 (ja) デ−タ処理装置
JPS5847465Y2 (ja) エラ−検出保持装置
JPS5849900B2 (ja) Ipl時の診断方式
JPS6130303B2 (ja)
JPS6111855A (ja) デ−タ処理装置の機能診断方式
JPH01116840A (ja) 診断異常通知方式
JPS5837583B2 (ja) 情報処理装置
JPS6074052A (ja) ヒストリ・メモリ制御方式
JPS61160156A (ja) プロセツサの障害検出方式
JPS62113241A (ja) 障害回復装置
JPS6252639A (ja) マイクロプロセツサシステムのセルフチエツク方式