JPH03265950A - 制御記憶1ビットエラー処理方式 - Google Patents

制御記憶1ビットエラー処理方式

Info

Publication number
JPH03265950A
JPH03265950A JP2066463A JP6646390A JPH03265950A JP H03265950 A JPH03265950 A JP H03265950A JP 2066463 A JP2066463 A JP 2066463A JP 6646390 A JP6646390 A JP 6646390A JP H03265950 A JPH03265950 A JP H03265950A
Authority
JP
Japan
Prior art keywords
error
bit error
memory
bit
information generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2066463A
Other languages
English (en)
Inventor
Shozo Iida
飯田 昌三
Kenji Yahiro
八尋 健次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Engineering Ltd
Original Assignee
NEC Corp
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Engineering Ltd filed Critical NEC Corp
Priority to JP2066463A priority Critical patent/JPH03265950A/ja
Publication of JPH03265950A publication Critical patent/JPH03265950A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は制御記憶(以下rcsJという」〉1ビット工
ラー処理方式に関し、特にC5Iビットエラーが固定的
なものか間欠的なものかを識別し、その結果によってプ
ログラム制御装置の制御を決定するC81ビットエラー
処理方式に関する。
〔従来の技術〕
従来、この種のCSIビットエラー処理方式としては、
次のようなものがある。第1に、C3Iビットエラーを
検出したとき、エラー訂正をマイクロ命令を読み出すレ
ジスタ上で行いメモリ内は書き替えない方式、第2に、
CSIビットエラーを検出したとき、常にメモリ内部の
エラー訂正書込みを行う方式、第3に、プログラム制御
装置が1ビットエラーを検出したとき、常にメモリ内部
のエラー訂正書込みを行うと共にCSエラー発生回数を
カウントし、更にCSエラーを1回検出した時点から一
定時間経過した後にCSエラーの発生回数を確認してそ
のカウント値によって1ビットエラーが固定障害か間欠
障害かを判別する方式特に第3の方式では、常にメモリ
上のエラー訂正書込みを行っているので、間欠障害なら
ばプログラム制御装置が1ビットエラーを1回検出して
からCSエラー発生回数を確認するまでの間に1ビット
エラーが複数回発生することはないという前提で固定/
間欠障害の判別を行っている。従って、CSエラー発生
回数を確認したときの値が“1”ならば間欠障害、カウ
ント値が2以上ならば固定障害と判断し、固定障害のと
きは性能低下を防ぐ為にプログラム制御装置をシステム
から切離している。
〔発明が解決しようとする課題〕
上述した従来のOSエラー処理方式には、次のような欠
点がある。
第1の方式は、マイクロ命令を読み出すレジスタ上での
みエラー訂正を行い、メモリ上は訂正書込みを行わない
為、ソフトエラーのような間欠障害が1回発生しただけ
で、永久にCSエラーを検出し続ける。また、1ビット
エラーが発生したマイクロ命令を実行するとき、エラー
訂正を行う為に通常の3倍程度の時間を要し、プログラ
ム制御装置の性能が低下する。
第2の方式は、CSエラーを検出したときは常にメモリ
上で書込みを行うので、ソフトエラーのような間欠障害
は1回検出した後訂正できるが、メモリの固定障害が発
生したときは、1ビットエラーの出現したマイクロ命令
の実行時間が通常の15倍程度かかり、第1の方式より
大きな性能低下となる。
第3の方式は、プログラム制御装置が1ビットエラーを
1回検出してから一定時間経過後CSエラー発生回数を
確認したとき、そのカウント値により1ビットエラーが
固定障害か間欠障害かを判別するようになっているが、
間欠障害の中にも、金属片がメモリチップに接触したこ
とにより発生する障害、及び、マイクロ命令読出しレジ
スタの間欠障害のように、障害が数百ms程度継続し、
1回のメモリ訂正書込みだけでは後口しない障害がある
。従って、上記のような間欠障害と固定障害とは判別で
きないなどという欠点がある。
〔課題を解決するための手段〕
本発明のC81ビットエラー処理方式は、マイクロ命令
を構成するビットの中の1ビットが反転したことを検出
及び訂正できるエラー訂正コードを含む複数の前記マイ
クロ命令から成るマイクロプログラムによる制御で作動
し、該マイクロプログラムを格納するメモリを有する情
報処理装置において、 実行中のマイクロ命令の1ビットエラーを検出および訂
正する手段と、エラー訂正したマイクロ命令で前記メモ
リ中のマイクロ命令を書き替える書込み手段と、1ビッ
トエラーの発生回数をカウントし、その結果を保持する
エラー情報生成手段と、一定時間経過したときタイムア
ウトするタイマ手段と、前記書き込み手段を有効或いは
無効にする書込み制御手段と、前記エラー情報生成手段
を有効或いは無効にするエラー処理制御手段とを具備し
、前記1ビットエラーを検出したとき前記書き込み手段
と前記エラー情報生成手段とを無効にし、一定時間経過
した後で再び前記書き込み手段と前記エラー情報生成手
段を有効にして構成される。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例の構成を示すブロック図であ
る。
101はエラー訂正コード付きのマイクロプログラムを
格納するCSメモリ、102はCSレジスタ103と割
込割出制御部105からのデータに従ってCSメモリ1
01のアドレスを生成するアドレス制御部、103はC
Sメモリから読み出したマイクロ命令を保持するCSレ
ジスタ、104はマイクロ命令の1ビットエラーを検出
及び訂正する機能をもちエラーを検出したとき割込割出
制御部105へその旨を報告すると同時にCSメモリに
ライトパルスを送出するエラー検出及訂正回路、114
はCSメモリ101からの読出し命令とエラー検出及訂
正回路104からの1ビットエラー訂正後のマイクロ命
令とをエラー検出及訂正回路104からの選択信号に従
って選択するセレクタ、105はエラー検出及び訂正回
路104からの1ビットエラー検出通知信号や割出し抑
止信号等によりマイクロプログラム内のルーチンの割出
し制御と他のユニットからの割込とを制御する割込割出
制御部、106は1ビットエラー情報収集ルーチンの割
出しを抑止する割出し抑止フリップフロップ回路(以下
、71717071回路をF/Fという)、107はC
Sレジスタ103の内容をCSメモリ101へ書込むこ
とを有効にする書込み可能F/F、108は1ビットエ
ラー情報の生成を行うエラー情報生成部、〕09はC8
1ビットエラーを検出したことをサービスプロセッサに
通知する通信制御部、110は通信制御部109からの
1ビットエラー検出通知を受信したときエラー情報生成
部108から1ビットエラー情報を取り込みカウント値
をカウント値判別部112へ送出したり割出抑止F/F
 106を有効または無効にしたりタイマ制御部111
を起動したりするエラー制御部、111はタイマが起動
された後一定時間の経過でタイムアウトをエラー制御部
110に通知するタイマ制御部、112はエラー制御部
110から受信したカウント値を判別してそのカウント
値により割出抑止F/F 106のリセット及びシステ
ム構成制御部への装置切離し指示を行うカウント値判別
部、113はカウント値判別部112からの装置切離し
指示を実行するシステム構成制御部である。
次に、本発明を実現するときの動作を第1図。
第2図を参照して詳細に説明する。ここで、第2図はC
SIビットエラー処理を行うときのプログラム制御装置
及びサービスプロセッサの動作を表すフローチャートで
ある。
CSメモリ101から読みだしたマイクロ命令の1ビッ
トエラーをエラー検出及び訂正回路104が検出したと
きくステップ10〉、セレクタ114にエラー検出及訂
正回路104側の入力を選択するようにしてエラーを訂
正したマイクロ命令をCSレジスタ103にセットし、
エラーを検出したことを割込割出制御部105に通知す
ると同時に、CSメモリ101に対してライトパルスを
送出する。そして、エラー訂正されたマイクロ命令は、
CSレジスタ103からCSメモリ101に書込まれる
。このとき、書込可能F/F 107は初期値“1”と
なっている。
割込割出し制御部105は、エラー検出通知を受けると
マイクロプログラム内の1ビットエラー処理ルーチンを
割出すようにアドレス制御部102に指示し、アドレス
制御部102は1ビットエラー処理ルーチンの開始アド
レスを生成する。1ビットエラー処理ルーチンが割出さ
れると、まず書込み可能F/F 107をリセットしく
ステップ11)、エラー情報を収集してエラー情報生成
部108に格納する。このとき、エラー情報生成部10
8はエラー発生回数(カウント値)を+1する(ステッ
プ12)。以上の1ビットエラー処理が終了すると、通
信制御部109を起動してエラー制御部110に1ビッ
トエラー検出を通知する(ステップ13)。
1ビットエラーの通知を受信したサービスプロセッサは
、エラー制御部109によりタイマ制御部111のタイ
マが有効(作動中)か否かを調べ(ステップ14)、そ
の結果に従って次の処理を決定する。タイマが無効であ
るときの次の処理を第1次1ビットエラー処理と称し、
タイマが有効であるときの次の処理を第2次1ビットエ
ラー処理と称する。
まず、第1次1ビットエラー処理から説明する。
エラー制御部110はタイマが無効であることを確認す
ると、割出抑止F/F 106をセットする(ステップ
15)。これにより・以降エラー検出及訂正回路104
が1ビットエラーを検出しても、割込割出制御部105
は1ビットエラー処理ルーチンを割出さないようにする
。次にエラー制御部110は、エラー情報生成部108
からエラー情報を取り込む(ステップ17)と共にカウ
ント値を“0”クリアしくステップ16)、1秒間の待
ち合わせを行う(ステップ18)。1ビットエラーの原
因がCSメモリのハードウェア上の間欠障害或いはCS
レジスタ103周りの間欠障害である場合、一般的に1
ビットエラーは数百ms継続するので、上記1秒間の待
合せは、この間欠障害が直るまで1ビットエラー処理ル
ーチンの割出を抑止することにより、プログラム制御装
置の性能低下を防いでいる。
上記1秒間の待合わせが終了するとエラー制御部110
は割出抑止F/F 106をリセットして(ステップ1
9)、タイマ制御部111にタイマ起動指示をする(ス
テップ20)6本タイマは1秒程でタイムアウトする様
に設定する。割出抑止F/F 106がリセットされる
と割込割出制御部105は、1ビットエラー回復ルーチ
ンを割出し書込み可能F/F 107をセットする(ス
テップ21)。
次に第2次1ビットエラー処理を説明する。
第2次1ビットエラー処理は、第1次1ビットエラーを
起動した1ビットエラーが、CSメモリ101への1回
の訂正書き込みで回復するようなソフトエラーではなく
、CSメモリ101のハードウェア上の固定/間欠障害
によるものであるときに起動される。CSメモリ101
の固定/間欠障害による1ビットエラーは第1次1ビッ
トエラー処理終了後1秒以内に再び検出されるはずであ
り、上記1ビットエラー検出がエラー制御部110に通
知されると(ステップ13)、エラー制御部110はタ
イマを調べる(ステップ14)。
そして、タイマが有効であることを確認すること割出抑
止F/F 106をセットする(ステップ22)。次に
エラー制御部110はエラー情報生成部108からエラ
ー情報を採取する(ステップ24)と共にエラー情報主
成部108内のカウント値を°゛O′°O′°クリアッ
プ23)、カウント値をカウント値判別部112に送出
する。カウント値判別部112はカウント値を調べくス
テップ25)、カウント値が1”ならば、第1次1ビッ
トエラー処理の訂正書き込みだけでは回復できなかった
CSメモリ間欠障害による1ビットエラーと判断し、割
出抑止F/F 106をリセットして(ステップ26)
第2次1ビットエラー処理を終了する。割出抑止F/F
 106がリセットされると、割込割出制御部105は
1ビットエラー回復ルーチンを割出し、書込み可能F/
F 107をセットする〈ステップ27)。また、カウ
ント値が2以上ならばCSメモリ固定障害による1ビッ
トエラーと判断してくステップ25)プログラム制御装
置をシステムから切離すくステップ28)。
〔発明の効果〕
以上説明したように本発明は、プログラム制御装置にお
いて、C81ビットエラーを検出したとき、−度訂正書
込みを行った後、一定時間内に再び1ビットエラーが発
生した場合、エラー発生回数を調べて、その値により上
記1ビットエラーの原因が固定障害か或は間欠障害かを
判別することにより、次の効果がある。
第1に、ソフトエラーのように一度の訂正書込みで回復
するエラーに対しては、常に訂正しか行わない方式で問
題となるプログラム装置の性能低下を防ぐことができる
第2に、CSメモリの固定障害が発生したときに、常に
訂正書き込みを行う方式で問題となるプログラム装置の
性能低下を防ぐことができる。
第3に、従来技術では固定障害と数百ms間継続する間
欠障害とを識別することができなかった為、訂正できる
エラーは極力救済するという思想から、CSメモリの固
定障害を起こしたプログラム制御装置でもシステムから
簡単に切離すことができなかったが、本発明により固定
障害に限ってシステムから切離すことができる。システ
ムから切離すことによる効果を入出力処理装置を例にあ
げて説明する。入出力処理装置の場合、データチエイン
処理に対して高い性能が要求されるので、CSメモリの
固定障害により性能が低下するとデータオーバランが発
生しやすくなる。主記憶から入出力装置へのライト転送
中にデータオーバランが発生すると媒体へのデータ書込
みが中断される為に、CPUがその入出力回路(Ilo
)をリトライする必要が生じ、システム全体の性能低下
につながる。また、データ書き込み中断が後にデータ化
けになる恐れもある。従って、2台以上の入出力処理装
置が構成されているシステムにおいて、入出力処理装置
のCSメモリに固定障害が発生したときには、その入出
力処理装置をシステムから切離した方が安全である。
101・・・CSメモリ、102・・・アドレス制御部
、103・・・CSレジスタ、104・・・エラー検出
及び訂正回路、105・・・割込割出制御部、106・
・・割出抑止F/F、107・・・書込可能F/F、1
08・・・エラー情報生成部、109・・・通信制御部
、110・・・エラー制御部、111・・・タイマ制御
部、112・・・カウント値判別部、113・・・シス
テム構成制御部、114・・・セレクタ。

Claims (1)

  1. 【特許請求の範囲】 マイクロ命令を構成するビットの中の1ビットが反転し
    たことを検出及び訂正できるエラー訂正コードを含む複
    数の前記マイクロ命令から成るマイクロプログラムによ
    る制御で作動し、該マイクロプログラムを格納するメモ
    リを有する情報処理装置において、 実行中のマイクロ命令の1ビットエラーを検出および訂
    正する手段と、エラー訂正したマイクロ命令で前記メモ
    リ中のマイクロ命令を書き替える書き込み手段と、1ビ
    ットエラーの発生回数をカウントし、その結果を保持す
    るエラー情報生成手段と、一定時間経過したときタイム
    アウトするタイマ手段と、前記書き込み手段を有効或い
    は無効にする書き込み制御手段と、前記エラー情報生成
    手段を有効或いは無効にするエラー処理制御手段とを具
    備し、前記1ビットエラーを検出したとき前記書込み手
    段と前記エラー情報生成手段とを無効にし、一定時間経
    過した後で再び前記書込み手段と前記エラー情報生成手
    段を有効にして成ることを特徴とする制御記憶1ビット
    エラー処理方式。
JP2066463A 1990-03-15 1990-03-15 制御記憶1ビットエラー処理方式 Pending JPH03265950A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2066463A JPH03265950A (ja) 1990-03-15 1990-03-15 制御記憶1ビットエラー処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2066463A JPH03265950A (ja) 1990-03-15 1990-03-15 制御記憶1ビットエラー処理方式

Publications (1)

Publication Number Publication Date
JPH03265950A true JPH03265950A (ja) 1991-11-27

Family

ID=13316498

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2066463A Pending JPH03265950A (ja) 1990-03-15 1990-03-15 制御記憶1ビットエラー処理方式

Country Status (1)

Country Link
JP (1) JPH03265950A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009175791A (ja) * 2008-01-21 2009-08-06 Nec Corp メモリ判定システム、メモリ判定方法およびメモリ判定プログラム
JP2017045168A (ja) * 2015-08-25 2017-03-02 Necプラットフォームズ株式会社 障害処理装置、システム、障害管理装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009175791A (ja) * 2008-01-21 2009-08-06 Nec Corp メモリ判定システム、メモリ判定方法およびメモリ判定プログラム
JP2017045168A (ja) * 2015-08-25 2017-03-02 Necプラットフォームズ株式会社 障害処理装置、システム、障害管理装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
US5274646A (en) Excessive error correction control
US6393582B1 (en) Error self-checking and recovery using lock-step processor pair architecture
EP0479230B1 (en) Recovery method and apparatus for a pipelined processing unit of a multiprocessor system
US5214652A (en) Alternate processor continuation of task of failed processor
EP0032957B1 (en) Information processing system for error processing, and error processing method
US6823476B2 (en) Mechanism to improve fault isolation and diagnosis in computers
JP2770913B2 (ja) パリティの置換装置及び方法
JPH03265950A (ja) 制御記憶1ビットエラー処理方式
US5898867A (en) Hierarchical memory system for microcode and means for correcting errors in the microcode
JPH08263453A (ja) データ障害処理装置
JPH02135533A (ja) 障害処理方式
JPH0135369B2 (ja)
JPH07219796A (ja) 情報処理装置
SU615478A1 (ru) Устройство дл выборки микрокоманд
JPH03191451A (ja) エラー訂正方式
JPH0365743A (ja) 主記憶装置の故障発見方法
JPH0218506B2 (ja)
JPH04255032A (ja) 制御記憶装置のエラー訂正方式
JPH02285428A (ja) 制御記憶回復処理方式
JPH06149602A (ja) 演算処理装置
JPH01133147A (ja) データ処理装置
JPS6142033A (ja) 情報処理装置
JPS6282436A (ja) 情報処理装置
JPS63101947A (ja) エラ−処理方式
JPS59117643A (ja) マシン・チエツク割込み処理方式