JPH0218627A - データ処理システム - Google Patents

データ処理システム

Info

Publication number
JPH0218627A
JPH0218627A JP1099050A JP9905089A JPH0218627A JP H0218627 A JPH0218627 A JP H0218627A JP 1099050 A JP1099050 A JP 1099050A JP 9905089 A JP9905089 A JP 9905089A JP H0218627 A JPH0218627 A JP H0218627A
Authority
JP
Japan
Prior art keywords
error
signal
level
clock
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1099050A
Other languages
English (en)
Inventor
Thomas James Roche
トーマス・ジエームズ・ロチエ
Gregory S Still
グレゴリイ・スコツト・ステイル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0218627A publication Critical patent/JPH0218627A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/10Distribution of clock signals, e.g. skew
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明ハ、フロセッサ・システム・ユニットで検出され
た誤りに応してプロセッサ・システムを停止する装置と
方法に関する。具体的には、本発明は、1群のユニット
からなり、それらのユニ・ソ1・の1つに発生ずる誤り
によってそれらの動作の保全性が影響を受ける、プロセ
ッサ区画のクロックを選択的に停止することに関する。
B、従来技術及びその問題点 従来技術では、第2図で表わされるモジュール式構成を
もつプロセッサが、論理カード12−1ないし12−n
を挿入するコネクタ機構(図示せず)を担持する背面板
10を含む。論理カードは背面板10上の背面配線によ
って相互接続されている。
第2図の回路板の機能的レイアウトを第3図に参照番号
12−1及び12−2で示す。それらは第2図の同じ番
号の回路板に対応し、第2図の他の回路板を一般的に代
表する。第3図の回路板は、回路板12−1上のユニッ
ト・モジュールM1、M2、M3と回路板12−2上の
モジュールM1”、M2”、M3′を含む。回路板12
−1j二のモジュールは必ずしも回路板12−2」−の
モジュールと機能的に等価である必要はない。たとえば
、12−1ではそのモジュールをスカラー処理構成を形
成するように配列して接続し、回路板12−2のモンユ
ールはヘクトル・プロセッサを構成するように配列する
ことができる。回路板12−1及び12−21のモジュ
ールは、それぞれクロック生成回路(CG)i4−1及
び14−2からクロック信号か供給されるときにたけ動
作する。各クロック生成回路は、クロック発振器25に
よって生成され信号線25−1及び25−2上に分配さ
れるシステム発振器信号から局所クロックを誘導する。
生成されたクロック信号は、それぞれ信号線16−1及
び16−2に供給される。
クロック信号を供給されないと、モジュールは動作しな
い。モジュール動作誤りを検出するために、誤り指示回
路18−1と18−2か、それぞれ回路板12−1及び
12−2のモジュールに接続されている。誤り指示回路
18−1と18−2はあらゆる点で従来通りであり、そ
れぞれが接続された各モジュールからの誤り指示を集め
て転送するのに使用される。指示回路18−1と18−
2は、それぞれに接続された各モジュールからの誤り指
示に応答して、それぞれ信号線20−1及び20−2上
に誤りがあることを示す誤り信号と、NORゲート23
に対応するゲート回路に到る信号線22−1と22−2
上に停止信号があることを示す誤り信号の2つの誤り信
号を供給する。回路板モジュールの1つから誤り指示を
受は取ると、それに関連する誤り指示器はその停止信号
を高レベルにして、NORゲートの出力を非活動状態に
させる。NORゲート出力は、クロック生成回路14−
1と14−2のそれぞれに供給されるクロック・ゲート
信号に相当する。非活動状態のクロック・ゲート信号は
、クロック生成回路がクロック信号を生成して、それに
接続されたモジュールにそれらの信号を転送するのを妨
げる。支援プロセッサ20が線20−1及び20−2上
で受は取った誤り指示信号に応じて誤り検出・訂正処理
を実行する間に、モジュールからクロック信号が除去さ
れると、それらのモジュールは動作しなくなる。誤り訂
正処理がうまく完了したと仮定すると、支援プロセッサ
は停止信号とIND信号をリセットし、クロック・ゲー
トを活動化させる。その結果、クロック生成回路14−
1と14−2は、可びクロック信号を供給してモジュー
ルを動作させることができる。
第3図のクロック停止装置及び停止手順は、第2図のプ
ロセッサのすへてのカードについて実施される。ずなわ
ぢ、カードの]枚で誤りが検出されると、支援プロセッ
サ20の誤り訂正手順が終了するまて、すべてのカード
上のクロックが停止される。当然のことながら、1枚の
カードの機能動作で発生した誤りは他のカードに伝播し
、または他のカードで誤りを引き起こすことがあるが、
こうした誤りが他のすべてのカードに伝播するというの
は、必ずしも常に真実ではない。他の部分か誤って機能
している間でも、プロセッサの重要な部分か良好に動作
し続けることがある。さらに、1枚のカードの動作の誤
りが、他の1枚のカードにしか影響を及ぼさないことが
ある。たとえば、ベクトル・プロセッサ実行における誤
りは、関連するスカラー・プロセッサの動作にしか影響
を及ぼさない。しかし、メモリ・カードの故障は、メモ
リ・カードへのアクセスを必要とする処理を行なう他の
多数のカードに影響を及ぼしかねない。
第2図のモジュール式構成のプロセッサでの誤りの検出
に対する条件付き応答は、そのカードの1って誤りが検
出されても、プロセッサの継続する、品質の低下した動
作をサポートする。適切な応答は、他の影響を受けない
ユニットの動作を中断させずに、誤りを生じたユニット
及びこのユニットによって動作が影響を受ける他のユニ
ットの動作だけを中断させることができる。
C9問題点を解決するための手段 本発明の装置は、あるユニットの誤りのある動作の検出
に応じて、誤りのあるユニット用のクロック、及びその
ユニットの動作によって動作が影響を受けやすい1群の
ユニットから構成される区画内のユニット用のクロック
を停止する条件付きクロック停止を行なう。停止された
ユニットに関して誤り分析・訂正手順が行なわれている
間、その区画内にないユニット用のクロックは停止され
ず、それらのユニットは動作を継続できる。
あるユニットの誤りが他のユニットの動作にはほとんと
あるいは全く影響を及ぼさないことがあり得ることを考
慮して、本発明は、誤りを生じたユニット中のクロック
だけを停止する局所的クロック介入もサポートする。
最後に、本発明の実施は、誤りが発生してもシステムの
他の部分にほとんど影響を及ぼさず、動作の中断なしに
その誤りから回復できる、プロセッサの領域があるこき
を考慮している。
本発明の主な利点は、複数のユニットを停止しなければ
ならない誤りが検出されたときにプロセッサのある区画
に対するクロック介入を可能にする、マシン動作中の誤
り状態の発生に対する条件付き応答を提供することであ
る。
本発明の他の利点は、残りのプロセッサ・ユニットに影
響を及ぼさずに、誤りに応じて単一ユニットの動作を適
時に停止することである。
区画を限定した介入が行なわれるときの本発明の利点は
、影響を受ける区画のユニットすべてに対するクロック
停止が同期されることである。
最後に、単一ユニットのクロック停止が必要なときの本
発明の利点は、そのユニット用のクロックを迅速に一時
停止することである。
図面を参照しながら以下の詳細な説明を読むと、本発明
のより広い応用範囲が明らかになるはすである。ただし
、当然のことながら、以下に示す詳細な説明及び具体的
な例は、本発明の好ましい実施例を示しているが、それ
を例示するためのものにすぎず、本発明の範囲内での様
々な改良、変更及び修正は当業者にとって自明である。
D、実施例 プロセッサ誤り検査装置に関する記載は、米国特許第4
464751号に出ている。この特許の内容を引用によ
り本明細書に組み込む。
以下の説明で、用語「ユニット」は、用語「カード」と
同じ意味であり、両方とも、第2図のカード12−1な
いし12−nの任意のものによって例示されるモジュー
ル式要素を指す。さらに、この説明中のユニットまたは
カードは、共同してユニット機能を実行するように相互
接続されたモジュールの捕要素を含むものとする。さら
に、あるユニットまたはカード」二のモジュールは、ク
ロック信号を供給されると作動可能となり、これらのク
ロック信号の停止によりそれらの動作が中断できるもの
とする。各ユニットはさらに、あるユニット上のいくつ
かのモジュール誤り状態を明示できる複数の誤り信号を
供給する、誤り検出・指示装置を含むものと仮定する。
本発明では、誤りの第1のクラスを「レベル1(LL)
Jの誤りと定義する。レベル1の誤りは、それに応じで
ある複数ユニット区画が同時に停止しなければならない
、誤りのクラスである。この誤りレベル分類では、サブ
システム中の複数のカードを一緒に停止させて再起動の
ためにそれらの間の同期を維持しなければならない、プ
ロセッサの領域で発生する誤りに何州である。たとえば
、パイプライン式構造を利用するプロセッサでは、ある
時点で多数の命令が実行中なので、複数のユニットを停
止させる必要がある。パイプラインを凍結することは、
誤りの分析とそれからの回復にとって不可欠である。
誤りの第2のクラスを、「レベル2 (L2) Jと定
義する。このタイプの誤りは、検出ユニットだけをでき
るだけ速く停止させる。この誤りレベル分類は、処理が
停止されても、さらには休止状態または中断状態に入っ
た場合でも、マシンの残りの部分で実行中の処理に干渉
したり邪魔したりしない、プロセッサの領域で使用され
る。この誤りレベル分類は、逐次処理を扱うが、モジュ
ール境界を越えてクロック信号によってもたらされる同
期に大きく依存する処理システム・ユニットで有用であ
る。ユニットのすべてのモジュールがレベル2の誤りに
応じて同期して中断されることが好ましい。そうすると
、ユニットの状態は誤り発生時の状態と厳密に合致する
ので、回復の可能性が高まる。以下の説明で、Ll誤り
とL2誤りは、元来排他的ではない。誤りを生成するユ
ニットは、L1中断動作の進行中に、L2レベルでその
動作を中断できることが好ましい。
最後に、[レベル3 (L3)Jの誤りは、プロセッサ
のどこにもクロック介入を必要としないタイプの誤りで
ある。これらの誤りの訂正は、ハードウェア、機能マイ
クロコード、または支援プロセッサ誤り訂正/回復コー
ドによって処理されるものと仮定する。このレベルの誤
りに応答して必要となるクロック停止は、訂正処理に委
ねられている。
第1図は、高い抽象度で本発明を示したものである。本
発明は複数の同一のユニット・レベル要素を含み、各要
素は第2図に示したものなどモジュール化プロセッサの
各カード上に配置されている。ユニット・レベル要素は
すへて、誤り指示を監視し、本発明による適切な区画ク
ロック停止を開始する1次レベル要素に接続されている
第1図で、2枚のカード30と40は、同じユニット・
レベルの第2のクロックm持(SECMA I NT)
装置31と41を担持している。ユニット31と41は
2個以上のこうしたユニット・レベルS E CMA 
I NT表装置表わす。カード30では、複数のモジュ
ール32が、カード誤り検査収集(CECL)要素33
に接続された誤り信号線をもつ。CECL要素33は、
それらのモジュールから誤り指示信号を収集し、カード
・レベル検出・記録(CLDR)回路35に送る。CE
CL要素33からの誤り指示の受取りに基づいて、CL
D、R回路35は誤りを、レベル1(LL)、レベル2
 (L2)またはレベル3 (L3)として分類して、
信号線35−1ないし35−3上に対応する信号を出力
する。これらの信号はすべてカード誤り通信収集回路(
CCOMlGOLL)36に送られる。収集回路36は
、回路35から受は取ったレベル分類信号LL、L2及
びL3を回路線36−1を介して送る。さらに、Lルベ
ル分類信号は順方向に送られるが、L2信号は線35−
2を介してゲート・クロック生成回路(CKGEN)3
7に送り戻される。クロック生成回路37は、カード実
行ゲート信号に応答して、(以下に詳しく説明する)1
対のクロック信号を各カード・モジュールに供給する。
クロック生成回路37は、L22レベル類信号(L2 
 検査停止信号)の供給に応じて、モジュールへのクロ
ック信号の供給を停止する。すなわち、カード30上で
SECMAINTユニット31がL22レベル類信号を
検出すると、カード30上のモジュールに供給されるク
ロック信号が中断される。
第1図を検討するとわかるように、カード40のS E
 CMA I NT回路41はカード30について今説
明したものと同じである。すなわち、カード40は、L
l、L2及びL3信号を生成することにより、カード4
0上のモジュール42が指示する誤りを分類できるよう
にする誤り分類能力をもつ。さらに、カード40上のモ
ジュール42の動作は、L2信号が生成されるときモジ
ュールに供給されるクロック信号の中断によって中断さ
れる。
第1図の1次クロック維持(CLKMAINT)要素5
0を考慮すると、カード区画(CPART)回路54が
接続されているマシン検査収集(MCHKCOL)要素
52により、カード・レベルSECMA INTユニッ
トから出力されたL1信号がすべて収集され監視される
。カード区画回路54は、複数の区画信号を供給する。
カード区画回路54から供給される区画信号は、それぞ
れ1つまたは複数のユニットのグループから成る区画に
対応しそれを指示する。それらのユニットの動作は、そ
の区画の任意のユニットからのL1信号に応答して同期
して停止される。当該のプロセッサ・カードからのL1
信号の受取りに基づいて、マシン検査収集回路52は、
受は取った特定のL1信号に応答して同期して動作が停
止されるカードのグループを表わす区画信号を選択する
カード実行ゲート(CRNGT)回路56は、マシン検
査収集回路52の出力を受は取るように接続されている
。第1図の装置が初期化されると、カード実行ゲート回
路56は、複数のカード実行ゲート信号を連続して通過
させるように条件付けられる。2つのカード実行ゲート
信号がそれぞれカード30と40に送られる。区画信号
は、マシン検査収集回路52で選択されると、カード実
行ゲート回路56に送られる。カード実行ゲート回路5
6は、区画信号によって表わされるカードに供給される
カード実行ゲート信号を、こうしたカード上のクロック
生成回路の動作を中断する状態に条件付ける。このため
、選択された区画信号で表わされるグループに含まれる
カードの条件によって表わされる処理状態が維持される
誤り信号報告は、1次通信収集回路(PCOMM  C
0LL)58によって行なわれる。回路58は、カード
誤り通信収集回路の出力を収集して、それを割込み信号
の形で転送する。この停止信号は、支援プロセッサ(図
示せず)の誤り検査維持手順を初期化するのに使用され
る。支援プロセッサは、プロセッサの初期化ルーチンを
実行し、CLKMA INT回路から受は取った割込み
信号に応答して誤り分析・訂正手順を行なう。
第4A図ないし第4C図に、本発明の特定の実施例を理
解するのに必要な重要な細部を示す。第4A図は、第1
図の生成回路37と47などのゲーテッド・クロック生
成回路を示す。第4A図のゲーテッド・クロック生成回
路は、本発明が実施されるプロセッサのユニット中の対
応する各要素を表わすものと理解されたい。ゲーテッド
・クロック生成回路及び以下に記載の特定の回路は、レ
ベル敏感走査設計(LSSD)回路に基づいている。
この点に関して、基本回路ユニットは、それぞれLlと
L2として示す2つのラッチ要素を含むシフト・レジス
タ・ラッチ(SRL)である。こうしたSRLの1つが
第4A図に参照番号60で示されている。ボートDとC
は、SRLへのデータ入力及びクロック入力として使用
される。52部分は、L1出力端に内部接続されたデー
タ入力ポートをもち、B入力ポートを使ってそれをクロ
ックする。ラッチ・トリガ設計では、8人力は、本発明
の主タイミング・シーケンスをもたらすトリガ・クロッ
クにも使用される。各SRLは、第4B図に示す2つの
クロック波形C1と02から成るクロック信号を供給さ
れる。データは、c1クロック波形が正のレベル61の
とき、L1ラッチのD入力端に供給され、そのラッチに
入る。このデータはC1の立下り61bでラッチ中に保
持される。
このデータは、C2クロックの立上り62でL2ラッチ
の出力端から得られる。
本発明が利用されるプロセッサの基本的動作サイクル(
マシン・サイクル)は、C2クロックの連続する正の遷
移の間の周期で定義される。本発明を理解するために、
ユニット・モジュールはC1及びC2クロックの供給に
応答して動作するものと仮定する。
次に、第4A図に示し本発明のユニット・レベル要素中
で使用されるゲーテッド・クロック生成回路の説明に移
る。クロック波形生成回路64は、1対の発振器波形0
1と02からそれぞれclと02の波形を形成する。発
振器波形とは、それぞれ第3図の発振器25などのシス
テム・クロック発振器の1次出力及び遅延出力である。
クロック波形C1とC2は、クロック・ゲート65に供
給され、ゲート65は、線66上のゲート信号が正の状
態のとき、ユニットのモジュールにクロックを供給する
。信号線上のゲート信号は、最初、ゲーテッド・クロッ
ク生成回路があるユニットにカード実行ゲート信号を供
給することによって、高レベルにセットされる。カード
実行ゲート信号が高レベルになると(第4B図)、それ
は5RL60によってラッチされて反転され、その正の
形と一緒に反転ANDゲート67aに送られる。第4B
図のA波形で示されるように、ANDゲート67aの出
力は、5RL60の出力が02クロツクの立上り63で
高レベルになるまで、負のレベルをとる。人波形の負レ
ベルのパルスは、反転ANDOR(AOI)ゲート68
の出力に、5RL69がC2遷移63で高レベルになる
まで、正のレベルをとらせる。C2遷移63の後、5R
L60の出力は、第4B図のクロック走行信号で表わさ
れるように、高レベルのままとなる。ゲート65を通し
て01と02波形を送るために信号線66」二に供給さ
れるのがクロック走行信号である。
カード実行ゲート信号が正の状態のままであり、第4A
図のゲーテッド・クロック生成回路が配置されているユ
ニットから供給されるL2検査停止信号が低レベルのま
まである限り、第4C図の波形Cて示されるように、反
転入力ANDゲート67bの出力は負のままとなる。カ
ード実行ゲート信号が低レベルに下がるか、またはL2
検査停止信号が高レベルに上がると、C波形が高レベル
になり、AOIゲート68の出力端で負レベルへの遷移
を引き起こす。これは第4C図の波形Bで示される。ゲ
ート68の出力の負の遷移は、波形Bのレベルが低下し
てから1サイクル後で5RL6θの出力の負レベルへの
遷移として反映される。
これは、第4C図に示されている。第4図では、クロッ
ク走行波形が02クロツク波形の遷移70と同期して負
に向かう遷移を示す。
すなわち、あるユニットに対するカード実行ゲート信号
またはL2M査停止信号の適切な遷移に応じて、そのユ
ニットのモジュールは、それが動作するのに必要なりロ
ック信号を奪われる。その結果、クロックの中断中、モ
ジュールの動作構成とユニットの状態が「凍結」される
本発明では、Lルベル分類信号が発生すると、区画限定
に基づいて、1個または複数のユニットに対するクロッ
クが中断される。L1分類信号は、複数のカード中でク
ロックの停止を要求する。すなわち、誤りを検出して分
類するとき、SECMAINTユニットとCLKMAI
NTユニットの間の論理経路を、2回通過しなければな
らない。
この場合、適切なカード・クロックが停止される前に、
4マシン・サイクルが発生できる。この動作のタイミン
グを第5A図に示す。第5A図で、マシン・サイクル0
 (MCO)の間に誤りが検出され、捕捉信号がマシン
・サイクル1の始めに高レベルになる。捕捉の正の遷移
に応じて、誤りが分類され、L1捕捉信号がサイクル2
の始めに高レベルになる。L1捕捉信号の上昇に応じて
、選択された区画の構成要素すべてに対するカード実行
ゲート信号(CRUNGATE)が、サイクル3の始め
に下降し、その結果、サイクル4の始めに関連するクロ
ック走行信号が下降する。
L2検査停止信号は、誤りを検出するユニットが迅速に
停止しなければならないことを示す。ユニットのSEC
MAINTは、この誤りを分類して、2つのマシン・サ
イクルが経過した後にこの誤りに応答してクロックを停
止するようにクロック制御を実行する。このタイミング
を第5B図に示す。第5B図で、マシン・サイクル0の
間に誤りが検出され、捕捉信号がマシン・サイクル1の
始めに上昇し、その分類後、サイクル2の始めにクロッ
ク走行信号の負の遷移が起こる。
第6図には、第1図のSECMAINT要素31のカー
ド誤り検査収集回路33とカード・レベル検出・報告回
路35をより詳しく示す。カード30上で生成されたす
べての誤り信号は、線ロックアウト・ゲート回路71を
介して捕捉レジスタ(SCAPTURE)72に供給さ
れる。信号線71−1ないし71−nは、それぞれ、S
ECMAINTユニットによってサービスされるユニッ
ト中のn個のモジュール誤り指示回路の1つに接続され
ている。線ロックアウト・ゲート71は、誤り信号線7
1−1ないし71−nのそれぞれから捕捉レジスタ72
に到る明確な経路をもたらす働きをする。誤り信号線7
1−1ないし71−nの1本を介して捕捉レジスタ72
に最初の誤り指示が入力されると、他の誤り信号がその
誤り信号線を介してレジスタに入力されるのを防止する
ため、線ロックアウト・ゲート71にフィードバックさ
れる。2次検査エネーブル(SCHKENBL)レジス
タ73に記憶されたマスク・パターンが、線ロックアウ
ト・ゲート回路71を介して誤り指示をマスクするのに
使用される。そのマスクは、通常のディジタル形式であ
り、レジスタ73の各ビット位置が「1」のとき、線ロ
ックアウト・ゲート71が対応する誤り指示線上で誤り
指示を受は取れるように動作する。マスク位置が「0」
のとき、線ロックアウト・ゲート71は、対応する誤り
指示線を介して誤り指示に応答することを妨げられる。
マシン誤り指示線71−1ないし71−qは、それぞれ
捕捉レジスタ72のビット位置の1つによって監視され
る。レジスタ72は、誤りが発生したことを示す第1の
活動状態の指示を捕捉し保持する。これは、誤り線1本
ごとに行なわれ、最初の誤りが分類されている間に発生
した他の誤り指示が捕捉できる。
捕捉レジスタ72の各ビットは、3つのマスク・レジス
タのうち2つ中に関連ビットをもち、それらのビットは
特定の誤りがどのレベルに分類されるかを示す。これら
のレジスタは、L1マスク74、L2マスク76及びL
23マスク78として示されている。好ましい実施例で
は、捕捉レジスタ72は32ビツト幅で、L1マスク・
レジスタ74、L2マスク・レジスタ7B、L23マス
ク・レジスタ78は、それぞれ24ビツト、24ビツト
、12ビツト幅である。
L1マスク・レジスタ74に記憶されたビット・パター
ンは、従来のディジタル・マスクを含む。
すなわち、そのマスクの特定のビット位置が「1」であ
れば、捕捉レジスタ72のそのビット位置の誤り信号が
レベル1の誤りとして分類され、「0」のときは、その
誤りがレベル1に分類されないことを示す。好ましい実
施例では、L1マスク・レジスタ74は、捕捉レジスタ
72の最上位24ビツトに適用される。L2マスク・レ
ジスタ76中のマスクも、L1マスク・レジスタ74中
のL1マスクと同様に、捕捉レジスタ72の最上位24
ビ・ソト位置をマスクする。このため、捕捉レジスタ7
2で捕捉された誤り指示が、必要に応じてレベル1及び
レベル2のクロック停止を開始することができる。そう
する必要があるのは、たとえば、その誤り訂正方式で、
直列プロセッサとそれに接続されたベクトル・プロセッ
サが、同期して迅速に停止することが必要とされるとき
である。
L23マスク・レジスタ78のL23マスクは、捕捉レ
ジスタ72の最下位12ビツトに対して働き、「1」が
レベル2の誤りを示し「0」がレベル3の誤りを示すと
いう規約に従って、これらのビットをレベル2またはレ
ベル3として分類する。
その結果、捕捉レジスタ72の最下位12ビツトだけを
使ってレベル3が指示でき、36ビツト全部で関連する
誤りをレベル2として分類することがてきる。
捕捉レジスタ72とL1マスク・レジスタ74の出力は
、レベル1検出回路(LEVEL  IDETECT)
80に接続されている。回路80は1ビツトごとにレジ
スタの内容を比較して、捕捉レジスタ72中の任意の誤
り信号がL1マスク・レジスタ74中のL1マスクに応
じてレベル1の誤りとして分類されるかどうか判定する
。捕捉レジスタ72の最上位24ビット位置のあるビッ
トが誤り信号の受取りによってセットされ、そのビット
がL1マスク74の対応するビット位置のセット・ビッ
トによって突き合わされる場合、レベル1検出回路80
はL1信号を出力する。同様に、捕捉レジスタ72、L
2マスク・レジスタ76、及びL23マスク・レジスタ
78の出力は、すべてレベル2検出回路82(LEVE
L  2  DETECT)に接続されている。捕捉レ
ジスタ72中の誤り指示が、レジスタ76または78の
一方の対応するビット位置の対応するL2指示によって
マスクされると、回路82はL2検査停止ビットを出力
する。
上記のように、レジスタ・ビットは、その各7スフ・ビ
ットがL1マスク・レジスタ74中で設定されると、ユ
ニットのL1信号を高レベルにし、その信号が、信号線
35−1を介して、CLKMAINTユニット50(第
1図)のマシン検査収集回路52に送られる。下記で述
べるように、これらの捕捉ビットはまた、禁止レジスタ
83からの対応する禁止信号(INH)と協同して、後
続のレベル2の停止指示がレベル2検出回路82によっ
て認識されることを禁止する。というのは、誤り指示が
L1分類に続くサイクルでレベル2のレベルとして分類
される場合、そのユニットをその区画中の他のユニット
との同期を外して停止させることが可能だからである。
捕捉レジスタ72のレベル2に対してマスクされたビッ
トは、ユニットのゲーテッド・クロック生成回路に送ら
れ、レベル2禁止機能が非活動状態にあるという条件で
、そのユニットを停止する。
レベル2の誤りでは本来的にユニット間で非同期停止が
起こる可能性があるので、このレベルではクロック停止
機能の阻止は行なわれない。レベル2の誤りに応答して
クロックが停止される前の2サイクルの間に後続のレベ
ル1検査が検出されると、このレベル1の誤りの原因が
レベル2の誤りにあったとしても、区画限定されたクロ
ック停止が開始される。これは、その誤りが他のユニッ
ト中に拡散されるのを防止するために行なわれる。
捕捉レジスタ72は、各誤り指示を捕捉して保持するこ
とができるが、誤り発生の順序についての情報は提供し
ない。2次ロツクアウ) (SLOCKOUT)レジス
タ86は、レベル・ロックアウト・ゲーテッド回路84
及びDE検出ロックアウト回路88とあいまって、捕捉
レジスタ72が誤り信号について行なうのと同じ方式で
、誤り状態が存在するかどうか捕捉レジスタ72の出力
を監視することにより、この機能を実行する。しかし、
線ロックアウト回路の場合のように、誤り指示が発生し
たときに各ビット位置をロックする代わりに、任意の位
置で最初の誤りが検出された後、2次ロックアウト・レ
ジスタ86中でグループ・レベル内のすべての位置がブ
ロックされる。この点に関連して、捕捉レジスタ72の
出力は、レベル・ロックアウト・ゲーテッド回路84を
介して2次ロックアウト・レジスタ86に供給される。
次に、2次ロックアウト・レジスタ86の出力は、検出
ロックアウト回路88に送られる。回路88はL1マス
ク・レジスタ74、L2マスク・レジスタ76、及びL
23マスク・レジスタ78の出力も受は取る。最初のク
ロック停止誤り(LlまたはL2として分類される)が
捕捉レジスタ72に入力されると、その誤りは、レベル
・ロックアウト・ゲーテッド回路84を介して2次ロッ
クアウト・レジスタ86の入力に送られる。誤り指示ビ
ットは、検出ロックアウト回路88中で、マスク・レジ
スタ74.76.78のすべてのマスクと比較される。
誤り指示がLlまたはL2マスク中のビットでマスクさ
れるビット位置を占める場合、検出ロックアウト回路8
8は、レベル・ロックアウト・ゲーテッド回路84にロ
ックアウト信号を送って、それがLlまたはL2マスク
中のビットでマスクされた誤り信号をそれ以上供給でき
ないようにする。同様に、L3誤りとして分類される最
初の誤り指示が捕捉レジスタ72に入力されると、2次
ロックアウト・レジスタ86に入り、検出ロックアウト
回路88は、L30ツクを行なって、L3に分類された
誤り指示がそれ以上2次ロックアウト・レジスタ86に
入力できないようにする。すなわち、2次ロックアウト
・レジスタ86は、LlまたはL2誤りとして分類され
た最初の誤り指示と最初の非クロック検査停止(L3誤
り)を捕捉する。これにより、誤り検出・回復手順は、
調査範囲を誤り発生の理由に絞ることができる。
最後に、カード誤り通信収集機能が、検査報告回路90
によって実行される。回路90は、ロックアウト検出回
路88とほぼ同じ方式で動作して、LlまたはL2誤り
及びL3誤りの指示をもたらしクロックを停止させる。
第6図のSECMAINT装置の回路に固有の実施態様
を、1つの誤り指示ビットの場合について第7図に詳し
く示す。第7図の論理は、従来並列に複製されて、好ま
しい実施例では、たとえば36ビツト幅の機能をもたら
す。第7図の回路技術は、やはりSRLに基づく論理を
利用している。
すなわち、すべてのレジスタが並列S RLのアレイか
ら構成される。第7図では、捕捉レジスタ、2次検査エ
ネーブル・レジスタ、L1マスク・レジスタ及びL2マ
スク・レジスタのn番目のセルをそれぞれ72  n1
73  n174  n及び76−nで示しである。一
方、2次ロックアウト・レジスタのn番目のビットは8
6−nで示しである。第7図でAOとして示したゲート
は、2つの並列な複数入力ANDゲートの出力が関連す
るORゲートへのただ2つの入力として接続されている
、周知のAND−ORゲートである。
ここで、誤り指示ビットnが高レベルになって、誤り入
力線nに接続された誤り指示ユニットによって誤り指示
信号が供給されたことを示すものと仮定する。さらに、
L1マスクのビットnが、2次検査エネーブル・レジス
タのn番目のビットとして設定されているものと仮定す
る。この場合、AOゲート70の上方ANDゲートの出
力が上昇して、AO回路70の出力を上昇させる。この
レベルの上昇は、捕捉レジスタ72のセルフ2−nの正
の出力で得られる。この正の出力は、AOゲート70の
ANDゲートにフィードバックされて、後続の誤りがセ
ルフ2−n中にクロックされないようにする。さらに、
捕捉セルフ2−nの正の出力は、ANDゲート100と
24方向ORゲート101を含むゲート組合せ体に送ら
れる。AND10Rゲートの組合せ100と101は、
レベル1検出回路80を表わし、ORゲート101は、
ANDゲート100の他に他の23個のANDゲートの
出力を収集する。捕捉レジスタのn番目のビットに対応
するし1マスク・ビットが設定された場合、ANDゲー
)100が上昇したとき、捕捉セルフ2−nの出力は活
動状態になる。これにより、基本的にn番目の誤り指示
がレベル1の誤りとして分類され、それがL1信号とし
てORゲート101を介して送られる。同様に、捕捉レ
ジスタのn番目のセルに対応するL2マスクが設定され
た場合、ANDゲート110の出力が上昇して、36方
向NOR(N)ゲート111の出力を下降させ、適切な
極性のレベル2検出停止信号を供給してクロック信号の
供給を停止させる。NORゲート111、ANDゲート
110及び他の35個のANDゲートは、第6図のレベ
ル2検出回路82を含む。
回路84中のレベル・ロックアウト・ゲートは、AOア
ゲート20によって表わされる。AOアゲート20は、
その出力が2次ロックアウト・レジスタ86のn番目の
セルの入力端に接続されている。n番目の誤り指示線上
で誤り信号が肯定されて、捕捉セルフ2−nの出力を上
昇させると、AOアゲ−120の出力が上昇する。この
上昇する出力は、2次ロックアウト・セル86−nを介
してクロックされる。このセルの出力は、AOアゲート
20を介してフィードバックされる。AOアゲート20
は、捕捉セルフ2−nの出力のその後の変化に応答して
、セルを「ロツクコする。2次ロックアウト・セル中に
ロックされた誤り指示は、ORゲート122とANDゲ
ート123と24方向ORゲート124の組合せを介し
て、レベル1/レベル20ツクアウトとして分類される
。同様に、ANDゲート126と12方向ORゲート1
27は、L23マスクの対応するビットが「0」の場合
に、そのロックアウトをレベル30ツクアウトとして分
類する。この“O“°のビットは、反転されてANDゲ
ート126に送られると、正になる。
2次ロックアウト・セル86−n中のビットのロックア
ウト検出は、ORゲート130、AOアゲート32及び
インバータ134によって行なわれる。
通信停止(COMMUN  INTERRUPT)信号
は、それぞれゲート124と127の出力で得られるレ
ベル1/レベル20ツクアウト信号とレベル30ツクア
ウト信号の論理和を取ることによって生成される。これ
らの信号は、それぞれ5RL138と139中で登録さ
れた後、ORゲート136に送られる。ORゲート13
6の出力は、32人力ORゲート137の入力側で収集
される。
ORゲート137の出力が、通信停止信号である。
この信号は、プロセッサ中でのマシン誤り発生の非同期
通知を行なうためのものである。こうした通知は、たと
えば、支援プロセッサに送られ、誤り診断・回復を開始
させる。
第1図及び第6図の禁止レジスタ83は、L1マスクと
長さが等しく捕捉レジスタ中の同じビットに作用する、
禁止マスクを記憶する。禁止マスク・ビットの1つが設
定されると、影響を受けるユニットのクロック生成回路
は、対応する捕捉レジスタ・ビットに対して生成された
L2検査停停止器に応答しない。詳細に理解するには、
第4A図と第7図を参照されたい。禁止マスク・ビット
nが、禁止レジスタ出力83−nの正の値の出力(L2
禁止エネーブル信号n)で示されるように設定されてい
るものと仮定する。捕捉ビット72−nがセットされる
と、ANDゲート102の出力が上昇する。これによっ
てNORゲート103の出力が非活動化(L2禁止停止
)され、L2検査停停止器及びL2禁止停止信号がクロ
ック生成回路(第4A図)中のANDゲート104に供
給されるため、L2禁止停止信号はAOゲート68の出
力(B)が降下しないようにする。そのため、クロック
生成器は、C1と02の供給を中断するカード実行ゲー
ト信号にたけ応答するように制限される。
第4A図及び第7図を検討すると確認できるように、レ
ベル2クロツク停止は、2サイクルで実施される。第1
のサイクルの始めに、誤り指示が捕捉セルフ2−nを含
むSRLに送られる。第2サイクルの始めに、捕捉セル
フ2−n中の誤り指示が、ゲート110と111中を伝
播してL2誤りとして分類され、ゲート104.67b
168を介してクロック制御機構に入り、5RL69の
入力端に供給される。第3サイクルの始めに、この信号
は、クロック走行信号を信号線66上で下降させて、ク
ロックを中断させている。
CLKMAINT機構を第8図と第9図に詳細に示す。
第8図で、プロセッサ・ユニット中のレベル1検出回路
のすべての出力が入力線」−に集められる。すなわち、
たとえば信号線35−1と45−1が示されている。レ
ジスタ150中のL1検査エネーブル・マスクに応じて
、対応するマスク・ビットをもつL1信号がゲーテッド
回路152を通過してL1捕捉レジスタ154に到る。
L1捕捉レジスタ154は上記の捕捉レジスタと同様に
動作する。すなわち、このレジスタは、L1信号線がそ
のマスクによって動作可能になっている間、ユニットか
らLl信号線に到着したL1信号を捕捉する。ロックア
ウト・ゲーテッド回路155とL10ツクアウト・レジ
スタ153から成るロックアウト・ループは、任意のL
1信号線を介してL1捕捉レジスタ154に入る最初の
L1信号を捕捉し、その線上でその後に到着したL1信
号は無視する。L1捕捉レジスタは、tビット・レジス
タであり、各ビット位置が最高を個のSECMAIN’
T回路のそれぞれに対応する。
L1捕捉レジスタ154の出力が4つの区画検出回路1
56−159のそれぞれに供給される。
区画検出回路はまた、SRL対180−0ないし160
−tから構成される1次検査停止回路の出力をその入力
端で受は取る。各区画検出回路は、=37 所定の4つの区画の1つを識別する信号を生成する。各
SRL対は、所定の4つの区画の1つに対応する2ビツ
ト・コードで事前設定される。各SRLは正出力及び反
転出力を供給するので、1次検査停止回路の各SRL対
は4状態コードの1つの状態を示す。各1次検査停止S
RL対は、各区画検出回路中で、L1捕捉レジスタ15
4の対応するビットと関連づけられている。すなわち、
L1捕捉レジスタ154のビット位置Oの出力は、各区
画検出回路156−159中で、1次検出停止SRL対
1t30−0と関連づけられ、以下同様である。例を続
けると、レベル1誤り信号がビット位置Oの入力に接続
されたSECMAINT回路からL1捕捉レジスタ15
4のビット位置Oに登録される場合、それは、SRL対
IEfO−0のコードによって動作可能にされた区画検
出回路の入力端に渡される。区画検出回路156−15
9の出力は、回路板区画停止信号(PARTSTOP)
O−3を供給する。各区画停止信号は、当該区画の各ユ
ニットのクロックが中断されることを示す。区画検出回
路の出力は、第9図に示されている停止収集マルチプレ
クサ170に送られる。
第9図で、4つの回路板区画(BRDPART)レジス
タ172−175がマルチプレクサ170の入力端に接
続されている。レジスタ172−175は、それぞれ各
ビット位置が当該ユニットに対応する区画マスクを含む
。マスクはそのクロックがその区画の任意の構成要素か
らのL1誤り信号に同期し応答して中断される、ユニッ
トのグループとして区画を定義する。このマスクは、区
画構成要素に対応するビット位置に1が入り、他のすべ
ての位置に0が入った通常の1次元ビ・ソトを含む。自
明のことであるが、0を含むビット位置は、その区画に
含まれないプロセッサの残すのユニットすべてである。
停止収集マルチプレクサ170の出力は反転されて、制
御回路180を介して1次実行ゲート(PRUNGAT
E)レジスタ182に供給される。L1誤りが発生する
と、区画停止信号が活動状態になって、マルチプレクサ
170に対応する回路板区画レジスタの出力を選択させ
る。その出力は制御回路180を通過して、1次実行ゲ
ート・レジスタ182に入力される。1次実行ゲート・
レジスタ中の選択されたマスクは、ユニットのゲーテッ
ド・クロック生成回路に供給されるカード実行ゲート信
号を定義する。ある区画マスクが選択されて1次実行ゲ
ート・レジスタ182に送られると、その区画中の各ユ
ニットのカード実行ゲート信号が、そのユニットのビッ
ト位置のOによって非活動化され、区画中のユニットの
中断を同期させる。
第10図及び第11図に、第8図と第9図のCLKMA
INT装置のSRL回路による実施態様を示す。第10
図及び第11図は、第8図と第9図に示した設計の単一
ビット・スライスを表わす。
当然のことながら、CLKMAINT装置は、協同して
動作する複数の統合されたスライスを含む。
第10図で、レベル1誤り信号がユニットnから受は取
られ、L1捕捉セル154−nにラッチされる。セル1
54−nへの入力は、L1検査エネーブル・レジスタ1
50からのビット150−nによって制御されるAND
10Rゲートを含む。統合AOゲートは、最初のL1信
号がそれにラッチされると、L1捕捉セル154−nを
ロックする。
L1捕捉セル154−nの出力は、それぞれ0R(0)
ゲートに供給するAND (A)ゲートから構成される
4つの区画検出回路の入力に送られる。
区画停止ANDゲート2001202.204.208
は、それぞれ検査停止SRL対IE30−nの出力の当
該の組合せを受は取る。すなわち、検査停止対5RLI
EtO−nの状態に応じて、L1捕捉セル154−n中
のL1誤り信号が、ANDゲートからORゲート201
.203.205.207の1つに送られ、区画停止信
号を形成する。
L1捕捉レジスタに入力された最初のL1信号のロック
アウトは、AND10Rゲート210、L10ツクアウ
ト・レジスタ・セル156= n NORゲート211
及びインバータ212から構成されるループで実施され
る。このループは、レジスタ154に入力された最初の
L1誤り信号を捕捉して、後続のすべてのL1誤りをロ
ックアウトし、こうした誤りの列の最初を識別する働き
をする。
第11図で、停止収集マルチプレクサは、ANDゲート
220−0ないし220−3のアレイから構成され、各
ゲートは当該の区画停止信号及び回路板区画マスク・レ
ジスタ172−175からのビットnを受は取る。OR
ゲート221はANDゲー)220−0ないし220−
3の出力を集め、ANDゲート・アレイによって選択さ
れた区画マスク・ビットを制御回路AND10R反転ゲ
ート223に送る。AOIORゲート201次実行ゲー
ト・レジスタ182のSRL対182−nへの入力を制
御し、したがってn番目のカード実行ゲート信号の状態
を制御する。AO1ORゲート201、反転ANDゲー
ト225を介してクロック開始信号が、またANDゲー
ト227を介してクロック停止信号が供給される。ゲー
ト225と227は、開始停止マスク・レジスタ210
(第9図)のn番目のビットを受は取る。本発明の装置
の動作を初期化するには、クロック開始信号を上昇させ
て、開始停止マスク・ピッ)nを1次実行ゲート・レジ
スタ182のn番目のビットに入力させる。−度初期構
成されると、1次実行ゲート・レジスタ182から供給
されるカード実行ゲート信号は、Ll誤り信号が区画マ
スクを選択したときに変更されるまで肯定され続ける。
その区画マスクは、その後のカード実行ゲート信号の状
態を決定するために、1次実行ゲート・レジスタに入力
される。
第7図、第10図、第11図及び第4A図を検討すると
確認できるように、Ll誤りに応答するクロック中断は
、4マシン・サイクルで完了する。
誤り指示はマシン・サイクル0の間に捕捉セルフ2nに
供給され、マシン・サイクル1の始めにSRLの出力か
ら得られる。この誤りはゲート100と101によって
レベル1の誤りとして分類され、L1捕捉セル154n
に入力される。L1信号は、サイクル2の終わりにL1
捕捉セル154nから得られる。捕捉されたレベル1誤
り信号は、区画検出AND10Rゲート組合せ体の一方
中を伝播して区画グループを選択し、停止収集ANDゲ
ートの1つを介して区画マスクを選択する。選択された
区画マスクは1次実行ゲート・レジスタ182に送られ
、サイクル3の間にラッチされる。
最後に、区画マスクのラッチによってカード実行ゲート
信号が発生し1次実行ゲート・レジスタ182に入ると
、サイクル4の終わりに5RL69から出力されるクロ
ック走行信号が変化する。すなわち、サイクル0でレベ
ル1の誤りが検出されると、レベル1誤り信号によって
選択された区画中のすべてのユニットがサイクル4の終
わりで同時に中断される。
第1図、第6図、第8図及び第9図を参照して、参照番
号30て示すユニット中でレベル2の誤りが発生するも
のと仮定する。この点に関連して、モジュール32のう
ちの1つは、ロックアウト・ゲート71を介して捕捉レ
ジスタ72にゲートされる誤り線71−1ないし71−
qの1本の誤り指示を上昇させる。その誤りが初期化以
降に発生した最初の誤りであるとすると、その誤りは、
ロックアウト・レジスタ86の、それが発生したモジュ
ール専用のビット位置に入力される。同時に、その誤り
は、捕捉レジスタの対応するビット位置から出力され、
Ll、L2及びL2′3マスクに応答して検出回路によ
って分類される。分類されると、L2検査停止信号が上
昇し、ユニット・クロックが中断される。検査報告回路
90は、ORアゲ−127(第7図)の出力端でレベル
1/レベル20ツクアウト信号を上昇させ、その信号が
1次通信収集回路58に送られる。1次通信収集回路5
8は、通常のように中断信号を生成して支援プロセッサ
30に転送させる働きをする。中断信号に応答して、支
援プロセッサは、捕捉レジスタ中のSECMAINT及
びCLKCNTLロツタアウトを走査して、適切な診断
・訂正動作を開始する。
上側で誤り指示がレベル1の誤りとして分類されるもの
と仮定すると、そのL1信号は、SECMAINTユニ
ットから信号線35−1上に出力され、その線を介して
、CLKMAINTユニットに転送される。したがって
L1信号は、ロックアウト・ゲーテッド回路152を介
してL1捕捉レジスタ154のユニット30からくるビ
ット位置(とL10ツクアウト・レジスタ153の対応
するビット位置)にゲートされる。CLKMAINTユ
ニット中で、L1信号は1次検査停止SRL対i e 
o−oの4状態コードと比較され、ユニット30が4つ
の区画のどれのポートになっているかが判定される。適
切な区画停止信号が4つの区画検出回路157−159
の1つから供給され、レジスタ172−175中の4つ
の回路板区画マスクの1つを選択する。そのマスクが、
1次実行ゲート・レジスタ182に入力され、その結果
、その区画のすべてのユニットのカード実行ゲート信号
が非活動状態になって、選択された区画の動作を同時に
同期して中断させる。
L1区画限定クロック停止の例を続けると、Ll誤りが
発生したユニット中のクロック信号は、その誤りがL2
誤りとして分類される場合、及び6一 ユニットの禁止レジスタ中のマスクがL2検査停止信号
に応答してクロックの中断を妨げない場合には、すでに
停止されている可能性がある。この場合、誤り指示が発
生したユニット中のクロックが、影響を受ける区画中の
他のユニットよりも2マシン・サイクル前に停止されて
いる。
本発明を実施する際、すべてのSECMAINTユニッ
トとCLKMAINTユニットがプログラミング可能な
ことにより、最高の柔軟性が与えられる。この点に関連
して、第6図、第8図及び第9図に、支援プロセッサか
らのプログラミング入力を示す。支援プロセッサは、通
常のプログラム式デバイスであることが好ましく、その
デバイスは、たとえば、本発明を組み込んだプロセッサ
を初期化し維持する働きをするパーソナル・コンピュー
タPS/2を含むことができる。支援プロセッサはプロ
セッサの初期化を支援し、プロセッサ内で発生する誤り
状態に応答するためのものである。支援プロセッサは、
通常のように、プロセッサの誤動作を特定し訂正する診
断手順を実施することにより、マシン・エラー(及び、
「マシン検査」)から発生する中断に応答するようプロ
グラミングされる。こうした診断を援助するため、本発
明は、誤りが発生した時点で、まず上記の誤り指示の形
のマシン検査条件に応じて、マシン(プロセッサ)の部
分とそれらの動作構成を「凍結する」機能をもつ。
誤動作プロセッサに対する急速な保守アクセスは、検査
エネーブル・レジスタ、マスク・レジスタ及び1次検査
停止SRLラッチ対を含むアドレス・マツプによって、
支援プロセッサに与えることができる。本発明のこれら
の要素は、支援プロセッサのアドレス可能資源アレイに
含めることができるので、支援プロセッサによって直接
プログラミングできる。こうして支援プロセッサでL1
マスク、L2マスク、L23マスク、及び2次検査エネ
ーブル・レジスタ73(第6図)の検査エネーブル・マ
スクをプログラミングすると好都合である。さらに、支
援プロセッサとS E CMA INTユニット(第6
図)の禁止レジスタを直接接続すると、L2禁止パター
ンをプロセッサでプログラミングできるようになる。
CLKMAINTユニット(第8図と第9図)において
、支援プロセッサに接続すると、区画マスク・レジスタ
172−175をプログラミングすることによってユニ
ット区画を確立することが可能となる。さらに、各プロ
セッサ・ユニットを、1次検査停止SRL対のプログラ
ミングによっである区画に割り当てる。すなわち、たと
えば、SECMAINTユニット35によってサービス
されるプロセッサ・ユニットを、SRL対16〇−〇に
プログラミングされた4状態コードによっである区画に
連結させる。
支援プロセッサは、1次実行ゲート・レジスタ182中
で初期クロック実行ゲート・パターンを設定するのにも
使用され、開始信号及び停止信号を制御ブロック180
に供給しく第9図)、開始停止マスクをCLKCNTL
ユニットの開始停止レジスタにプログラミングする。
支援プロセッサ300はまた、ロックアウト・レジスタ
86と156及び捕捉レジスタ72と154に入力され
た情報に直接アクセスすることにより、すべてのSEC
MAINTユニット及ヒCLKMAINTユニットから
誤り報告情報を受は取るように連結される。本発明から
の情報を読み取り、任意のレベルの誤り指示に応じて従
来の方式で生成される停止信号に応答して、支援プロセ
ッサで実施できる。さらに、支援プロセッサ300は、
本発明の捕捉レジスタ及びロックアウト・レジスタを繰
り返して走査するようにプログラミングすることもでき
る。
E1発明の効果 本発明により、複数のユニットを停止しなければならな
い誤りが検出されたときにプロセッサのある区画に対す
るクロック介入を可能にする、マシン動作中の誤り状態
の発生に対する条件付き応答を提供することができ、そ
して、残りのプロセッサ・ユニットに影響を及ぼさずに
誤りに応じて単一ユニットの動作を適時に停止すること
ができる。
【図面の簡単な説明】 第1図は、本発明の好ましい実施例の全体的構成図であ
る。 第2図は、モジュール式構成をもつデータ・プロセッサ
の概略図である。 第3図は、第2図に示すようなモジュール式プロセッサ
用の従来技術の代表的なりロック介入装置の部分構成図
である。 第4A図は、第1図に示したゲーテッド・クロック生成
回路の詳細を示す回路図である。 第4B図と第4C図は、それぞれ第4A図のクロック生
成回路がどのように開始し停止するかを示す波形図であ
る。 第5A図と第5B図は、同期区画クロック停止及び迅速
単一ユニット・クロック停止における第1図の動作シー
ケンスを示す波形図である。 第6図は、第1図の重要なブロックをより詳細に示す構
成図である。 第7図は、第6図に示した回路部分の回路に固有の実施
態様を示す構成図である。 第8図及び第9図は、第1図の重要なブロックをより詳
細に示す構成図である。 第10図と第11図は、それぞれ第8図と第9図の回路
に固有の実施態様を示す構成図である。 30140・・・・カード、31.41・・・・2次ク
ロック維持回路、32.42・・・・モジュール、33
・・・・カード誤り検査・収集要素(CECL)、35
・・・・カード・レベル検出・記録回路(CLDR)、
37.47・・・・ゲーテッド・クロック生成回路(C
KGEN) 、50・・・・1次クロック維持要素(C
LKMAINT) 、52・・・・マシン検査収集要素
(MCHKCOL) 、54・・・・カード区画回路(
CPART) 、56・・・・カード実行ゲート回路(
CRNGT) 、58・・・・1次通信収集回路(PC
OMM  C0LL)。

Claims (1)

  1. 【特許請求の範囲】 複数の接続されたユニットを含み、各ユニットがシステ
    ム機能を実行し、ユニット・クロック信号に応答して前
    記システム機能を実行するように接続された複数のモジ
    ュールと、前記モジュールに接続され各モジュールにお
    ける誤りをそれぞれが示す複数の誤り信号を発生する誤
    り決定手段とを含むデータ処理システムであって、 前記誤り決定手段に接続され、前記誤り信号を分類して
    、誤りの種類を示すレベル分類信号を発生する誤り分類
    手段と、 それぞれが前記各ユニットに設けられユニット実行ゲー
    ト信号に応答してユニット・クロック信号を発生する複
    数のクロック実行信号発生手段であって、前記誤り分類
    手段に接続され一方のレベルの分類信号に応答して前記
    クロック実行信号発生手段がユニット・クロック信号を
    発生しないようにする手段を含むものと、 それぞれが少なくとも1個の前記ユニットのグループを
    表わす複数のユニット区画信号を発生する区画手段と、 前記複数のクロック実行信号発生手段に接続され複数の
    ユニット実行ゲート信号を発生する実行ゲート信号発生
    手段であって、前記区画手段及び前記誤り分類手段に接
    続され他方のレベルの分類信号に応答して所定の区画信
    号を選択する第1手段と、前記第1手段に接続され前記
    所定の区画信号に対応するグループのユニットにおける
    クロック実行信号発生手段に対してユニット実行ゲート
    信号を取り消す第2手段とを含むものと、 を備えた前記データ処理システム。
JP1099050A 1988-06-24 1989-04-20 データ処理システム Pending JPH0218627A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/211,469 US4916697A (en) 1988-06-24 1988-06-24 Apparatus for partitioned clock stopping in response to classified processor errors
US211469 1988-06-24

Publications (1)

Publication Number Publication Date
JPH0218627A true JPH0218627A (ja) 1990-01-22

Family

ID=22787043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1099050A Pending JPH0218627A (ja) 1988-06-24 1989-04-20 データ処理システム

Country Status (3)

Country Link
US (1) US4916697A (ja)
EP (1) EP0347558A3 (ja)
JP (1) JPH0218627A (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0719211B2 (ja) * 1988-10-08 1995-03-06 日本電気株式会社 クロック制御方式
JPH0439707A (ja) * 1990-06-06 1992-02-10 Mitsubishi Electric Corp 数値制御装置の非常停止装置
US5448725A (en) * 1991-07-25 1995-09-05 International Business Machines Corporation Apparatus and method for error detection and fault isolation
US5473767A (en) * 1992-11-03 1995-12-05 Intel Corporation Method and apparatus for asynchronously stopping the clock in a processor
US5574393A (en) * 1992-12-22 1996-11-12 Amdahl Corporation Apparatus and method for immediately stopping clocks
US5987244A (en) * 1994-12-22 1999-11-16 Texas Instruments Incorporated Power management masked clock circuitry, systems and methods
US5771373A (en) * 1994-12-22 1998-06-23 Texas Instruments Incorporated Power management masked clock circuitry, systems and methods
US5754436A (en) * 1994-12-22 1998-05-19 Texas Instruments Incorporated Adaptive power management processes, circuits and systems
US6886162B1 (en) * 1997-08-29 2005-04-26 International Business Machines Corporation High speed methods for maintaining a summary of thread activity for multiprocessor computer systems
US7117385B2 (en) * 2003-04-21 2006-10-03 International Business Machines Corporation Method and apparatus for recovery of partitions in a logical partitioned data processing system
US20040216003A1 (en) * 2003-04-28 2004-10-28 International Business Machines Corporation Mechanism for FRU fault isolation in distributed nodal environment
JP2006260325A (ja) * 2005-03-18 2006-09-28 Fujitsu Ltd 障害の伝達方法
GB2456618A (en) * 2008-01-15 2009-07-22 Ibm Delaying the stop-clock signal of a chip by a set amount of time so that error handling and recovery can be performed before the clock is stopped
US8042010B2 (en) * 2008-10-22 2011-10-18 Synopsys, Inc. Two-phase clock-stalling technique for error detection and error correction
US8010838B2 (en) 2008-11-20 2011-08-30 International Business Machines Corporation Hardware recovery responsive to concurrent maintenance

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5983250A (ja) * 1982-11-05 1984-05-14 Fujitsu Ltd 情報処理装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3229251A (en) * 1962-03-26 1966-01-11 Ibm Computer error stop system
SE308038B (ja) * 1968-04-18 1969-01-27 Ericsson Telefon Ab L M
US3593307A (en) * 1968-09-20 1971-07-13 Adaptronics Inc Redundant, self-checking, self-organizing control system
IT1046598B (it) * 1974-05-16 1980-07-31 Honeywell Inf Systems Interfaccia di connessione di apparecchiature periferiche a un calcolatore provvista di meccanismi di segnalazione e di distinzione tradiversi tipi di errore
US4317200A (en) * 1978-10-20 1982-02-23 Vlsi Technology Research Association Method and device for testing a sequential circuit divided into a plurality of partitions
US4503490A (en) * 1981-06-10 1985-03-05 At&T Bell Laboratories Distributed timing system
JPS589488A (ja) * 1981-07-09 1983-01-19 Pioneer Electronic Corp 複数の中央演算処理装置を有するシステムの中央演算処理装置の復帰機構
US4464751A (en) * 1981-11-10 1984-08-07 International Business Machines Corp. Machine check coordination
JPS59116858A (ja) * 1982-12-23 1984-07-05 Fujitsu Ltd マシンチエツク割込み処理方式
US4616335A (en) * 1983-06-30 1986-10-07 International Business Machines Corporation Apparatus for suspending a system clock when an initial error occurs
US4679195A (en) * 1985-04-10 1987-07-07 Amdahl Corporation Error tracking apparatus in a data processing system
JPS6226580A (ja) * 1985-07-29 1987-02-04 Hitachi Ltd 障害処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5983250A (ja) * 1982-11-05 1984-05-14 Fujitsu Ltd 情報処理装置

Also Published As

Publication number Publication date
EP0347558A3 (en) 1991-05-22
US4916697A (en) 1990-04-10
EP0347558A2 (en) 1989-12-27

Similar Documents

Publication Publication Date Title
JPH0218627A (ja) データ処理システム
US4996688A (en) Fault capture/fault injection system
US4800564A (en) High performance clock system error detection and fault isolation
JP3005250B2 (ja) バスモニター集積回路
US4932028A (en) Error log system for self-testing in very large scale integrated circuit (VLSI) units
US5349654A (en) Fault tolerant data exchange unit
US4620302A (en) Programmable digital signal testing system
US4688222A (en) Built-in parallel testing circuit for use in a processor
EP0031501A2 (en) Diagnostic and debugging arrangement for a data processing system
US4471484A (en) Self verifying logic system
US5515501A (en) Redundant maintenance architecture
JP3515571B2 (ja) 集積回路の事象認定試験アーキテクチャ
US6243666B1 (en) Maintenance system and interface for use in a modularized, high-speed data processing system
EP0385404B1 (en) Clock failure recovery system
EP0348663A2 (en) Simultaneous trans-processor broadcast of machine conditions in a loosely-coupled multi-processor system
US5418794A (en) Error determination scan tree apparatus and method
JPS6225211B2 (ja)
BREUER et al. A methodology for the design of hierarchically testable and maintainable digital systems
JPH04321140A (ja) エラー発生部指摘方法および装置
JPS60239835A (ja) 論理回路の故障診断方式
JPH03172948A (ja) システムバスのログ採取方式
JPS62203244A (ja) ハ−ドウエア診断方式
JPH0331233B2 (ja)
JPS6270958A (ja) 入出力処理装置の試験方式