JPH03182939A - ソフトウェアのエラー処理の方法 - Google Patents
ソフトウェアのエラー処理の方法Info
- Publication number
- JPH03182939A JPH03182939A JP2203802A JP20380290A JPH03182939A JP H03182939 A JPH03182939 A JP H03182939A JP 2203802 A JP2203802 A JP 2203802A JP 20380290 A JP20380290 A JP 20380290A JP H03182939 A JPH03182939 A JP H03182939A
- Authority
- JP
- Japan
- Prior art keywords
- error
- data
- memory
- module
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 129
- 230000006870 function Effects 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims description 68
- 238000011084 recovery Methods 0.000 claims description 42
- 230000002093 peripheral effect Effects 0.000 claims 1
- 230000015654 memory Effects 0.000 abstract description 484
- 238000001514 detection method Methods 0.000 abstract description 18
- 238000012546 transfer Methods 0.000 description 75
- 238000010586 diagram Methods 0.000 description 42
- 238000004891 communication Methods 0.000 description 28
- 230000007704 transition Effects 0.000 description 28
- 230000008569 process Effects 0.000 description 18
- 230000004044 response Effects 0.000 description 16
- 239000000872 buffer Substances 0.000 description 14
- 230000001360 synchronised effect Effects 0.000 description 14
- 230000000630 rising effect Effects 0.000 description 10
- 230000003936 working memory Effects 0.000 description 10
- 230000002457 bidirectional effect Effects 0.000 description 9
- 230000001052 transient effect Effects 0.000 description 8
- 230000009977 dual effect Effects 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000001816 cooling Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 239000013256 coordination polymer Substances 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000238876 Acari Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100325756 Arabidopsis thaliana BAM5 gene Proteins 0.000 description 1
- 241001234891 Bletia purpurea Species 0.000 description 1
- 101100328887 Caenorhabditis elegans col-34 gene Proteins 0.000 description 1
- 101000860173 Myxococcus xanthus C-factor Proteins 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 101150046378 RAM1 gene Proteins 0.000 description 1
- 101100476489 Rattus norvegicus Slc20a2 gene Proteins 0.000 description 1
- 101100524639 Toxoplasma gondii ROM3 gene Proteins 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003134 recirculating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/1633—Error detection by comparing the output of redundant processing systems using mutual exchange of the output between the redundant processing components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/165—Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Hardware Redundancy (AREA)
- Stored Programmes (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は一般にフォールト許容コンピユーティンクシス
テム内のエラー処理システム、さらに詳細に言えば、同
時に機能する2重プロセッサを備えるようなシステムで
の、エラー処理のための方法及び装置に関する。
テム内のエラー処理システム、さらに詳細に言えば、同
時に機能する2重プロセッサを備えるようなシステムで
の、エラー処理のための方法及び装置に関する。
データ処理システム内のエラー処理は、3つのステップ
を含む。第1のステップは、エラーの検出。第2のステ
ップは、エラーの回復。第3のステップは、エラーにつ
いての情報の記録である。
を含む。第1のステップは、エラーの検出。第2のステ
ップは、エラーの回復。第3のステップは、エラーにつ
いての情報の記録である。
冗長処理環境(redundant processi
ngenvironment)におけるもう一つの心配
事は、修復後、冗長が十分に満たされるよう、システム
を回復するということである。
ngenvironment)におけるもう一つの心配
事は、修復後、冗長が十分に満たされるよう、システム
を回復するということである。
フォールト許容コンピユーテイングシステムにおいて、
エラーは、標準の非フォールト許容コンピユーティンク
システムより、コストが高くつくものである。これはな
ぜかと言えば、フォールト許容コンピユーティンクシス
テムが、常に、お金あるいはセーフティのいづれかのた
め、どのようなダウンタイムのコストも高くついてしま
うような環境で使用されるからである。それ故に、エラ
ー処理は、そのようなシステムにとってとてはかなり重
要な働きをしているのである。
エラーは、標準の非フォールト許容コンピユーティンク
システムより、コストが高くつくものである。これはな
ぜかと言えば、フォールト許容コンピユーティンクシス
テムが、常に、お金あるいはセーフティのいづれかのた
め、どのようなダウンタイムのコストも高くついてしま
うような環境で使用されるからである。それ故に、エラ
ー処理は、そのようなシステムにとってとてはかなり重
要な働きをしているのである。
エラー処理に重要であるのと同じく、フォールト許容シ
ステムにとっても重要であることは、そのような処理が
、普通のデータ処理機能の実行に対して不必要に遅延を
起こさないようにすることが望ましい、ということであ
る。このように、実効的な処理の要望と、実効的なエラ
ー処理の必要性との間で、バランスが取られなくてはな
らないのである。
ステムにとっても重要であることは、そのような処理が
、普通のデータ処理機能の実行に対して不必要に遅延を
起こさないようにすることが望ましい、ということであ
る。このように、実効的な処理の要望と、実効的なエラ
ー処理の必要性との間で、バランスが取られなくてはな
らないのである。
ある従来のフォールト許容コンピュータシステムは、ソ
フトウェアエラー回復プロシーンヤを実行するために、
エラーの検出に関する全ての働きを山めてしまう。ソフ
トウェアエラー回復プロシジャは、しかしながら、複雑
で込み入ったものでありうる。そのようなプロシージャ
は、常に相当の時間がかかるものであり、もしかすると
重大なタスクであるものに、インクラブドすることを強
いるものなのである。
フトウェアエラー回復プロシーンヤを実行するために、
エラーの検出に関する全ての働きを山めてしまう。ソフ
トウェアエラー回復プロシジャは、しかしながら、複雑
で込み入ったものでありうる。そのようなプロシージャ
は、常に相当の時間がかかるものであり、もしかすると
重大なタスクであるものに、インクラブドすることを強
いるものなのである。
故に、エラー処理に必要なソフトウェア処理時間の総実
行時間が、最低限しかかからないようなシステムを構成
することが望ましい。このように、コンピュータシステ
ム処理上でのソフトウェアエラー処理の影響を、エラー
処理にかかる時間を最小限にすることにより、減らすこ
とが出来るのである。
行時間が、最低限しかかからないようなシステムを構成
することが望ましい。このように、コンピュータシステ
ム処理上でのソフトウェアエラー処理の影響を、エラー
処理にかかる時間を最小限にすることにより、減らすこ
とが出来るのである。
エラー回復がソフトウェアプロセスに明らかなで、コン
ピュータシステムがデータ処理の指示を実行するように
、ハードウェアでできる限り多くのエラーを扱うという
ことも、本発明に望まれることである。
ピュータシステムがデータ処理の指示を実行するように
、ハードウェアでできる限り多くのエラーを扱うという
ことも、本発明に望まれることである。
発明の概要
本発明は、ハードウェア内のエラー源の位置を探知し、
そしてもしソフトウェアエラー処理ルーチンに入る前の
故障であれば、プロセッサの機能を止めるという試みに
より、所望の結果を得ようというものである。また、も
しエラーがハードウェアで完全に処理することができる
ものならば、そのときはソフトウェアのエラー処理は必
要ないのである。さらに詳しくいえば、本発明にしたが
って、ここに具現化し広く述べたように、エラーを回復
する方法は、データ処理機能を実行することなく、デー
タ処理システムにより実行される幾つかのステップから
なるものにより、提供されている。データ処理システム
は、同一のデータ処理機能のセットを実行する複数のプ
ロセッサ部分を備えており、その段階は、故障機能のう
ちの1つの実行の間に、データ処理システム内のエラー
を検出し、エラーが検出された処理部分の位置を突き止
め、エラーが検出されたプロセッサ部分が、普通にデー
タ処理機能を実行することができないことを示している
決定的なエラーであるかどうかを判断し、もし決定的な
エラーが検出されれば、エラーが検出されたプロセッサ
部分を回避するためにデータ経路を再構築し、そしても
しエラーが決定的なエラーでなければ、エラーが検出さ
れた時に実行されていたデータ処理機能を再試行するの
である。
そしてもしソフトウェアエラー処理ルーチンに入る前の
故障であれば、プロセッサの機能を止めるという試みに
より、所望の結果を得ようというものである。また、も
しエラーがハードウェアで完全に処理することができる
ものならば、そのときはソフトウェアのエラー処理は必
要ないのである。さらに詳しくいえば、本発明にしたが
って、ここに具現化し広く述べたように、エラーを回復
する方法は、データ処理機能を実行することなく、デー
タ処理システムにより実行される幾つかのステップから
なるものにより、提供されている。データ処理システム
は、同一のデータ処理機能のセットを実行する複数のプ
ロセッサ部分を備えており、その段階は、故障機能のう
ちの1つの実行の間に、データ処理システム内のエラー
を検出し、エラーが検出された処理部分の位置を突き止
め、エラーが検出されたプロセッサ部分が、普通にデー
タ処理機能を実行することができないことを示している
決定的なエラーであるかどうかを判断し、もし決定的な
エラーが検出されれば、エラーが検出されたプロセッサ
部分を回避するためにデータ経路を再構築し、そしても
しエラーが決定的なエラーでなければ、エラーが検出さ
れた時に実行されていたデータ処理機能を再試行するの
である。
(実施例)
本発明の好適な実施例を詳細に参照するが、この実施例
の具体例は添付図に示されている。
の具体例は添付図に示されている。
A、システムの説明
第1図は本発明による故障許容コンピュータ・システム
IOのブロック図である。この故障許容コンピュータ・
システムlOはゾーンと呼ぶ重複システムを有している
。通常のモードの場合、2つのゾーン11とlビが同時
に動作している。
IOのブロック図である。この故障許容コンピュータ・
システムlOはゾーンと呼ぶ重複システムを有している
。通常のモードの場合、2つのゾーン11とlビが同時
に動作している。
この重複によって、1つのポイントで故障が発生するこ
とがなく、ゾーン11またはII’の1つにエラーまた
は故障が発生しても、これによってコンピュータ・シス
テムIOが動作不能にならないことが保証される。さら
に、こうした故障は、これを発生させた装置または構成
要素を動作不能にするまたは無視することによって取り
除くことができる。第1図に示すゾーン11とll′は
、それぞれ重複処理システム20と20′を有している
。しかし、これらが重複して設けられていることによっ
て、処理システム以上のことを行うことができる。
とがなく、ゾーン11またはII’の1つにエラーまた
は故障が発生しても、これによってコンピュータ・シス
テムIOが動作不能にならないことが保証される。さら
に、こうした故障は、これを発生させた装置または構成
要素を動作不能にするまたは無視することによって取り
除くことができる。第1図に示すゾーン11とll′は
、それぞれ重複処理システム20と20′を有している
。しかし、これらが重複して設けられていることによっ
て、処理システム以上のことを行うことができる。
第2図は、故障許容コンピュータ・システム10の物理
的ハードウェアを示し、システムが重複して設けられて
いることを図によって示す。各ゾーン11と11’は、
別のキャビネット11と12’にそれぞれ内蔵されてい
る。キャビネット12は、バッテリ13、電源調整装置
14、冷却ファンI6およびAC人力17を有する。キ
ャビネット12′はキャビネット12の構成要素13.
14.16および17に対応する別の構成要素を有する
。
的ハードウェアを示し、システムが重複して設けられて
いることを図によって示す。各ゾーン11と11’は、
別のキャビネット11と12’にそれぞれ内蔵されてい
る。キャビネット12は、バッテリ13、電源調整装置
14、冷却ファンI6およびAC人力17を有する。キ
ャビネット12′はキャビネット12の構成要素13.
14.16および17に対応する別の構成要素を有する
。
以下で詳細に説明するように、処理システム20および
20′は背面板によって相互に接続された幾つかのモジ
ュールを有する。もし1つのモジュールに故障またはエ
ラーがあれば、このモジュールは、コンピュータ・シス
テム1oを動作不能にすることなく、取り外して取り替
えることができる。これは、処理システム20と20’
が物理的に分離され、モジュールがプラグによって挿0 入されている別の背面板を有し、相互に独立して動作す
ることができるためである。従って、これらのモジュー
ルは、一方の処理システムが動作を継続している間に、
他方の処理システムの背面板から取り外しまたはその背
面板にプラクによって挿入することができる。
20′は背面板によって相互に接続された幾つかのモジ
ュールを有する。もし1つのモジュールに故障またはエ
ラーがあれば、このモジュールは、コンピュータ・シス
テム1oを動作不能にすることなく、取り外して取り替
えることができる。これは、処理システム20と20’
が物理的に分離され、モジュールがプラグによって挿0 入されている別の背面板を有し、相互に独立して動作す
ることができるためである。従って、これらのモジュー
ルは、一方の処理システムが動作を継続している間に、
他方の処理システムの背面板から取り外しまたはその背
面板にプラクによって挿入することができる。
好適な実施例の場合、重複処理システム20および20
′は同一のものであり、同一のモジュールを内蔵してい
る。したがって、処理システム20′は同じ動作をする
と理解して、処理システム20のみを完全に説明する。
′は同一のものであり、同一のモジュールを内蔵してい
る。したがって、処理システム20′は同じ動作をする
と理解して、処理システム20のみを完全に説明する。
処理システム20は第3図および第4図に詳細に示すC
PUモジュール30を有している。CPUモジュール3
0は、以下で詳細に説明するクロスリンク経路25によ
って処理システム20′のCPUモジュール30′と相
互に接続されている。
PUモジュール30を有している。CPUモジュール3
0は、以下で詳細に説明するクロスリンク経路25によ
って処理システム20′のCPUモジュール30′と相
互に接続されている。
クロスリンク経路25によって、処理システム20と2
0′との間にデータ転送経路が設けられ、処理システム
20と20′が同期して動作することを保証するために
タイミング信号が搬送される。
0′との間にデータ転送経路が設けられ、処理システム
20と20′が同期して動作することを保証するために
タイミング信号が搬送される。
■
処理システム20はまたI10モジュール100.11
0、および120を有する。I10モジュル100.1
10.120.100′ IIO′および120′は独
立した装置である。第1図、第4図および第17図はI
10モジュール100を詳細に示す。複数のI10モジ
ュールを図示するが、これらの重複したモジュールはこ
のシステムによって要求されるものではない。しかし、
このような重複がなければ、ある程度の補償許容度が失
われる。
0、および120を有する。I10モジュル100.1
10.120.100′ IIO′および120′は独
立した装置である。第1図、第4図および第17図はI
10モジュール100を詳細に示す。複数のI10モジ
ュールを図示するが、これらの重複したモジュールはこ
のシステムによって要求されるものではない。しかし、
このような重複がなければ、ある程度の補償許容度が失
われる。
I10モジュール100.110.120の各々は、デ
ュアル・レール・モジュール相互接続部130および1
32によってCPUモジュール30に接続される。モジ
ュール相互接続部130と132はI10相互接続部と
して機能し、背面板を介して処理システム20に接続さ
れている。
ュアル・レール・モジュール相互接続部130および1
32によってCPUモジュール30に接続される。モジ
ュール相互接続部130と132はI10相互接続部と
して機能し、背面板を介して処理システム20に接続さ
れている。
この用途に使用するため、CPU40、メモリ制御装置
70、クロスリック90およびモジュール相互接続部1
30を有するデータ経路が一方のレールと考えられ、C
PU50、メモリ制御装置75、クロスリンク95、お
よびモジュール相互接続部+32を有するデータ経路が
他方のレールと考えられる。動作が正しく行われている
間は、両方のレールのデータは同じである。
70、クロスリック90およびモジュール相互接続部1
30を有するデータ経路が一方のレールと考えられ、C
PU50、メモリ制御装置75、クロスリンク95、お
よびモジュール相互接続部+32を有するデータ経路が
他方のレールと考えられる。動作が正しく行われている
間は、両方のレールのデータは同じである。
B、故障許容システムの原理
故障許容コンピュータ・システム10では、1つのポイ
ントで故障の発生することがないが、その理由は、各構
成要素が重複して設けられているためである。処理シス
テム20と20′は、それぞれ故障停止処理システムで
あり、このことは、これらのシステムがサブシステム内
の故障またはエラーを検出し、これらの故障またはエラ
ーが他のサブシステムに制御されない状態で広がること
を防止することができる。しかし、これらの処理システ
ムではVは、各処理システム内の構成要素が重複して設
けられていないため、1つの点て故障が発生する。
ントで故障の発生することがないが、その理由は、各構
成要素が重複して設けられているためである。処理シス
テム20と20′は、それぞれ故障停止処理システムで
あり、このことは、これらのシステムがサブシステム内
の故障またはエラーを検出し、これらの故障またはエラ
ーが他のサブシステムに制御されない状態で広がること
を防止することができる。しかし、これらの処理システ
ムではVは、各処理システム内の構成要素が重複して設
けられていないため、1つの点て故障が発生する。
2つの故障停止処理システム20と20′は、所定の方
法で動作するある種の構成要素によって相互に接続され
、フェール・セーフ・システムを3 形成する。故障許容コンピュータ・システムlOとして
具体化されているフェール・セーフ・システムの場合、
たとえ故障停止処理システム20および20′の一方が
故障しても、コンピュータ・システムは全体として処理
を継続することができる。
法で動作するある種の構成要素によって相互に接続され
、フェール・セーフ・システムを3 形成する。故障許容コンピュータ・システムlOとして
具体化されているフェール・セーフ・システムの場合、
たとえ故障停止処理システム20および20′の一方が
故障しても、コンピュータ・システムは全体として処理
を継続することができる。
2つの故障停止処理システム20と20′はロックステ
ップ同期で動作すると考えられるが、その理由は、CP
U40.50.40′および50′がこのような同期で
動作するからである。この場合、3つの重要な例外が存
在する。第1の例外は、ブートストラップ法によって両
方の処理装置を同期させる初期化の時に発生する。第2
の例外は、処理システム20と20′が2つの異なった
作業負荷で独立して(非同期の状態で)動作する場合に
発生する。第3の例外は、ある種のエラーが処理システ
ム20と20′に発生する場合に起こる。
ップ同期で動作すると考えられるが、その理由は、CP
U40.50.40′および50′がこのような同期で
動作するからである。この場合、3つの重要な例外が存
在する。第1の例外は、ブートストラップ法によって両
方の処理装置を同期させる初期化の時に発生する。第2
の例外は、処理システム20と20′が2つの異なった
作業負荷で独立して(非同期の状態で)動作する場合に
発生する。第3の例外は、ある種のエラーが処理システ
ム20と20′に発生する場合に起こる。
この最後の例外の場合、これらの処理システムの内の一
方のCPUとメモリ素子を動作不能し、これによって同
期動作を終了する。
方のCPUとメモリ素子を動作不能し、これによって同
期動作を終了する。
4
システムがロックステップI10で動作している場合、
いずれの1つの時間にも、1つのI10装置のみしかア
クセスすることができない。しかし、4つのCPU40
.50.40′および50′は全て実質的に同し時間に
同じデータをこのI10装置から受は取る。以下の議論
では、これらの処理システムのロックステップ同期とは
、1つのI10モジュールのみがアクセスされているこ
とを意味すると理解できる。
いずれの1つの時間にも、1つのI10装置のみしかア
クセスすることができない。しかし、4つのCPU40
.50.40′および50′は全て実質的に同し時間に
同じデータをこのI10装置から受は取る。以下の議論
では、これらの処理システムのロックステップ同期とは
、1つのI10モジュールのみがアクセスされているこ
とを意味すると理解できる。
重複して設けられた処理システム20および20′の同
期は、各システムを決定性を有する機械として取り扱う
ことによって実行され、この場合、これらのシステムは
、同じ入力を受けて同じ既知の状態でスタートし、常に
同じ機械状態に入り、エラーのない場合には、同じ結果
を発生する。
期は、各システムを決定性を有する機械として取り扱う
ことによって実行され、この場合、これらのシステムは
、同じ入力を受けて同じ既知の状態でスタートし、常に
同じ機械状態に入り、エラーのない場合には、同じ結果
を発生する。
処理システム20と20′は同じ構成を有し、同し人力
を受取、従って、同し状態を通過する。従って、両方の
処理装置が同期して動作する限り、これらは同じ結果を
発生すると共に同じ状態に入る。もしこれらの処理シス
テムが同じ状態でなく、または異なった結果を発生すれ
ば、これらの処理システム20と20′の一方が故障し
ていると考えられる。そこで修正動作を行うためには、
故障しているモジュールを動作不能にする等して故障の
原因を取り除かなければならない。
を受取、従って、同し状態を通過する。従って、両方の
処理装置が同期して動作する限り、これらは同じ結果を
発生すると共に同じ状態に入る。もしこれらの処理シス
テムが同じ状態でなく、または異なった結果を発生すれ
ば、これらの処理システム20と20′の一方が故障し
ていると考えられる。そこで修正動作を行うためには、
故障しているモジュールを動作不能にする等して故障の
原因を取り除かなければならない。
エラーの検出は、−殻内に別の処理時間または論理の形
でのオーバヘッドを含む。このようなオーバヘッドを最
小にするため、システムは故障許容動作と調和しながら
、エラー・チエツクをできるだけ少ない回数行わなけれ
ばならない。少なくとも、エラーのチエツクはデータが
CPU30と30′から出力される前に行われなければ
ならない。そうでなければ、内部処理のエラーによって
、原子炉のような外部システムに正しくない動作が発生
するが、これは故障許容システムの設計によって防止し
ようとしている状態である。
でのオーバヘッドを含む。このようなオーバヘッドを最
小にするため、システムは故障許容動作と調和しながら
、エラー・チエツクをできるだけ少ない回数行わなけれ
ばならない。少なくとも、エラーのチエツクはデータが
CPU30と30′から出力される前に行われなければ
ならない。そうでなければ、内部処理のエラーによって
、原子炉のような外部システムに正しくない動作が発生
するが、これは故障許容システムの設計によって防止し
ようとしている状態である。
これ以外にエラーのチエツクを行う理由が存在する。例
えば、故障またはエラーを除去するためには、記憶また
は使用する前に、CPUモジュール30および30′の
受は取ったデータをチェッ■ りすることが望ましい。そうでなければ、記憶されてい
るエラーのあるデータが後がアクセスされ、その結果、
別のエラーが発生すると、特にこのエラーのあるデータ
が一定期間記憶された場合には、これらのエラーの最初
の原因を見出だすことが困難または不可能になる。時間
が経過することとこれらのエラーのあるデータがその後
処理されることによって、エラーの原因を追跡すること
ができなくなる可能性がある。
えば、故障またはエラーを除去するためには、記憶また
は使用する前に、CPUモジュール30および30′の
受は取ったデータをチェッ■ りすることが望ましい。そうでなければ、記憶されてい
るエラーのあるデータが後がアクセスされ、その結果、
別のエラーが発生すると、特にこのエラーのあるデータ
が一定期間記憶された場合には、これらのエラーの最初
の原因を見出だすことが困難または不可能になる。時間
が経過することとこれらのエラーのあるデータがその後
処理されることによって、エラーの原因を追跡すること
ができなくなる可能性がある。
検出される前にエラーが記憶されていた時間を指す「エ
ラーの潜伏時間」によって、同様に後で問題が発生する
可能性がある。例えば、コンピュータシステムが以前に
発生したエラーによって小さくなったキャパシティで既
に動作している場合に、滅多に使わないルーチンによっ
て潜在するエラーの見付かる場合がある。コンピュータ
のキャパシティが減少している場合、潜在するエラーに
よってシステムが破壊される場合がある。
ラーの潜伏時間」によって、同様に後で問題が発生する
可能性がある。例えば、コンピュータシステムが以前に
発生したエラーによって小さくなったキャパシティで既
に動作している場合に、滅多に使わないルーチンによっ
て潜在するエラーの見付かる場合がある。コンピュータ
のキャパシティが減少している場合、潜在するエラーに
よってシステムが破壊される場合がある。
更に、処理システム20および20′がデュアル・レー
ル・システムになっている場合、データ7 をメモリのような共有の資源である1つのレール・シス
テムに転送するのに先立って、エラーをチエツクするこ
とが望ましい。この理由は、このような転送を行った後
には最早2つの独立するデータのソースが存在しないた
めであり、もしシングル・レール・システムで後になっ
て何らかのエラーが検出された場合、このエラーを追跡
することは、不可能でないにしても困難になる。
ル・システムになっている場合、データ7 をメモリのような共有の資源である1つのレール・シス
テムに転送するのに先立って、エラーをチエツクするこ
とが望ましい。この理由は、このような転送を行った後
には最早2つの独立するデータのソースが存在しないた
めであり、もしシングル・レール・システムで後になっ
て何らかのエラーが検出された場合、このエラーを追跡
することは、不可能でないにしても困難になる。
エラー処理の好適な方法が、これと同じ日に出願された
弁理士ドケットNαPD89−289/DEC−344
の発明の名称「ソフトウェアによるエラーの処理Jとい
う出願で説明され、これは参考としてここに引用されて
いる。
弁理士ドケットNαPD89−289/DEC−344
の発明の名称「ソフトウェアによるエラーの処理Jとい
う出願で説明され、これは参考としてここに引用されて
いる。
C,モジュールの説明
1、cPUモジュール
第1図に示すCPUモジュール30の構成要素を第3図
および第4図により詳細に示す。第3図はCPUモジュ
ールのブロック図であり、第4図はCPUモジュール3
0およびI10モジュール100並びにこれらの相互接
続部のブロック図で8 ある。CPUモジュール30および30’の動作および
これらに含まれる構成要素は一般的に同じであるため、
CPU30のみを説明する。
および第4図により詳細に示す。第3図はCPUモジュ
ールのブロック図であり、第4図はCPUモジュール3
0およびI10モジュール100並びにこれらの相互接
続部のブロック図で8 ある。CPUモジュール30および30’の動作および
これらに含まれる構成要素は一般的に同じであるため、
CPU30のみを説明する。
CPUモジュールは、デュアルCPU40と50を内蔵
する。CPU40と50は当業者に周知の標準的な中央
処理装置である。好適な実施例の場合、CPU40と5
0は本出願の譲受人であるディジタル・エクイップメン
ト会社によって製造されたVAXマイコロプロセッサで
ある。
する。CPU40と50は当業者に周知の標準的な中央
処理装置である。好適な実施例の場合、CPU40と5
0は本出願の譲受人であるディジタル・エクイップメン
ト会社によって製造されたVAXマイコロプロセッサで
ある。
CPU40と50に関連するのはそれぞれキャッシュ・
メモリ42と52てあり、これらはCPUに対して十分
なメモリのサイズを有する標準のキャッシュRAMであ
る。好適な実施例の場合、キャッシュRAMは4Kx6
4ビツトである。しかし、本発明がキャッシュRAMを
有する必要はない。
メモリ42と52てあり、これらはCPUに対して十分
なメモリのサイズを有する標準のキャッシュRAMであ
る。好適な実施例の場合、キャッシュRAMは4Kx6
4ビツトである。しかし、本発明がキャッシュRAMを
有する必要はない。
2、 メモリ・モジュール
CPU40と50は、最高4つのメモリ・モジュール6
0を共有できることが望ましい。第5図はCPUモジュ
ール30に接続して示した1つのメモリ・モジュール6
0のブロック図である。
0を共有できることが望ましい。第5図はCPUモジュ
ール30に接続して示した1つのメモリ・モジュール6
0のブロック図である。
メモリ転送サイクル、ステータス・レジスタ転送サイク
ルおよびEEPROM転送サイクルの期間中、各メモリ
・モジュール60は双方向データ・バス85を介してプ
ライマリ・メモリ制御装置70にデータを転送すると共
にこれからデータの転送を受ける。各メモリモジュール
6oは、またそれぞれバス80および82を介してメモ
リ制御装置70と75からアドレス信号、制御信号、タ
イミング信号およびECC信号を受は取る。バス80お
よび82のアドレス信号は、ボード信号、バンク信号、
および行アドレス信号と列アドレス信号を含み、これら
によってデータ転送に含まれるメモリ・ボード・アドレ
ス、バンク・アドレス、および行および列アドレスが識
別される。
ルおよびEEPROM転送サイクルの期間中、各メモリ
・モジュール60は双方向データ・バス85を介してプ
ライマリ・メモリ制御装置70にデータを転送すると共
にこれからデータの転送を受ける。各メモリモジュール
6oは、またそれぞれバス80および82を介してメモ
リ制御装置70と75からアドレス信号、制御信号、タ
イミング信号およびECC信号を受は取る。バス80お
よび82のアドレス信号は、ボード信号、バンク信号、
および行アドレス信号と列アドレス信号を含み、これら
によってデータ転送に含まれるメモリ・ボード・アドレ
ス、バンク・アドレス、および行および列アドレスが識
別される。
第5図に示すように、各メモリ・モジュール60はメモ
リ・アレイ600を有する。各メモリ・アレイ600は
DRAMが8バンクのメモリに組織されている標準RA
Mである。好適な実施例の場合、高速ページ・モード型
のDRAMが使用される。
リ・アレイ600を有する。各メモリ・アレイ600は
DRAMが8バンクのメモリに組織されている標準RA
Mである。好適な実施例の場合、高速ページ・モード型
のDRAMが使用される。
0
メモリ・モジュール60には、また制御ロジック610
、データ・トランシーバ/レジスタ620、メモリ・ド
ライバ630、およびEEPROM640が含まれる。
、データ・トランシーバ/レジスタ620、メモリ・ド
ライバ630、およびEEPROM640が含まれる。
データ・トランシーバ/レジスタ620によってメモリ
・アレイ600とデータ・バス85の双方向データ線と
の間でデータを転送するためのデータ・バスとデータ・
インターフェースが設けられる。メモリ・ドライバ63
0は、制御ロジック610からメモリ・アレイ600の
各バンクに対して行および列アドレス信号と制御信号を
分配し、ロングワードのデータとその対応するECC信
号をメモリ・ボード信号とバンク・アドレス信号によっ
て選択されたメモリ・バンクに対して転送すると共にこ
れらがそこから転送されることを可能にする。
・アレイ600とデータ・バス85の双方向データ線と
の間でデータを転送するためのデータ・バスとデータ・
インターフェースが設けられる。メモリ・ドライバ63
0は、制御ロジック610からメモリ・アレイ600の
各バンクに対して行および列アドレス信号と制御信号を
分配し、ロングワードのデータとその対応するECC信
号をメモリ・ボード信号とバンク・アドレス信号によっ
て選択されたメモリ・バンクに対して転送すると共にこ
れらがそこから転送されることを可能にする。
いずれのタイプのNVRAM (非揮発性RAM)であ
ってもよいEEPROM640によって、オフ・ライン
修理用のメモリ・エラー・データとモジュールのサイズ
のような構成データが記憶される。故障の発生後メモリ
・モジュールが取り外さ1 れた場合、故障の原因を判定するため、記憶されている
データがEEPROM640から取り出される。EEP
ROM640は、ドライバ630からの行アドレス線を
介して、制御ロジック610からのEEPROM制御信
号によってアドレスされる。EEPROM640は、3
2ビツトの内部メモリ・データ・バス645に対して8
ビツトのデータを転送し、ここからこのデータを受は取
る。
ってもよいEEPROM640によって、オフ・ライン
修理用のメモリ・エラー・データとモジュールのサイズ
のような構成データが記憶される。故障の発生後メモリ
・モジュールが取り外さ1 れた場合、故障の原因を判定するため、記憶されている
データがEEPROM640から取り出される。EEP
ROM640は、ドライバ630からの行アドレス線を
介して、制御ロジック610からのEEPROM制御信
号によってアドレスされる。EEPROM640は、3
2ビツトの内部メモリ・データ・バス645に対して8
ビツトのデータを転送し、ここからこのデータを受は取
る。
制御ロジック610は、メモリ・モジュール60の素子
に対してアドレス信号を転送すると共に内部タイミング
と制御信号を発生する。第6図に詳細に示すように、制
御ロジック612はプライマリ/ミラー指示回路612
を有する。
に対してアドレス信号を転送すると共に内部タイミング
と制御信号を発生する。第6図に詳細に示すように、制
御ロジック612はプライマリ/ミラー指示回路612
を有する。
プライマリ/ミラー指示回路612は、バス80と82
でメモリ制御装置70と75から2組のメモリ・ボード
・アドレス・バンク・アドレス、行および列アドレス、
サイクル・タイプ・サイクル・タイミング信号を受は取
り、またバス80と82てメモリ制御装置に対して2組
のECC信号を転送すると共にここからこれを受は取る
。指示2 装置612のトランシーバ/レジスタによって、これら
の信号をバス80と82との間で授受するバッファとイ
ンターフェースが設けられる。ステータス・レジスタ6
18に記憶されているプライマリ/ミラー・マルチプレ
クサのビットによって、メモリ制御装置70と75のい
ずれがプライマリ・メモリ制御装置として指定され、い
ずれがミラー・メモリ制御装置として指定されかが指示
され、プライマリ/ミラー・マルチプレクサ信号がステ
ータス・レジスタ618から指示装置612に加えられ
る。
でメモリ制御装置70と75から2組のメモリ・ボード
・アドレス・バンク・アドレス、行および列アドレス、
サイクル・タイプ・サイクル・タイミング信号を受は取
り、またバス80と82てメモリ制御装置に対して2組
のECC信号を転送すると共にここからこれを受は取る
。指示2 装置612のトランシーバ/レジスタによって、これら
の信号をバス80と82との間で授受するバッファとイ
ンターフェースが設けられる。ステータス・レジスタ6
18に記憶されているプライマリ/ミラー・マルチプレ
クサのビットによって、メモリ制御装置70と75のい
ずれがプライマリ・メモリ制御装置として指定され、い
ずれがミラー・メモリ制御装置として指定されかが指示
され、プライマリ/ミラー・マルチプレクサ信号がステ
ータス・レジスタ618から指示装置612に加えられ
る。
プライマリ/ミラー指示装置612よって、制御ロジッ
ク610に分配する2組の信号が与えられる。1組の信
号は指定されたプライマリ−・メモリ・ボード・アドレ
ス、バンク・アドレス、行および列アドレス、サイクル
・タイプ、サイクル・タイミングおよびEEC信号を含
む。他方の組の信号は、指定されたミラー・メモリ・ホ
ード・アドレス信号、バンク・アドレス信号、列および
行アドレス信号、サイクル・タイプ信号、サイン3 ル・タイミング信号、およびEEC信号を含む。
ク610に分配する2組の信号が与えられる。1組の信
号は指定されたプライマリ−・メモリ・ボード・アドレ
ス、バンク・アドレス、行および列アドレス、サイクル
・タイプ、サイクル・タイミングおよびEEC信号を含
む。他方の組の信号は、指定されたミラー・メモリ・ホ
ード・アドレス信号、バンク・アドレス信号、列および
行アドレス信号、サイクル・タイプ信号、サイン3 ル・タイミング信号、およびEEC信号を含む。
プライマリ/ミラー・マルチプレクサ信号は、バス80
と82の信号がそれぞれ指定されたプライマリ信号を搬
送する線および指定されたミラー信号を搬送する線に向
けられるか、またはその逆であるかを選択するために指
示装置612によって使用される。
と82の信号がそれぞれ指定されたプライマリ信号を搬
送する線および指定されたミラー信号を搬送する線に向
けられるか、またはその逆であるかを選択するために指
示装置612によって使用される。
バス80と82には多数の時間分周多重化双方向線が含
まれている。メモリ転送サイクル、ステータス・レジス
タ転送サイクル、およびEIEPROM転送サイクルの
開始後一定の時間に、データ・バス75のデータに対応
するFCC信号がこれらの時間分周多重化双方向線に載
置される。もしこの転送サイクルが書き込みサイクルで
あれば、メモリモジュール60はメモリ制御装置からデ
ータとFCC信号を受は取る。もしこの転送サイクルが
読み出しサイクルであれば、メモリ・モジュール60は
データとFCC信号をメモリ・モジュールに転送する。
まれている。メモリ転送サイクル、ステータス・レジス
タ転送サイクル、およびEIEPROM転送サイクルの
開始後一定の時間に、データ・バス75のデータに対応
するFCC信号がこれらの時間分周多重化双方向線に載
置される。もしこの転送サイクルが書き込みサイクルで
あれば、メモリモジュール60はメモリ制御装置からデ
ータとFCC信号を受は取る。もしこの転送サイクルが
読み出しサイクルであれば、メモリ・モジュール60は
データとFCC信号をメモリ・モジュールに転送する。
転送サイクルの他の時間に、アドレス信号、制御信号お
よびタイミング信号は時間分4 局名重化双方向線でメモリ・モンユール60によって受
は取られる。メモリ転送サイクル、ステータス・レジス
タ転送サイクル、およびBBFROM転送サイクルの始
めに、メモリ制御装置70と75がメモリ・ホード・ア
ドレス、バンク・アドレス、およびサイクル・タイプ信
号をこれらの時間共有線で各メモリ・モジュール60に
転送することが望ましい。
よびタイミング信号は時間分4 局名重化双方向線でメモリ・モンユール60によって受
は取られる。メモリ転送サイクル、ステータス・レジス
タ転送サイクル、およびBBFROM転送サイクルの始
めに、メモリ制御装置70と75がメモリ・ホード・ア
ドレス、バンク・アドレス、およびサイクル・タイプ信
号をこれらの時間共有線で各メモリ・モジュール60に
転送することが望ましい。
行アドレス信号と列アドレス信号は同じ転送サイクル中
に同じ行および列アドレス線で多重化されることが望ま
しい。先ず、行アドレスがメモリ制御装置によってメモ
リ・モジュール60に加えられ、約60ナノ秒後に列ア
ドレスが加えられる。
に同じ行および列アドレス線で多重化されることが望ま
しい。先ず、行アドレスがメモリ制御装置によってメモ
リ・モジュール60に加えられ、約60ナノ秒後に列ア
ドレスが加えられる。
シーケンサ−616は、システム・クロック信号とリセ
ット信号をCPUモジュール30から入力として受は取
り、指定されたプライマリ−・サイクル・タイミング信
号、指定されたプライマリ−・サイクル・タイプ信号、
指定されたミラー・サイクル・タイミング信号、および
指定されたミラー・サイクル・タイプ信号を指定装置6
12の5 トランシーバ/レジスタから受は取る。
ット信号をCPUモジュール30から入力として受は取
り、指定されたプライマリ−・サイクル・タイミング信
号、指定されたプライマリ−・サイクル・タイプ信号、
指定されたミラー・サイクル・タイミング信号、および
指定されたミラー・サイクル・タイプ信号を指定装置6
12の5 トランシーバ/レジスタから受は取る。
シーケンサ616は、種々のタイプのサイクルを実行す
るために必要な多数の制御およびシーケンス・タイミン
グ信号を発生し、これらをメモリ・モジュールに対して
分配する関連したステアリンク(steering)論
理を有するリング・カウンタである。制御およびシーケ
ンス・タイミング信号は、システム・クロック信号、指
定されたプライマリ−・サイクル・タイミング信号、お
よび指定されたプライマリ−・サイクル・タイプ信号か
ら発生される。
るために必要な多数の制御およびシーケンス・タイミン
グ信号を発生し、これらをメモリ・モジュールに対して
分配する関連したステアリンク(steering)論
理を有するリング・カウンタである。制御およびシーケ
ンス・タイミング信号は、システム・クロック信号、指
定されたプライマリ−・サイクル・タイミング信号、お
よび指定されたプライマリ−・サイクル・タイプ信号か
ら発生される。
シーケンサ616は、またシステム・クロック信号、指
定されたミラー・サイクル・タイミング信号、および指
定されたミラー・サイクル・タイプ信号から重複した組
のシーケンス・タイミング信号を発生する。これらの重
複したシーケンス・タイミング信号は、エラーのチック
のために使用される。高速ページモードで多重のロング
ワードのデータをメモリ・モジュール60との間で授受
するためには、各組の列アドレスは第1の組でス6 タートし、12727ナノ次の列アドレス120がこれ
に続き、各々のロングワードのデータは前のロングワー
ドのデータの後で120ナノ秒遅れてバス85を横切っ
て移動される。
定されたミラー・サイクル・タイミング信号、および指
定されたミラー・サイクル・タイプ信号から重複した組
のシーケンス・タイミング信号を発生する。これらの重
複したシーケンス・タイミング信号は、エラーのチック
のために使用される。高速ページモードで多重のロング
ワードのデータをメモリ・モジュール60との間で授受
するためには、各組の列アドレスは第1の組でス6 タートし、12727ナノ次の列アドレス120がこれ
に続き、各々のロングワードのデータは前のロングワー
ドのデータの後で120ナノ秒遅れてバス85を横切っ
て移動される。
シーケンサ616は、またt x / r xレジスタ
制御信号を発生する。tx/rxレジスタ制御信号は、
トランシーバ/レジスタ620の動作と指定袋ft、
612のトランシーバ/レジスタを制御するために発生
される。データの流れの方向は、シーケンサ616のス
テアリングロジックによって決定され、このシーケンサ
616はtx/rx制御信号とシーケンス・タイミンク
信号を発生することによって、指定されたプライマリ−
・サイクル・タイプ信号に応答し、データとECC信号
がメモリ・モジュール60のトランシーバ/レジスタに
対して書き込まれるべきであるかまたはここから読み出
されるへきであるか、およびそれらが何時行われるべき
であるかを示す。メモリ書き込みサイクル中、ステータ
ス・レジスタ書き込みサイクル中、および書き込みサイ
クル中、データお7 よびECC信号はバス80.82、および85からトラ
ンシーバ/レジスタにラッチされ、一方メモリ読み出し
サイクル中、ステータス・レジスタ読み出しサイクル中
、およびEEPROM読み出しサイクル中、データおよ
びECC信号は、メモリ・アレイ600、ステータス・
レジスタ618、またはEEPROM640からトラン
シーバ/レジスタにラッチされて、CPUモンユール3
0に出力される。
制御信号を発生する。tx/rxレジスタ制御信号は、
トランシーバ/レジスタ620の動作と指定袋ft、
612のトランシーバ/レジスタを制御するために発生
される。データの流れの方向は、シーケンサ616のス
テアリングロジックによって決定され、このシーケンサ
616はtx/rx制御信号とシーケンス・タイミンク
信号を発生することによって、指定されたプライマリ−
・サイクル・タイプ信号に応答し、データとECC信号
がメモリ・モジュール60のトランシーバ/レジスタに
対して書き込まれるべきであるかまたはここから読み出
されるへきであるか、およびそれらが何時行われるべき
であるかを示す。メモリ書き込みサイクル中、ステータ
ス・レジスタ書き込みサイクル中、および書き込みサイ
クル中、データお7 よびECC信号はバス80.82、および85からトラ
ンシーバ/レジスタにラッチされ、一方メモリ読み出し
サイクル中、ステータス・レジスタ読み出しサイクル中
、およびEEPROM読み出しサイクル中、データおよ
びECC信号は、メモリ・アレイ600、ステータス・
レジスタ618、またはEEPROM640からトラン
シーバ/レジスタにラッチされて、CPUモンユール3
0に出力される。
シーケンサ616は、またEEPROM制御信号を発生
して、EEPROM640の動作を制御する。
して、EEPROM640の動作を制御する。
メモリ・モンユール60に存在するタイミンク関係はシ
ステム・クロック信号の立ち上がり時間を参考にして決
められるが、このシステム・クロック信号は30ナノ秒
の間隔を有している。全てのステータス・レジスタ読み
出しおよび書き込みサイクルと1つのロングワードの全
てのメモリ読み出しおよび書き込みサイクルは、10シ
ステム・クロックの時間内、すなわち300ナノ秒内に
8 実行される。メモリ読み出しおよび書き込み転送サイク
ルは、多重化されたロングワードの転送によって構成さ
れることができる。別のロングワードが転送される毎に
、メモリ転送サイクルは4システム・クロックの期間だ
けさらに延長される。
ステム・クロック信号の立ち上がり時間を参考にして決
められるが、このシステム・クロック信号は30ナノ秒
の間隔を有している。全てのステータス・レジスタ読み
出しおよび書き込みサイクルと1つのロングワードの全
てのメモリ読み出しおよび書き込みサイクルは、10シ
ステム・クロックの時間内、すなわち300ナノ秒内に
8 実行される。メモリ読み出しおよび書き込み転送サイク
ルは、多重化されたロングワードの転送によって構成さ
れることができる。別のロングワードが転送される毎に
、メモリ転送サイクルは4システム・クロックの期間だ
けさらに延長される。
メモリ・リフレッシュ・サイクルとEEPROM書き込
みサイクルを実行するには少なくとも12システム・ク
ロックの間隔が必要てあり、EEPROM読み出しサイ
クルは、少なくとも20システム・クロックの間隔を必
要とする。
みサイクルを実行するには少なくとも12システム・ク
ロックの間隔が必要てあり、EEPROM読み出しサイ
クルは、少なくとも20システム・クロックの間隔を必
要とする。
指定されたプライマリ・サイクル、タイミング信号によ
って、シーケンサ616はシーケンス・タイミンク信号
と制御信号との発生を開始し、これらの信号によって、
メモリ・ホード・アドレス信号によって選択されたメモ
リ・モジュールが要求されたサイクルを実行することが
可能になる。
って、シーケンサ616はシーケンス・タイミンク信号
と制御信号との発生を開始し、これらの信号によって、
メモリ・ホード・アドレス信号によって選択されたメモ
リ・モジュールが要求されたサイクルを実行することが
可能になる。
指定されたプライマリ・サイクル・タイミンク信号が活
性状態に遷移すると、サイクルが開始される。指定され
たプライマリ・サイクル・タイミング信号が不活性状態
に戻ると、サイクルは終了す9 る。
性状態に遷移すると、サイクルが開始される。指定され
たプライマリ・サイクル・タイミング信号が不活性状態
に戻ると、サイクルは終了す9 る。
CPUモジュール30によって要求されたサイクルが実
行されるに従って、シーケンサ616によって発生され
たシーケンス・タイミング信号はシーケンサの入力した
異なった状態と関連する。
行されるに従って、シーケンサ616によって発生され
たシーケンス・タイミング信号はシーケンサの入力した
異なった状態と関連する。
これらの異なった状態の間のタイミング関係(およびこ
れらの状態の各々に対応するシーケンス・タイミング信
号の間のタイミング関係)を決めるため、シーケンサ6
16によって入力することのできるディスクリートな状
態がSEQ IDLEおよび5EQIないし5EQI
9と識別される。
れらの状態の各々に対応するシーケンス・タイミング信
号の間のタイミング関係)を決めるため、シーケンサ6
16によって入力することのできるディスクリートな状
態がSEQ IDLEおよび5EQIないし5EQI
9と識別される。
各状態は、lシステム・クロックの間隔(30ナノ秒)
の間持続する。シーケンサ616の行う各々の異なった
状態に対する入力は、システム・クロック信号の立ち上
がり区間によってトリガされる。シーケンサ616に状
態SEQ IDLEおよび5EQIないし5EQI9
を入力させるシステム・クロック信号の立ち上がり区間
は、これらをシーケンサ616の状態と関連させるため
に遷移TIDLEおよびTIないしT19として表さ0 れる。すなわち、TNはシーケンサ616に状態SEQ
Nを入力させるシステム・クロック信号の立ち上が
り区間である。
の間持続する。シーケンサ616の行う各々の異なった
状態に対する入力は、システム・クロック信号の立ち上
がり区間によってトリガされる。シーケンサ616に状
態SEQ IDLEおよび5EQIないし5EQI9
を入力させるシステム・クロック信号の立ち上がり区間
は、これらをシーケンサ616の状態と関連させるため
に遷移TIDLEおよびTIないしT19として表さ0 れる。すなわち、TNはシーケンサ616に状態SEQ
Nを入力させるシステム・クロック信号の立ち上が
り区間である。
CPUモジュール30がメモリ・モジュール60に1つ
のサイクルを実行させていない場合、指定されたプライ
マリ−・サイクル・タイミング信号は表明されず(no
t asserted) 、シーケンサはSEQ I
DLEの状態のままである。もし制御ロジック610と
シーケンサ616がこれもまたバス80でメモリ制御装
置70から転送されたメモリ・ボード・アドレスによっ
て選択されたメモリ・モジュールに位置しているならば
、シーケンサはメモリ制御装置70によるバス80のサ
イクル・タイミング信号の表明に応答してスタートされ
る(状態5EQIを入力する)。指定されたプライマリ
−・サイクルの活性信号の表明に続く第1システム・ク
ロック信号の立ち上がり区間は、遷移TIに対応する。
のサイクルを実行させていない場合、指定されたプライ
マリ−・サイクル・タイミング信号は表明されず(no
t asserted) 、シーケンサはSEQ I
DLEの状態のままである。もし制御ロジック610と
シーケンサ616がこれもまたバス80でメモリ制御装
置70から転送されたメモリ・ボード・アドレスによっ
て選択されたメモリ・モジュールに位置しているならば
、シーケンサはメモリ制御装置70によるバス80のサ
イクル・タイミング信号の表明に応答してスタートされ
る(状態5EQIを入力する)。指定されたプライマリ
−・サイクルの活性信号の表明に続く第1システム・ク
ロック信号の立ち上がり区間は、遷移TIに対応する。
前に述べたように、メモリ・アレイ600に対して1つ
のロングワードを授受する場合、そのすイクルは10シ
ステム・クロックの間隔で実行される。シーケンサはS
EQ IDLEから状態5EQIないし5EQ9に進
み、S E Q IDLEに戻る。
のロングワードを授受する場合、そのすイクルは10シ
ステム・クロックの間隔で実行される。シーケンサはS
EQ IDLEから状態5EQIないし5EQ9に進
み、S E Q IDLEに戻る。
しかし、別のロングワードを転送するためにメモリ読み
出しおよび書き込みサイクルを延長することができる。
出しおよび書き込みサイクルを延長することができる。
メモリ・アレイ600は、「高速ページ・モードJ D
RAMを使用することが望ましい。多重化されたロング
ワードの読み出しおよび書き込みを行う期間中、最初の
ロングワードの転送の後に行われるメモリ・アレイとの
データの授受は、列アドレスを繰り返して更新し、CA
S(列アドレス・ストローブ)信号を再び発生すること
によって行われる。
RAMを使用することが望ましい。多重化されたロング
ワードの読み出しおよび書き込みを行う期間中、最初の
ロングワードの転送の後に行われるメモリ・アレイとの
データの授受は、列アドレスを繰り返して更新し、CA
S(列アドレス・ストローブ)信号を再び発生すること
によって行われる。
多重化されたロングワードの転送サイクルの期間中、こ
れらの列アドレスのこれらの更新を実行することが可能
であるが、その理由は、全てのロングワードが転送され
るまでシステム616は、5EQ4から5EQ7を繰り
返して循環するからである。例えば、もし3つのロング
ワードがメモ2 す・アレイ600から読み出され、またはこれに書き込
まれているならば、シーケンサは状態5EQIDLE、
5EQI、5EQ2.5EQ3.5EQ4.5EQ5.
5EQ6.5EQ7.5EQ4.5EQ5.5EQ6.
5EQ7.5EQ4.5EQ5.5EQ6.5EQ7.
5EQ8.5EQ9、および5EQIDLEを入力する
。
れらの列アドレスのこれらの更新を実行することが可能
であるが、その理由は、全てのロングワードが転送され
るまでシステム616は、5EQ4から5EQ7を繰り
返して循環するからである。例えば、もし3つのロング
ワードがメモ2 す・アレイ600から読み出され、またはこれに書き込
まれているならば、シーケンサは状態5EQIDLE、
5EQI、5EQ2.5EQ3.5EQ4.5EQ5.
5EQ6.5EQ7.5EQ4.5EQ5.5EQ6.
5EQ7.5EQ4.5EQ5.5EQ6.5EQ7.
5EQ8.5EQ9、および5EQIDLEを入力する
。
メモリ転送サイクルの期間中、指定されたプライマリ・
サイクル・タイミング信号は、遷移T6の間のシーケン
サ616によって監視され、少なくとも1つの別のロン
グワードを転送するため、メモリ読み出しまたは書き込
みサイクルを延長するべきかどうかを決定する。指定さ
れたプライマリ・サイクル・タイミング信号が遷移T6
中に表明された場合、状態5EQ7にあるシケンサは状
態5EQ8を入力する代わりに状態5EQ4を入力する
ことによって、次のシステム・クロック信号に応答する
。
サイクル・タイミング信号は、遷移T6の間のシーケン
サ616によって監視され、少なくとも1つの別のロン
グワードを転送するため、メモリ読み出しまたは書き込
みサイクルを延長するべきかどうかを決定する。指定さ
れたプライマリ・サイクル・タイミング信号が遷移T6
中に表明された場合、状態5EQ7にあるシケンサは状
態5EQ8を入力する代わりに状態5EQ4を入力する
ことによって、次のシステム・クロック信号に応答する
。
多重ロングワードの転送の場合、指定されたプライマリ
−・サイクル・タイミング信号は、少な3 くとも第1T6の遷移の15ナノ秒前に表明され、最後
のロングワードが転送される迄、表明されたままである
。最後のロングワードが転送されてしまった後でメモリ
転送サイクルを終了するため、指定されたプライマリ・
サイクル・タイミング信号が最後のT6の遷移の少なく
とも15ナノ秒前に表明を解かれ、最後のT6の伝送の
後、少なくとも10ナノ秒間表明を解かれたままになる
。
−・サイクル・タイミング信号は、少な3 くとも第1T6の遷移の15ナノ秒前に表明され、最後
のロングワードが転送される迄、表明されたままである
。最後のロングワードが転送されてしまった後でメモリ
転送サイクルを終了するため、指定されたプライマリ・
サイクル・タイミング信号が最後のT6の遷移の少なく
とも15ナノ秒前に表明を解かれ、最後のT6の伝送の
後、少なくとも10ナノ秒間表明を解かれたままになる
。
メモリ転送サイクルの期間中、指定されたプライマリ行
アドレス信号と指定されたプライマリ列アドレス信号は
、制御ロジック610内の指定装置612によって別の
時間に1組の時間分周多重化線上でメモリ・ドライバ6
30に与えられる。
アドレス信号と指定されたプライマリ列アドレス信号は
、制御ロジック610内の指定装置612によって別の
時間に1組の時間分周多重化線上でメモリ・ドライバ6
30に与えられる。
ドライバ630の出力はメモリ・アレイ600のDRA
Mのアドレス入力に加えられ、また指定されたミラー行
および列アドレス信号と比較するため制御ロジック61
0に戻されてエラーをチックする。状態レンスタ転送サ
イクルとE E P ROM転送サイクルの期間中、列
アドレス信号は指定の記憶場所を選択するために必要で
はない。
Mのアドレス入力に加えられ、また指定されたミラー行
および列アドレス信号と比較するため制御ロジック61
0に戻されてエラーをチックする。状態レンスタ転送サ
イクルとE E P ROM転送サイクルの期間中、列
アドレス信号は指定の記憶場所を選択するために必要で
はない。
4
メモリ転送サイクルの期間中、行アドレス信号はバス8
0と82の時間を共有する行および列アドレスに与えら
れた最初の信号である。状態5IEQIDLEの期間中
、行アドレス信号は、メモリ制御装置によって行および
列アドレス線で転送され、列アドレスはT1の遷移の少
なくとも15ナノ秒前からTIの遷移後のlOナノ秒ま
で安定した状態にある。次に、列アドレス信号はメモリ
制御装置によって行およびコラムアドレス線で転送され
、列アドレスは、T3の遷移のlOナノ秒前からT4の
遷移の後15ナノ秒まで安定した状態にある。メモリ転
送サイクルの期間中に多重ロングワードの転送を行う場
合、続いて発生する列アドレス信号は、次に行およびコ
ラムアドレス線で転送され、これらの続いて発生する列
アドレスはT6の遷移のlOナノ秒前からT7の遷移の
後15ナノ秒まで安定した状態にある。
0と82の時間を共有する行および列アドレスに与えら
れた最初の信号である。状態5IEQIDLEの期間中
、行アドレス信号は、メモリ制御装置によって行および
列アドレス線で転送され、列アドレスはT1の遷移の少
なくとも15ナノ秒前からTIの遷移後のlOナノ秒ま
で安定した状態にある。次に、列アドレス信号はメモリ
制御装置によって行およびコラムアドレス線で転送され
、列アドレスは、T3の遷移のlOナノ秒前からT4の
遷移の後15ナノ秒まで安定した状態にある。メモリ転
送サイクルの期間中に多重ロングワードの転送を行う場
合、続いて発生する列アドレス信号は、次に行およびコ
ラムアドレス線で転送され、これらの続いて発生する列
アドレスはT6の遷移のlOナノ秒前からT7の遷移の
後15ナノ秒まで安定した状態にある。
ジェネレータ/チエッカ617はシーケンサ616によ
って発生された2組のシーケンス・タイミング信号を受
は取る。更に、指定されたプラ5 イマリ・サイクル・タイプ信号とバンク・アドレス信号
および指定されたミラー・サイクル・タイプ信号とバン
ク・アドレス信号が指定装置612によってジェネレー
タ/チエッカ617に転送される。ジェネレータ/チエ
ッカでは、多数のプライマリ制御信号、すなわちRAS
(行アドレス信号)、CAS(列アドレス・ストロー
ブ)およびWE (書き込みイネーブル)が発生され、
プライマリ・シーケンス・タイミング信号と指定された
プライマリ・サイクル・タイプ信号およびバンク・アド
レス信号を使用してドライバ630に分配される。これ
らの制御信号の重複した組がジェネレータ/チエッカ6
17によって重複(ミラー)シーケンス・タイミング信
号と指定されたミラー・サイクル・タイプ信号およびバ
ンク・アドレス信号から発生される。これらのミラーR
AS、CAS、および書き込みイネーブル信号はエラー
のチエツクのために使用される。
って発生された2組のシーケンス・タイミング信号を受
は取る。更に、指定されたプラ5 イマリ・サイクル・タイプ信号とバンク・アドレス信号
および指定されたミラー・サイクル・タイプ信号とバン
ク・アドレス信号が指定装置612によってジェネレー
タ/チエッカ617に転送される。ジェネレータ/チエ
ッカでは、多数のプライマリ制御信号、すなわちRAS
(行アドレス信号)、CAS(列アドレス・ストロー
ブ)およびWE (書き込みイネーブル)が発生され、
プライマリ・シーケンス・タイミング信号と指定された
プライマリ・サイクル・タイプ信号およびバンク・アド
レス信号を使用してドライバ630に分配される。これ
らの制御信号の重複した組がジェネレータ/チエッカ6
17によって重複(ミラー)シーケンス・タイミング信
号と指定されたミラー・サイクル・タイプ信号およびバ
ンク・アドレス信号から発生される。これらのミラーR
AS、CAS、および書き込みイネーブル信号はエラー
のチエツクのために使用される。
プライマリ・サイクル・タンプ信号がメモリ転送サイク
ルが実行中であることを示す場合、プラ6 イマリ・バンク・アドレス信号はメモリ・アレイ600
内のDRAMの1つの選択されたバンクを識別する。メ
モリ・ドライバ630はメモリ・アレイ600内のDR
AMの各バンクに対して別々のRASドライバを有して
いる。ジェネレータ/チエッカ617においてプライマ
リRAS信号は、メモリ転送サイクル中に発生され、ジ
ェネレータ/チエッカをRASドライバに接続する線の
1つに非多重化される。その結果、選択されたDRAM
バンクに対応するRASドライバのみがメモリ転送サイ
クル中に表明されたRAS信号を受は取る。
ルが実行中であることを示す場合、プラ6 イマリ・バンク・アドレス信号はメモリ・アレイ600
内のDRAMの1つの選択されたバンクを識別する。メ
モリ・ドライバ630はメモリ・アレイ600内のDR
AMの各バンクに対して別々のRASドライバを有して
いる。ジェネレータ/チエッカ617においてプライマ
リRAS信号は、メモリ転送サイクル中に発生され、ジ
ェネレータ/チエッカをRASドライバに接続する線の
1つに非多重化される。その結果、選択されたDRAM
バンクに対応するRASドライバのみがメモリ転送サイ
クル中に表明されたRAS信号を受は取る。
リフレッシュ・サイクルの期間中、プライマリRAS信
号は非多重化されず、表明されたRAS信号が各RAS
ドライバによって受は取られる。
号は非多重化されず、表明されたRAS信号が各RAS
ドライバによって受は取られる。
ステータス・レジスタ転送サイクルとBll!FROM
転送サイクルの期間中、バンク・アドレス信号は不必要
である。
転送サイクルの期間中、バンク・アドレス信号は不必要
である。
メモリ・ドライバ630はまたCASドライバを有する
。ジェネレータ/チエッカ617において、プライマリ
CAS信号はメモリ転送サイクル7 とリフレッシュ・サイクルの期間中に発生される。
。ジェネレータ/チエッカ617において、プライマリ
CAS信号はメモリ転送サイクル7 とリフレッシュ・サイクルの期間中に発生される。
プライマリCAS信号は、非多重化されず、表明された
CAS信号は各CASドライバによって受は取られる。
CAS信号は各CASドライバによって受は取られる。
メモリ書き込みサイクルの期間中、プライマリWE信号
はジェネレータ/チエッカ617によって発生される。
はジェネレータ/チエッカ617によって発生される。
表明されたWE倍信号、ドライバ630によってメモリ
・アレイ600内の各DRAMバンクに加えられる。し
かし、書き込みは選択ささたDRAMバンクによっての
み実行することが可能でり、このDRAMバンクはまた
表面されたRASおよびCAS信号を受は取る。
・アレイ600内の各DRAMバンクに加えられる。し
かし、書き込みは選択ささたDRAMバンクによっての
み実行することが可能でり、このDRAMバンクはまた
表面されたRASおよびCAS信号を受は取る。
本発明の好適な実施例の場合、メモリ転送サイクルの期
間中、プライマリRAS信号はT2の遷移の期間中表明
され、T3の遷移の少なくともlOナノ秒前から安定し
、最後のT7の遷移の期間中表面を解かれる。プライマ
リCAS信号は、各T4の遷移の前15ナノ秒間表明さ
れ、各T7の遷移の期間中表明を解かれる。メモリ書き
込みサイクルの期間中、プライマリWE信号は、T38 の遷移の期間中表明され、最初のT4の遷移の少なくと
も10ナノ秒前から安定し、最後のT7の遷移に期間中
表面を解かれる。
間中、プライマリRAS信号はT2の遷移の期間中表明
され、T3の遷移の少なくともlOナノ秒前から安定し
、最後のT7の遷移の期間中表面を解かれる。プライマ
リCAS信号は、各T4の遷移の前15ナノ秒間表明さ
れ、各T7の遷移の期間中表明を解かれる。メモリ書き
込みサイクルの期間中、プライマリWE信号は、T38 の遷移の期間中表明され、最初のT4の遷移の少なくと
も10ナノ秒前から安定し、最後のT7の遷移に期間中
表面を解かれる。
プライマリ・サイクル・タイプ信号がメモリ・リフレッ
シュ・サイクルが実行中であることを示す場合、メモリ
・アレイ600はシーケンサ616によって与えられる
プライマリ・シーケンス・タイミンク信−弓に応答して
、ジェネレータ/チエッカ617によってメモリ・リフ
レッシュ動作を実行さされる。これらのリフレッシュ動
作の期間中、RAS信号およびCAS信号が逆の順序で
ジェネレータ/チエッカによって発生されて分配される
。
シュ・サイクルが実行中であることを示す場合、メモリ
・アレイ600はシーケンサ616によって与えられる
プライマリ・シーケンス・タイミンク信−弓に応答して
、ジェネレータ/チエッカ617によってメモリ・リフ
レッシュ動作を実行さされる。これらのリフレッシュ動
作の期間中、RAS信号およびCAS信号が逆の順序で
ジェネレータ/チエッカによって発生されて分配される
。
このリフレッシュ・モートはバンク、行または列に対す
る外部アドレスを必要としない。
る外部アドレスを必要としない。
転送サイクルの期間中、データがバス85い転送されて
いる時間に、FCC信号はハス80と82の時間分周多
重化双方向線で転送される。しかし、これらの同し線は
転送サイクル中の他の時間に制御信号(例えば、サイク
ル・タイプ)およびアドレス信号(例えば、メモリ・ボ
ード・アト9 レスおよびハング・アドレス)信号を転送するために使
用される。
いる時間に、FCC信号はハス80と82の時間分周多
重化双方向線で転送される。しかし、これらの同し線は
転送サイクル中の他の時間に制御信号(例えば、サイク
ル・タイプ)およびアドレス信号(例えば、メモリ・ボ
ード・アト9 レスおよびハング・アドレス)信号を転送するために使
用される。
プライマリ/ミラー指定装置612内のトランシーバ/
レジスタはシーケンサ616によって加えられるシーケ
ンス・タイミング信号ともtx/rxレジスタ制御信号
に応答する受信機と発信機を有する。シーケンス・タイ
ミング信号とLx/r Xレジスタ制御信号は、バス8
0と82の時間分周多重化双方向線でFCC信号とアド
レス信号および制御信号を多重化することを可能にする
。
レジスタはシーケンサ616によって加えられるシーケ
ンス・タイミング信号ともtx/rxレジスタ制御信号
に応答する受信機と発信機を有する。シーケンス・タイ
ミング信号とLx/r Xレジスタ制御信号は、バス8
0と82の時間分周多重化双方向線でFCC信号とアド
レス信号および制御信号を多重化することを可能にする
。
サイクル・タイプ信号、メモリ・ボード・アドレス信号
およびバンク・アドレス信号のような制御信号とアドレ
ス信号はメモリ制御装置70と75によって転送され、
単一の転送サイクルまたは多重ロングワード転送サイク
ルのいずれかの開始時にハス80と82の時間を共有し
た線に与えられることが望ましい。これらの信号はサイ
クル・タイミング信号の活性化と同時に遷移を開始しく
シーケンサはSEQ IDLE状態にあるが)T2の
間安定状態にある。従って、指定装置6120 のトランシーバ/レジスタにおいて、受信機は起動され
、送信機は少なくとも状態5EQ2の終わり迄そのトリ
ステート・モードにセットされる。
およびバンク・アドレス信号のような制御信号とアドレ
ス信号はメモリ制御装置70と75によって転送され、
単一の転送サイクルまたは多重ロングワード転送サイク
ルのいずれかの開始時にハス80と82の時間を共有し
た線に与えられることが望ましい。これらの信号はサイ
クル・タイミング信号の活性化と同時に遷移を開始しく
シーケンサはSEQ IDLE状態にあるが)T2の
間安定状態にある。従って、指定装置6120 のトランシーバ/レジスタにおいて、受信機は起動され
、送信機は少なくとも状態5EQ2の終わり迄そのトリ
ステート・モードにセットされる。
サイクル・タイプ信号は、下記にリストアツブした機能
、すなわちメモリの読み出し、メモリの書き込み、ステ
ータス・レジスタの読み出し、ステータス・レジスタの
書き込み、EEFROMの読み出し、EEPROMの書
き込み、およびリフレッシュのいずれがサイクル期間中
にメモリ・アサイ60によって実行されるかを識別する
。指定装置612によって受は取られた指定されたプラ
イマリ・サイクル・タイプ信号は、シーケンサ616に
加えられ、tx/rx制御信号とシーケンス・タイミン
グ信号を発生する場合に使用される。例えば、データ・
トランシーバ/レジスタ620および指定装置612の
トランシーバ/レジスタにおいて、受信機は起動され、
送信機は書き込みサイクル全体を通してシーケンサ61
6によってトリステート・モードにセットされる。しか
し、読み出し期間中のデータ・トランシーバ/4ル ジスタ620および指定装置612のトランシーバ/レ
ジスタの場合、受信機はトリステート・モードにセット
され、送信機はサイクル・タイプ信号、メモリ・ホード
・アドレス信号およびバンク・アドレス信号がこのサイ
クルの開始時点で受は取られた後シーケンサ616によ
って起動される。
、すなわちメモリの読み出し、メモリの書き込み、ステ
ータス・レジスタの読み出し、ステータス・レジスタの
書き込み、EEFROMの読み出し、EEPROMの書
き込み、およびリフレッシュのいずれがサイクル期間中
にメモリ・アサイ60によって実行されるかを識別する
。指定装置612によって受は取られた指定されたプラ
イマリ・サイクル・タイプ信号は、シーケンサ616に
加えられ、tx/rx制御信号とシーケンス・タイミン
グ信号を発生する場合に使用される。例えば、データ・
トランシーバ/レジスタ620および指定装置612の
トランシーバ/レジスタにおいて、受信機は起動され、
送信機は書き込みサイクル全体を通してシーケンサ61
6によってトリステート・モードにセットされる。しか
し、読み出し期間中のデータ・トランシーバ/4ル ジスタ620および指定装置612のトランシーバ/レ
ジスタの場合、受信機はトリステート・モードにセット
され、送信機はサイクル・タイプ信号、メモリ・ホード
・アドレス信号およびバンク・アドレス信号がこのサイ
クルの開始時点で受は取られた後シーケンサ616によ
って起動される。
適切な実施例の場合、メモリ・アレイ600に対して授
受されたデータはエラー検出コード(E D C)を使
用して各メモリ・モジュール60内でチエツクされるこ
とが望ましく、このエラー検出コードはメモリ制御装置
70と75によって必要とされるコードと同じであるこ
とが望ましい。
受されたデータはエラー検出コード(E D C)を使
用して各メモリ・モジュール60内でチエツクされるこ
とが望ましく、このエラー検出コードはメモリ制御装置
70と75によって必要とされるコードと同じであるこ
とが望ましい。
好適なコードは1ビツト修正、2ビツト検出のエラー修
正コード(E CC)であることが望ましい。
正コード(E CC)であることが望ましい。
メモリ書き込みサイクルの期間中、メモリ制御装置70
は少なくとも1つのロングワードのデータをデータ・ハ
ス85で転送し、同時に対応する組のFCC信号をバス
80で転送する。一方、メモリ制御装置75は第2組の
FCC信号を転送し、2 これらの信号はバス82のデータ・バス85のロングワ
ードとまた対応する。
は少なくとも1つのロングワードのデータをデータ・ハ
ス85で転送し、同時に対応する組のFCC信号をバス
80で転送する。一方、メモリ制御装置75は第2組の
FCC信号を転送し、2 これらの信号はバス82のデータ・バス85のロングワ
ードとまた対応する。
ここで実施されているように、メモリ書き込みサイクル
の期間中、各ロングワードに対するデータとECC信号
がデータ・トランシーバ/レジスタ620の受信機に与
えられると共に指定装置612のトランシーバ/レジス
タの受信機に与えられる。データおよびECC信号はT
4の遷移の少なくともlOナノ秒前に安定しており、T
6の遷移後15ナノ秒後迄安定した状態にあり、これら
のトランシーバ/レジスタにラッチされる。この時間の
間、メモリ制御装置70と75はバス80と82の時間
を共有した線にアドレス信号と制御信号を加えない。
の期間中、各ロングワードに対するデータとECC信号
がデータ・トランシーバ/レジスタ620の受信機に与
えられると共に指定装置612のトランシーバ/レジス
タの受信機に与えられる。データおよびECC信号はT
4の遷移の少なくともlOナノ秒前に安定しており、T
6の遷移後15ナノ秒後迄安定した状態にあり、これら
のトランシーバ/レジスタにラッチされる。この時間の
間、メモリ制御装置70と75はバス80と82の時間
を共有した線にアドレス信号と制御信号を加えない。
メモリ書き込みサイクルの期間中に指定装置612によ
って受は取られた指定されたプライマリECC信号とト
ランシーバ/レジスタ620によって受は取られたロン
グワードのデータは、メモリ・アレイ600の8つのバ
ンクの各々に於けるDRAMのデータ入力とECC発生
装置623に加えられる。発生されたFCCは比較器6
25によって指定されたプライマリ・FCCと比較され
る。指定されたプライマリ・ECC信号は、また指定さ
れたミラー・ECC信号と共にECC比較器625に加
えられる。
って受は取られた指定されたプライマリECC信号とト
ランシーバ/レジスタ620によって受は取られたロン
グワードのデータは、メモリ・アレイ600の8つのバ
ンクの各々に於けるDRAMのデータ入力とECC発生
装置623に加えられる。発生されたFCCは比較器6
25によって指定されたプライマリ・FCCと比較され
る。指定されたプライマリ・ECC信号は、また指定さ
れたミラー・ECC信号と共にECC比較器625に加
えられる。
ここで実施例されているように、メモリ読み出しサイク
ルの期間中、少なくとも1つのロングワードのデータと
対応する組のECC信号がメモリ・アレイ600から読
み出され、データ・トランシーバ/レジスタ620と指
定装置612のトランシーバ/レジスタにそれぞれ向け
られる。メモリ読み出しサイクルの遷移T7の期間中、
各ロングワードに対するデータとECC信号はメモリ・
アレイ600から入手可能であり、これらのトランシー
バ/レジスタにラッチされる。このデータはECC発生
装置623に与えられ、その出力はメモリから読み出さ
れたFCCと比較される。
ルの期間中、少なくとも1つのロングワードのデータと
対応する組のECC信号がメモリ・アレイ600から読
み出され、データ・トランシーバ/レジスタ620と指
定装置612のトランシーバ/レジスタにそれぞれ向け
られる。メモリ読み出しサイクルの遷移T7の期間中、
各ロングワードに対するデータとECC信号はメモリ・
アレイ600から入手可能であり、これらのトランシー
バ/レジスタにラッチされる。このデータはECC発生
装置623に与えられ、その出力はメモリから読み出さ
れたFCCと比較される。
ラッチの後、データおよびECC信号は、データ・トラ
ンシーバ/レジスタ620の送信機と指定装置612の
トランシーバ/レジスタの送信機4 によってデータ・バス85とバス80および82に与え
られる。同じECC信号は、指定装置612のトランシ
ーバ/レジスタからメモリ制御装置70とメモリ制御装
置75に転送される。データバス85とバス80および
82て転送されたデータとE ’CC信号は、T7の遷
移の15秒後からこれに続<T6の遷移の5ナノ秒前迄
(多重ロングワード転送の場合)またはこれに続<T
IDLE遷移の5ナノ秒前迄(単一のロングワードの
転送または多重ロングワード転送の最後のロングワード
の場合)安定した状態にある。この時間間隔の間、メモ
リ制御装置70と75は、バス80と82の時間を共有
したアドレス信号と制御信号を加えない。データ・トラ
ンシーバ/レジスタ620の送信機と指定装置612の
トランシーバ/レジスタの送信機は、これに続<T
IDLE遷移の期間中、トリステート・モードにセット
される。
ンシーバ/レジスタ620の送信機と指定装置612の
トランシーバ/レジスタの送信機4 によってデータ・バス85とバス80および82に与え
られる。同じECC信号は、指定装置612のトランシ
ーバ/レジスタからメモリ制御装置70とメモリ制御装
置75に転送される。データバス85とバス80および
82て転送されたデータとE ’CC信号は、T7の遷
移の15秒後からこれに続<T6の遷移の5ナノ秒前迄
(多重ロングワード転送の場合)またはこれに続<T
IDLE遷移の5ナノ秒前迄(単一のロングワードの
転送または多重ロングワード転送の最後のロングワード
の場合)安定した状態にある。この時間間隔の間、メモ
リ制御装置70と75は、バス80と82の時間を共有
したアドレス信号と制御信号を加えない。データ・トラ
ンシーバ/レジスタ620の送信機と指定装置612の
トランシーバ/レジスタの送信機は、これに続<T
IDLE遷移の期間中、トリステート・モードにセット
される。
比較器614は、制御装置70から発生するアドレス信
号制御装置およびタイミング信号を制御装置75から発
生するこれらに対応するアドレス5 信号、制御信号およびタイミング信号と比較するために
設けられる。指定されたプライマリ・サイクル・タイミ
ング信号、サイクル・タイプ信号、メモリ・ボード・ア
ドレス信号、およびバンク・アドレス信号は、指定され
たミラー・サイクル・タイミング信号、サイクル・タイ
プ信号、メモリ・ボードアドレス信号、バンク・アドレ
ス信号、行アドレス信号、および列アドレス信号と共に
指定装置612から比較器614に加えられる。指定さ
れたプライマリ行アドレス信号および列アドレス信号は
ドライバ630の出力から比較器614に加えられる。
号制御装置およびタイミング信号を制御装置75から発
生するこれらに対応するアドレス5 信号、制御信号およびタイミング信号と比較するために
設けられる。指定されたプライマリ・サイクル・タイミ
ング信号、サイクル・タイプ信号、メモリ・ボード・ア
ドレス信号、およびバンク・アドレス信号は、指定され
たミラー・サイクル・タイミング信号、サイクル・タイ
プ信号、メモリ・ボードアドレス信号、バンク・アドレ
ス信号、行アドレス信号、および列アドレス信号と共に
指定装置612から比較器614に加えられる。指定さ
れたプライマリ行アドレス信号および列アドレス信号は
ドライバ630の出力から比較器614に加えられる。
そこで両方の組の信号が比較される。
もし、メモリ制御装置から発生するアドレス信号、制御
信号、およびタイミング信号の間で比較のミスがあれば
、比較器614は適当なエラー信号を発生する。第6図
に示すように、ボード・アドレス・エラー信号、バンク
・アドレス・エラー信号、行アドレス・エラー信号、列
アドレス・エラー信号、サイクル・タイプ・アドレス・
エラー6 信号、およびサイクル・タイミング・エラー信号は比較
器から発生することができる。
信号、およびタイミング信号の間で比較のミスがあれば
、比較器614は適当なエラー信号を発生する。第6図
に示すように、ボード・アドレス・エラー信号、バンク
・アドレス・エラー信号、行アドレス・エラー信号、列
アドレス・エラー信号、サイクル・タイプ・アドレス・
エラー6 信号、およびサイクル・タイミング・エラー信号は比較
器から発生することができる。
ジェネレータ/チエッカ617は、指定されたプライマ
リ・バンク・アドレス信号、サイクル・タイプ信号およ
びサイクル・タイミング信号を使用してシーケンサ61
6およびジェネレータ/チエッカ617によって発生さ
れたプライマリ制御信号およびタイミング信号を、指定
されたミラー・バンク・アドレス信号、サイクル・タイ
プ信号およびサイクル・タイミング信号を使用して、発
生されたミラー制御信号およびタイミング信号と比較す
る。2組のシーケンス・タイミング信号は、シーケンサ
616によってジェネレータ/チエ・ツカ617に加え
られる。プライマリRAS信号、CAS信号、およびW
E倍信号、ドライバ630の出力からジェネレータ/チ
エッカ617に加えられる。前に説明したように、ミラ
ーRAS信号、CAS信号およびWE倍信号ジェネレー
タ/チエッカによって内部的に発生される。ジェネレー
タ/チエッカ617は、プライマリRAS信号、ング信
号をミラーRAS信号、CAS信号、WE倍信号および
シーケンス・タイミング信号と比較する。
リ・バンク・アドレス信号、サイクル・タイプ信号およ
びサイクル・タイミング信号を使用してシーケンサ61
6およびジェネレータ/チエッカ617によって発生さ
れたプライマリ制御信号およびタイミング信号を、指定
されたミラー・バンク・アドレス信号、サイクル・タイ
プ信号およびサイクル・タイミング信号を使用して、発
生されたミラー制御信号およびタイミング信号と比較す
る。2組のシーケンス・タイミング信号は、シーケンサ
616によってジェネレータ/チエ・ツカ617に加え
られる。プライマリRAS信号、CAS信号、およびW
E倍信号、ドライバ630の出力からジェネレータ/チ
エッカ617に加えられる。前に説明したように、ミラ
ーRAS信号、CAS信号およびWE倍信号ジェネレー
タ/チエッカによって内部的に発生される。ジェネレー
タ/チエッカ617は、プライマリRAS信号、ング信
号をミラーRAS信号、CAS信号、WE倍信号および
シーケンス・タイミング信号と比較する。
もし、シーケンサ616またジェネレータ/チエッカ6
17から発生する制御信号およびタイミンク信号のいず
れかの間に比較のミあれば、ジェネレータ/チエッカは
適当なエラー信号を発生する。第6図に示すように、シ
ーケンサ・エラー信号、RASエラー信号、C,ASエ
ラー信号、およびWEエラー信号はジェネレータ/チエ
ッカ617によって発生することかできる。
17から発生する制御信号およびタイミンク信号のいず
れかの間に比較のミあれば、ジェネレータ/チエッカは
適当なエラー信号を発生する。第6図に示すように、シ
ーケンサ・エラー信号、RASエラー信号、C,ASエ
ラー信号、およびWEエラー信号はジェネレータ/チエ
ッカ617によって発生することかできる。
エラー信号は、比較器614およびジェネレータ/チエ
ッカ617からアドレス/制御エラー・ロジック621
に加えられる。比較器614またはジェネレータ/チエ
ッカ617から受は取ったエラー信号に応答して、アド
レス/制御エラー・ロジック621はアドレス/制御エ
ラー信号をCPUモジュール30に転送し、アドレス信
号・制御信号、またはタイミング信号のいずれかの間8 で比較のミスが発生したことによる故障を検出したこと
を示す。アドレス/制御エラー信号は、エラーを処理す
るためにメモリ制御装置70と75のエラー・ロジック
に送られる。アドレス/制御エラー信号をCPUモジュ
ール30にすることによって、CPU/MEM故障が発
生するが、これは他のセクションで詳細に論しる。
ッカ617からアドレス/制御エラー・ロジック621
に加えられる。比較器614またはジェネレータ/チエ
ッカ617から受は取ったエラー信号に応答して、アド
レス/制御エラー・ロジック621はアドレス/制御エ
ラー信号をCPUモジュール30に転送し、アドレス信
号・制御信号、またはタイミング信号のいずれかの間8 で比較のミスが発生したことによる故障を検出したこと
を示す。アドレス/制御エラー信号は、エラーを処理す
るためにメモリ制御装置70と75のエラー・ロジック
に送られる。アドレス/制御エラー信号をCPUモジュ
ール30にすることによって、CPU/MEM故障が発
生するが、これは他のセクションで詳細に論しる。
比較器614およびジェネレータ/チエッカ617から
のエラー信号は、またステータス・レジスタ618に加
えられる。エラー信号および故障に関連するアドレス信
号、制御信号、タイミング信号、データ信号およびEC
C信号の全ては、−時的にステータス・レジスタに記憶
され、エラーの診断と修復を可能にする。
のエラー信号は、またステータス・レジスタ618に加
えられる。エラー信号および故障に関連するアドレス信
号、制御信号、タイミング信号、データ信号およびEC
C信号の全ては、−時的にステータス・レジスタに記憶
され、エラーの診断と修復を可能にする。
本発明の1つの特徴によれば、32ピツトのデータ・バ
ス85が1本だけCPUモジュール30とメモリ・モン
ユール60との間に設けられる。
ス85が1本だけCPUモジュール30とメモリ・モン
ユール60との間に設けられる。
従って、メモリ・モジュール60はメモリ制御装置70
と75からの2組のデータを比較することができない。
と75からの2組のデータを比較することができない。
しかし、メモリ制御装置70と759
によってメモリ・モジュール60に転送された2つの独
立した組のECC信号をチックすることによって、ビッ
トのデータ線の重複した組を使用することなく、データ
の健全性がメモリ・モジュール60によって検証される
。
立した組のECC信号をチックすることによって、ビッ
トのデータ線の重複した組を使用することなく、データ
の健全性がメモリ・モジュール60によって検証される
。
第6図に示すように、制御ロジック610はECC発生
装置623とECC比較器625を有する。指定された
プライマリおよびミラーECC信号は、指定装置712
によってFCC比較器に加えられる。メモリー書き込み
サイクルの期間中、指定されたプライマリECC信号は
、指定されたミラーECC信号と比較される。その結果
、メモリ・モジュール60は、メモリ制御装置70と7
5が一致しているかどうかを検証すると共にメモリー書
き込みサイクルの期間中にメモリ・アレイ600のDR
AMに記憶されている指定されたプライマリECC信号
が正しいかどうかを検証する。更に、メモリー書き込み
サイクルの期間中にDRAMのデータ人力に与えられた
データは、ECC発生装置623に加えられる。FCC
発生0 装置623は、このデータ応する1組の発生されたEC
C信号を発生し、この発生されたECC信号をECC比
較器625に加える。指定されたプライマリECC信号
は発生されたECC信号と比較され、メモリ制御装置7
0によってデータ・バス85に転送されたデータがメモ
リ・アレイ600のDRAMに記憶されているデータと
同じであるかどうかを検証する。
装置623とECC比較器625を有する。指定された
プライマリおよびミラーECC信号は、指定装置712
によってFCC比較器に加えられる。メモリー書き込み
サイクルの期間中、指定されたプライマリECC信号は
、指定されたミラーECC信号と比較される。その結果
、メモリ・モジュール60は、メモリ制御装置70と7
5が一致しているかどうかを検証すると共にメモリー書
き込みサイクルの期間中にメモリ・アレイ600のDR
AMに記憶されている指定されたプライマリECC信号
が正しいかどうかを検証する。更に、メモリー書き込み
サイクルの期間中にDRAMのデータ人力に与えられた
データは、ECC発生装置623に加えられる。FCC
発生0 装置623は、このデータ応する1組の発生されたEC
C信号を発生し、この発生されたECC信号をECC比
較器625に加える。指定されたプライマリECC信号
は発生されたECC信号と比較され、メモリ制御装置7
0によってデータ・バス85に転送されたデータがメモ
リ・アレイ600のDRAMに記憶されているデータと
同じであるかどうかを検証する。
メモリ読み出しサイクルの期間中、DRAMの選択され
たバンクから読み出されたデータはECC発生器に与え
られる。発生されたECC信号はそこでFCC比較器に
加えられ、このFCC比較器は、またDRAMの選択さ
れたバンクから読み出されて記憶されているECC信号
を受は取る。発生され記憶されているECC信号は、E
CC比較器625によって比較される。
たバンクから読み出されたデータはECC発生器に与え
られる。発生されたECC信号はそこでFCC比較器に
加えられ、このFCC比較器は、またDRAMの選択さ
れたバンクから読み出されて記憶されているECC信号
を受は取る。発生され記憶されているECC信号は、E
CC比較器625によって比較される。
もしECC比較器625によって監視されているECC
信号のいずれかの対の間に比較のミスがあれば、FCC
比較器は適当なエラー信号を発生する。第6図に示すよ
うに、プライマリ/ミラーECCエラー信号、プライマ
リ/発生されたECC信号エラーおよびメモリ/発生さ
れたECCエラー信号はFCC比較器によって発生する
ことができる。
信号のいずれかの対の間に比較のミスがあれば、FCC
比較器は適当なエラー信号を発生する。第6図に示すよ
うに、プライマリ/ミラーECCエラー信号、プライマ
リ/発生されたECC信号エラーおよびメモリ/発生さ
れたECCエラー信号はFCC比較器によって発生する
ことができる。
ECC比較器625からのこれらのECCエラー信号は
ステータス・レジスタ618に加えられる。ECCエラ
ー信号の各々およびFCC故障に関連するアドレス信号
、制御信号、タイミング信号、データ信号、およびEC
C信号の全ては一時的にステータス・レジスタに記憶さ
れ、エラーの診断と修復を可能にする。
ステータス・レジスタ618に加えられる。ECCエラ
ー信号の各々およびFCC故障に関連するアドレス信号
、制御信号、タイミング信号、データ信号、およびEC
C信号の全ては一時的にステータス・レジスタに記憶さ
れ、エラーの診断と修復を可能にする。
ECCエラー信号はFCCエラー線上でECC比較器6
25によって表明され、CPUモジュール30に転送さ
れ、比較のミスによって発生したFCCの故障を検出し
たことを示す。この比較のミスはメモリ書き込みサイク
ルの期間中に行われる2つのECCのチエツクの期間中
またはメモリ読み出しサイクル行われる1つのFCCの
チエツクの期間中のいずれかで発生する可能性がある。
25によって表明され、CPUモジュール30に転送さ
れ、比較のミスによって発生したFCCの故障を検出し
たことを示す。この比較のミスはメモリ書き込みサイク
ルの期間中に行われる2つのECCのチエツクの期間中
またはメモリ読み出しサイクル行われる1つのFCCの
チエツクの期間中のいずれかで発生する可能性がある。
第6図に示すように、ボード選択ロジック6272
はメモリの背面板からスロット信号を受は取る。
これらのスロット信号によって、各メモリモジュール6
0に対してユニークなスロット・ロケーションが指定さ
れる。ボード選択ロジッチ627は、そこでこれらのス
ロット信号を指定回路612を介してメモリ制御装置の
1から転送された指定されたプライマリ・ボード・アド
レス信号と比較する。もしこのスロット信号が指定され
たプライマリ・ボード・アドレス信号と同じであれば、
ボード選択信号がホード選択ロジック627によって発
生され、これによって制御ロジック610内の他の回路
を動作させる。
0に対してユニークなスロット・ロケーションが指定さ
れる。ボード選択ロジッチ627は、そこでこれらのス
ロット信号を指定回路612を介してメモリ制御装置の
1から転送された指定されたプライマリ・ボード・アド
レス信号と比較する。もしこのスロット信号が指定され
たプライマリ・ボード・アドレス信号と同じであれば、
ボード選択信号がホード選択ロジック627によって発
生され、これによって制御ロジック610内の他の回路
を動作させる。
3、 メモリ制御装置
メモリ制御装置70と75は、CPU40と50のメモ
リ・モジュール60および補助メモリ素子に対するアク
セスをそれぞれ制御好適な実施例の場合、ある種のエラ
ー処理動作を実行する。
リ・モジュール60および補助メモリ素子に対するアク
セスをそれぞれ制御好適な実施例の場合、ある種のエラ
ー処理動作を実行する。
メモリ制御装置72に接続された補助メモリ素子はシス
テムROM43、EEPROM44、およびスクラッチ
・パッドRAM45を有する。ROM3 43は、診断コード、コンソール・ドライバ・コード、
およびブートストラップ・コードの一部のようなある種
の標準コードを保持している。
テムROM43、EEPROM44、およびスクラッチ
・パッドRAM45を有する。ROM3 43は、診断コード、コンソール・ドライバ・コード、
およびブートストラップ・コードの一部のようなある種
の標準コードを保持している。
EEPROM44は、CPU40の動作中に検出された
エラー情報のような情報を保持するのに使用されるが、
この情報は変更を行う必要があるが、電源を切った場合
に失われるべきではない。スクラッチ・パッドRAM4
5は、CPU40によって実行されるある種の動作のた
めに使用されると共に、レール・ユニーク情報(例えば
、ただ1つのCPU40または50に使用することので
きる1つのレールの条件に特有の情報)をゾーン情報(
CPU40と50の両方がアクセスすることのできる情
報)に変換するために使用される。
エラー情報のような情報を保持するのに使用されるが、
この情報は変更を行う必要があるが、電源を切った場合
に失われるべきではない。スクラッチ・パッドRAM4
5は、CPU40によって実行されるある種の動作のた
めに使用されると共に、レール・ユニーク情報(例えば
、ただ1つのCPU40または50に使用することので
きる1つのレールの条件に特有の情報)をゾーン情報(
CPU40と50の両方がアクセスすることのできる情
報)に変換するために使用される。
等価な構成要素53.54および55がメモリ制御装置
75に接続される。システムROM53、EEPROM
54およびスクラッチ・パッドRAM55は、システム
ROM43、EEPROM44、およびスクラッチ・パ
ッドRAM45とそれぞれ同じであり、同じ機能を実行
する。
75に接続される。システムROM53、EEPROM
54およびスクラッチ・パッドRAM55は、システム
ROM43、EEPROM44、およびスクラッチ・パ
ッドRAM45とそれぞれ同じであり、同じ機能を実行
する。
4
第7図ないし第9図は、プライマリ・メモリ制御装置7
0の好適な実施例の詳細を示す。ミラー・メモリ制御装
置75は、第7図ないし第9図に示す構成要素と同し構
成要素を有しているが、動作は若干界なっている。従っ
て、メモリ制御装置75の動作と異なっている部分を除
いて、プライマリ・メモリ制御装置70の動作のみを説
明する。
0の好適な実施例の詳細を示す。ミラー・メモリ制御装
置75は、第7図ないし第9図に示す構成要素と同し構
成要素を有しているが、動作は若干界なっている。従っ
て、メモリ制御装置75の動作と異なっている部分を除
いて、プライマリ・メモリ制御装置70の動作のみを説
明する。
処理システム20′内のメモリ制御装置70′と75′
は同し構成要素を有し、それぞれメモリ制御装置70と
75と同じように動作する。
は同し構成要素を有し、それぞれメモリ制御装置70と
75と同じように動作する。
第7図に示す構成要素は、プライマリ・メモリ制御装置
70を介してデータの流れ、アスおよび信号を制御する
。制御ロジック700は、メモリ制御装置70の受は取
った信号および制御ロジック700に記憶されているそ
のメモリ制御装置のステート・エンジンに従って第7図
の種々の構成要素の状態を制御する。マルチプレクサ7
02は、これらのソースの1つからアドレスを選択する
。
70を介してデータの流れ、アスおよび信号を制御する
。制御ロジック700は、メモリ制御装置70の受は取
った信号および制御ロジック700に記憶されているそ
のメモリ制御装置のステート・エンジンに従って第7図
の種々の構成要素の状態を制御する。マルチプレクサ7
02は、これらのソースの1つからアドレスを選択する
。
これらのアドレスは、受信機705を介してCPU30
から得ることもできるし、第8図を参照して5 以下で説明するDMAエンジン800から得ることもで
きるし、また再同期化動作の期間中に1つのゾーンから
他のゾーンにある種のバンク・メモリを転送する間に人
工的リフレッシュを発生するのに使用されるリフレッシ
ュ再同期化アドレスから得ることもできる。
から得ることもできるし、第8図を参照して5 以下で説明するDMAエンジン800から得ることもで
きるし、また再同期化動作の期間中に1つのゾーンから
他のゾーンにある種のバンク・メモリを転送する間に人
工的リフレッシュを発生するのに使用されるリフレッシ
ュ再同期化アドレスから得ることもできる。
CPU30からのデータは、受信機705を介して受は
取られDMAからのデータはエンジン800を介して受
は取られるρで、マルチプレクサ702の出力はマルチ
プレクサ0の入力である。
取られDMAからのデータはエンジン800を介して受
は取られるρで、マルチプレクサ702の出力はマルチ
プレクサ0の入力である。
マルチプレクサ710の出力は、メモリ相互接続部85
とドライバ715を介してメモリ・モジュール60にデ
ータを与える。ドライバ715はミラー・メモリ制御モ
ジュール75と75′に対して不能にされるが、その理
由は、メモリ・データの1つの組のみが、それぞれメモ
リ・モジュール60と60′に送られるからである。
とドライバ715を介してメモリ・モジュール60にデ
ータを与える。ドライバ715はミラー・メモリ制御モ
ジュール75と75′に対して不能にされるが、その理
由は、メモリ・データの1つの組のみが、それぞれメモ
リ・モジュール60と60′に送られるからである。
メモリ相互接続部85に送られるデータは、CPU30
からメモリ・モジュール6oに記憶されるべきデータま
たはDMAエンジン800から6 メモリ・モジュール60に記憶されるべきデータのいず
れかを含んている。CPU30からのデータとマルチプ
レクサ702からのデータはまたこの経路また受信機7
45とECC修正装置750を介してDMAエンジン8
00に送られる。
からメモリ・モジュール6oに記憶されるべきデータま
たはDMAエンジン800から6 メモリ・モジュール60に記憶されるべきデータのいず
れかを含んている。CPU30からのデータとマルチプ
レクサ702からのデータはまたこの経路また受信機7
45とECC修正装置750を介してDMAエンジン8
00に送られる。
マルチプレクサ702からのアドレスは、デマルチプレ
クサ720の入力にまた加えられ、このデマルチプレク
サ720はこれらのアドレスを67列アドレス部、ボー
ド/バンク・アドレス部分およびシンクル・ボード・ビ
ットに分割する。67列アドレスの22ビツトが11本
の線に多重化される。好適な実施例の場合、22ビツト
の67列アドレスがトライバ21を介してメモリ・モジ
ュール60に送られる。シンクル・ホード・ビットはド
ライバ722を介してメモリ・モジュール60に送られ
ることが望ましく、他のホード/バンク・アドレスヒツ
トはFCC信号と多重化される。
クサ720の入力にまた加えられ、このデマルチプレク
サ720はこれらのアドレスを67列アドレス部、ボー
ド/バンク・アドレス部分およびシンクル・ボード・ビ
ットに分割する。67列アドレスの22ビツトが11本
の線に多重化される。好適な実施例の場合、22ビツト
の67列アドレスがトライバ21を介してメモリ・モジ
ュール60に送られる。シンクル・ホード・ビットはド
ライバ722を介してメモリ・モジュール60に送られ
ることが望ましく、他のホード/バンク・アドレスヒツ
トはFCC信号と多重化される。
マルチプレクサ725は、メモリ制御装置7゜に対する
通、ilj、のりフレッソユ命令とCPU30か7 らのサイクル・タイプ情報(すなわち読み出し、書き込
み等)およびDMAサイクル・タイプ情報とを結合する
。通常のリフレッシュ命令とリフレッシュ再同期アドレ
スの両方によって、メモリ・モジュール60がメモリ・
リフレッシュ動作を開始する。
通、ilj、のりフレッソユ命令とCPU30か7 らのサイクル・タイプ情報(すなわち読み出し、書き込
み等)およびDMAサイクル・タイプ情報とを結合する
。通常のリフレッシュ命令とリフレッシュ再同期アドレ
スの両方によって、メモリ・モジュール60がメモリ・
リフレッシュ動作を開始する。
マルチプレクサ725の出力は、デマルチプレクサ72
0からのボード/バンク・アドレスと共にマルチプレク
サ730に対する入力である。マルチプレクサ730に
対する他の入力は、FCCジェネレータ/チエッカ73
5の出力である。マルチプレクサ730は、入力の1つ
を選択し、これをメモリ・モジュール60に対する時間
分割多重化FCC/アドレス線に載置する。マルチプレ
クサ730は、これらの時間分割多重化線がボード/バ
ンク・アドレスと別の制御情報ならびにECC情報を、
異なった時間に、搬送するこを可能にする。
0からのボード/バンク・アドレスと共にマルチプレク
サ730に対する入力である。マルチプレクサ730に
対する他の入力は、FCCジェネレータ/チエッカ73
5の出力である。マルチプレクサ730は、入力の1つ
を選択し、これをメモリ・モジュール60に対する時間
分割多重化FCC/アドレス線に載置する。マルチプレ
クサ730は、これらの時間分割多重化線がボード/バ
ンク・アドレスと別の制御情報ならびにECC情報を、
異なった時間に、搬送するこを可能にする。
ECC情報は、受信機734を介してメモリ・モジュー
ル60から受は取られ、人力としてECC8 ジェネレータ/チエッカ735に加えられ、メモリ・モ
ジュール60によって発生されたFCCをメモリ制御装
置70によって発生されたFCCと比較する。
ル60から受は取られ、人力としてECC8 ジェネレータ/チエッカ735に加えられ、メモリ・モ
ジュール60によって発生されたFCCをメモリ制御装
置70によって発生されたFCCと比較する。
FCCジェネレータ/チエッカ735に対する他の入力
は、マルチプレクサ740からの出力である。メモリ・
トランザクションが書き込みトランザクションであるか
読み出しトランザクションであるかによって、マルチプ
レクサ740はマルチプレクサ710からメモリ・モジ
ュール60に送られたメモリ・データを入力として受は
取るか、または受信機745を介してメモリ・モジュー
ル60から受は取られたメモリ・データを入力として受
は取る。マルチプレクサ740は、FCCジェネレータ
/チエッカ735に対する入力であるこれらのメモリ・
データの組の1つを選択する。
は、マルチプレクサ740からの出力である。メモリ・
トランザクションが書き込みトランザクションであるか
読み出しトランザクションであるかによって、マルチプ
レクサ740はマルチプレクサ710からメモリ・モジ
ュール60に送られたメモリ・データを入力として受は
取るか、または受信機745を介してメモリ・モジュー
ル60から受は取られたメモリ・データを入力として受
は取る。マルチプレクサ740は、FCCジェネレータ
/チエッカ735に対する入力であるこれらのメモリ・
データの組の1つを選択する。
ジェネレータ/チエッカ735は、次に適当なFCCコ
ードを発生し、このコードは、マルチプレクサ730に
送られる以外に、またECC修正装置750にも送られ
る。好適な実施例の場合、9 ECC修正装置750はメモリ・モジュール60から受
は取られたメモリ・データ内の全てのシングル・ビット
エラーを修正する。
ードを発生し、このコードは、マルチプレクサ730に
送られる以外に、またECC修正装置750にも送られ
る。好適な実施例の場合、9 ECC修正装置750はメモリ・モジュール60から受
は取られたメモリ・データ内の全てのシングル・ビット
エラーを修正する。
FCCチエッカ750からの修正されたメモリ・データ
は、次に第8図に示すDMAエンジンに送られると共に
マルチプレクサ752に送られる。
は、次に第8図に示すDMAエンジンに送られると共に
マルチプレクサ752に送られる。
マルチプレクサ752に対する他の入力は、第9図と関
連して以下で説明するエラー処理ロジックからのエラー
情報である。マルチプレクサ752の出力は、ドライバ
753を介してCPU30に送られる。
連して以下で説明するエラー処理ロジックからのエラー
情報である。マルチプレクサ752の出力は、ドライバ
753を介してCPU30に送られる。
比較器755は、マルチプレクサ710からメモリ・モ
ジュール60に送られたデータをこのデータがドライバ
715と受信機745を通過した後、このデータのコピ
ーと比較する。チエツクによって、ドライバ715と受
信機745が正しく動作しているかどうかを判定する。
ジュール60に送られたデータをこのデータがドライバ
715と受信機745を通過した後、このデータのコピ
ーと比較する。チエツクによって、ドライバ715と受
信機745が正しく動作しているかどうかを判定する。
比較器755からの出力はCMPエラー信号であり、こ
の信号はこのような比較エラーがあるか無いかを示す。
の信号はこのような比較エラーがあるか無いかを示す。
第9図においてCMPエラー・ロジックに供給さ0
れる。
第7図の他の2つの構成要素によって、異なった種類の
エラー検出が行われる。構成要素760はパリティ−発
生装置である。メモリ制御装置70によってメモリ・モ
ジュール60に記憶されるべきデータに発生されたかま
たはメモリ・モジュール60によってメモリ・モジュー
ル60から読み出されたデータに発生されたFCCデー
タは、パリティ−発生装置70に送られる。発生装置7
60からのパリティ−信号は、ドライバ762を介して
、比較器765に送られる。比較器765は、発生装置
760からFCCパリティ−信号を制御袋装置75′に
よって発生された等価のFCCパリティ−信号と比較す
る。
エラー検出が行われる。構成要素760はパリティ−発
生装置である。メモリ制御装置70によってメモリ・モ
ジュール60に記憶されるべきデータに発生されたかま
たはメモリ・モジュール60によってメモリ・モジュー
ル60から読み出されたデータに発生されたFCCデー
タは、パリティ−発生装置70に送られる。発生装置7
60からのパリティ−信号は、ドライバ762を介して
、比較器765に送られる。比較器765は、発生装置
760からFCCパリティ−信号を制御袋装置75′に
よって発生された等価のFCCパリティ−信号と比較す
る。
パリティ−発生装置770は、デマルチプレクサ720
から受は取られた行/列アドレス信号とシングル・ビッ
ト・ボード・アドレス信号とについて同じ種類のチエツ
クを実行する。パリティ−発生装置770からのアドレ
ス・パリティ−信号はドライバ772によって比較器7
75に送られ、1 この比較器775は制御装置75からまたアドレス・パ
リティ−信号を受は取る。比較器765と775の出力
はパリティ−・エラー信号であり、これらの信号は第9
図のエラー・ロジックに供給される。
から受は取られた行/列アドレス信号とシングル・ビッ
ト・ボード・アドレス信号とについて同じ種類のチエツ
クを実行する。パリティ−発生装置770からのアドレ
ス・パリティ−信号はドライバ772によって比較器7
75に送られ、1 この比較器775は制御装置75からまたアドレス・パ
リティ−信号を受は取る。比較器765と775の出力
はパリティ−・エラー信号であり、これらの信号は第9
図のエラー・ロジックに供給される。
第8図はDMAエンジン800の基礎を示す。
好適な実施例の場合、DMAエンジン800はメモリ制
御装置70内に位置するが、この場所にある必要はない
。第8図に示すように、DMAエンジン800はデータ
・ルータ(router) 810、DMA制御装置8
20、およびDMAレジスタ830を有する。ドライバ
815と受信機816によって、メモリ制御装置70と
クロスリンク90との間にインターフェースが設けられ
る。
御装置70内に位置するが、この場所にある必要はない
。第8図に示すように、DMAエンジン800はデータ
・ルータ(router) 810、DMA制御装置8
20、およびDMAレジスタ830を有する。ドライバ
815と受信機816によって、メモリ制御装置70と
クロスリンク90との間にインターフェースが設けられ
る。
DMA制御装置820は、制御ロジック700から内部
制御信号を受は取り、これに応答して、制御信号を送っ
てデータ・ルータ810を適当に構成する。制御装置8
20によって、データ・ルータ810が第7図に示すク
ロスリンク90からのデータと制御信号をメモリ制御7
0回路に送る2 ように、その構成がまた設定される。データ・ルタは、
その状態信号をDMA制御装置820に送り、このDM
A制御装置はこの信号を他のDMA情報と共に第9図の
エラー・ロジックに伝える。
制御信号を受は取り、これに応答して、制御信号を送っ
てデータ・ルータ810を適当に構成する。制御装置8
20によって、データ・ルータ810が第7図に示すク
ロスリンク90からのデータと制御信号をメモリ制御7
0回路に送る2 ように、その構成がまた設定される。データ・ルタは、
その状態信号をDMA制御装置820に送り、このDM
A制御装置はこの信号を他のDMA情報と共に第9図の
エラー・ロジックに伝える。
レジスタ830はDMAハイド・カウンタ・レジスタ8
32とDMAアドレス・レジスタ836を有する。これ
らのレジスタは、ルータ810を介してCPU40によ
って初期値にセットされる。
32とDMAアドレス・レジスタ836を有する。これ
らのレジスタは、ルータ810を介してCPU40によ
って初期値にセットされる。
次に、DMAサイクルの期間中、制御装置820はルー
タ810を介してカウンタ・レジスタ832をインクリ
メントさせアドレス・レジスタ836をデクリメントさ
せる。制御装置820によって、アドレス・サイクル8
36の内容がDMA動作の期間中ルータ810と第7図
の回路を介してまたメモリ・モジュール60に送られる
。
タ810を介してカウンタ・レジスタ832をインクリ
メントさせアドレス・レジスタ836をデクリメントさ
せる。制御装置820によって、アドレス・サイクル8
36の内容がDMA動作の期間中ルータ810と第7図
の回路を介してまたメモリ・モジュール60に送られる
。
上に説明したように、本発明の好適な実施例の場合、メ
モリ制御装置70.75.70′、および75′は、ま
たある種の基本的なエラー動作を実行する。第9図は、
このようなエラー動作を実行するハードウェアの好適な
実施例の1例を示す。
モリ制御装置70.75.70′、および75′は、ま
たある種の基本的なエラー動作を実行する。第9図は、
このようなエラー動作を実行するハードウェアの好適な
実施例の1例を示す。
3
第9図に示すように、タイムアウト信号、BCCエラー
信号およびバスのミス比較信号のようなある種のメモリ
制御装置内部信号は、レール(rail)・エラー信号
、ファイヤーウオール(firewall)のミス比較
信号およびアドレス/制御エラー信号のようなある種の
外部信号と同様に、診断エラー・ロジック870に対す
る入力である。好適な実施例の場合、診断エラー・ロジ
ック870はクロスリンク90と95を介してシステム
10の他の構成要素からエラー信号を受は取る。
信号およびバスのミス比較信号のようなある種のメモリ
制御装置内部信号は、レール(rail)・エラー信号
、ファイヤーウオール(firewall)のミス比較
信号およびアドレス/制御エラー信号のようなある種の
外部信号と同様に、診断エラー・ロジック870に対す
る入力である。好適な実施例の場合、診断エラー・ロジ
ック870はクロスリンク90と95を介してシステム
10の他の構成要素からエラー信号を受は取る。
診断エラーロジック870は、エラー信号とメモリ制御
装置70のベーシック・タイミングから発生された制御
パルス信号からエラー・パルスを形成する。診断エラー
・ロジック870によって発生されたエラー・パルスは
、ある種のタイミング信号に従って診断エラー・レジス
タ880の適当なロケーションに記憶されているある種
のエラ情報を含む。システム故障エラー・アドレス・レ
ジスタ65は、エラーが発生した場合、CPU40と5
0が通信を行っていたメモリ・モジュー4 ル60内にアドレスを記憶する。
装置70のベーシック・タイミングから発生された制御
パルス信号からエラー・パルスを形成する。診断エラー
・ロジック870によって発生されたエラー・パルスは
、ある種のタイミング信号に従って診断エラー・レジス
タ880の適当なロケーションに記憶されているある種
のエラ情報を含む。システム故障エラー・アドレス・レ
ジスタ65は、エラーが発生した場合、CPU40と5
0が通信を行っていたメモリ・モジュー4 ル60内にアドレスを記憶する。
診断エラー・ロジック870からのエラー・パルスはま
たエラー・カテゴリー化ロジック850に送られ、この
エラー・カテゴリー化ロジック850はまたサイクル・
タイプ(例えば読み出し、書き込み等)を示す情報をC
PU30から受は取る。。この情報およびエラー・パル
スから、エラー・カテゴリー化ロジック850はCPU
/IOエラー、DMAエラー、またはCPU/MEM故
障の存在を判定する。
たエラー・カテゴリー化ロジック850に送られ、この
エラー・カテゴリー化ロジック850はまたサイクル・
タイプ(例えば読み出し、書き込み等)を示す情報をC
PU30から受は取る。。この情報およびエラー・パル
スから、エラー・カテゴリー化ロジック850はCPU
/IOエラー、DMAエラー、またはCPU/MEM故
障の存在を判定する。
CP U/ I Oエラーは、バス46のCPU/IO
サイクルに直接帰するべき動作上のエラーであり、リセ
ットに関して以下で説明するように、ハードウェアーに
よって修復することが可能である。DMAエラーは、D
MAサイクルの期間中に発生するエラーであり、好適な
実施例の場合、主としてソフトウェアによって処理され
る。CPU/MEM故障は、CPUの正しい動作または
メモリの内容を保障することのできないエラーである。
サイクルに直接帰するべき動作上のエラーであり、リセ
ットに関して以下で説明するように、ハードウェアーに
よって修復することが可能である。DMAエラーは、D
MAサイクルの期間中に発生するエラーであり、好適な
実施例の場合、主としてソフトウェアによって処理され
る。CPU/MEM故障は、CPUの正しい動作または
メモリの内容を保障することのできないエラーである。
エラー・カテゴリー化ロジック850からの出5
力は、エンコーダ855に送られ、このエンコーダ85
5は特定のエラー・コードを形成する。このエラー・コ
ートは、エラ−1デイスエーブル信号が存在する場合、
次にANDゲート856を介してクロスリンク90と9
5に送られる。
5は特定のエラー・コードを形成する。このエラー・コ
ートは、エラ−1デイスエーブル信号が存在する場合、
次にANDゲート856を介してクロスリンク90と9
5に送られる。
エラー・コードを受は取った後、クロスリンク90.9
5.90’、95’はメモリ制御装置にリトライ要求信
号を送る。第9図に示すように、メモリ制御装置70の
エンコーダ895はサイクル・タイプ情報とエラー信号
〔サイクル・クオリファイヤ(qualifiers)
として纏めてに示される〕と共にリトライ要求信号を受
は取る。エンコーダ895は、次にシステム故障エラー
・レジスタ898に記憶するための適当なエラー・コー
ドを発生する。
5.90’、95’はメモリ制御装置にリトライ要求信
号を送る。第9図に示すように、メモリ制御装置70の
エンコーダ895はサイクル・タイプ情報とエラー信号
〔サイクル・クオリファイヤ(qualifiers)
として纏めてに示される〕と共にリトライ要求信号を受
は取る。エンコーダ895は、次にシステム故障エラー
・レジスタ898に記憶するための適当なエラー・コー
ドを発生する。
システム故障エラー・レジスタ898は、診断エラー・
レジスタ880と同じ情報を記憶しない。
レジスタ880と同じ情報を記憶しない。
システム故障エラー・レジスタ898とは違って、診断
エラー・レジスタ880はクロスリンク・レールからの
1つの入力のエラーのようなレール・6 ユニーク情報およびメモリ・モジュール60内の修正不
可能なFCCエラーのようなゾーン・ユニーク・データ
のみを含んでいる。
エラー・レジスタ880はクロスリンク・レールからの
1つの入力のエラーのようなレール・6 ユニーク情報およびメモリ・モジュール60内の修正不
可能なFCCエラーのようなゾーン・ユニーク・データ
のみを含んでいる。
診断エラー・レジスタ898は、またエラーの処理に使
用される幾つかのビットを含んでいる。
用される幾つかのビットを含んでいる。
これらのビットは、所望のメモリ・ロケーションが見当
たらないことを示すNXNビット、所望に110ロケー
シヨンが見当たらないことを示すNXl0ビツト、ソリ
ッド故障ビットおよび過渡的ビットを含んでいる。過渡
的ビットソリッド・ビットはいずれも故障のレベルを示
す。過渡的ビットによって、またシステム故障エラー・
アドレス・レジスタ865が凍結される。
たらないことを示すNXNビット、所望に110ロケー
シヨンが見当たらないことを示すNXl0ビツト、ソリ
ッド故障ビットおよび過渡的ビットを含んでいる。過渡
的ビットソリッド・ビットはいずれも故障のレベルを示
す。過渡的ビットによって、またシステム故障エラー・
アドレス・レジスタ865が凍結される。
第9図は、メモリ・コントローラ・ステータス・レジス
タ875を示すが、これは技術的にはエラー・ロジック
の一部ではない。レジスタ875は、DMA比率比率部
子77MA比率コート・エラー・ディスエーブル部87
8のエラー・デスエーブル・コード、およびミラー・バ
ス・ドライバ・イネーブル部876のミラー・バス・ド
ライバ7 ・イネーブルコードのようなある種の状態情報を記憶す
る。DMA比率コードは、DMAに割り当てることので
きるメモリ帯域幅の部分を特定する。
タ875を示すが、これは技術的にはエラー・ロジック
の一部ではない。レジスタ875は、DMA比率比率部
子77MA比率コート・エラー・ディスエーブル部87
8のエラー・デスエーブル・コード、およびミラー・バ
ス・ドライバ・イネーブル部876のミラー・バス・ド
ライバ7 ・イネーブルコードのようなある種の状態情報を記憶す
る。DMA比率コードは、DMAに割り当てることので
きるメモリ帯域幅の部分を特定する。
エラー・デスエーテル・コードによって、ANDケート
856および従ってエラー・コードを不能にする信号が
与えられる。ミラー・バス・ドライバ・イネーブル・コ
ードによって、ある種のトランサクションに対してミラ
ー・バス・ドライバを動作させる信号を与えられる。
856および従ってエラー・コードを不能にする信号が
与えられる。ミラー・バス・ドライバ・イネーブル・コ
ードによって、ある種のトランサクションに対してミラ
ー・バス・ドライバを動作させる信号を与えられる。
4、 クロスリンク
メモリ再同期、DMAおよびI10動作用のデータは、
クロスリンク90と95を通過する。
クロスリンク90と95を通過する。
殻内に、クロスリンク90および95によって、CPU
モジュール30、CPUモジュール30′I10モジユ
ール100.110.120、およびI10モジュール
110’、110’、120′・との間の通信が行われ
る。(第1図参照)クロスリンク90と95は、第1O
図に示すように、並列レジスタ910と直列レジスタ9
20の両方を含む。両方のタイプのレジスタは、本発8 明の好適な実施例でプロセッサ間の通信を行うために使
用される。通常の動作の期間中、処理システム20と2
0′は同期され、データはそれぞれクロスリンク90/
95と90’ /95’の並列レジスタ910を使用し
て、処理システム20と20′との間で交換され、処理
システム20と20′が同期されていない場合、ブート
ストラッピングの期間中に最も顕著に現れるように、デ
ータは直列レジスタ902によってクロスリンクの間で
交換される。
モジュール30、CPUモジュール30′I10モジユ
ール100.110.120、およびI10モジュール
110’、110’、120′・との間の通信が行われ
る。(第1図参照)クロスリンク90と95は、第1O
図に示すように、並列レジスタ910と直列レジスタ9
20の両方を含む。両方のタイプのレジスタは、本発8 明の好適な実施例でプロセッサ間の通信を行うために使
用される。通常の動作の期間中、処理システム20と2
0′は同期され、データはそれぞれクロスリンク90/
95と90’ /95’の並列レジスタ910を使用し
て、処理システム20と20′との間で交換され、処理
システム20と20′が同期されていない場合、ブート
ストラッピングの期間中に最も顕著に現れるように、デ
ータは直列レジスタ902によってクロスリンクの間で
交換される。
並列レジスタのアドレスは、メモリ・スペースと違って
I10スペースである。メモリ・スペースとはメモリモ
ジュール60内のロケーションのことである。I10ス
ペースとは、Iloおよび内部システム・レジスタのよ
うなロケーションのことであり、こらはメモリ・モジュ
ール60内には存在しない。
I10スペースである。メモリ・スペースとはメモリモ
ジュール60内のロケーションのことである。I10ス
ペースとは、Iloおよび内部システム・レジスタのよ
うなロケーションのことであり、こらはメモリ・モジュ
ール60内には存在しない。
I10スペース内では、アドレスはシステム・アドレス
・スペース内に存在するか、ゾーン・アドレス・スペー
ス内に存在するかのいずれかであ9 る。「システム・アドレス・スペース」という用語は、
システムlO全体を通してアクセスすることのできるア
ドレス、すなわち処理システム20と20′の両方によ
ってアクセスすることのできるアドレスのことである。
・スペース内に存在するか、ゾーン・アドレス・スペー
ス内に存在するかのいずれかであ9 る。「システム・アドレス・スペース」という用語は、
システムlO全体を通してアクセスすることのできるア
ドレス、すなわち処理システム20と20′の両方によ
ってアクセスすることのできるアドレスのことである。
「ゾーン・アドレス・スペースjという用語は、特定の
クロスリンクを含むゾーンによってのみアクセス可能で
あるアドレスのことである。
クロスリンクを含むゾーンによってのみアクセス可能で
あるアドレスのことである。
第10図に示す並列レジスタは、通信レジスタ906と
I10リセット・レジスタ908を有する。通信レジス
タ906は、ゾーン間で交換される独特のデータを含む
。このようなデータは、メモリ・ソフト・エラーのよう
な通常ゾーンに特有のデータである(メモリモジュール
60と60′が同じエラーを同時に独立して経験すると
いうことは確率の領域外の出来事である) レジスタ906に記憶されるべきデータはユニークなも
のであるため、書き込みの目的のための通信レジスタ9
06のアドレスは、ゾーン・アドレス・スペースになけ
ればならない。もしそうで0 なければ、処理システム20と20′は、ロックステッ
プ同期状態にあり同し一連の命令を異同時に実行してい
るため、ゾーン・ユニーク・データをゾーン11内の通
信レジスタ906のみに記憶することはできず、これら
はこの同しデータをシンエビ内の通信レジスタ906’
(図示せず)にも記憶しなければならない。
I10リセット・レジスタ908を有する。通信レジス
タ906は、ゾーン間で交換される独特のデータを含む
。このようなデータは、メモリ・ソフト・エラーのよう
な通常ゾーンに特有のデータである(メモリモジュール
60と60′が同じエラーを同時に独立して経験すると
いうことは確率の領域外の出来事である) レジスタ906に記憶されるべきデータはユニークなも
のであるため、書き込みの目的のための通信レジスタ9
06のアドレスは、ゾーン・アドレス・スペースになけ
ればならない。もしそうで0 なければ、処理システム20と20′は、ロックステッ
プ同期状態にあり同し一連の命令を異同時に実行してい
るため、ゾーン・ユニーク・データをゾーン11内の通
信レジスタ906のみに記憶することはできず、これら
はこの同しデータをシンエビ内の通信レジスタ906’
(図示せず)にも記憶しなければならない。
しかし、読み出しのための通信レジスタ906のアドレ
スは、システム・アドレス・スペース内に存在する。し
たがって、同期動作の期間中、両方のゾーンは同時に1
つのゾーンから通信レジスタを読み出すことができ、次
に他のゾーンから通信レジスタを同時に読み出すことが
できる。
スは、システム・アドレス・スペース内に存在する。し
たがって、同期動作の期間中、両方のゾーンは同時に1
つのゾーンから通信レジスタを読み出すことができ、次
に他のゾーンから通信レジスタを同時に読み出すことが
できる。
I10リセット・レジスタ908は、システム・アドレ
ス・スペース内に存在する。このI10リセット・レジ
スタは、対応するモジュールがリセット状態にあるかと
うかを示すため、1つのI10モジュールに対して1ビ
ツトを有する。I10モジュールがリセット状態にある
場合、これは効果的にディスエーブルされる。
ス・スペース内に存在する。このI10リセット・レジ
スタは、対応するモジュールがリセット状態にあるかと
うかを示すため、1つのI10モジュールに対して1ビ
ツトを有する。I10モジュールがリセット状態にある
場合、これは効果的にディスエーブルされる。
並列レジスタ91もまた他のレジスタを有するが、これ
らの他のレジスタの理解は本発明を理解するために必要
ではない。
らの他のレジスタの理解は本発明を理解するために必要
ではない。
並列クロスリンク・レジスタ920は全てゾーンの固有
のスペース内に存在するが、その理由は、これらが非同
期通信に使用されるが、ゾーンに固有の情報のみを有し
ているかのいずれかであるからである。並列クロスリン
ク・レジスタと並列クロスリンクの目的は、プロセッサ
20と20′が例えロック・ステップ同期状態(例えば
、位相ロック状態およびこれと同じ状態)で動作してい
なくても、これらのプロセッサ20と20′に通信を行
なわせることである。好適な実施例の場合、幾つかの並
列レジスタがあるが、本発明を理解するためにこれらを
説明する。必要はない。
のスペース内に存在するが、その理由は、これらが非同
期通信に使用されるが、ゾーンに固有の情報のみを有し
ているかのいずれかであるからである。並列クロスリン
ク・レジスタと並列クロスリンクの目的は、プロセッサ
20と20′が例えロック・ステップ同期状態(例えば
、位相ロック状態およびこれと同じ状態)で動作してい
なくても、これらのプロセッサ20と20′に通信を行
なわせることである。好適な実施例の場合、幾つかの並
列レジスタがあるが、本発明を理解するためにこれらを
説明する。必要はない。
制御および状態レジスタ912は、状態および制御フラ
グを含む直列レジスタである。これらのフラジの1つは
O9Rビット913であり、これはブートストラビング
のために使用され、対応するゾーンの処理システムがブ
ートストラブ・プロ2 セスが既に終了しているかまたはこのシステムが再同期
を行ったかのいずれかの理由のために、この処理システ
ムが既にそのブートストラブ・プロセスを開始したかと
うか、またはそのゾーンに対する動作システムが現在勤
作中であるかとうかを示す。
グを含む直列レジスタである。これらのフラジの1つは
O9Rビット913であり、これはブートストラビング
のために使用され、対応するゾーンの処理システムがブ
ートストラブ・プロ2 セスが既に終了しているかまたはこのシステムが再同期
を行ったかのいずれかの理由のために、この処理システ
ムが既にそのブートストラブ・プロセスを開始したかと
うか、またはそのゾーンに対する動作システムが現在勤
作中であるかとうかを示す。
制御および状態レジスタ912は、またクロスリンク9
0の現在のモードおよび従って処理システム20のJI
Eのモートを識別するためのモート・ピッI−914を
有する。モート・ビットは、再同期モード・ビット91
5とクロスリンク・モート・ビット916を含むことが
望ましい。再同期モード・ビット915は、クロスリン
ク90を再同期スレーブ・モードまたは再同期マスター
・モードのいずれかにあるものとして識別する。クロス
リンク・モード・ビット916は、クロスリンク90を
クロスリンク・オフ・モード、デュプレックス・モート
、クロスリンク・マスター・モト、またはクロスリンク
・スレーブ・モードのいずれかにあるものとして識別す
る。
0の現在のモードおよび従って処理システム20のJI
Eのモートを識別するためのモート・ピッI−914を
有する。モート・ビットは、再同期モード・ビット91
5とクロスリンク・モート・ビット916を含むことが
望ましい。再同期モード・ビット915は、クロスリン
ク90を再同期スレーブ・モードまたは再同期マスター
・モードのいずれかにあるものとして識別する。クロス
リンク・モード・ビット916は、クロスリンク90を
クロスリンク・オフ・モード、デュプレックス・モート
、クロスリンク・マスター・モト、またはクロスリンク
・スレーブ・モードのいずれかにあるものとして識別す
る。
3
直列レジスタの用途の1つは、状態読み出し動作であり
、この動作によって、1つのゾーンのクロスリンクが他
のゾーンのクロスリンクの状態を読み出すことができる
。状態読み出し要求フラグ918を直列制御状態レジス
タ912に立てることによって、状態情報に対する要求
がクロスリンク90′に送られる。このメツセージを受
は取ると、クロスリンク90′は、その直列制御および
状態レジスタ912′の内容をクロスリンク90に送り
返す。
、この動作によって、1つのゾーンのクロスリンクが他
のゾーンのクロスリンクの状態を読み出すことができる
。状態読み出し要求フラグ918を直列制御状態レジス
タ912に立てることによって、状態情報に対する要求
がクロスリンク90′に送られる。このメツセージを受
は取ると、クロスリンク90′は、その直列制御および
状態レジスタ912′の内容をクロスリンク90に送り
返す。
第11図は、プライマリ・クロスリンク90およびミラ
ー・クロスリンク95内のルート制御および状態信号(
「制御コード」と呼ぶ)用の構成要素の幾つかを示す。
ー・クロスリンク95内のルート制御および状態信号(
「制御コード」と呼ぶ)用の構成要素の幾つかを示す。
対応するクロスリンクの構成要素は、好適な実施例では
、クロスリンク90′および95′内に存在する。これ
らのコードは、メモリ制御装置70と75およびモジュ
ール相互接続部130.132.130′および132
′との間に送られる。
、クロスリンク90′および95′内に存在する。これ
らのコードは、メモリ制御装置70と75およびモジュ
ール相互接続部130.132.130′および132
′との間に送られる。
第12図は、ルート・データおよびアドレス信4
号を送るのに使用される好適な実施例のプライマリ・ク
ロスリンク90の構成要素を示す。対応するクロスリン
クの構成要素は、クロスリンク95.90′および95
′内に存在する。
ロスリンク90の構成要素を示す。対応するクロスリン
クの構成要素は、クロスリンク95.90′および95
′内に存在する。
第11図は、プライマリ・クロスリンク90とミラー・
クロスリンク95の両方に対する構成要素を示すが、こ
れらの構成要素の間には重要な相互接続部があるため、
ハードウェアは同じである。
クロスリンク95の両方に対する構成要素を示すが、こ
れらの構成要素の間には重要な相互接続部があるため、
ハードウェアは同じである。
プライマリ・クロスリンク90の構成要素と同じミラー
・クロスリンク95の回路の構成要素は同じ番号で示す
が、ミラー制御装置の場合には番号の次にrmJの文字
を付ける。
・クロスリンク95の回路の構成要素は同じ番号で示す
が、ミラー制御装置の場合には番号の次にrmJの文字
を付ける。
第11図および第12図を参照して、これらの構成要素
はラッチ、マルチプレクサ、ドライバおよび受信機を含
む。ラッチ933および933mのような一部のラッチ
は遅延要素として動作し、クロスリンクの正しいタイミ
ングを保証し、これによって同期を維持する。第11図
に示すように、メモリ制御装置70からの制御コードは
、バス88を介してラッチ931に送られ、次にラッチ
5 932に送られる。このよらなラッチを行う理由は、適
当な遅れを与えてメモリ制御装置70からのデータがメ
モリ制御装置70′からのデータと同時にクロスリンク
90を通過することを保証することである。
はラッチ、マルチプレクサ、ドライバおよび受信機を含
む。ラッチ933および933mのような一部のラッチ
は遅延要素として動作し、クロスリンクの正しいタイミ
ングを保証し、これによって同期を維持する。第11図
に示すように、メモリ制御装置70からの制御コードは
、バス88を介してラッチ931に送られ、次にラッチ
5 932に送られる。このよらなラッチを行う理由は、適
当な遅れを与えてメモリ制御装置70からのデータがメ
モリ制御装置70′からのデータと同時にクロスリンク
90を通過することを保証することである。
もしメモリ制御装置70からのコードがクロスリンク9
0′を介して処理システム20′に送られるべきであれ
ば、ドライバ937が起動される。
0′を介して処理システム20′に送られるべきであれ
ば、ドライバ937が起動される。
メモリ制御装置70からの制御コードは、またラッチ9
33を通過してマルチプレクサC3MUXA935に入
る。もし制御コードがクロスリンク90′からプライマ
リ・クロスリンク90に受は取られれば、これらの経路
は受信装置936を通ってラッチ938およびまたマル
チプレクサ935に至る。
33を通過してマルチプレクサC3MUXA935に入
る。もし制御コードがクロスリンク90′からプライマ
リ・クロスリンク90に受は取られれば、これらの経路
は受信装置936を通ってラッチ938およびまたマル
チプレクサ935に至る。
マルチプレクサ935に対する制御コードによって、デ
ータのソースが決定される、すなわちこれがメモリ制御
装置70からきたものであるかまたはメモリ制御装置7
0′からきたものであるかが決定され、これらのコード
はマルチプレクサ935の出力に加えられる。この出力
は、再び正6 しい遅延目的のため、ラッチ939の記憶され、もしこ
れらのコードがモジュール相互接続部130に送られる
べきであれば、ドライバ940が起動される。
ータのソースが決定される、すなわちこれがメモリ制御
装置70からきたものであるかまたはメモリ制御装置7
0′からきたものであるかが決定され、これらのコード
はマルチプレクサ935の出力に加えられる。この出力
は、再び正6 しい遅延目的のため、ラッチ939の記憶され、もしこ
れらのコードがモジュール相互接続部130に送られる
べきであれば、ドライバ940が起動される。
データおよびアドレス信号の経路は、第12図に示すよ
うに、第11図に示す制御信号の経路と若干類似してい
る。これらの相違点は、いずれの1つのトランザクショ
ンの期間中においてもデータおよびアドレスはクロスリ
ンク90と95を介して1つの方向のみに流れるが、制
御信号はそのトランザクションの期間中に双方向に流れ
るという事実を反映している。これと同じ理由のため、
バス88と89のデータ線は双方向であるが、制御方向
は双方向ではない。
うに、第11図に示す制御信号の経路と若干類似してい
る。これらの相違点は、いずれの1つのトランザクショ
ンの期間中においてもデータおよびアドレスはクロスリ
ンク90と95を介して1つの方向のみに流れるが、制
御信号はそのトランザクションの期間中に双方向に流れ
るという事実を反映している。これと同じ理由のため、
バス88と89のデータ線は双方向であるが、制御方向
は双方向ではない。
バス88を介してメモリ制御装置70から供給されるデ
ータとアドレスはラッチ961に入り、次いでラッチ9
62に入り、次いでラッチ964に入る。第11図の場
合と同様に、第12図のラヨチによって同期を維持する
ための正しいタイミングが与えられる。メモリ制御装置
70′から出7 カされるデータは受信装置986によってバッファされ
、ラッチ988に記憶され、次にマルチプレクサMUX
A966の入力に向かう。マルチプレクサ966の出力
は、ラッチ986に記憶され、もしドライバ969が起
動されれば、モジュール相互接続部130に送られる。
ータとアドレスはラッチ961に入り、次いでラッチ9
62に入り、次いでラッチ964に入る。第11図の場
合と同様に、第12図のラヨチによって同期を維持する
ための正しいタイミングが与えられる。メモリ制御装置
70′から出7 カされるデータは受信装置986によってバッファされ
、ラッチ988に記憶され、次にマルチプレクサMUX
A966の入力に向かう。マルチプレクサ966の出力
は、ラッチ986に記憶され、もしドライバ969が起
動されれば、モジュール相互接続部130に送られる。
第11図はメモリ制御装置72送られるべき制御コード
の経路を示す。モジュール相互接続部130からのコー
ドは、先ずラッチ941に記憶され、次にマルチプレク
サC3MUXC942に与えられる。マルチプレクサ9
42は、また並列クロスリンク・レジスタ910から制
御コードを受は取り、ラッチ943に転送するため並列
レジスタ・コードまたはラッチ941からのコードのい
ずれかを選択する。もしこれらの制御コードがクロスリ
ンク90′に転送されるべきであれば、ドライバ946
が起動される。クロスリンク90’からのコード(およ
び従ってメモリ制御装置70′からの制御コード)は受
信機947いよってバッファされ、ラッチ948に記憶
され、入力として8 マルチプレクサC8MUXD945に加えられる。
の経路を示す。モジュール相互接続部130からのコー
ドは、先ずラッチ941に記憶され、次にマルチプレク
サC3MUXC942に与えられる。マルチプレクサ9
42は、また並列クロスリンク・レジスタ910から制
御コードを受は取り、ラッチ943に転送するため並列
レジスタ・コードまたはラッチ941からのコードのい
ずれかを選択する。もしこれらの制御コードがクロスリ
ンク90′に転送されるべきであれば、ドライバ946
が起動される。クロスリンク90’からのコード(およ
び従ってメモリ制御装置70′からの制御コード)は受
信機947いよってバッファされ、ラッチ948に記憶
され、入力として8 マルチプレクサC8MUXD945に加えられる。
マルチプレクサCSMUXD945は、またラッチ94
3の内容を記憶しているラッチ944の出力を入力とし
て受は取る。
3の内容を記憶しているラッチ944の出力を入力とし
て受は取る。
マルチプレクサ945は、モジュール相互接続部130
からのコードまたはクロスリンク90′からのコードの
いずれかを選択し、これらの信号を入力としてマルチプ
レクサC8MUXE949に加える。マルチプレクサ9
49は、またデコード・ロジック970からのコード(
再同期の期間中に発生するバルク・メモリの転送のため
に)、直列クロスリンク・レジスタ920からのコード
、または所定のエラーコードERRを入力として受は取
る。マルチプレクサ949は、次に適当に制限されてこ
れらの入力の幾つかを選択してラッチ950に記憶する
。もしこれらのコードがメモリ制御装置70に送られる
べきであれば、次にドライバ951が起動される。
からのコードまたはクロスリンク90′からのコードの
いずれかを選択し、これらの信号を入力としてマルチプ
レクサC8MUXE949に加える。マルチプレクサ9
49は、またデコード・ロジック970からのコード(
再同期の期間中に発生するバルク・メモリの転送のため
に)、直列クロスリンク・レジスタ920からのコード
、または所定のエラーコードERRを入力として受は取
る。マルチプレクサ949は、次に適当に制限されてこ
れらの入力の幾つかを選択してラッチ950に記憶する
。もしこれらのコードがメモリ制御装置70に送られる
べきであれば、次にドライバ951が起動される。
マルチプレクサ949に対する入力であるエラー・コー
ドERRの目的は、レールの1つのエラ−によって、レ
ールとしての同じゾーン内のCPUが異なった情報を処
理しないことを保証することである。もしこのようなこ
とが発生すれば、CPUモジュール30は故障を検出し
、これによってトラスチックだが恐らく必要のないアク
ションが発生する。このことを回避するため、クロスリ
ンク90はEXCLUSIVE ORゲー1−960
を有し、このゲートによってマルチプレクサ945と9
45mの出力が比較される。もしこれらの出力が異なっ
ていれば、ゲート960によってマルチプレクサ949
はERRコードを選択する。
ドERRの目的は、レールの1つのエラ−によって、レ
ールとしての同じゾーン内のCPUが異なった情報を処
理しないことを保証することである。もしこのようなこ
とが発生すれば、CPUモジュール30は故障を検出し
、これによってトラスチックだが恐らく必要のないアク
ションが発生する。このことを回避するため、クロスリ
ンク90はEXCLUSIVE ORゲー1−960
を有し、このゲートによってマルチプレクサ945と9
45mの出力が比較される。もしこれらの出力が異なっ
ていれば、ゲート960によってマルチプレクサ949
はERRコードを選択する。
EXCLUSIVE ORゲート960mは、同様に
マルチプレクサ949mにまたERRコードを選択させ
る。このコードは、エラーが発生しているがCPUモジ
ュールにエラーの発生することは回避されていることを
メモリ制御装置70と75に示す。メモリ・モジュール
60に対するシングル・レール・インターフェースはデ
ータとアドレスに対して同じ結果を達成する。
マルチプレクサ949mにまたERRコードを選択させ
る。このコードは、エラーが発生しているがCPUモジ
ュールにエラーの発生することは回避されていることを
メモリ制御装置70と75に示す。メモリ・モジュール
60に対するシングル・レール・インターフェースはデ
ータとアドレスに対して同じ結果を達成する。
第12図に示すデータとアドレスの流れは第0
11図の制御信号の流れと同じである。モジュール相互
接続部130からのデータとアドレスは、ラッチ972
に記憶され、次に入力としてマルチプレクサMUXB9
74に入力として加えられる。
接続部130からのデータとアドレスは、ラッチ972
に記憶され、次に入力としてマルチプレクサMUXB9
74に入力として加えられる。
並列レジスタ910からのデータによって別の入力がマ
ルチプレクサ974に加えられる。マルチプレクサ97
4の出力は、マルチプレクサMUXC976に対する入
力であり、このマルチプレクサMUXC976は、また
もともとメモリ制御装置70から送られてラッチ961
に記憶されているデータとアドレスを受は取る。マルチ
プレクサ976は、次にこれらの入力のIつを選択して
ラッチ798に記憶する。もしモジュール相互接続部1
30から入力されたものであれ、メモリ制御装置70か
ら入力されたものであれ、もしデータとアドレスがクロ
スリンク90’に送られるべきであれば、ドライバ98
4が起動される。
ルチプレクサ974に加えられる。マルチプレクサ97
4の出力は、マルチプレクサMUXC976に対する入
力であり、このマルチプレクサMUXC976は、また
もともとメモリ制御装置70から送られてラッチ961
に記憶されているデータとアドレスを受は取る。マルチ
プレクサ976は、次にこれらの入力のIつを選択して
ラッチ798に記憶する。もしモジュール相互接続部1
30から入力されたものであれ、メモリ制御装置70か
ら入力されたものであれ、もしデータとアドレスがクロ
スリンク90’に送られるべきであれば、ドライバ98
4が起動される。
クロスリンク90′から人力されたデータは受信装置9
86によってバッファされラッチ988に記憶されるが
、このラッチ988によってまた1 マルチプレクサMUXD982に対する入力が与えられ
る。マルチプレクサMUXD982の他方の入力はラッ
チ980の出力であり、このラッチ988はラッチ97
8から入力されたデータとアドレスを有している。マル
チプレクサ982は次にその入力の1つを選択し、こら
は次にラッチ900に記憶される。もしデータまたはア
ドレスがメモリ制御装置70に送られるべきであれば、
ドライバ922が起動される。シリアル・レジスタ92
0からのデータはドライバ944を介してメモリ制御装
置70に送られる。
86によってバッファされラッチ988に記憶されるが
、このラッチ988によってまた1 マルチプレクサMUXD982に対する入力が与えられ
る。マルチプレクサMUXD982の他方の入力はラッ
チ980の出力であり、このラッチ988はラッチ97
8から入力されたデータとアドレスを有している。マル
チプレクサ982は次にその入力の1つを選択し、こら
は次にラッチ900に記憶される。もしデータまたはア
ドレスがメモリ制御装置70に送られるべきであれば、
ドライバ922が起動される。シリアル・レジスタ92
0からのデータはドライバ944を介してメモリ制御装
置70に送られる。
クロスリンク90を通るデータ、特に第11図および第
12図の両方のエクソンレオール(xonreol)素
子を通るデータは、デコード・ロジック970、デコー
ド・ロジック971、デコードロジック996、および
デコード・ロジック998によって発生される幾つかの
信号によって制御される。
12図の両方のエクソンレオール(xonreol)素
子を通るデータは、デコード・ロジック970、デコー
ド・ロジック971、デコードロジック996、および
デコード・ロジック998によって発生される幾つかの
信号によって制御される。
適当な入力ソースを選択するため、このロジックによっ
て、適当な入力ソースを選択するために、マルチプレク
サ935.942.945.949、2 966.974.976、および982を制御する信号
が与えられる。更に、このデコード・ロジックは、また
ドライバ940.946.9511969.984.9
92、および994を制御する。
て、適当な入力ソースを選択するために、マルチプレク
サ935.942.945.949、2 966.974.976、および982を制御する信号
が与えられる。更に、このデコード・ロジックは、また
ドライバ940.946.9511969.984.9
92、および994を制御する。
制御信号の大部分は、デコード・ロジック998によっ
て発生されるが、これらの一部はデコード−ロジック9
70.971.970m、971m。
て発生されるが、これらの一部はデコード−ロジック9
70.971.970m、971m。
および996によって発生される。デコード・ロジック
998.970および970mは、データとコードがそ
れ自身のゾーンから受は取られるか他のゾーンから受は
取られるかを制御するのに必要なデータとコードをこの
ロジックが受は取ることを保証する位置に持続される。
998.970および970mは、データとコードがそ
れ自身のゾーンから受は取られるか他のゾーンから受は
取られるかを制御するのに必要なデータとコードをこの
ロジックが受は取ることを保証する位置に持続される。
デコード・ロジック971.971mおよび966の目
的は、ドライバ937.937mおよび984が適切な
状態にセットされることを保証することである。この「
初期デコード」によって、データ・アドレスとコードが
全てのケースで適切なりロスリンクに送られることを確
認する。この3 ような初期デコード・ロジックがなければ、クロスリン
クは全てそれらのドライバが不能にされた状態におかれ
る可能性がある。メモリ制御装置のドライバがまた不能
にされれば、そのクロスリンクは決してアドレス、デー
タおよび制御コードを受は取らず、そのクロスリンクに
接続されているI10モジュールの全てを効率的に不能
にする。
的は、ドライバ937.937mおよび984が適切な
状態にセットされることを保証することである。この「
初期デコード」によって、データ・アドレスとコードが
全てのケースで適切なりロスリンクに送られることを確
認する。この3 ような初期デコード・ロジックがなければ、クロスリン
クは全てそれらのドライバが不能にされた状態におかれ
る可能性がある。メモリ制御装置のドライバがまた不能
にされれば、そのクロスリンクは決してアドレス、デー
タおよび制御コードを受は取らず、そのクロスリンクに
接続されているI10モジュールの全てを効率的に不能
にする。
デコード・ロジック970.973970m。
971m、および998によって発生されたドライバ制
御信号を説明する前に、これらのゾーン、従ってクロス
リンク90と95がとることのできる異なったモードを
理解する必要がある。第13図は、異なった状態Aない
しFおよび各モードに対応するこれらの状態を説明する
表である。
御信号を説明する前に、これらのゾーン、従ってクロス
リンク90と95がとることのできる異なったモードを
理解する必要がある。第13図は、異なった状態Aない
しFおよび各モードに対応するこれらの状態を説明する
表である。
開始時およびその他の場合、両方のゾーンは状態Aにあ
り、この状態Aはこれら両方のゾーンに対するOFFモ
ードとして知られる。このモードの場合、両方のゾーン
のコンピュータ・システムは独立して動作している。こ
れらのゾーンの1つの動作システムが他方のゾーンのI
loと通信を4 行う能力を要求し、その要求が受は入れられた後、これ
らのゾーンは状態BとCとして示されるマスター/スレ
ーブ・モードに入る。このようなモードの場合、マスタ
ーであるゾーンは動作しているCPUを有し、そのゾー
ンおよび他方のゾーンのI10モジュールを制御する。
り、この状態Aはこれら両方のゾーンに対するOFFモ
ードとして知られる。このモードの場合、両方のゾーン
のコンピュータ・システムは独立して動作している。こ
れらのゾーンの1つの動作システムが他方のゾーンのI
loと通信を4 行う能力を要求し、その要求が受は入れられた後、これ
らのゾーンは状態BとCとして示されるマスター/スレ
ーブ・モードに入る。このようなモードの場合、マスタ
ーであるゾーンは動作しているCPUを有し、そのゾー
ンおよび他方のゾーンのI10モジュールを制御する。
再同期を開始すると、コンピュータ・システムは状態B
またはCのいずれかのマスター/スレーブモードを離脱
し、状態EおよびFとして示される再同期スレーブ/再
同期マスター・モードに入る。これらのモードの場合、
マスター・ゾーンであったゾーンが他方のゾーンのCP
Uをオン・ラインにする役割を果たす。もし再同期に失
敗すれば、これらのゾーンは前に再同期しようとしたの
と同じマスター/スレーブモードに戻る。
またはCのいずれかのマスター/スレーブモードを離脱
し、状態EおよびFとして示される再同期スレーブ/再
同期マスター・モードに入る。これらのモードの場合、
マスター・ゾーンであったゾーンが他方のゾーンのCP
Uをオン・ラインにする役割を果たす。もし再同期に失
敗すれば、これらのゾーンは前に再同期しようとしたの
と同じマスター/スレーブモードに戻る。
しかし、もし再同期が成功すれば、これらのゾーンは状
態りに入り、この状態りは完全デュプレックス・モード
である。このモードの場合、両方のモードはロックステ
ップ同期状態で共に動作する。動作は、CPM/MEM
の故障が発生する迄、5 このモードで継続され、この場合、システムは2つのマ
スター・スレーブ・モードの1つに入る。
態りに入り、この状態りは完全デュプレックス・モード
である。このモードの場合、両方のモードはロックステ
ップ同期状態で共に動作する。動作は、CPM/MEM
の故障が発生する迄、5 このモードで継続され、この場合、システムは2つのマ
スター・スレーブ・モードの1つに入る。
スレーブはそのプロセッサーがCPM/MEM故障を経
験したゾーンである。
験したゾーンである。
状態D、すなわち完全デュプレックス・モードで作動し
ている場合、最も顕著なのはクロック位相エラーである
が、ある種のエラーが発生すると、システムを2つの独
立した処理システムに分割する必要が生ずる。これによ
ってシステムは状態Aに戻る。
ている場合、最も顕著なのはクロック位相エラーである
が、ある種のエラーが発生すると、システムを2つの独
立した処理システムに分割する必要が生ずる。これによ
ってシステムは状態Aに戻る。
第11図および第12図に示すデコード・ロジック97
0.970m、971.971m、 998(まとめて
クロスリンク・制御ロジックと称する)は、クロスリン
ク・ドライバとマルチプレクサをどのようにして適切な
状態にセットするかを決定するため、第1O図に示す再
同期モード・ビット915とクロスリンク・モード・ビ
ット916にアクセスする、更に、このクロスリンク・
デコード・ロジックは、またデータ・トランザクション
の期間中にメモリ制御装置70と75から送られ6 たアドレスの一部を受は取って分析し、クロスリンク・
マルチプレクサとドライバの状態をとのようにして設定
するかをクロスリンク・デコード・ロジックに対して更
に指示すアドレス情報を取り出す。
0.970m、971.971m、 998(まとめて
クロスリンク・制御ロジックと称する)は、クロスリン
ク・ドライバとマルチプレクサをどのようにして適切な
状態にセットするかを決定するため、第1O図に示す再
同期モード・ビット915とクロスリンク・モード・ビ
ット916にアクセスする、更に、このクロスリンク・
デコード・ロジックは、またデータ・トランザクション
の期間中にメモリ制御装置70と75から送られ6 たアドレスの一部を受は取って分析し、クロスリンク・
マルチプレクサとドライバの状態をとのようにして設定
するかをクロスリンク・デコード・ロジックに対して更
に指示すアドレス情報を取り出す。
マルチプレクサの状態を設定するのに必要な情報は、−
魔界なったモートとトランザクションを理解すると、か
なりはっきりする。行うべき唯一の判断はデータのソー
スである。従って、クロスリンク90と95がスレーブ
・モードにある場合、マルチプレクサ935.935m
、および966はゾーン11からデータ・アドレスとコ
ードを選択する。もしクロスリンク90と95が完全に
デュプレックス・モードにあり、Iloの命令のアドレ
スがゾーン11のIloに接続された装置に対するもの
であり、影響を受けたマルチプレクサとのクロスリンク
がクロスオーバー・モードにあれば、これらのマルチプ
レクサはまた他方のシンからデータ、アドレスおよびコ
ードを選択する。
魔界なったモートとトランザクションを理解すると、か
なりはっきりする。行うべき唯一の判断はデータのソー
スである。従って、クロスリンク90と95がスレーブ
・モードにある場合、マルチプレクサ935.935m
、および966はゾーン11からデータ・アドレスとコ
ードを選択する。もしクロスリンク90と95が完全に
デュプレックス・モードにあり、Iloの命令のアドレ
スがゾーン11のIloに接続された装置に対するもの
であり、影響を受けたマルチプレクサとのクロスリンク
がクロスオーバー・モードにあれば、これらのマルチプ
レクサはまた他方のシンからデータ、アドレスおよびコ
ードを選択する。
クロスオーバー・モートの場合、モジュール相互接続部
に送られるべきデータはチエツクのため他方のゾーンか
ら受は取られるべきである。好適な実施例の場合、モジ
ュール相互接続部130はゾーン11のプライマリ・レ
ールからデータ、アドレスおよびコードを受は取り、モ
ジュール接続部は、ゾーン11’のミラー・レールから
データ、アドレスおよびコードを受は取る。または、モ
ジュール相互接続部132はゾーン11’のプライマリ
・レールからデータ、アドレスおよびコードを受は取る
ことができ、これによって、一方のゾーンのプライマリ
・レールを他方のゾーンのミラ・レールと比較すること
が可能になる。
に送られるべきデータはチエツクのため他方のゾーンか
ら受は取られるべきである。好適な実施例の場合、モジ
ュール相互接続部130はゾーン11のプライマリ・レ
ールからデータ、アドレスおよびコードを受は取り、モ
ジュール接続部は、ゾーン11’のミラー・レールから
データ、アドレスおよびコードを受は取る。または、モ
ジュール相互接続部132はゾーン11’のプライマリ
・レールからデータ、アドレスおよびコードを受は取る
ことができ、これによって、一方のゾーンのプライマリ
・レールを他方のゾーンのミラ・レールと比較すること
が可能になる。
マルチプレクサ945.945m、982は、データの
ソースであるいずれかのゾーンからデータ、アドレスお
よびコードを受は入れるようにセットされる。このこと
は、全てのクロスリンクが完全にデュプレックス・モー
ドにあり、データ、アドレスおよびコードがT10モジ
ユールから受は取られる場合と、クロスリンクが再同期
スレーブ・モートであり、データ、アドレスおよびコー
B ドが他方のゾーンのメモリ制御装置から受は取られる場
合の両方について、真実である。
ソースであるいずれかのゾーンからデータ、アドレスお
よびコードを受は入れるようにセットされる。このこと
は、全てのクロスリンクが完全にデュプレックス・モー
ドにあり、データ、アドレスおよびコードがT10モジ
ユールから受は取られる場合と、クロスリンクが再同期
スレーブ・モートであり、データ、アドレスおよびコー
B ドが他方のゾーンのメモリ制御装置から受は取られる場
合の両方について、真実である。
もしメモリ制御装置70および75からのアドレス情報
が、応答データとコードのソースがクロスリンク自身の
並列レジスタ910であることを示せば、マルチプレク
サ942.942m、および974はこれらのレジスタ
からデータとコードを選択するようにセットされる。同
様に、もしメモリ制御装置70および75からのアドレ
ス情報が応答データのソースはクロスリンク自身のシリ
アル・レジスタ920であることを示せば、マルチプレ
クサ949と949mはデータとコードをこれらのレジ
スタから選択するようにセットされる。
が、応答データとコードのソースがクロスリンク自身の
並列レジスタ910であることを示せば、マルチプレク
サ942.942m、および974はこれらのレジスタ
からデータとコードを選択するようにセットされる。同
様に、もしメモリ制御装置70および75からのアドレ
ス情報が応答データのソースはクロスリンク自身のシリ
アル・レジスタ920であることを示せば、マルチプレ
クサ949と949mはデータとコードをこれらのレジ
スタから選択するようにセットされる。
もしこの情報がメモリ再同期動作期間中の制御コードで
あれば、マルチプレクサ949と949mはデコード・
ロジック970と970mからデータを選択するように
またセットされ、もしEXCLUSIVE ORゲー
ト960と960mがクロスリンク90と95を介して
転送された9 データの間で比較の、ミスを識別すれば、ERRコード
を選択するようにセットされる。この後者の場合、マル
チプレクサ949と949mの制御は、クロスリンクロ
ジックからではなくてEXCL[JS IVBORゲー
ト960と960mから行われる。マルチプレクサ94
9と949mは、クロスリンク・レジスタ910が要求
された場合には、これらのレジスタからコードをまた選
択し、これらのコードが要求された場合には、マルチプ
レクサ945と945mの出力をまた選択する。マルチ
プレクサ945と945mは、それぞれマルチプレクサ
942と942mからの出力かまたはそれぞれクロスリ
ンク90′と95′からのI10コードかのいずれかを
選択する。
あれば、マルチプレクサ949と949mはデコード・
ロジック970と970mからデータを選択するように
またセットされ、もしEXCLUSIVE ORゲー
ト960と960mがクロスリンク90と95を介して
転送された9 データの間で比較の、ミスを識別すれば、ERRコード
を選択するようにセットされる。この後者の場合、マル
チプレクサ949と949mの制御は、クロスリンクロ
ジックからではなくてEXCL[JS IVBORゲー
ト960と960mから行われる。マルチプレクサ94
9と949mは、クロスリンク・レジスタ910が要求
された場合には、これらのレジスタからコードをまた選
択し、これらのコードが要求された場合には、マルチプ
レクサ945と945mの出力をまた選択する。マルチ
プレクサ945と945mは、それぞれマルチプレクサ
942と942mからの出力かまたはそれぞれクロスリ
ンク90′と95′からのI10コードかのいずれかを
選択する。
マルチプレクサ976は、T10モジユールとのトラン
ザクションの場合には、モジュール相互接続部139か
らデータとアドレスを選択するか、またはデータとアド
レスがIloに対してかまたはメモリの再同期の期間中
かのいずれかにクロスリンク90′に送られるべきであ
る場合、メモリ0 制御装置90からのデータとアドレスを選択するかのい
ずれかである。
ザクションの場合には、モジュール相互接続部139か
らデータとアドレスを選択するか、またはデータとアド
レスがIloに対してかまたはメモリの再同期の期間中
かのいずれかにクロスリンク90′に送られるべきであ
る場合、メモリ0 制御装置90からのデータとアドレスを選択するかのい
ずれかである。
ドライバ937と937mは、クロスリンク90と95
がデュプレックス・モード、マスター・モードまたは再
同期マスター・モードにある場合、動作される。ドライ
バ940と940mは、ゾーン11のI10トランザク
ションの場合に動作される。ドライバ946と946
mは、クロスリンク90と95がデュプレックス・モー
ドまたはスレーブ・モードの場合に動作される。ドライ
バ951と951mは常に動作されている。
がデュプレックス・モード、マスター・モードまたは再
同期マスター・モードにある場合、動作される。ドライ
バ940と940mは、ゾーン11のI10トランザク
ションの場合に動作される。ドライバ946と946
mは、クロスリンク90と95がデュプレックス・モー
ドまたはスレーブ・モードの場合に動作される。ドライ
バ951と951mは常に動作されている。
ドライバ969はゾーン11に対するI10書き込み期
間中に動作される。ドライバ984は、クロスリンク9
0がデータとアドレスをゾーン11’のIloに送って
いる場合、またはクロスリンク90が再同期マスター・
モードにある場合に動作される。受信機986はクロス
リンク90′からデータを受は取る。ドライバ992と
994は、データがメモリ制御装置70に送られている
場合に動作される。ドライバ994は、シリアル■ ・クロスリンク・レジスタ910の内容が読み出されて
いる場合に動作され、ドライバ992は全ての他の読み
出し期間中に動作される。
間中に動作される。ドライバ984は、クロスリンク9
0がデータとアドレスをゾーン11’のIloに送って
いる場合、またはクロスリンク90が再同期マスター・
モードにある場合に動作される。受信機986はクロス
リンク90′からデータを受は取る。ドライバ992と
994は、データがメモリ制御装置70に送られている
場合に動作される。ドライバ994は、シリアル■ ・クロスリンク・レジスタ910の内容が読み出されて
いる場合に動作され、ドライバ992は全ての他の読み
出し期間中に動作される。
5、発振器
両方の処理システム20と20′が各々同じ機能を完全
デユープレックス・モードで実行している場合、CPU
モジュール30と30′が同し速度で動作を実行するこ
とが避けられない、もしそうでなければ、処理時間の大
部分は、I’Oおよびインタープロセッサのエラーのチ
エツクのために処理システムの20と20′を再同期さ
せることに消費されてしまう。処理システム20と20
′の好適な実施例の場合、これらのシステムの基本的な
りロック信号は相互に同期されて位相ロックされている
。故障許容コンピュータ・システム10は、処理システ
ム20と20′に対するクロック信号の周波数を制御し
、各処理システムに対するクロック信号の間の位相差を
最小にするために、タイミング・システムを有している
。
デユープレックス・モードで実行している場合、CPU
モジュール30と30′が同し速度で動作を実行するこ
とが避けられない、もしそうでなければ、処理時間の大
部分は、I’Oおよびインタープロセッサのエラーのチ
エツクのために処理システムの20と20′を再同期さ
せることに消費されてしまう。処理システム20と20
′の好適な実施例の場合、これらのシステムの基本的な
りロック信号は相互に同期されて位相ロックされている
。故障許容コンピュータ・システム10は、処理システ
ム20と20′に対するクロック信号の周波数を制御し
、各処理システムに対するクロック信号の間の位相差を
最小にするために、タイミング・システムを有している
。
第14図は、処理システム20と20′で実施2
される本発明のタイミング・システムのブロック図を示
す。このタイミング・システムは、処理システム20の
CPUモジュール30の発信器システム200と処理シ
ステム20′のCPUモジュール30′の発振器システ
ム200′によって構成される。発振器200′の構成
要素は発振器200の構成要素と同じであり、両方の発
振器システムの動作は同じである。従って、発振器シス
テム200と200′の動作が異なっている場合を除い
て、発振器システム200の構成要素と動作のみを説明
する。
す。このタイミング・システムは、処理システム20の
CPUモジュール30の発信器システム200と処理シ
ステム20′のCPUモジュール30′の発振器システ
ム200′によって構成される。発振器200′の構成
要素は発振器200の構成要素と同じであり、両方の発
振器システムの動作は同じである。従って、発振器シス
テム200と200′の動作が異なっている場合を除い
て、発振器システム200の構成要素と動作のみを説明
する。
第14図に示すように、発振器システム200の大部分
、特にディジタル・ロジックはクロスリンク95内部に
位置しているが、この位置は本発明にとって必要なもの
ではない。発振器システム200は電圧制御水晶発振器
(VCX)205を有し、これは好ましくは、66.6
6Mhzの基本発振器信号を発生する。VCXO205
の周波数は入力の電圧レベルによって調整することがで
きる。
、特にディジタル・ロジックはクロスリンク95内部に
位置しているが、この位置は本発明にとって必要なもの
ではない。発振器システム200は電圧制御水晶発振器
(VCX)205を有し、これは好ましくは、66.6
6Mhzの基本発振器信号を発生する。VCXO205
の周波数は入力の電圧レベルによって調整することがで
きる。
クロック分配チップ210は基本発振器信号を3
分周し、全て同じ周波数を有する4つの一次クロックを
発生することが望ましい。プライマリCPU40の場合
、これらのクロックはPCLK LおよびPCLK
Hであり、これらは相互に論理が反転しているもので
ある。ミラーCPU50の場合、クロック分配チップ2
10はクロック信号MCLK LとMCLK Hを
発生し、これらはまた相互に論理が反転しているもので
ある。第15図は、これらのクロック信号のタイミング
と位相の関係を示す。クロック信号PCLK L、P
CLK HSMCLK M、およびMCLKHは約
33.33Mhzであることが望ましい。クロック・チ
ップ210は、また第15図に示す16.66Mhzの
位相ロック・ループ信号CLKCHをまた発生する。こ
の位相ロック・ループ信号は、この信号をバッファする
クロック・ロジック220に送られる。
発生することが望ましい。プライマリCPU40の場合
、これらのクロックはPCLK LおよびPCLK
Hであり、これらは相互に論理が反転しているもので
ある。ミラーCPU50の場合、クロック分配チップ2
10はクロック信号MCLK LとMCLK Hを
発生し、これらはまた相互に論理が反転しているもので
ある。第15図は、これらのクロック信号のタイミング
と位相の関係を示す。クロック信号PCLK L、P
CLK HSMCLK M、およびMCLKHは約
33.33Mhzであることが望ましい。クロック・チ
ップ210は、また第15図に示す16.66Mhzの
位相ロック・ループ信号CLKCHをまた発生する。こ
の位相ロック・ループ信号は、この信号をバッファする
クロック・ロジック220に送られる。
クロック・ロジック・バッファ220は、同期に使用す
るため、CLKCH信号を発振器200′に送る。発振
器200′のクロック・ロジック・4 バッファ220′は、それ自身のバッファされた位相ロ
ック・ループ信号CLKC’ Hを発振器200の位
相検出器230に送る。位相検出器230は、遅延素子
225を介してクロック・ロジック220から位相ロッ
ク・ループ信号CLKCHをまた受は取る。遅延素子2
25は、クロック・ロジック・バッファ220’からの
ケーブル・ラン(cable run)による遅延を概
算する。
るため、CLKCH信号を発振器200′に送る。発振
器200′のクロック・ロジック・4 バッファ220′は、それ自身のバッファされた位相ロ
ック・ループ信号CLKC’ Hを発振器200の位
相検出器230に送る。位相検出器230は、遅延素子
225を介してクロック・ロジック220から位相ロッ
ク・ループ信号CLKCHをまた受は取る。遅延素子2
25は、クロック・ロジック・バッファ220’からの
ケーブル・ラン(cable run)による遅延を概
算する。
位相検出器230は、その入力位相ロック・ループ信号
を比較して2つの出力を発生する。これらの信号の1つ
は位相差式信号235であり、これはループ増幅器24
0を介してVCXO205の電圧入力に送られる。位相
差異信号235によって、増幅器240は信号を発生し
、この位相差異を補償するためにVCXO205の周波
数を変換する。
を比較して2つの出力を発生する。これらの信号の1つ
は位相差式信号235であり、これはループ増幅器24
0を介してVCXO205の電圧入力に送られる。位相
差異信号235によって、増幅器240は信号を発生し
、この位相差異を補償するためにVCXO205の周波
数を変換する。
位相検出器230の他方の出力は、位相エラー信号23
6であり、これは可能性のある同期の故障を示す。
6であり、これは可能性のある同期の故障を示す。
第16図は、位相検出器230の詳細図である。
5
位相検出器230は位相比較器232と電圧比較器23
4を有する。位相比較器232は、遅延素子225から
クロック信号(CLKCH)を受は取ると共に検出器2
00′から位相ロック・ループ・クロック信号(CLK
C’ H)を受は取り、これらの信号の位相差を表す
電圧差として位相差信号235を発生する。
4を有する。位相比較器232は、遅延素子225から
クロック信号(CLKCH)を受は取ると共に検出器2
00′から位相ロック・ループ・クロック信号(CLK
C’ H)を受は取り、これらの信号の位相差を表す
電圧差として位相差信号235を発生する。
もしクロックを同期させる目的のために処理システム2
0が「スレーブ」であれば、スイッチ245はrSLA
VEJの位置(すなわち閉)にあり、電圧水準235は
、ループ増幅器240によって増幅された後、VCXO
205の周波数を制御する。もし両方のスイッチ245
と245′が「マスター」の位置にあれば、処理システ
ム20と20′は位相ロックされず、非同期の状態で(
独立して)動作する。
0が「スレーブ」であれば、スイッチ245はrSLA
VEJの位置(すなわち閉)にあり、電圧水準235は
、ループ増幅器240によって増幅された後、VCXO
205の周波数を制御する。もし両方のスイッチ245
と245′が「マスター」の位置にあれば、処理システ
ム20と20′は位相ロックされず、非同期の状態で(
独立して)動作する。
位相差信号235の電圧水準は、また電圧比較器234
に対する入力であり、これらの位相差は位相の進みと遅
れの許容範囲を表す電圧V r e I lおよびV
t e I 2である。もしこの位相差が許容範囲で6 あれば、PHASE ERROR信号は活性化されな
い。もしこの位相差が許容範囲以外であれば、PHAS
E ERROR信号236は活性化され、クロック・
デコーダ220を介してクロスリンク95に送られる。
に対する入力であり、これらの位相差は位相の進みと遅
れの許容範囲を表す電圧V r e I lおよびV
t e I 2である。もしこの位相差が許容範囲で6 あれば、PHASE ERROR信号は活性化されな
い。もしこの位相差が許容範囲以外であれば、PHAS
E ERROR信号236は活性化され、クロック・
デコーダ220を介してクロスリンク95に送られる。
6、 I10モジュール
第17図はI10モジュール100の好適な実施例を示
す。このI10モジュール100の動作の原理は、他の
I10モジュールにも同様に適応することができる。
す。このI10モジュール100の動作の原理は、他の
I10モジュールにも同様に適応することができる。
第18図はファイヤウオール(firewall) 1
000の好適な実施例の構成要素を示す。ファイヤウオ
ール1000は、第17図に示すモジュール相互接続部
130に対する16ビツトのバス・インターフェース+
810とバス1020に接続するための32ビツトのバ
ス・インターフェース1820を有する。インターフェ
ース18「0と1820は内部ファイヤウオール・バス
1815によって接続され、このファイヤウオール・バ
ス1815はまたファイヤウオール1000の他の構成
要素と7 も相互に接続される。バス1815は16または35ビ
ツト幅の並列バスであることが望ましい。
000の好適な実施例の構成要素を示す。ファイヤウオ
ール1000は、第17図に示すモジュール相互接続部
130に対する16ビツトのバス・インターフェース+
810とバス1020に接続するための32ビツトのバ
ス・インターフェース1820を有する。インターフェ
ース18「0と1820は内部ファイヤウオール・バス
1815によって接続され、このファイヤウオール・バ
ス1815はまたファイヤウオール1000の他の構成
要素と7 も相互に接続される。バス1815は16または35ビ
ツト幅の並列バスであることが望ましい。
I10モジュール100はデュアル・レール・モジュー
ル相互接続部130と132によってCPUモジュール
30に接続される。モジュール相互接続部の各々は、そ
れぞれファイヤウオール1000と1010に接続され
る。通常はファイヤウオール1000であるが必ずしも
これではない一方のファイヤウオールは、モジュール相
互接続部130からバス1020にデータを書き込む。
ル相互接続部130と132によってCPUモジュール
30に接続される。モジュール相互接続部の各々は、そ
れぞれファイヤウオール1000と1010に接続され
る。通常はファイヤウオール1000であるが必ずしも
これではない一方のファイヤウオールは、モジュール相
互接続部130からバス1020にデータを書き込む。
この場合にはファイヤウオール1010である他方のフ
ァイヤウオールは、第18図に示すファイヤウオール比
較回路1840を使用して、そのデータをモジュール相
互接続部132から受は取った自分自身のコピーとチエ
ツクする。このチエツクは有効であるが、その理由は、
CPUモジュール30と30′からI10モジュールに
対して書き込まれたデータを実質的に同時にファイヤウ
オール1000と1010で入手可能にしているこれら
のCPUモジュール30と30′がロックス8 テップ同期の状態にあるからである。
ァイヤウオールは、第18図に示すファイヤウオール比
較回路1840を使用して、そのデータをモジュール相
互接続部132から受は取った自分自身のコピーとチエ
ツクする。このチエツクは有効であるが、その理由は、
CPUモジュール30と30′からI10モジュールに
対して書き込まれたデータを実質的に同時にファイヤウ
オール1000と1010で入手可能にしているこれら
のCPUモジュール30と30′がロックス8 テップ同期の状態にあるからである。
ファイヤウオール比較回路1840は、CPUモジュー
ル30と30′から受取ったデータのみをチエツクする
だけである。I10装置からCPUモジュール30と3
0′送られたデータは、共通の供給元を有し、従ってチ
エツクを必要としない。
ル30と30′から受取ったデータのみをチエツクする
だけである。I10装置からCPUモジュール30と3
0′送られたデータは、共通の供給元を有し、従ってチ
エツクを必要としない。
その代わり、I10装置から受取られCPUモンユール
30と30′に送られるデータは、EDC/CRC発生
装置1850によって実行される周期的冗長性チエツク
(CRC)コードのようなエラー検出コード(EDC)
によってチエツクされる。EDC/CRC,発生装置1
850は、また内部ファイヤウオール・パス1815に
接続される。
30と30′に送られるデータは、EDC/CRC発生
装置1850によって実行される周期的冗長性チエツク
(CRC)コードのようなエラー検出コード(EDC)
によってチエツクされる。EDC/CRC,発生装置1
850は、また内部ファイヤウオール・パス1815に
接続される。
EDC/CRC発生装置1850は、I10装置によっ
て使用されるのと同じEDC/CRCコードを発生して
チエツクを行う。I10モジュール100は2つのED
Cを発生することが望ましい。一方のEDCはまたE
D C/CRCでもよく、これはモジュール100が接
続されているアサ−ネット(Ethernet )パケ
ット・ネットワークのより9 うなネットワークに対するインターフェースに使用され
る(第17図の構成要素108に参照)。
て使用されるのと同じEDC/CRCコードを発生して
チエツクを行う。I10モジュール100は2つのED
Cを発生することが望ましい。一方のEDCはまたE
D C/CRCでもよく、これはモジュール100が接
続されているアサ−ネット(Ethernet )パケ
ット・ネットワークのより9 うなネットワークに対するインターフェースに使用され
る(第17図の構成要素108に参照)。
他方のEDCは第17図のディスク・インターフェース
1072のようなディスク・インターフェースに使用さ
れる。
1072のようなディスク・インターフェースに使用さ
れる。
CPUモジュール30とI10モジュール100との間
でE D C/CRCを適応することは必要でないが、
その理由は、モジュールゆ相互接続部が2重になってい
るからである。例えばCPUモジュール30の場合、ク
ロスリンク90はモジュール相互接続部30を介してフ
ァイヤウオール1000と通信を行い、クロスリンク9
5はモジュール相互接続部132を介してファイヤウオ
ール1000と通信を行う。
でE D C/CRCを適応することは必要でないが、
その理由は、モジュールゆ相互接続部が2重になってい
るからである。例えばCPUモジュール30の場合、ク
ロスリンク90はモジュール相互接続部30を介してフ
ァイヤウオール1000と通信を行い、クロスリンク9
5はモジュール相互接続部132を介してファイヤウオ
ール1000と通信を行う。
アサ−ネット・ネットワーク1082から受は取られた
メツセージは、第17図に示すネットワーク制御装置1
080によってEDC/CRCの有効性をチエツクされ
る。EDC/CRCが完全であるデータは、これもまた
第17図に示すローカルRAM1060に書き込まれる
。ローカル00 RAMI 060内の全てのデータは、DMAを使用し
てメモリ・モジュール60に転送される。
メツセージは、第17図に示すネットワーク制御装置1
080によってEDC/CRCの有効性をチエツクされ
る。EDC/CRCが完全であるデータは、これもまた
第17図に示すローカルRAM1060に書き込まれる
。ローカル00 RAMI 060内の全てのデータは、DMAを使用し
てメモリ・モジュール60に転送される。
DMA制御装置1890は転送の調整を行い、E D
C/CRC発生装置に転送中のE D C/CRCによ
って符号化されたデータの有効性をチエツクさせる。
C/CRC発生装置に転送中のE D C/CRCによ
って符号化されたデータの有効性をチエツクさせる。
I10装置との大部分のデータの転送はDMAによって
行われる。データはメイン・メモリとI10バッファ・
メモリとの間を移動する。データがメイン・メモリから
I10バッファメモリに移動する場合、E D C/C
RCを付加してもよい。
行われる。データはメイン・メモリとI10バッファ・
メモリとの間を移動する。データがメイン・メモリから
I10バッファメモリに移動する場合、E D C/C
RCを付加してもよい。
データがI10バッファメモリからメイン・メモリに移
動する場合、EDC/CRCはチエツクを受けてメイン
・メモリに移動してもよく、または取り除かれてもよい
。データがI10バッファメモリからディスクまたはア
サ−ネット・アダプタのような外部装置を介して移動さ
れる場合、EDC/CRCは局部的または離れた位置に
ある受信ノードでチエツクされてもよく、またはその両
方でチエツクされてもよい。メモリ・データ・バケツ0
1 トは遠くの位置にあるノードまたはI10モジュールの
ローカル・インターフェースによって発生されたそれら
のEDC/CRCを有してもよい。
動する場合、EDC/CRCはチエツクを受けてメイン
・メモリに移動してもよく、または取り除かれてもよい
。データがI10バッファメモリからディスクまたはア
サ−ネット・アダプタのような外部装置を介して移動さ
れる場合、EDC/CRCは局部的または離れた位置に
ある受信ノードでチエツクされてもよく、またはその両
方でチエツクされてもよい。メモリ・データ・バケツ0
1 トは遠くの位置にあるノードまたはI10モジュールの
ローカル・インターフェースによって発生されたそれら
のEDC/CRCを有してもよい。
この動作によって、I10モジュール100のようなシ
ングル・レール・システムに存在する、またはこれを介
して転送中のデータがエラー検出コードによってカバー
されることが保証され、この工、ラー検出コードはこの
データが最終的に通過する通信メディアと少なくとも同
じくらい信頼性のあることが望ましい。例えば、同期プ
ロトコールを処理するような異なったI10モジュール
は、適当なプロトコールのEDC/CRCコードを発生
してチエツクするE D C/CRC発生装置を有する
ことが望ましい。
ングル・レール・システムに存在する、またはこれを介
して転送中のデータがエラー検出コードによってカバー
されることが保証され、この工、ラー検出コードはこの
データが最終的に通過する通信メディアと少なくとも同
じくらい信頼性のあることが望ましい。例えば、同期プ
ロトコールを処理するような異なったI10モジュール
は、適当なプロトコールのEDC/CRCコードを発生
してチエツクするE D C/CRC発生装置を有する
ことが望ましい。
一般的に、DMA制御装置1890はアドレスされてい
る共有のメモリ制御装置105とローカルRAM106
0に特有のDMAの動作の部分を取扱う。32ビツト・
バス1020は2つの異なったモードで駆動される。D
MAのセットアツプの期間中、DMA制御装置1890
は標準非同期 02 マイクロプロセッサ・バスとしてハス1020を使用す
る。DMAの動作が発生するローカルRAM1060の
アドレスは共有のメモリ制御装置1050とDMA制御
装置1890に供給される。実際のDMAの転送の期間
中、DMA制御装置1890はDMA制御線1895に
非同期の状態でバス1020を駆動させる。共有のメモ
リ制御装置1050はバス・サイクル毎に32ビットの
データ・ワードをバス1020に転送し、DMA制御装
置1090はとれくらいの数のワードの転送が残ってい
るかについての情報を得る。共有のメモリ制御装置10
50は、またローカルRAM1060を制御して次のD
MAアドレスを発生する。
る共有のメモリ制御装置105とローカルRAM106
0に特有のDMAの動作の部分を取扱う。32ビツト・
バス1020は2つの異なったモードで駆動される。D
MAのセットアツプの期間中、DMA制御装置1890
は標準非同期 02 マイクロプロセッサ・バスとしてハス1020を使用す
る。DMAの動作が発生するローカルRAM1060の
アドレスは共有のメモリ制御装置1050とDMA制御
装置1890に供給される。実際のDMAの転送の期間
中、DMA制御装置1890はDMA制御線1895に
非同期の状態でバス1020を駆動させる。共有のメモ
リ制御装置1050はバス・サイクル毎に32ビットの
データ・ワードをバス1020に転送し、DMA制御装
置1090はとれくらいの数のワードの転送が残ってい
るかについての情報を得る。共有のメモリ制御装置10
50は、またローカルRAM1060を制御して次のD
MAアドレスを発生する。
I10モジュール(100,110,120)はそれら
自身のローカルRAMl060に対する読み出し/書込
み動作を制御する責任を負う。
自身のローカルRAMl060に対する読み出し/書込
み動作を制御する責任を負う。
CPUモジュール30はメモリ・アレイ60との転送動
作を制御する責任を負う。メモリ制御装置70と75の
DMAエンジン800(第8図に示す)は、CPUモジ
ュール30に対するDMAの+03 動作を管理する。このような作業の分割によって、いず
れかのモジュールのDMAロジックの故障がゾーン11
または11’のいずれかの他のモジュールのデータの健
在性を低下させることを防止する。
作を制御する責任を負う。メモリ制御装置70と75の
DMAエンジン800(第8図に示す)は、CPUモジ
ュール30に対するDMAの+03 動作を管理する。このような作業の分割によって、いず
れかのモジュールのDMAロジックの故障がゾーン11
または11’のいずれかの他のモジュールのデータの健
在性を低下させることを防止する。
トレースRAMI 872は)・レースRAM制御装置
1870の機能を以下で詳細に説明する。簡単に言えば
、故障が検出され、CPU40.40′50および50
′とCPUモジュール30および30′がそのことを通
知されると、コンピュータ・システム10全体の種々の
トレースRAMが以下で説明するある種の機能を実行す
る。トレースRAMとの通信はトレース・バス1095
で行われる。トレースRAM制御装置1870は、トレ
ース・ハス1095からの信号に応答して、トレスRA
Ml872に記憶を停止させるかその内容をソレース・
バス1095放出させる。
1870の機能を以下で詳細に説明する。簡単に言えば
、故障が検出され、CPU40.40′50および50
′とCPUモジュール30および30′がそのことを通
知されると、コンピュータ・システム10全体の種々の
トレースRAMが以下で説明するある種の機能を実行す
る。トレースRAMとの通信はトレース・バス1095
で行われる。トレースRAM制御装置1870は、トレ
ース・ハス1095からの信号に応答して、トレスRA
Ml872に記憶を停止させるかその内容をソレース・
バス1095放出させる。
32ピツトの並列バスであることが望ましいI10モジ
ュール・バス1020は、ファイヤウオール1000お
よび1010に接続されると共に11)4 I10モジュール100の他の構成要素にも接続される
。共有のメモリ制御装置1050は、I10モジュール
100の■10モジュール・バス1020にもまた接続
される。共有のメモリ制御装置1050は共有のメモリ
・バス1065によってローカル・メモリ1060に接
続され、この共有のメモリ・ハス1065は32ビツト
のデータを搬送することが望ましい。ローカル・メモリ
1060は256キロハイトのメモリを有するRAMで
あることが望ましいが、このRAM1060は任意のサ
イズでよい。共有のメモリ制御装置1050とローカル
RAMI O60によって、I10モジュール100に
対する記憶能力が与えられる。
ュール・バス1020は、ファイヤウオール1000お
よび1010に接続されると共に11)4 I10モジュール100の他の構成要素にも接続される
。共有のメモリ制御装置1050は、I10モジュール
100の■10モジュール・バス1020にもまた接続
される。共有のメモリ制御装置1050は共有のメモリ
・バス1065によってローカル・メモリ1060に接
続され、この共有のメモリ・ハス1065は32ビツト
のデータを搬送することが望ましい。ローカル・メモリ
1060は256キロハイトのメモリを有するRAMで
あることが望ましいが、このRAM1060は任意のサ
イズでよい。共有のメモリ制御装置1050とローカル
RAMI O60によって、I10モジュール100に
対する記憶能力が与えられる。
ディスク制御装置1070によって、第1図のディスク
l075および1075’のようなディスクに対して標
準のインターフェースが設けられる。ディスク制御装置
1070は、ローカルRAM1060に使用するためま
たはI10モジュール・バス1020との通信を行うた
めに共有のメモ 05 す制御装置1050にまた接続される。
l075および1075’のようなディスクに対して標
準のインターフェースが設けられる。ディスク制御装置
1070は、ローカルRAM1060に使用するためま
たはI10モジュール・バス1020との通信を行うた
めに共有のメモ 05 す制御装置1050にまた接続される。
ネットワーク制御装置1080はネットワーク・インタ
ーフェース1082によってETHBRNETネットワ
ークのような標準ネットワークに対してインターフェー
スを与える。ネットワーク制御装置1080は、ローカ
ルRAM1060とI10モジュール・バス1020の
両方に対してインターフェースとして機能する共有のメ
モリ制御装置1050にまた接続される。しかし、I1
0モジュール・バス1020の特定の組織または構造に
ついては何等の要求も存在しない。
ーフェース1082によってETHBRNETネットワ
ークのような標準ネットワークに対してインターフェー
スを与える。ネットワーク制御装置1080は、ローカ
ルRAM1060とI10モジュール・バス1020の
両方に対してインターフェースとして機能する共有のメ
モリ制御装置1050にまた接続される。しかし、I1
0モジュール・バス1020の特定の組織または構造に
ついては何等の要求も存在しない。
PCIM(電源および冷却用インターフェース・モジュ
ール)サポート・エレメント1030は、I10モジュ
ール・バス1.020に接続されると共にASCI I
インターフェース103に接続される。PCIMサポー
ト・エレメント1O30によって、処理システム20は
電源システムの状態(すなわちバッテリ・レギュレータ
等)と冷却システム(すなわちファン)を監視してこれ
らの適切な動作を保証することが可能になる。PCIM
06 サポート・エレメント1030は、バッテリの電圧が許
容できない程度に低い等のある種の故障または潜在的な
故障の徴候が存在する場合のみ、メツセージを受は取る
ことが望ましい。全ての電源および冷却サブシステムを
周期的に監視するために、CPIMサポート・エレメン
ト1030を使用することもまた可能である。または、
PCIMサポート・エレメント1030は、直接ファイ
ヤウオール1000と1010に接続されてもよい。
ール)サポート・エレメント1030は、I10モジュ
ール・バス1.020に接続されると共にASCI I
インターフェース103に接続される。PCIMサポー
ト・エレメント1O30によって、処理システム20は
電源システムの状態(すなわちバッテリ・レギュレータ
等)と冷却システム(すなわちファン)を監視してこれ
らの適切な動作を保証することが可能になる。PCIM
06 サポート・エレメント1030は、バッテリの電圧が許
容できない程度に低い等のある種の故障または潜在的な
故障の徴候が存在する場合のみ、メツセージを受は取る
ことが望ましい。全ての電源および冷却サブシステムを
周期的に監視するために、CPIMサポート・エレメン
ト1030を使用することもまた可能である。または、
PCIMサポート・エレメント1030は、直接ファイ
ヤウオール1000と1010に接続されてもよい。
診断マイクロプロセッサ1100が、またI10モジュ
ール・バス1020に接続される。−殻内に、診断マイ
クロプロセッサ1100は、故障が検出された場合、ト
レースRAM1872のようなトレースRAMからエラ
ー・チエツク情報を集めるために使用される。このデー
タは、それぞれファイヤウオール1000と1010を
介してトレース・バス1095と1096に集められる
と共にモジュール・バス1020を介してマイクロプロ
セッサ1100に集められる。
ール・バス1020に接続される。−殻内に、診断マイ
クロプロセッサ1100は、故障が検出された場合、ト
レースRAM1872のようなトレースRAMからエラ
ー・チエツク情報を集めるために使用される。このデー
タは、それぞれファイヤウオール1000と1010を
介してトレース・バス1095と1096に集められる
と共にモジュール・バス1020を介してマイクロプロ
セッサ1100に集められる。
D、インタープロセッサとインターモジュールの07
通信
■、 データ経路
コンピュータ・システム10の構成要素は、それら自身
によって故障許容システムを構成するものではない。正
常な動作の期間中および故障の検出と修正の動作の期間
中に通信を可能にする通信経路とプロトコールが必要で
ある。このような通信号に対するキーは、クロスリンク
経路25である。クロスリンク経路25は、並列リンク
、直列リンク、および既に説明したクロック信号によっ
て構成される。これらは19図に示される。並列リンク
は、2組の同じデータおよびアドレス線、制御線、割り
込み線、符号化エラー線、および1本のソフト・リセッ
ト・リクエスト線を有する。
によって故障許容システムを構成するものではない。正
常な動作の期間中および故障の検出と修正の動作の期間
中に通信を可能にする通信経路とプロトコールが必要で
ある。このような通信号に対するキーは、クロスリンク
経路25である。クロスリンク経路25は、並列リンク
、直列リンク、および既に説明したクロック信号によっ
て構成される。これらは19図に示される。並列リンク
は、2組の同じデータおよびアドレス線、制御線、割り
込み線、符号化エラー線、および1本のソフト・リセッ
ト・リクエスト線を有する。
データおよびアドレス線と制御線は、モジュール相互接
続部130と132(または130′と132’)また
はメモリ・モジュール60(60’からCPUモジュー
ルの間で交換される情報を有している。
続部130と132(または130′と132’)また
はメモリ・モジュール60(60’からCPUモジュー
ルの間で交換される情報を有している。
割り込み線は、I10サブシステム(モジュー08
ル100.110.120.100′、110′および
120’)で使用可能な割り込み水準の各々に対し1本
の線を有することが望ましい。これらの線はクロスリン
ク90.95.90′、および95′によって共有され
る。
120’)で使用可能な割り込み水準の各々に対し1本
の線を有することが望ましい。これらの線はクロスリン
ク90.95.90′、および95′によって共有され
る。
符号化エラー線は、両方のゾーンに対するコンソールr
HALT」要求を同期させる複数のコードを有すること
が望ましく、これらの複数のコードの1つは両方のゾー
ンに対してCPUエラーを同期させるコード、1つは他
方のゾーンに対してCPU/メモリの故障の発生を示す
コード、1つは両方のゾーンに対してDMAエラーを同
期させるコード、および1つはクロック位相エラーを示
すコードである。各ゾーン11または11’からのエラ
ー線は、ゾーン11に対するORゲート1990または
ゾーン11’に対するORゲート1990’のようなO
Rゲートに対する入力である。各ORゲート2の出力に
よって、他方のゾーンのクロスリンクに対する入力が与
えられる。
HALT」要求を同期させる複数のコードを有すること
が望ましく、これらの複数のコードの1つは両方のゾー
ンに対してCPUエラーを同期させるコード、1つは他
方のゾーンに対してCPU/メモリの故障の発生を示す
コード、1つは両方のゾーンに対してDMAエラーを同
期させるコード、および1つはクロック位相エラーを示
すコードである。各ゾーン11または11’からのエラ
ー線は、ゾーン11に対するORゲート1990または
ゾーン11’に対するORゲート1990’のようなO
Rゲートに対する入力である。各ORゲート2の出力に
よって、他方のゾーンのクロスリンクに対する入力が与
えられる。
欠陥許容処理システム10は、過渡的な故障に09
関係なくデュアル・レール・システムとして動作を継続
するように設計されている。I10サブシステム(モジ
ュール100.110.120.100’、110’、
120’)は、また過渡的なエラーまたは故障を経験し
ても動作を継続することができる。好適な実施例の場合
、ファイヤウオール比較回路1840の検出したエラー
によって、同期化されたエラー・レポートがCPUの管
理する動作に関して経路25を介して行われる。
するように設計されている。I10サブシステム(モジ
ュール100.110.120.100’、110’、
120’)は、また過渡的なエラーまたは故障を経験し
ても動作を継続することができる。好適な実施例の場合
、ファイヤウオール比較回路1840の検出したエラー
によって、同期化されたエラー・レポートがCPUの管
理する動作に関して経路25を介して行われる。
CPU30と30′のハードウェアは経路25を介して
同期化されたソフト・リセットを行い、故障のある動作
をもう一度行う。DMAの管理する動作の場合、同じエ
ラーの検出によって、同期割り込みが経路235を介し
て行われ、CPU40.50.40′、および50′の
ソフトウェアはDMAの動作を再び開始する。
同期化されたソフト・リセットを行い、故障のある動作
をもう一度行う。DMAの管理する動作の場合、同じエ
ラーの検出によって、同期割り込みが経路235を介し
て行われ、CPU40.50.40′、および50′の
ソフトウェアはDMAの動作を再び開始する。
ある種の過渡的なエラーは、動作を完全デュプレックス
の同期形態で継続するように直ちに修復されるものでは
ない、例えば、メモリ・モジュール60に制御エラーが
発生すると、その結果メモ10 リ・モジュール60に未知のデータが生じる。この場合
、CPUとメモリ・エレメントは最早フェル・セーフ・
システムの一部として信頼性のある機能は果たすことは
できず、従ってこれらを取り外さなければならない。メ
モリ・アレー60はそこで、CPUとメモリ・エレメン
トが再びメモリに取り付けられる前に、メモリの再同期
を行わなければならない。経路25の符号化エラー線の
CPUメモリ故障コードは、CPU30のCPUとメモ
リ・エレメントが故障していることをCPU30′に知
らせる。
の同期形態で継続するように直ちに修復されるものでは
ない、例えば、メモリ・モジュール60に制御エラーが
発生すると、その結果メモ10 リ・モジュール60に未知のデータが生じる。この場合
、CPUとメモリ・エレメントは最早フェル・セーフ・
システムの一部として信頼性のある機能は果たすことは
できず、従ってこれらを取り外さなければならない。メ
モリ・アレー60はそこで、CPUとメモリ・エレメン
トが再びメモリに取り付けられる前に、メモリの再同期
を行わなければならない。経路25の符号化エラー線の
CPUメモリ故障コードは、CPU30のCPUとメモ
リ・エレメントが故障していることをCPU30′に知
らせる。
サイクル・タイプ、エラー・タイプおよび準備完了状態
の組み合わせを示す制御線によって、CPUモジュール
(30および30′)とI10モジュールとの間にハン
ドシェーキングが行われる。上で説明したように、実行
されているバス動作のタイプがサイクル・タイプによっ
て決められる。すなわち、これらは、CPU Ilo
の読み出し、DMAの転送、DMAのセットアツプまた
は割り込みベクトルの要求である。エラー・タイCRC
のエラーか決められる。「準備完了JのメツセージはC
PUとI10モジュールとの間に送られて要求された動
作の完了を示す。
の組み合わせを示す制御線によって、CPUモジュール
(30および30′)とI10モジュールとの間にハン
ドシェーキングが行われる。上で説明したように、実行
されているバス動作のタイプがサイクル・タイプによっ
て決められる。すなわち、これらは、CPU Ilo
の読み出し、DMAの転送、DMAのセットアツプまた
は割り込みベクトルの要求である。エラー・タイCRC
のエラーか決められる。「準備完了JのメツセージはC
PUとI10モジュールとの間に送られて要求された動
作の完了を示す。
シリアル・クロスリンクは状態読み出しのためのシリア
ル・データの転送、ループバック、およびデータの転送
を行うために2本の線を2組有している。
ル・データの転送、ループバック、およびデータの転送
を行うために2本の線を2組有している。
交換されるクロック信号は、位相ロック・クロック信号
CLKCHとCLCK’ H(遅延した)。である。
CLKCHとCLCK’ H(遅延した)。である。
第20A図乃至第20D図は、異なった動作期間中にデ
ータが通過するCPUモジュール3oおよび30′とI
10モジュール100および100′の構成要素のブロ
ックを示す。これらの構成要素の各々は前に説明したも
のである。
ータが通過するCPUモジュール3oおよび30′とI
10モジュール100および100′の構成要素のブロ
ックを示す。これらの構成要素の各々は前に説明したも
のである。
第20A図は、共有のメモリ制御装置1050(105
0’)からのレジスタ・データのCPUのI10レジス
タによる読み出し動作のようなI10モジュール100
からのデータの一般的なCPU Iloによるデータ
読み出し動作のためのデータ経路を示す。このような動
作はローカル・データの読み出しと呼び、これをローカ
ル・メモリ1060からのDMAによるデータの読み出
しと区別し、このローカル・メモリ1060は通常内部
装置の制御装置からのデータを有している。
0’)からのレジスタ・データのCPUのI10レジス
タによる読み出し動作のようなI10モジュール100
からのデータの一般的なCPU Iloによるデータ
読み出し動作のためのデータ経路を示す。このような動
作はローカル・データの読み出しと呼び、これをローカ
ル・メモリ1060からのDMAによるデータの読み出
しと区別し、このローカル・メモリ1060は通常内部
装置の制御装置からのデータを有している。
ローカル・データは共有のメモリ制御装置1050(1
050’)を介して転送されるようにローカルRAM1
060 (1060’)に記憶されているものと仮定す
る。経路が1つの場合、データはファイアウオール10
00、モジュール相互接続部130を介してクロスリン
ク90に流れる。第12図から分かるように、クロスリ
ンク90はファイアウオール 1000からメモリ制御
装置90に流れるデータを遅延させ、その結果、クロス
リンク90′に対するデータは、データがメモリ制御装
置70に加えられるのと同時に、このメモリ制御装置7
0に加えられ、従って、処理システム20と20′が同
期状態のままであることが可能になる。このデータは、
次に内部バス46と13 40′によってメモリ制御装置70および70′からC
PU40および40′に進む。
050’)を介して転送されるようにローカルRAM1
060 (1060’)に記憶されているものと仮定す
る。経路が1つの場合、データはファイアウオール10
00、モジュール相互接続部130を介してクロスリン
ク90に流れる。第12図から分かるように、クロスリ
ンク90はファイアウオール 1000からメモリ制御
装置90に流れるデータを遅延させ、その結果、クロス
リンク90′に対するデータは、データがメモリ制御装
置70に加えられるのと同時に、このメモリ制御装置7
0に加えられ、従って、処理システム20と20′が同
期状態のままであることが可能になる。このデータは、
次に内部バス46と13 40′によってメモリ制御装置70および70′からC
PU40および40′に進む。
同じ経路を使用してCPU50と50′にデータを読み
込む。共有のメモリ制御装置1050からのデータはフ
ァイヤウオール1010を介してクロスリンク95に進
む。この時、データはクロスリンク95′と遅延装置を
介してクロスリンク95の内部の両方に流れる。
込む。共有のメモリ制御装置1050からのデータはフ
ァイヤウオール1010を介してクロスリンク95に進
む。この時、データはクロスリンク95′と遅延装置を
介してクロスリンク95の内部の両方に流れる。
CPUl0読み出し動作は、また共有のメモリ制御装置
1050’とI10装置100′のローカルRAMを介
して処理システム20′のI10処置から受は取られた
データに対してもまた実行されることができる。
1050’とI10装置100′のローカルRAMを介
して処理システム20′のI10処置から受は取られた
データに対してもまた実行されることができる。
I10モジュール100.110、および120は同じ
ものであり、それぞれI10モジュール100’、11
0’ 120’に対応するが、対応するI10モジ
ュールはロックステップ同期状態にはない。CPU
I10読み出しのためメモリ制御装置1050’とロー
カルRAMI 060’行う使用して、データは先ずク
ロスリンク90′14 と95′に進む。残りのデータ経路はメモリ制御装置1
050からの経路と同じである。データはクロスリンク
90′と95′からメモリ制御装置70′と75′を経
由して最終的にそれぞれCPO40′と50′に進む。
ものであり、それぞれI10モジュール100’、11
0’ 120’に対応するが、対応するI10モジ
ュールはロックステップ同期状態にはない。CPU
I10読み出しのためメモリ制御装置1050’とロー
カルRAMI 060’行う使用して、データは先ずク
ロスリンク90′14 と95′に進む。残りのデータ経路はメモリ制御装置1
050からの経路と同じである。データはクロスリンク
90′と95′からメモリ制御装置70′と75′を経
由して最終的にそれぞれCPO40′と50′に進む。
同時に、データはそれぞれクロスリンク90と95を横
切って進み、次に遅延エレメントを経由しないでそれぞ
れCPU40と50に進み続ける。
切って進み、次に遅延エレメントを経由しないでそれぞ
れCPU40と50に進み続ける。
第20B図は、ローカル・データのCPU、Ilo書き
込み動作を示す。このようなローカル・データはCPU
40.50.40′および50′からI10モジュール
100のようなI10モジュールに転送される。このよ
うな動作の1つの例は、共有のメモリ制御装置1050
におけるレジスタAに対する書き込みである。CPU4
0によって転送されるデータは同じ経路に沿って進むが
、その方向はCPU Iloの読み出し期間中のデー
タの方向と逆の方向である。特に、このようなデータは
バス46、メモリ制御装置70、種々のラッチ(同期を
行うため)、ファイヤウオール1000、およびメモリ
制御装置1050を通過する。CPU50’からのデー
タは、またCPUl10の読み出しの経路を逆の方向に
流れる。特に、このようなデータは、バス56′、メモ
リ制御装置75′クロスリンク95′クロスリンク95
を経由しくファイヤウオール1010に行く。
込み動作を示す。このようなローカル・データはCPU
40.50.40′および50′からI10モジュール
100のようなI10モジュールに転送される。このよ
うな動作の1つの例は、共有のメモリ制御装置1050
におけるレジスタAに対する書き込みである。CPU4
0によって転送されるデータは同じ経路に沿って進むが
、その方向はCPU Iloの読み出し期間中のデー
タの方向と逆の方向である。特に、このようなデータは
バス46、メモリ制御装置70、種々のラッチ(同期を
行うため)、ファイヤウオール1000、およびメモリ
制御装置1050を通過する。CPU50’からのデー
タは、またCPUl10の読み出しの経路を逆の方向に
流れる。特に、このようなデータは、バス56′、メモ
リ制御装置75′クロスリンク95′クロスリンク95
を経由しくファイヤウオール1010に行く。
上で述べたように、ファイヤウオール1000と101
0はIloの書き込み動作の期間中にデータをチエツク
して記憶する前にエラーを調べる。
0はIloの書き込み動作の期間中にデータをチエツク
して記憶する前にエラーを調べる。
書き込みが他方のゾーンのI10モジュールに対して行
われる場合、同じ動作が行われる。しかし、CPU50
と40′からのデータがCPU50′と40からのデー
タの代わりに使用される。
われる場合、同じ動作が行われる。しかし、CPU50
と40′からのデータがCPU50′と40からのデー
タの代わりに使用される。
CPU50と40′からのデータは対称の経路を介して
共有のメモリ制御装置1050’に転送される。CPU
50と40′からのデータはファイヤウオール1000
’と1010’によって比較される。Ilo書き込みデ
ータに対してサービスを行うために異なったCPUの対
が使用される理由は、完全デュプレックス・システムで
正常に■ 使用している期間中に全てのデータ経路をチエツクする
ためである。各ゾーンに対するインターレール・チエツ
クはメモリ制御装置70.75.70′および75′で
前に実行された。
共有のメモリ制御装置1050’に転送される。CPU
50と40′からのデータはファイヤウオール1000
’と1010’によって比較される。Ilo書き込みデ
ータに対してサービスを行うために異なったCPUの対
が使用される理由は、完全デュプレックス・システムで
正常に■ 使用している期間中に全てのデータ経路をチエツクする
ためである。各ゾーンに対するインターレール・チエツ
クはメモリ制御装置70.75.70′および75′で
前に実行された。
第20C図は、DMA読取り動作に対するデータ経路を
示す。メモリ・アレイ600からのデータは、同時にメ
モリ制御装置70と75に入り、次いでクロスリンク9
0と95に入る。クロスリンク90はファイヤウオール
1000に転送されたデータを遅延させ、その結果、ク
ロスリンク90と95′からのデータは実質的に同じ時
間にファイヤウオール1000と1010に到着する。
示す。メモリ・アレイ600からのデータは、同時にメ
モリ制御装置70と75に入り、次いでクロスリンク9
0と95に入る。クロスリンク90はファイヤウオール
1000に転送されたデータを遅延させ、その結果、ク
ロスリンク90と95′からのデータは実質的に同じ時
間にファイヤウオール1000と1010に到着する。
CPU Ilo書き込み動作と同様に、種々のクロス
リンクに対するデータの4つのデータ/コピーが存在す
る。ファイヤウオールでは2つのコピーのみが受は取ら
れる。ゾーン11に対する読み出しを実行する場合には
、異なった対のデータが使用される。DMAの書き込み
動作に対するデータ経路は第20D図に示され、これら
はCPUl10の読み出しに対するデータと同じである
。
リンクに対するデータの4つのデータ/コピーが存在す
る。ファイヤウオールでは2つのコピーのみが受は取ら
れる。ゾーン11に対する読み出しを実行する場合には
、異なった対のデータが使用される。DMAの書き込み
動作に対するデータ経路は第20D図に示され、これら
はCPUl10の読み出しに対するデータと同じである
。
17
特に、共有のメモリ制御装置1050’からのデータは
、ファイアウオール1000’、クロスリンク90′
(遅延を伴う)、メモリ制御装置70′を経由してメモ
リ・アレイ600′に進む。同時に、このデータは、フ
ァイヤウオールl 010’クロスリンク95′ (遅
延を伴う)およびメモリ制御装置75′を通過し、この
時これはインターレール・エラー・チエツクの期間中に
メモリ制御装置70′からのデータと比較される。CP
U110の読み出しの場合のように、DMA書き込み動
作中のデータは、共有のメモリ制御装置1050を介し
て交互に同じ動作に入ってもよい。
、ファイアウオール1000’、クロスリンク90′
(遅延を伴う)、メモリ制御装置70′を経由してメモ
リ・アレイ600′に進む。同時に、このデータは、フ
ァイヤウオールl 010’クロスリンク95′ (遅
延を伴う)およびメモリ制御装置75′を通過し、この
時これはインターレール・エラー・チエツクの期間中に
メモリ制御装置70′からのデータと比較される。CP
U110の読み出しの場合のように、DMA書き込み動
作中のデータは、共有のメモリ制御装置1050を介し
て交互に同じ動作に入ってもよい。
クロスリンク90′からのデータは、またクロスリンク
90とメモリ制御装置70を通過してメモリ・アレイ6
00に行く。クロスリンク95′からのデータは、クロ
スリンク95とメモリ制御装置75を通過し、この時こ
れは同時に行われるインターレール・チエツクの期間中
にメモリ制御装置70′からのデータと比較される。
90とメモリ制御装置70を通過してメモリ・アレイ6
00に行く。クロスリンク95′からのデータは、クロ
スリンク95とメモリ制御装置75を通過し、この時こ
れは同時に行われるインターレール・チエツクの期間中
にメモリ制御装置70′からのデータと比較される。
第270E図は、メモリ再同期(resync)動作の
18 ためのデータ経路を示す。この動作の場合、メモリ・ア
レイ60と60′の両方の内容は、相互に同じように設
定されなければならない。メモリの再同期の場合、メモ
リ・アレイ600′からのデータは、DMAに制御され
てメモリ制御装置70′と75′を通過し、次にそれぞ
れクロスリンク90′と95′を通過する。このデータ
は、次にメモリ600アレイに3己1.αされる?ii
f+こ、それぞれメモリ制御装置70と75に入る。
18 ためのデータ経路を示す。この動作の場合、メモリ・ア
レイ60と60′の両方の内容は、相互に同じように設
定されなければならない。メモリの再同期の場合、メモ
リ・アレイ600′からのデータは、DMAに制御され
てメモリ制御装置70′と75′を通過し、次にそれぞ
れクロスリンク90′と95′を通過する。このデータ
は、次にメモリ600アレイに3己1.αされる?ii
f+こ、それぞれメモリ制御装置70と75に入る。
2、 リセット
システム10に閣する」二記の議論は、リセットに関す
る多くの異なった必要性を考慮して行われた。議論しな
かったある種の場合には、リセットは、電源が最初にシ
ステム10に印加される場合等の標準的な機能のために
行われる。多くのシステムは1つのリセットを有し、こ
のリセットは常にプロセッサをある所定の状態または最
初の状態にセットし、従ってプロセッサの命令の流れを
中断する。しかし、大部分の他のシステムと異なって、
システム10のリセットは、もし絶対的に必要でなけれ
ば、CPU40.40′、50および50′による命令
の実行の流れに影響を及ぼさない。更に、システム10
のリセットは、正常な動作を回復するためにリセットさ
れる必要のある部分のみに影響を及ぼす。
る多くの異なった必要性を考慮して行われた。議論しな
かったある種の場合には、リセットは、電源が最初にシ
ステム10に印加される場合等の標準的な機能のために
行われる。多くのシステムは1つのリセットを有し、こ
のリセットは常にプロセッサをある所定の状態または最
初の状態にセットし、従ってプロセッサの命令の流れを
中断する。しかし、大部分の他のシステムと異なって、
システム10のリセットは、もし絶対的に必要でなけれ
ば、CPU40.40′、50および50′による命令
の実行の流れに影響を及ぼさない。更に、システム10
のリセットは、正常な動作を回復するためにリセットさ
れる必要のある部分のみに影響を及ぼす。
システム10のリセットの他の特徴は、これらのリセッ
トの抑制である。故障許容システムの最も重要な考慮す
べき事項の1つは、もしある機能が故障しても、その機
能はシステムの動作を停止してはならないことである。
トの抑制である。故障許容システムの最も重要な考慮す
べき事項の1つは、もしある機能が故障しても、その機
能はシステムの動作を停止してはならないことである。
この理由のため、システムのいかなる1つのリセットも
、ゾーン11と11′が直接に協力しないなら、ゾーン
11と11’の両方の構成要素を制御することはできな
い。従って、完全デュプレックス・モードで動作してい
るの場合、ゾーンll内の全てのリセットはゾーン11
’内のリセットとは独立している。
、ゾーン11と11′が直接に協力しないなら、ゾーン
11と11’の両方の構成要素を制御することはできな
い。従って、完全デュプレックス・モードで動作してい
るの場合、ゾーンll内の全てのリセットはゾーン11
’内のリセットとは独立している。
しかし、システムIOがマスター/スレーブ・モートに
ある場合、スレーブゾーンはマスターゾーンのリセット
を使用する。更に、システムjo内のいかなるリセット
もメモリ・チップの内容に影20 響を及ぼさない。従って、キャッシュ・メモリ42及び
52、スクラッチ・パッド・メモリ45および55また
はメモリ・モジュール60のいずれもリセットによって
いかなるデータも失うことはない。
ある場合、スレーブゾーンはマスターゾーンのリセット
を使用する。更に、システムjo内のいかなるリセット
もメモリ・チップの内容に影20 響を及ぼさない。従って、キャッシュ・メモリ42及び
52、スクラッチ・パッド・メモリ45および55また
はメモリ・モジュール60のいずれもリセットによって
いかなるデータも失うことはない。
システム12は3つのクラスのリセット、すなわち、
「クロック・リセット」 「ハード・リセット」、およ
び「ソフト・リセット」があることが望ましい。クロッ
ク・リセットはゾーン内の全てのクロック位相発生器を
再編成する。ゾーンll内のクロック・リッセトはまた
CPU40と50、およびメモリ・モジュール60をイ
ニシアライスする。クロック・リセットは、これらのモ
ジュールのクロック位相発生器を再編成する以外にモジ
ュール相互接続部130と132に影響を及ぼさない。
「クロック・リセット」 「ハード・リセット」、およ
び「ソフト・リセット」があることが望ましい。クロッ
ク・リセットはゾーン内の全てのクロック位相発生器を
再編成する。ゾーンll内のクロック・リッセトはまた
CPU40と50、およびメモリ・モジュール60をイ
ニシアライスする。クロック・リセットは、これらのモ
ジュールのクロック位相発生器を再編成する以外にモジ
ュール相互接続部130と132に影響を及ぼさない。
システム10がマスター/スレーブモードにある場合で
さえ、スレーブ・ゾーンでクロック・リセットを行って
も、これはマスターゾーンのモジュール相互接続部から
スレーブ・ゾーンのモジュール相互接続部に対するデー
タの転送を妨げ 21 ない。しかし、ゾーン11’でクロック・リセットを行
うと、ゾーン11’内の対応する構成要素がイニシアラ
イズされる。
さえ、スレーブ・ゾーンでクロック・リセットを行って
も、これはマスターゾーンのモジュール相互接続部から
スレーブ・ゾーンのモジュール相互接続部に対するデー
タの転送を妨げ 21 ない。しかし、ゾーン11’でクロック・リセットを行
うと、ゾーン11’内の対応する構成要素がイニシアラ
イズされる。
一般的に、ハード・リセットを行うと、全ての状態デバ
イスとレジスタはある所定の状態または最初の状態に戻
る。ソフト・リセットを行うと、状態エンジンと一時的
に記憶を行うレジスタのみがそれらの所定の状態または
最初の状態に戻るだけである。1つのモジュール内の状
態エンジンはそのモジュールの状態を決める回路である
。エラー情報と構成データを有するレジスタはソフト・
リセットによって影響を与えられない。更に、システム
lOは、処理を継続するために、再びイニシアライスさ
れる必要のある構成要素のみをリセットするために同時
にハード・リセットとソフト・リセットの両方を選択的
に行う。
イスとレジスタはある所定の状態または最初の状態に戻
る。ソフト・リセットを行うと、状態エンジンと一時的
に記憶を行うレジスタのみがそれらの所定の状態または
最初の状態に戻るだけである。1つのモジュール内の状
態エンジンはそのモジュールの状態を決める回路である
。エラー情報と構成データを有するレジスタはソフト・
リセットによって影響を与えられない。更に、システム
lOは、処理を継続するために、再びイニシアライスさ
れる必要のある構成要素のみをリセットするために同時
にハード・リセットとソフト・リセットの両方を選択的
に行う。
ハード・リセットはシステム10をクリアし、従来のシ
ステムと同様に、システム1oを既知の構成に戻す。ハ
ード・リセットは、ゾーンが同期されるべき場合または
I10モジュールをイニシ 22 ァライズまたは不能にするべき場合に、電源を印加した
後、使用される。システム10の場合、4つのハード・
リセット、すなわち、「パワーアップ・リセット」、
rCPUハード・リセット」、「モジュール・リセット
」、及び「デバイス・リセット」があることが望ましい
。ハード・リセットは更にローカル・ハード・リセット
とシステム・ハード・リセットに分けることができる。
ステムと同様に、システム1oを既知の構成に戻す。ハ
ード・リセットは、ゾーンが同期されるべき場合または
I10モジュールをイニシ 22 ァライズまたは不能にするべき場合に、電源を印加した
後、使用される。システム10の場合、4つのハード・
リセット、すなわち、「パワーアップ・リセット」、
rCPUハード・リセット」、「モジュール・リセット
」、及び「デバイス・リセット」があることが望ましい
。ハード・リセットは更にローカル・ハード・リセット
とシステム・ハード・リセットに分けることができる。
ローカル・ハード・リセットは、CPUがスレーブ・モ
ードにある場合に応答するロジックのみにに影響を及ぼ
す。システム・ハード・リセットは、クロスリンク・ケ
ーブル25とモジュール相互接続部130及び132に
接続されているロジックのみに限定される。
ードにある場合に応答するロジックのみにに影響を及ぼ
す。システム・ハード・リセットは、クロスリンク・ケ
ーブル25とモジュール相互接続部130及び132に
接続されているロジックのみに限定される。
パワーアップ・リセットは、電源が印加された直後に、
ゾーン11と11’をイニシアライズするために使用さ
れる。パワーアップ・リセットによって、ゾーンの全て
の部分に対して強制的にリセットが行われる。パワーア
ップ・リセットはシステム11のゾーンの間では決して
接続されない23 が、その理由は、各ゾーンがそれ自身の電源を有し、従
って異なった長さの「電源投入」イベントを経験するか
らである。パワーアップ・リセットは全てのハード・リ
セットとクロック・リセットをゾーン11または11’
に行うことによって実行される。
ゾーン11と11’をイニシアライズするために使用さ
れる。パワーアップ・リセットによって、ゾーンの全て
の部分に対して強制的にリセットが行われる。パワーア
ップ・リセットはシステム11のゾーンの間では決して
接続されない23 が、その理由は、各ゾーンがそれ自身の電源を有し、従
って異なった長さの「電源投入」イベントを経験するか
らである。パワーアップ・リセットは全てのハード・リ
セットとクロック・リセットをゾーン11または11’
に行うことによって実行される。
CPUハード・リセットは、CPUモジュールを既知の
状態に戻すため診断目的に使用される。
状態に戻すため診断目的に使用される。
CPUハード・リセットは影響の与えられたゾーン内に
あるCPU、メモリ制御装置、およびメモリ・モジュー
ル、状態レジスタの全ての情報をクリアする。キャッシ
ュ・メモリとメモリ・モジュールは不能にされるが、ス
クラッチ・パッドRAM45および55の内容とメモリ
・モジュール60の内容は変化されない。更に、パワー
アップ・リセットと違って、CPUハード・リセットは
、クロスリンクのゾーン識別またはクロック・マスター
シップを変更しない。CPUハード・リセットは、CP
Uモジュールとクロック・リセットに加えることのでき
る全てのローカル・ハード・リセット24 の合計である。
あるCPU、メモリ制御装置、およびメモリ・モジュー
ル、状態レジスタの全ての情報をクリアする。キャッシ
ュ・メモリとメモリ・モジュールは不能にされるが、ス
クラッチ・パッドRAM45および55の内容とメモリ
・モジュール60の内容は変化されない。更に、パワー
アップ・リセットと違って、CPUハード・リセットは
、クロスリンクのゾーン識別またはクロック・マスター
シップを変更しない。CPUハード・リセットは、CP
Uモジュールとクロック・リセットに加えることのでき
る全てのローカル・ハード・リセット24 の合計である。
・モジュール・ハード・リセットは、ルートストラッピ
ングの期間中のような既知の状態にI10モジュールを
セットするために使用され、また故障したI10モジュ
ールをシステムから取り外すためにも使用される。I1
0モジュール・ハイド・リセットはモジュール上の全て
のものをクリアし、診断モードでファイヤウオールを離
れ、ドライバを不能にする。
ングの期間中のような既知の状態にI10モジュールを
セットするために使用され、また故障したI10モジュ
ールをシステムから取り外すためにも使用される。I1
0モジュール・ハイド・リセットはモジュール上の全て
のものをクリアし、診断モードでファイヤウオールを離
れ、ドライバを不能にする。
デバイス・リセットは、I10モジュールに接続された
I10デバイスをリセットするために使用される。これ
らのリセットは装置に依存し、装置が接続されているI
10モジュールによって与えられる。
I10デバイスをリセットするために使用される。これ
らのリセットは装置に依存し、装置が接続されているI
10モジュールによって与えられる。
他のクラスのリセットはソフト・リセットである。上で
説明したように、ソフト・リセットは、システムlO内
の状態エンジンと一時的レジスタをクリアするが、これ
らはクロスリンク内のモード・ビットのような構成情報
を変化させない。更に、ソフト・リセットは、またモジ
ュール内の工25 ラー処理機構をクリアするが、これらはシステム・エラ
ー・レジスタ898およびシステム故障アドレス・レジ
スタ865のようなエラー・レジスタを変化させない。
説明したように、ソフト・リセットは、システムlO内
の状態エンジンと一時的レジスタをクリアするが、これ
らはクロスリンク内のモード・ビットのような構成情報
を変化させない。更に、ソフト・リセットは、またモジ
ュール内の工25 ラー処理機構をクリアするが、これらはシステム・エラ
ー・レジスタ898およびシステム故障アドレス・レジ
スタ865のようなエラー・レジスタを変化させない。
ソフト・リセットには目標が定まっているので、その結
果、システムの必要な部分のみがリセットされる。例え
ば、モジュール相互接続部130がリセットされる必要
があれば、CPU40はリセットされず、またI10モ
ジュール110に接続されている装置もリセットされな
い。
果、システムの必要な部分のみがリセットされる。例え
ば、モジュール相互接続部130がリセットされる必要
があれば、CPU40はリセットされず、またI10モ
ジュール110に接続されている装置もリセットされな
い。
ソフト・リセットには3つのユニークな特徴がある。1
つは各ゾーンがそれ自身のリセットの発生に対して責任
を負っていることである。1つのゾーン内の故障エラー
またはリセット・ロジックは、従って故障の発生してい
ないゾーンでリセットを行うことを防止される。
つは各ゾーンがそれ自身のリセットの発生に対して責任
を負っていることである。1つのゾーン内の故障エラー
またはリセット・ロジックは、従って故障の発生してい
ないゾーンでリセットを行うことを防止される。
第2の特徴は、ソフト・リセットが命令実行のシーケン
スを乱さないことである。CPU40.40′、50、
および50′はクロックとハード・リセットの組み合わ
せのみによってリセットさ26 れる。更に、メモリ制御装置70.75.70′および
75′はハード・リセットに取り付けたCPU命令にサ
ービスを行うのに必要なそれらの状態エンジンとレジス
タを有している。従って、ソフト・リセットはソフトウ
ェアの実行にとって透明である。
スを乱さないことである。CPU40.40′、50、
および50′はクロックとハード・リセットの組み合わ
せのみによってリセットさ26 れる。更に、メモリ制御装置70.75.70′および
75′はハード・リセットに取り付けたCPU命令にサ
ービスを行うのに必要なそれらの状態エンジンとレジス
タを有している。従って、ソフト・リセットはソフトウ
ェアの実行にとって透明である。
第3の特徴は、ソフト・リセットの範囲、すなわちソフ
ト・リセットによって影響を与えられるシステムlO内
の構成要素の数がシステム10のモードと最初のリセッ
トに対する要求によって決まるということである。完全
デュプレックス・モードの場合、CPUモジュール30
で開始されるソフト・リセットに対する要求によって、
ソフト・リセットがCPUモジュールの全ての構成要素
およびモジュール相互接続部130と132に取り付け
られた全てのファイヤウオール1000と1010に対
して行われる。従って、モジュール相互接続部130と
132によってサービスを受ける全てのモジュールはそ
れらの状態エンジンと一時的レジスタのリセットを有し
ている。これに27 よって、過渡的なエラーによって発生される全ての問題
のシステム・パイプラインがクリアされる。
ト・リセットによって影響を与えられるシステムlO内
の構成要素の数がシステム10のモードと最初のリセッ
トに対する要求によって決まるということである。完全
デュプレックス・モードの場合、CPUモジュール30
で開始されるソフト・リセットに対する要求によって、
ソフト・リセットがCPUモジュールの全ての構成要素
およびモジュール相互接続部130と132に取り付け
られた全てのファイヤウオール1000と1010に対
して行われる。従って、モジュール相互接続部130と
132によってサービスを受ける全てのモジュールはそ
れらの状態エンジンと一時的レジスタのリセットを有し
ている。これに27 よって、過渡的なエラーによって発生される全ての問題
のシステム・パイプラインがクリアされる。
システム10は、デュプレックス・モードにあるので、
ゾーン11′はゾーン11の行っている全ての事柄を行
う。従って、CPUモジュール30′は、CPUモジュ
ール30と同時に、ソフト・リセットに対する要求を出
す。ゾーン11’内のソフト・リセットは、ゾーン11
内のソフト・リセットと同し効果を有している。
ゾーン11′はゾーン11の行っている全ての事柄を行
う。従って、CPUモジュール30′は、CPUモジュ
ール30と同時に、ソフト・リセットに対する要求を出
す。ゾーン11’内のソフト・リセットは、ゾーン11
内のソフト・リセットと同し効果を有している。
しかし、システム10がマスタ/スレーブ・モードにあ
りCPUモジュール30’がスレーブ・モードにある場
合、CPUモジュール30で始まるソフト・リセットに
対する要求は、予期できるように、CPUモジュール3
0の全ての構成要素とモジュール相互接続部130と1
32に取り付けられた全てのファイヤウオール1000
と1010に対してソフト・リセットを出す。更に、ソ
フト・リセットに対する要求は、クロスリンク90と9
0′、クロスリンク・ケーブル25およびクロスリンク
90’と95′を介してCPUモジュー 28 ル30′に出される。一部のモジュール相互接続部13
0と132はソフト・リセットを受は取る。
りCPUモジュール30’がスレーブ・モードにある場
合、CPUモジュール30で始まるソフト・リセットに
対する要求は、予期できるように、CPUモジュール3
0の全ての構成要素とモジュール相互接続部130と1
32に取り付けられた全てのファイヤウオール1000
と1010に対してソフト・リセットを出す。更に、ソ
フト・リセットに対する要求は、クロスリンク90と9
0′、クロスリンク・ケーブル25およびクロスリンク
90’と95′を介してCPUモジュー 28 ル30′に出される。一部のモジュール相互接続部13
0と132はソフト・リセットを受は取る。
この同じ構成の場合、CPUモジュール30′から開始
されるソフト・リセットに対する要求は、メモリ制御装
置70′と75′およびクロスリンク90′と95′に
一部のみリセットする。
されるソフト・リセットに対する要求は、メモリ制御装
置70′と75′およびクロスリンク90′と95′に
一部のみリセットする。
ソフト・リセットは、 rCPUソフト・リセット」と
「システム・ソフト・リセット」を有する。
「システム・ソフト・リセット」を有する。
CPUソフト・リセットは、要求を最初に出したCPU
モジュールの状態エンジンに影響を及ぼすソフト・リセ
ットである。システム・ソフト・リセットは、モジュー
ル相互接続部とこれに直接取付けられた構成要素に対す
るソフト・リセットである。CPUモジュールは、常に
CPUソフト・リセットを要求することができる。シス
テム・ソフト・リセットは、CPUを要求するクロスリ
ンクがデュプレックス・モード・マスター/スレーブ・
モード、またはオフ・モードにある場合にのみ、要求す
ることができる。スレーブ・モードにあるクロスリンク
は、他方のゾーンからシステム29 ・ソフト・リセットを与えられ、それ自身のモジュール
相互接続部に対してシステム・ソフト・シセットを発生
する。
モジュールの状態エンジンに影響を及ぼすソフト・リセ
ットである。システム・ソフト・リセットは、モジュー
ル相互接続部とこれに直接取付けられた構成要素に対す
るソフト・リセットである。CPUモジュールは、常に
CPUソフト・リセットを要求することができる。シス
テム・ソフト・リセットは、CPUを要求するクロスリ
ンクがデュプレックス・モード・マスター/スレーブ・
モード、またはオフ・モードにある場合にのみ、要求す
ることができる。スレーブ・モードにあるクロスリンク
は、他方のゾーンからシステム29 ・ソフト・リセットを与えられ、それ自身のモジュール
相互接続部に対してシステム・ソフト・シセットを発生
する。
CPUソフト・リセットは、エラーの状態に続いていて
CPUのパイプラインをクリアする。
CPUのパイプラインをクリアする。
CPUパイプラインは、メモリ相互接続部80と82、
メモリ制御装置75および75内のラッチ(図示せず)
、DMAエンジン800およびクロスリンク90と95
を有する。CPUソフト・リセットは、またDMAまた
はIloのタイムアウトに続いて発生することもできる
。DMAまたはIloのタイムアウトは、I10デバイ
スが特定の時間間隔内にDMAまたはIloの要求に対
して応答しない場合に発生する。
メモリ制御装置75および75内のラッチ(図示せず)
、DMAエンジン800およびクロスリンク90と95
を有する。CPUソフト・リセットは、またDMAまた
はIloのタイムアウトに続いて発生することもできる
。DMAまたはIloのタイムアウトは、I10デバイ
スが特定の時間間隔内にDMAまたはIloの要求に対
して応答しない場合に発生する。
第21図は、CPUモジュール30および300′から
I10モジュール100.110.100′および11
O′とメモリ・モジュール60および60′に対するリ
セット線を示す。CPUモジュール30は、何時電源が
印加されたかを示すDCOK信号を受は取る。リセット
をイニシアライズ 30 するのはこの信号である。CPUモジュール30′は、
その電源から同じ信号を受取る。
I10モジュール100.110.100′および11
O′とメモリ・モジュール60および60′に対するリ
セット線を示す。CPUモジュール30は、何時電源が
印加されたかを示すDCOK信号を受は取る。リセット
をイニシアライズ 30 するのはこの信号である。CPUモジュール30′は、
その電源から同じ信号を受取る。
1つのシステム・ハード・リセット線は、各I10モジ
ュールに送られ、1つのシステム・ソフト・リセットは
3つの■/○モジュールの全てに送られる。1つのハー
ド・リセットが各モジュールに対して必要である理由は
、システム・ハード・リセット線がシステム10から個
々のI10モジュールを取除くのに使用されるからであ
る。各システム・ソフト・リセットに対してI10モジ
ュールを3つに制限しているのは、単にローデングを考
慮しているかeにに過ぎない。更に、1つのクロック・
リセット線が全てのI10モジュールとメモリ・モジュ
ールに送られる。1つのモジュールについて1つの線を
使用する理由は、負荷を制御することによってスキュー
を制限するためである。
ュールに送られ、1つのシステム・ソフト・リセットは
3つの■/○モジュールの全てに送られる。1つのハー
ド・リセットが各モジュールに対して必要である理由は
、システム・ハード・リセット線がシステム10から個
々のI10モジュールを取除くのに使用されるからであ
る。各システム・ソフト・リセットに対してI10モジ
ュールを3つに制限しているのは、単にローデングを考
慮しているかeにに過ぎない。更に、1つのクロック・
リセット線が全てのI10モジュールとメモリ・モジュ
ールに送られる。1つのモジュールについて1つの線を
使用する理由は、負荷を制御することによってスキュー
を制限するためである。
第22図は、リセットに関連するCPUモジュール30
の構成要素を示す。CPU40と50は、それぞれクロ
ック発生装置2210と2211を有している。メモリ
制御装置70と75は、それぞれクロック発生装置22
20と2221を有し、クロスリンク90と95は、そ
れぞれクロック発生装置2260と2261を有する。
の構成要素を示す。CPU40と50は、それぞれクロ
ック発生装置2210と2211を有している。メモリ
制御装置70と75は、それぞれクロック発生装置22
20と2221を有し、クロスリンク90と95は、そ
れぞれクロック発生装置2260と2261を有する。
クロック発生装置は、システム・クロック信号を個々の
モジュールによって使用するために分割する。
モジュールによって使用するために分割する。
メモリ制御装置70は、リセット制御回路2230とソ
フト・リセット要求レジスタ2235を有する。メモリ
制御装置75は、リセット制御回路2231とソフト・
リセット要求レジスタ2236を有する。
フト・リセット要求レジスタ2235を有する。メモリ
制御装置75は、リセット制御回路2231とソフト・
リセット要求レジスタ2236を有する。
クロスリンク90は、ローカル・リセット発生装置22
40とシステム・リセット発生装置2250の両方を有
している。クロスリンク95は、ローカル・リセット発
生装置224Iとシステム・リセット発生装置2251
を有している。クロスリンクの「ローカル」部分は、こ
のクロスリンクかスレーブ・モードにある場合に、CP
Uモジュールと共に残っているこのクロスリンクの部分
であり、従って、シリアル・レジスタ、および幾つか3
2 のパラレル・レジスタを有している。クロスリンクの「
システム1部分は、モジュール相互接続部130と13
2(または130′と132′)とクロスリンク・ケー
ブル25にアクセスするために必要であるクロスリンク
のその部分である。
40とシステム・リセット発生装置2250の両方を有
している。クロスリンク95は、ローカル・リセット発
生装置224Iとシステム・リセット発生装置2251
を有している。クロスリンクの「ローカル」部分は、こ
のクロスリンクかスレーブ・モードにある場合に、CP
Uモジュールと共に残っているこのクロスリンクの部分
であり、従って、シリアル・レジスタ、および幾つか3
2 のパラレル・レジスタを有している。クロスリンクの「
システム1部分は、モジュール相互接続部130と13
2(または130′と132′)とクロスリンク・ケー
ブル25にアクセスするために必要であるクロスリンク
のその部分である。
ローカル・リセット発生装置3340と2241は、そ
れぞれクロスリンク90と95のローカル・リセット制
御回路2245と2246にハードおよびソフト・リセ
ット信号を送ると共に、それぞれメモリ制御装置70と
75のリセット制御回路2230と2231にハードお
よびソフト・リセット信号を送ることによって、CPU
モジュール30に対してリセットを発生する。ローカル
・クロスリンク・リセット制御回路2245と2246
は、それらの状態エンジン、転送するべきデータを記憶
しているラッチおよびそれらのエラー・レジスタをリセ
ットすることによって、ソフト・リセット信号に応答す
る。これらの回路は、ソフト・リセットに対して行うの
と同じ動作を行い、またエラー・レジスタと構成レジス
タをリセットすること33 によって、ハード・リセット信号に応答する。リセット
制御回路2230と2231は、同じ方法でハードおよ
びソフト・リセット信号に応答する。
れぞれクロスリンク90と95のローカル・リセット制
御回路2245と2246にハードおよびソフト・リセ
ット信号を送ると共に、それぞれメモリ制御装置70と
75のリセット制御回路2230と2231にハードお
よびソフト・リセット信号を送ることによって、CPU
モジュール30に対してリセットを発生する。ローカル
・クロスリンク・リセット制御回路2245と2246
は、それらの状態エンジン、転送するべきデータを記憶
しているラッチおよびそれらのエラー・レジスタをリセ
ットすることによって、ソフト・リセット信号に応答す
る。これらの回路は、ソフト・リセットに対して行うの
と同じ動作を行い、またエラー・レジスタと構成レジス
タをリセットすること33 によって、ハード・リセット信号に応答する。リセット
制御回路2230と2231は、同じ方法でハードおよ
びソフト・リセット信号に応答する。
更に、ローカル・リセット発生装置2240は、モジュ
ール相互接続部130と132を介して、I10モジュ
ール100、itoおよび120にクロック・リセット
信号を送る。I10モジュール100.110および1
20は、以下で述べる方法でそれらのクロックをリセッ
トするため、クロック・リセット信号を使用する。ソフ
ト・リセット要求レジスタ2235と2236は、それ
ぞれローカル・リセット発生装置2240と2241に
ソフト要求信号を送る。
ール相互接続部130と132を介して、I10モジュ
ール100、itoおよび120にクロック・リセット
信号を送る。I10モジュール100.110および1
20は、以下で述べる方法でそれらのクロックをリセッ
トするため、クロック・リセット信号を使用する。ソフ
ト・リセット要求レジスタ2235と2236は、それ
ぞれローカル・リセット発生装置2240と2241に
ソフト要求信号を送る。
クロスリンク90と95のシステム、リセット発生装置
2450と2251は、それぞれモジュール相互接続部
130と132を介してI10モジュール100.11
0、および120にそれぞれシステム・ハード・リセッ
ト信号とシステム・ソフト・リセット信号に送る。I1
0モジュール100.110、および120は、CPU
データ34 または命令に依存する全てのレジスタをリセットするこ
とによってソフト・リセット信号に応答する。これらの
モジュールは、ソフト・リセットが行なうのと同しレジ
スタをリセットし、また全ての構成レジスタをリセット
することによって、ハート・リセット信号に応答する。
2450と2251は、それぞれモジュール相互接続部
130と132を介してI10モジュール100.11
0、および120にそれぞれシステム・ハード・リセッ
ト信号とシステム・ソフト・リセット信号に送る。I1
0モジュール100.110、および120は、CPU
データ34 または命令に依存する全てのレジスタをリセットするこ
とによってソフト・リセット信号に応答する。これらの
モジュールは、ソフト・リセットが行なうのと同しレジ
スタをリセットし、また全ての構成レジスタをリセット
することによって、ハート・リセット信号に応答する。
更に、システム・リセット発生装置2250と2251
は、またシステム・ソフトおよびシステム・ハート・リ
セット信号を各クロスリンクのシステム・リセット制御
回路2255と2256に送る。システム・リセット制
御回路2255と2256は、ローカル・ソフトおよび
ローカル・ハート・リセット信号に対するローカル・リ
セット制御回路の応答と同し方法でシステム・ソフト・
リセット信号とシステム・ハード・リセット信号に応答
する。
は、またシステム・ソフトおよびシステム・ハート・リ
セット信号を各クロスリンクのシステム・リセット制御
回路2255と2256に送る。システム・リセット制
御回路2255と2256は、ローカル・ソフトおよび
ローカル・ハート・リセット信号に対するローカル・リ
セット制御回路の応答と同し方法でシステム・ソフト・
リセット信号とシステム・ハード・リセット信号に応答
する。
メモリ制御装置70と75は、CPU40と50がそれ
ぞれ適当なコートをソフト・リセット要求レジスタ22
35と2236にそれぞれ書込み場合に、クロスリンク
90と95にそれぞれソ 35 フト・リセットを発生させる。ソフト・リセツ]・要求
レジスタ2235と2236は、ソフト・リセット要求
信号をローカル・リセット発生装置2240と2241
に送る。符号化エラー信号は、メモリ制御装置70から
ローカル・リセ・ソト発生装置2240と2241に送
られる。
ぞれ適当なコートをソフト・リセット要求レジスタ22
35と2236にそれぞれ書込み場合に、クロスリンク
90と95にそれぞれソ 35 フト・リセットを発生させる。ソフト・リセツ]・要求
レジスタ2235と2236は、ソフト・リセット要求
信号をローカル・リセット発生装置2240と2241
に送る。符号化エラー信号は、メモリ制御装置70から
ローカル・リセ・ソト発生装置2240と2241に送
られる。
システム・ソフト・リセットは、データと制御信号が送
られるのと同じデータ経路に沿ってゾーンの間に送られ
る。従って、データとアドレスに対するのと同じ遅延を
等しくする原理が使用され、リセットはほぼ同時に2つ
のゾーンの全ての構成要素に到達する。
られるのと同じデータ経路に沿ってゾーンの間に送られ
る。従って、データとアドレスに対するのと同じ遅延を
等しくする原理が使用され、リセットはほぼ同時に2つ
のゾーンの全ての構成要素に到達する。
ハード・リセットは、適当なコートをローカル・ハード
・リセット・レジスタ2243に書込むCPU40と5
0またはDCOK信号によって発生されるパワーアップ
・リセットに対する要求によって発生される。
・リセット・レジスタ2243に書込むCPU40と5
0またはDCOK信号によって発生されるパワーアップ
・リセットに対する要求によって発生される。
クロスリンク90の同期回路2270は、DCOK信号
が同時にローカルおよびリセ・ソト発生装置2240.
2250.2241および2251■ 6 の全てに行き渡ることを保証するため、適当な遅延要素
を有している。
が同時にローカルおよびリセ・ソト発生装置2240.
2250.2241および2251■ 6 の全てに行き渡ることを保証するため、適当な遅延要素
を有している。
事実、リセットの同期は、システム10では非常に重要
である。これは、リセット信号がクロスリンクで始まる
からである。このようにして、リセットはほぼ同期して
異なったモジュールとこれらのモジュール内の異なった
要素に到達するように送られることができる。
である。これは、リセット信号がクロスリンクで始まる
からである。このようにして、リセットはほぼ同期して
異なったモジュールとこれらのモジュール内の異なった
要素に到達するように送られることができる。
第21図と第22図の構造を理解することによって、異
なったハード・リセットの実行をよりよく理解すること
ができる。パワーアップ・リセットはシステム・ハード
・リセットとローカル・ハード・リセットおよびクロッ
ク・リセットの両方を発生ずる。−殻内に、クロスリン
ク90.95.90′および95′は最初はクロスリン
ク・オフモードと再同期オフ・モードの両方の状態にあ
り、両方のゾーンはクロック・マスターシップを表明す
る。
なったハード・リセットの実行をよりよく理解すること
ができる。パワーアップ・リセットはシステム・ハード
・リセットとローカル・ハード・リセットおよびクロッ
ク・リセットの両方を発生ずる。−殻内に、クロスリン
ク90.95.90′および95′は最初はクロスリン
ク・オフモードと再同期オフ・モードの両方の状態にあ
り、両方のゾーンはクロック・マスターシップを表明す
る。
CPU/MEM故障リセットは、メモリ制御装置70.
75.70′および75′がCPM/ 37 MEMの故障を検出する時は何時でも自動的に動作され
る。符号化エラー・ロジックはエラー・ロジック223
7と2238から両方のクロスリンク90と95に送ら
れる。故障が発生したCPUモジュールは、そのクロス
リンクをスレーブ状態にセットし、他方のCPUモジュ
ールのクロスリンクをマスター状態にセットすることに
よって、システム10から取り除かれる。しかし、故障
が発生していないCPUモジュールは、リセットを経験
しない。その代わり、これはシリアル・クロスリンク・
エラー・レジスタ(図示せず)内のコードを介して、他
方のモジュールの故障を知らされる。CPU/MEM故
障リセットはす故障したCPUモジュールを有するゾー
ンに対するクロック信号とそのモジュールに対するロー
カル・ソフト・リセットによって構成される。
75.70′および75′がCPM/ 37 MEMの故障を検出する時は何時でも自動的に動作され
る。符号化エラー・ロジックはエラー・ロジック223
7と2238から両方のクロスリンク90と95に送ら
れる。故障が発生したCPUモジュールは、そのクロス
リンクをスレーブ状態にセットし、他方のCPUモジュ
ールのクロスリンクをマスター状態にセットすることに
よって、システム10から取り除かれる。しかし、故障
が発生していないCPUモジュールは、リセットを経験
しない。その代わり、これはシリアル・クロスリンク・
エラー・レジスタ(図示せず)内のコードを介して、他
方のモジュールの故障を知らされる。CPU/MEM故
障リセットはす故障したCPUモジュールを有するゾー
ンに対するクロック信号とそのモジュールに対するロー
カル・ソフト・リセットによって構成される。
再同期リセットは、基本的にはローカル・ハード・リセ
ットとクロック・リセットを有するシステム・ソフト・
リセットである。この再同期リセットは、2つのゾーン
をロックステップ同期の状38 態にするために使用される。ゾーン11と11′が同期
されていなかった一定の期間の後、もしCPUレジスタ
の記憶された状態を含むメモリ・モジュール60と60
′の内容が相互に等しくセットされれば、これらのゾー
ンがデュプレックス・モードを再び開始することができ
るように、再同期リセットが使用されてこれらのツゾー
ンを互換性のある構成にする。
ットとクロック・リセットを有するシステム・ソフト・
リセットである。この再同期リセットは、2つのゾーン
をロックステップ同期の状38 態にするために使用される。ゾーン11と11′が同期
されていなかった一定の期間の後、もしCPUレジスタ
の記憶された状態を含むメモリ・モジュール60と60
′の内容が相互に等しくセットされれば、これらのゾー
ンがデュプレックス・モードを再び開始することができ
るように、再同期リセットが使用されてこれらのツゾー
ンを互換性のある構成にする。
再同期リセットは、基本的にはCPUハード・リセット
とクロック・リセットである。再同期リセットは、再同
期・リセット・アドレスを並列クロスリンク・レジスタ
の1つに書込むソフトウェアによって動作される。この
時、一方のゾーンは、クロスリンク・マスター/再同期
マスター・モードでなければならず、他方のゾーンは、
クロスリンク・スレーブ/再同期スレーブ・モードでな
ければならい。そこでリセットが両方のゾーンで同時に
行われ、これは、とりわけ4つのクロスリンク全てをデ
ュプレックス・モードにセットする。
とクロック・リセットである。再同期リセットは、再同
期・リセット・アドレスを並列クロスリンク・レジスタ
の1つに書込むソフトウェアによって動作される。この
時、一方のゾーンは、クロスリンク・マスター/再同期
マスター・モードでなければならず、他方のゾーンは、
クロスリンク・スレーブ/再同期スレーブ・モードでな
ければならい。そこでリセットが両方のゾーンで同時に
行われ、これは、とりわけ4つのクロスリンク全てをデ
ュプレックス・モードにセットする。
再同期リセットは、システム・ソフト・リセット39
ではないため、I10モジュールはリセットを受取らな
い。
い。
システム10の好適な実施例は、またクロック・リセッ
ト信号がコンフォーミング(conforming)ク
ロックをリセットせず、非コンフォーミング・クロック
のみをリセットすることを保証する。この理由は、クロ
ックがリセットされる場合はいつでも、これはクロック
のタイミングを変更し、このタイミングはこんどはこの
ようなりロックでモジュールの動作に影響を及ぼすから
である。もしモジュールが正しく実行され、このクロッ
クが正しい位相であれば、その動作を変更することは不
必要であるばかりでなく無駄なことである。
ト信号がコンフォーミング(conforming)ク
ロックをリセットせず、非コンフォーミング・クロック
のみをリセットすることを保証する。この理由は、クロ
ックがリセットされる場合はいつでも、これはクロック
のタイミングを変更し、このタイミングはこんどはこの
ようなりロックでモジュールの動作に影響を及ぼすから
である。もしモジュールが正しく実行され、このクロッ
クが正しい位相であれば、その動作を変更することは不
必要であるばかりでなく無駄なことである。
第23図は、ノンコンフォーミング・クロックのみがリ
セットされることを保証する回路の好適な実施例である
。第23図に示す回路は、第22図に示す対応するモジ
ュールのクロック発生装置221O12211,222
0,2221゜2260、および2261内に位置する
ことが望ましい。
セットされることを保証する回路の好適な実施例である
。第23図に示す回路は、第22図に示す対応するモジ
ュールのクロック発生装置221O12211,222
0,2221゜2260、および2261内に位置する
ことが望ましい。
40
好適な実施例の場合、異なったクロック発生装置221
0.2211,2220.222112260、および
2261は立上がり区間検出器2300、と位相発生装
置2310を有している。
0.2211,2220.222112260、および
2261は立上がり区間検出器2300、と位相発生装
置2310を有している。
立上がり区間検出器2300は、クロスリンク90と9
5からクロック・リセット信号を受取り、クロック・リ
セット信号の立上がり区間と同時に既知の持続期間を有
するパルスを発生する。このパルスは、特定のモジュー
ルに対する内部クロック信号と同様に位相発生装置23
10に対する入力である。そのモジュールに対する内部
クロック信号は、発振器システム200と200′から
分配されたシステム・クロック信号から取出されたクロ
ック信号である。位相発生装置231Oは、クロック信
号に対する異なった位相を形成する下方分割回路である
ことが望ましい。再循環シフト・レジスタのような位相
発生装置2310に対する別の設計をまた使用すること
もできる。
5からクロック・リセット信号を受取り、クロック・リ
セット信号の立上がり区間と同時に既知の持続期間を有
するパルスを発生する。このパルスは、特定のモジュー
ルに対する内部クロック信号と同様に位相発生装置23
10に対する入力である。そのモジュールに対する内部
クロック信号は、発振器システム200と200′から
分配されたシステム・クロック信号から取出されたクロ
ック信号である。位相発生装置231Oは、クロック信
号に対する異なった位相を形成する下方分割回路である
ことが望ましい。再循環シフト・レジスタのような位相
発生装置2310に対する別の設計をまた使用すること
もできる。
立上がり区間検出器2300からの立上がり区間パルス
によって、位相発生装置2310は予め41 選択された位相を出力することが望ましい。従って、例
えばもし位相発生装置231Oが幾つかのステージを有
する下方分割回路であれば、クロック・リセットの立上
がり区間パルスは、そのステージに対して設定された入
力であり、このステージは全ての他のステージに対して
予め選択された位相とリセット入力を発生する。もし位
相発生装置2310が既にこの位相を発生していれば、
同期化クロック・リセット信号の存在は基本的に透明で
ある。
によって、位相発生装置2310は予め41 選択された位相を出力することが望ましい。従って、例
えばもし位相発生装置231Oが幾つかのステージを有
する下方分割回路であれば、クロック・リセットの立上
がり区間パルスは、そのステージに対して設定された入
力であり、このステージは全ての他のステージに対して
予め選択された位相とリセット入力を発生する。もし位
相発生装置2310が既にこの位相を発生していれば、
同期化クロック・リセット信号の存在は基本的に透明で
ある。
このようにして組織されたリセットは、システムlOの
通常の実行に対して混乱を最小限に止めるように設計さ
れ、トラスチックなアクションが必要とされる場合には
、このトラスチックなアクションは命令実行の通常のシ
ーケンスに割込みをかけることに止まる。このことは、
従来のリセットが引起こす再同期化の問題のためにデュ
アルまたは多重ゾーンの環境では特に重要である。従っ
て、システムlOで行っているようにハード・リセット
の数を最小にすることが望ましい。
通常の実行に対して混乱を最小限に止めるように設計さ
れ、トラスチックなアクションが必要とされる場合には
、このトラスチックなアクションは命令実行の通常のシ
ーケンスに割込みをかけることに止まる。このことは、
従来のリセットが引起こす再同期化の問題のためにデュ
アルまたは多重ゾーンの環境では特に重要である。従っ
て、システムlOで行っているようにハード・リセット
の数を最小にすることが望ましい。
42
E、誤り処理
誤り処理には、誤り検出、誤り回復、及び誤り報告があ
る。誤り検出は、前項で、メモリ制御器70.75.7
0’、75′、メモリモジュール60と60′、クロス
リング90,95.90’95′、及びファイヤウオー
ル(Fire wall )1000、1010.10
00’、 1010’の比較構成要素に関して、検討さ
れた。
る。誤り検出は、前項で、メモリ制御器70.75.7
0’、75′、メモリモジュール60と60′、クロス
リング90,95.90’95′、及びファイヤウオー
ル(Fire wall )1000、1010.10
00’、 1010’の比較構成要素に関して、検討さ
れた。
本発明の誤り回復は、かような回復に費いやす時間を最
小にし、誤り回復が通常実行するソフトウェアに課する
オーバヘッドを最小にすることを意図している。この誤
り回復には2つの面がある。
小にし、誤り回復が通常実行するソフトウェアに課する
オーバヘッドを最小にすることを意図している。この誤
り回復には2つの面がある。
すなわち、ハードウェアとソフトウェアである。
ハードウェアの誤り回復は、−殻内ソフトウェア誤り処
理過程内のソフトウェアの誤り回復が行われ前に、大抵
の故障に対して試みられる。ハードウェアの誤り回復が
試みられた故障が一時的の場合、故障許容ロックステッ
プ・オペレーションへ戻る誤り回復は、ハードウェアに
よりその時間の多くを十分に費いやして行われる。ハー
ドウェア■ 3 れない場合、ソフトウェアの誤り回復が試みられる。か
ようなソフトウェアの回復は、CPU (中央処理装置
)40,50.40’、50’が正規のオペレーション
から誤り処理プロセスへの整然とした変換を行えるよう
にしているものである。
理過程内のソフトウェアの誤り回復が行われ前に、大抵
の故障に対して試みられる。ハードウェアの誤り回復が
試みられた故障が一時的の場合、故障許容ロックステッ
プ・オペレーションへ戻る誤り回復は、ハードウェアに
よりその時間の多くを十分に費いやして行われる。ハー
ドウェア■ 3 れない場合、ソフトウェアの誤り回復が試みられる。か
ようなソフトウェアの回復は、CPU (中央処理装置
)40,50.40’、50’が正規のオペレーション
から誤り処理プロセスへの整然とした変換を行えるよう
にしているものである。
データ処理システムが1.どのモジュールが誤り源であ
るかを決定し、故障装置を不能にするかあるいは故障装
置をバイパスするためにシステムを再構成した時に、誤
り回復は完了する。
るかを決定し、故障装置を不能にするかあるいは故障装
置をバイパスするためにシステムを再構成した時に、誤
り回復は完了する。
1、 ハードウェア誤りの処理と回復
本発明の好適な実施例において、誤り回復はハードウェ
アレベルで出来るだけ多く行われる。これは、誤り処理
の誤り回復の段階で費いやされる時間を最小にし、ソフ
トウェアの複雑性を最低にするために行われる。ソフト
ウェアの介入は、般に、多くの時間がかかり、システム
の残りの装置へ比較的大きい衝撃を起す。これは、特に
、システム10のようなマルチプロセッサで起り、ここ
では、異なるゾーン11とlビが互いにロツ44 クステップの同期化をしている。ハードウェアで行われ
る誤り処理の割合いが大きくなればなる程、システム全
体への衝撃は小さくなる。
アレベルで出来るだけ多く行われる。これは、誤り処理
の誤り回復の段階で費いやされる時間を最小にし、ソフ
トウェアの複雑性を最低にするために行われる。ソフト
ウェアの介入は、般に、多くの時間がかかり、システム
の残りの装置へ比較的大きい衝撃を起す。これは、特に
、システム10のようなマルチプロセッサで起り、ここ
では、異なるゾーン11とlビが互いにロツ44 クステップの同期化をしている。ハードウェアで行われ
る誤り処理の割合いが大きくなればなる程、システム全
体への衝撃は小さくなる。
ハードウェア誤り回復アルゴリズムを使用して解決され
るシステムの故障あるいは誤りには、3つの基本的カテ
ゴリがある。この誤りは、CPU入出力誤り、CPU/
MEM (メモリ)故障、及びDMA (直接メモリア
クセス)誤りである。各タイプの誤りについての誤り処
理ルーチンは僅かに異なる。
るシステムの故障あるいは誤りには、3つの基本的カテ
ゴリがある。この誤りは、CPU入出力誤り、CPU/
MEM (メモリ)故障、及びDMA (直接メモリア
クセス)誤りである。各タイプの誤りについての誤り処
理ルーチンは僅かに異なる。
第24図は、全ハードウェア誤り処理手順を示す流れ図
2400を示す。前記の説明にあるように、ゾーン11
に関しては、このプロセスがゾーンll′の構成要素と
同等に実行されると理解することにより、プロセス24
00の手順が説明される。
2400を示す。前記の説明にあるように、ゾーン11
に関しては、このプロセスがゾーンll′の構成要素と
同等に実行されると理解することにより、プロセス24
00の手順が説明される。
図2400を説明する前に、誤り処理に関するいくつか
の原理を理解することが重要である。データ処理オペレ
ーションが行われた後に、誤りを発生したバスオペレー
ションに誤りを関係づける45 情報が存在している間、時間の窓がある。いわゆる“バ
スオペレーション°”は、CPU40,50゜40′、
または50′に直接に接続していないメモリ・モジュー
ル60と60′などの資源を必要とするCPU40,5
0.40’または50′により始動した完全オペレーシ
ョンに相当する。
の原理を理解することが重要である。データ処理オペレ
ーションが行われた後に、誤りを発生したバスオペレー
ションに誤りを関係づける45 情報が存在している間、時間の窓がある。いわゆる“バ
スオペレーション°”は、CPU40,50゜40′、
または50′に直接に接続していないメモリ・モジュー
ル60と60′などの資源を必要とするCPU40,5
0.40’または50′により始動した完全オペレーシ
ョンに相当する。
第24図が示すように、バス・オペレーションが行われ
た後(ステップ2410)、誤りが発生したかしていな
いかの確認が行われる。誤りが検出されない場合(ステ
ップ2420)、ハードウェア誤り処理の必要はなく、
手順が完了する(ステップ2440)。
た後(ステップ2410)、誤りが発生したかしていな
いかの確認が行われる。誤りが検出されない場合(ステ
ップ2420)、ハードウェア誤り処理の必要はなく、
手順が完了する(ステップ2440)。
しかし、誤りが検出された場合、ハードウェア誤り処理
が、故障を起したバスオペレーションに続いて時間窓で
開始されなければならない。最初に、誤りのタイプが識
別されなければならない(ステップ2430)。誤りの
タイプは、CPU入出力誤り、DMA誤り、あるいはC
PU/MEM故障である。
が、故障を起したバスオペレーションに続いて時間窓で
開始されなければならない。最初に、誤りのタイプが識
別されなければならない(ステップ2430)。誤りの
タイプは、CPU入出力誤り、DMA誤り、あるいはC
PU/MEM故障である。
データ処理命令またはデータ処理システム1046
により行われたオペレーションにより、各種のハードウ
ェア誤り処理手順が行われる。CPU入出力誤りが検出
された場合、CPU入出力誤りハンドラが入力される(
ステップ2450)。CPU入出力誤りは、CPU40
と50、メモリモジュー・ル60、及びメモリモジュー
ル60とインターフェイスしているメモリ制御器70と
75の部分の周辺で発生した誤りのタイプを示す。例え
ば、CPU88と89またはファイヤウオール1000
と1010の両方で検出された間違い比較、メモリ制御
器70と75、あるいはクロスリンク90と95力さ時
間切れの場合、CPU入出力誤りが発生する。かような
場合、CPU40と50とは、継続的確実なオペレーシ
ョンが可能であると見なされる。
ェア誤り処理手順が行われる。CPU入出力誤りが検出
された場合、CPU入出力誤りハンドラが入力される(
ステップ2450)。CPU入出力誤りは、CPU40
と50、メモリモジュー・ル60、及びメモリモジュー
ル60とインターフェイスしているメモリ制御器70と
75の部分の周辺で発生した誤りのタイプを示す。例え
ば、CPU88と89またはファイヤウオール1000
と1010の両方で検出された間違い比較、メモリ制御
器70と75、あるいはクロスリンク90と95力さ時
間切れの場合、CPU入出力誤りが発生する。かような
場合、CPU40と50とは、継続的確実なオペレーシ
ョンが可能であると見なされる。
CPU入出力誤り処理について以下に説明する。
しかし、一般に、CPU入出カバードウェア誤り処理が
完了した後、レジスタがセットされて、その誤りが一時
的か永続的であったかを示し、誤りの分析のために他の
情報と一緒にロードされる。
完了した後、レジスタがセットされて、その誤りが一時
的か永続的であったかを示し、誤りの分析のために他の
情報と一緒にロードされる。
■
7
一時的故障あるいは誤りは、故障オペレーションの再試
行がハードウェア誤り回復の間にうまく行われたことを
意味する。また、所定のレベルの割込み(システム誤り
Sys Err)は、CPU40と50がソフトウェア
誤り回復あるいはロッギングを行うようにセットされる
。
行がハードウェア誤り回復の間にうまく行われたことを
意味する。また、所定のレベルの割込み(システム誤り
Sys Err)は、CPU40と50がソフトウェア
誤り回復あるいはロッギングを行うようにセットされる
。
誤りがDMAオペレーションの間に検出された場合、D
MA誤りハンドラが入力される(ステップ2452)。
MA誤りハンドラが入力される(ステップ2452)。
例えば、CPUバス88と89またはファイヤウオール
1000と1010の両方で検出された入出力間違い比
較、メモリ制御器70と75、あるいはクロスリンク9
0と95が時間切れの場合、この誤りはDMAオペレー
ション中に検出される。DMAはCPU40と50のオ
ペレーションと非同期的に動作しているので、DMAハ
ンドラの基本的動作(ステップ2452)は、DMAエ
ンジン800を遮断し、以降に説明する他の各種応答、
例えばシステム誤り割込み及びDMA割込みなどを使用
することとなる。
1000と1010の両方で検出された入出力間違い比
較、メモリ制御器70と75、あるいはクロスリンク9
0と95が時間切れの場合、この誤りはDMAオペレー
ション中に検出される。DMAはCPU40と50のオ
ペレーションと非同期的に動作しているので、DMAハ
ンドラの基本的動作(ステップ2452)は、DMAエ
ンジン800を遮断し、以降に説明する他の各種応答、
例えばシステム誤り割込み及びDMA割込みなどを使用
することとなる。
誤りが、CPU40または50のオペレーショ 48
ンあるいはメモリモジュール60の内容が疑わしいと、
検出された場合、誤りは、CPU/MEM故障と見なさ
れて、CPU/MEM故障ハンドラが入力される(ステ
ップ2454)。CP U/MEM故障の例としては、
二重ビットECC誤り、CPU40と50からのデータ
に関する間違い比較、またはメモリモジュール60へ送
られたアドレスに関する間違い比較などがある。CPU
/MEM故障の検出は、CPUモジュール30とその関
連メモリモジュールの状態を疑しいものにする。
検出された場合、誤りは、CPU/MEM故障と見なさ
れて、CPU/MEM故障ハンドラが入力される(ステ
ップ2454)。CP U/MEM故障の例としては、
二重ビットECC誤り、CPU40と50からのデータ
に関する間違い比較、またはメモリモジュール60へ送
られたアドレスに関する間違い比較などがある。CPU
/MEM故障の検出は、CPUモジュール30とその関
連メモリモジュールの状態を疑しいものにする。
このタイプの誤りは限界にあると考えられ、CPU/M
EM故障を受けた一対のCPUメモリは、自身を自動的
に遮閉し、システムは再構成する。
EM故障を受けた一対のCPUメモリは、自身を自動的
に遮閉し、システムは再構成する。
故障しているCPUまたは関連メモリは、関連している
一対の信頼の置けないCPUメモリによりハードウェア
またはソフトウェアの誤り処理を0続いて行う。
一対の信頼の置けないCPUメモリによりハードウェア
またはソフトウェアの誤り処理を0続いて行う。
第25図の流れ図は、第24図のCPU入出カバンドラ
(ステップ2450)より成るCPU入出力誤り処理の
ための好適なプロセス(2500)を 49 示す。本発明の好適な実施例において、この誤り処理プ
ロセスとほかの誤り処理プロセスで説明した信号が第2
6図に示されている。
(ステップ2450)より成るCPU入出力誤り処理の
ための好適なプロセス(2500)を 49 示す。本発明の好適な実施例において、この誤り処理プ
ロセスとほかの誤り処理プロセスで説明した信号が第2
6図に示されている。
ハードウェアCPU入出力誤り処理の1つの重要な面は
、メモリ制御器70と75と関係のないオペレーション
のなかには、誤り信号が入力されなければ、オペレーシ
ョンの後に遅れを生じているものもあることである。従
って、誤り信号が、かようなオペレーションに対応する
データとして入力されるならば、システムは、すべての
誤り報告がメモリ制御器へ伝播するように遅れるであろ
う。
、メモリ制御器70と75と関係のないオペレーション
のなかには、誤り信号が入力されなければ、オペレーシ
ョンの後に遅れを生じているものもあることである。従
って、誤り信号が、かようなオペレーションに対応する
データとして入力されるならば、システムは、すべての
誤り報告がメモリ制御器へ伝播するように遅れるであろ
う。
CPU入出力誤り信号が受信された(ステップ2510
)後に、メモリ制御器70と75とにより行われた一連
のオペレーションは、次の3つの状態のうち1つが存在
する場合、メモリ制御器70と75とによって始動する
。すなわち、(1)特定の信号がクロスリンク90と9
5とから伝送される。(2)誤り報告がメモリモジュー
ル60により作成される。あるいは、内部誤り信号がメ
モリ制御 50 部器70と75に発生する。
)後に、メモリ制御器70と75とにより行われた一連
のオペレーションは、次の3つの状態のうち1つが存在
する場合、メモリ制御器70と75とによって始動する
。すなわち、(1)特定の信号がクロスリンク90と9
5とから伝送される。(2)誤り報告がメモリモジュー
ル60により作成される。あるいは、内部誤り信号がメ
モリ制御 50 部器70と75に発生する。
クロスリンク90と95とから伝送された特定の信号が
、バス88と89の制御状態回線に沿って同時に送られ
たコードである。本発明の好適実施例において、このよ
うなコードは、間違い比較がファイヤウオール1000
及び101Oにおいて検出された場合か、あるいは、ク
ロスリンク90と95が、レール(rail)間違い比
較を、例えば第11図の排他的ORゲート960と96
0mとにおいて検出する場合、生成される。ファイヤウ
オール1000と1010が間違い比較するならば、そ
れらは、所定のビットパターンを、モジュール相互接続
130と132をそれぞれ経由してクロスリンク90と
95とへ送られ、次に、そのパターンはメモリ制御器7
0と75とへそれぞれ再び送られる。
、バス88と89の制御状態回線に沿って同時に送られ
たコードである。本発明の好適実施例において、このよ
うなコードは、間違い比較がファイヤウオール1000
及び101Oにおいて検出された場合か、あるいは、ク
ロスリンク90と95が、レール(rail)間違い比
較を、例えば第11図の排他的ORゲート960と96
0mとにおいて検出する場合、生成される。ファイヤウ
オール1000と1010が間違い比較するならば、そ
れらは、所定のビットパターンを、モジュール相互接続
130と132をそれぞれ経由してクロスリンク90と
95とへ送られ、次に、そのパターンはメモリ制御器7
0と75とへそれぞれ再び送られる。
メモリ制御器70と75は、これらの誤り信号を、第9
図に示された診断誤りレジスタ論理870へ送り、論理
は誤りパルスを生成する。その誤りパルスは、ビットを
診断誤りレジスタ880(ステップ2510)に設定す
る。診断誤り論理870からの誤りパルスは、誤り類別
論理850への入力である。
図に示された診断誤りレジスタ論理870へ送り、論理
は誤りパルスを生成する。その誤りパルスは、ビットを
診断誤りレジスタ880(ステップ2510)に設定す
る。診断誤り論理870からの誤りパルスは、誤り類別
論理850への入力である。
誤り類別論理850の出力は、誤りコートを生成するエ
ンコーダ855へ送られる(ステップ2510)。誤り
コードは、ハードウェア誤り処理が使用可能の場合、A
NDゲート856から送られ、誤り使用不能ビット87
8が、それに応して設定される。次に、誤りコードはク
ロスリンク90と95へ送られる。
ンコーダ855へ送られる(ステップ2510)。誤り
コードは、ハードウェア誤り処理が使用可能の場合、A
NDゲート856から送られ、誤り使用不能ビット87
8が、それに応して設定される。次に、誤りコードはク
ロスリンク90と95へ送られる。
誤りコードに応答して、クロスリング90と95は、一
連のハードウェア・オペレーションを行う(ステップ2
520)。これらのオペレーションの1つは、システム
lOへ配分するためのゾーン誤り回線の所定の誤り信号
の表明である(2520)。
連のハードウェア・オペレーションを行う(ステップ2
520)。これらのオペレーションの1つは、システム
lOへ配分するためのゾーン誤り回線の所定の誤り信号
の表明である(2520)。
第19図と第26図に示されているように、シン当り4
本1組の誤り回線がある。クロスリンク90と95(ゾ
ーン11′の誤り信号のクロスリンクは、90′と95
′である。)からの誤り回線が共に論理和されと、ゾー
ンIIのゾーン誤り52 信号が生成される。これは、−貫した誤り報告がクロス
リンク90と95(及びクロスリング90′と95′)
により作成され、他のゾーンのクロスリンクへ送り出さ
れるように行われる。
本1組の誤り回線がある。クロスリンク90と95(ゾ
ーン11′の誤り信号のクロスリンクは、90′と95
′である。)からの誤り回線が共に論理和されと、ゾー
ンIIのゾーン誤り52 信号が生成される。これは、−貫した誤り報告がクロス
リンク90と95(及びクロスリング90′と95′)
により作成され、他のゾーンのクロスリンクへ送り出さ
れるように行われる。
所定の誤り信号を他のクロスリンク(ステップ2520
)へ配分した後、クロスリンク90.95゜90’、9
5’は、同時にシステム誤り割込みを中止し、追跡RA
Mを固定して、再試行リクエスト(Retry Req
uest)を送る(ステップ2520)。
)へ配分した後、クロスリンク90.95゜90’、9
5’は、同時にシステム誤り割込みを中止し、追跡RA
Mを固定して、再試行リクエスト(Retry Req
uest)を送る(ステップ2520)。
クロスリンク90と95は、割込みをCPU40と50
とへ送ったシステム誤り回線(参照第26図)を設定す
ることにより、システム誤り割込みを中止する。また、
クロスリンク90と95は、追跡RAM (ステップ2
520)を固定し、RAMは、広域誤り回線(参照第2
6図)を設定することにより、バス情報を収集するため
に種々のバスと接続する。
とへ送ったシステム誤り回線(参照第26図)を設定す
ることにより、システム誤り割込みを中止する。また、
クロスリンク90と95は、追跡RAM (ステップ2
520)を固定し、RAMは、広域誤り回線(参照第2
6図)を設定することにより、バス情報を収集するため
に種々のバスと接続する。
追跡RAMは、誤りの検出の前に送られた最新のデータ
を収集するために、固定される。追跡RAMの機能は、
この章で手短かに説明され、誤り 53 分析でのその使用は、ソフトウェア誤り処理の説明で述
べられる。
を収集するために、固定される。追跡RAMの機能は、
この章で手短かに説明され、誤り 53 分析でのその使用は、ソフトウェア誤り処理の説明で述
べられる。
システム10において追跡RAMは、好適に、すべての
主要レール(rail)データ経路に配置されている。
主要レール(rail)データ経路に配置されている。
第27図は、コンピュータシステムIO内の追跡RAM
の好適な配置を示しているcPUモジュール30と入出
カモジュール100の構成図である。もちろん、ほかの
配置も選択出来る。
の好適な配置を示しているcPUモジュール30と入出
カモジュール100の構成図である。もちろん、ほかの
配置も選択出来る。
追跡RAMの機能は、追跡RAMの内容間のデータの間
違い比較を追跡することにより、誤り源の識別を行うこ
とである。
違い比較を追跡することにより、誤り源の識別を行うこ
とである。
第27図において、追跡RAM2700と2705は、
ファイヤウオール1000と10]0とにそれぞれ配置
され、モジュール相互接続130と132とにそれぞれ
接続している。追跡RAM2710.2715.271
8は、それぞれ、クロス1ノンク95の対応するバスと
のインターフニスに配置され、追跡RAM2720.2
725.2728は、それぞれ、クロスリンク95の対
応するハスとのインターフェースに配置されている。
ファイヤウオール1000と10]0とにそれぞれ配置
され、モジュール相互接続130と132とにそれぞれ
接続している。追跡RAM2710.2715.271
8は、それぞれ、クロス1ノンク95の対応するバスと
のインターフニスに配置され、追跡RAM2720.2
725.2728は、それぞれ、クロスリンク95の対
応するハスとのインターフェースに配置されている。
+54
−群の相補追跡RAMが処理システム20′に配置され
ている。
ている。
ゾーン11において、追跡RAM2700と2718は
モジュール相互接続130を監視し、追跡RAM270
5と2728はモジュール相互接続132を監視し、追
跡RAM2715と2725はクロスリンクケーブル2
5を監視し、追跡RAM2710はバス88を監視し、
追跡RAM2720はバス89を監視する。ゾーン11
’の対応している追跡RAMはそれぞれのバスを監視す
る。
モジュール相互接続130を監視し、追跡RAM270
5と2728はモジュール相互接続132を監視し、追
跡RAM2715と2725はクロスリンクケーブル2
5を監視し、追跡RAM2710はバス88を監視し、
追跡RAM2720はバス89を監視する。ゾーン11
’の対応している追跡RAMはそれぞれのバスを監視す
る。
追跡RAM2800の1例が第28図に示されている。
追跡RAM2800は、連結しているバス経路のN回の
最初のサイクルで送られたデータを格納する循環バッフ
ァとして、好適に構成されている。
最初のサイクルで送られたデータを格納する循環バッフ
ァとして、好適に構成されている。
追跡RAM2800は、連結しているデータ経路からデ
ータを受けるために接合した入力部を有するバッファ・
レジスタ2805より成っている。
ータを受けるために接合した入力部を有するバッファ・
レジスタ2805より成っている。
バッファ2805へ入力されたロードは、ANDゲート
2815の出力である。ANDゲート2815への入力
は、データ経路からのクロック信号であり、故障が検出
されると広域誤り信号が生成され、追跡RAMは、追跡
RAMデコーダ2820からの信号を使用可能にする。
2815の出力である。ANDゲート2815への入力
は、データ経路からのクロック信号であり、故障が検出
されると広域誤り信号が生成され、追跡RAMは、追跡
RAMデコーダ2820からの信号を使用可能にする。
追跡RAM使用可能信号が、バスが休止状態にない場合
、対応するバスからのデータ格納を可能にする。バスが
休止サイクル状態にある時、バスはデータ伝送のために
使用されている。従って、追跡RAMは、バスに存在す
る信号を格納することを続けない。
、対応するバスからのデータ格納を可能にする。バスが
休止サイクル状態にある時、バスはデータ伝送のために
使用されている。従って、追跡RAMは、バスに存在す
る信号を格納することを続けない。
好適に、広域誤り信号により、追跡RAMはそのデータ
を固定し、さらに信号を格納することを停止する。広域
誤り信号が表明されると、バッファ2805が連結した
データ経路の信号の格納を中止するように、広域誤り信
号の逆信号がANDゲート2815へ送られる。
を固定し、さらに信号を格納することを停止する。広域
誤り信号が表明されると、バッファ2805が連結した
データ経路の信号の格納を中止するように、広域誤り信
号の逆信号がANDゲート2815へ送られる。
バッファ2805のアドレス入力は、ANDゲート28
15からカウント信号を受ける再反復カウンタ281O
により供給される。
15からカウント信号を受ける再反復カウンタ281O
により供給される。
追跡RAMは、それぞれ、そのメモリに、それと連結し
たデータ経路のN個の最新非休止トランザクションのコ
ピーを保持する。例えば、第27図では、追跡RAM2
700は、モジュール相互接続130のN個の最新トラ
ンザクションを保持する。
たデータ経路のN個の最新非休止トランザクションのコ
ピーを保持する。例えば、第27図では、追跡RAM2
700は、モジュール相互接続130のN個の最新トラ
ンザクションを保持する。
追跡RAM2800の深さNは、最も遠くから送られた
メツセージに必要とされるバスサイクル数の合計と、誤
りあるいは故障が発生した場合、広域誤り信号を追跡R
AMへ送ることが必要とされるサイクル数の合計とによ
り決定される。好適な実施例においては、16回の非休
止バスサイクルが格納されている。。誤りコードの生成
に直接応答して、行われた残りの動作は、再試行リクエ
ストの伝達である。クロスリング90と95内の誤り論
理回路2237.2238は、誤りコード(ステップ2
520)に応答して再試行リクエストを送る。再試行リ
クエストにより、一連のオペレーションがほぼ同時にメ
モリ制御器70と75に発生する(ステップ2530)
。すなわち、故障レベルの増大、システム故障・誤リア
ドレス・57 レジスタの固定、ソフトウェアのリセット・リクエスト
の伝達である。
メツセージに必要とされるバスサイクル数の合計と、誤
りあるいは故障が発生した場合、広域誤り信号を追跡R
AMへ送ることが必要とされるサイクル数の合計とによ
り決定される。好適な実施例においては、16回の非休
止バスサイクルが格納されている。。誤りコードの生成
に直接応答して、行われた残りの動作は、再試行リクエ
ストの伝達である。クロスリング90と95内の誤り論
理回路2237.2238は、誤りコード(ステップ2
520)に応答して再試行リクエストを送る。再試行リ
クエストにより、一連のオペレーションがほぼ同時にメ
モリ制御器70と75に発生する(ステップ2530)
。すなわち、故障レベルの増大、システム故障・誤リア
ドレス・57 レジスタの固定、ソフトウェアのリセット・リクエスト
の伝達である。
現在のハードウェア誤り回復故障レベル、または状態が
、システム故障・誤りレジスタ898の2ビツトに存在
する。これらの2ビツトは、−時ビットと固定ビットで
ある(参照第9図)。これらの2ビツトの組合せは、バ
ス誤りコードとして指定される。CPU入出力字体を解
釈する場合、バス誤りコードに3つの有効値がある。有
効値の1つは、現在未定の誤りがなく、誤り回復アルゴ
リズムが現在実行されていないシステム状態に相当する
。バス誤りコードのもう1つの有効値は、オペレーショ
ンの初期の実行中に誤りがあったか、あるいは、再試行
が試みられなかった誤りが発生したシステム状態に該当
する。第3の有効値は、オペレーションが再試行された
後に発生する誤りの場合である。再試行リクエストは、
故障レベルを増加するエンコーダ895への入力である
。
、システム故障・誤りレジスタ898の2ビツトに存在
する。これらの2ビツトは、−時ビットと固定ビットで
ある(参照第9図)。これらの2ビツトの組合せは、バ
ス誤りコードとして指定される。CPU入出力字体を解
釈する場合、バス誤りコードに3つの有効値がある。有
効値の1つは、現在未定の誤りがなく、誤り回復アルゴ
リズムが現在実行されていないシステム状態に相当する
。バス誤りコードのもう1つの有効値は、オペレーショ
ンの初期の実行中に誤りがあったか、あるいは、再試行
が試みられなかった誤りが発生したシステム状態に該当
する。第3の有効値は、オペレーションが再試行された
後に発生する誤りの場合である。再試行リクエストは、
故障レベルを増加するエンコーダ895への入力である
。
誤りが頻繁に発生し、従って最初の故障レベルがソフト
ウェア誤り処理によりクリアされなかっ58 た場合、故障レベルは多くの誤りにより何回となく増加
される。かように、間断なく発生する2つの故障は、ソ
フトウェア誤り処理により固定的故障であるかのように
見える。
ウェア誤り処理によりクリアされなかっ58 た場合、故障レベルは多くの誤りにより何回となく増加
される。かように、間断なく発生する2つの故障は、ソ
フトウェア誤り処理により固定的故障であるかのように
見える。
故障レベルを増加すると、システム故障誤りアドレス・
レジスタは固定する。−時的ビットは、第1と第2の故
障レベルのいずれにも設定されるが、現在未定誤りがな
い状態に対応する最低レベルには設定されない。−時的
ビットは、システム故障誤リアドレス・レジスタ898
を使用不能にして、固定する。システム故障誤リアドレ
ス・レジスタ865は、メモリ制御器70と75とに内
蔵されており、現在のバスオペレーションを再試行し、
診断の実行を援助させるために固定される。
レジスタは固定する。−時的ビットは、第1と第2の故
障レベルのいずれにも設定されるが、現在未定誤りがな
い状態に対応する最低レベルには設定されない。−時的
ビットは、システム故障誤リアドレス・レジスタ898
を使用不能にして、固定する。システム故障誤リアドレ
ス・レジスタ865は、メモリ制御器70と75とに内
蔵されており、現在のバスオペレーションを再試行し、
診断の実行を援助させるために固定される。
ソフトウェア・リセット・リクエストは、第26図に示
されたソフトウェア・リセット・リクエスト回線を設定
し、メモリ制御器70と75とのそれぞれにより、クロ
スリンク90と95へ送られる(ステップ2530)。
されたソフトウェア・リセット・リクエスト回線を設定
し、メモリ制御器70と75とのそれぞれにより、クロ
スリンク90と95へ送られる(ステップ2530)。
さらに、メモリ制御器70と75が再試行リクエストを
受けると、DM■ 9 Aエンジン800を停止し、誤りコードをDMA制御器
820内の状態レジスタに書込み、誤りのタイプを示し
、さらにメモリ制御器70と75と、クロスリンク90
と95とのそれぞれの間にあるバス88と89とを固定
する。
受けると、DM■ 9 Aエンジン800を停止し、誤りコードをDMA制御器
820内の状態レジスタに書込み、誤りのタイプを示し
、さらにメモリ制御器70と75と、クロスリンク90
と95とのそれぞれの間にあるバス88と89とを固定
する。
各種オペレーションが再試行リクエストに応答して実行
された後、主クロスリンク90の局部ソフトウェア・リ
セット・ジェネレータ2240は、ソフトウェア・リセ
ット・リクエストに応答して、局部ソフトウェア・リセ
ットを生成する(ステップ2532)。局部ソフトウェ
ア・リセットに応答して、メモリ制御器70と75内の
再試作ジェネレータ261Oと2620は、それぞれ、
未定のバス・トランザクションを再始動する(ステップ
2534)。再試行バス・オペレーションが順調に行わ
れて、誤り信号が入力されない場合(ステップ2536
)、CPU入出力誤りに関するノ\−ドウエア誤り処理
が完了する(ステップ2525)。
された後、主クロスリンク90の局部ソフトウェア・リ
セット・ジェネレータ2240は、ソフトウェア・リセ
ット・リクエストに応答して、局部ソフトウェア・リセ
ットを生成する(ステップ2532)。局部ソフトウェ
ア・リセットに応答して、メモリ制御器70と75内の
再試作ジェネレータ261Oと2620は、それぞれ、
未定のバス・トランザクションを再始動する(ステップ
2534)。再試行バス・オペレーションが順調に行わ
れて、誤り信号が入力されない場合(ステップ2536
)、CPU入出力誤りに関するノ\−ドウエア誤り処理
が完了する(ステップ2525)。
誤り信号が、メモリ制御器70と75とへ入力される場
合、同様なハードウェア・オペレーショ60 ンが、最初の誤り信号が入力された時に行われたように
、実行される。診断誤りレジスタが設定され、誤りコー
ドが生成される(ステップ2538)。
合、同様なハードウェア・オペレーショ60 ンが、最初の誤り信号が入力された時に行われたように
、実行される。診断誤りレジスタが設定され、誤りコー
ドが生成される(ステップ2538)。
誤り信号が配布され、システム誤り割込みが中止され、
追跡RAMが固定されて、再試行リクエストが送られる
(ステップ2539)。次に、故障レベルが増加され、
システム故障誤りアドレス・レジスタが固定され、ソフ
トウェア・リセット・リクエストが送られる(ステップ
2540)。これらのオペレーションの多くは、すでに
行われているので、追跡RAM、誤りアドレスと診断誤
りとのレジスタには変化はない。しかし、故障レベルは
、コンピュータ・システムに固定的故障があることを示
しているその最高レベルへ増加されている。これは、誤
りがバス・オペレーションの再試行の後に検出され、誤
りが再試行において検出される時に固定的故障が発生す
ることによるものである。次に、CPU入出力誤り25
00に関するハードウェア・誤り・処理ルーチンから移
行する前に、ソフトウェア・リセットが行われる。
追跡RAMが固定されて、再試行リクエストが送られる
(ステップ2539)。次に、故障レベルが増加され、
システム故障誤りアドレス・レジスタが固定され、ソフ
トウェア・リセット・リクエストが送られる(ステップ
2540)。これらのオペレーションの多くは、すでに
行われているので、追跡RAM、誤りアドレスと診断誤
りとのレジスタには変化はない。しかし、故障レベルは
、コンピュータ・システムに固定的故障があることを示
しているその最高レベルへ増加されている。これは、誤
りがバス・オペレーションの再試行の後に検出され、誤
りが再試行において検出される時に固定的故障が発生す
ることによるものである。次に、CPU入出力誤り25
00に関するハードウェア・誤り・処理ルーチンから移
行する前に、ソフトウェア・リセットが行われる。
61
割込みが、下記のソフトウェア誤り処理に関して行われ
るように、CPU40と50により行われているオペレ
ーションを完了するために、誤りが検出された時に読取
りオペレーションが行われていたか、いなかったかを確
認する□テストが行われる(ステップ2544)。そう
であれば、省略(detault)オペレーションが行
われる(ステップ2546)。省略オペレーションは、
CPUモジュール30へ一貫したデータ、例えばすべて
ゼロなどを送ることより成っており、従って、現在実行
中のオペレーションは、レール・データの分散により、
失敗の危険がなく完了する。
るように、CPU40と50により行われているオペレ
ーションを完了するために、誤りが検出された時に読取
りオペレーションが行われていたか、いなかったかを確
認する□テストが行われる(ステップ2544)。そう
であれば、省略(detault)オペレーションが行
われる(ステップ2546)。省略オペレーションは、
CPUモジュール30へ一貫したデータ、例えばすべて
ゼロなどを送ることより成っており、従って、現在実行
中のオペレーションは、レール・データの分散により、
失敗の危険がなく完了する。
第29図は、DMA誤りから受けるための手順2900
を示す。ハードウェアレベルで行われる一連のオペレー
ション(ステップ2910)は、CPU入出力誤り回復
の連続動作について述べたものと類似している。DMA
誤りに対するハードウェアの応答動作には、システム誤
り割込みの入力、DMA割込みの入力、追跡RAMの固
定、及びDMAの停止がある。
を示す。ハードウェアレベルで行われる一連のオペレー
ション(ステップ2910)は、CPU入出力誤り回復
の連続動作について述べたものと類似している。DMA
誤りに対するハードウェアの応答動作には、システム誤
り割込みの入力、DMA割込みの入力、追跡RAMの固
定、及びDMAの停止がある。
62
最初に、システム割込内のデータの改悪を防止するため
に、DMAは停止される。システム誤り割込みの入力は
、システムに、完全な回復が誤りから行われるように、
入力処理ルーチンが行われなければならないことを示す
。DMA割込みを入力すると、DMAハンドラをソフト
ウェアへ呼び出して、それ自身のオペレーションの点検
を始める。追跡RAMも、ソフトウェア誤りハンドラが
故障源を局部制限することが出来るように、固定される
。
に、DMAは停止される。システム誤り割込みの入力は
、システムに、完全な回復が誤りから行われるように、
入力処理ルーチンが行われなければならないことを示す
。DMA割込みを入力すると、DMAハンドラをソフト
ウェアへ呼び出して、それ自身のオペレーションの点検
を始める。追跡RAMも、ソフトウェア誤りハンドラが
故障源を局部制限することが出来るように、固定される
。
DMAが停止しても、残りのシステムは、通常のオペレ
ーションを続行することが出来る。しかし、動作不能な
りMAエンジンは、入出力オペレーションを実行するこ
とが出来ないので、DMAが停止した時にシステムのオ
ペレーションを続けると、さらに他の誤り、例えばバス
の時間切れによるCPU入出力誤りなどが発生する。
ーションを続行することが出来る。しかし、動作不能な
りMAエンジンは、入出力オペレーションを実行するこ
とが出来ないので、DMAが停止した時にシステムのオ
ペレーションを続けると、さらに他の誤り、例えばバス
の時間切れによるCPU入出力誤りなどが発生する。
DMA誤りへのハードウェアの応答が行われた後、DM
A誤り回復の一連の動作が完了する(ステップ2920
)。その後、DMA故障の処理と 63 DMAオペレーションの再開がソフトウェアで行われな
ければならない。CPU40.50と40′50′によ
り行われるソフトウェア誤り処理スキーマは以下に説明
される。
A誤り回復の一連の動作が完了する(ステップ2920
)。その後、DMA故障の処理と 63 DMAオペレーションの再開がソフトウェアで行われな
ければならない。CPU40.50と40′50′によ
り行われるソフトウェア誤り処理スキーマは以下に説明
される。
主にハードウェアにより処理される第3のタイプの誤り
は、CPU/MEM故障である。第30図はCPU/M
EM故障誤り処理手順3000を示す。
は、CPU/MEM故障である。第30図はCPU/M
EM故障誤り処理手順3000を示す。
CPU/MEM故障に関する誤り信号が入力されると、
それらの信号は、診断誤りレジスタ論理879と誤り類
別化論理850を経て、誤りを検出したメモリ制御器に
伝播する。次に、誤り類別論理850は、エンコーダ8
55により、CPU/MEM故障を示す2ビット誤りコ
ードへ符号されたCPU/MEM故障信号を入力する。
それらの信号は、診断誤りレジスタ論理879と誤り類
別化論理850を経て、誤りを検出したメモリ制御器に
伝播する。次に、誤り類別論理850は、エンコーダ8
55により、CPU/MEM故障を示す2ビット誤りコ
ードへ符号されたCPU/MEM故障信号を入力する。
2ビット誤りコードが、ANDゲート856を経てクロ
スリンク90と95へ送られる。
スリンク90と95へ送られる。
CPU/MEM故障(ステップ3010)を入力すると
、システム割込みの入力、故障レベルの増加、システム
故障誤リアドレスレジスタの固定、 64 及び追跡RAM (ステップ3020)が行われる。
、システム割込みの入力、故障レベルの増加、システム
故障誤リアドレスレジスタの固定、 64 及び追跡RAM (ステップ3020)が行われる。
これらは、CPU入出力誤り処理プロセス2500の検
討のなかで前に述べられている。
討のなかで前に述べられている。
CPU、/MEM故障の検出が完了すると、正確に動し
、従って誤り回復スキーマのすべてのタイプを行うべき
現在のゾーンの能力が、最善の状態で不確かであるので
、オペレーションを再試行する動きはない。クロスリン
ク9oと95が、CPU/MEM故障を示す誤りコード
を受けると、直ちにそれ自体をスレーブ・モード(sl
ave mode。
、従って誤り回復スキーマのすべてのタイプを行うべき
現在のゾーンの能力が、最善の状態で不確かであるので
、オペレーションを再試行する動きはない。クロスリン
ク9oと95が、CPU/MEM故障を示す誤りコード
を受けると、直ちにそれ自体をスレーブ・モード(sl
ave mode。
ステップ3025)へ再構成する。ここで、システム1
0は、効率低下デュプレックスまたはマスタ/スレーブ
・モードで動作していると見なされる。
0は、効率低下デュプレックスまたはマスタ/スレーブ
・モードで動作していると見なされる。
局部ソフトウェア・リセット(ステップ3030)及び
ゾーン・クロック・リセット(ステップ3040)が行
われ、CPU/MEM故障に関するハードウェア誤り回
復が完了する(ステップ3050)。
ゾーン・クロック・リセット(ステップ3040)が行
われ、CPU/MEM故障に関するハードウェア誤り回
復が完了する(ステップ3050)。
2つの状態が生成し、システム誤りレジスタ898内の
2つの対応するビットがセットされる。
2つの対応するビットがセットされる。
65
最初の状態は、記憶動作中の応答の欠如に相当するNX
M(nonexistent memory、非存在メ
モリ)である。もう1つの誤り状態は、入出力動作中の
応答の欠如に相当するNX I O(nonexist
ent l10device、非存在入出力デバイス)
である。
M(nonexistent memory、非存在メ
モリ)である。もう1つの誤り状態は、入出力動作中の
応答の欠如に相当するNX I O(nonexist
ent l10device、非存在入出力デバイス)
である。
NXM誤りは、以下に述べるように、ソフトウェアに回
復される。NXl0誤りは、CPU入出力誤りタイプに
属し、CPU入出カバンドラ・プロセス2500に従っ
てハードウェア内で処理される。
復される。NXl0誤りは、CPU入出力誤りタイプに
属し、CPU入出カバンドラ・プロセス2500に従っ
てハードウェア内で処理される。
NXl0ビツトとNXMビット(参照第9図)は、対応
するNXMとNX I O誤りに関して検出される。N
XMビットが設定されると、DMA800は使用不能に
なり、これにより入出力へのアクセスはシステムによっ
て阻止される。
するNXMとNX I O誤りに関して検出される。N
XMビットが設定されると、DMA800は使用不能に
なり、これにより入出力へのアクセスはシステムによっ
て阻止される。
ハードウェア誤り回復の3つのタイプの各タイプにおい
て、ソフトウェア誤り処理プロセスは、出来るならば誤
りの原因と個所を検出するため、ハードウェア誤り回復
手順の後に使用される。そのほかに、ソフトウェア誤り
処理は、故障がなく、66 システムが通常の完全デュプレクス・モードで再始動出
来ることを確認する。一方で、ソフトウェア誤り処理中
に、モジュールが不良であり、これによりモジュールが
マークされることが決定される。
て、ソフトウェア誤り処理プロセスは、出来るならば誤
りの原因と個所を検出するため、ハードウェア誤り回復
手順の後に使用される。そのほかに、ソフトウェア誤り
処理は、故障がなく、66 システムが通常の完全デュプレクス・モードで再始動出
来ることを確認する。一方で、ソフトウェア誤り処理中
に、モジュールが不良であり、これによりモジュールが
マークされることが決定される。
全ハードウェア誤り回復スキーマは、CPU入出力誤り
ハンドラ・プロセス内の一時的故障の後に、システムに
オペレーションを続けさせることにより、誤り回復で浪
費する時間を最小にする。
ハンドラ・プロセス内の一時的故障の後に、システムに
オペレーションを続けさせることにより、誤り回復で浪
費する時間を最小にする。
さらに、誤り処理に当てられたシステム・オーバヘンド
は、CPU/MEM故障からの回復を提供するために試
行しないことにより、最小化される。
は、CPU/MEM故障からの回復を提供するために試
行しないことにより、最小化される。
CPU/MEM故障から回復するためのシステム10の
能力は、好適実施例においてシステムの機能を厳しく効
率低下する誤り回復を考慮するために、時間のペナルテ
ィを課する。
能力は、好適実施例においてシステムの機能を厳しく効
率低下する誤り回復を考慮するために、時間のペナルテ
ィを課する。
2、 ソフトウェア誤り処理と回復
ソフトウェア誤り処理を始めるために、コンピュータシ
ステム10は、いずれが適正であるとしても、システム
誤り割込みまたはDMA割込み7 システム10に現在のハス・オペレーションを完成させ
るために、マシン点検などのより思い切った手段の代り
に使用される。マシン点検により、アクションが直ちに
とられ、システムをバス・オペレーションの中間で停止
することが出来る。ハードウェア誤り処理に関して簡潔
に述べたように、省略情報が、バス・オペレーションを
完成するために、生成されることが必要である。
ステム10は、いずれが適正であるとしても、システム
誤り割込みまたはDMA割込み7 システム10に現在のハス・オペレーションを完成させ
るために、マシン点検などのより思い切った手段の代り
に使用される。マシン点検により、アクションが直ちに
とられ、システムをバス・オペレーションの中間で停止
することが出来る。ハードウェア誤り処理に関して簡潔
に述べたように、省略情報が、バス・オペレーションを
完成するために、生成されることが必要である。
システム10が割込みを受は入れている場合、システム
は、第31図の手順3100などのソフトウェア誤り処
理手順を開始する。コンピュータシステムIOは、変更
可能な与えられたIPL(割込み優先順位)で動作する
。IPLは、割込みが、現在のコンピュータシステム・
オペレーションに割り込むために、入力されなければな
らない優先を指定する。割込みが、コンピュータシステ
ムlOが運転している現在のIPL以下のIPして生成
されるならば、割込みは受入れられないであろう。好適
実施例において、システム誤り割 68 込みは最高の優先割込みである。
は、第31図の手順3100などのソフトウェア誤り処
理手順を開始する。コンピュータシステムIOは、変更
可能な与えられたIPL(割込み優先順位)で動作する
。IPLは、割込みが、現在のコンピュータシステム・
オペレーションに割り込むために、入力されなければな
らない優先を指定する。割込みが、コンピュータシステ
ムlOが運転している現在のIPL以下のIPして生成
されるならば、割込みは受入れられないであろう。好適
実施例において、システム誤り割 68 込みは最高の優先割込みである。
ほかの例で行われているように、システム1゜がロック
ステップ・モードで機能している場合、同様な動作がゾ
ーン11′により行われていること理解した上で、ソフ
トウェア・誤り処理は、ゾーン11の構成機器の動作に
関して一般に説明される。
ステップ・モードで機能している場合、同様な動作がゾ
ーン11′により行われていること理解した上で、ソフ
トウェア・誤り処理は、ゾーン11の構成機器の動作に
関して一般に説明される。
システムlOがシステム誤り割込み(ステップ3110
)を受は入れると、システムIOはソフトウェア・リセ
ットを開始する(ステップ3112)。
)を受は入れると、システムIOはソフトウェア・リセ
ットを開始する(ステップ3112)。
次に、システムlOは、メモリ制御器7oと75、及び
70′と75′内と、クロスリング90と95及び90
′と95′とに配置された各種誤りレジスタを読取るこ
とを試みる(ステップ3]14)。
70′と75′内と、クロスリング90と95及び90
′と95′とに配置された各種誤りレジスタを読取るこ
とを試みる(ステップ3]14)。
メモリ制御器とクロスリンクは、その一部が図示されて
いないが、ソフトウェア誤り処理に使用される情報を格
納する。2つのかような誤りレジスタは、システム故障
誤りレジスタ898とシステム故障誤リアドレス・レジ
スタ865である。これらは、ゾーンのアドレス・スペ
ースに格納され 69 ており、各ゾーン毎に同じ情報を備えていなければなら
ない。しかし、CPU/MEM故障の場合、2つのゾー
ンのシステム故障誤りレジスタは異っている。2つのゾ
ーンのレジスタの内容のこの差異は、データ処理システ
ム20と20′がもはやロックステップになく、システ
ム10が効率低下デュプレクスまたはマスタ/スレーブ
・モードで運行している場合に、許容されるだけである
。
いないが、ソフトウェア誤り処理に使用される情報を格
納する。2つのかような誤りレジスタは、システム故障
誤りレジスタ898とシステム故障誤リアドレス・レジ
スタ865である。これらは、ゾーンのアドレス・スペ
ースに格納され 69 ており、各ゾーン毎に同じ情報を備えていなければなら
ない。しかし、CPU/MEM故障の場合、2つのゾー
ンのシステム故障誤りレジスタは異っている。2つのゾ
ーンのレジスタの内容のこの差異は、データ処理システ
ム20と20′がもはやロックステップになく、システ
ム10が効率低下デュプレクスまたはマスタ/スレーブ
・モードで運行している場合に、許容されるだけである
。
従って、誤り分析に使用したレジスタからのデータが一
貫していなければ、−これは検出された誤りまたは間違
い比較があることを意味するが一一貫していない誤りデ
ータを検出するゾーンは、CPU/MEM故障を設定し
、第30図に示されたハードウェア誤り回復手順300
0を人力する(ステップ3118)。この状態は、誤り
論理で発生した場合、生威し、この手法は、システム1
0から欠陥構成要素を除去する。
貫していなければ、−これは検出された誤りまたは間違
い比較があることを意味するが一一貫していない誤りデ
ータを検出するゾーンは、CPU/MEM故障を設定し
、第30図に示されたハードウェア誤り回復手順300
0を人力する(ステップ3118)。この状態は、誤り
論理で発生した場合、生威し、この手法は、システム1
0から欠陥構成要素を除去する。
誤り情報が一貫しているならば(ステップ3116)、
ソフトウェア誤り処理は継続し、システム10は故障の
特性を確認して、どの誤りハンドラを採用70 すべきかを決定する。誤りのタイプを識別するため、誤
りレジスタ、例えば、メモリ制御器70と75内のシス
テム故障誤りレジスタ898とシステム故障誤リアドレ
スレジスタ865、及びクロスリンク90と95(図示
せず)内の誤りレジスタは分析される。さらに、クロス
リンクへのアクセスは、NXMビットが設定されている
間抑制されてるので、システム故障誤りレジスタのNX
M誤リビリビットクロスリング90と95の誤りレジス
タをアクセスする前に、検査されなければない。
ソフトウェア誤り処理は継続し、システム10は故障の
特性を確認して、どの誤りハンドラを採用70 すべきかを決定する。誤りのタイプを識別するため、誤
りレジスタ、例えば、メモリ制御器70と75内のシス
テム故障誤りレジスタ898とシステム故障誤リアドレ
スレジスタ865、及びクロスリンク90と95(図示
せず)内の誤りレジスタは分析される。さらに、クロス
リンクへのアクセスは、NXMビットが設定されている
間抑制されてるので、システム故障誤りレジスタのNX
M誤リビリビットクロスリング90と95の誤りレジス
タをアクセスする前に、検査されなければない。
検出された故障がCPU入出力タイプの誤りであったな
らば、CPU入出力誤りハンドラが入力される(ステッ
プ3124)。その故障がCPU/MEM故障であるな
らば、CPU/MEM故障ハンドラが入力される(ステ
ップ3126)。クロック誤りが検出されたならば、ク
ロック誤りハンドラが入力される(ステップ3128)
。NXMが検出されたならば、NXMハンドラが入力さ
れる(ステップ3130)。CPU入出力誤りとCPU
/MEM故障は、ハードウェア誤り処理に関して上述さ
れている。ソフトウェア誤り処理の場合にのみ、CPU
入出力誤りはDMA誤りを有する。NXM誤りは、アク
セスするために探し出されたメモリが存在しないことを
示す。
らば、CPU入出力誤りハンドラが入力される(ステッ
プ3124)。その故障がCPU/MEM故障であるな
らば、CPU/MEM故障ハンドラが入力される(ステ
ップ3126)。クロック誤りが検出されたならば、ク
ロック誤りハンドラが入力される(ステップ3128)
。NXMが検出されたならば、NXMハンドラが入力さ
れる(ステップ3130)。CPU入出力誤りとCPU
/MEM故障は、ハードウェア誤り処理に関して上述さ
れている。ソフトウェア誤り処理の場合にのみ、CPU
入出力誤りはDMA誤りを有する。NXM誤りは、アク
セスするために探し出されたメモリが存在しないことを
示す。
第32図に示されているように、CPU入出力誤りハン
ドラ3200は、追跡RAM読取りから始まる(ステッ
プ3210.)。追跡RAM読取りは必要ではないが、
比較長いプロセスであるのでこの時点で開始する。前章
で明らかにしたように、追跡RAMは、広域誤り信号に
より固定された。
ドラ3200は、追跡RAM読取りから始まる(ステッ
プ3210.)。追跡RAM読取りは必要ではないが、
比較長いプロセスであるのでこの時点で開始する。前章
で明らかにしたように、追跡RAMは、広域誤り信号に
より固定された。
次に、追跡RAMからのデータは、診断マイクロプロセ
ッサにより追跡バス1095と1096とに読み取られ
、入出カモジュール100の局部RAM1060へ読み
込まれる。両方のゾーンの追跡RAMからの追跡RAM
データの完全セットが、ゾーン11と11’の両方の入
出カモジュールにより収集される。
ッサにより追跡バス1095と1096とに読み取られ
、入出カモジュール100の局部RAM1060へ読み
込まれる。両方のゾーンの追跡RAMからの追跡RAM
データの完全セットが、ゾーン11と11’の両方の入
出カモジュールにより収集される。
追跡RAMデータの分析には、追跡RAMサインを調べ
ることが必要である。追跡RAMデータ72 が入出カモジュール100と100′へ読み取られるに
つれて、追跡RAMサインが、各ゾーンの一連のMビッ
トとして形成される。Mは、各レールの追跡RAMの数
に等しい。追跡RAMサインの各ビットは、1対の追跡
RAMに相当する。1対の追跡RAMは、同じ関係位置
に配置されている各種レール上の2つの追跡RAMであ
る。例えば、第27図では、ゾーン11の追跡RAMの
対は、追跡RA M2700/2705.2718/2
728.2715/2725.2710/2720など
である。追跡RAMサイン内にビットが設定されるなら
ば、1対の追跡RAMの間に間違い比較が存在している
。
ることが必要である。追跡RAMデータ72 が入出カモジュール100と100′へ読み取られるに
つれて、追跡RAMサインが、各ゾーンの一連のMビッ
トとして形成される。Mは、各レールの追跡RAMの数
に等しい。追跡RAMサインの各ビットは、1対の追跡
RAMに相当する。1対の追跡RAMは、同じ関係位置
に配置されている各種レール上の2つの追跡RAMであ
る。例えば、第27図では、ゾーン11の追跡RAMの
対は、追跡RA M2700/2705.2718/2
728.2715/2725.2710/2720など
である。追跡RAMサイン内にビットが設定されるなら
ば、1対の追跡RAMの間に間違い比較が存在している
。
次に、誤りステータス・レジスタ898内のNXl0ビ
ツトが調べられる(ステップ3212)。
ツトが調べられる(ステップ3212)。
そのビットがセットされるならば、NXl0は、入出力
への読込みあるいは入出力からの書出しが行われている
間、時間切れを示すが、これが発生する。NXl0がセ
ットされないならば(ステップ3212)、追跡RAM
が分析されて、誤りが発生した装置の決定を助ける(ス
テップ3214)。
への読込みあるいは入出力からの書出しが行われている
間、時間切れを示すが、これが発生する。NXl0がセ
ットされないならば(ステップ3212)、追跡RAM
が分析されて、誤りが発生した装置の決定を助ける(ス
テップ3214)。
73
例えば、1対の追跡RA M2700/2705に対応
する追跡RAMサイン・ビットがセットされる。装置は
、ファイヤ・ウオール1000と1010に対応する入
出カモジュールが誤り源であることを決定することが出
来る。
する追跡RAMサイン・ビットがセットされる。装置は
、ファイヤ・ウオール1000と1010に対応する入
出カモジュールが誤り源であることを決定することが出
来る。
誤り源である装置が決定された後、システムは、故障装
置の通知を作成する(ステップ3220)。
置の通知を作成する(ステップ3220)。
この通知は、各種誤りレジスタ、例えばシステム故障誤
リアドレス・レジスタ865に格納された誤り情報を使
用し、特定の故障装置を識別するために追跡RAMを分
析することにより作成される。
リアドレス・レジスタ865に格納された誤り情報を使
用し、特定の故障装置を識別するために追跡RAMを分
析することにより作成される。
システムが、故障装置を識別すると、誤りが永続的故障
であるか、あるいは断続的故障であるかの決定が行われ
る。故障が永続的かどうかを決定するために、システム
故障誤りレジスタ898の最初の2つのビットが分析さ
れる。
であるか、あるいは断続的故障であるかの決定が行われ
る。故障が永続的かどうかを決定するために、システム
故障誤りレジスタ898の最初の2つのビットが分析さ
れる。
故障が断続的であるならば、明示された装置が故障して
いると見なされるべきか、でないかを決定するために、
故障基準のしきい値化が行われる。
いると見なされるべきか、でないかを決定するために、
故障基準のしきい値化が行われる。
故障率基準しきい値化は、与えられた期間中に故74
障装置に発生した断続的誤りの回数を、その装置の所定
のしきい値に比較して行われる。装置の単位時間当りの
誤りの回数が、所定のしきい値より大きい場合(ステッ
プ3224)、装置は故障していると見なされる。単位
時間当りの誤り回数が、しきいイ直より大きくないなら
ば(ステップ3224 )、ソフトウェア誤り処理の基
本機能は完全てあり、二三のステップが行われて、ソフ
トウェア誤り処理手順3200を退出させる。
のしきい値に比較して行われる。装置の単位時間当りの
誤りの回数が、所定のしきい値より大きい場合(ステッ
プ3224)、装置は故障していると見なされる。単位
時間当りの誤り回数が、しきいイ直より大きくないなら
ば(ステップ3224 )、ソフトウェア誤り処理の基
本機能は完全てあり、二三のステップが行われて、ソフ
トウェア誤り処理手順3200を退出させる。
断続的故障の回数が余り多いか、あるいは故障が永続的
である場合、故障装置のハンドラ(ステップ3226)
が呼び出される。
である場合、故障装置のハンドラ(ステップ3226)
が呼び出される。
第33図は、故障装置ハンドラ手順3300を示す。最
初に、適切な故障情報が故障モジュールのEEPROM
(電気的消去可能プログラマブルROM)に格納され
る(ステップ3310)。かような情報は、対応するモ
ジュールが破壊されているか、または破壊される可能性
があることを示すビットを有する。格納された情報は、
また、あるステータス情報を有することも出来る。
初に、適切な故障情報が故障モジュールのEEPROM
(電気的消去可能プログラマブルROM)に格納され
る(ステップ3310)。かような情報は、対応するモ
ジュールが破壊されているか、または破壊される可能性
があることを示すビットを有する。格納された情報は、
また、あるステータス情報を有することも出来る。
5
装置の故障による影響を最小にするため、故障装置の仮
想アドレスが、“ブラックホール”′と呼ばれる物理ア
ドレスヘマップされる(3314)。“ブラックホール
′°は、システム内の誤りの影響を受けることなく、デ
ータが送られる装置に実際に対応し、所定の一式のデー
タ□これはゼロであるが好適であるが−を読取り動作で
戻す物理アドレス空間である。マツピングは、好適実施
例において、システムlOの装置に関して、仮想アドレ
スと対応システムアドレスのリストを有するシステムア
ドレス変換表を使用して行われる。
想アドレスが、“ブラックホール”′と呼ばれる物理ア
ドレスヘマップされる(3314)。“ブラックホール
′°は、システム内の誤りの影響を受けることなく、デ
ータが送られる装置に実際に対応し、所定の一式のデー
タ□これはゼロであるが好適であるが−を読取り動作で
戻す物理アドレス空間である。マツピングは、好適実施
例において、システムlOの装置に関して、仮想アドレ
スと対応システムアドレスのリストを有するシステムア
ドレス変換表を使用して行われる。
第34図は、好適にメモリ・アレイ600と600’と
に格納されているシステムアドレス変換表3400の例
を示す。
に格納されているシステムアドレス変換表3400の例
を示す。
システム変換表3400には、仮想アドレス領域341
Oと物理アドレス領域3420が記載されている。ソフ
トウェアは、装置の仮想アドレスをその物理アドレスへ
翻訳あるいはマツプするために、システムアドレス変換
表3410を使用する。そのほかに、人出力ドライバ・
ルーチンは、76 対応する人出装置を識別するために、仮想アドレスを諌
用する。従って、装置に関してシステムアドレス変換表
3400を修正すると、入出力装置に仮に該当する仮想
アドレス宛のデータについて最終宛先を効果的に変更す
ることが出来る。
Oと物理アドレス領域3420が記載されている。ソフ
トウェアは、装置の仮想アドレスをその物理アドレスへ
翻訳あるいはマツプするために、システムアドレス変換
表3410を使用する。そのほかに、人出力ドライバ・
ルーチンは、76 対応する人出装置を識別するために、仮想アドレスを諌
用する。従って、装置に関してシステムアドレス変換表
3400を修正すると、入出力装置に仮に該当する仮想
アドレス宛のデータについて最終宛先を効果的に変更す
ることが出来る。
マツピンクが完了した後、故障装置ハンドラの次のステ
ップは、メモリ・アレイ600に格納されているソフト
ウェア表内の装置存在フラッグを消すことである(ステ
ップ3316)。フラッグを消す目的は、故障装置に対
応する装置ドライバへ、装置は故障していると見なされ
ていると、伝えることである。
ップは、メモリ・アレイ600に格納されているソフト
ウェア表内の装置存在フラッグを消すことである(ステ
ップ3316)。フラッグを消す目的は、故障装置に対
応する装置ドライバへ、装置は故障していると見なされ
ていると、伝えることである。
装置存在フラッグが消された後に、システムは必要な修
理の通知を送る(ステップ3318)。
理の通知を送る(ステップ3318)。
好適な実施例では、通知はメツセージを修理担当者へ送
る。1つの例では、このメツセージは、モデムを経て、
遠隔地のサービス者へ送られる。
る。1つの例では、このメツセージは、モデムを経て、
遠隔地のサービス者へ送られる。
故障装置ハンドラ手順3300の効果は、装置ドライバ
の性能を試験することにより、評価される。第35図は
、装置ドライバの一例を示してお 77 す、ドライバーは、対応する装置により行われる一連の
入出力命令を有する命令の実行可能なブロックである。
の性能を試験することにより、評価される。第35図は
、装置ドライバの一例を示してお 77 す、ドライバーは、対応する装置により行われる一連の
入出力命令を有する命令の実行可能なブロックである。
装置が故障しても、装置のドライバーは、正常に動作し
て、入出力命令を実行し続ける。人出装置アドレス空間
は、故障装置の°“ブラックホール°′ヘマップされる
ので、命令の継続的実行は、そのほかに故障を発生しな
い。装置ドライバーは、すべて、“存在装置の点検パの
命令3510を有する。この命令は、存在装置ビットに
対応する入出力装置を点検する。存在装置ビットがクリ
アされると、その装置は故障していると見なされて、ド
ライバは、規則通りの仕方で自身を使用不能にする。
て、入出力命令を実行し続ける。人出装置アドレス空間
は、故障装置の°“ブラックホール°′ヘマップされる
ので、命令の継続的実行は、そのほかに故障を発生しな
い。装置ドライバーは、すべて、“存在装置の点検パの
命令3510を有する。この命令は、存在装置ビットに
対応する入出力装置を点検する。存在装置ビットがクリ
アされると、その装置は故障していると見なされて、ド
ライバは、規則通りの仕方で自身を使用不能にする。
“存在装置の点検゛°の命令351Oの直前に、クリア
・パイプライン命令3520がある。クリア・パイプラ
イン命令は、即時実施中の命令内の誤りが、パイプライ
ンの遅れにより落されないように、人出力の命令が、す
べて、完全であることを保証する。“クリア・パイプラ
イン゛命令の一例は、メモリ制御器レジスタからの読取
りである。
・パイプライン命令3520がある。クリア・パイプラ
イン命令は、即時実施中の命令内の誤りが、パイプライ
ンの遅れにより落されないように、人出力の命令が、す
べて、完全であることを保証する。“クリア・パイプラ
イン゛命令の一例は、メモリ制御器レジスタからの読取
りである。
78
装置が故障していると見なされるか、どうかを点検する
前に、一連の命令を実行する能力は、この能力によりす
べのオペレーションの後に点検を行うことを避けること
が出来るので、ソフトウェアのオーバヘッドを保全する
。
前に、一連の命令を実行する能力は、この能力によりす
べのオペレーションの後に点検を行うことを避けること
が出来るので、ソフトウェアのオーバヘッドを保全する
。
第32図に示されたCPU入出力誤りハンドラは、誤り
を有する装置がしきい値評価(ステップ3224)の後
またはクラッシュ・ダンプ実行(ステップ3232)後
に故障していると見なされないと決定した後、故障装置
ハンドラ3300(ステップ3226)を退去されてか
ら、多くのハウスキーピング・オペレーションを開始す
る。
を有する装置がしきい値評価(ステップ3224)の後
またはクラッシュ・ダンプ実行(ステップ3232)後
に故障していると見なされないと決定した後、故障装置
ハンドラ3300(ステップ3226)を退去されてか
ら、多くのハウスキーピング・オペレーションを開始す
る。
これらのハウスキーピング・オペレーションは、追跡R
AM及び誤りレジスタのリセット(ステップ3228)
と誤りのロギング(ステップ3230)とより成ってい
る。
AM及び誤りレジスタのリセット(ステップ3228)
と誤りのロギング(ステップ3230)とより成ってい
る。
第31図のソフトウェア誤り処理の流れに再度関連して
、誤りのタイプがCPU/MEM故障(ステップ312
2)であると決定されたならば、CPU/MEM故障ハ
ンドラが入力される(ステ9 ツブ3126)。第36図は、CPU/MEM故障ハン
ドラの一例を示す。
、誤りのタイプがCPU/MEM故障(ステップ312
2)であると決定されたならば、CPU/MEM故障ハ
ンドラが入力される(ステ9 ツブ3126)。第36図は、CPU/MEM故障ハン
ドラの一例を示す。
CPU/MEM故障ハンドラ3600は、CPU/ME
M故障が発生していると決定された場合及びCPUまた
はMEMモジュールの確実な動作を未知の場合のすべて
のケースにおいて、入力される簡単なソフトウェア手順
である。従って、CPU/MEM故障のあるシステムに
関して、確実な誤り処理は僅かしか行われない。CPU
/MEM故障が入力された後、故障しているCPUモジ
ュールは、その内部誤りレジスタ(図示せず)を適切な
EEPROM (ステップ3612) 、例えばEEP
ROMI O55へ動かそうとする。CPU/MEM故
障誤り報告の表示が、両方のレールへ伝播する時必ずし
も与えられず、システムは、ハードウェア誤り処理中に
可及的速かに閉鎖されるので、EEPROMI O55
へ動かされた誤りレジスタは、レール固有データを非常
に適切に保有している。
M故障が発生していると決定された場合及びCPUまた
はMEMモジュールの確実な動作を未知の場合のすべて
のケースにおいて、入力される簡単なソフトウェア手順
である。従って、CPU/MEM故障のあるシステムに
関して、確実な誤り処理は僅かしか行われない。CPU
/MEM故障が入力された後、故障しているCPUモジ
ュールは、その内部誤りレジスタ(図示せず)を適切な
EEPROM (ステップ3612) 、例えばEEP
ROMI O55へ動かそうとする。CPU/MEM故
障誤り報告の表示が、両方のレールへ伝播する時必ずし
も与えられず、システムは、ハードウェア誤り処理中に
可及的速かに閉鎖されるので、EEPROMI O55
へ動かされた誤りレジスタは、レール固有データを非常
に適切に保有している。
故障CPUモジュールが、誤りレジスタをその80
EEPROMへ移動させようとした後(ステップ361
2)、故障CPUモジュールは、直ちに、コンソール・
モードに入り(ステップ3614)、CPU/MEM故
障ハンドラ3600は完了する(ステップ3616)。
2)、故障CPUモジュールは、直ちに、コンソール・
モードに入り(ステップ3614)、CPU/MEM故
障ハンドラ3600は完了する(ステップ3616)。
ソフトウェア誤りハンドラ・ルーチンの場合、誤りのタ
イプが、クロック誤りであると決定されると(ステップ
3122)、クロック誤りハンドラが加えられる(ステ
ップ3128)。クロック誤りハンドラの一例が、手順
3700として第37図に示されている。
イプが、クロック誤りであると決定されると(ステップ
3122)、クロック誤りハンドラが加えられる(ステ
ップ3128)。クロック誤りハンドラの一例が、手順
3700として第37図に示されている。
クロック誤りが発生した場合、誤りが発生した時にはク
ロックは同期されていないので、正確な診断あるいは誤
り分析は行われないと見なされる。
ロックは同期されていないので、正確な診断あるいは誤
り分析は行われないと見なされる。
従って、誤りレジスタはクリアされ(ステップ3710
)、追跡RAMは、広域誤り信号の表明を解除すること
により、固定から解かれる(ステップ3716)。クロ
ック誤りを発見したすべてのゾーンは、自身を基本クロ
ックへ合せる(ステップ3718)。
)、追跡RAMは、広域誤り信号の表明を解除すること
により、固定から解かれる(ステップ3716)。クロ
ック誤りを発見したすべてのゾーンは、自身を基本クロ
ックへ合せる(ステップ3718)。
81
次に、クロック誤りを発見しているゾーンは、ケーブル
が装着されているか、電力がほかのゾーンへ送られてい
るかを確認するために、点検を行う。クロスリンク・ケ
ーブル25が装着されており(ステップ3720) 、
かつほかのゾーンが電力を受けていない(ステップ37
25)ならば、クロック誤りは通常の形でロッグされ(
ステップ3730)、ゾーンは続行する。クロスリンク
・ケーブル25が装着されていないか(ステップ372
0)、あるいは装着されていないがほかのゾーンが電力
を受けているならば(ステップ3725)、ゾーンは、
これらの状態の下で動作を続けるように事前に選定され
たゾーンか、どうかを質問する(ステップ3735)。
が装着されているか、電力がほかのゾーンへ送られてい
るかを確認するために、点検を行う。クロスリンク・ケ
ーブル25が装着されており(ステップ3720) 、
かつほかのゾーンが電力を受けていない(ステップ37
25)ならば、クロック誤りは通常の形でロッグされ(
ステップ3730)、ゾーンは続行する。クロスリンク
・ケーブル25が装着されていないか(ステップ372
0)、あるいは装着されていないがほかのゾーンが電力
を受けているならば(ステップ3725)、ゾーンは、
これらの状態の下で動作を続けるように事前に選定され
たゾーンか、どうかを質問する(ステップ3735)。
そうであれば、クロック誤りはロッグされ(ステップ3
730)、ゾーンは続く。ゾーンが事前に選定されたゾ
ーンでなければ(ステップ3735) 、ゾーンはコン
ソール・モードに入る(ステップ3740)。
730)、ゾーンは続く。ゾーンが事前に選定されたゾ
ーンでなければ(ステップ3735) 、ゾーンはコン
ソール・モードに入る(ステップ3740)。
ソフトウェア誤り処理ルーチンの誤りのタイプが、NX
M誤りであると決定された場合(ステラ 82 プ3122)、NXMハンドラが加えられる(ステップ
3130)。NXM誤りは、NXMビットが第9図に示
されたシステム故障誤りレジスタ898にセットされて
いるならば、検出される。
M誤りであると決定された場合(ステラ 82 プ3122)、NXMハンドラが加えられる(ステップ
3130)。NXM誤りは、NXMビットが第9図に示
されたシステム故障誤りレジスタ898にセットされて
いるならば、検出される。
システム故障誤リアドレス・レジスタ898内のNXM
ビットは2つの状態にセットされる。1つは、システム
が実行しようとしたイリーガル命令がある場合である。
ビットは2つの状態にセットされる。1つは、システム
が実行しようとしたイリーガル命令がある場合である。
もう1つは、NXM誤りが、メモリモジュール60から
の応答がないために検出された場合である。
の応答がないために検出された場合である。
NXM誤り処理の手順3800の例が第38図に示され
ている。NXMハンドラが加えられた後(ステップ31
30)、最初の判断は、イリーガル命令が行われようと
したか、とうかである(ステップ3810)。イリーガ
ル命令があったので、NXMビットがセットされた場合
、コンソール・モードが加えられ(ステップ3812)
、NXMビットの表明が解除され(ステップ3831)
、NXMハンドラが完了する(ステップ3832)。
ている。NXMハンドラが加えられた後(ステップ31
30)、最初の判断は、イリーガル命令が行われようと
したか、とうかである(ステップ3810)。イリーガ
ル命令があったので、NXMビットがセットされた場合
、コンソール・モードが加えられ(ステップ3812)
、NXMビットの表明が解除され(ステップ3831)
、NXMハンドラが完了する(ステップ3832)。
実際のNXM誤りがあった場合、システム故障■
3
誤りアドレス・レジスタ865は読み取られる(ステッ
プ3820)。システム故障誤リアドレス・レジスタ8
65は、記憶場所のアドレスをメモリ・アレイに格納し
ている。次のステップは、メモリ・アドレスをメモリ・
マツプに配列された有効記憶場所と比較することである
(ステップ3826)。この比較の目的は、ハードウェ
ア誤りをソフトウェア誤りと識別することである。
プ3820)。システム故障誤リアドレス・レジスタ8
65は、記憶場所のアドレスをメモリ・アレイに格納し
ている。次のステップは、メモリ・アドレスをメモリ・
マツプに配列された有効記憶場所と比較することである
(ステップ3826)。この比較の目的は、ハードウェ
ア誤りをソフトウェア誤りと識別することである。
NXM誤りが検出される3つの異なる状aがある。最初
の状況は、システムがブーティングアップ(booti
ng up) L/ており、メモリが、メモリ・アップ
を形成するために、大きさ合せられている状態である。
の状況は、システムがブーティングアップ(booti
ng up) L/ており、メモリが、メモリ・アップ
を形成するために、大きさ合せられている状態である。
ブーティング中に、ソフトウェアは、メモリ・アレイ6
00内の有効と無効の記憶場所を調へている。この状況
が誤りを発生することを防止するため、報告もまた、メ
モリ探査中にシステムIPLを高めることにより、ブー
ツ時のメモリ探査の間、使用不能にされる。かようにし
て、NXM誤りハンドラは加えられない。
00内の有効と無効の記憶場所を調へている。この状況
が誤りを発生することを防止するため、報告もまた、メ
モリ探査中にシステムIPLを高めることにより、ブー
ツ時のメモリ探査の間、使用不能にされる。かようにし
て、NXM誤りハンドラは加えられない。
NXM誤りが検出される第2の状況は、メモリ84
アレイ600の特定の部分が、メモリマツプが形成され
ていた時に有効であったとしても、メモリ・モジュール
60が、その特定部分を使用不能にしたハードウェア故
障を受けた場合である。例えば、これは、メモリアレイ
・カードの1つが、動作中にシステムから簡単に取り除
かれる場合である。これはハードウェア故障であり、対
応するCPUモジュールの確実な動作を不可能にする。
ていた時に有効であったとしても、メモリ・モジュール
60が、その特定部分を使用不能にしたハードウェア故
障を受けた場合である。例えば、これは、メモリアレイ
・カードの1つが、動作中にシステムから簡単に取り除
かれる場合である。これはハードウェア故障であり、対
応するCPUモジュールの確実な動作を不可能にする。
NXM誤りが発生する第3の状況は、ソフトウェアが無
効なメモリ・アドレスを生成する場合である。この状況
ては、ソフトウェアは間違っている。
効なメモリ・アドレスを生成する場合である。この状況
ては、ソフトウェアは間違っている。
これらの3つのケースは、現在の状況において区別する
ことが可能である。上述のように、第1状況は、NXM
誤りハンドラを参入させないことにより区別される。次
の2つの状況は、NXM誤りが有効な記憶場所とメモリ
マツプで検出された時に、メモリアドレスを点検するこ
とによって区別される(ステップ3826)。明らかな
ように、ブーツのメモリモジュールがハードウェア故障
を 85 受け、さらに現在の記憶場所がマツプ内の有効な場所で
あるが、ある理由ですでに有効でない場合、CPU/M
EM故障は強制される(ステップ3828)。
ことが可能である。上述のように、第1状況は、NXM
誤りハンドラを参入させないことにより区別される。次
の2つの状況は、NXM誤りが有効な記憶場所とメモリ
マツプで検出された時に、メモリアドレスを点検するこ
とによって区別される(ステップ3826)。明らかな
ように、ブーツのメモリモジュールがハードウェア故障
を 85 受け、さらに現在の記憶場所がマツプ内の有効な場所で
あるが、ある理由ですでに有効でない場合、CPU/M
EM故障は強制される(ステップ3828)。
このようにして、CPU/MEM故障により、ハードウ
ェア誤り処理ルーチンが、効率低下デョ、プレクスある
いはマスク/スレーブ・モードにおいて動作を続行する
ために、システムを再構成することが出来るので、現在
実行中の作業は引続いて実行される。
ェア誤り処理ルーチンが、効率低下デョ、プレクスある
いはマスク/スレーブ・モードにおいて動作を続行する
ために、システムを再構成することが出来るので、現在
実行中の作業は引続いて実行される。
しかし、現在の記憶場所が無効な場所であり、有効なメ
モリマツプに存在しないことが確認されたならば、シス
テムは、ソフトウェアは間違っており、衝撃ダンプと誤
りログは行わなければならないと決定する(ステップ3
830)。これら2つのケースが行われた後に(ステッ
プ3828と3830)、NXMビットは表明が解除さ
れ(ステップ293])、次にNXM誤リハリハンドラ
場させられる(ステップ3832)。NXMビットの表
明が解除された後、入出力装置へのアクセスは、」二連
のように行われる。
モリマツプに存在しないことが確認されたならば、シス
テムは、ソフトウェアは間違っており、衝撃ダンプと誤
りログは行わなければならないと決定する(ステップ3
830)。これら2つのケースが行われた後に(ステッ
プ3828と3830)、NXMビットは表明が解除さ
れ(ステップ293])、次にNXM誤リハリハンドラ
場させられる(ステップ3832)。NXMビットの表
明が解除された後、入出力装置へのアクセスは、」二連
のように行われる。
86
3つのタイプの各ハードウェア誤り回復において、ソフ
トウェア処理プロセスは、誤りの原因または場所を検出
するハードウェア誤り回復手順の後に、可能ならば使用
される。そのほかに、ソフトウェア誤り処理は、故障が
ないこと、及びシステムは、通常の完全デコプレクス・
モードにおいて再始動出来ることとを決定する。一方で
、ソフトウェア誤り処理の間に、モジュールが不良であ
り、従ってモジュールは、マークされることが決定され
る。
トウェア処理プロセスは、誤りの原因または場所を検出
するハードウェア誤り回復手順の後に、可能ならば使用
される。そのほかに、ソフトウェア誤り処理は、故障が
ないこと、及びシステムは、通常の完全デコプレクス・
モードにおいて再始動出来ることとを決定する。一方で
、ソフトウェア誤り処理の間に、モジュールが不良であ
り、従ってモジュールは、マークされることが決定され
る。
要約すると、割込みサイクルがシステム10により達成
される時にのみ、システムlOがソフトウェア誤り回復
を行うことが出来るようにすることにより、誤りが検出
された時に実行中のオペレーションへのインパクトは、
最小になる。ハードウェア誤り回復は、誤り処理の通常
実行データ処理命令への透明伝送機構を容易にする。入
出力装置を“ブラックホール°゛ヘマッピングし、それ
によって、装置のドライバーに、誤り点検前に多くの入
出力命令を完了せしめることにより、最初の87 誤り検出後に誤りがほかに検出されないならば、入出力
オペレーションは正確に行われ、不適切に割り込まれな
いことを保証するために必要なオーバヘッドを最小にす
る。
される時にのみ、システムlOがソフトウェア誤り回復
を行うことが出来るようにすることにより、誤りが検出
された時に実行中のオペレーションへのインパクトは、
最小になる。ハードウェア誤り回復は、誤り処理の通常
実行データ処理命令への透明伝送機構を容易にする。入
出力装置を“ブラックホール°゛ヘマッピングし、それ
によって、装置のドライバーに、誤り点検前に多くの入
出力命令を完了せしめることにより、最初の87 誤り検出後に誤りがほかに検出されないならば、入出力
オペレーションは正確に行われ、不適切に割り込まれな
いことを保証するために必要なオーバヘッドを最小にす
る。
3、 レールの固有データからシステム・データへの変
換 故障許容計算システムにおける誤り処理のある条件の下
で、データは生成され、ゾーン11または11′の単一
レールに固有のものである。本発明の好適実施例におい
て、レール固有データは、CPU/MEM故障の後に、
診断誤りレジスタ880に格納される。しかし、レール
固有データは、診断レジスタ880に制約されない。診
断誤り分析中に、レール固有データは、試験中のレジス
タにより、多くの場所で生成する。
換 故障許容計算システムにおける誤り処理のある条件の下
で、データは生成され、ゾーン11または11′の単一
レールに固有のものである。本発明の好適実施例におい
て、レール固有データは、CPU/MEM故障の後に、
診断誤りレジスタ880に格納される。しかし、レール
固有データは、診断レジスタ880に制約されない。診
断誤り分析中に、レール固有データは、試験中のレジス
タにより、多くの場所で生成する。
データ処理装置20または20′が、レール固有データ
を1つの場所からほかへ移動しようとするか、あるいは
、何かの方法で使用しようとする場合、通常の誤り検出
回路、例えば、データ比較1000及び1000’は、
各レールのデータは88 同一でないので、誤りの信号を送る。従って、転送中に
誤りの発生を防止するため機構が必要とされる。
を1つの場所からほかへ移動しようとするか、あるいは
、何かの方法で使用しようとする場合、通常の誤り検出
回路、例えば、データ比較1000及び1000’は、
各レールのデータは88 同一でないので、誤りの信号を送る。従って、転送中に
誤りの発生を防止するため機構が必要とされる。
さらに、レール固有データが、ゾーンに共用のデータに
変換された場合、ゾーン11と11’のデータの間に不
一致があるので、固有データは故障許容システムにより
未だ使用出来る状態ではない。このデータを分析するた
め、各データ処理装置20と20′に存在するデータの
1つの一貫性のあるコピーがあるように、データはさら
にシステムデータへ変換されなければならない。このデ
ータ変換は、ロックステップ同期化状態で運転中の4つ
のCPU40,50.40’、50’と共に行わなけれ
ばならない。
変換された場合、ゾーン11と11’のデータの間に不
一致があるので、固有データは故障許容システムにより
未だ使用出来る状態ではない。このデータを分析するた
め、各データ処理装置20と20′に存在するデータの
1つの一貫性のあるコピーがあるように、データはさら
にシステムデータへ変換されなければならない。このデ
ータ変換は、ロックステップ同期化状態で運転中の4つ
のCPU40,50.40’、50’と共に行わなけれ
ばならない。
レール固有データからゾーン固有データへの変換は、同
じ手順がゾーン11’のデータ処理装置20’により行
われることを理解した上で、実例説明のために、ゾーン
11とデータ処理装置20に関して説明する。
じ手順がゾーン11’のデータ処理装置20’により行
われることを理解した上で、実例説明のために、ゾーン
11とデータ処理装置20に関して説明する。
第39図に図示されているように、レール固有 89
データからシステムデータへの変換手順の本発明の好適
実施例において、コンピュータシステム1゜のIPL(
割込み優先順位)は、間違い比較の誤りによって、ソフ
トウェア誤り処理ルーチンが行われるレベルよりも高め
られる(ステップ3910)。
実施例において、コンピュータシステム1゜のIPL(
割込み優先順位)は、間違い比較の誤りによって、ソフ
トウェア誤り処理ルーチンが行われるレベルよりも高め
られる(ステップ3910)。
このIPLにおいて、コンピュータシステムl。
は、システム誤り割込みレベルより高い優先レベルを有
する割込みを受は入れるだけである。
する割込みを受は入れるだけである。
誤り報告システムは、また、メモリ制御器7゜と75に
おいて使用不能にされる(ステップ3912)。
おいて使用不能にされる(ステップ3912)。
メモリ制御器70と75内の誤り報告は、誤り使用不能
ビット878を、ANDゲート856への入力であるメ
モリ制御器ステータス・レジスタにセットすることによ
って、使用不能になる。
ビット878を、ANDゲート856への入力であるメ
モリ制御器ステータス・レジスタにセットすることによ
って、使用不能になる。
特定のレジスタからのレール固有データは、これは、例
えば、診断誤りレジスタ8・8oからのデータであるが
、対応するメモリ制御器7oと75のそれぞれにある診
断誤りレジスタから、作業用メモリ(scratch
pad memory) 45と55へ移動される(ス
テップ3914)。作業用メモリ4590 と55は、メモリ制御器70と75の“上位パに位置し
ており、従ってすべての誤りチエッカ−を通過しない。
えば、診断誤りレジスタ8・8oからのデータであるが
、対応するメモリ制御器7oと75のそれぞれにある診
断誤りレジスタから、作業用メモリ(scratch
pad memory) 45と55へ移動される(ス
テップ3914)。作業用メモリ4590 と55は、メモリ制御器70と75の“上位パに位置し
ており、従ってすべての誤りチエッカ−を通過しない。
作業用メモリ45と55内のこのデータは、メモリモジ
ュール60へ移動する。最初に、書込みオペレーション
が行われ、これて、作業用メモリ45と55のデータは
、メモリモジュール60へ最初の場所に書き込まれる(
ステップ3916)。
ュール60へ移動する。最初に、書込みオペレーション
が行われ、これて、作業用メモリ45と55のデータは
、メモリモジュール60へ最初の場所に書き込まれる(
ステップ3916)。
システム省略再構成は、データを、主レールからメモリ
モジュール60のアドレスされた記憶場所へ書き込む。
モジュール60のアドレスされた記憶場所へ書き込む。
最初の記憶場所へのこの書込み動作により、作業用メモ
リ45からメモリモジュール60へ読み込まれるデータ
が生成する。
リ45からメモリモジュール60へ読み込まれるデータ
が生成する。
対称の作業用メモリ55からのデータは、2の動作を必
要とするメモリモジュールへ書き込まれる。最初に、メ
モリ制御器75内のメモリ・バス変換が可能とならなけ
ればならず、メモリ制御器70内のその変換は、使用不
能にならなければならない(ステップ3918)。これ
は、対称バス・ドライバ・使用可能ビット879をメモ
リ制御器ステータス・レジスタ876にセットすること
により、達成される。次に、メモリモジュール60は、
対称メモリ制御器75からのデータに関してFCCを選
択することを指令される(ステップ3920)。
要とするメモリモジュールへ書き込まれる。最初に、メ
モリ制御器75内のメモリ・バス変換が可能とならなけ
ればならず、メモリ制御器70内のその変換は、使用不
能にならなければならない(ステップ3918)。これ
は、対称バス・ドライバ・使用可能ビット879をメモ
リ制御器ステータス・レジスタ876にセットすること
により、達成される。次に、メモリモジュール60は、
対称メモリ制御器75からのデータに関してFCCを選
択することを指令される(ステップ3920)。
次に、もう1つの書込み動作が実行され、作業用メモリ
45と55のデータは、作業用メモリ45と55とから
最初に書き込まれた場所(ステップ3916)と異なる
第2の記憶場所へ書き込まれる(ステップ3922)。
45と55のデータは、作業用メモリ45と55とから
最初に書き込まれた場所(ステップ3916)と異なる
第2の記憶場所へ書き込まれる(ステップ3922)。
対称レールは、書込み動作のデータ源と選定されている
ので、第2の記憶場所へのこの書込み動作により、作業
用メモリ55からのデータは、メモリモジュール60内
の第2の記憶場所へ書き込まれる(ステップ3918と
ステップ3920)。
ので、第2の記憶場所へのこの書込み動作により、作業
用メモリ55からのデータは、メモリモジュール60内
の第2の記憶場所へ書き込まれる(ステップ3918と
ステップ3920)。
この一連のオペレーションによって、レール固有データ
はゾーン固有データへ変換する。ゾーン+1の各レール
に位置するレジスタからのデータは、現在では、メモリ
モジュール60内にあって、間違い比較を起すこともな
く、データ処理装置2092 により使用される。ここで、これらのゾーンは、前に使
用した作業用メモリ45と55内の特定の場所をクリア
しくステップ3924) 、メモリモジュールの主レー
ルを選定しくステップ3926)、対称バス・ドライバ
使用可能ビット879を再セットしてメモリ制御器75
内の対称レール・バス・ドライバーを選定から解除しく
ステップ3928)、該当する誤りと診断のレジスタを
クリアしくステップ3930)、ソフトウェアをメモリ
制御器70と75とに再セット(ステップ3932)な
どの一連の操作を行うことより、その正常な状態にセッ
トされて戻される。
はゾーン固有データへ変換する。ゾーン+1の各レール
に位置するレジスタからのデータは、現在では、メモリ
モジュール60内にあって、間違い比較を起すこともな
く、データ処理装置2092 により使用される。ここで、これらのゾーンは、前に使
用した作業用メモリ45と55内の特定の場所をクリア
しくステップ3924) 、メモリモジュールの主レー
ルを選定しくステップ3926)、対称バス・ドライバ
使用可能ビット879を再セットしてメモリ制御器75
内の対称レール・バス・ドライバーを選定から解除しく
ステップ3928)、該当する誤りと診断のレジスタを
クリアしくステップ3930)、ソフトウェアをメモリ
制御器70と75とに再セット(ステップ3932)な
どの一連の操作を行うことより、その正常な状態にセッ
トされて戻される。
IPLが、システムが割込みを受は入られるレベルに復
帰した後(ステップ3934)、システムlOは、各メ
モリモジュール60と60′内の2つのアドレスに格納
されたゾーン固有データを、全システムにより使用可能
なデータへ変換する。
帰した後(ステップ3934)、システムlOは、各メ
モリモジュール60と60′内の2つのアドレスに格納
されたゾーン固有データを、全システムにより使用可能
なデータへ変換する。
ゾーン固有データをシステムデータへ変換するために、
通信レジスタ906が利用される。通信レジスタ906
は、ゾーンの間で変換されるべき 93 固有データを保持するために使用される。前述のように
、書込み用通信レジスタのアドレスは、ゾーン・アドレ
ス空間内にある。かようにして、ロックステップ動作の
間、両方のゾーンは、通信レジスタを各ゾーンに同時に
書き込むことが出来る。
通信レジスタ906が利用される。通信レジスタ906
は、ゾーンの間で変換されるべき 93 固有データを保持するために使用される。前述のように
、書込み用通信レジスタのアドレスは、ゾーン・アドレ
ス空間内にある。かようにして、ロックステップ動作の
間、両方のゾーンは、通信レジスタを各ゾーンに同時に
書き込むことが出来る。
しかし、読取り用の通信レジスタ906のアドレスは、
システム・アドレスの空間にある。このように、ロック
ステップ動作中の2つのゾーンは、通信レジスタを使用
して、ゾーン固有データを同時に読むことが出来る。
システム・アドレスの空間にある。このように、ロック
ステップ動作中の2つのゾーンは、通信レジスタを使用
して、ゾーン固有データを同時に読むことが出来る。
ゾーン固有データをシステムデータへ変換スる方法は、
第40図の手順4000に示されている。
第40図の手順4000に示されている。
最初に、両方のデータ処理装置20と20′は、希望の
場所を各メモリモジュールから各通信レジスタへ書き込
む(ステップ4010)。次に、両方のデータ処理装置
は、そのデータを通信レジスタ906からメモリモジュ
ール60と80’へ書き込む(ステップ4020)。そ
れから、両方のデータ処理装置20は、そのデータを通
信レジスタ906′からメモリモジュール60と60′
へ+94 書き込む(ステップ4030)。ここで、すべてのゾー
ンは、同一データを有する。
場所を各メモリモジュールから各通信レジスタへ書き込
む(ステップ4010)。次に、両方のデータ処理装置
は、そのデータを通信レジスタ906からメモリモジュ
ール60と80’へ書き込む(ステップ4020)。そ
れから、両方のデータ処理装置20は、そのデータを通
信レジスタ906′からメモリモジュール60と60′
へ+94 書き込む(ステップ4030)。ここで、すべてのゾー
ンは、同一データを有する。
レール固有データの場合のように、異なるデータを有す
る複数のメモリモジュール・ロケーションがある場合、
手順4000が、各ロケーションについて繰り返される
。
る複数のメモリモジュール・ロケーションがある場合、
手順4000が、各ロケーションについて繰り返される
。
第1図は、本発明を実施する故障許容コンピュータ・シ
ステムの好適な実施例のブロック図である。 第2図は、第1図の故障許容コンピュータ・システムを
有する物理的ハードウェアを示す。 第3図は、第1図の故障許容コンピュータ・システムに
示すCPUモジュールのブロック図である。 第4図は、第1図に示すコンピュータ・システムの相互
に接続されたCPUモジュールとI10モジュールのブ
ロック図を示す。 第5図は、第1図に示す故障許容コンピュータ・システ
ムのメモリ・モジュールのブロック図を示5 す。 第6図は、第5図に示すメモリ・モジュールの制御ロジ
ックの構成要素の詳細図である。 第7図は、第3図に示すCPUモジュールのプライマリ
・メモリ制御装置の部分ブロック図を示す。 第8図は、第3図のCPUモジュールのプライマリ・メ
モリ制御装置のDMAエンジンのらブロック図である。 第9図は、第3図のCPUモジュールのプライマリ・メ
モリ制御装置のエラー処理回路図である。 第10図は、第3図に示すCPUモジュールのクロスリ
ンクの幾つかのレジスタの図である。 第11図は、第3図に示すCPUモジュールのクロスリ
ンクに制御信号を流す構成要素のブロック図である。 第12図は、第3図に示すCPUモジュールのプライマ
リ・クロスリンクにデータとアドレス信号を流す構成要
素のブロック図である。 第13図は、第3図に示すCPUモジュールの96 クロスリンクの状態を示す状態図である。 第14図は、第1図の故障許容コンピュータ・システム
のタイミング・システムのブロック図である。 第15図は、第14図のタイミング・システムによって
発生されるクロック信号のタイミング図である。 第16図は、第14図に示すタイミング・システムの位
相検出器の詳細図である。 第17図は、第1図のコンピュータ・システムのI10
モジュールのブロック図である。 第18図は、第17図に示すI10モジュールのファイ
ヤウオールの構成要素のブロック図である。 第19図は、第1図のコンピュータ・システムのクロス
リンク経路の構成要素の詳細図である。 第20A図ないし第20E図は第1図のコンピュータ・
システムのデータ・フロー図である。 第21図は、リセット信号の流れを示すゾーン20のブ
ロック図である。 97 第22図は、第3図に示すCP’Uモジュールのリセッ
トに含まれる構成要素のブロック図である。 第23図は、クロック・リセット回路の図である。 第24図は、第1図のコンピュータ・システムの全ハー
ドウェア誤り処理手順を示す流れ図である。 第25a図と第25bとは合せて、第24図のプロセス
内のCPU入出力誤り処理手順の流れ図である。 第26図は、第1図のコンピュータシステムの誤り処理
手順に使用された誤り回線と各種構成要素を示す構成図
である。 第27図は、第1図のコンピュータシステム内の追跡R
AMの位置を示す構成図である。 第28図は、第1図のコンピュータシステムの追跡RA
Mの構成図である。 第29図は、第24図の全ハードウェア誤り処理手順内
DMA誤りらの回復手順を示す流れ図である。 98 第30図は、第24図のプロセス内CPU/MEM故障
の処理手順を示す流れ図である。 第31図は、第1図のコンピュータシステムの全ソフト
ウェア誤り処理手順を示す流れ図である。 第32図は、第31図のCPU入出力誤りハンドラを示
す流れ図である。 第33図は、第32図の故障装置ハンドラを示す流れ図
である。 第34図は、第1図のコンピュータシステムに使用され
たシステム・アドレス変換表の説明図である。 第35図は、第1図のコンピュータシステムに使用され
た装置ドライバーの例の説明図である。 第36図は、第31図のCPU/MEM故障ホルダーの
流れ図である。 第37図は、第31図のクロック誤りハンドラの流れ図
である。 第38図は、第31図のNXM誤りハンドラの流れ図で
ある。 第39図及び40図は、レール特定データの、第1図の
コンピュータシステムのシステムデータへの変換のため
の手続きを示す流れ図である。 特開平3 182939 (54) 旧仏 特開平3−182939 (70) 特開平3−182939 (84) 手 続 補 正 書 (方式) 1、事件の表示 平成2年特許願第203802号 2、発明の名称 ソフトウェアのエラー処理の方法 3、補正をする者 事件との関係 出 願 人 4、代 理 人 5、補正命令の日付 平Ifj、2年10月30日
ステムの好適な実施例のブロック図である。 第2図は、第1図の故障許容コンピュータ・システムを
有する物理的ハードウェアを示す。 第3図は、第1図の故障許容コンピュータ・システムに
示すCPUモジュールのブロック図である。 第4図は、第1図に示すコンピュータ・システムの相互
に接続されたCPUモジュールとI10モジュールのブ
ロック図を示す。 第5図は、第1図に示す故障許容コンピュータ・システ
ムのメモリ・モジュールのブロック図を示5 す。 第6図は、第5図に示すメモリ・モジュールの制御ロジ
ックの構成要素の詳細図である。 第7図は、第3図に示すCPUモジュールのプライマリ
・メモリ制御装置の部分ブロック図を示す。 第8図は、第3図のCPUモジュールのプライマリ・メ
モリ制御装置のDMAエンジンのらブロック図である。 第9図は、第3図のCPUモジュールのプライマリ・メ
モリ制御装置のエラー処理回路図である。 第10図は、第3図に示すCPUモジュールのクロスリ
ンクの幾つかのレジスタの図である。 第11図は、第3図に示すCPUモジュールのクロスリ
ンクに制御信号を流す構成要素のブロック図である。 第12図は、第3図に示すCPUモジュールのプライマ
リ・クロスリンクにデータとアドレス信号を流す構成要
素のブロック図である。 第13図は、第3図に示すCPUモジュールの96 クロスリンクの状態を示す状態図である。 第14図は、第1図の故障許容コンピュータ・システム
のタイミング・システムのブロック図である。 第15図は、第14図のタイミング・システムによって
発生されるクロック信号のタイミング図である。 第16図は、第14図に示すタイミング・システムの位
相検出器の詳細図である。 第17図は、第1図のコンピュータ・システムのI10
モジュールのブロック図である。 第18図は、第17図に示すI10モジュールのファイ
ヤウオールの構成要素のブロック図である。 第19図は、第1図のコンピュータ・システムのクロス
リンク経路の構成要素の詳細図である。 第20A図ないし第20E図は第1図のコンピュータ・
システムのデータ・フロー図である。 第21図は、リセット信号の流れを示すゾーン20のブ
ロック図である。 97 第22図は、第3図に示すCP’Uモジュールのリセッ
トに含まれる構成要素のブロック図である。 第23図は、クロック・リセット回路の図である。 第24図は、第1図のコンピュータ・システムの全ハー
ドウェア誤り処理手順を示す流れ図である。 第25a図と第25bとは合せて、第24図のプロセス
内のCPU入出力誤り処理手順の流れ図である。 第26図は、第1図のコンピュータシステムの誤り処理
手順に使用された誤り回線と各種構成要素を示す構成図
である。 第27図は、第1図のコンピュータシステム内の追跡R
AMの位置を示す構成図である。 第28図は、第1図のコンピュータシステムの追跡RA
Mの構成図である。 第29図は、第24図の全ハードウェア誤り処理手順内
DMA誤りらの回復手順を示す流れ図である。 98 第30図は、第24図のプロセス内CPU/MEM故障
の処理手順を示す流れ図である。 第31図は、第1図のコンピュータシステムの全ソフト
ウェア誤り処理手順を示す流れ図である。 第32図は、第31図のCPU入出力誤りハンドラを示
す流れ図である。 第33図は、第32図の故障装置ハンドラを示す流れ図
である。 第34図は、第1図のコンピュータシステムに使用され
たシステム・アドレス変換表の説明図である。 第35図は、第1図のコンピュータシステムに使用され
た装置ドライバーの例の説明図である。 第36図は、第31図のCPU/MEM故障ホルダーの
流れ図である。 第37図は、第31図のクロック誤りハンドラの流れ図
である。 第38図は、第31図のNXM誤りハンドラの流れ図で
ある。 第39図及び40図は、レール特定データの、第1図の
コンピュータシステムのシステムデータへの変換のため
の手続きを示す流れ図である。 特開平3 182939 (54) 旧仏 特開平3−182939 (70) 特開平3−182939 (84) 手 続 補 正 書 (方式) 1、事件の表示 平成2年特許願第203802号 2、発明の名称 ソフトウェアのエラー処理の方法 3、補正をする者 事件との関係 出 願 人 4、代 理 人 5、補正命令の日付 平Ifj、2年10月30日
Claims (8)
- (1)同一のデータ処理機能のセットを実行する複数の
プロセッサ部分を備えるデータ処理システムにおけるエ
ラー回復方法において、 故障機能のうちの1つの実行の間に、データ処理システ
ム内のエラーを検出し、 エラーが検出された処理部分の位置を突き止め、 エラーが検出されたプロセッサ部分が、普通にデータ処
理機能を実行することができないことを示している決定
的なエラーであるかどうかを判断し、 もし決定的なエラーが検出されれば、エラーが検出され
たプロセッサ部分を回避するためにデータ経路を再構築
し、 そしてもしエラーが決定的なエラーでなければ、エラー
が検出された時に実行されていたデータ処理機能を再試
行するという、前記データ処理機能を実行することなく
、データ処理システムにより実行される段階を備えるこ
とを特徴とする方法。 - (2)請求項(1)記載の方法において、処理部分はそ
れぞれ、別々のデータ経路を通じて異なる周辺部分に結
合されており、前記処理部分それぞれのためのデータ経
路は、所望の働きを行っている間、ほぼ同一の時間にほ
ぼ同一の情報を伝送するための2つの平行な経路を含ん
でおり、そして、 エラーを検出する段階は、 各々のデータ経路の2つの平行経路が異なるデータを持
っているのかどうかを判断する、二次段階を備えている
方法。 - (3)請求項(2)記載の方法において、検出されたエ
ラーが決定的なエラーであるのかどうかを判断する段階
は、 前記エラーが検出された時に、どのタイプのデータ処理
命令が実行されていたかを判断する二次段階を含む方法
。 - (4)請求項(1)記載の方法においてさらに、もし、
故障データ処理命令の処理の間にエラーが検出されなけ
れば、プロセッサ部分のうち、予め選択された状態にリ
セットする段階を備える方法。 - (5)請求項(4)記載の方法において、リセット段階
は、 処理部分のうちの予め選択された1つを、故障データ処
理機能の実行の前に存在した初めの状態にリセットする
、二次段階を備える方法。 - (6)請求項(1)記載の方法において、データ処理命
令を終えるのに失敗した後、デフォルト機能を実行する
段階をさらに含む方法。 - (7)請求項(6)記載の方法において、故障データ処
理機能に、デフォルト機能を実行させることを引き起こ
させる段階は、 故障データ処理機能が読出し機能の時に、予め定められ
たデータのパターンに再び戻す、二次段階を含む方法。 - (8)請求項(6)記載の方法において、故障データ処
理機能に、デフォルト機能を実行させることを引き起こ
させる段階は、 故障データ処理機能が書き込み機能の時に、機能の実行
を避ける、二次段階を含む方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US388041 | 1989-08-01 | ||
US07/388,041 US5153881A (en) | 1989-08-01 | 1989-08-01 | Method of handling errors in software |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03182939A true JPH03182939A (ja) | 1991-08-08 |
Family
ID=23532398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2203802A Pending JPH03182939A (ja) | 1989-08-01 | 1990-07-31 | ソフトウェアのエラー処理の方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5153881A (ja) |
EP (1) | EP0414379A3 (ja) |
JP (1) | JPH03182939A (ja) |
CA (1) | CA2022209A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0644195A (ja) * | 1992-03-30 | 1994-02-18 | Internatl Business Mach Corp <Ibm> | 結合式データ処理システム用の方法および装置 |
JPH0756742A (ja) * | 1993-08-19 | 1995-03-03 | Nec Corp | コンピュータシステムおよびそのシステム縮退運転実現方法 |
US9253046B2 (en) | 1998-09-10 | 2016-02-02 | International Business Machines Corporation | Controlling the state of duplexing of coupling facility structures |
US11422877B2 (en) | 2019-07-26 | 2022-08-23 | Fujitsu Limited | Information processing apparatus, method, and non-transitory computer-readable storage medium for storing control program of information processing apparatus |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0476195A1 (en) * | 1990-09-19 | 1992-03-25 | International Business Machines Corporation | Initial program load for computer workstation |
US5297119A (en) * | 1990-11-30 | 1994-03-22 | Casio Computer Co., Ltd. | Data storage apparatus |
US5313625A (en) * | 1991-07-30 | 1994-05-17 | Honeywell Inc. | Fault recoverable computer system |
US5325520A (en) * | 1992-01-03 | 1994-06-28 | Amdahl Corporation | Invoking hardware recovery actions via action latches |
US5390324A (en) * | 1992-10-02 | 1995-02-14 | Compaq Computer Corporation | Computer failure recovery and alert system |
US5640530A (en) * | 1992-12-17 | 1997-06-17 | International Business Machines Corporation | Use of configuration registers to control access to multiple caches and nonvolatile stores |
JPH06188909A (ja) * | 1992-12-18 | 1994-07-08 | Fujitsu Ltd | 異常パケット処理方式 |
US5809525A (en) * | 1993-09-17 | 1998-09-15 | International Business Machines Corporation | Multi-level computer cache system providing plural cache controllers associated with memory address ranges and having cache directories |
US5566298A (en) * | 1994-03-01 | 1996-10-15 | Intel Corporation | Method for state recovery during assist and restart in a decoder having an alias mechanism |
US5539895A (en) * | 1994-05-12 | 1996-07-23 | International Business Machines Corporation | Hierarchical computer cache system |
US5630048A (en) * | 1994-05-19 | 1997-05-13 | La Joie; Leslie T. | Diagnostic system for run-time monitoring of computer operations |
US5594862A (en) * | 1994-07-20 | 1997-01-14 | Emc Corporation | XOR controller for a storage subsystem |
US5594861A (en) * | 1995-08-18 | 1997-01-14 | Telefonaktiebolaget L M Ericsson | Method and apparatus for handling processing errors in telecommunications exchanges |
US5815571A (en) * | 1996-10-28 | 1998-09-29 | Finley; Phillip Scott | Computer system with secured data paths and method of protection |
US5946498A (en) * | 1996-11-12 | 1999-08-31 | International Business Machines Corporation | Delivery of client remote procedure calls to a server via a request queue utilizing priority and time-out |
US6018805A (en) * | 1997-12-15 | 2000-01-25 | Recipio | Transparent recovery of distributed-objects using intelligent proxies |
US6052758A (en) * | 1997-12-22 | 2000-04-18 | International Business Machines Corporation | Interface error detection and isolation in a direct access storage device DASD system |
JP3687373B2 (ja) * | 1998-12-04 | 2005-08-24 | 株式会社日立製作所 | 高信頼分散システム |
US7096358B2 (en) * | 1998-05-07 | 2006-08-22 | Maz Technologies, Inc. | Encrypting file system |
US6173351B1 (en) * | 1998-06-15 | 2001-01-09 | Sun Microsystems, Inc. | Multi-processor system bridge |
US6223304B1 (en) * | 1998-06-18 | 2001-04-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Synchronization of processors in a fault tolerant multi-processor system |
US6859866B2 (en) * | 2001-10-01 | 2005-02-22 | International Business Machines Corporation | Synchronizing processing of commands invoked against duplexed coupling facility structures |
US6687791B2 (en) * | 2002-01-07 | 2004-02-03 | Sun Microsystems, Inc. | Shared cache for data integrity operations |
US6931576B2 (en) * | 2002-01-07 | 2005-08-16 | Sun Microsystems, Inc. | Data integrity device providing heightened error protection in a data processing system |
US7698539B1 (en) | 2003-07-16 | 2010-04-13 | Banning John P | System and method of instruction modification |
EP1577773A1 (de) * | 2004-03-15 | 2005-09-21 | Siemens Aktiengesellschaft | Multiprozessorsystem mit einem Diagnoseprozessor zur Sicherung des Systemzustands und Verfahren zum Betrieb eines Multiprozessorsystems |
US7228457B2 (en) * | 2004-03-16 | 2007-06-05 | Arm Limited | Performing diagnostic operations upon a data processing apparatus with power down support |
DE102004047363A1 (de) * | 2004-09-29 | 2006-03-30 | Siemens Ag | Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung |
US8230396B2 (en) * | 2006-01-06 | 2012-07-24 | International Business Machines Corporation | Apparatus and method to debug a software program |
US8806476B2 (en) * | 2006-03-14 | 2014-08-12 | International Business Machines Corporation | Implementing a software installation process |
US20080162966A1 (en) * | 2006-12-28 | 2008-07-03 | Motorola, Inc. | System and method for handling access to memory modules |
EP2204736A4 (en) * | 2007-09-25 | 2012-01-11 | Fujitsu Ltd | INFORMATION PROCESSOR AND CONTROL PROCEDURE |
US20090186344A1 (en) * | 2008-01-23 | 2009-07-23 | Caliper Life Sciences, Inc. | Devices and methods for detecting and quantitating nucleic acids using size separation of amplicons |
US8392762B2 (en) | 2008-02-04 | 2013-03-05 | Honeywell International Inc. | System and method for detection and prevention of flash corruption |
US9785901B2 (en) * | 2010-10-04 | 2017-10-10 | International Business Machines Corporation | Business process development and run time tool |
US20140188829A1 (en) * | 2012-12-27 | 2014-07-03 | Narayan Ranganathan | Technologies for providing deferred error records to an error handler |
US9519532B2 (en) * | 2014-01-20 | 2016-12-13 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Handling system interrupts with long-running recovery actions |
GB2506825B (en) * | 2014-02-12 | 2014-10-15 | Ultrasoc Technologies Ltd | Functional testing of an integrated circuit chip |
US10922203B1 (en) * | 2018-09-21 | 2021-02-16 | Nvidia Corporation | Fault injection architecture for resilient GPU computing |
US11099975B2 (en) | 2019-01-24 | 2021-08-24 | International Business Machines Corporation | Test space analysis across multiple combinatoric models |
US11010282B2 (en) | 2019-01-24 | 2021-05-18 | International Business Machines Corporation | Fault detection and localization using combinatorial test design techniques while adhering to architectural restrictions |
US11263116B2 (en) | 2019-01-24 | 2022-03-01 | International Business Machines Corporation | Champion test case generation |
US11106567B2 (en) | 2019-01-24 | 2021-08-31 | International Business Machines Corporation | Combinatoric set completion through unique test case generation |
US11010285B2 (en) | 2019-01-24 | 2021-05-18 | International Business Machines Corporation | Fault detection and localization to generate failing test cases using combinatorial test design techniques |
US11232020B2 (en) | 2019-06-13 | 2022-01-25 | International Business Machines Corporation | Fault detection using breakpoint value-based fingerprints of failing regression test cases |
US10963366B2 (en) | 2019-06-13 | 2021-03-30 | International Business Machines Corporation | Regression test fingerprints based on breakpoint values |
US10970195B2 (en) | 2019-06-13 | 2021-04-06 | International Business Machines Corporation | Reduction of test infrastructure |
US11422924B2 (en) | 2019-06-13 | 2022-08-23 | International Business Machines Corporation | Customizable test set selection using code flow trees |
US11036624B2 (en) | 2019-06-13 | 2021-06-15 | International Business Machines Corporation | Self healing software utilizing regression test fingerprints |
US10990510B2 (en) | 2019-06-13 | 2021-04-27 | International Business Machines Corporation | Associating attribute seeds of regression test cases with breakpoint value-based fingerprints |
US10970197B2 (en) | 2019-06-13 | 2021-04-06 | International Business Machines Corporation | Breakpoint value-based version control |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AT285689B (de) * | 1968-03-29 | 1970-11-10 | Siemens Ag | Zentralgesteuerte Vermittlungsanlage der Fernmelde-, insbesondere Fernsprechtechnik |
US3665173A (en) * | 1968-09-03 | 1972-05-23 | Ibm | Triple modular redundancy/sparing |
US3864670A (en) * | 1970-09-30 | 1975-02-04 | Yokogawa Electric Works Ltd | Dual computer system with signal exchange system |
SE347826B (ja) * | 1970-11-20 | 1972-08-14 | Ericsson Telefon Ab L M | |
FR2182259A5 (ja) * | 1972-04-24 | 1973-12-07 | Cii | |
US3898621A (en) * | 1973-04-06 | 1975-08-05 | Gte Automatic Electric Lab Inc | Data processor system diagnostic arrangement |
US4099241A (en) * | 1973-10-30 | 1978-07-04 | Telefonaktiebolaget L M Ericsson | Apparatus for facilitating a cooperation between an executive computer and a reserve computer |
US4031372A (en) * | 1973-11-06 | 1977-06-21 | Westinghouse Electric Corporation | System for manually or automatically transferring control between computers without power generation disturbance in an electric power plant or steam turbine operated by a multiple computer control system |
CH623669A5 (ja) * | 1973-11-14 | 1981-06-15 | Agie Ag Ind Elektronik | |
US3873819A (en) * | 1973-12-10 | 1975-03-25 | Honeywell Inf Systems | Apparatus and method for fault-condition signal processing |
IT1014277B (it) * | 1974-06-03 | 1977-04-20 | Cselt Centro Studi Lab Telecom | Sistema di controllo di elaboratori di processo operanti in parallelo |
US4313160A (en) * | 1976-08-17 | 1982-01-26 | Computer Automation, Inc. | Distributed input/output controller system |
US4228496A (en) * | 1976-09-07 | 1980-10-14 | Tandem Computers Incorporated | Multiprocessor system |
US4099234A (en) * | 1976-11-15 | 1978-07-04 | Honeywell Information Systems Inc. | Input/output processing system utilizing locked processors |
SE397013B (sv) * | 1976-12-17 | 1977-10-10 | Ellemtel Utvecklings Ab | Sett och anordning for att overfora datainformationer till tva parallellt arbetande datamaskindelar |
US4358823A (en) * | 1977-03-25 | 1982-11-09 | Trw, Inc. | Double redundant processor |
US4141066A (en) * | 1977-09-13 | 1979-02-20 | Honeywell Inc. | Process control system with backup process controller |
US4153318A (en) * | 1977-10-17 | 1979-05-08 | Square D Company | Bus stab for panelboard assembly |
JPS6016664B2 (ja) * | 1977-10-28 | 1985-04-26 | 豊田工機株式会社 | デ−タ転送装置 |
US4403282A (en) * | 1978-01-23 | 1983-09-06 | Data General Corporation | Data processing system using a high speed data channel for providing direct memory access for block data transfers |
DE2813383A1 (de) * | 1978-03-28 | 1979-10-11 | Siemens Ag | Datensende/-empfangs-einrichtung mit parallel/seriell- und seriell/parallel- zeichen-umsetzung, insbesondere zum datenaustausch zwischen kommunizierenden datenverarbeitungsanlagen |
GB2019622B (en) * | 1978-04-14 | 1982-04-07 | Lucas Industries Ltd | Digital computing apparatus |
US4200226A (en) * | 1978-07-12 | 1980-04-29 | Euteco S.P.A. | Parallel multiprocessing system for an industrial plant |
US4270168A (en) * | 1978-08-31 | 1981-05-26 | United Technologies Corporation | Selective disablement in fail-operational, fail-safe multi-computer control system |
US4268902A (en) * | 1978-10-23 | 1981-05-19 | International Business Machines Corporation | Maintenance interface for a service processor-central processing unit computer system |
US4495571A (en) * | 1979-01-31 | 1985-01-22 | Honeywell Information Systems Inc. | Data processing system having synchronous bus wait/retry cycle |
US4245344A (en) * | 1979-04-02 | 1981-01-13 | Rockwell International Corporation | Processing system with dual buses |
US4253147A (en) * | 1979-04-09 | 1981-02-24 | Rockwell International Corporation | Memory unit with pipelined cycle of operations |
US4377843A (en) * | 1979-04-19 | 1983-03-22 | Wescom Switching, Inc. | Data distribution interface |
DE2920994A1 (de) * | 1979-05-23 | 1980-11-27 | Siemens Ag | Datensende/-empfangseinrichtung mit parallel/seriell- und seriell/parallel- zeichenumsetzung, insbesondere zum datenaustausch zwischen kommunizierenden datenverarbeitungsanlagen |
DE2926292A1 (de) * | 1979-06-29 | 1981-01-08 | Harnischfeger Gmbh | Insbesondere mobiler teleskopauslegerkran |
US4428044A (en) * | 1979-09-20 | 1984-01-24 | Bell Telephone Laboratories, Incorporated | Peripheral unit controller |
DE3003291C2 (de) * | 1980-01-30 | 1983-02-24 | Siemens AG, 1000 Berlin und 8000 München | Zweikanalige Datenverarbeitungsanordnung für Eisenbahnsicherungszwecke |
US4356546A (en) * | 1980-02-05 | 1982-10-26 | The Bendix Corporation | Fault-tolerant multi-computer system |
FR2477809B1 (fr) * | 1980-03-10 | 1987-08-21 | Jeumont Schneider | Systeme de transmission rapide de messages entre calculateurs |
US4365293A (en) * | 1980-03-28 | 1982-12-21 | Pitney Bowes Inc. | Serial communications bus for remote terminals |
US4377000A (en) * | 1980-05-05 | 1983-03-15 | Westinghouse Electric Corp. | Automatic fault detection and recovery system which provides stability and continuity of operation in an industrial multiprocessor control |
US4371754A (en) * | 1980-11-19 | 1983-02-01 | Rockwell International Corporation | Automatic fault recovery system for a multiple processor telecommunications switching control |
US4418343A (en) * | 1981-02-19 | 1983-11-29 | Honeywell Information Systems Inc. | CRT Refresh memory system |
US4424565A (en) * | 1981-06-22 | 1984-01-03 | Bell Telephone Laboratories, Incorporated | Channel interface circuit with high speed data message header field translation and direct memory access |
US4453215A (en) * | 1981-10-01 | 1984-06-05 | Stratus Computer, Inc. | Central processing apparatus for fault-tolerant computing |
US4597084A (en) * | 1981-10-01 | 1986-06-24 | Stratus Computer, Inc. | Computer memory apparatus |
JPS5892025A (ja) * | 1981-11-26 | 1983-06-01 | Hitachi Ltd | デ−タ処理方式 |
IT1151351B (it) * | 1982-01-19 | 1986-12-17 | Italtel Spa | Disposizione circuitale atta a realizzare lo scambio di dati tra una coppia di elaboratori operanti secondo il principio master-slave |
US4541094A (en) * | 1983-03-21 | 1985-09-10 | Sequoia Systems, Inc. | Self-checking computer circuitry |
US4602327A (en) * | 1983-07-28 | 1986-07-22 | Motorola, Inc. | Bus master capable of relinquishing bus on request and retrying bus cycle |
DE3328405A1 (de) * | 1983-08-05 | 1985-02-21 | Siemens AG, 1000 Berlin und 8000 München | Steuerorgane eines fehlertoleranten mehrrechnersystems |
US4610013A (en) * | 1983-11-08 | 1986-09-02 | Avco Corporation | Remote multiplexer terminal with redundant central processor units |
US4569017A (en) * | 1983-12-22 | 1986-02-04 | Gte Automatic Electric Incorporated | Duplex central processing unit synchronization circuit |
EP0148297B1 (en) * | 1984-01-09 | 1993-12-15 | Hitachi, Ltd. | Synchronous decentralized processing system |
US4589066A (en) * | 1984-05-31 | 1986-05-13 | General Electric Company | Fault tolerant, frame synchronization for multiple processor systems |
US4751702A (en) * | 1986-02-10 | 1988-06-14 | International Business Machines Corporation | Improving availability of a restartable staged storage data base system that uses logging facilities |
EP0256267B1 (en) * | 1986-08-12 | 1994-03-02 | Hitachi, Ltd. | Microprocessor for retrying data transfer |
FR2602891B1 (fr) * | 1986-08-18 | 1990-12-07 | Nec Corp | Systeme de correction d'erreur d'un systeme a multiprocesseurs pour corriger une erreur dans un processeur en mettant le processeur en condition de controle apres achevement du redemarrage du microprogramme a partir d'un point de reprise |
JPS6375963A (ja) * | 1986-09-19 | 1988-04-06 | Hitachi Ltd | システム回復方式 |
JPH0690682B2 (ja) * | 1987-02-28 | 1994-11-14 | 日本電気株式会社 | マルチプロセツサシステムの障害処理方式 |
EP0306211A3 (en) * | 1987-09-04 | 1990-09-26 | Digital Equipment Corporation | Synchronized twin computer system |
US4916704A (en) * | 1987-09-04 | 1990-04-10 | Digital Equipment Corporation | Interface of non-fault tolerant components to fault tolerant system |
-
1989
- 1989-08-01 US US07/388,041 patent/US5153881A/en not_active Expired - Lifetime
-
1990
- 1990-07-20 EP EP19900308004 patent/EP0414379A3/en not_active Withdrawn
- 1990-07-30 CA CA002022209A patent/CA2022209A1/en not_active Abandoned
- 1990-07-31 JP JP2203802A patent/JPH03182939A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0644195A (ja) * | 1992-03-30 | 1994-02-18 | Internatl Business Mach Corp <Ibm> | 結合式データ処理システム用の方法および装置 |
JPH0756742A (ja) * | 1993-08-19 | 1995-03-03 | Nec Corp | コンピュータシステムおよびそのシステム縮退運転実現方法 |
US9253046B2 (en) | 1998-09-10 | 2016-02-02 | International Business Machines Corporation | Controlling the state of duplexing of coupling facility structures |
US9565013B2 (en) | 1998-09-10 | 2017-02-07 | International Business Machines Corporation | Controlling the state of duplexing of coupling facility structures |
US9860315B2 (en) | 1998-09-10 | 2018-01-02 | International Business Machines Corporation | Controlling the state of duplexing of coupling facility structures |
US10491675B2 (en) | 2001-10-01 | 2019-11-26 | International Business Machines Corporation | Controlling the state of duplexing of coupling facility structures |
US11422877B2 (en) | 2019-07-26 | 2022-08-23 | Fujitsu Limited | Information processing apparatus, method, and non-transitory computer-readable storage medium for storing control program of information processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
US5153881A (en) | 1992-10-06 |
EP0414379A3 (en) | 1993-02-24 |
EP0414379A2 (en) | 1991-02-27 |
CA2022209A1 (en) | 1991-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03182939A (ja) | ソフトウェアのエラー処理の方法 | |
US5291494A (en) | Method of handling errors in software | |
US5251227A (en) | Targeted resets in a data processor including a trace memory to store transactions | |
US5068851A (en) | Apparatus and method for documenting faults in computing modules | |
US5185877A (en) | Protocol for transfer of DMA data | |
US5068780A (en) | Method and apparatus for controlling initiation of bootstrap loading of an operating system in a computer system having first and second discrete computing zones | |
US5255367A (en) | Fault tolerant, synchronized twin computer system with error checking of I/O communication | |
US4916704A (en) | Interface of non-fault tolerant components to fault tolerant system | |
US4907228A (en) | Dual-rail processor with error checking at single rail interfaces | |
US5249187A (en) | Dual rail processors with error checking on I/O reads | |
US5065312A (en) | Method of converting unique data to system data | |
EP0306244B1 (en) | Fault tolerant computer system with fault isolation | |
US5163138A (en) | Protocol for read write transfers via switching logic by transmitting and retransmitting an address | |
US5048022A (en) | Memory device with transfer of ECC signals on time division multiplexed bidirectional lines | |
EP0411805B1 (en) | Bulk memory transfer during resync | |
JP3069585B2 (ja) | データ処理装置における目標指定リセット法 | |
JPH03184155A (ja) | 非存在メモリエラー処理の方法 |