JPS61500875A

JPS61500875A - 補助記憶装置へのアクセス喪失に耐える処理システム

Info

Publication number: JPS61500875A
Application number: JP59503933A
Authority: JP
Inventors: ハンセン，ロバート　カール; リチヤードソン，カルヴイン　ジエローム; シユミツト，デイヴイツド　アンソニー
Original assignee: アメリカンテレフオンアンドテレグラフカムパニ−
Priority date: 1983-12-27
Filing date: 1984-10-18
Publication date: 1986-05-01
Also published as: KR850700171A; EP0167540B1; KR920003497B1; JPH0420493B2; EP0167540A1; DE3477282D1; US4608688A; WO1985002926A1; CA1274913A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】補助記憶装置へのアクセス喪失に耐える処理システム且土立！本発明は耐冨害処理システム、より詳細には複製補助記憶装置を含む処理システムに関する。衾匪立！量各種の記憶装置のコスト及び性能の違いから、処理システムは、通常、少なくとも２つのタイプの記憶装置を使用する。１つのタイプは主記憶装置として使用される実質的にリアルタイムにて読出し及び書込みを行なうことができる高速直接アクセス記憶装置である。主記憶装置はコアあるいは半導体記憶装置として実現されるが、１ビツト当たりの記憶空間は割高となる。従って、通常、主記憶装置は処理システムに直ちに必要とされる情報を十分に保持できる程度のものに設計される。処理システムによって使用される他の多量の情報は補助記憶装置と呼ばれる別のタイプの記憶装置に保持され、必要に応じて、処理システムによって情報がこの主記憶装置と補助記憶装置との間に伝送される。補助記憶装置は、通常、順次アクセス磁気記憶媒体、例えば、テープあるいはディスクとして実現される０通常、主記憶装置と比較して、補助記憶装置へのアクセスは低速となる。しかし、補助記憶装置は１ビツト当たりの記憶空間が安く、従って、比較的低コストにて大量の記憶能力が提供できる長所を持つ。リアルタイム処理が要求され、一方で、処理能力の喪失に十分に対処できてない処理システム、が多くの用途でみかけられるが、−例として、電話電子交換システムなどもこの部類に属する。このような用途に使用される処理システムは信頼性が高く、障害が発生した場合にもこれにはえられることが要求される。信頼性が高く、障害に対して強い処理システムを達成する方法の１つとして、システム内の機能装置を、補助記憶装置及びそれらの内容を含めて、二重にしたり、あるいはさらに多くのこれらの複製を提供する方法がある。二重にされた補助記憶装置は活動／待機状態に構成されるが、活動状態の記憶装置はオフラインとされ処理システムによって要求される記憶及び検索タスクを遂行し、一方、他方の記憶装置はこの活動状態の記憶装置と同じ内容を持つように常時更新され、現在活動状態の装置に故、隙が発生したとき活動状態の装置として動作できるように待機される。こうして、システムは、通常、片方の補助記憶装置が障害を起こしたときでも処理能力を失なうことな（これに耐えることができるようにされる。合でも、そのシステムの処理能力が完全に喪失されるわけではない、システムに格納される情報の幾つかを主記憶装置に格納し、この情報を使用することによってシステムの幾っがのタスクの遂行を継続することが可能である。つまり、処理システムの全ての複製補助記憶装置が故障した場合、処理システムが少なくともそのシステムの能力を維持できるか否かは、これら補助記憶装置以外のソースから使用できる情報がシステム内にどの程度残るかに依存することとなる０例えば、ある種の電子交換システムにおいては、システムの動作に欠くことのできない情報、例えば、最もリアルタイムを必要とする必須システム／アプリケーション　プログラム／パラメータはシステムの主記憶装置内のプログラム格納部分に永久的に格納され、一方、その他の情報、例えば、そのシステムによって処理される特定の顧客に関するデータなどは、重複ディスク上に格納され、必要なときにのみ主記憶装置の呼格納部分に運ばれる０重複ディスクの両方が障害を起こした場合でも、システムは必須プログラムへのアクセスは可能であり、従って、システムの呼格納部分に必要なデータが格納されたデータを持つ、あるいは格納されたデータを必要としない、タスクの遂行する能力、あるいは顧客に対するサービス能力を維持することが可能となる。現代的な電子交換システムを含む大多数の処理システムは上述の交換システムのような構造を持たない、つまり、こ弗ら多くの処理システムは前述の交換システムとこれらが主記憶装置内に全ての必須プログラム及びシステム　パラメータを永久的に格納し　パない点で異なる。これら処理システムは、通常、システムの殆どのパラメータ、プログラム及びその他の情報を補助記憶装置、例えば、ディスク記憶装置内に格納し、必要に応じてこれら情報を主記憶装置と補助記憶装置の間で伝送する。これには多くの理由があるが、これら理由には、これら処理システムはプロセス及びその他の情報を主記憶装置と補助記憶装置との間で効率的に伝送する能力を持つ高速のオペレーティング　システムを持ち、従って、主記憶装置には処理システムによって実行される全てのプログラムを格納せずこれに格納しておくことが好ましいと考えられるものだけを格納することにより主記憶装置の容量を小さくする方が経済的であること、及び、処理システムを主記憶装置に格納できる制約された数及びサイズのプログラムのみを実行するように制限しない方が多様性及び汎用性の点でえ得策であることなどを挙げることができる。しかし、これらシステムがそのシステムに欠くことのできない情報を補助記憶装置と主記憶装置の間で伝送することによって動作するため、これらシステムは補助記憶装置へのアクセスが得られなくなるとこれら情報にアクセスできなくなる。補助記憶装置へのアクセスの喪失はいつ起っても不思議でなく、さらにこれによってアクセスできなくなるｔｒｉがそれなしではシステムが処理活動を継続できないような性格のものであるときは、処理システムは補助記憶装置の障害によってその処理能力を失なうこととなる。犬」廊と」ｈ本発明は先行技術による処理システムのこれら及びその他の短所を解決することを目的とする０本発明による処理システムは情報、例えば、動作に必要なプログラム及びデータなどを格納するための複製の補助記憶装置、例えば、二重ディスクを持ち、補助記憶装置に障害が発生した場合でも必須の処理能力を失なうことはない、複製の補助記憶装置の１つを除く全て、あるいは少なくとも１つが障害を起こすと、補助記憶装置から提供される指定の情報がシステムの主記憶装置内に格納及びロックされ、この結果、全ての補助記憶装置が使用できなくなった場合でもこれらｔ！報がシステムによって使用できるようにされる。複製の補助記憶装置の全てが使用できなくなると、システムの動作は主記憶装置内にロックされた指定の情報の使用に制限される。複製の補助記憶装置の少なくとも１つが回復すると、動作の制限は解除されるが、指定の情報は主記憶装置内にロックされたままとなる。他方のｒｉ製禎助記憶装置も回復すると、指定の情報が主記憶装置からアンロックされ、これら情報の主記憶装置からの移動が可能となる。好ましくは、この補助記憶装置に加えて複製の機能装置をもつ本発明による処理システムは複製の少なくとも幾つかの記憶装置が故障すると、故はした？ｉＲ助記憶装置を回復するためにこの複製の機能装置を使用して自体を再構成する。　゛好ましくは、本発明による処理システムは、複製ネ覇助記憶装置の全てが障害を起した場合でも少なくとも一部のシステム能力を保持する。これは、システムの動作に必須のシステム及びアプリケーション　プログラムを含む必須情報をそれらの複製補助記憶装置内に格納するようなシステムにも通用できる。従って、本発明は、通常、それらのプログラムを補助記憶装置内に格納し、動作の際に１．必要に応じてこれら情報をオペレーティング　システムの制御下で主記憶装置内にあるいはこれから補助記憶袋］こ移動させるような現代的な処理システムに特に通ずる０本発明はこれら処理システムにこれまで実現ができなかった程度の耐障害能力を提供する。本発明のこれら及びその他の長所及び特徴は図面を参照しての本発明の一例として実施！３様の以下の説明からより明白となるものである。 ■工二呈星呈森ユ第１図は本発明を具現する一例としての処理システムのブロック図を示し；第２図は第１図の処理システムの構成状態の状態図を示し；第３図は第１図の処理システムのディスパンチャ制御テーブルを示し；第４図は第１図の処理システムのディスクに関する動作モードの図を示し；第５図は第４図の動作モード図のシンプレックス　プロ・ツクへの装置除去遷移の論理流れ図を示し；第６図は第４図の動作モード図のシンプレ７クス　ブロックからの装置回復遷移の論理流れ図を示し；第７図は第４図の動作モード図のソフト　スイッチ　ブロックの論理流れ図を示し；第８図は第４図の動作モード図のハード　スイッチ　ブロックの論理流れ図を示し；第９図は第４図の動作モード図のフル　ディスク　リング　モード　ブロックへの遷移の論理流れ図を示し；そして第１０図は第４図の動作モード図の手動ブート　プロ、りの論理流れ図を示す。ｋ■星段所Ａ、＞五±ム１底第１図には本発明を組み込んだ処理システムの一例としての実施！３様がブロック図にて示される。ここにはジエアル　プロセッサ　システム１００が示されるが、これには好ましくは、エイティ　アンド　ティ　ウェスタン　エレクトリック（ＡＴ＆ＴＷｅｓｔｅｒｎ　Ｅｌｅｃｔｒｉｃ）によって製作される３ＢＴ１１２００／ＤＭＥＲＴコンビエータ　システムが使用される。このシステムは３Ｂ２０Ｄプロセツサによって実行されるＤＭＥＲＴオペレーティングシステムを含む、３Ｂ２０Ｄ／ＤＭＥＲＴコンピュータ　システムは、ベル　システム　テクニカル　ジャーナル（ＢｅｌｌＳｙｓｔｅｍ　Ｔｅｃｈｎｉｃａｌ　Ｊｏｕｒｎａｌ　）　、Ｖｏｌ、　６４、寛１、パート２．１９８３年１月号において説明されている。この３Ｂ２０Ｄ／Ｄ　Ｍ　Ｅ　ＲＴコンビニータ　システムの構造及び動作の詳細に関しては上記の雑誌を参照を勧めるものとし、ここでは、本発明が機能する環境を説明する目的でこれに関して簡単に説明するにとどめる。シュアル　プロセッサ　システム１００は対のプロセッサ１０１及び１０２を含む、プロセッサ１０１及び１０２は川ね同一である。従来のモードの動作においては、プロセッサ１０１か１０２の片方は活動状態にあり、そのプロセッサによる実行を割り当てられたプロセス、あるいはタスクを実行するためにオペレーティング　システムの制御下で動作し、一方、プロセッサ１０１か１０２の他方はアイドル状態にあり、待機し、プロセッサ１０１か１０２の活動状態のプロセンサが故障によってサービスができなくなったときこれにかわって動作する。プロセスは、用の機能をもつこともある。プロセスは、通常、専用のデータスペース及びレジスタ値、並びに場合によっては他のプロセスと共用されるセントのコード、つまり、プログラム命令を持つ。プロセッサ１０１の主プログラムの実行、制御及びデータ処理機能は中央処理装置（ＣＰＵ）１１２によりて遂行される。ＣＰＵＩ　１２はマイクロプログラム　マシーンであり、殆どのプロセフす機能はＣＰＵ１１２の内部のマイクロプログラム記憶装置（図示なし）内に格納されたマイクロ命令の実行によって遂行される。マイクロ命令のシーケンスの実行はプログラム命令によって指令される動作を実現する。ＣＰＵ１１２は、通常、ＣＰｔＪが要求する情報、例えば、データ及びプログラム命令をプロセッサ１０１の主記憶袋ｒＬ（ＭＡＳ）１１４と呼ばれる主オンライン記憶装置から得る。アプリケーション　プロセス及びオペレーティング　システム　プロセスの両方の選択された部分が主記憶装置１１４内に格納される。動作速度を向上させるために、ＣＰＵ１１２にはオプション的にキャッシュ１１３を提供することもできるが、このキャッシュはＣＰＵ１１２と主記憶装置１１４との間の情報伝送用の高速バッファとして機能する。主記憶装置と装置、例えば、ＣＰＵＩ　１２及びキャッシュ１１３との間の通信は主記憶装置バス（ＭＳＢ）１１６を通じて行なわれ、主記憶装Ｗ、１１４へのアクセスを調停する主記憶装置更新装置（ＭＡ　Ｓ　Ｕ）によりてｔｉＩＩ＠される。対の直接メモリ　アクセス　コントローラ（ＤＭＡＣ）１１０及び１１１も主記憶装置バス１１６に接続し、主記憶装置１１４とプロセッサ１０１の周辺装置゛の間の直接情報伝送装置として機能する。プロセフす１０１と１０２は実質的に同一であり、プロセッサ１０２も同様にＭＳＢ１２６によって相互接続される対のＤＭＡＣｌ２Ｏ及び１２１、ＣＰＵ１２２、キヤツシユ１２３、ＭＡＳ１２４、及びＭＡＳＵ１２５を含む。プロセッサ１０１及び１０２の周辺装置には各種の装置が含まれるが、これらの殆どは処理システム１００が使用される用途によって決定される９周辺装置は第１図に示されるように、大容量記憶装置、例えば、ディスク　メモリ　サブシステム１３９及び１４９並びにテープ　サブシステム１５９および１６９を含む。サブシステム１３９及び１５９からなる周辺装置の第１のグループはシュアル　ボート　コントローラ（ＤＰＣ）１３０にＷｊ続される。シュアル　ボート　コントローラ１３００片方の通信ボートは通信チャネル１３３に接続され、一方、コントローラ１３０の他方のボートはチャネル１３４に接続される。コントローラ１３０はサブシステム１３９及び１５９をチャネル１３３−１３４を通じて受信される命令に従ってチャネル１３３−１３４のどちらかに選択的にインタフェースする。チャネル１３３はＤＭＡコントローラ１１１に接続し、チャネル１３４はＤＭＡコントローラ１２１に接続し、こうして、プロセッサ１０１および１０２の両方にサブシステム１３９および１５９へのアクセスを特坦’６１−５００８７５　（４）提供する。ＤＭＡＣｌ　１１及び１２１はまた従来の方法にてＭＡＳ　１１４及び１２４とサブシステム１３９及び１５９の間の情報の伝送を制御する。類似の方法にて、サブシステム１４９及び１６９からなる周辺装置の第２のグループはシュアル　ボート　コントローラ（ＤＰＣ）１４０によって対のチャネル１４３及び１４４０片方に選択的にインクフェースされる。チャネル１４３はＤＭＡＣ１１０に接続し、一方、チャネル１４４はＤＭＡＣ１２０に接続し、こうして、プロセッサ１０１及び１０２の両方にサブシステム１４９および１６９へのアクセスを提供する。ＤＭＡＣ１１０及び１２０はまた従来の方法にてＭＡＳ　Ｌ　１４及び１２４とサブシステム１４９及び１６９の間の情報の伝送を制御する。記憶装置、並びに包括される記憶装置の動作を制御し、周知の方法にて通信チャネルへの通信のためにこれらをインタフェースするコントローラを含む、ディスク　メモリ　サブシステム１３９では、この記憶装置は複数の可動ヘンド　ディスク（ＭＨＤ）１３１−１３２からなる。これらディスクはディスク　ファイルコントローラ（ＤＦＣ）１３５によって制御される。同様に、ディスク　メモリ　サブシステム１４９はＤＦＣ１４５によって制御される複数のＭＨＤ１４１− １４２からなる。テープ　サブシステム１５９では、情報はテープ１５１上に格納されるが、これはテープ　ファイル　コントローラ゛（ＴＦＣ）１５５によって制御される。同様に、テープ　メモリ　サブシステム１６９はテープ１６１及びＴＦＣｌ　６５を含む。サブシステム１３９のＭＨＤ１３１−１３２の幾つかあるいは全てはサブシステム１４９のＭＨＤ１４１−１４２の幾つかあるいは全てと重複する。２つのＭＨＤは同一の情報のコピーを格納する場合、互いに重複する。互いに重複する２つのＭＨＤはディスクの重複ペアと呼ばれる０通常、システム内では、任意の時間においてＭ　ＨＤの重複ペアの片方のＭＨＤのみが必要となる０重複ペアの他方のＭＨＤはスペアとして機能する０重複ペアのＭ’ＨＤは、通常、同一の情報を持つように常に更新され、重複ペアの他方へのアクセスが失なわれた場合でも、システム１００はこれに格納された情報を得ることができ、従って、システム１００の処理能力に影響を受けることがない。テープ１５１及び１６１の幾らかあるいは全ても同様に互いに重複する。しかし、テープ１５１及び１６１は手操作にてサブシステム１５９及び１６９の間を移動できるため、通常、テープ１５１及び１６１を互いに重複させる必要はない。重複ディスク　ペアと同様に、プロセッサ１０１と１０２のどちらでもシステム　タスクを同じように遂行でき、これらのどちらかが故障した場合、他方がこれにかわることができるようにするため、主記憶装置１１４及び１２４の内容も互いに重複させることが必要である。このためプロセフす１０１及び１０２の主記憶装置更新装置１１５及び１２５は更新バス１０３として示される通信バスによって相互接続される。更新バス１０３は以下の方法にて主記憶装置更新装置１１５及び１２５によって制御及び使用される。主記憶装置更新装置１１５は主記憶装置１１４へのアクタスの調停を行なうのに加えて、主記憶装置１１４へのアクセスのタイプを監視する。必要とされるアクセスが主記憶装置１１４の内容を変更するようなタイプ、例えば、書込みあるいは消去動作であり・そしてプロセッサ１０２がサービス中であるとき番ヨ、主記憶装置更新装置１１５はバス１２６に接続される他の全ての装置によって行なわれるように、主記憶装置バス１２６に対スルアクセスの要求を主記憶装置更新装置１２５に発行する。主記憶装置更新装置１２５はこの要求をバス１２６への他の全てのアクセス要求と同様に処理する。バス１２６が空き使用できる状態になると、主記憶装置更新装置１２５はアクセス許可信号を主記憶装置更新装置１１５に送信し、更新バス１０３の一端を主記憶装置バス１２６にｔｉ続する。許可信号に応答して、主記憶装置更新装置１１５は更新バス　′１０３の他端を主記憶装置バス１１６に接続し、最初に要求された主記憶装置１１４へのアクセスを実現する。こうして、現在、バス１１６と１２６が接続されているためバス１１６及び１２６の両方を通じて主記憶装置１１４＆び１２４の両方へのアクセスが行なわれ、装置１１４及び１２４の内容が同じように変更される。アクセスが完了すると、主記憶装置更新装置１１５及び１２５は両方とも更新バス１０３を対応する主記憶装置バス１１６及び１２６から切断する。主記憶装置１１４及び１２４の両方に対して必要なプロセッサ１０２による主記憶装置へのアクセスの場合は、上述の主記憶装置更新装置１１５及び１２５の動作が単に反対にとなるのみである。また、ＣＰＵ１１２とＣＰＵＩ　２２の間には直接通信チャネルが提供される。これは保守チャネル１０４として示され、これはプロセッサ１０１あるいは１０２のオンラインで活動状態のプロセッサからオンラインで非活動状懸のプロセッサを診断するための制御及び通信ハスとして機能する。保守チャネル１０４はまた障害回復プログラムに対する低レベル保守制御を提供し、プロセンサの切り替えが動作に影響を与えることなく遂行できるように。する、これに加えて、プロセッサ１０．１及び１０２のどちらかによって保守チャネル１０４を通じて他の保守制御を行ない、他方のプロセンサの初期化シーケンスを開始したり、あるいは他方のプロセッサによるプログラムの実行を停止することができる。保守チ島ネル１０４はまた外部ソースからマイクロ命令を受信して、これを実行することもできる。保守チャネル１０４はさらにプロセッサ　バスを制御し、プロセッサ制御信号を発行することができる。こうして、保守チャネル１０４はプロセンサを殆ど完全に制御することができ、マイクロ制御が不在の場合でもこれを使用してマシーンを診断することができる。信頼性の目的から保守チャネル１０４も同様に重複されチャネル１０４ａと１０４ｂからなる。シュアル　プロセッサ　システム１００の上述のハードウェア構成の助けをかり、シュアル　プロセッサ　システム１００のオペレーティング　システムはシステム１００を複数の構成の選択された１つにて動作させ、またオペレータによってシステム１００に与えられる命令に応答して、あるいは内部的に検出された状況、例えば、障害の発生に応答してシステム１００を再構成する。動作においては、プロセッサ１０１か１０２の片方のみが動作状態となり全てのシステム　タスクを遂行し、一方、他方のプロセッサ上ン活動状態のプロセッサは呼び出されたら活動状態のプロセッサとしてかわりに動作できるように待機状態にある０通常、活動状態のプロセフすに故障が発生すると、これは非活動プロセッサとなり、サーζ゛スから外され（ＯＯ’Ｓ）　、これはもはや動作プロセッサとしてかわることができないものとしてみなされる。このような故障が発生すると、Ｘったプロセッサが故障したプロセッサを診断し、故障したプロセッサを待機状態にもどすことを試みる。システム１００内には、主記憶装置１１４及び１２４並びに大容量記憶サブシステム１３９．１４９．１５９及び１６９内にその重複コピーが）各納されてはいるが、これには１つのバージョンのオペレーティング　システムのみが存在する。この１つのバージョンのオペレーティング　システムが２つのプロセッサ１０１及び１０２の活動状態にある方のプロセッサ上で実行される。動作において、システムは第２図に示される４つの構成状態の１つをとる。状態１においては、プロセッサ１０１か１０２の片方が活動体感（ａ）にあり、他方が待機状ｓ　（ＳＴＢＹ）にある。状態２においては、この２つのプロセッサの動作状態が切り替えられている。状！３３においては、プロセッサ１０１あるいは１０２のいずれかが動作状態にあり、他方がサービスから外された状５３（００Ｓ）にある、状！３４においてはミこの２つのプロセッサの動作状態が切り替えられている。動作状況、例えば、故障の発生に応答して、あるいはシステム管理者からの命令に応答して、システム１００はこれら各種の構成状態の間の遷移を行なう。システム１００の構成状態の遷移は太き（２つの範ちゅう、つまり、ハード遷移及びソフト遷移に分類できる。ハード遷移はシステム１００のある程度の初期化を必要とし、従って、システム１００上で実行されるプロセスに影響を与えることなく（トランスバレントに）初期化を行なうことができないような遷移である。システムの初期化は故はが発生した場合に通常の処理能力を回復するために行なわれる一連の動作である。ハード遷移は、通宝、活動状態のプロセッサにそのプロセッサが動作を継続することができず、従って、サービスから外す必要が生じる程度の故障が発生した場合に起こる。ハード遷移はハード遷移を起こす程ではないがソフト遷移による回復が失敗した場合にその故障の回復をハード遷移によって試みるような場合にも起こる。第２図において、ハード遷移は状：３１から状！３４への遷移、状態２から状態３への遷移あるいは状態３と状！：ｉ４の間の遷移であり、“ハード　スイッチ１と呼ばれる。ハード遷移は、現在の活動状態のプロセッサ上のシステム動作が停止され、他方のプロセッサに切り替えられるため“ストツプ　アンド　スイッチ”とも呼ばれる。ソフト遷移はシステムの再初期化を必要としない、あるいはシステム１００上で実行されているアブリケーシッン　プロセスに影響を与えることなく（トランスバレントに）行なうことが可能な程度の初期化を必要とする遷移である。これらは、通常、ハード遷移を起さない程度のハードウェアの故障の発生、ソフトウェアの故障の発生、及びシステム１００に与えられた外部的に生成された命令の結果として起こる。このようなソフト遷移には、例えば、状！３１と状！３２の間の遷移があるが、これは“ソフト　スイッチ”と呼ばれる。もう１つのソフト遷移、つまり、状！３３から状！３１への遷移あるいは状態４から状！ｉ３２への遷移は１プロセッサ回復２遷移と呼ばれるが、これは外部的に生成された命令に応答して、あるいはシステム１００の診断及び回復プログラムによるサービスから外されたプロセッサが持回プロセッサとして使用でき、現在活動状態のプロセッサが故はしたときに活動状態となることができるとの判定に応答して起こる。そして、状態１から状態３へのソフト遷移、あるいは状態２から状態４へのソフト遷移は、“プロセッサ除去“遷移と呼ばれる。これは動作状態のプロセッサのハード遷移を起こすようなハードウェア障害の発生によっても起こされるが、この例ではこのような障害によって影響を受けるようなプロセスが待機プロセッサによって実行されていないためここではこの遷移は起こらない、プロセッサは手操作による命令によってもサービスから外すことができる。システム１００は、障害検出及び回復ソフトウェア及びハードウェアに基づいて、障害が検出された場合、これに応答して自動的に再構成を行なう、システム１００の障害検出及び回復機構は前述のベル　システム　テクニカル　ジャーナル（ＢＳＴＵ）において説明されているため、詳細に関してはこれを参照すること　゛を勧めることにし、ここでは、システム１００内で本発明が機能する環境を説明する目的でこれら機構について簡単に説明することにとどめる。システム１００内に含まれる隙害挟出回路及びプログラムは高度なものである。障害検出ハードウェア及びソフトウェア技法にはローカル　マツチング回路、全てのバスに対するパリティ検査、主記憶装置に対するハミング　エラー修正、補助記憶装置に対する巡回冗長コード、及び制御装置及び周辺装置などに対する各種のハードウェア及びソフトウェア衛生タイマ等が広く採用されている。これに加えて、障害検出機構自体の障害を検出するために診断ルーチンが使用される。また衛生検査ルーチンが周辺サブシステムの０！康状態を確認するために使用される。さらに、システム統合ルーチンによって個々の検出器によっては発見できないキャッチ障害がチェックされる。任意の障害検出器がエラー状態を検出すると、影響を受けたプロセッサ１０１あるいは１０２内に割込みが登録される。最も重大な障害に起因する割込み（よ動作を自動的に影響を受けないプロセッサに切り替えるハードウェア　シーケンス、つまり、ハード遷移を起こさせる。障害の程度が軽い場合はマイクロコードへの割込みが発生し、これはソフトウェアにシステムを回復するように命令する。障害回復プログラムはハードウェア及びソフトウェアの障害検出及び回復を制御する。ハードウェア障害回復プログラムはハードウェア割込みを受信し、その後に行なわれる回復手順を制御する。特定のエラーが所定の頻度いき値を越えることが検出されると、システム構成の健康状態への遷移が行なわれる。ソフトウェア障害回復プログラムはハードウェア障害回復プログラムと非常に類似する構造を持つ、ソフトウェアの個々の主要単位はそれと関連する障害検出機構、例えば、防衛チェフク及び監査、エラーいき値等、並びにエラー回復機構、例えば、障害復帰、データ修正監査、及び再初期化技術等を持つ、これに加えてミあるプロセスが無限実行ループに入ったり、システム資源、例えば、メツセージ　バッファを不当に消費したりしないよう、あるいはメツセージの定義される範囲の外側にアクセスしたり、そのプロセスに許可されてない命令を実行したりしないように、プロセスの実行が正しく行なわれているか監視する０個々のプロセスは回復を行なうための再初期化及び回復制御を行なう。回復動作の結果としてシステム１００からのハードウェアあるいはソフトウェアが除去されると、診断及び監査プログラムがその除去の原因となったハードウェア障害及びソフトウェア障害を分析するために自動的に送られる。プートストラップ及び初期化ルーチンはマイクロプロセスを初期化し、これによって通常の処理能力を達成するための制御を行なうマイクロコード及びソフトウェア実現動作の基本セットを提供する。システムの初期化は障害状態のような状況に遭遇した場合に通常の処理動作を回復するために実行されるマイクロコード化された動作のシーケンスからなる。システムの初期化はソフトウェアないしソフトウェアの回復機構によって自動的に、あるいは手操作による要求によって開始される。初期化シーケンスはそのソースと無関係にプロセッサ内の保守リセット信号と呼ばれるハードウェア信号内に共通の開始点を持つ、保守リセット信号の受信によって実行される初期化シーケンスは保守リセットｍｌ（ＭＲＦ）と呼ばれる。保守リセット信号に起因する割込みはシステム１００内の最も優先度の高いマイクロコード割込みである。ＭＲＦは呼び出しがあったプロセッサの初期化を開始する。システム１００は回復を達成するために段階的な初期化動作に従う、不必要に処理能力が失われるのを避けるために障害の規模にみあった初期化動作がとられる。あるレベルの初期化動作において回復を達成できない場合、それが最大レベルに達してないかぎり回復が達成されるまで、初期化動作のレベルが次のレベルに上げられる。第１図に再び戻り、メモリ　スキームはハードウェア装置と処理システム１００のオペレーティング　システムとの協同で動作される。メモリ　スキームの該当する機能は以下の通りである：ケージ　サブ−システム１５９及び１６９は処理システム１００に対する基本記憶装置である。サブシステム１５９及び１６９は処理システム１００内の記憶装置の第３のレベルを提供する。これらは、システム１００が動作するのに必要なオペレーティングシステム　ソフトウェア、基本アプリケーション　プログラム、並びにシステム及びアプリケーション　パラメータを含む基本プログラム、データ、制御、及びその他の情報を格納する。システム１００が初めて初期化される場合、例えば、最初にシステムにパワーが投入されると、サブシステム１５９及び１６９のテープ１５１及び１６１の内容がシステム１００のディスク　メモリサブシステム１３９及び１４９からなる第２の記憶装置に転送、つまり、コピー及び格納される。これらは動作中、システム１００によってここからアクセスされる。この転送は手操作ブートストランプと呼ばれる周知の方法によって行なわれる。全てのＭ）ＩＤ１３１−１３２及び１４１−１４２がシステム１００によって使用されるこれら情報を格納するが、ディスクの１つの重複ペアのみ、この例では、ＭＨＤ１３２及び１４２のみがシステム１００の動作に必須の情報を釡む、このためＭＨＤ１３２及び１４２はディスクのシステム必須重複ベアと呼ばれる。これらが含む情報にはテープ　サブシステム１５９及び１６９がら転送されるシステム清ｉｉ！：っまり、オペレーティング　システム　プロセス、システムの初期化に必要な情報、診断プログラム、並びにシステム管理者とインタフェースするためのプロセスなどが含まれる。システム必須重複ベア、ＭＨＤ　１３２及び１４２以外のＭＨＤはシステム１００のアプリケーションに関、する情報、例えば、アプリケーション　プロセス、システム１００の顧客会計情報、並びに幾つかのデータ　ベースを含む、これら情報の多くもテープサブシステム１５９及び１６９がらこれらディスクに転送される。システム１００にとって、システムに掛けられたアプリケーションを遂行するのに欠くことのできないアプリケージクン　プロセスは必須アプリケーション　プロセスと呼ばれる。この必須ア・プリケーシッン　プロセスを格納するＭＨＤ、つまり、この例では、ＭＨＤ　１３１及び１４１はディスクのアプリケージ目ン必須重復ベアと呼ばれるディスクの重複ベアを構成する。必須ＭＨＤと非必須ＭＨＤの差はシステム１００は動作を非必須ＭＨＤ上に格納された情報にアクセスするたことなく継続する能力を持つが、必須ＭＨＤ上に格納された必須情報にアクセスすることなく継続することはできない点である。システム動作にとってどのような情報が必須であるかは、シス例えば、全てのプロセスのプロセス制御情報ブロック内にそのプロセスが必須であるか否かを指定する欄を含める。ＭＨＤ　ｌ　３２及び１４２のシステム必須重複ベアは、テープサブシステム１５９及び１６９からこれに転送されたシステムプロセスを格納するのに加えて、これらプロセス及びシステム１００内に存在する他のプロセスのイメージを格納する。このプロセスのイメージはＭＨＤ　１３２及び１４２のスワツプ　スペースと呼ばれる領域内に格納される。プロセスのイメージはそのプロセスの実行あるいは実行可能なバージョンである。１つのイメージはそれ自体の関連するデータ及びその他の情報とともにそのプロセス　プログラム　コードのコピーを含む、プロセスのイメージはそのプロセスへの呼に応答して生成され、このイメージはその実行が完了すると破壊される。プロセス　イメージの生成及び破壊はオペレーティング　システムに依存する。プロセス　イメージはそれ自体独立したプロセスである。従って、プロセスとそのイメージには差異はなく、プロセス　イメージは、通常、単にプロセスと呼ばれる。システム１００によって始めて実行される最初のアプリケージタン　プロセスの１つはａ・須アプリケーション　プロセスへの呼を行ない、それによってＭＨＤ　１３２及び１４２のシステム必須１？１ペアのスワップ領域内に必須アプリケーション　プロセスのイメージを生成するプロセスである。システム１００はこうして、ＭＨＤ　１３２及び１４２を通じて必須アプリケージタン　プロセスへのアクセスを行なう、この結果、システム１００はＭＨＤ１３１及び１４１のアプリケーション必須重複ペアに７クセスすることなく所期のアプリケージ３ンを遂行することができる。ＭＨＤ１３２及び１４２は、従って、システム１００の動作に本当に必須の唯一のディスクであり、従って、ディスク　メモリサブシステム１３９及び１４９の以降の説明はＭＨＤ１３２及び１４２について集中的に述べる。ＭＡＳ　Ｉ　Ｌ　４及び１２４はシステム１００の主記憶装置を構成する。ＭＡＳ１１４及び１２４の記憶容量はディスク　メモリサブシステム１３９及び１４９の記憶容量と比較して小さい。ＭＡＳ　１１４及び１２４は、従って、ある任意の時間において、ディスク　メモリ　サブシステム１３９及び１４９の内容の一部のみを含む、ある情報がＣＰＵ１１２あるいは１２４、あるいはその他のシステム１００の装置によって必要となったときにその情報のブロックがディスク　メモリ　サブシステム１３９及び１４９からＭＡＳ１１’４及び１２４に転送、あるいはスワップされる０例えば、プロセスあるいはその一部がこれを実行するためにＭＡＳ１１４及び１２４゛内にスワップされる。ＭＡＳ　１１４あるいは１２４内にスワップされる情報のための領域を確保するためにＭＡＳ　ｌ　ｌ　４及び１２４内に駐在し現在使用されてない他の情報のブロックはＭＡＳ１１４及び１２４がらディスク　メモリ　サブシステム１３９及び１４９にスワップアウトされる。より風体的には、ＭＡＳ１’１４及び１２４からスワップ　アウトされたプロセスはＭＨＤ１３２＆び１４２のスワップ領域内に格納される。ＭＡＳ１１４及び１２４内への、あるいはこれから外への情報のスワップ動作はメモリ　マネージャと呼ばれるオペレーティング　システムの部分によって制御される。このプロセスは当技術において周知である。プロセッサ１０１及び１０２とディスク　メモリ　サブシステム１３９及び１４９の間の情報の伝送はディスク　ドライバと呼ばれるオペレーティング　システム　プロセスによって始動及び管理される。ディスク　ドライバは要求に応答− でディスク　メモリ　サブシステム１３９及び１４９からの情報の検索及びこれへの情報の格納を行なう。ディスク　ドライバは情報の伝送を遂行する装置を選択し、必要なりＭＡＣに情報の伝送を遂行するように命令し、そして要求された伝送を遂行する選択されたＤＭＡＣ＆び周辺装置からの応答信号あるいはエラー報告などのメツセージに応答する。ディスク　ドライバは伝送を正常に完了させるか、あるいはその伝送が完結されない理由をオペレーティング　システムに通知する任務を持つ、ディスク　ドライバも当技術において周知である。もう１つのプロセス　マネージャと呼ばれるオペレーティングシステム　プロセスはシステム１００内のプロセスの生成、破壊及び追跡を行なう、プロセス　マネージャも同様に当技術において周知である。プロセス　マネージャは第３図に示されるディスバッチャ制御テーブル（ＤＣＴ）３００の助けを得てプロセスの追跡を行なう。ＤＣＴ３００はＭＡＳＩＬ４及び１２４内に駐在する。これはシステム１００内に存在する個々のプロセスに対する項目３０１を含む、プロセス　マネージャはそれが新たなプロセスを生成したときＤＣＴ３００に項目を加える。プロセス　マネージャはそれがプロセスを破壊したときＤＣＴ３００からそのプロセスの項目を削除する０個々のプロセス項目はオペレーティング　システムによってそのプロセスを正しく管理するのに必要とされるそのプロセスに関する情報を含む、この情報は複数の欄の中に格納される識別子（ＩＤ）Ｆ！１３０２はそのプロセスを同定する。状！３欄３０３は、例えば、そのプロセスがＭＡＳ　１１４及び１２４に駐在するか否か、あるいはそれが中断されているか、つまり、ＭＨＤ１３２及び１４２上にスワップ　アウトされているか否かなどを示す、タイプ掴３０４はそのプロセスが必須として指定さロセス　マネージャによって、例えば、そのプロセスのプロセス制御ブロックから得られる。ロック３０５はそのプロセスが主メモリからスワップ　アウトできるか否かを示す、ＤＣＴ３００内には、第３図に示されていないその他の欄を含めることもできる。Ｂ、之五之人飲詐ここに説明されるシステム１００は、ＭＨＤ１２３及び１４２の両方のシステム必須重複ペアへのアクセスが失われた後でも、能力は落ちるが、動作を継続することが可能である。ＭＨＤ１３２及び１４２のシステム必須ペアのＭＨＤの片方あるいは両方が失われたときシステム１００がいかに対処するかまず第４図を参照して説明する。第４図にはシステム１００が経過する動作のモード、及びシステム１００がシステム必須ディスクが失われたとき最大限の初期化能力を保持するために試みるこれらモードにおける動作が示される。システム１００は、ブロック４００にて示される二重モードの動作から開始するものと仮定するが、ブロック４００の状態においては、必須ＭＨＤ　１３２及び１４２の重複ペアの両方ともがプロセッサ１０１及び１０２の活動状態の方のプロセッサによってアクセスすることが可能である。二重モードの動作は通常の勤咋のモードであるが、ただし、これは第２図の構成状ｊ３１　＋　４のいずれにも対応する。プロセッサ１０１が活動状態のプロセッサであるものと仮定すると（第２図の状！３１あるいは３）、情報の伝送が必要に応じてサブシステム１３９及び１４９とＭＡＳ　ｌ　１４の間で起こる。非活動状態のプロセッサ１０２が待機状態にある　−とく第２図の状態１）、ＭＡＳ１１４と１２４の内容が一致することを維持するためにＭＡＳ　１２４がＭＡＳｔＪ１１５及び１２５によってＭＡＳ１１４と同一の情報にて更新される。プロセッサ１０２がサービスから外されているときは（第２図の状態３）、ＭＡＳ　１２４は更新を中断する。第４図のブロック４００の二重モードにおいては、ディスクドライバはメモリ　マネージャの要求、つまり、ディスク格納情報をその情報がＭ）（Ｄの重複ペア内に格納されているときは交互にサブシステム１３９及びサブシステム１４９から、そしてその情報が非重複ＭＨ’Ｄ内に格納されているときはサブシステム１３９あるいは１４９の該当する方から検索しこれを主メモリ内に伝送することに対する要求に満足に答える。１３ｊＭＨＤからの情報の検索の場合はサブシステム１３９及び１４９の両方を交互に動作させることによって、ディスク　ドライバはサブシステム１３９及び１４９の両方が継続されて正しく動作されているか否かの最新情報を得る。ディスク　ドライバはメモリ　マネージャによって指定される情報をＭＡＳ　ｌ　１４からスワップ　アウトし、サブシステム１３９及び１４９の両方のスワップ領域に格納する。ディスク　ドライバはこうして、ＭＨＤ１３２及び１４２の両方の情報内容を同一とどめる。プロセッサ１０１はＭＨＤへのアクセスに関与する機能装置の連鎖に影響を与えるような幾つかの状態が発生することによってＭＨＤへのアクセスを失なう場合がある０例えば、ＭＨＤ自体が障害を起こす場合もあり、あるいは制御ＤＦＣが障害を起こすこともある。さらに、ディスク　メモリ　サブシステムをプロセッサに接続するチャネルが障害を起こす場合もあり、またアクセスを行なっているＤ　Ｍ　Ａ　Ｃが障害を起こす場合も考えられる。アクセスの失敗には完全な失敗もあり、単にエラー率が許容範囲を越えて異常に高いという場合もある。アクセスはさらに装置のパワーが切られる、あるいはシステム１００から切断されることによりでも失われる。アクセスの失敗の発生について通知する。ディスク　ドライバは示される障害のタイプによってその障害が単に過渡的なものであるか否かを判定するためにアクセスを再試行する。所望のＭＨＤつ部分にこのことを通知する。非−システム必須ＭＨＤである場合は、オペレーティング　システムの構成プロセスが障害による影響を受けた装置あるいは装置群をサービスから外す。第５図にシステム必須ＭＨＤをサービスから外すときにとられるステップが図式的に示される。ブロック５００において、ディスク　ドライバによってシステム必須ＭＨＤへのアクセスが失敗したことを通知されると、構成プロセスは、ブロック５０１に示されるごとく、これが二重モードからの遷移であることを確認するためにシステム必須ＭＨＤ１３２及び１４２の重複ペアの他方がサービスから外されているか否かを判定する。これをｆ！認した後においてはじめて、構成プロセスは、ブロック５０２によって示されるごと＜、障害による影響を受けた装置あるいは装置群をサービスから外す、サービスから外されたＭＨＤはＭＡＳ　１１４及び１２４からスワップ　アウトされる情報によって更新されることを中断される。ブロック５０２において示されるごとく、装置をサービスから外す動作は、システムの装置構成データ　ベース（ＥＣＤ）内に該当する標識をセントすることによって達成される０名前によって示されるごとく、ＥＣＤ　（図示なし）はシステム１００の構成、し、その装置をいかに構成し、装置間にどのような通信及び信号法手続きを使用するを定義する主メモリ駐在データ　ベースである。非−重複ＭＩＤがサービスから外された場合は、ＭＨＤが失われたことは単にＥＣＤ内においてのみ確認され、システム１００は動作を継続し、単にＭＩＤからの情報をめるプロセスに対してＭＨＤがアクセスできない旨を通知する。そして、非−システム必須重複ＭＨＤ、例えば、Ｍ）（Ｄ　１３１がサービスから外された場合は、ディスク　ドライバはこれ代わりに重複ペアの他方のＭＨＤ　１４１にアクセスするように命令を行ない、システムの動作は変化なくｍ続される。つまり、第４図のブロック４０Ｇの二重モードにて動作が１！続される。しかし、システム必須ＭＨＤ。例えば、ＭＨＤ１３２がこれをプロセッサ１０１に連結する他の装置の１つがサービスから外された結果としてサービスから外され場合は状況が異なる。つまり、システム必須ディスク、例えば、ＭＨＤ　１３２へのアクセスが失われると、システム１００は第４図においてブロック４０１にて示されるシンプレフクス　モードの動作に移る。システム１００が二重モードからブロック４０１のシンプレ７事態の通知を受ける。プロセス　マネージャも同様にこの事態の通知を受けるが、プロセス　マネージャのその後の動作が第５図のブロック５０３−５０５に示される。ブロック５０３に示されるごとく、プロセス　マネージャはこの通知に応答してＤＣＴ３００　（第３図参照）を検索し、タイプｆｉｉ３０４によってそれらが必須プロセスであることが示される全てのプロセスを調べる。プロセス　マネージャは全てのメモリ駐在必須プロセスのロックＭＡＳ　Ｉ　Ｌ　４からスワップ　アウトされるのを防止し、こうして、ブロック５０４によって示されるようにこれらプロセスをＭ　Ａ　５１１４内にロックする。必須プロセスの状Ｆ３３０３がそのプロセスが現在ＭＡＳ１１４に駐在しておらず、ディスク上にスワツプアウトされていることを示すときは、プロセス　マネージャは、ブロック５０５によって示されるごとく、そのプロセスがＭＡＳ１１４内に戻されこれに格納されることを要求する。この要求に応答して、ディスク　ドライバは他方のシステム必須ＭＨＤ、この例ではＭＨＤ１４２を通常の方法でアクセスできるように゛し、変更し、ブロック５０５にて示されるように、このプロセスをＭＡＳ１１４内にロックする。システム１００は、その後、第４図のシンプレックス　モードにて、第５図のブロック５０６によって示されるとと（、他方のＭ）ＩＤ１４２を使用して通常の動作を継続する。これは、システム必須ＭＨＤ　１３２＆び１４２の両方へのアクセスが失われた場合でも、必須プロセスがシステム１００にアクセス可能であることを確保する。システム保守要員がプロセッサ１０１がシステム必須ＭＨＤ１３２へのアクセスを不可能にした原因を取り除き、ＭＨＤ１３２へのアクセス能力を回復すると、システム管理者はシステ　′ム１００にディスク回復命令を与える。活動状態のプロセッサ、この例では、プロセッサ１０１は、この命令を学信し、これに第６図に示されるように応答する。より詳細には、回復の検出がディスク　ドライバに通知され、ディスク　ドライバはこの命令に応答して、ブロック６００−６０１によって示されるようにＭＨＤ１３２へのアクセスが本当に回復されたか検証する目的でテストを行なう、テスト　アクセスが失敗した場合は、システム管理者に対してシンブレックス状態が＄１！ＨＥされる旨のメツセージを発行する。テスト　アクセスが成功したときは、ディスク　ドライバはＭＨＤ１４２からＭＨＤ１３２をリポビュレーションし、新たにアクセス可能になったＭＨＤ１３２の内容を使用できる状態に回復する。ブロック６０２によって示されるごとく、このリポビュレーションは、動作状態でアクセス可能な状態にとどまるＭＨＤ１４２の内容をＭＨＤ　ｌ　４２からＭＡＳ　１１４、そしてこれからＭＨＤ　ｌ　３２への情報のＤＭＡ転送を介して回復されたＭＨＤ１３２にコピーすることによって達成される。ディスクのりポピユレーションはＭＨＤ１４２と〜ｆＨＤ１３２が再度互いに一致する内容となり、また両方がＭＡＳ１１４及び１２４の内容と一致する内容を持つことを確保する。ＭＨＤ１３２はこうして。完全に動作できる状態に回復され、ディスク　ドライバはオペレーティング　システムの他の部分にこのことを通知する。両方のディスクへのアクセスが回復されたことを通知されると、構成プロセスは、ブロック６０３に示されるごとく、ＥＣＤ内の該当する標品をＭＨＤ１３２をサービス中であるとマークするために変更する。そして、プロセス　マネージャは、ブロック６０４に示されるごとく、ＤＣＴ３００にアクセスし、ａ・須プロセスのロック欄３０５を１アンロンク”状態にセントし、こうして、ＭＡＳ　Ｌ　１４からのプロセスのスワップを可能にする。システム１００は次に、第４図のブロック４００において再び二重モードに入り、そして、第６図のブロック６０５に示されるごとく、通常の動作を継続する。プロセッサ１０１がＭＨＤの非−システム必須重複ベアの両方のＭＨＤへのアクセスを失った場合は、システム１００は回復動作、例えば、ＭＨＤベアの少なくとも１つへのアクセスを回復することを目上してシステムの）活動をプロセン、す１０１がらプロセッサ１０２に切り替えるなどの動作を行なう、これらＭＨＤの少な（とも１つへのアクセスを回復することに失敗した場合は、システム１００は動作をＨＴｉＨし、単にアクセス不能のＭＨＤからの情報を要求するプロセスに対してこれらＭＨＤがアクセスできないことを通知する。これらディスクがアプリケージシン必須ＭＨＤ　１３１及び１４１である場合は、システムはさらに、ブートストラップを試みてもこれはシステムに無忘味な回復の企てを反復して送る結果となるため、自動ブートストラップが始動されることを阻止する。しかし、これらが必須ディスク１３２及び１４２である場合は、システムＩＱＱは第４図のブロック４０１のシンプレックス　モードにとどまる。システム１００がシンプレックス　モードにある間にプロセッサ１０１による他のシステム必須ＭＨＤ　１４２へのアクセスも失敗する場合もある。このような二重のディスク障害が発生すると、プロセンサ１０１はシステム必須ＭＨＤ１３２及び１４２の両方へのアクセスを失う、アクセスが失われたことを検出すると、ディスク　ドライバはその失敗が単に過渡的な状態であるか否かを判定するためにＭＨＤ１４２へのアクセスを再度法みる。ＭＨＤ１４２が本当にアクセスできないことをｉ認すると、ディスクドライバは再びオペレーティング　システムの構成プロセスにこの状況を通知する。　ｆＩ構成プロセスＭＨＤ　１４２をサービスから外すことができるか否かを判定する。システム必須ＭＨＤ　１３２及び１４２の二重障害が発生しているため、代替ＭＨＤ　１３２もアクセス不能であり、構成プロセスはＭ）ＩＤ１４２をサービスから外すことができないと判定する。この結果システム１００はディスク　リング　モードに入るが、これは、システム１００の動作がシステム必須ディスクの重複ベアのいずれにもアクセスせずに“リンブ状態に１力）れること力）らりンプ　モードと呼ばれる。ただし、システム１００は、この状態でも演算能力は低下するが動作を継続できる。システム１００がディスク　リン１　モードに入っている間に、構成プロセスはシステム１００がシステム必須ＭＨＤ　１３２及び１４２の少なくとも１つへのアクセスを百度回復できるようシステム１００の再構成を試みる。ｔｉ構成プロセス、第４図のプロ７り４０２に示されるように、最初にソフト　スイッチを要求する。ソフト　スイッチは活動状態のプロセッサ１０１から待機プロセンサ１０２にアプリケーション　プロセス及び進行中の入／出力妙作に影響を与えないように（トランスバレントに）処理動作を移す、第７図にソフト　スイッチ　プロセスの論理図が示される。れるごとく、システム１００の構成が活動−待機状態にあるが否かを判定するためにＭＡＳ１１４内のＥＣＤにアクセスする。この状態にない場合は、ＭＡＳ１２４は必ずしもＭＡＳ　１１４と一致するように更新されていない、従って、ソフト　スイッチは遂行することができず、ソフト　スイッチ　プロセスは、ブロック７０２に示されるように構成プロセスに対してエラー　メツセージを発行する。一方、システム１００の構成が活動−待機構成であるときは、ソフト　スイッチ　プロセスは、プロ７り７０３に７０４に示されるように、活動状態のプロセッサ１０１の状態レジスタにアクセスして、その内部プロセッサの状態を判定する。活動プロセッサ１０１の内部プロセッサの状態を判定したら、保守チャネル１０４を使用して、ブロック７０５に示されるように、他方のプロセッサ１０２をその内部プロセッサの状態にセントする。活動プロセッサ１０１は、次に、ブロック７０６に示されるように、保守チャネルに対して他方のプロセッサ１０２を始動するように命令する。他方のプロセッサ１０２が前に活動状態にあったプロセッサ１０１が停止した点からシステムの通常の処理動作を変って遂行し、プロセッサ１０１は、ブロック７０７に示されるように、停止し、待機状態に入る。ソフト　スイッチがプロセッサ１０２をプロセンサ１ｏ１と同一の内部伏憇にするため、プロセッサ１０２はプロセッサ１０１が失敗したのと同一のディスク　アクセスを試みる。これはプロセッサ１０２は、プロセッサ１０１によって使用されたのとは異なるチャネル及び異なるＤＭＡＣを通じて同一のＭＨＤ、この例では、ＭＨＤ１４２にアクセスすることを意味する。このアクセスが成功した場合は、これはソフト　スイッチが他のプロセッサ１０１のアクセスを失敗させる原因となったエラーを除去することに成功したことを意味する。従って、システム１００は第４図のブロック４０１のシンプレックス　モードの動作をとる。このモードにおいて、プロセッサ１０２はＭＨＤ１４２を使用してシステムの通常の処理動作を継続する。第４図において、ソフト　スイッチがプロセフす１０１によるＭＨＤ１４２へのアクセスを失敗させる原因となったエラーを除去することに成功しなかったときは、プロセッサ１０２によって同一のアクセスが試みられた場合、これも失敗する。この失敗に応答して、ディスク　ドライバは他方の必須ＭＨＤ１３２及び関連するＤＦＣＬ　３５がアクセスの可能性も含めて使用できるか否かをチェックする。サービスから外されているとマークされている場合でも、これらがアクセス可能であり、電源が切られてない限り、これらが障害を持たない場合、あるいはこれらの少なくとも片方の回復が行なわれ、これが成功している場合は、使用可能であるとみなされる。ＭＨＤ１３２及びＤＦＣＬ３５が使用可能でないと判定された場合は、構成プロセスがその旨の通知を受け、構成プロセスはこの通知に応答して、システム１００がブロック４０５のフル　ディスク　リング　モードの動作にあることを示す標識をＥＣＤ内にセントする。Ｍ）（Ｄ　１３２及びＤＦＣ，１３５が使用可能であると判定された場合は、システム１００はＭＨＤ１３２を使用して動作できる。しかし、ＭＨＤ１３２はサービスから外されているとマークされているため、これはＭＡＳ　１１４及び１２４からのＭ）ＩＤ１４２と同一の情報によって更新されていないことがわかる。従って、ＭＨＤ１３２を使用する前にＭＡＳ１２４の内容をＭＨＤ　１３２の内容と一致させることが必要である。これを達成するには、ブロック４０３に示されるように、ＭＡＳ　１２４をＭＨＤ　１３２から自動プートする。この自動ブートストラップはＭＡＳ　１２４内に格納されるプロセスのバージロンをＭＨＤ　１３２内に存在するプロセスのコピーと置換することからなる。しかし、プロセスのＥＤＣ及び堡謹アプリケーション　セグメント（ＰＡＳ）はＭＡＳ　１２４内に保管される。ＰＡＳはプロセスに割り当てられたメモリのセグメントであり、通常、プロセスはこの中にそのプロセスの回復に欠くことのできない情報を保管する。自動ブートストラップに続いて、システム１００は、ブロック４０１のシンプレックス　モードの動作をとる。このモードにおいて、プロセフ＋１０２はＭｌ（Ｄ　ｌ　３２を使用して通常のシステム処理動作を継続する。システム１００はこのシンプレックスモードから、第６図との関連で前述した方法にてプロ、り４００の二重モードに復帰することが可能である。一方、ソフト　スイッチが成功しなかった場合は、最初にＭＨＤ　１３２及びＤＦＣ１３５が使用可能であるかをチェックする代わりに、システム１００は後述するフル　ディスク　リングモードに直接に入る。上述したごとく、ソフト　スイッチはシステム１００が活動−待機構成にあるときにのみ可能であり、システム１００が他の構成にあるときは、ソフト　スイッチ　プロセスに呼を送ると、構成プロセスにエラー　メソセージが返信さ−れる。ディスク　ドライバはエラーの通知を受けると、上述の方法にて、他方のシステム必須ＭＨＤ１３２及びＤＦＣ１３５が使用可能であるかチェックする。ＭＨＤ１３２及びその１）ＦＣ１３５が使用可能であると判定された場合は、システム１００はＭＨＤ１３２を使用して動作できる。しかし、上述の理由によって、ブロック４０３によって示されるように、ＭＡＳ１１４をＭ）ＩＩ）１３２から自動的にブートすることが必要である。この自動ブートストラップの後、システム１００はブロック４０１のシンプレ７クス動作に戻る。このモードにおいて、プロセッサ１０１はＭＨＤ１３２を使用して通常のシステム処理動作を継続する。ここでも、システム１００は、第６図と関連して前述した方法に従ってシンプレ７クス　モードから二重モードに復帰することができる。一方、ソフト　スイッチが許されない場合は、システム１００は、最初にＭＨＤ　１３２及びＤＦＣ１３５が使用可能であるかチェックする代わりに、後述する暫定ディスク　リング　モードに入る。ソフト　スイッチが許されず、またＭＨＤ　１３２及びＤＦＣ１３５がチェックされた結果、使用できないと判定された場合は、システム１００は、暫定ディスク　リンズ　モードの動作に入る。ディスク　リング　モードの場合と同様に、暫定ディスク　リング　モードにおいて、システム１００はそれ自体をシステム必須ＭＨＤ１３２及び１４２の少なくとも片方へのアクセスを回復できるように再構成する。暫定ディスク　リング　モードにおいては、システム１００の構成は′８２図の活動７００Ｓ状態となる。これ以外の場合は、第４図のブロック４０２において、ソフトスイッチが許される。従って、システム動作をプロセッサ１０１からプロセッサ１０２に移すために、システム構成プロセスは請求する。このハード　スイッチはシステム１００を第２図の活動／○Ｏ８状態の構成からｏＯ８／活動状態の構成にする。第８図にハード　スイッチ　プロセスが論理図にて示される。第８図のブロック８００において、ハード　スイッチ命令を受信すると、ハード　スイッチ　プロセスはＭＡＳ　１１４内のＥＣＤにアクセスすることによって、ブロック８０１によって示されるごとく、プロセ、す１０２が失敗したとマークされているか否かを判定する。失敗したとマークされている場合は、処理動作をプロセッサ１０２に切り替えすることはできず、ハード　スイッチ　プロセスはブロック８０２に示されるように構成プロセスにエラー　メツセージを発行する。構成プロセスはこれに応答・して、ＥＣＤ内にシステム１（ＩＱがプロ７り４０５のフル　ディスク　リンズ　モードの動作であることを示すＩａ識をセットする。しかし、プロセフす１０２が失敗したとマークされていない場合は、ハード　スイッチ　プロセスは保守チャネル１０４に、ブロック８０３に示されるように、他方のプロセッサ１０２上にＭＲＦを呼び出す、ハード　スイッチ　プロセッサは、次にブロック８０４において示されるように、活動状態のプロセッサ１０１を（亭止する。プロセッサ１０２によって保守リセット信号が受信されると、ブロック８０５において、Ｍ　ＲＦシーケンスがプロセッサ１０２上で実行を開始される。ＭＲＦシーケンスは、ブロック８０６に示されるごとく、呼び出されたプロセッサ１０２を初期化する。ＭＲＦシーケンスも、プロ７り８０７に示されるように、プロセスが実行される前に該当する標ｔΔをセットするなどして全てのプロセスを初期化する。ＭＲＦシーケンスの実行の頂点として、ブロック８０８に示されるようにＭＲＦが呼び出されたプロセッサ１０２によるプロセスの実行が開始される。現在活動状態のプロセッサ１０２上で実行されることにより、ハード　スイッチ　プロセスはＭＡＳ　１２４のＥＣＤに入り、ブロック８０９に示されるごとく、ここに現在のシステム構成、つまり、現在非活動状態のプロセッサ１０１をサービスから外されたものとしてマークする情報を格納する。現在活動状態のプロセッサ１２０は次に、プ続し、プロセスの実行を初期化によって示される点から再開する。通常のシステム処理動作が再開されると、プロセッサＩＱ２はシステム必須ディスク　アクセスを企てる結果となる。ＭＨＤ１３２はまだＥＣＤ内でサービスから外されているとマークされているため、ディスク　アクセスはここでもＭＨＤ１４２に向けて行なわれる。ただし、これはプロセッサ１０１によって使用されたのとは異なるチャネルを通して、また異なるＤ　Ｍ　Ａ　Ｃを使用して行なわれる。アクセスが成功した場合は、これはハード　スイッチが他方のプロセッサ１０１によるアクセスを失敗させる原因となったエラーを除去することに成功したことを示す、システム１００は、従って、１４１ｉＵのブロック４０１のシンプレックスモードの動作を再開する。このモードにおいて、プロセッサ１０２はＭＨＤ１４２を使用して通常のシステム処理動作を継続する。ハード　スイッチがプロセッサ１０１によるＭＨＤ　１４２へのアクセスを失敗させる原因とｔったエラーを除去できなかったときは、プロセッサ１０２によるＭＨＤ１４２へのアクセスの試みも失敗に終わる。構成プロセスはこの失敗を通知されると、これに応答してＥＤＣ内にシステム１００が第４図のブロック４０５前述したごとく、システム１００は、ソフト　スイッチあるいはハード　スイッチがシステム必須ＭＨＤへのアクセスを回復することに失敗した場合、あるいはソフト　スイッチあるいはハード　スイッチが許されない場合にフル　ディスク　リン１　モードの動作に入る。−万、システム１００は重複システム必須ディスクは書が発生した場合は、必ずしもディスク　リン１　モード及び暫定ディスク　リン１　モードを経ることなく、ブロック４０１のシンプレックス　モードから直接にフル　ディスク　リン１　モードに入る。フル　ディスク　リンズ　モードにおいては、プロセッサ１０１あるいは１０２からシンブレ７クス必須ＭＨＤ　１３２あるいは１４２にアクセスすることは不可能、゛あるいは許されない。通常のシステム動作を回復するには黛害の発生した装置を修理し、手操作によるブートストラップを行なうことが必要である。しかし、システム１００は、減速されたレベルの演算能力で動作を継続する。第９図にシステム１００によってフル　ディスク　リンズ　モードに遷移されるステップが論理的に図示される。前述したごとく、プロ、り９００において、フル　ディスク　リン１　モードに入ったことを通知されると、構成プロセスは、ブロック９０１に示されるように、ＥＣ，Ｄ内にフル　ディスク　リンズ　モード１ｍをセットする。これに応答して、ブロック９０２に示されるように、システふ管理者がフル　ディスク　リンズ　モードに入ったことを通知される。同様に、ブロック９０３に示されるようンプ　モードに入っていることを通知されており、このようなメプロセス　マネージャ及びディスク　ドライバもフル　ディスプロセスを終結、つまり破壊する。プロセッサ１０１あるいはブロック９０ａに示されるように、そのプロセスがシステム必須ディスク　アクセス要求し、失敗することを防止するために、シ通知する。装置修理モードの動作に入る。このモードにおいては、システム１００はブロック４０５のフル　ディスク　リン１　モードにて動作するが、これに加えて、システム　サービス要員はシステム１００を呼び出して、必須プロセスの中に含まれるユティリティプロセスを実行して、どのシステム装置が障害を起こしたかの判定、障害の性格の判定、及び修理の効果のチェックを行なうことも片方へのアクセスが可能になると、システムの回復が開始される。システム１００に手操作によるブート命令が与えられ、システム１００が第り図のブロック４０７のディスク回復モードに入れられる。第１０図にディスク　回復モードにおけるシステムの動作が図示される。主メモリ内の非必須プロセスが破壊されており、処理がシステム必須ＭＨＤ　１３２および１４２の更新を行なうことな（継続されたため、主メモリの内容とシステム必須ディスクの内容は互いに一致しない、従って、ディスク回復モードにおいては、システム１００はテープ　サブシステム１５９あるいは１６９から再初期化を行なうことが必要である。テープ　サブム必須ディスク及び主メモリにロードすることが必要である。システム管理者によって手操作ブート命令の一部として、システム定される。この命令に対する応答の一部として、ブロック１００れ、回復されたＭＨＤ１３２にテープ１５１からの情報のコピーが再ロードされ、こうして、ＭＨＤ　１３２が再初期化される０次に、ブロック１００３によって示されるごとく、ＭＡＳ　１１４及び１２４が新たに初期化されたＭＨＤ　１３２からブートストラップされる。全ての情報の新たなコピーがＭＨＤ１３２から主メモリにスワップされる。ＭＡＳ１１４及び１２４内のＥＣＤ及びＰＡＳは保管されない０ＭＡＳ１１４及び１２４のブートストランプの一部として、ＥＣＤ内のフル　ディスク　リン１　モードであることを示す標１へが解除される。これは応答して、システムは第４図のブロック４０１のシンブレ７クス　モードの動作をとる０回復されたＭＨＤ１３２が、第１０図のブロック１００４によって示されるごとく、ＥＣＤ内においてサービス中であるとマークされる。システムは次に、ブロック１００５によって示されるごと（、シンプレックス　モードにて処理動作を継続する。このモードから第６図と関連して既に説明の方法に従ってブロック４００全二重モードに入る。各々のセットを前述の方法にてシステムに処理されることもできる。また、補助メモリ　サブシステムは必ずしもディスク　サブシステムである必要はなく、他のメモリ　サブシステム例えば、ドラム或はテープを使用して実現することもできる。同様に個々の複製された必須補助記憶装置は必ずしも専用チャネル、つまり専用ＤＭＡＣを介してプロセッサに接続する必要はなく、これら記ｔ！！装置Ｏ共通のＤＭＡＣにて接続することも可能である。さらに１本発明を具現する処理システムは必ずしもシュアル処理システムである必要はなく、単一プロセッサ或は多重プロセッサ　システムであってもよい、また１本発明を具現する処理システム内の個々のプロセッサは必ずしも専用の主記憶装置を持つ必要はなく、プロセッサに単一の主記憶装置を共用させることもできる。これら変更及び修正は本発明の精神及び範囲から逸脱することなく、又、本発明によって得られる利益を軽減することなく実現できるものである。従って、これら変更及び修正も以下の請求の範囲に網羅されるものと解釈されるべきである。Ｉｆ（Ｆ、　２ソ７トスイ−７す乙に４んτ５　Ｆｌ６．　（ｐＦＩ６：７　Ｆｌに、ｅ！！んで夕　Ｆｌ６．　ｊ０国際調−Ｆ餠失、＾コＣトロ＝：（：口？−Ｌｒ）「：＝＝；（２１λ：＝Ｓ；−二Ｓ＝メース：３ｉ’ＬＥ？ｃ：（ＴＯ？１τ５龜　加ｒｏｐａａｎ　？ＩＬ：ａｎＥ　Ｃ− ｆｉｃａ　ｉｓ　ｉｒ＋　＝ｏ　ｈ＆７　’−二ムｂＬ＠　！Ｏｒ　ｔ５ａｓ＊ｐａｒｔｉｃｕｌａｒｓ　ｙｈｉｃ？、　ａｒｍ　ｅ＊：＊Ｌｙ　ｇｉｖａｎ　？口ｒ　Ｑ＊　ｐ＊ｑｏ＊ａ　ｏ！Ｌｎ？ｏｒｍａセｉｏｒ、。

Claims

【特許請求の範囲】

１．各々が処理システムによって使用される指定の情報を含む情報の複製を格納するための複数の補助記憶装置、該情報の選択された部分を格納するための主記憶装置、及び該情報の部分を該主記憶装置と該補助記憶装置の間で伝送するための装置を含む処理システムにおける。該主記憶装置と該複数の補助記憶装置の間の該情報の伝送に障害が発生した場合に少なくとも幾つかのシステム処理能力が失われるのを保護する方法であって、該方法が：該主記憶装置と少なくとも１つを除く該複数の補助記憶装置との間の該情報の伝送機能に障害が発生したことを検出するステップ；該検出に応答して指定の全ての情報を該主記世装置に格約するステップ；及び該指定の情報が該主記憶装置から伝送されるのを停止するステップを含む；これによって該主記憶装置と該複数の補助記憶装置の間の情報の伝送機能に障害が発生したときに該指定された情報が該処理システムによって使用できるように該主記憶装置内にとどまることが確保されることを特徴とする方法。
２．請求の範囲第１項に記載の方法において、該指定の全ての情報を該主記憶装置に格納する該ステップが：該主記憶装置に格約されていない指定の情報を該少なくとも１つの補助記憶装置から該主記憶装置に伝送するステップを含むことを特徴とする方法。
３．請求の範囲第１項に記載の方法において、更に故主記憶装置と該少なくとも２個の補助記憶装置との間の情報伝送機能が回復されたことを検出するステップ；及び該検出に応答して該指定の情報を該主記憶装置から伝送できるようにするステップが含まれることを特徴とする方法。
４．請求の範囲第１項に記載の方法において、更に該主記憶装置と全ての該補助記憶装置の間の情報伝送機能が失われたことを検出するステップ；及び該検出に応答してシステムの動作を指定された情報の使用だけに制限するステップが含まれることを特徴とする方法。
５．請求の範囲第４項に記載の方法において、更に該主記憶装置と少なくとも１つの補助記憶装置の間の情報伝送機能が回復されたことを検出するステップ；及び該検出に応答してシステム動作の制限を解除し、一方、該指定の情報が該主記憶装置から伝送されるのを防止するステップが含まれることを特徴とする方法。
６．請求の範囲第５項に記載の方法において、更に故主記憶装置と少なくとも２つの該補助記憶装置の間の情報伝送機能が回復されたことを検出するステップ；及び該検出に応答して該指定の情報を該主記憶装置から伝送でさるようにするステップが含まれることを特徴とする方法。
７．ディスク記憶装置へのアクセスの喪失に耐えられる処理システムにおいて、該システムが：各々が該処理システムによって使用されるシステム動作に必須であると指定されるプロセスを含むプロセスを格約するのに使用される１対のディスク記憶装置；選択されたプロセスを格納するのに使用される主記憶装置；該主記憶装置と該ディスク記憶装置の間でプロセスを伝送するための伝送装置；該伝送装置と協力して該主記憶装置とディスク記憶装置の間のプロセスの伝送機能の喪失を検出するための装置；選択されたプロセスをそれらが該主記憶装置から伝送されないように該主記憶装置内にロックするための装置；及び該伝送機能喪失検出装置に応等して、該主記世装置と１つの該ディスク記憶装置との間のプロセス伝送機能の喪失が検出されたとき、該伝送装置に該主記憶装置に格納されていない指定プロセスを該主記憶装置内に伝送させ、また該ロック装置に指定プロセスを該主記憶装置内にロックさせる制御装置を含み、これによって該主記世装置畳と該両方のディスク記憶装置との間のプロセス伝送機能が喪失されたときでも該指定プロセスが故主記憶装置内にとどめられ該処理システムが処理を継続できるようにされることを特徴とする処理システム。
８．請求の範囲第７項に記載の処理システムにおいて、更に該主記憶装置と１つのディスク記憶装置との間のプロセス伝送機能が回復されたことを検出するための装置が含まれ；そして該制御装置がさらに該伝送機能回復検出装置に応答して、該主記憶装置と該両方のディスク記憶装置との間のプロセス伝送機能の回復が検出されたとさ、ロック装置に該主記憶装置内の該指定プロセスが該主記憶装置から伝送できるようにロックを解除させる制御装置を含むことを特徴とする処理システム。
９．請求の範囲第８項に記載の処理システムにおいて、更に該制御装置が該回復検出装置に応答して、該主記憶装置と該両方のディスク記憶装置との間のプロセス伝送機能の回復が検出されたとき、該伝送装置に該ディスク記憶装置の片方に格納された該プロセスを該ディスク記憶装置の他方にコピーさせる装置を含むことを特徴とする処理システム。