JPS61502223A

JPS61502223A - 再構成可能なデュアル・プロセッサ・システム

Info

Publication number: JPS61502223A
Application number: JP60502170A
Authority: JP
Inventors: ビシヨツプ，トーマス　パトリツク; ブタヴイラ，ジヨナス; フイツチ，デイヴイツド　ジヨン; ハンセン，ロバート　カール; シユミツト，デイヴイツド　アンソニー; サーラツト，グローヴアー　テイモスイ
Original assignee: エイ　ティ　アンド　ティ　コーポレーション
Priority date: 1984-06-22
Filing date: 1985-05-17
Publication date: 1986-10-02
Anticipated expiration: 2011-11-13
Also published as: CA1232688A; JP2552651B2; DE3583430D1; US4823256A; KR860700302A; WO1986000439A1; EP0185704B1; EP0185704A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】

再構成可能なデュアル・プロセッサ・システム本発明は第１および第２のプロセッサと、第１のプロセッサ中に含まれる第１のメモリと、第２のプロセッサ中に含まれる第２のメモリと、第１および第２のメモリを相互接続する更新バスより成る処理システムに関する。発明の背景従来の処理システムは一般に単一の中央プロセッサの周囲に構成されて来た。中央プロセッサは処理システムの主計算ユニットであった。中央プロセッサはまた一般にシステムの主管理ユニットであり、種々のシステム・ユニットの動作を調整してシステム・タスクを実行させる役割を有していた。中央プロセッサと同様、他のシステム・ユニットもほとんどの場合システムにおいて二重化されていなかった。このようなシステムは、構成ユニットが障害を起した結果として部分的あるいは全面的な動作障害を引き起しやすいという意味で信頼性が高くなかった。詳細に述べると、中央プロセッサの主要な障害によ、り一般に処理システム全体がダウンし、システムは障害が修理されるまで割当てられたタスクを実行出来なくなる。システムの処理能力に対する日毎に強まる要求はしばしば単一の中央プロセッサの計算能力を越えてしまう。この問題に対する解決策の１つとしてこのようなシステムの中央プロセッサに１つまたはそれ以上の補助プロセッサを取り付けることがある。補助プロセッサの機能は計算負荷の１部を中央プロセッサから取り上げ、それによって全体としてのシステムの処理能力をあげることにある。、しかし、一般に取り付けられたプロセッサは中央プロセッサの制御の下にある単なる特殊目的の計算ユニットとして動作する。この取付けられたプロセッサは一般に他のシステム資源を中央プロセッサと共有し、しばしば中央プロセッサを介してのみこれら資源と通信する・よう作られている。即ち中央プロセッサは処理システムに対し管理制御権限を保持していることになる。システムの処理能力は付加的プロセッサを取り付けることにより大幅罠増加する。しかし、殆んどのシステム・ユニットは二重化されておらず、中央プロセッサはその処理システムにおいてキーとなる位置を占めているので、システムの信頼性は改善されたい。詳細に述べると、中央プロセッサにおける障害に対するシステムの感受性は単一のプロセッサ構成と実質的に変らないことになる。他方、通信交換システムの如き処理システムのおる種の応用用途にろってはシステム・ユニットの障害によるサービス断の状態は許容出来ないことがある。このような応用用途′ｌｃ、ｆ）つては高い信頼性を有する処理システムを使用することが要求される。このようなシステムにおける信頼性はシステム・ユニット、特に中央プロセッサを二重化することにより達成される。一般にこのようなシステムにおける二重化された中央プロセッサは各プロセッサが他のプロセッサと並列にすべてのシステム・タスクを実行するロック・ステップ構成で動作するか、るるいは一方のプロセッサがすべてのシステム・タスクを実行し、第２のプロセッサはバックアップとして動作し、１方のプロセッサが障害を起したとき取って替る準備が出来ている待機状態にある活性−待機構成で動作するか、プロセッサが実行するトランスアクションに関する情報を他方のプロセッサに送信し、そればよって１方のプロ・セッサに障害が起ると他方のプロセッサが障害を起したプロセッサの現在の状態を計算してそのトランスアクションをその点から引き受けるチェックポイント構成で動作するようになっている。このようなシステムにあっては、二重化されたプロセッサのいずれもすべてのシステム・タスクを単独で取扱うよう作られている。このようにしていずれか一方のプロセッサの障害は処理システム全体としての障害とはならない。他方のプロセッサは障害を起したプロセッサがタスクを実行する。このようなシステムにろっては、両方のプロセッサが同時に障害を起すとシステムは無能力状態となる。このようにしてシステムの信頼性は単一のプロセッサ構成の場合に比べて大幅に改善される。しかし、このような信頼性の高いシステムが中央プロセッサを含むシステム・ユニットの二重化という出費を払ったとしても、このシステムは任意の時刻においてプロセッサの内の唯一方のみの処理能力しか使用できない。従ってその処理能力は唯一つのプロセッサを有する相応するシステムの処理能力より良くはならない。当業者にあってはマルチ・プロセッサ・システムも周知である。このシステムはしばしば互いに独立に製作する複数個の処理ユニットを含んでいる。処理ユニットは一般に通信バスに接続されており、このバスを共通使用することによって処理ユニットは互いに通信し、かつメモリの如き共有資源と通信する。問題点は処理ユニ、ットがナベてメモリの如き資源を共有し、従ってその共有資源が適正に機能しているということに依存しているため、このようなシステムの信頼性が高いない点［６る。そして、複数個の処理ユニットが資源を共有しているため、処理ユニットの１つが障害を起し、それが共有の資源に極めて悪い影響を及ぼし、それによってその資源に依存する他の処理ユニットの動作にも極めて悪い影響を与える機会が増大する。前述の問題点は本発明に従い、更新バスが選択的に各メモリを更新し、内容の変更は他方のメモリ中で行ない、第１および第２のメモリは同じ内容を有するようにし、プロセッサはある条件に応動して第１および第２の動作モードの一方から他方にシステム動作を自動的に変更させ、第１のモードにろっては両方のプロセッサが活性状態にあり、各プロセッサは第１および第２のグループのタスクの内の異なるものから選択された他方のタスクとは独立に実行し、第２の動作モードにありては、プロセッサの内の選択された一方は不活性状態にあり、プロセッサの他方は活性状態にあって第１および第２のタスクの両方から選択されたタスクを実行する処理システムにより解決された。発明の要旨本発明の目的は従来技術の前述およびその他の欠点を解決することにある。本発明圧従い、デュアル・プロセッサ・システムは両方のプロセッサが活性状態にあり、各々が互いに独立にシステム・タスクを実行している第１のモードと、１方のプロセッサが不活性状態にあり、他方のプロセッサが不活性状態にあってシステム・タスクを実行している第２のモードで選択的に動作する。システムは２つのプロセッサを含んでいる。各プロセッサはそれ自身のメモリを有しており、これら２つのメモリは同じ内容を有している。これら２つのメモリは、各メモリを更新し、内容の変更は他方のメモリ中で行い、それによって２つのメモリが互いの内容の複製を作る装置によって相互接続されている。特に該システムはある条件に応動してシステムの動作を一方のモードから他方のモードに自動的に変更する装置を含んでいる。これらの条件は例えば手動およびプログラムてよるコマンド、ならびに第１および第２の型のシステム障害状態である。第１のモードにあっては、両方のプロセッサは活性状態にあり、各プロセッサは他方とは独立に第１および第２のグループのタスクの異なる一方から選択されたタスクを実行する。第２のモードにあってはプロセッサの内の選択された一方は不活性状態でちり、他方のプロセッサは活性状態であって第１お工び第２のグループのタスクから選択されたタスクを実行する。更に、該システムは２組の周辺装置を含んでおり、周辺装置の各組はプロセッサのいずれか一方に選択的に接続するコントローラを有している。。第２のモードにあっては、不活性状態にあるプロセッサは待機用プロセッサであって、タスクの実行を行う準備が整っている。システムの動作を変更する装置は選択されたプロセッサを選択的に始動および停止させる装置と、一方のプロセッサが停止したとき実行すべき両方のグループのタスクを残りの活性状態にあるプロセッサにき各グループのタスクを異なるプロセッサに割当てる装置とを含んでいる。この割当てはディスパッチ・キューを介して実行される。本発明のシステムは処理能力の面で強力であり、極めて信頼性゛も高い。本発明のシステムは補助プロセッサが取り付けられた中央プロセッサを有するシステムの計算能力を有している。それでいてプロセッサが障害を起した場合には二重化されたプロセッサ・システムと同じ信頼性を有している。そしてプロセッサは各々にそれ自身のメモリを有しているので、本システムはプロセッサがメモリを共有するシステムで生じる信頼性の問題は回避される。本発明のシステムは両方のプロセッサが活性状態にあり、システム・タスクを独立に実行するモードあるいは一方のプロセッサが活性状態にあり、他方のプロセッサが待機状態にあるモードのいずれかで選択的に動作することが可能である。更に、各プロセッサはシステムのすべての資源（すべての周辺ユニットを含む〕にアクセスを有し、従っていずれかのプロセッサもすべての゛システム・タスクを同等に・実行することが出来る。本システムは１方の動作モードから他方の動作モードに自由に移ることが出来る。本システムは手動コマンドまたは障害の生起の如きシステム条件に応動して適当なモードに自動的に自分自身を再構成する。そして重大なハードウェア障害の如き致命的な障害に続いて実行されるシステムの再構成の場合を除き、はとんどのシステム再構成はシステム上で実行されている応用プログラムに対してはトランスペアレントである。応用プログラムはシステムが動作しているモードおよびシステムの構成の変化は気に留めない。本発明のこれらおよび他の特徴は付図を参照した本発明の実施例に関する以下の記述から明白となろう。図面の簡単な説明第１図は本発明を具現する処理システムのブロック図、第２図は第１図のシステムの動作モードおよび状態を示す状態図ならびにその間の遷移を示す図、第３および４図は夫々第２図の収束モードおよび発散モード時の第１図のシステム１００のメモリのオペレーティング・システム部のメモリ・レイアウトのブロック図、第５図は第１図のプロセッサのシステム・ステータス・インディケータのブロック図、第６および７図は第１図のシステムの保守リセット機能（、Ｍ　ＲＦ　）の論理機能図、第８図は第１図の活性状態にあるプロセッサによって実行される回復動作の論理流れ図、第９図は第６図の停止および切換え過程の論理流れ図、第１０図は第２図の復旧過程の論理機能図、第１１図は第２図の除去過程の論理機能図、第１２図は第２図の発散過程の論理機能図、第１３図は第２図のソフト的収束の論理機能図、第１４図は第２図のソフト的切喚え過程の論理機能図、第１５図は第２図のハード的収束過程の論理機能図、第１６図は第２図のハード的切換えおよびＦＯＮ、Ｌ　／ＦＯＦＬ過程の論理機能図である。。詳細な説明本発明は実施例がデュアル・プロセッサ・システム１００の場合について第１図のブロック図として示されている。このシステムにおいて本発明がどのように機能するか圧ついて簡単に説明する。デュアル・プロセッサ・システム１０口は１対のプロセッサ１０１および１０２ ↓り成る。プロセッサ１０１および１０２は実質的に同一でらる。従来の動作モードにあっては、プロセッサ１０１および１０２の内の１方が活性状態にあり、応用タスク（プログラムまたはプロセスとも呼ばれる）を実行するためにオペレーティング・システムの制御の下で動作する。プロセッサ１０１および１０２の内の他方は従来はアイドル状態にるり、障害によってプロセッサ１０１および１０２の内の活性状態にあるものがサービス不能の状態になったとき直ちに活性状態となるよう待機している。プロセッサ１０１のメイン・タスクの実行、制御およびデータ処理操作は中央処理ユニット（ＣＰＵ）１１２によって実行される。ＣＰＵ１１２はマイクロプログラミングされたマシンであり、殆んどのプロセッサ機能はＣＰＵ１１２の内部のマイクロプログラム記憶装置（図示せず）Ｋ記憶されたマイクロ・インストラクションの実行によって実現される。マイクロ・インストラクション系列の実行匠よゆプログラム・インストラクションによって指示される動作が実現される。ＣＰＵ１１２は一般に主記憶装置（ＭＡＳ）１１４と呼ばれるプロセッサ１０１のメイン・オン・ライン・メモリ装置からデータおよびプログラム・インストラクションを取り出す。応用プログラムおよびオペレーティング・システム・ソフトウェアも主記憶装置１１４中に記憶されていても良い。動作速度を改善するため、ＣＰＵ１１２にはオプションとして書き込みが出来ないキャブシュ１１３（これはＣＰＵと主記憶装置１１４の間の情報転送用の高速度バッファとして機能する）が実装されていて良い。主記憶装置１１４とＣＰＵ１１２およびキャッシュ１１３の如きデバイスの間の通信は主記憶バスＣＭＳＲ）１１６を介して行なわれ、主記憶装置１１４に対するアクセスを仲裁する主記憶更新ユニット（ＭＡＳＵ）１１５によって制御されている。１対の直接メモリ・アクセス・コントローラ（ＤＭＡＣ）ｉｌｏおよび１１１がまた主記憶バス１１６に接続されており、主記憶装置１１４とプロセッサ１０１０周辺装置の間の直接的な情報転送手段として機能している。プロセッサ１０１および１０２は互いに他の複製物でおるので、プロセッサ１０２は同様にしてＭＳ８１２６によって相互接続された１対のＤＭＡＣｌ２Ｏおよび１２１、ＣＰＵ１２２、キャッシュ１２３、ＭＡＳ１２４およびＭＡＳＵ１２５より成っている。プロセッサ１０１および１０２０周辺装置は複数個の周辺装置ユニット（ＰＥＵ）１３１〜１３．２および１４１〜１４２より成る。これらのユニットはディスク・メモリおよびテープ・メモリ・システムの如き２次記憶装置、ＣＲＴディスプレイ、キーボード端末およびテレプリンタの如き入出力通信装置、ならびにデュアル・プロセッサ・システム１００が使用される応用用途に応じて要求される他の装置のホストを含んでいて良い。周辺装置ユニット１３１〜１３２の第１のグループはデュアル・ポート・コントローラ（ＤＰＣ）１３０に接続されている。デュアル・ポート・コントローラ１３０の１つの通信ポートは通信チャネル１３３に接続されており、コントローラ１３Ｇの他方のポートはチャネル１３４に接続されている。コントローラ１３０はチャネル１３３〜１３４を介して受信された指令に従って周辺装置ユニット１３１〜１３２をチャネル１３３または１３４のいずれかに選択的に接続する。チャネル１３３はＤＭＡコントローラ１１１に接続されており、チャネル１３４はＤＭＡコントローラ１２１に接続されており、従って両方のプロセッサ１０１および１０２が周辺装置ユニット１３１〜１３２にアクセスすることを許容する。信頼性をあげるため、デュアル・ポート・コントロー成っている。コントローラ対１３０ａ、ｔ３０ｂの一方の選択・活性化はチャネル１３３〜１３４の１つを介して送信されるコマンドを介して実行される。同様にして、周辺装置ユニット１４１〜１４２の第２のグループはデュアル・ポート・コントローラ１４０によって１対のチャネル１４３および１４４の一方と選択的に接続される。チャネル１４３はＤＭＡＣ１１０に接続されており、チャネル１４４はＤＭＡＣｌ２Ｏに接続されており、それＫよって両方のプロセッサ１０１および１０２が周辺装置ユニット１４１〜１４２にアクセス出来ることになる。コントローラ１４０はまた二重化されており、コントローラｔ４０ａ、１４０ｂ対の一方の選択はチャネル１４３および１４４を介して行なわれる。プロセッサ１０１および１０２のいずれもがシステム・タスクを同等に実行することを許容し、いずれか一方が障害を起したときに他方の代りとして用いるために主記憶装置１１４お工び１２４は同一状態に保持されていなければならない。このため、プロセッサ１０１および１０２の主記憶更新ユニット１１５および１２５は更新バス１０３と呼ばれる通信バスによって相互接続されている。主記憶装置１１４に対するアクセスを仲裁するのに加えて、主記憶更新ユニット１１５は主記憶装置１１４に対してなされるアクセスの型をモニタする。要求されたアクセスが例えば書き込み操作またはクリア操作の如く主記憶装置１１４の内容を変化させる型のアクセスであると、主記憶ｙ新ユニット１１５は、バス１２６に接続されている他のユニットがするのど同じように、主記憶更新ユニット１２５が主記憶バス１２６にアクセスしたいという要求を発する。主記憶更新ユニット１２５はこの要求をバス１２Ｇに対する他のアクセス要求と同様に処理するが、この要求には最も高い優先度を与える。バス１２６が利用可能な状態になると主記憶更新ユニット１２５は主記憶更新ユニット１１５のアクセスの許可信号を発生し、更新バス１０３の一端を主記憶バス１２６に接続する。前記許可信号に応動して、主記憶更新ユニット１１５は更新バス１０３の他端を主記憶バス１１６に接続し、最初に要求された主記憶装置１１４に対するアクセスを許容する。このときバス１１６および１２６は接続されているので、主記憶アクセスは両方のバス１１Ｇおよび１２６を介して両方の主記憶ユニット１１４および１２４に対して行なわれ、ユニット１１４および１２４の内容は同じ仕方で変更される。アクセスの完了後、両方の主記憶更新ユニット１１５および１２５は更新バス１０３を夫々の主記憶バス１１６および１２６から切離す。夫々他のプロセッサのＭＡＳ１２４または１１４を更新するＭＡＳ［Ｊ１１５および１２５のこの機能はＭＡＳＯ１１５および１２５に対するコマンドによって禁止することが出来る。プロセッサ１０２で生起する主記憶書き込みまたはクリア・アクセス（これらのアクセスは主記憶１１４と１２４の両方に対して行なわれる必要がある）に関しては、主記憶更新ユニット１１５および１２５の前述の役割を単に入れ替えれば良い。更に１直接通信チャネルがＣＰＵ１１２とｃｐσ１２２の間に設けられている。保守チャネル（ＭＴＣＨ）１０４ａと呼ばれるチャネルはオン・ライン活性状態にあるプロセッサが不活性のプロセッサを診断するだめの制御・通信バスを提供する。保守チャネル１０４ａはまた障害回復プログラム用の低レベル保守制御を提供し、プロセッサの切替え動作に悪影響を与えることなく実行することが出来るよう罠なっている。更に、他の保守制御として、保守チャネル１０４ａを介してプロセッサ１０１および１０２の１方が他方のプロセッサ上の初期化系列を開始させたり、プログラムの実行を停止させることが出来る。保守チャネル１０４ａはまた外部源からマイクロ・インストラクションを受信し、それを実行することが出来る。保守チャネル１０４ａはまたプロセッサ・バスを制御し、プロセッサ制御信号を発生することが出来る。このようＫして、保守チャネル１０４ａはプロセッサに対してほぼ完全な制御を実行することが出来、プロセッサを診断するのに十分なアクセスを提供することが出来る。信頼性をあげるため、保守チャネル１０４ａはバックアップ保守チャネル１０４ｂによってバックアップされている。バックアップ保守チャネル１０４ｂは単にプロセッサが他のプロセッサの１正常であることを示す′タイマ（図示せず）をリセットすることを許容する。′正常であることを示す′タイマはプロセッサの電源が投入されたときにプロセッサ上で動作するハードウェア的に実現されたタイマである。′正常であることを示す′タイマはある値で時間切れとなり、その時点でプロセッサの再初期化が生じるよってする。このようにして１正常であることを示す１タイマは再初期化が起ることを防止するため周期的にリセットされねばならない。他のプロセッサによりプログラムされたインタラブド要求（ＯＰＰＩＲ）信号線１０５ａおよび１０５ｂがＣＰＵＩ　１２とｃｐσ１２２の間に延びている。その名が示すように、これらの信号線はＣＰＵ１１２お工び１２２がプログラムされた、即ちソフトウェアによって開始されたインタラブド要求を互いに発生することを許容する。プロセッサ・システム１００の前述のハードウェア構成の助けにより、デュアル・プロセッサ・システム１００°のオペレーティング・システムは第２図に示すような複数個の構成の内の１つの構成で選択的に動作し、かつそのオペレータによってシステム１００に与えられたコマンドまたは障害の生起の如き内部的に検出された状態に応動じて再構成することを許容する。デュアル・プロセッサ・システム１００の従来の通常の動作モードは収束モードであり、第２図のシステム１００の構成状態図では番号１０で示されている。収束モード１０Ｖｃ６つては、プロセッサ１０１および１０２の一方のみが活性状態であって、すべてのシステム・タスクを実行しており、他のプロセッサは不活性である。通常のシステム動作期間中、不活性なプロセッサは待機状態にあり、要求により活性プロセッサとなる準備が出来ている。一般に活性プロセッサに障害が起ると、；障害を起したプロセッサは不活性プロセッサとなり、サービスからはずされ、最早活性プロセッサとしては使えないものと見做される。このような障害の後に、先に不活性でめったプロセッサが活性となり、システム・タスクを実行するのに加えて障害を起したプロセッサを診断し、該プロセッサを活性状態または待機状態に戻そうと努力する。第３図のメモリ・レイアウト・マツプに示すように１収束動作モード１０１Ｃ６つては、３００と番号の付されたオペレーティング・システムのただ１つのバージョンのみがシステム１００中に存在する。（但しそのコピーは主記憶１１４および１２４中に記憶されている。）、オペレーティング・システムのこのバージョン３００は２つのプロセッサ１０１および１０２の内たまたま活性であるものの上で実行される。第２図に戻ると、収束動作モー　ドにあってはシステム１００は４つの動作状態３〜６の内のいずれかの状態にある。これら状態の各々は次のようなラベルで表わされている。即ち最初の記号はプロセッサ０（第１図の１０１）の状態を表わし、ついでスラッシュが入り、その次にプロセッサＪ（第１図の１０２）の状態が来ている。第２図に示すように、状態３に８つ１ノはプロセッサ０１０１は活性状態（ａ）であり、プロセッサ１１ｏ２は待機状態（ＳＴＢＹ）である。状態４にろっではプロセッサ１０１と１０２の動作状態は逆転し７ている。状態５にあってはプロセッサ０１０１は活性状態であり、プロセッサ１１０２は非サービス状態（ＯＯＳ）であり、状態６にあっては２つのプロセッサ１ｏ１と１０２０動作状態は逆転している。本発明を具現するシステム１００は第２図に番号１１で示す発散動作モードを付加的に有している。このモードでは両方のプロセッサー０１および１０２が活性状態にあって、異なるシステム・タスクを実行している。異なるタスクとしては同じプログラムのコピーの実行を含んでいて良い。発散動作モードにおいてはシステム１００は２つの動作状態の内のいずれかの状態にある。状態１にあってはプロセッサ０１０１は主プロセツサ（ａ　）と名付けられ、プロセッサー０２は２次プロセッサ（＆、）と名付けられる。状態２にあってはプロセッサ１０１および１０２の主および２次の命名は逆転される。収束モード１０の如き活性−不活性システム構成にあっては、活性プロセッサは常に主プロセツサであると見做される。従って、第２図が示唆するように、状態１．３および５にあっては、プロセッサ０ｊＯ１は主プロセツサであり、プロセッサー１ｏ２は２次プロセッサであり、状態２．４および６ではプロセッサー０１および１０２の主および２次の命名は逆転している。プロセッサの主および２次の命名は例えば各プロセッサー０１および１０２中において第５図に示すフラグ２１０を適当にセットすることにより行なわれる。フラグ２１０は各プロセッサー０１および１０２と関連する複数個のシステム・ステータス・インディケータ２００の１つである。フラグ２ｔＯはシステムの構成を示すレジスタのフラグ・ビットであって良い。あるいはフラグ２１０はメモリの１つのワードであってもよい。フラグ２１０は次のように実現される。即ち主記憶装置の１つのワー、ドはプロセッサ０またはプロセッサｌを主プロセツサと同定する。このワードはプロセッサが主であるか２次であるかを決定するためにプロセッサがプロセッサ０であるかプロセッサ１であるかを同定するそれ自身の構成を示すシステム・ステータス・レジスタ（ＳＳＲ）中のフラグ・ビットと共にプロセッサ中で使用される。第４図のメモリ・レイアウト・マツプに示すように、発散動作モード１１におっては番号３００および３０１で示す２つのオペレーティング・システムのバージョンがシステム１００中に存在する。オペレーティング・システムの主バージョン３００はプロセッサ１０１および１０２の内の主プロセツサ上で実行され、２次バージョン３０１は２次バージョン上で実行される。主記憶ユニット１１４および１２４は更新された状態にあるので（即ちその内容は同一であるように保持されているので入オペレーティング・システムの２つのバージョン３００および３０１のコピーが各々の主記憶ユニット１１４および１２４中に記憶されている。発散モード１１にあっては、２つのプロセッサ１０１および１０２は個々のプロセッサとして互いに独立して動作しており、従って各プロセッサ１０１および１０２はオペレーティング・システムのバージョン３００および３０１の内の異なるものを実行していることになる。しかしバージョン３００および３０１は同じオペレーティング・システムのバージョンであることに注意されたい。更に、たとえプロセッサ１０１および１０２が各々それ自身のディスパッチ、・キュー（至急用待行列）から得た独立したタスクを実行しているときでさえも、２つのディスパッチ・キューは共通ワーク・リストから供給される。従って、両方のバージョン３００および３０１に共通なオペレーティング・システムの部分、例えばオペレーティング・システム・テキスト、メツセージ・バッファおよびディスパッチ制御表は２つのバージョン３００および３０１によって共有されている。オペレーティング・システムの各バージョン３００および３０１は、それが実行されるプロセッサ１０１または１０２が主プロセツサでおるか２次プロセッサであるかに依存し、かつ実行している特定のタスクに依存するオペレーティング・システムの部分のみを別個に保守する。これらの要因に依存するタスクの例としては例えばインタラブド・スタックおよびディスパッチ・キュー、データならびにセグメント・テーブルがある。障害の生起の如き動作状態に応動して、あるいはシステム・ユーザからのコマンドに応動して、システム１００は種々の動作状態の間の遷移を行ないうる。第２図の矢印で図式的に示すようなこれら遷移がどのようＫして行なわれるのかを述べるのが残りの議論の主要な部分を占めている。システム１００の動作状態の変化は一般に２つのカテゴリーに分れる。即ちハード的変化とソフト的変化である。ハード的変化は応用プログラムに対してトランスペアレントではらり得ないようなある程度のシステム１００の初期化を伴う変化である。システムの初期化とは障害に出会った後に正規の処理能力を回復するために実行しなければならない動作系列のことを言う。ハード的な変化は一般に活性状態にあるプロセッサが動作を継続出来ないような障害を起し、非サービス状態としなければならないときに生じる。これらは致命的障害と呼ばれる。ハード的変化はまた非致命的障害（即ちハード的変化を起させる必要は必ずしもない障害〕からの回復の試みのニスカレーション（即ちソフト的な変化によって回復させようとした試みが失敗した場合）の結果としても生じ得る。ハード的変化を引き起す障害は第１の型の障害と呼ばれる。ハード的変化はまた手動の、即ちオペレータによる要求またはプログラムの要求に応動して生じ得る。第２図を参照すると、ハード的変化は状態３がら状態６−の遷移、または状態４から状態６への遷移であることが分るが、これは１ハード的切替え′と呼ばれる。ハード的切替えのプロセスについては第１６図と関連して議論する。１強制オンライン／強制オフライン１と呼ばれる状態５と６の間の変化も同様にハード的変化であり、これについても第１６図と関連して議論する。ハード的変化はまた状態１から状態５への遷移も含んでおり、これは１主プロセツサへのハード的収束′と呼ばれる。更にハード的変化として状態１から状態６または状態２から状態、５への遷移もあり、これは１２次プロセッサへのハード的収束′と呼ばれる。ハード的収束のプロセスについては第１５図と関連して議論する。ソフト的変化とはシステムの再初期化を伴わないか、またはシステム１００上で実行されている殆んどの応用プログラムに対してトランスペアレントであるような性質の初期化を伴う変化である。ソフト的変化を引き起す障害は第２の型の障害と呼ばれる。ソフト的変化はまた手動の要求またはプログラムの要求知応動ｌ −でも生じ得る。ソフト的状態変化としては状態１から状態３への変化、状態２から状態４への変化（これらは１主プロセツサへのソフト的収束′と呼ばれる）。ならびに状態１がら状態４への変化、状態２から状態３への変化（これらは１２次プロセッサへのソフト的収束′と呼ばれる）を含んでいる。ソフト的収束のプロセスについては第１３図と関連して議論する。ソフト的状態変化はまた状態３から状態１への変化、また状態４から状態２の変化（これらは１発散１と呼ばれる）を含んでいる。発散のプロセスについては第１２図と関連して議論する。状態５がら状態３への変化、また状態６から状態４への変化もまたソフト的変化であり、′プロセッサ復旧ｔと呼ばれる。プロセッサ復旧のプロセスについては第１．０図と関連して議論する。状態３から状態５へのソフト的変化、また状態４から状態６へのソフト的変化は１プロセツサ除去１と呼ばれる。プロセッサ除去はまた活性状態にあるプロセッサにハード的変化を生じさせる非活性状態にあるプロセッサのハード的障害に応動しても生じ得る。このようなハード的障害は非活性状態にあるプロセッサのハード的変化は引き起さない。何做ならば障害によって影響を受けるソフトウェアは待機中のプロセッサ上では実行状態にないからでおる。プロセッサ除去のプロセスについては第１１図と関連して議論する。障害の検出に応動した自動再構成に関しては、システム１００は障害の検出および回復用のハードウェアならびにソフトウェアに依存する。本発明がシステム１００内においてどのように機能するかを説明するためにそのメカニズムについて簡単に述べる。システム１００内に含まれる障害検出回路およびプログラムは大規模なものである。障害検出ハードウェアおよびソフトウェア技法は局部整合回路、すべてのバス上のパリティ技法、主記憶上のハミング誤り訂正、２次および３次記憶装置上のサイクリック・リダンダンシ・コード、および制御ユニットならびに周辺装置全体にわたる種々のハードウェアおよびソフトウェアが１正常であることを示す ′タイマなどん広範囲に使用している。更に障害検出メカニズムそれ自身の障害を検出するのにルーチン診断が使用されている。′正常であること′のルーチン・チェックは周辺のサブシステムが健全であることを保証するのに使用される。最後に、システムの完全性チェックは固有の検出器では捕捉し得ないような問題を捕捉する。いずれかの障害検出器が誤り状態を検出すると、インタラブドが影響を受けるプロセッサ１０１または１０２中に登録される。障害の内張も重大なものによって引き起されたインタラブドは自動的ハードウェア・シーケンスならびにハード的変更を生じさせ、それによって作業は影響を受けなかったプロセッサに切替えられる。より重大でない障害はシステムの回復を行なうマイクロコードならびにソフトウェア九対するインタラブドを生じさせる。障害回復プログラムはハ・−・ドおよびソフトによる障害の検出ならびに回復全制御する。ハードウェア障害回復プログラムはハードウェア・インタラブドを受信し、そｎに続く回復シーケンスを制御する。特定の誤シが予め定められた度数の閾値を越したことが検出されると、システムの構成は健全な状態に変更さｎる。ソフトウェア障害回復プログラムはアーキテクチュア的にハ・−ドウエア障害回復と極めて類似している。ソフトウェアの各々の主ユニットは防御的検査の如き障害検出機構、誤シ閾値、ならびに失敗によるリターン、デ・−タ訂正検査および再初期化技法の如き誤り回復機構と関連している。更に１．プログラムの実行はモニタさｎていて、プログラムか無限の実行ループに入つ友シ、メツセージ・バッファの如きシステム資源全過度に消費した択指定さｊた限界上越えたメモリにアクセスしたり、プログラムに許可されていないインストラクション全実行しｆｃすすることがないようにかつでいる。各プログラムまたσプログラムの組は再初期化および回復制御機能を鳴しておシ、そ扛によって回復全行うことが出来る↓うになっている。こｊ２は通常各プログラムに障害エントリ・ポイントと呼ばれる別個のエントリ・ポイントを提供することにより実行される。回復動作によりシステム１００からハードウェアまたはソフトウェア・ユニットが除去される場合には、診断および検査プログラムが自動的に急派さｎ５除去を引き起したハードおよびソフトの問題点の解析が行わｎる。ブートストラップおよび他の初期化プログラムはプロセッサの初期化を制御し、それによって正規の処理能力の回復を図るためにマイクロコードおよびソフトウェアにより実現される動作の基本的集会全提供する。システムの初期化は、障害の如き状態に出合つ定径に正規の処理状態を回復するために使用されるマイクロコード化さｎた動作シーケンスの実行を含んでいる。システムの初。期化はハードウェアまたはソフトウェア回復機構、あるいは手動要求によって自動的に開始さ扛る。システムの初期化または再初期化は次のような場合に要求さｊ、る。即ちシステムが最初にサービス状態とされるとき（即ち電源が投入さｎたとき）；ハード約１たはソフト的なプロセッサ切替えを要求するハードウェア障害が起ったとき；カウンタによって指示される過度の／Ｘ・−ドウエアおよびソフトウェア・インタラブドが生じたとき；プログラム要求に応動したとき；手動要求に応動したときなどである。初期化シーケンスは七の原因の如何暉関係なくプロセッサ内の“保守リセット信号“と呼ばれるＩ＼−ドウエア信号によって開始される。この保守リセット信号はそれが発せらｎたプロセッサにインタラブドを生じさせる。保守リセット信号の結果生じたインタラブドはシス夙ム１００における最も優先度の高いマイクロコード・インタラブドｋｆｉわす。保守リセット信号の受信時に実行される初期化シーケンスにより当該プロセッサの初期化が行われる。この初期化シーケンスは保守リセット機能（ＭＲＦ）と呼ばれる。ＭＲＦは第６および７図と関連して以下で更に詳細に議論する。システム１００は回復を行うために漸進的初期化戦略に従う。実行さｎる初期化動作は処理能力の不必要な損失を防止する之め障害の度付に整合している。特定レベルの初期化で回復が出来ないと、既に最高レベルにある場合を除き回復が得ら九る筐で初期化のレベルがニスカレートされる。システム中の活性状態に６るプロセッサが実行し得る漸進的なソフトウェア的初期化には４つの位相がある。ソフトウェア回復の位相１（φ１）にあっては、プロセッサのハードウェアは周知の状態にリセットされ、プログラムは再初期化され、プロセッサのオペレーティング・システムの核に周知のエントリ・ポイントから入る。これは迅速な回復であり、ブートストラップはない（即ち２次メモリから主記憶への再ローディングは無い。）。ソフトウェア回復の位相２（φ２）にあっては、プロセッサはブートストラップを行う。即ちオペレーティング・システムおよび応用プログラムの新しいコピーがディスクの如きバックアップ用の２次メモリから主記憶中にロードさｆる。しかし、装置の構成データ・ベース（ＥＣＤ）およびプログラムの保護された応用セグメント（ＰＡＳ　）からのデータのローカル・コピーは保存されている。その名前が示すように、ＥＣＤは、システム１００にはどのような装置およびオプションが実装さ扛ているのか、こｎらの装置がどのような構成になっているのかおよびこれら装置の間でどのような通侶および信号手続きが行わｎるかの如きシステム１０Ｇの構成を規定するデータ・ベースである。ＥＣＤ情報は再ロードされないので、再初期化は、ＥＣＤの２次記憶コピー中の情報と矛盾しない周知の状態に周辺装置全回復する必要がないため早められる。ＰＡＳはプロスセが典型例ではその回復に必要な情報をセーブするのに使用するプロセス

【割当てらｎたセグメント・メモリである。ソフトウェア回復の位相３（φ３）はφ２と類似しているが、ＰＡＳのみが保存され、ＥＣＤはバックアップ・メモリから再ロードされる。ソフトウェア回復の位相４（φ４）はφ３と類似しているが、すべてのものがプロセッサの主記憶からクリアされ、バックアップ記憶装置から再ロードさｎる。ＰＡＳが破壊されることがあるが、このレベルの回復は手動コマンドによってのみ開始され得る。活性状態にあるプロセッサ上のＭＲＦシーケンスによって実行されるハードウェア初期化のレベルが第５図に示す１対の初期化シーケンス制御（ＩＳＣ）ビット２１１および２１２によって示さｎている。３Ｂ２０計算機にあってＨ１ｒｓｃビット２１１および２１２はプロセッサのシステム・ステータス・レジスタ（ＳＳＲ）内に設けられている。ＩＳＣビット２１１および２１２はマイクロコードに対するハードウェア初期化レベル・カウンタと見做すことが出来る。活性状態にあるプロセッサから要求さ江ると、ＭＲＦはＩＳＣビット２１１および２１２を調べ、実行すべき回復のレベルを決定する。第６および第７図から明らかなように、ハードウェア回復の各レベルはソフトウェア回復のあるレベル金倉んでいる。不活性な状態にあるプロセッサ上で実行さｊ、ているＭＲＦはＩＳＣビット２１１および２１２の値を無視する。不活性な状態にあるプロセッサにあっては、ＭＲＦＫよ・りて実行される初期化のレベルは通常プロセッサに電源を入れ之ときに実行されるような基本的な初期化である。ハードウェア初期化シーケンスへ・のエントリは影響ヲ受けるプロセッサが不安定であると考えら扛る初期化期間の開始時点全マークする。ハードウェア初期化に対する他の要求がこの期間中に生じると、初期化期間の開始時点においてその２進値が減少さｎたＩＳＣビット２１１および２１２は初期化のレベルをニスカレートさせる。（即ち初期化の次のレベルが実行されるようにする。）これに応動じて、次のレベルのハードウェア初期化シーケンスに入り、ＩＳＣビット２１１および２１２の値は再び減少され、初期化期間のタイミングが再スタートさｎる。この期間中に更に他の初期化要求があると初期化の次のレベルに進む。ＩＳＣビット２１１および２１２の値はこれ以上減少出来ず、従って未満７の初期化期間中にその後生じるプロセッサによって発生された回復要求に対しては最も高位の自動回復レベルが再試行さｎることになる。各々の初期化要求の後、初期化期間が他の初期化要求を受信することなく終了すると、ｒｓｃビット２１１および２１２はアイドル２進値にリセットさｎる。ＭＲＦはその人力としてＭＲＦが呼ばれたときのシステム１００の構成、即ち状態ならびにＭＲＦが呼ばｎた理由（即ちＭＲＦが呼ばｎた状態あるいはＭＲＦ” 、呼んだ源）を取り入れる。ＭＲＦＶｉ第６および７図に論理流れ図として図示されている。議論を簡単にするため、第５ａ−ｂ図においてＭＲＦがプロセッサ０１０１上で呼ばれたものと仮定する。（ＭＲＦがプロセッサ１１０２上で呼ばれた場合にもＭＲＦによって実行さｎる動作は等価であること？理解さｎたい。）プロセッサ０１０１上で呼ば扛ると（ブロック＋００）、ＭＲＦは最初ブロック４０１によって示すようニ、フロセッサのマイクロ記憶装置中にそのプロセッサ０１０１のハードウェア状態を記憶することにより応動する。プロセッサのハードウェア状態はそのプロセッサの特別なレジスタの内のあるものの内容によって指示される。特別なレジスタはプロセッサの状態（誤シ全含む）を示すレジスタである。この特別なレジスタとしては次のようなレジスタがある。即ち現在実行しているプログラムと関連するソフトウェアと関係する情報を記憶するプログラム・ステータス・ワード・レジスタ（ＰＳＷ）　；システムの構成、保守および回復制御ならびに状態の如きものと関連するシステムと関係する情報を記憶するシステム・ステータス・レジスタ（ＳＳＲ）　；ハードウェア状態および制御情報を記憶するハードウェア・ステータス・レジスタ（Ｈ３Ｒ）　；システム・エラー・ステータスを記憶するエラー・レジスタ（ＥＲ）などがある。特別なレジスタの内容は、必要な場合その後に呼ばｎた診断および回復プログラムがこの情報を調べ、それによってどのようにして影響を受けたプロセッサおよびシステム１００’ｉ復旧させるかを決定するために保存さｎている。プロセッサ０１０１のハードウェア状態を保存した後、ＭＲＦは何故呼ばｔｌｔかの理由全決定する。まず最初にブロック４０２中に示すように、ＭＲＦは電源の入れらｎたプロセッサ０１ｏ１に応動して呼はルたがどうかチェックする。もしそうであると、ＭＲＦはブロック４０３に示すように、プロセッサ０１０１を初期化する。実行さｎる初期化のレベルは基本的、徹底的な初期化であり、プロセッサ０１０１はすべて周知の状態とさｎる。初期化によシプロセッサの特別なレジスタおよび“正常であることを示す“タイマはクリアされ、久方および出力動作は禁止さ扛る。ブロック４０３においてプロセッサ０１０１が初期化さｎると、ＭＲＦＶｊブロック４０４に示すようにＭＡＳ１１＋ノ内容全クリア、即ちＯとする。この点において、ＭＡｓＵの更新機能はオフとされ、従ってＭＡＳ１１４のクリアはＭＡＳ１２４の内容に対し何らの影響も与えない。ＭＡ３１１４にクリアすると１．ＭＲＦは再びブロック＋０５中にテすようにプロセッサ０１０１ｉ初期化し、ＭＡＳｉクリアすることにより生じたかも知ｎない誤り’＆クリアし、再びプロセッサの正常さを示すタイマをリセットする。次にＭＲＦはブロック４０６に示すように電源投入による初期化が完了したことの指示金与える。この指示は第５図に示すインディケータ２１３０セツトを含んでいる。３Ｂ２０計算機にあっては、インディケータ２１３はＭＡＳ１１４のワード３である。次Ｋ　ＭＲＦは第６図のブロック４０７中に示すようにプロセッサ０１０１ｔホールトさせることによシ活動を完了する。他のプロセッサ１１０２が既に活性状態にあると、電源投入による初期化が完了したという指示（例えばインディケータ２１３）は他のプロセッサ１１ｏ２によって周期的にモニタされる。プロセッサ０１０１に電源が投入され、初期化されたことをプロセッサ１１０２が検出すると、該プロセッサ１１０２はＥＣＤ中のインディケータ２１８をセットすることによってプロセッサ０１０１がサービスが出来ない状態であることをマークする。このマーキングは活性状態にあるプロセッサ１１０２に対し、該プロセッサ１１０２が、不活性であるが今電源が投入さｎ、従って利用可能なプロセッサ０１０１の正常であることを示すタイマ全リセットして、正常であることを示すタイマが障害指示全発生しないようにする役目を果す。次にプロセッサ１１０２はその動作全継続する。セッサ１１０２はプロセッサ０１０１によって実行された電源投入による初期化の完了指示には応動しない。従ってプロセッサ０１０１の正常であること金示すタイマは時間切ｎとな９、障害指示？発生する。不活性なプロセッサ０１０１は停止および切替え（第９図参照）を試みることによってこの障害指示に応動する。停止および切替えはプロセッサ０１０１’ｅ停止させ、他のプロセッサ１１０２上ＫＭＲＦ（ｉ−呼び出すことを含んでいる。プロセッサは例えばそのために用意されたフリップ・フロップの如きフラグ全セットおよびリセットすることにより通常の仕方で停止および始動さ扛る。プロセッサ１１０２’に電源が投入さｊ、るとき、ＭＲＦｉ呼ぶことにより一般にプロセッサ０１０１またはプロセッサ１１０２が活性状態となる。このことは第７図のブロック４５０〜４６５の議論から明らかとなろう。しかし、他方のプロセッサ１１０２に電源が投入されていないと、該プロセッサ１１０２は停止および切替えには応動しない。プロセッサ１１０２はプロセッサ０１０１の正常さを示すタイマをリセットしないから、正常さを示すタイマは第２の閾値において時間切れとなり、該タイマはバックアップの正常さ金示すタイマと呼ばｎる。この結果プロセッサ０１０１の障害指示が生じ、それによってＭＲＦがプロセッサｏ　ｉ　ｏ　１　、Ｊ：で呼ば扛る。プロせツサ０１０１が機能しているときにはこれによって第７図のブロック４５０−４６５の議論から明らかとなろう。電源の投入さ扛たプロセッサ０１０１に応動してＭＲＦが呼ばれないと（第５ａ図のブロック４０２）、ブロック４２０によって示すようにＭＲＦはバックアップ用保守チャネルＢＭＴＣＨ１０４ｂ　（第１図参照）を介してプロセッサ】１０２によって呼ばれたかどうかチェックする。もし呼ばれた場合には、七扛はプロセッサ１１ｏ２が例えばプロセッサ０１０１の正常さ金示すタイマ全リセットするために保守チャネルｉｏ＋ａｌ介してプロセッサ０１０１にアクセスすることを望んだが、ＭＴＣＨ１０４ａの障害のためにアクセス出来なかったことの指示となる。ＭＲＦはブロック４２１に示すようにプロセッサ０１０１を初期化することにより応動する。プロセッサ０１０１は前述の基本初期化レベルておいて初期化さｎ１障害を起したＭＴＣＨｌ　０４　ａが発生した誤シヲクリアし、プロセッサ０１０１の正常さを示すタイマをリセットする。初期化に続いてＭＲＦはブロック４２２に示すように再びプロセッサ０１０１’に停止させる。電源投入（ブロック４０２）またはバックアップＭＴＣＨ１０４ｂ（ブロック４２０）によってＭＲＦが呼ばしなかつた場合、ＭＲＦはブロック４３０に示すようにプロセッサ０１０１が現在強制的にオフ・ラインとされているがどうか（ＦＯＦＬ　、第２図参照）をチェックする。そのインデイケーションはシステム・ステータス・レジスタ（ＳＳＲ）中のフラグ・ビットとして実現さｎている第５図に示すインディケータ２１４により与えらｎる。プロセッサ０１０１が強制的にオフ・ラインとされていると、ＭＲＦはブロック４３１中に示すように基本初期化レベルにおいてプロセッサ０１０１に初期化することによシ応動する。次にブロック４３２中に示すようにＭＲＦは再びプロセッサ０１０１全停止させる。プロセッサ０１０１が強制的にオフラインにされていないと、ＭＲＦはプロセッサ０１０１が活性状態となるよう準備を整える。ＭＲＦはブロック４３５に示すように基本初期化レベルにおいて再びプロセッサ０１０１を初期化する。ＭＲＦは次にブロック４３６中に示すようにプロセッサ０１０１が入出力動作に従事し得るようにする。これは第５図に示すＳＳＲ中のフラグ・ビット２１６をセットすることによシ実行される。ＭＲＦはまたブロック４３７中に示すようにブロック４０１で保存さｎたプロセッサ０１０１のハードウェアの状態をマイクロ記憶装置からＭＡ８１１４中に転送させる。第７図に戻ると、ＭＲＦはブロック斗４０に示すように手動のコマンドに応動して呼ばれたかどうか全チェックする。そのインデイケーションは第５図のインディケータ２１７によって与えられる。３Ｂ２０計算機にあっては、インディケータ２１７は緊急動作インタフェース（ＦＡＩ）パラメータ・バッファ中に組み込ｔｎている。手動で呼ばれると、ＭＲＦはブロック４４１に示すようにブートストラップがそｎによって要求さｎ念かどうか全決定するコマンドをチェックする。ブートストラップが要求さｎると、ＭＲＦはブロック４４２中に示すように要求されたレベル（即ち初期化の位相２．３または４）においてプロセッサ０１０１上でブートストラップ全実行する。この回復の試みが回復の試みのニスカレーションに至らない場合には、ブートストラップの完了時点においてプロセッサ０１０１は再初期化によって決定さｎる点に戻らされる。手動コマンドがブートストラップ全要求しない場合（ブロック４４１　）、ブロック４４５に示すようにＭＲＦは要求がテープからディスクにロードすべきことであったかどうか全チェックする。ディスクは通常システム１００の２次メモリであり、テープは通常システム１００の３次メモリである。両者が第１図の周辺装置ユニット（ＰＥＵ）１３１〜１３２においては包摂さｎている。要求がテープからディスクヘロードすることであると、ＭＲＦはブロック４４６中に示すように要求を満そうとする。次いでＭＲＦはブロック４４６中に示すように次の手動コマンドを待機する。期待されるコマンドはブートストラップに対する要求である。手動コマンドによってブートストラップもテープからディスクへのローディングも要求されないと、ＭＲＦはブロック４４８中に示すようにプロセッサ０１０１に対シ位相１時ベルの初期化を実行する。この回復の試みが回復の試みのニスカレーションをもたらさない場合には、再初期化の位相１の完了時点において、プロセッサ０１０１ｆｌ再初期化によって決定さｎる点に戻ってその中断さｎた活動を再開する。・ブロック４４０においてＭＲＦが手動コマンドによって呼ばれたのではないと決定すると、ＳＳＲのＩＳＣピット２１１および２１２の値全調べて初期化のどのレベルを実行すべきかを決定する。ｌ／　１１　ＩＩなる２進の値は活性−不活性構成に配列さまたプロセッサ１０１および１０２のＩＳＣビット２１１および２１２のアイドル値でおる。ＩＳＣビット２１１お工び２１２が“１１“なる２進の値を有することｉ　ＭＲＦが見出すと（ブロック４５０）、ＭＲＦはブロック４５１に示すようにその値を“１０″に減少させ、ブロックキ５２に示すようにそれ自身のプロセッサ０１０１上で位相ルベルの初期化を実行する。再びこの回復の試みが回復の試みのニスカレーションをもたらさない場合には、再初期化の位相ルベルの完了時点において、プロセッサ０１０１は再初期化によって決定される点において中断され次活動に戻り、活動を再開する。第１の減少さした２進の値“１０“は活性−不活性構成されたプロセッサ１０１および１０２の工ＳＣビット２１１および２１２のアイドル値である。ＩＳＣビット２１１および２１２が２進の値“１０”を有すること全ＭＲＦが見出すと（ブロック４６０）、ＭＲＦはブロック４６１に示すようにその値ｔ　／／　ｏ　ｏ“に減少させ、停止および切替えとして知られるハード的変更を実行する。ＭＲＦカ実行するハード的変更の型はＭＲＦ’に対する呼び出しが行われたときに第２図の状態１〜６の内のどれにシステム１００がいたかの関数となる。種々のハード的変更に関係するプロセスについては第１５および１６図と関連して議論する。第７図のブロック４５０および４６０においてプロセッサ０１０１のＩＳＣビット２１１および２１２の値が“ｌ】“または“１０“以外であるとＭＲＦが判定すると、ＭＲＦはそｎに応動しであるレベルのブートストラップ、即ち再初期化の位相２または３レベルを実行する。これがブロック４６１中に示さｎている。実行されるブートストラップのレベルはＭＲＦによって呼ばれたソフトウェアによって決定されると共に所望の回復の型にも依存する。これは例えば試みられたが不成功に終ったブートストラップの最後のレベルに依存し、ブートストラップ・レベルのニスカレーションを表わしている。再び、この回復の試みが回復の試みの更なるニスカレーション、即ち繰返しをも九らさない場合には、ブートストラップの完了時点において、プロセッサ１０１は再初期化によって決定される点に戻される。１度ブートストラップされ、更に初期化期間中にＭＲＦを呼んでもＩＳＣビット２１１および２１２の値は変化せず、単にＭＲＦ金してより高いレベルのブートストラップ再初期化全試みさせることになる。位相４レベルの再初期化はＭＲＦによっては自動的にニスカレートされない。こ扛はブロック４４２に示すように手動のコマンドにのみ応動して実行される。ここで活性プロセッサ中で行わｎるシステム回復プロセスの手順について注目されたい。この手順は第８図に論理的に図式弄現さｎている。第８図の議論ｔ−明快にするため、障害の検出ならびに七牡に対する応動はプロセッサ０１０１上で生起するものと仮定する。第８図に示し、前述したように、システム１０Ｇの活性状態にあるプロセッサ０１０１のハードウェアの障害の検出によシ影響を受けたプロセッサ０１０１にハードウェア・インタラブドが発生さｎる。ハードウェア・インタラブドが致命的な障害（即ち影響を受けたプロセッサ０１０１が動作を継続することが出来ず、サービス中止状態としなければならないような程度の障害）の生起全指示する場合、インタラブドに応動する機構は自動的に停止および切替え信号を発生する。停止および切替え信号に対するプロセッサ０１０１の応動は第９図に論理流れ図として示されている。ブロック５００における停止および切替え信号の発生は保守チャネル１０４ａに応動して行われ、ブロック５０１中に示すように他のプロセッサ１１０２に対するＭＲＦ呼び出しが実行されることになる。停止および切替え信号はまたブロック５０２中に示すように障害を起したプロセッサ０１０１を停止させる。第８図の考察に戻ると、保守チャネル１０◆ａが他のプロセッサ１１０２にＭＲＦ呼び出しを発生するとき、ＭＲＦはプロセッサ１１０２が不活性状態であるときのみプロセッサ１上に呼び出さ扛る。不活性なプロセッサｌであると、ＭＲＦ呼び出しはＭＲＦ呼び出し要求のプロセッサ１１０２の障害回復ソフトウェアの告示となる。プロセッサ１１０２の障害回復ソフトウェアはプロセッサ０１０１の以前の状態の関数として応動する。プロセッサ０１０１がＭＲＦ’ｉプロセッサ１１０２上に呼び出したときプロセッサ０１０１が活性状態にあると、プロセッサ１１０２の障害回復ソフトウェアはプロセッサ１１０２に対するハード的収束を実行することによシ応動する。ハード的収束のプロセスは第１５図と関連して議論する。しかしプロセッサ０１０１が不活性状態であると、プロセッサ１１０２の障害回復ソフトウェアはプロセッサ０１０１が障害を起していると見做し、従ってプロセッサ０１０１をサービスから取シ除く。プロセッサ除去のプロセスは第１１図と関連して議論する。ハードウェア・インタラブドが致命的な障害を・指示しない場合、このハードウェア・インタラブドは影響を受けたプロセッサ０１０１において誤りの型に依存して適当なしノベルのソフトウェア・インタラブドに変換さ１．ム同様に、障害がプロセッサ０１０１のソフトウェア中で検出されると、影響？受は念プロセッサ０ｊ０１において適当なレベルのソフトウェア・インタラブドが発生されることになる。ソフトウェア・インタラブドは影響金受けたプロセッサ０１０１のマイクロコードによって応動される。マイクロコー・ドはプロセッサ０１０１のソフトウェアに対する障害のインパクトを調べる。すべてのインタラブドがマスクされ、プロセッサ０１０１の障害回復機能が現在実行されていること金示す場合、ＭＲＦに対する呼び出しが障害を起したプロセッサ０１０１上で行われる。ＭＲＦは第６および７図に示すようにプロセッサ０１０１のＩＳＣビットの値の関数として障害に応動する。マイクロコードて対するすべてのインタラブドがマスクされていない場合には、インタラブドは影響全党けたプロセッサ０１０１の障害回復ソフトウェアに対する誤りインタラブド全発生させる。これに応動して、影響を受けたプロセッサ０１０１の障害回復プログラムは適当な誤９カウンタ（図示せず）を更新、即ち増加させ、その状態を調べる。カウンタの更新により指定された閾値計数値を越すと、障害回復機構はシステム１００め構成のソフト的変更全試みる。実行されるソフト的変更の型はシステム１００の現在の構成の関数である。システム１００が活性−活性構成であると、試みられるソフト的変更は他のプロセッサ１０２に対するソフト的収束である。ソフト的収束のプロセスは第１３図と関連して議論する。システム１００が活性−待機構成であると、ソフト的変更は他のプロセッサ１０２に対するソフト的切替えである８ソフト的切替えのプロセスは第１４図と関連して議論する。試みられたソフト的変更が失敗に終ると、影響を受けたプロセッサ０１０１の障害回復ソフトウェアは他のプロセッサ１１０２に対するハード的変更を試みる。実行されるハード的変更の型はシステム１０Ｇの現在の構成の関数である。システムが活性−活性構成にあると、試みられるハード的変更は他のプロセッサ１１０２に対するハード的収束である。ハード的収束のプロセスについては第１５図と関連して議論する。システム１００が活性−待機構成であると、ハード的変更は他のプロセッサ１１０２に対するハード的切替えとなる。ハード的切替えのプロセスについては第１６図と関連して議論する。ソフト的変更が成功すると、現在残りの活性状態にあるプロセッサ１１０２上で実行されている障害回復プログラムはソフト的変更のオペレーティング・システム核を通知する。ソフト的変更の核の通知後、あるいはカウンタの更新によっても指定された閾値計数値を越さない場合、障害回復プログラムは障害に関して集められた情報を調べ、システム１００のソフトウェアが障害によって影響を受けたかどうかを決定する。ソフトウェアが影響を受けない場合には、核がその上で実行さｉｔているプロセッサはシステム・タスクの実行を再開する。ソフトウェアが影響全党けると、障害回復プログラムはまた核に対し障害に関して集めた情報を知らせる。前述の議論が示すように、障害に関する情報が提供さｎた核はプロセッサの変更が成功裡に行われたか否かに依存して障害を起したプロセッサ０１０１または他方のプロセッサ１１０２上で実行さｎる。核は障害回復プログラムから受信され念情報金調べて核そｎ自身が障害によって影響を受けたかどうか、あるいけ他の核でないプログラムがそれＫよって影響を受けたかどうかを決定する。核が七扛自身障害によって影響を受けたと決定すると、核は障害回復全要求し、核を実行しているプロセッサ上にＭＲＦ−ｉ呼び出す。呼び出し源はＭＲＦから見るとシステム・ソフトウェアであるように見える。（即ちＭＲＦに対する手動要求ではない。）従ってＭＲＦはそれが呼び出されたプロセッサのＩＳＣビット２１１および２１２の指令に従って応動する。核がそれ自身障害てよって直接影響されなかったと決定すると、核は他のどのプログラムが障害によって影響されたかを決定する。影響を受けたプログラムが障害エントリ・ポイントを有していないと、該プログラムは核によって終了される。影響されたプログラムが障害エントリ・ポイントを有している場合、該プログラムは核の指示によシその障害エントリ・ポイントよ夕実行さｎる。障害エントリ・ポイントから入った後、プログラム（はそれ自身全清掃する。即ち障害の影響を回復する。このダラムがそれ自身システム資源に対する制ａｔ有しておシ、その資源はシステムの初期化によってのみ回復し得るものと決定すると、該プログラムはシステムの障害回復プログラムに対し該プログラムが実行されているプロセッサ上にＭＲＦ　ｉ呼び出すこと全要求する。ＭＲＦに対する呼び出し源は尚ＭＲＦにとってはシステム・ソフトウェアであると見做さｎているので（即ちＭＲＦＫ対する手動要求ではない）、ＭＲＦはその上に呼び出されたプロセッサのＩＳＣビット２１１および２１２の指令に従って応動する。システムの障害回復の一部として自動的に実行さｎた前述の構成の変化はシステム１００が行う唯一の構成変化ではない。例えばシステム１００はサービス金していないプロセッサが活性となる状態にあると決定する診断に応動して活性−非サービス構成から活性−待機構成の如き他の自動変更も行い得る。活性−待機から活性−活性状態への変化、またはその逆はプログラムの要求に応動して行われ得る。そしてシステム１ｏｏｕシステム１００のオペレータにより手動で加えられたコマンドに応動して要求されるどのような変更も行い得る。第２図の種々の状態変化中に含まれている動作については次に述べる。先に述べた如く、システム１００は電源投入時活性／非サービス（ＯＯ８）状態５または６となる。システム１００ハ活性／非サービス状態５または６から活性 −待機状態３または４に２つの方法の内のいずｊ、かの方法で遷移する。まず第１に活性状態にあるプロセッサは周期的に検査プロセスおよび他の診断プロセスを非サービス状態のプロセッサ上で実行１７てそのプロセッサの状態全決定する。非サービス状態のプロセッサが診断を通過し、該プロセッサが待機状態となり得ることが示さｎると、復旧コマンドが自動的に活性状態にあるプロセッサに与えらｒ２る。そして第２に、活性状態にあるプロセッサは手動コマンドを受信して非サービス状態にあるプロセッサを復旧することが考えら扛る。復旧には非サービス状態のプロセッサを待機状態に遷移ζせること金含んでいる。復１日のプロセスは第１０図に論理図として示さｎている。第１０図に示すように、ブロック６００に示すように復旧指令全受信すると、活性状態にあるプロセッサ（例えばプロセッサ０１０１はプロセッサＥＣＤ２００の適当なインディケータ２１８および２２０（第５図参照）を検査し、ブロック６０１に示すよう例システム構成が本当に活性／非サービス状態にあるかどうかを確認する。もしそうでない場合には活性状態にあるプロセッサ０１０１はブロック６０２に示すように誤シメッセージを発生する。システムの構成が活性／非サービスであると、活性状態にあるプロセッサ０１０１は次に第５図に示すようにＳＳＲのフラグ・ビットとして実現されたインディケータ２０９をセットし、主記憶更新回路１１５および１２５全してブロック６０３に示すように主記憶装置１１４および１２４の更新全再開させる。更新能力の復旧に続いて、活性状態にあるプロセッサ０１０１はこの能力を使用してブロック８０４に示すようにその主記憶１１４の内容を他のプロセッサ１１０２の主記憶１２４中にコピーする。このようにして主記憶１１４と１２４の内容は同一となる。次に活性状態にあるプロセッサ０１０１はブロック６０５に示すように待機状態にあるプロセッサ１１０２の準備を整える。この準備には待機状態にあるプロセッサ１１０２上におけるパリティ検査の如きテストの実行が含まれており、これによって待機中のプロセッサ１１０２が活性状態となり得る状態にあることが確認される。待機中のプロセッサ１１０２が前記の準備を整えるテストに失敗すると（ブロック６０６）、活性状態にあるプロセッサ０１０１はブロック６０７に示すように復旧を中止する。復旧の中止は例えば再び主記憶更新ユニット１１５および１２５が主記憶１１４および１２４を更新を中止させ、システム１００のオペレータにエラー・メツセージを発すること金含んでいる。待機中のプロセッサ上１０２がブロック６０６において前記の準備を整えるテストに合格すると、活性状態にあるプロセッサ０１０１ばＥＣＤに入り、適当なインディケータ２１８および２１９の［’ｚｆｆｉ更することにより他方、即ち非サービス状態のプロセッサ１１０２をブロック６０８中に示すように待機状態としてマークする。プロセッサ１１０２の待機状態に対する復旧は完了し、活性プロセッサ０１０１はブロック６０９に示すようにその活動を継続する。復旧プロセスの逆は除去プロセスでオシ、該プロセスはシステム１００の状態３筐几は４から状態５または６への遷移を含んでいる。除去プロセスは待機状態にあるプロセッサを除去して非サービス状態とする。このプロセスは第１１図に論理図として示されている。第１１図゛に示すように、除去コマンド、即ち要求を受信すると（ブロック７００　）、活性状態にあるプロセッサ、例えばプロセッサ０１０１はＥＣＤのインディケータ２１９および２２０によって記憶された情報全チェックし、ブロック７０１に示すようにシステムの構成が本当に活性−待機状態であるかどうかが確認される。システム構成が活性−待機状態にないと、活性状態にあるプロセッサ０１０１はブロック７０２に示すようにエラー・メツセージを出力する。システム構成が活性−待機状態であると、活性状態にあるプロセッサ０１０１は再びＥＣＤに入り、ブロック７０３に示すようにその中に他方、即ち待機中のプロセッサ１１０２が非サービス状態であることを示す情報を記憶させる。次に活性状態にあるプロセッサ０１０１はＳＳＨのインディケータ２０９をリセットし、ブロック７０４に示すように主記憶更新回路１１５および１２５全して夫々の主記憶１１４および１２４の他方の主記憶中に加えられた情報による更新を中止させる。次に活性状態にあるプロセッサ０１０１はブロック７０５に示すようにその活動を継続する。除去プロセスは実行プログラムに対しては完全にトランスペアレント（透明）である。何故ならば除去さｎたプロセッサ上ではプログラムは実行さｎていなかったからである。収束モード１０の活性−待機状態３または４から夫々発散モード１１の活性−活性状態１または２への遷移が第１２図に論理図として示さｎている。発散コマンドを受信すると（ブロック８００　）、活性状態にあるプロセッサ、例スばプロセッサ０１０１はＥＣＤにアクセスし、ブロック８０１に示すようにシステム１００が活性−待機構成にあることを検証する。システム１００が活性 −待機構成されていないと、活性状態にあるプロセッサ０１０１はブロック８０２に示すようにエラー・メツセージを発生する。システム１００がブロック８０１に示すように適当に構成されていることが見出されると、活性状態におるプロセッサ０１０１はブロック８０３に示すように他のプロセッサ１１０２に対する必要なオペレーティング・システムの構造を生成し、他方のプロセッサ１１０２がオペレーティング・システムのそれ自身のバージョンを実行する準備を整える。第４図に示すように、これはせグメント・チー・プルおよびデータのコピーの生成および第２のインタラブド・スタックおよびディスパッチ・キュー３１１の生成を含んでいる。第１２図に戻ると、活性状態にあるプロセッサ０１０１は次にブロック８０４に示すように障害回復プログラムのシャドウを生成する。シャドウとはシステム１００においてプロセッサ毎に実行されねばならない活動を実行する障害回復プログラムの部分コピーでおる。システム全体として実行する必要のある動作（例えば正常さを示すタイマの保守）は主プロセツサｏ１０Ｌ即ち現在活性状態にあるプロセッサの障害回復プログラムによって実行され、シャドウ（これは２次プロセッサ１１０２上で実行される）から除外される。シャドウの生成に続いて、活性状態にあるプロセラササ１１０２を周知の初期化された状態とする。活性状態にあるプロセッサ０１０１はまたブロック８０６に示すようにＩＳＣビット２１１および２１２のアイドル状態を“１．１’から“ １０＃に変更し、予期される活性−活性プロセッサ構成を反映させる。活性状態におるプロセッサ０１０１は次に保守チャネル１０４を使用して他方のプロセッサ１１０２上でテスト・ルーチンを実行させ（ブロック８０７　）、他方のプロセッサ１１０２が活性状態となり得る状態にあることを検証する。他方のプロセッサ１１０２がテストに失敗すると（ブロック８０８）、活性状態にあるプロセッサ０１０１はブロック８０９に示すように発散プロセスを中止する。発散プロセスの中止は例えばインタラブド・スタックお：びディスパッチ・キュー３１１および他方のプロセッサ１１０２のために生成された他の構造の除去、障害回復プログラムのシャドウの終了、ＩＳＣビット２１１および２１２のアイドル状態を“１１″にリセットすることおよびシステム１０００オペレータに対するエラー・メツセージを発生することを含んでいる。他方のプロセッサ１１０２がブロック８０８においてテストに合格すると、活性状態にあるプロセッサ０１０１はブロック８１０に示すようにシャドウを他方のプロセッサ１１０２のディスパッチ・キューに移す。ＯＰＰ　ＩＲ線路１０５ａを使用することによって、活性状態にあるプロセッサｏ１０１は他方のプロセッサ１１０２中でインタラブドを発生させ、これはブロック８１１に示すように他方のプロセッサ１１０２上で実行されるシャドウとなる。シャドウが他方のプロセッサ１１０２中で障害を見出したと報告すると（ブロック８１２）、活性状態にあるプロセッサ０１０１はブロック８１３に示すように再び発散を中止させる。シャドウが他方のプロセッサ１１０２中に障害が無いと報告すると（ブロック８１２）、活性状態にあるプロセッサ０１０１はブロック８１４に示すように２つのプロセッサのディスパッチ・キューを発散させる。ディスパッチ・キューの発散はいくつかのタスクを活性状態にあるプロセッサ０１０１のディスパッチ・キューから他方のプロセッサ１１０２のディスパッチ・キューに転送することを含んでいる。各タスクは主プロセツサと２次プロセッサのいずれの上で実行されることが好ましいを示す情報を有していても良く、活性状態にあるプロセッサ０１０１はこの情報に基づいてディスパッチ・キューを発散させる。ディスパッチ・キューの発散につづいて、活性状態にあるプロセッサ０１０’ｌは再び０ＰＰＩＲ線路１０５ａを使用してブロック８１５に示す↓うに他方のプロセッサ１１０２の動作を開始させる。元々活性状態にあるプロセッサＯ↑０１は主プロセツサに留まり、以前に待機状態にあったプロセッサ１１０２は２次プロセッサとなる。このようにして発散プロセスは完了し、主プロセツサ０１０１はブロック８１６に示すようにその正規の処理動作を再開する。発散モード１１の状態１お工び２から、システム１００はソフト的収束プロセスによって活性−待機状態３または４に戻される。システム１００は主プロセツサまたは２次プロセッサにソフト的に収束し得る。２つのソフト的収束プロセスは実質的に同一であり、両者は第１１図に論理図として示されている。ソフト的収束指令を受信すると（ブロック９００）、指令を受信するプロセッサ（例えばプロセッサ０１０１）はブロック９０１に示すようにプロセッサ１０１および１０２の内子゛活性状態となる方のディスパッチ・キュー上に収束プログラムを配置する。この立ち退くプロセッサはプロセッサ１０１および１０２のいずれでらっても良く、従ってプロセッサ０１０１は収束プログラムをそれ自身または他方のプロセッサのディスパッチ・キュー上に配置することが出来る。例えば、プロセッサ０１０１がそれ自身に収束しているとき、該プロセッサは収束プログラムを他方のプロセッサ１１０２のディスパッチ・キュー上に配置する。プロセッサ０１０１は次にブロック９０２に示すようにその処理動作を継続する。収束プログラムはシステム１００における最も優先度の低いタスクでらる。その結果、該プログラムは、立ち退くプロセッサ上の他のプログラムがインタラブド即ち実行の途中に停止されて実行の継続を待機している状態にないときにのみ、立ち退くプロセッサ上で実行される。このようにして、収束プログラムの実行が開始されると、エリ優先度の高いプログラムによってインタラブドされていたより優先度の低いプログラムは存在せず、従って立ち退くプロセッサのインタラブド・スタックは空であることが保証される。インタラブド・スタ゛ククはごく普通のものでおって、インタラブドされたプログラムの実行を再開するために必要な情報を記憶するだめのＦＵＦＯで動作する記憶領域でちる。ブロック９０３において実行が開始されると、収束プログラムは立ち退くプロセッサをしてＥＣＤにアクセスさせ、ブロック９０４に示す↓うにシステムが活性 −活性構成にあることを検証させる。システムの構成が活性−活性でないと、収束プログラムはブロック９０５に示す↓）にエラー・インデイケ・−ジョンを発生させる。この時点で収束プログラムは終了し、システム１００け他のプログラムの実行を継続する。システムの構成が活性−活性であることが見出されると（ブロック９０４　）、収束プログラムはブロック９０６に示すようにそれが実行されているプロセッサ、即ち立ち退くプロセッサ上に核収束プログラムを急派する。収束プログラムはまたブロック９０６に示すように核収束プログラムの実行優先度レベル金最高レベル（Ｃ上げる。これに工り一度核収束プログラムが実行を開始すると、この核収束プログラムがインタラブドされて、他のタスクにとってかわられることがないことが保証される。核収束プログラムが立ち退くプロセッサ上で実行されるとき、該核収束プログラムはブロック９０７に示すように０ＰＰＩＲ１０５を介して他のプロセッサにインタラブドを送信する。次に核収束プログラムはブロック９０８に示すように立ち退くプロセッサを停止させる。ブロック９１０において立ち退くプロセッサから受信するインタラブドに応動して、他方の活性状態におるプロセッサはブロック９１１中に示す↓うにプロセッサのＩＳＣビット２１１および２１２のアイドル状態を“１０″から“１１″′ に変更し、活性−不活性プロセッサ構成を反映させる。次に残りの活性状態にあるプロセッサはブロック９１２に示す工うに２次プロセッサのディスパッチ・キューから主プロセツサのディスパッチ・キューにナベてのタスクをｙすことにより２つのプロセッサのディスパッチ・キューを収束させる。障害回復プログラムのシャドウは最早不要であり、ブロック９１３に示すように残りの活性状態にちるプロセッサはシャドウを終了させる。ここでブロック９１４に示す工うに主プロセツサに対するソフト的収束と２次プロセッサに対するソフト的収束とは異なる。要求された収束が２次プロセッサに対するものでｂると、残りの活性状態にあるプロセッサは２次プロセッサであり、該プロセッサはブロック９１５に示すようにインディケータ２１Ｇにアクセスしてプロセッサ１０１および１０２のアイデンティティを切替える。前に主プロセツサで多つた停止されたプロセッサは現在は２次プロセッサとなり、以前２次のプロセッサでめった残りの活性状態にるるプロセッサは現在主プロセツサとなる。プロセッサのアイデンティティの変更に続いて（即ち要求された収束が主プロセツサに対するものである場合）、残りの活性状態にあるプロセッサはプロセッサはＥＣＤに入り、インディケータ２１９および２２Ｇにアクセスして、ブロック９１６中に示すようにシステム１００が現在活性−待機状態３または４にあることを示す情報をその中に記憶させる。次に残りの活性状態にあるプロセッサはシステム１００の動作を継続する。状態３または４の活性−待機構成にあっては、プロセッサ１０１および１０２は状態が切替えられる。ソフト的切替えにより実行中のプロセスまたは現在進行中の入出力動作に対してはトランスペアレントな仕方で一方のプロセッサから他方のプロセッサにシステムの活動が切替えられる。ソフト的切替えは第１４図に論理図として示されている。ソフト的切替え要求を受信すると（ブロック１０００）、活性状態にあるプロセッサ（例えばプロセッサ０１０１）はブロック１００１に示すようにＥＣＤにアクセスしてシステム１００の構成が活性−待機状態であるかどうか決定する。もしそうでない場合には、活性状態にあるプロセッサ０１０１はブロック１００２に示すようにシステム１００のオペレータにエラー・メツセージを発スる。システム１００の構成が活性−待機状態であると、活性状態にあるプロセッサ０１０１は正規のタスクの実行を停止してブロック１００３に示すように活性状態にらるプロセッサ０１０１の状態を凍結させる。次にプロ・セツスしてブロック１００４に示す工うにその内部プロセッサ状態を決定する。以前活性状態にあったプロセッサ０１０１の初期プロセッサ状態が一度決定されると、プロセッサ０１０１はブロック１００５に示すように保守チャネル１０４を使用して他方のプロセッサ１１０２を前記内部プロセッサ状態にセットする。この操作にはプロセッサ１１０２のインディケータ２００をプロセッサ０１０１の相応するインディケータ２００によって保持されている状態にセットすることが含まれており、従ってプロセッサ１１０２は主プロセツサとなる。次にプロセッサ０１０１はブロック１００６に示すように他方のプロセッサ１１０２に開始を告げるコマンドをＭＴＣ）（１０４ａを介して送信する。他方のプロセッサ１１０２は正規のシステム処理活動を以前活性状態にあったプロセッサ０１０１が活動を停止した地点から引き継ぎ、ブロック１００７に示すようにプロセッサ０１０１は停止し、待機状態となる。ブロック１１００においてハード的収束指令を受信すると、この指令を受け取った残りの活性状態にあるプロセッサ（例えばプロセッサｏ１０１）はそのＳＳＲのインディケータ２０９をリセットし、ブロック１１０１に示す↓うにそのＭＡＳＵｌ　１５をして他方のプロセッサの主記憶１２４の更新を中止させる。プロセッサ０１０１はまたプロセッサのＩＳＣビット２１１お↓び２１２のアイドル状態をブロック１１０２に示ｊ、ｃうに”１０’から“１１″に変化させ、予期される活性／非サービスプロセッサ構成を反映する。次にプロセッサ０１０１はＥＣＤに入り、その中でブロック１１０３に示すように他方の停止したプロセッサ１１０２を非サービス状態とマークする。・次に、活性状態にあるプロセッサｏ１０１はブロック１１０５に示すように２次プロセッサのディスパッチ・キューからのすべてのタスクを主プロセツサのディスパッチ・キューに移すことにより主お↓び２次プロセッサのディスパッチ・キュー全収束させる。主プロセツサはプロセッサ１０１お；び１０２のいずれてらってもよく、従ってプロセッサ０１０１はディスパッチ・キューをそれ自身またはプロセッサ１０２のディスパッチ・キューに収束させる。活性状態にあるプロセッサ０１０１は次に適当なインディケータをセットする如きステップを実行シフ、ブロック１１Ｃｉ６中に示すようにすべてのプロセスを実行前に再初期化状態とする。障害回復プログラムのシャドウは後続の収束では必要でなく、従って活性プロセッサ０１０１はブロック１１０γに示すようにシャドウを終了する。この時点においてブロック１１０８に示すように、主プロセツサに対するハード的収束と２次プロセッサに対するハード的収束は異なる。活性状態におるプロセッサ０１０１が２次プロセッサであると、実行されているプロセスは２次プロセッサに対するハード的収束であり、活性状態にあるプロセッサ０１０１はインディケータ２０９にアクセスしてプロセッサ・アイデンティティを切替え、それ自身を主プロセツサとする（ブロック１１０９）。プロセッサ・アイデンティティの切替えに続いて（即ち活性状態にあるプロセッサ０１０１が主プロセツサであり、従ってハード的収束プロセスは主プロセツサに対するものであるとき）、活性状態にあるプロセス０１０１はＥＣＤに入り、ブロック１１１０に示すようにその中にシステムの新らしい活性／非サービス状態を示す情報を記憶する。次にプロセッサ０１０１はブロック１１１１に示すように正規のシステム処理活動を継続する。システム１００は状態３または４の活性−待機構成から状態６または５の非サービス／活性構成にハード的切替えを行う。システム１００はまた活性／非サービス状態５お工び非サービス／活性状態６の間で状態を切替え、以前に非サービス状態てらったプロセッサを活性状態、即ちオンラインとし、以前に活性状態であったプロセッサを非サービス状態、即ちオフラインとする。ハード的切替えおよび強制オンライン／強制オフラインプロセスは共に同様なステップを含んでいる。両方のプロセスは第１４図に論理図として示されている。ブロック１２００においてハード的切替えまたは強制オンライン／強制オフライン指令を受信すると、以、前不活性状態で６ったプロセッサ（例えばプロセッサ０１０１）は、ブロック１２０１に示す工うに活性化され、それ自身初期化される。初期化のレベルは第６および７図と関連して以前に議論した如き基本レベルである。この時点において他方の以前活性状態であったプロセッサ１１０２は不活性状態であす、ハード的切替え、またはＦ　ＯＮ　Ｌ／ＦＯＦＬプロセス（第８図参照）の実行に導いた停止および切替え信号によって停止された状態にるる。活性化されたプロセッサｏ１０１はまた適当なインディケータをセットする如きステップを実行し、ブロック１２０２に示すように実行前にすべてのプロセスを初期化させる。ブロック１２０３に示すように、次にプロセッサ０１０１はシステム１００の活性状態にあるプロセッサとして活動を開始する。活性状態にあるプロセッサ０１０１はＥＣＤに入り、ブロック１２０４に示すように現在のシステムの構成を示し、現在不活性でろるプロセッサ１１０２を非サービス状態であるとマークする情報をその中に記憶させる。次に活性状態にるるプロセッサ０１０１はブロック１２０５に示すように正規のシステム・タスクの実行を継続する。もちろん、前述の図示の実施例に対し種々の変更および変形を加え得ることは当業者にあっては明白である。例えば、不発明は任意の適当な処理システム上で実現することが出来る。このような変更および菱形は本発明の精神および範囲を逸脱することなく、またその付随する利点を損うことなく実現し得る。従って、そのような変更および変形は別記の特許請求の範囲に含まれる。八４６Ｆ渥７　゛Ｆπ夕　６２にｌ７ζＩんてＢＦにｌ　ｂてＩ □／６国際調査報告１ｍ、１１ｅａａ’　ｈ−ｅｓ＝ｎ　Ｎ１１．　ＰＣＴ／ＵＳ　８５１００９３６

Claims

【特許請求の範囲】

１．処理システムにおいて、該処理システムは：第１および第２のプロセツサ（１０１、１０２）と；第１のプロセツサ中に含まれる第１のメモリ（ＭＡＳＵＯ）と第２のプロセツサ中に含まれる第２のメモリ（ＭＡＳＵＩ）と；第１および第２のメモリを相互接続する更新バス（１０３）とを含み；前記更新バスは各メモリを更新し、内容の変更は他方のメモリ中で行なわれ、それによつて第１および第２のメモリが同じ内容を有するようにし；プロセツサはある条件に応動して自動的に第１（１０）および第２（１１）の動作モードの一方から他方にシステムの動作を変更し、第１のモードにあつては両方のプロセツサは活性状態にあり、各々は互いに他とは独立に第１および第２のタスク・グループの内の異なる一方から選択されたタスクを実行し、第２の動作モードにあつては２つのプロセツサの内選択されたものは不活性状態であり、プロセツサの他方は活性状態であつて第１および第２のタスクの両方から選択されたタスクを実行することを特徴とする処理システム。
２．請求の範囲第１項に記載の処理システムにおいて、前記ある条件は手動およびプログラム・コマンドならびに第１および第２の型のシステム障害状態より成ることを特徴とする処理システム。
３．請求の範囲第１項に記載の処理システムにおいて、第２のモードにある不活性状態のプロセツサはタスクの実行の準備が出来た状態で待機しており；プロセツサは：選択されたプロセツサを選択的に開始および停止させる回路を含み、デイスパツチ・キユー（３１０、３１１）、システムステータス・インデイケータ（第４図）およびチヤネル（ＯＰＰＩＲおよびＭＴＣＨ）はプロセツサと協同動作して一方のプロセツサが停止しているとき第１および第２のグループのタスクを実行するべく活性プロセツサに割当て、両方のプロセツサが活性状態にあるとき第１のグループのタスクを一方のプロセツサに、第２のグループのタスクを他方のプロセツサに割当てることを特徴とする処理システム。
４．請求の範囲第３項に記載の処理システムにおいて、第１のグループおよび選択的に第２のグループからのタスクを同定する活性状態にあるプロセツサと関連する第１のデイスパツチ・キユーと；第２のグループのタスクを同定する第２の活性状態にあるプロセツサと関連する第２のデイスパツチ・キユーとを含み、該デイスパツチ・キユー（３１０、３１１）、システム・ステータス・インデイケータ（第４図）およびチヤネル（ＯＰＰＩＲおよびＭＴＣＨ）は１つのプロセツサが停止したとき第１および第２のデイスパツチ・キユーを収束させ、両方のプロセツサが活性状態になつたとき第１および第２のキユーを発散させることを特徴とする処理システム。
５．請求の範囲第１項に記載の処理システムにおいて、該システムは更に：第１および第２の周辺デバイスと；第１の周辺デバイスと第１および第２のプロセツサの間に介在配置され、第１の周辺デバイスを第１および第２のプロセツサの一方と選択的に接続する第１のコントローラと；第２の周辺デバイスと第１および第２のプロセツサの間に介在配置され、第２の周辺デバイスを第１および第２のプロセツサの１つと選択的に接続する第２のコントローラを含むことを特徴とする処理システム。
６．第１および第２のプロセツサと、該第１のプロセツサ中に含まれる第１のメモリと、第２のプロセツサ中に含まれる第２のメモリとを含み、該第１および第２のメモリは障害回復プログラムおよび実行すべきプログラムのアイデンテイテイを保持する第１のデイスパツチ・キユーを含むプログラムを含む同じ内容を有しており、更に第１および第２のメモリを相互接続する装置を含み、それによつて内容の変更は他方のメモリ中で行なわれるという形で、各メモリを、第２のプロセツサが不活性状態であり、第１のプロセツサが活性状態であり、第１のデイスパツチ・キユーによつて同定されたプログラムから選択されたプログラムを実行している第１の状態から、第１および第２のプロセツサの内の異なる一方によつて実行されるべきプログラムのアイデンテイテイを各々保持している第１および第２のデイスパツチ・キユーが存在し、両方のプロセツサが活性状態にあり、夫々のデイスパツチ・キユーによつて同定された各々のプログラムとは独立に実行している第２の状態に更新する処理システムのシステム動作を自動的に変更する方法において、該方法は：第２のプロセツサによつて実行されるべきプログラムを同定する第２のデイスパツチ・キユーを生成し；障害回復プログラムの選択された部分より成るシヤドウ障害回復プログラムを生成し；第２のプロセツサを周知の状態に設定し；シヤドウ障害回復プログラムのアイデンテイテイを第２のデイスパツチ・キユー中に配置し；シヤドウ障害回復プログラムを第２のプロセツサ上で実行し；第２のプロセツサによつて実行すべきプログラムのアイデンテイテイを第１のデイスパツチ・キユーから第２のデイスパツチ・キユーに転送し；第２のプロセツサを開始させて第２のデイスパツチ・キユーによつて同定されたプログラムを実行し；第１のデイスパツチ・キユーによつて同定されたプログラムの第１のプロセツサによる実行を継続するステツプより成ることを特徴とする方法。
７．両方のプロセツサが活性状態にあり、夫々のデイスパツチ・キユーによつて同定された各々のプログラムとは独立に実行する第１の状態から、第２のプロセツサはプログラムの実行の準備が出来た状態で待機しており、第１のプロセツサは活性状態にあり、第１のデイスパツチ・キユーによつて同定されたプログラムから選択されたプログラムを実行する第２の状態にシステムの動作を自動的に変更する第６項に従う方法において、該方法は：第１のプログラムのアイデンテイテイを第２のプロセツサのデイスパツチ・キユー中に配置し；インタラプトされたプログラムが第２のプロセツサのデイスパツチ・キユーによつて同定されないときにのみ第１のプログラムの実行を開始し；第１のプログラムの実行に応動して第２のプログラムをインタラプトすることなく第２のプロセツサ上で実行させ；第２のプログラムの実行に応動して第１のプロセツサをインタラプトし；第２のプロセツサを停止させ；インタラプトに応動してプログラムのアイデンテイテイを第２のデイスパツチ・キユーから第１のデイスパツチ・キユーに移し；シヤドウ障害回復プログラムのアイデンテイテイを第１のデイスパツチ・キユーから取り除き；インデイケータ装置をチエツクして第１のプロセツサが主プロセツサであるかどうかを決定し；第１のプロセツサが主プロセツサでない場合、インデイケータ装置を変更してプロセツサを切替え；第１のデイスパツチ・キユーによつて同定されたプログラムを第１のプロセツサ上で実行することを継続するステツプより成る方法。
８．両方のプロセツサが活性状態で、夫々デイスパツチキユーによつて同定された各々のプログラムとは独立に実行を行う第１の状態から、第２のプロセツサが非サービス状態で、第１のプロセツサが活性状態で、第１のデイスパツチ・キユーによつて同定されたプログラムから選択されたプログラムを実行している第２の状態にシステム動作を自動的に変化させる第６項に従う方法であつて、該方法は：第２のプロセツサを停止させ；メモリ更新装置をデイスエイブルし；プログラムのアイデンテイテイを第２のデイスパツチキユーから第１のデイスパツチ・キユーに移動させ；第１のデイスパツチ・キユーによつて同定されたプロセスを初期化し；シヤドウ障害回復プログラムのアイデンテイテイを第１のデイスパツチ・キユーから取り除き；インデイケータ装置をチエツクして第１のプロセツサが主プロセツサとなつているかどうかを決定し；インデイケータ装置を変更してもし第１のプロセツサが主プロセツサでない場合にはプロセツサの役害を切替え；第１のデイスパツチ・キユーによつて同定された第１のプロセツサのプログラムの実行を継続するステツプより成ることを特徴とする方法。