JPH0831047B2

JPH0831047B2 - 論理区画式データ処理装置における区画間制御のための装置及び方法

Info

Publication number: JPH0831047B2
Application number: JP3192231A
Authority: JP
Inventors: ドナルド・フレッド・オウルト; デービッド・ブラッドレイ・ピーターセン; イアン・ジョフレー・レディング; スティーブン・ジョン・シュマント
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1990-08-31
Filing date: 1991-07-31
Publication date: 1996-03-27
Anticipated expiration: 2011-03-27
Also published as: DE69113181D1; EP0472861A2; EP0472861A3; EP0472861B1; DE69113181T2; US5345590A; JPH05181823A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、論理区画式データ処理
システムに係り、一層詳細に説明すれば、１つの論理区
画内で活動状態にあるプロセスが他の論理区画内のプロ
セスに対して影響を及ぼす活動を行わねばならない場合
の、区画間対話のメカニズムに係る。

【０００２】

【従来の技術】『論理区画』論理区画化の機能を利用すると、１台の大型コンピュー
タ・システムを、マイクロコードの制御下で複数の論理
区画へ分割することができる。例えば、ＩＢＭ社のプロ
セッサ・リソース／システム・マネジャ（ＰＲ／ＳＭ）
機構を利用すると、ＩＢＭ３０９０プロセッサを複数の
論理区画へ分割することができる。論理区画（logical
partition: ＬＰ）とは、システム制御プログラム（sys
tem control program: ＳＣＰ）を実行するのに十分な
１組のハードウェア資源（プロセッサ、メモリ、チャネ
ル、等）をいう。一層詳細な背景技術については、ＩＢ
Ｍ社発行のマニュアルである「ＥＳ／３０９０プロセッ
サ・コンプレックス：プロセッサ・リソース／システム
・マネジャ（Form Number: GA22-7123）」に記述されて
いる。

【０００３】論理区画式マシンの内部では、各ＳＣＰが
互いに分離されていて、あたかもそれ自体の物理セント
ラル・プロセッサ・コンプレックス（ＣＰＣ）内に置か
れているかのようにランする。論理区画化は、非常に大
きな融通性を与える。例えば、導入設備において、一日
のうちに何回かの作業交替が行われる場合や、長期間に
わたる新しいソフトウェア又は新しいソフトウェア・バ
ージョンの試験及び移行が行われる場合には、異なった
論理区画が活動化されることがある。また、論理区画化
によれば、ユーザが、マシンの物理資源を最大限に利用
することが可能となる。

【０００４】同一の物理マシン上に複数のＳＣＰが置か
れるにも拘わらず、これらのＳＣＰは、互いに他のＳＣ
Ｐと直接的に通信したり、これを直接的に制御するため
の手段を備えていない。一方、オペレータによる各論理
区画の制御は、サービス・プロセッサに接続された１台
のシステム・コンソールを介して行われる。論理区画式
マシンの内部では、複数のＳＣＰが実際には同一のＣＰ
Ｃ上に置かれていて、これらのＳＣＰが単一のサービス
・プロセッサを共用する。さらに、ハードウェアによる
論理区画化を提供するマシンは、再構成サポート機能も
併せて提供し、この再構成サポート機能によって、各Ｓ
ＣＰがチャネルや記憶機構のような資源を追加できるよ
うになっている。ただし、この場合において、これらの
資源を各論理区画の構成に追加できるのは、これらの資
源が「解放されている」場合に限られ、ここで「解放さ
れている」とは、これらの資源が他の論理区画によって
使用されていないことをいう。

【０００５】論理区画の非活動化とは、オペレータによ
って開始される処の、一の論理区画を閉鎖（シャットダ
ウン）するための機能である。一の論理区画が非活動化
される場合、この論理区画は、それまでこの論理区画に
割り当てられていたプロセッサや記憶機構を全て解放す
るとともに、この論理区画へ構成されていたチャネル経
路をリセットする。（これ以上の詳細については、ＩＢ
Ｍ社発行のマニュアルである「ＥＳ／３０９０プロセッ
サ・コンプレックス：プロセッサ・リソース／システム
・マネジャ（Form Number: GA22-7123）」を参照された
い）。

【０００６】ＰＲ／ＳＭ機構の重要な機能の１つに、記
憶機構や物理ＣＰＣの処理能力を区画化するという能力
がある。これにより、各論理区画には、主記憶機構や拡
張記憶機構の一部分が付与される。

【０００７】ＰＲ／ＳＭ機構の記憶機構再構成機能は、
複数の論理区画の間で記憶機構の動的な再構成を行うこ
とを可能にする。すなわち、一の論理区画に割り当てら
れていた記憶機構の一部を、この論理区画から構成解除
（除去）して、他の論理区画を活動化するのに使用する
ことができる。或いは、一の論理区画を非活動化した後
に、この論理区画に割り当てられていた記憶機構の全て
を、他の論理区画へ構成することもできる。

【０００８】ＳＣＰは、サービス・コールを介して、サ
ービス・プロセッサに対し記憶機構の再構成を実行する
よう要求する。

【０００９】各論理区画用の記憶機構の構成を定義する
ために、論理区画定義フレームが使用される。また、記
憶機構の再構成機能を利用するためには、一の論理区画
用の記憶機構の割当分を、２つの別個の量で以て定義し
ておく必要がある。その１つは初期記憶量であり、他の
１つは予約記憶量である。これに加えて、物理構成内の
開始アドレスも定義しておかねばならない。第１の論理
区画用のものとして定義されていた記憶機構を、第２の
論理区画へ追加することができるのは、第１の論理区画
の記憶機構が、第２の論理区画の記憶機構の予約記憶部
分と同一の物理アドレスから開始するように定義されて
いる場合だけである。（これ以上の詳細については、Ｉ
ＢＭ社発行のマニュアルである「ＥＳ／３０９０プロセ
ッサ・コンプレックス：プロセッサ・リソース／システ
ム・マネジャ（Form Number: GA22-7123）」と、「プロ
セッサ・リソース／システム・マネジャの動的記憶機構
再構成のためのＭＶＳガイド（Form Numer: GC28-136
5）」を参照されたい）。

【００１０】各ＳＣＰは、サービス・プロセッサ・イン
ターフェースを有しており、これを介して「サービス・
コール論理プロセッサ（Service Call Logical Process
or:ＳＣＬＰ）」との通信を行う。ＳＣＰは、その記憶
機構内に制御情報をセットアップした上で、サービス・
コール命令を実行する。このサービス・コール命令に応
じて、サービス・コール論理プロセッサ（以下「サービ
ス・プロセッサ」という）が、この制御情報内で指定し
た機能を実行する。サービス・プロセッサ・インターフ
ェースの目的は、サービス・プロセッサとの通信を行
い、サービス・プロセッサが提供するサービスを呼び出
すことにある。特定の機能に応じた実行が行われるの
は、ＣＰＣ内であったり、サービス・プロセッサ内であ
ったり、又は両者の内部であったりする。

【００１１】サービス・コール命令は、「ＳＣＬＰコマ
ンド・ワード」と呼ばれる３２ビットの値と、サービス
・コール制御ブロック（Service Call Control Block:
ＳＣＣＢ）の実アドレスとを必要とする。ＳＣＣＢは、
ＳＣＬＰコマンドに関連する制御情報を保持する。サー
ビス・コール命令が完了するのは、そのＳＣＬＰコマン
ドがサービス・プロセッサによって受入れられた場合で
ある。実際の機能は、非同期的に実行される。ＳＣＬＰ
コマンドの完了は、外部割り込みコード「’２４０１’
Ｘ」（サービス信号）を持つ外部割り込みによって通知
される。

【００１２】『マルチシステム・アプリケーション』既存のアプリケーション（例えば、ＣＩＣＳ、ＩＭＳ）
について云えば、マルチシステム環境内の一のＳＣＰ
（例えば、ＭＶＳ）上で実行されている各アプリケーシ
ョンには、２通りの立場がある。その１つは「活動」
（プライマリ）であり、他の１つは「代替」（バックア
ップ）である。プライマリ・アプリケーションが、その
サービスを実行できない場合は、その役割をバックアッ
プ・アプリケーションが引継ぐようになっている。ただ
し、アプリケーションの故障ばかりでなく、ＳＣＰの故
障や、通信アクセス方式（例えば、ＶＴＡＭ）の故障に
対しても、機能保護を提供することが望まれる場合に
は、マルチシステム構成が必要となる。これらの保護を
可能とする拡張回復機能（Extended Recovery Facilit
y:ＸＲＦ）は、故障が生ずる際にそのアプリケーション
の最終ユーザが直面する処の、サービス中断時間を短縮
するのに大いに役立つものである。これ以上の詳細につ
いては、ＩＢＭ社発行のマニュアルである「ＣＩＣＳ／
ＥＳＡ￣ＸＲＦガイドＶ３．１（Form Number: SC33-06
61）」を参照されたい。

【００１３】かかるバックアップ能力を提供するために
は、導入処理の際に、各々が完全に構成された２組のシ
ステムを構築しなければならなかった。一方をプライマ
リとして機能させ、他方をバックアップとして機能させ
るためである。さらに、プライマリの故障を確認するた
めのプロセスは、オペレータの頻繁な介入や、追加のハ
ードウェア及びソフトウェアを必要としていた。例え
ば、ＣＩＣＳ￣ＸＲＦは、通常、ＣＩＣＳ又はＶＴＡＭ
の故障から自動的に回復することができるが、ＭＶＳの
故障からの回復処理は、本発明以前には、オペレータの
介入なしには完了することができなかった。すなわち、
オペレータ（又は自動化運用ツール）が、代替ＣＩＣＳ
から発行されたメッセージを見た上で、活動ＣＩＣＳが
ランしていた場合はＭＶＳイメージのシステム・リセッ
トを行うとともに、その代替ＣＩＣＳのメッセージに応
答して、このリセットの正常な完了を確認しなければな
らなかった。

【００１４】かかる所望の機能を達成するには、２通り
の方法がある。第１はオペレータが介入するというもの
であり、第２は追加のハードウェアやソフトウェア・パ
ッケージを使用するというものである。

【００１５】『オペレータの介入による解決法』以下のシナリオは、複数の論理区画を利用して高いアベ
イラビリティを達成するためには、どのようにすれば良
いかを、説明するためのものである。１．活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能となるように、これら
の論理区画を定義する。２．第１のシステムは、活動アプリケーション（例え
ば、ＣＩＣＳ）をランさせている。３．第２のシステムは、代替アプリケーションをランさ
せている。４．第１のシステムが故障する。５（ユーザによって制御された）所定時間の経過後に、
第１のシステムのステータスについて、第２のシステム
がオペレータにプロンプトを出す。６．オペレータが、第１のシステムを手動的にリセット
する。７．オペレータが、第１のシステムを手動的に非活動化
する（以前のリセットが行われていなかった場合には、
この非活動化によって第１のシステムのリセットも併せ
て行われる）。８．オペレータが、第１のシステムから記憶機構を獲得
するための再構成コマンドを、第２のシステム上で手動
的に発行するとともに、そのオペレーションが完了する
のを待機する。９．オペレータが、ステップ５で出されたプロンプトに
応答する。１０．この時点では、ワークロードを第２のシステムへ
切替えるためのプロセスを、アプリケーションが開始す
る。

【００１６】前述のシナリオにおいて、ステップ５−９
は、オペレータの手動操作を必要とする。かかる手動的
な介入が存在するために、遅延時間が長くなるのに加え
て、誤操作の可能性も生ずるから、最終ユーザにとって
の、アプリケーションのアベイラビリティが低いものと
なっている。

【００１７】『追加のハードウェア及びソフトウェアに
よる解決法』以下のシナリオは、ＮＥＴＶＩＥＷ及びＩＳＣＦという
製品を使用し且つ購入済みの追加のハードウェアを接続
して、高いアベイラビリティを達成するには、どのよう
にすれば良いかを説明するためのものである。（これに
ついては、ＩＢＭ社発行のマニュアルである「ＩＳＣＦ
の計画及び導入ガイド」（Form Number:SC30-3472）を
参照されたい）。１．活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能となるように、これら
の論理区画を定義する。２．ＮＥＴＶＩＥＷ及びＩＳＣＦという製品を購入し
て、これを導入する。また、ＰＳ／２と、ＩＳＣＦを両
システムのシステム・コンソール及びオペレータ・コン
ソールに接続するためのケーブルを購入する。３．ユーザは、所望の動作を実行するように、ＮＥＴＶ
ＩＥＷ及びＩＳＣＦの制御情報を、カストマイズしなけ
ればならない。４．第１のシステムは、活動アプリケーション（例え
ば、ＣＩＣＳ）をランさせている。５．第２のシステムは、代替アプリケーションをランさ
せている。６．第１のシステムが故障する。７（ユーザによって制御された）所定時間の経過後に、
第１のシステムのステータスについて、第２のシステム
がオペレータにプロンプトを出す。８．ＮＥＴＶＩＥＷが、このメッセージを捕捉して、ユ
ーザ側の自動化運用ツールを呼び出す。９．この自動化運用ツールは、第１のシステムの論理区
画を非活動化するために、一のＩＳＣＦ機能を呼び出
す。１０．ＩＳＣＦは、ＶＴＡＭを介して、ＩＳＣＦのＰＳ
／２と通信を行う。１１．ＩＳＣＦのＰＳ／２は、システム・コンソールと
通信を行って、非活動化機能を要求する。１２．ＩＳＣＦのＰＳ／２は、システム・コンソールを
モニタして、その非活動化機能の完了を確認する。この
機能が完了した場合、この機能は、第２のシステム上で
ＩＳＣＦと通信を行い、かかる通信を受けたＩＳＣＦ
は、ＮＥＴＶＩＥＷの自動化運用ツールへ制御を返し
て、この機能が完了したことを知らせる。１３．この時点で、自動化運用ツールは、諸資源を再構
成するために、ＭＶＳ再構成コマンドを呼び出さなけれ
ばならない。１４．自動化運用ツールは、ステップ７で出されたプロ
ンプトに応答する。１５．この時点で、ワークロードを第２のシステムへ切
替えるためのプロセスを、アプリケーションが開始す
る。

【００１８】この解決法は、オペレータによる介入が必
要とされている場合に生じがちな、長時間にわたる予測
不可能な遅延を防止するには大いに役立つものである
が、本発明と比較した場合には、著しく劣ったものと云
わざるを得ない。なぜなら、この解決法によれば、ＭＶ
Ｓの故障後に、ＣＩＣＳ￣ＸＲＦの引継ぎ処理を行おう
とした場合に、適正な動作が適正な順序で行われること
を保証できないからである。このような状況における誤
動作が、極めて重大であると云われる所以は、かかる誤
動作がユーザのデータを損傷させてしまうおそれがあ
り、しかもそのことが最終的に判明するまでの間に、か
かる損傷データによって、他の大量のデータの不正な更
新が行われてしまうおそれがあるからである。

【００１９】前述のＩＳＣＦ／ＮＥＴＶＩＥＷによる解
決法を、ＣＩＣＳ￣ＸＲＦについて利用するのに適して
いない具体的な理由は、次の通りである。１．このプロセスは、ＰＳ／２、ＩＳＣＦの接続機器
（追加の制御装置）、ＮＥＴＶＩＥＷ、ＩＳＣＦ及びＶ
ＴＡＭという夫々の製品の信頼性に依存するだけでな
く、自動化運用ツールの信頼性にも依存する。このいず
れによっても、故障発生率が増大することに加えて、追
加のハードウェア製品及びソフトウェア製品の費用も余
分にかかることになる。２．このプロセスは、既存のメッセージを代行受信（in
tercept）して、これらのメッセージに対する応答を含
む、必要な動作を自動化することを基礎とするものであ
る。従って、オペレータが、メッセージに対して早まっ
て応答してしまうという誤操作の可能性を、払拭するこ
とができない。３．このＩＳＣＦ／ＮＥＴＶＩＥＷによる解決法では、
システム・リセットを必要とするようなＳＣＰインスタ
ンスに固有の識別子を、受け取ることも、使用すること
もできない。この欠点は、データを損傷してしまうとい
う問題、健全なＳＣＰがその必要もないのにユーザから
引き離されてしまうという問題、又はＭＶＳの故障原因
を診断するためにそれまで実行していたスタンド・アロ
ーン・ダンプが失われてしまうという問題を導くおそれ
がある。４．各導入設備には、関係するメッセージを代行受信し
たときに実行すべき動作を決定するための、比較的複雑
なプログラムを書き込まねばならない。このプログラム
を開発し且つ維持するにはかなりの費用がかかり、しか
もこのプログラムは誤りを含んだものとなり易いにもか
かわらず、これをテストするのは困難である。なぜな
ら、生起しうる故障には、極めて多種類のケースが存在
するからである。また、このプログラムに誤りがあった
場合には、結果的にデータを損傷してしまうことが多い
が、かかるデータ損傷の存在は、長期にわたって表面化
しないため、その回復を行うことが非常に困難である。
また、たとえデータ損傷の存在が速やかに判明したとし
ても、損傷したデータの正しいバージョンが、バックア
ップ・コピーからの前進回復によって元の状態に復元さ
れるまでの間は、最終ユーザに対するサービスが、機能
低下したままに留まらざるを得ない。

【００２０】

【発明の概要】本発明は、第１の論理区画内のプロセス
を使用して、第２の論理区画内の全てのプロセスを、効
率的にしかも自動的に監視したり中止させることによっ
て、第２の論理区画内のワークロードを、第１の論理区
画へ移動させることができるようにするための方法及び
装置を提供するものである。

【００２１】動作について説明すると、論理区画式シス
テム内の選択された論理区画を、区画間機能を実行でき
るようにイネーブルする。次に、これらの選択された論
理区画において、オペレーティング・システムを起動さ
せる。起動された各オペレーティング・システムは、自
らを区画間機能のターゲットとしてイネーブルするとと
もに、他の論理区画内のオペレーティング・システムが
故障した際の動作を指定するポリシーを活動化する。も
し、これらの他のシステムのうちの１つが故障したなら
ば、故障システムを除く他のシステムが、自らのポリシ
ーを照会して、適正な動作を自動的に実行する。これら
の動作は、非活動化や、リセットや、故障したターゲッ
ト・システムの論理区画からの資源を再構成することを
含んでいる。

【００２２】従って、本発明の目的は、一の論理区画内
のプロセスに、他の論理区画内の故障システムの下でラ
ンしている他のプロセスの機能を引継がせる、というプ
ロセスを自動化することにある。本発明の他の目的は、
区画間制御のための信頼性の高いメカニズムを提供する
ことにある。本発明の他の目的は、複数の論理区画内で
それぞれランしているプロセス用のアベイラビリティ・
ポリシーを、高い信頼性を以て定義し且つ実現するため
のメカニズムを提供することにある。本発明の他の目的
は、一の論理区画内でランしているプロセスを、他の論
理区画内でランしているプロセスで自動的にバックアッ
プするに当たり、追加の又は信頼性の劣るハードウェア
又はソフトウェアの必要性を低減させることにある。

【００２３】

【実施例】本発明は、マルチシステム環境が確立されて
いることを必要とする。以下の説明では、マルチシステ
ム環境内の複数システムのセット（集合）を表すため
に、シスプレックスという用語（「システム」と「コン
プレックス」との合成語）を使用する。どのような複数
システムが一のシスプレックスの限界を定めるか、とい
う点を説明すると、このシスプレックス内の各システム
については、次の条件が真でなければならない（図１７
を参照のこと）。 −各システムは、共用ＤＡＳＤ上の、共通のシスプレッ
クス・データ・セット１７０１を共用しなければならな
い。 −各システムは、他のシステムが当該システムと通信で
きるように、共通のシスプレックス・データ・セット１
７０１へ、当該システムに固有のシステム許可識別子１
７０２を書き込む。この識別子の固有の値は「システム
ＩＤ」とも呼ばれ、これについては以下で詳述する。 −各システムは、シスプレックス・データ・セット１７
０１の固有のセクション（１７０３Ａ、１７０３Ｂ、１
７０３Ｃ）を要求して、これを更新する。各システム
は、この固有のセクションにおいて、タイム・スタンプ
を含むステータス・フィールド１７０４を一定の期間ご
とに更新する。また、各システムは、当該システムの故
障検出期間１７０５（この期間は導入の際に指定され
る）を書き込む。もし、一のシステムが、この故障検出
期間１７０５を超える時間にわたってステータス・フィ
ールドの更新を停止するならば、これをもって「ステー
タス更新欠落」が生じたものと判断する。 −当該シスプレックス内の各システムは、他の全てのシ
ステムのステータス・フィールドを読み取る。こうする
と、ステータス更新欠落状態を、他のシステムが検出で
きるからである。 −もし、当該シスプレックス内の一のシステムが、当該
シスプレックス内の他のシステムを対象として、アベイ
ラビリティ・ポリシーに従った動作を行うことを必要と
すれば、後者のシステムＩＤ（１７０２）が、シスプレ
ックス・データ・セット１７０１から得られる。こうし
て得られたシステムＩＤは、区画間リセット又は区画間
非活動化を行うために、ＰＲ／ＳＭ機構へ渡される。ま
た、このシステムＩＤは許可値として使用されて、前者
の論理区画が、後者（故障側）の論理区間を対象として
区画間機能を発行し得ることを表す。

【００２４】図１には、本発明の全体的なフローチャー
トが示されている。初期化段階１１は、他の論理区画を
対象とする動作を、それとは別のどの論理区画に許可し
ておくかを定義するのに必要なセットアップと、オペレ
ーティング・システムの初期プログラム・ロード（ＩＰ
Ｌ）と、このオペレーティング・システムが実行すべき
動作を制御するアベイラビリティ・ポリシーの活動化と
を含んでいる。オペレーティング・システムのＩＰＬが
正常に終了した後は、モニタ段階１２が開始する。この
モニタ動作は、故障しているように見えるオペレーティ
ング・システムを識別するためのものである。次の分離
段階１３は、故障したシステムによる共用資源のアクセ
スを防止するためのプロセスである。（一の論理区画内
でランしている）一のシステムが故障していることを確
認し、この故障システムを共用資源から分離した後は、
資源再構成段階１４により、この故障システムの資源
（例えば、記憶機構、プロセッサ、等）を解放して、同
一マシン内の異なる論理区画内でランしている他のシス
テムに、これらの資源を獲得させることができる。資源
再構成段階１４と同時に、ワークロード引継ぎ段階１５
は、故障システムのワークロードの引継ぎを行わせて、
これをバックアップ・システム上のワークロードとする
ことができる。このように、ワークロードを他の論理区
画内でランしているバックアップ・システムへ移転させ
ると、故障システムから獲得したシステム資源を利用す
ることが可能となる。

【００２５】図２には、初期化段階１１中の制御の流れ
が示されている。オペレーティング・システムのＩＰＬ
を行う前に、該当する論理区画をイネーブルすることに
より（ステップ２１）、後でいずれかのシステムが故障
した場合に必要となる、区画間機能を実行できるように
しておく必要がある。この制御は、同一のＣＰＣ上に置
かれた、ユーザが異なる複数の論理区画を、互いに適正
に分離した状態に維持することを可能にする。また、当
該技術分野では公知の、論理区画セキュリティ（ＬＰＳ
ＥＣ）フレームは、各論理区画用の、種々のセキュリテ
ィ関係の制御信号を保持している。（ＬＰＳＥＣフレー
ムの詳細については、例えばＩＢＭ社発行のマニュアル
である「ＥＳ／３０９０プロセッサ・リソース／システ
ム・マネジャ（Form Number: GA22-7123）を参照された
い）。本発明は、このＬＰＳＥＣフレームに区画間制御
許可情報を追加して、他の論理区画に影響を及ぼすよう
な区画間機能（例えば、区画間システム・リセット機
能）を、各論理区画が発行する能力を制限するようにし
ている。図３には、かかるＬＰＳＥＣフレームが示され
ている。同図に示すように、各論理区画用の区画間制御
許可情報は、ＬＰＳＥＣフレームのＸＬＰ欄３１で指定
されている。

【００２６】図３の例では、１つのＬＰＳＥＣフレーム
で、２つの論理区画（「ＰＲＩＭＡＲＹ」３２及び「Ｂ
ＡＣＫＵＰ１」３３）を定義している。「ＢＡＣＫＵＰ
１」論理区画は、区画間機能を発行することを許可され
ている（ＸＬＰ欄３１において、「ＢＡＣＫＵＰ１」論
理区画に対応する位置３４には、「イエス」を表わす
「Ｙ」が指定されている）。このＸＬＰ情報は、セキュ
リティ制御テーブル（図１８の１８０３）内に維持され
る。

【００２７】次に（図２のステップ２２）、通常の方法
で、該当する論理区画内に、オペレーティング・システ
ムを初期プログラム・ロード（ＩＰＬ）する。なお、本
実施例では、ＭＶＳをＩＰＬするように示しているが、
この機能は、ＭＶＳオペレーティング・システムには限
られない。

【００２８】次に（図２のステップ２３）、このオペレ
ーティング・システムは、その初期化段階のいずれかの
時点で、他のオペレーティング・システム・インスタン
スに対して、次の許可を与える。すなわち、その許可と
は、このオペレーティング・システムに故障が発生した
場合に、他のオペレーティング・システム・インスタン
スが、このオペレーティング・システムを対象とする動
作を実行することの許可である。この機能は図８に一層
詳細に示してあり、また同図を参照して以下で詳述す
る。

【００２９】オペレーティング・システムが動作してい
る任意の時点で、オペレータ（又は自動化運用ツール）
は、アベイラビリティ・ポリシーを活動化することがで
きる（ステップ２４）。このアベイラビリティ・ポリシ
ーは、このオペレーティング・システムに対して、他の
オペレーティング・システム・インスタンスの故障を検
出した場合に実行すべき動作を通知するものである。ア
ベイラビリティ・ポリシーについては、アベイラビリテ
ィ・ポリシーの初期化に関連して、以下で詳細に説明す
る。

【００３０】図４には、複数システムの活動をモニタす
るためのプロセスが示されている。一のシステムの故障
を検出するため、関与している各システムは、共用ＤＡ
ＳＤ上の共用データ・セット（４６）に、タイム・スタ
ンプを周期的に書き込む（ステップ４１）。このタイム
・スタンプの書き込みは、各システム内の高優先順位の
タスク（可能な最高の指名順位にセットされたタスク）
によって行われる。というのは、もし高優先順位のタス
クがその作業を完了できないのであれば、アプリケーシ
ョンがランしていない可能性も非常に高いからである。
このタイム・スタンプとともに、各システムは、共用デ
ータ・セット（４６）内に、このシステムの故障検出期
間（図１７の１７０５）を書き込む。（なお、この故障
検出期間はユーザが指定するものであって、例えば１分
に指定される）。各システムは、そのタイム・スタンプ
を書き込むことに加えて、他の全てのシステムのタイム
・スタンプを読み取ることも行う（ステップ４２）。

【００３１】他のシステムのタイム・スタンプを読み取
った後、このタイム・スタンプを現在時刻と比較する
（ステップ４３）。もし、読み取ったタイム・スタンプ
がその故障検出期間内に（例えば、最近の１分間の間
に）更新されていなければ、そのシステムがステータス
更新欠落状態にあるものと判断し（ステップ４４）、そ
の旨の表示をポリシー活動化タスク（４５）へ渡す。こ
の時点で、ポリシー活動化タスク（４５）は、アベイラ
ビリティ・ポリシーを照会して、何らかの動作を実行す
べきか否かを決定する（後述する「アベイラビリティ・
ポリシー」内のＮＯＳＴＡＴＵＳポリシー・ステートメ
ントを参照されたい）。一方、各システムが故障検出期
間内に自らのステータスの更新を行っていたならば、ス
テータスのタイム・スタンプを次に読み取るまでの間、
これ以上の動作は何も行わない。一のシステムがステー
タス更新欠落状態にあると識別され、しかもアベイラビ
リティ・ポリシーがこのシステムをマルチシステム環境
から除去すべきである旨を表示している場合には、次の
分離段階へ入る。

【００３２】図５には、分離段階の制御の流れが示され
ている。ステータス更新欠落状態を検出したシステムに
おける、オペレーティング・システム上のポリシー活動
化タスク（Policy Activation Task: ＰＡＴ）は、故障
システムがもはや共用資源をアクセスしないようにする
ために、区画間システム・リセット機能又は区画間非活
動化機能を呼び出す（ステップ５１）。この機能の詳細
については、図９及び同図に関する後述の説明を参照さ
れたい。

【００３３】区画間システム・リセット機能又は区画間
非活動化機能の実行結果をチェックして（ステップ５
２）、この機能が正常に完了したか否かを決定する。も
し、この機能が正常に完了したならば、当該シスプレッ
クスの区画化を開始する（ステップ５３）。シスプレッ
クスの区画化とは、当該シスプレックス内の一のシステ
ムが、当該シスプレックスから他のシステムを除去する
際に使用するプロセスである。（なお、一のシステムを
閉鎖する代替方法には、手動操作又はオペレータが駆動
するインターフェース（５８）を介するものもある）。
このシステムを除去する際に実行される動作は、次の通
りである。 −当該シスプレックス内にある複数システムのリスト
（図１７参照）から、ターゲット・システム（処理対象
のシステム、ここでは故障システムのこと）を除去する
（ステップ５４）。この結果、当該シスプレックス内に
ある複数システムのリストに対する将来の全ての要求に
は、この故障システムが割り当てられることはなくな
る。 −該当するオペレーティング・システム内のマルチシス
テム構成要素は、故障システムのシステム・レコード
（図１７の１７０５）が存在しないことを検出し、従っ
て以前にこの故障システムが所有していた全ての資源を
一掃して構わないということを知る。 −当該シスプレックス内の各システムが、故障システム
のかかる確認を検出した場合、追加のポリシー動作を行
わせるために、各システム上のポリシー活動化タスク
（ＰＡＴ）へ、ＳＹＳＧＯＮＥ（システム消滅）事象が
渡される。

【００３４】ＳＹＳＧＯＮＥ状態を知らされた場合、ポ
リシー活動化タスク５６は、何らかの動作を実行する必
要があるか否かを決定する。ＳＹＳＧＯＮＥ状態につい
てのポリシー活動化タスクの主たる目的は、資源再構成
段階とワークロード引継ぎ段階とをトリガすることにあ
る。これらの段階は、同時並行的に処理される。（その
詳細については、図６及び図７、並びにこれらの図面に
関連する説明を参照されたい）。

【００３５】もし分離処理が正常に完了しなければ、故
障システムがリセットされたことを確認するように、オ
ペレータに対し、プロンプトが出される。なお、オペレ
ータが故障を確認した場合には、本発明に関連する自動
運用化ツールの残りの部分の処理を続行することができ
る。

【００３６】（なお、アベイラビリティ・ポリシーに
は、分離段階を実行した後に、資源再構成段階とワーク
ロード引継ぎ段階とをバイパスさせるようなものもあ
る。）

【００３７】一のシステムが共用資源から分離された後
に、資源に関係する任意のポリシー動作が実行される。
図６には、図５のポリシー活動化タスク（５６）が、図
５の５５に示すようなＳＹＳＧＯＮＥ状態の通知を受け
取ったときに実行する処の、資源再構成に関する主要な
機能が示されている。

【００３８】一の資源を一の論理区画に移転できるよう
にするためには、この資源が、他の論理区画内の故障オ
ペレーティング・システムにもはや割り当てられていな
いことを確認する必要がある。これを達成するには、区
画間非活動化機能を呼び出して（ステップ６１）、（ア
ベイラビリティ・ポリシーが指定している）ターゲット
論理区画（故障システムの論理区画）に現に割り当てら
れている全ての資源を解放するか、又は無指定の区画間
非活動化機能を呼び出して、このポリシー動作を実行し
ているシステムの論理区画アドレッシング・レンジ内に
位置している処の、複数の論理区画に割り当てられてい
る全ての資源を解放するようにすれば良い。これらのサ
ービスの詳細については、図９及び図１０、並びにこれ
らの図面に関連する説明を参照されたい。

【００３９】故障システム及びその論理区画の資源を解
放した後は、これらの資源を、同一のＣＰＣ上に置かれ
ている他の論理区画へ再構成することができる。このよ
うにして処理される資源は、アベイラビリティ・ポリシ
ー内で指定されている。ＭＶＳは、適当なＭＶＳ￣ＣＯ
ＮＦＩＧコマンドを内部的に発行して、これらの資源
を、このシステムに対してオンライン状態となるように
構成する（このコマンドの詳細については、ＩＢＭ社発
行のマニュアルである「ＭＶＳ／ＥＳＡ動作：システム
・コマンド（Form Number: GC28-1826）」を参照された
い）。もし、このアベイラビリティ・ポリシー内で、Ｓ
ＴＯＲＥ（ＹＥＳ）が指定されているならば（ステップ
６２）、ＰＡＴは、ＣＯＮＦＩＧ￣ＳＴＯＲ（Ｅ＝
１），ＯＮＬＩＮＥコマンドを内部的に発行して（ステ
ップ６３）、主記憶機構をこのシステムに対してオン・
ライン状態となるように構成する。もし、このアベイラ
ビリティ・ポリシー内で、ＥＳＴＯＲＥ（ＹＥＳ）が指
定されているならば（ステップ６４）、ＭＶＳは、ＣＯ
ＮＦＩＧ￣ＥＳＴＯＲ（Ｅ＝Ｘ），ＯＮＬＩＮＥコマン
ド（ＢＡＣＫＵＰ１が現にＥＳＴＯＲＥ（拡張記憶機
構）を割り当てられていなければ、Ｘ＝０であり、ＢＡ
ＣＫＵＰ１が既に幾らかのＥＳＴＯＲＥを割り当てられ
ていれば、Ｘ＝１である）を内部的に発行して（ステッ
プ６５）、主記憶機構又は拡張記憶機構を、そのシステ
ムに対してオンライン状態となるように構成する。

【００４０】図７には、ワークロード引継ぎの処理が示
されている。故障システムからバックアップ・システム
への引継ぎを、一のアプリケーションに行わせる場合の
最初のステップは、問題が発生していることを、このア
プリケーションに知らせるためのものである。これは次
のようにして行われる。−バックアップ・アプリケーシ
ョンは、プライマリ・アプリケーションをモニタする手
段を有するから（ステップ７１）、プライマリ・アプリ
ケーションが作業の実行を停止した場合には、バックア
ップ・アプリケーションは、これを知ることができる。
前述のように、これは、ＣＩＣＳ及びＸＲＦという既知
の製品で採用されている。 −バックアップ・アプリケーションが、プライマリ・ア
プリケーションの故障を検出する場合（ステップ７
２）、バックアップ・アプリケーションは、ＳＣＰが提
供する照会サービスを呼び出す。 −この照会サービスはシスプレックス・データ・セット
７６を読み取り（ステップ７３）、当該シスプレックス
内の複数システムのステータスを返す。この場合、プラ
イマリ・システムの可能な状態と、その状態に応じたバ
ックアップ・アプリケーションの反応は次の通りであ
る。 −プライマリ・システムは、ステータス更新欠落状態に
ある。バックアップ・アプリケーションは、プライマリ
・システムが既に故障していて共用資源から分離された
状態にあると決定するまでは、プライマリ・アプリケー
ションのモニタ動作とシスプレックスの照会動作とを続
行する。 −プライマリ・システムは、正常な動作を再開した状態
にある。バックアップ・アプリケーションは、通常のモ
ニタ動作へ復帰する（これはテスト・ステップ７４の結
果が「ＮＯ」であった場合である）。 −プライマリ・システムは、当該シスプレックスの区画
化が実行された結果として、正常に停止し且つ既に消滅
している。（これはテスト・ステップ７４の結果が「Ｙ
ＥＳ」であった場合である）。バックアップ・アプリケ
ーションは、従来技術において行われているように、通
常のＸＲＦ処理を行って、ワークロードをバックアップ
・システムへ移転させるプロセスを開始する（ステップ
７５）。

【００４１】図８には、区画間イネーブルメントの制御
の流れが示されている。ステップ８１では、ＳＣＰが、
共用ＤＡＳＤ上の共用データ・セット８２を読み取っ
て、固有のシーケンス番号（システム許可ＩＤの一部−
図１７の１７０２を参照）を獲得する。このシーケンス
番号は、「システムＩＤ」とも呼ばれるシステム許可識
別子（システム許可ＩＤ）の一部として使用される。こ
のシステムＩＤは、シスプレックス名と、システム番号
と、固有のシーケンス番号とから成る。新しいシステム
・レコードが作成されるたびに、システムＩＤ内にある
シーケンス番号が「１」ずつインクリメントされる。ス
テップ８３では、ＳＣＰからＰＲ／ＳＭ機構へＳＣＣＢ
（８４）を転送して、ＰＲ／ＳＭ機構の区画間イネーブ
ルメント機能を呼び出す。この区画間イネーブルメント
機能は、区画間機能をロックして、ハードウェア・シス
テム領域（ＨＳＡ）内のステータス・テーブル（図１８
の１８０２）にシステムＩＤを記憶させた後、ロックを
解除するというものである。（注：ＳＣＣＢは、かかる
要求を取り扱う論理区画コントローラ（本実施例ではＰ
Ｒ／ＳＭ機構）と通信を行うために、ＳＣＰが使用する
一般的な機構である。ハードウェア・システム領域（図
１８の１８０２）に記憶されるＳＣＣＢの通常のフォー
マットは、図１６に示した通りであって、機能コード１
６０１、応答コード１６０２、ターゲット論理区画の識
別子１６０３、及び許可コード１６０４を含んでい
る）。次のステップ８５では、システムＩＤが、ハード
ウェア・システム領域に正常に書き込まれたか否かをテ
ストする。（このテスト結果は、ＰＲ／ＳＭ機構が応答
コード（図１６の１６０２）をセットして、ＥＸＴＥＲ
ＮＡＬ割り込みを発生することによって表される）。も
し、ハードウェア・システム領域への書き込みが正常に
行われたならば、このシステムに関連するシステム・レ
コード内の共用データ・セット（図１７の１７０２）
へ、そのシステムＩＤを書き込む（ステップ８６）。こ
のシステムＩＤは、当該シスプレックス内の他のシステ
ムが、これとは別のシステムの論理区画を対象とする区
画間機能を発行しようとするときに（特に、ＮＯＳＴＡ
ＴＵＳ事象又はＳＹＳＧＯＮＥ事象が生ずるときに）、
当該他のシステムによって読み取られ、そしてこのシス
テムＩＤに対応するシステムを対象とする後の区画間リ
セット又は区画間非活動化のコールの際に使用される。
もし、ステップ８５のテスト結果として、このシステム
ＩＤが、ハードウェア・システム領域に正常に書き込ま
れなかったことが判明すれば、そのシステムＩＤを
「０」にセットした上で、「０」を共用データ・セット
に書き込む（ステップ８７）。こうすると、このシステ
ム及び論理区画を対象とする区画間リセット又は区画間
非活動化の実行を阻止することができる。

【００４２】図９には、区画間非活動化及び区画間シス
テム・リセットの制御の流れが示されている。ＳＣＣＢ
９１は、これらの２つの機能（非活動化機能、システム
・リセット機能）の双方へ入力される。ＳＣＣＢ９１に
は、区画間非活動化機能の機能コード又は区画間システ
ム・リセット機能の機能コードと、ターゲット論理区画
用の１６バイトの区画間許可ＩＤ（システムＩＤ−図１
７の１７０２）と、ターゲット論理区画用の論理区画Ｉ
Ｄが保持されている。ステップ９２では、初期有効性チ
ェックを実行するとともに（このチェックは、前述のよ
うに、この論理区画が他の論理区画を対象とする区画間
機能を発行する許可を与えられているか否かというチェ
ックを含んでいる−許可を与えるか否かはＬＰＳＥＣフ
レームにおいて指定する）、タイマをセットする。さら
に、ターゲット論理区画に関する排他的ロックを獲得し
て、この機能が完了するまでは、オペレータが入力する
可能性のある競合コマンドが実行されず、そして他の区
画間機能の実行が試みられないことを保証する。タイマ
の目的は、この機能が妥当な時間内（例えば、３０秒以
内）に完了するのを保証することにある。ステップ９３
では、ターゲット論理区画用の許可ＩＤの値が、ＳＣＣ
Ｂ９１を介してこのサービスへ渡されてきた許可ＩＤの
値（この値は論理区画ステータス・テーブル−図１８の
１８０２−に維持されている）と一致するか否かをテス
トする。もし一致しなければ、応答コードをセットした
上で、割り込みを発生して戻りコードをＳＣＰへ送り返
す（ステップ９５）。（この後、ロックを解除する）。
一方、それらのＩＤの値が一致すれば、ＳＣＣＢ９１を
介して転送されてきた機能コードに従って、この論理区
画をリセットするか、又はこれを非活動化する（ステッ
プ９４）。もし、リセット機能が指定されていたなら、
サービス・プロセッサは、ＳＣＣＢ内で指定されている
ターゲット論理区画について、システム・コンソールか
ら入力される「ＳＹＳＲＥＳＥＴ」コマンドやＯＰＲＣ
ＴＬフレームで指定される「０３」コマンドを処理する
際に呼び出すサービスと同一のサービスを呼び出す。
（システム・コンソールについては、ＩＢＭ社発行のマ
ニュアルである「システム・コンソールのオペレータ制
御（Form Number: SC38-0068）」を参照されたい）。か
くて、論理ＣＰがリセットされ、浮動割り込みがリセッ
トされ、論理区画のＩ／Ｏサブシステムがリセットされ
る（これについては、ＩＢＭ社発行のマニュアルである
「ＥＳＡ／３７０のオペレーションの原則（Form Numbe
r: SA22-7200）」の、第１２章「オペレータによって開
始される機能」と、第４章「外部から開始されるシステ
ム・リセットの定義のための機能」とを参照された
い）。最後に、論理区画をリセットした原因をオペレー
タに知らせるための情報メッセージ（監査証跡メッセー
ジ）を、システム・コンソール上に発行する。以上によ
る総合的な結果は、ターゲット・システムが、これ以後
いかなる作業も実行せず、また共用資源へのその全ての
Ｉ／Ｏが停止されるということである。このシステム・
リセットが完了した場合（これは、非同期的に通知され
る）、他のシステムは、リセットされたシステムが以前
に共用していた資源に対して、変更を加えても良いこと
を知る。続いて、タイマのリセットを行なった後、ステ
ップ９５において、ＳＣＰへの応答のための「正常終
了」応答コードをＳＣＣＢ内にセットする。（また、ロ
ックの解除も行う）。

【００４３】もし、入力された機能コードが「非活動
化」を指定しているならば、サービス・プロセッサは、
ＳＣＣＢ内で指定されているターゲット論理区画につい
て、システム・コンソールから入力される「ＤＥＡＣＴ
ＬＰ」コマンドを処理するときに呼び出すサービスと同
一のサービスを呼び出す（これについては、ＩＢＭ社発
行のマニュアルである「ＰＲ／ＳＭ計画ガイド（Form N
umber: GA22-7123）」を参照されたい）。このサービス
は、同一のＣＰＣ上の他の論理区画が使用することがで
きるように、ターゲット論理区画の資源を解放するとと
もに、システム・リセットをも行う。以上が終了したな
らば、非活動化の完了を表示する情報メッセージを、シ
ステム・コンソール上に書き込む。このシステム非活動
化による総合的な結果は、このシステムがこれ以後いか
なる作業も実行せず、また共用資源へのその全てのＩ／
Ｏが停止されるということである。このシステム非活動
化が完了した場合（これは、非同期的に通知される）、
他のシステムは、その非活動化されたシステムとの間で
これまで共用してきた資源に対して変更を加えても良
く、また解放された資源を獲得できることを知ることに
なる。続いて、タイマをリセットし、ロックを解除し、
「正常終了」応答コードをセットするとともに、その応
答コードをＳＣＰへ返すようにする（ステップ９５）。

【００４４】もし、タイマにセットした時間内（例え
ば、３０秒以内）に、リセット又は非活動化が完了しな
かったならば、タイム・アウトが生じ、これに応じた適
当な応答コードをＳＣＰへ返すようにする（ステップ９
６）。この場合、コマンドを発行した論理区画には、後
にリセット又は非活動化が完了しても、特に表示を与え
ることはしない。

【００４５】図１０には、無指定の区画間システム非活
動化の制御の流れが示されている。入力されたＳＣＣＢ
は、無指定の区画間非活動化機能の機能コードを入力と
して与える（ステップ１００１）。無指定の非活動化機
能は、初期有効性チェックを実行するとともに、タイマ
を起動する（ステップ１００２）。このタイマの目的
は、この無指定の非活動化機能が完了するか、又は然る
べき応答コードが送出されるかの、いずれかが確実に行
われるようにすることにある。ステップ１００３では、
この無指定の非活動化機能をコールした論理区画を除
く、全ての論理区画を順次に処理する。ステップ１００
４では、処理中の論理区画が、この機能をコールした論
理区画と、記憶機構（主記憶機構又は拡張記憶機構）を
共用しているか否かをチェックする。（この情報は、各
論理区画ごとの記憶機構割り振りテーブル−図１８の１
８０１−に維持される）。もし、処理中の論理区画が、
記憶機構を共用していなかったならば、次に続く論理区
画を処理する。もし、この論理区画が記憶機構を共用し
ていたならば、その論理区画を非活動化する（ステップ
１００５）。この非活動化は、先に図９に関連して説明
した論理区画の非活動化と同様にして行われるものであ
る。全ての論理区画の処理が完了した後、タイマををリ
セットし、応答コードをセットし、割り込みを発生し、
その応答コードを元のＳＣＰへ返す（ステップ１００
６）。もし、タイマにセットした時間内（例えば、３０
秒以内）に、この無指定の非活動化の全てが完了しなか
ったならば、タイム・アウトが生じ（ステップ１００
７）、適当な応答コードを元のＳＣＰへ返すようにす
る。

【００４６】図１１には、本発明に係るアベイラビリテ
ィ・ポリシー指定法のシンタックスが示されている。こ
のポリシーのキーワード及びオプションは、次のような
意味を有する。

【００４７】『ＮＯＳＴＡＴＵＳ（ｆａｉｌｓｙｓ）』これは、ステータス更新欠落状態が発生した場合に、故
障システム（ｆａｉｌｓｙｓ）をターゲット・システム
（動作対象のシステム）として、指定した動作を実行す
べきことを表わす。

【００４８】『ＲＥＳＥＴＴＩＭＥ（ｎｎｎｎｎ）』このＲＥＳＥＴＴＩＭＥオプションは、指定した時間が
経過した後に、故障システムを、「システム・リセット
（ＳＹＳＲＥＳＥＴ）」することを要求するオプション
である。時間の長さ「ｎｎｎｎｎ」は、秒単位で指定す
る。例えば、ＲＥＳＥＴＴＩＭＥ（１０）として指定し
た場合は、ステータス更新欠落状態が検出されてから１
０秒の後に、故障システムのシステム・リセットを実行
する。また、ＲＥＳＥＴＴＩＭＥ（０）として指定した
場合は、オペレーティング・システムがステータス更新
欠落状態を検出すると即座に、システム・リセットを実
行する。ＳＹＳＲＥＳＥＴを発行することができるの
は、ＰＲ／ＳＭ機構の制御下においてＬＰＡＲモードで
ランしている、当該シスプレックス内の他のシステムで
あって、しかも故障システムと同じＣＰＣ上に置かれて
いるシステムだけである。注：もし故障システムが、時
間「ｎｎｎｎｎ」の経過前に、そのステータス更新を再
開するのであれば、ＳＹＳＲＥＳＥＴの機能は実行され
ない。

【００４９】『ＤＥＡＣＴＴＩＭＥ（ｎｎｎｎｎ）』このＤＥＡＣＴＴＩＭＥオプションは、故障システムが
存在している論理区画を、指定した時間が経過した後に
「非活動化（ＤＥＡＣＴＩＶＡＴＥ）」することを要求
するオプションである。時間の長さ「ｎｎｎｎｎ」は、
秒単位で指定する。例えば、ＤＥＡＣＴＴＩＭＥ（１
０）を指定した場合は、「ステータス更新欠落」状態が
検出されてから１０秒後に、故障システムのＤＥＡＣＴ
ＩＶＡＴＥを実行する。また、ＤＥＡＣＴＩＶＡＴＥが
実行される場合は、ＳＹＳＲＥＳＥＴも実行される。Ｄ
ＥＡＣＴＩＶＡＴＥを発行することができるのは、ＰＲ
／ＳＭ機構の制御下においてＬＰＡＲモードでランして
いる、当該シスプレックス内の他のシステムであって、
しかも故障システムと同一のＣＰＣ上に置かれているシ
ステムだけである。注：もし故障システムが、時間「ｎ
ｎｎｎｎ」の経過前に、そのステータス更新を再開する
のであれば、このＤＥＡＣＴＩＶＡＴＥの機能は実行さ
れない。

【００５０】『ＳＹＳＧＯＮＥ（ｆａｉｌｓｙｓ）』これは、故障システム（ｆａｉｌｓｙｓ）が、アベイラ
ビリティ・ポリシー又はオペレータによってリセット
（又は非活動化）された場合に、オペレーティング・シ
ステムがポリシー活動化タスクへ、システム消滅（ＳＹ
ＳＧＯＮＥ）事象を通知するためのものである。

【００５１】『ＳＹＳＴＥＭ（ｓｙｓｎａｍｅ）』必須パラメータである、このＳＹＳＴＥＭパラメータ
は、故障システムの消滅を知らせるＳＹＳＧＯＮＥ通知
を受け取った場合に、指定された動作を実行すべき当該
シスプレックス内のシステムを特定するものである。Ｐ
ＯＬＩＣＹ（アベイラビリティ・ポリシー）は、全ての
システム上に実現されているから、このＳＹＳＴＥＭパ
ラメータで特定したシステムだけが、ＳＹＳＧＯＮＥの
通知に応答するようにしているのである。もし、このＳ
ＹＳＴＥＭパラメータで特定してあるｓｙｓｎａｍｅ
が、現システムのＳＹＳＮＡＭＥ（システム名）と一致
しなければ、このポリシー・ステートメントは、現シス
テムについては何ら影響を及ぼさない。

【００５２】『ＤＥＡＣＴＩＶＡＴＥ（ｏｔｈｅｒｓｙ
ｓ／ＡＬＬ）』このＤＥＡＣＴＩＶＡＴＥキーワードは、非活動化（Ｄ
ＥＡＣＴＩＶＡＴＥ）すべきシステムをユーザが指定す
ることを可能にする。このＤＥＡＣＴＩＶＡＴＥは、必
須のキーワードである。ＤＥＡＣＴＩＶＡＴＥ（ｏｔｈ
ｅｒｓｙｓ）を指定する場合、そのｏｔｈｅｒｓｙｓに
は、当該シスプレックス内の他のシステムを指定しなけ
ればならず、さもなければ、いかなる動作も行われな
い。この非活動化の機能が、ターゲット論理区画のオペ
レーティング・システム及びハードウェアに、どのよう
な影響を及ぼすかについての説明は、図９及び同図に関
連する記述を参照されたい。特に、ＳＹＳＴＥＭパラメ
ータで指定したシステムと、ｏｔｈｅｒｓｙｓとは、同
一のＣＰＣ上でランしているシステムでなければならな
いことに注意されたい。一方、ＤＥＡＣＴＩＶＡＴＥ
（ＡＬＬ）を指定した場合には、ＳＹＳＴＥＭパラメー
タで指定してあるシステムは、ＰＲ／ＳＭ機構に対し、
そのアドレッシング・レンジ内にある他の全ての論理区
画を非活動化するように要求する。これは、無指定の区
画間非活動化と呼ばれる。この機能が、ターゲット論理
区画のオペレーティング・システム及びハードウェアに
対し、どのような影響を及ぼすかについては、図１０及
び同図に関連する記述を参照されたい。もし、ＮＯＳＴ
ＡＴＵＳ処理の一部として、ＤＥＡＣＴＩＶＡＴＥが既
に実行されていたならば、ＳＹＳＧＯＮＥ処理のために
実行されたＤＥＡＣＴＩＶＡＴＥは、ターゲット・シス
テムが既に消滅していることを検出して、要求された再
構成動作を依然として試みることになる。

【００５３】『ＳＴＯＲＥ（ＹＥＳ／ＮＯ）』他の論理区画の非活動化が正常に終了したのに続いて、
もしＹＥＳが指定されたならば、ＳＹＳＴＥＭパラメー
タで指定してあるシステムが、主記憶機構をオンライン
状態に構成するよう要求するコマンドを発行する。例え
ば、ＭＶＳ内では、このコマンドは次のようになる。ＣＯＮＦＩＧ￣ＳＴＯＲ（Ｅ＝１），ＯＮＬＩＮＥこのコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された主記憶機構を獲得す
る。注：もし、ＤＥＡＣＴＩＶＡＴＥが正常に終了され
ないで、ターゲットＬＰＡＲが活動状態にないことを表
示したのであれば、記憶機構再構成コマンドが依然とし
て試みられることになる。ＳＴＯＲＥ（ＮＯ）はデフォ
ールト値である。

【００５４】『ＥＳＴＯＲＥ（ＹＥＳ／ＮＯ）』他の論理区画の非活動化が正常に終了したのに続いて、
もしＹＥＳが指定されたならば、ＳＹＳＴＥＭパラメー
タで指定してあるシステムが、拡張記憶機構をオンライ
ン状態に構成するよう要求するコマンドを発行する。例
えば、ＭＶＳ内の一般的なコマンドは、次のようにな
る。ＣＯＮＦＩＧ￣ＥＳＴＯＲ（Ｅ＝Ｘ），ＯＮＬＩＮＥこのコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された拡張記憶機構を獲得す
る。ＥＳＴＯＲＥ（ＮＯ）はデフォールト値である。

【００５５】『ＯＴＨＥＲＲＥＳＯＵＲＣＥ（ＹＥＳ／
ＮＯ）』他の論理区画の非活動化が正常に終了したのに続いて、
もしＹＥＳが指定されたならば、ＳＹＳＴＥＭパラメー
タで指定してあるシステムが、他の資源をオンライン状
態にすることを要求する。この構成を拡張して、システ
ムが動的に再構成し得る任意の資源をも包含させること
も可能である。ＯＴＨＥＲＲＥＳＯＵＲＣＥ（ＮＯ）は
デフォールト値である。

【００５６】『アベイラビリティ・ポリシーの初期化』アベイラビリティ・ポリシーは、パラメータ・ライブラ
リ（ＰＡＲＭＬＩＢ）内に保持できるようにしてあり、
これは、従来技術に属するＭＶＳの制御値のセットがそ
のようにしてあるのと同様である。また、アベイラビリ
ティ・ポリシーは、オペレータ・コマンドにより、通常
の方法で初期化できるようにしてある。（他の通常の方
法、例えばシステム初期化パラメータ、又はシステム・
サービスを利用することもできる）。アベイラビリティ
・ポリシーを初期化するためのＭＶＳ￣ＳＥＴＡＶＡＩ
Ｌコマンドの使用法のシンタックスは、次の通りであ
る。ＳＥＴＡＶＡＩＬ￣ＰＯＬＩＣＹ，ＡＣＴＩＶＡＴＥ＝
ｍｅｍｎａｍｅＤＥＡＣＴＩＶＡＴＥこのシンタックスにおいて、ｍｅｍｎａｍｅは、パラメ
ータ・ライブラリのメンバを識別する。ＰＯＬＩＣＹの
指定は、次のようにして行うことができる。「ＡＣＴＩＶＡＴＥ＝ｍｅｍｎａｍｅ」このようにポリシーのメンバ名を指定した場合、ＭＶＳ
は、指定されたメンバ名をパラメータ・ライブラリから
読み取り、これを活動ポリシーとする。もし新しいメン
バ名を処理している間に、シンタックス・エラー又は他
の問題が発生したならば、旧ポリシー（もしそれがあれ
ば）が有効のままに留まる。「ＤＥＡＣＴＩＶＡＴＥ」ＤＥＡＣＴＩＶＡＴＥを指定した場合には、オペレーテ
ィング・システムは、全てのアベイラビリティ・ポリシ
ー処理を停止する。

【００５７】『アベイラビリティ・ポリシー処理』アベイラビリティ・ポリシー処理が行われるのは、当該
シスプレックスのモニタ中に、ステータス更新欠落状態
の存在が検出されるか、又はシスプレックス区画化機能
によって、当該シスプレックスから一のシステムが除去
されるときである。アベイラビリティ・ポリシーの処理
は、ポリシー活動化タスク（ＰＡＴ）によって行われ
る。

【００５８】当該シスプレックスのモニタ中に、一のシ
ステムがステータス更新欠落状態にあることが検出され
た場合、ＰＡＴは、アベイラビリティ・ポリシーのＮＯ
ＳＴＡＴＵＳ部分を処理する。アベイラビリティ・ポリ
シーを処理するＰＡＴは、ステータス更新欠落状態を検
出するシステム上のＰＡＴである。このＰＡＴがＮＯＳ
ＴＡＴＵＳポリシー・ステートメントを処理する方法
は、次の通りである。「ＲＥＳＥＴＴＩＭＥ（ｎｎｎｎ
ｎ）」−ＰＡＴは「ｎｎｎｎｎ」秒間だけ待機し、その
期間中、ステータス更新欠落状態が持続したならば、こ
のステータス更新欠落状態が発生しているシステムの論
理区画を、区画間システム・リセット機能を使用してシ
ステム・リセットし、そしてシスプレックス区画化機能
に対し、そのシステムがもはや活動状態にはないことを
通知する。「ＤＥＡＣＴＴＩＭＥ（ｎｎｎｎｎ）−ＰＡ
Ｔは「ｎｎｎｎｎ」秒間だけ待機し、その期間中、ステ
ータス更新欠落状態が持続したならば、このステータス
更新欠落状態が発生しているシステムの論理区画を、区
画間非活動化機能を使用して非活動化し、そしてシスプ
レックス区画化機能に対し、そのシステムがもはや活動
状態にはないことを通知する。

【００５９】シスプレックス区画化機能が、当該シスプ
レックスから一のシステムを除去した場合、ＰＡＴは、
アベイラビリティ・ポリシーのＳＹＳＧＯＮＥ部分を処
理する。ＳＹＳＧＯＮＥ（ｆａｉｌｓｙｓ）が指定して
いるシステムが、当該シスプレックスから除去された場
合には、ＳＹＳＴＥＭ（ｓｙｓｎａｍｅ）が指定してい
るシステム上のＰＡＴが、そのポリシーを処理する。こ
のＰＡＴがＳＹＳＧＯＮＥポリシー・ステートメントを
処理する方法は、次の通りである。「ＤＥＡＣＴＩＶＡ
ＴＥ（ｏｔｈｅｒｓｙｓ）」−ＰＡＴは、シスプレック
ス区画化機能によって当該シスプレックスから除去され
たシステムの論理区画を、区画間非活動化機能を使用し
て非活動化する（ただし、その論理区画は、アベイラビ
リティ・ポリシーのＮＯＳＴＡＴＵＳ部分を処理したＰ
ＡＴによって、既に非活動化されている場合もある）。
「ＤＥＡＣＴＩＶＡＴＥ（ＡＬＬ）」−ＰＡＴは、その
アドレッシング・レンジ内にある全ての論理区画を、無
指定の区画間非活動化機能を使用して非活動化する。
「ＳＴＯＲＥ（ＹＥＳ）」−もし中央記憶機構（主記憶
機構）が使用可能であれば、ＰＡＴは、適当なＭＶＳ￣
ＣＯＮＦＩＧ￣ＳＴＯＲ，ＯＮＬＩＮＥコマンドを内部
的に発行して、中央記憶機構をオンライン状態に構成す
る。「ＥＳＴＯＲＥ（ＹＥＳ）」−もし拡張記憶機構が
使用可能であれば、ＰＡＴは、適当なＭＶＳ￣ＣＯＮＦ
ＩＧ￣ＥＳＴＯＲ（Ｅ＝Ｘ），ＯＮＬＩＮＥコマンドを
内部的に発行して、拡張記憶機構をオンライン状態に構
成する。「ＯＴＨＥＲＲＥＳＯＵＲＣＥ（ＹＥＳ）」−
ＰＡＴは、適当なＭＶＳ￣ＣＯＮＦＩＧコマンドを内部
的に発行して、他のプロセッサ資源をオンライン状態に
構成する。

【００６０】以下に示す具体例は、システム故障が発生
した後に、システム資源を再構成するためのアベイラビ
リティ・ポリシーを活動化する場合に、実行が必要とな
る全てのステップを記述したものである。なお、図１２
には、一般的なケースが示されている。１．一の論理区画内で、活動ＭＶＳシステムの初期プロ
グラム・ロード（ＩＰＬ）を行う。この活動ＭＶＳシス
テムは、ＩＰＬを行う最初のシステムであるから、当該
シスプレックスの動作は、この活動ＭＶＳシステムをも
って開始することになる。２．この活動ＭＶＳシステムは、ＭＶＳのＩＰＬ実行中
に、当該シスプレックスに最終的に参加し且つこの活動
ＭＶＳシステムの論理区画に対し破壊的動作を実行する
ことがある、他の任意のＭＶＳシステム（例えば、代替
ＭＶＳシステム）に対し、許可を与える。この活動ＭＶ
Ｓシステムは、区画間リセット／非活動化イネーブルメ
ント要求をＰＲ／ＳＭ機構へ送出することによって、他
のＭＶＳシステムに対し許可を与える。このように活動
ＭＶＳシステムが他のシステムに許可を与えた場合に
は、当該シスプレックス内の他のＭＶＳシステムが、こ
の活動ＭＶＳシステムの論理区画を、システム・リセッ
ト又は非活動化することができるようになる。３．次に、他の論理区画内で、代替ＭＶＳシステムのＩ
ＰＬを行う。活動ＭＶＳシステムと代替ＭＶＳシステム
とは、同一プロセッサ上の別々の論理区画内で、又は互
いに異なるプロセッサ上の夫々の論理区画内で、それぞ
れの実行を行うことができる。代替ＭＶＳシステムの論
理区画へ定義されたプロセッサ資源の割当量は、アベイ
ラビリティ・ポリシーにどのような指定が行われている
かに依存する。もし、アベイラビリティ・ポリシーが、
活動ＭＶＳシステムの論理区画を、システム・リセット
すべきであると指定しているのであれば、代替ＭＶＳシ
ステムの論理区画には、活動ＭＶＳシステムのワークロ
ードをランさせるのに十分な量のプロセッサ資源を割り
当てておかねばならない。一方、アベイラビリティ・ポ
リシーが、活動ＭＶＳシステムの論理区画を、非活動化
すべきであると指定しているのであれば、代替ＭＶＳシ
ステムの論理区画には、ＭＶＳのＩＰＬを行うことがで
き且つＶＴＡＭ及び必要な代替ＣＩＣＳをランさせるこ
とができる程度の、プロセッサ資源を割り当てておくだ
けで十分である。この場合には、代替ＭＶＳシステムの
論理区画は、活動ＭＶＳシステムの論理区画に割り当て
られていたプロセッサ資源を、獲得することができる。４．活動ＭＶＳシステム上で、活動ＣＩＣＳ領域を起動
する。活動ＣＩＣＳ領域を起動した後に、ＣＩＣＳのワ
ークロードの処理が行われる。しかしながら、この場合
には、この活動ＣＩＣＳ領域は、ＸＲＦ機能を持たない
ままランしている。５．代替ＭＶＳシステム上で、代替ＣＩＣＳ領域を起動
する。代替ＣＩＣＳ領域は、一般的な方法で、ＸＲＦ機
能を確立する。活動ＣＩＣＳ領域がＣＩＣＳのワークロ
ードを処理しているとき、代替ＣＩＣＳ領域は、故障に
備えて待機している。活動ＣＩＣＳ領域が、一般的な方
法で、代替ＣＩＣＳ領域へＣＩＣＳ￣ＸＲＦ監査信号を
送出するのに対し、代替ＣＩＣＳ領域は、その監査信号
をモニタして、故障の徴候が現れているか否かをチェッ
クする。６．活動ＭＶＳシステムに関するアベイラビリティ・ポ
リシーのＮＯＳＴＡＴＵＳ条件を、代替ＭＶＳシステム
上で活動化する。このアベイラビリティ・ポリシーは、
活動ＭＶＳシステムが故障した場合に代替ＭＶＳシステ
ムが実行すべき回復動作を指定したものである。７．活動ＭＶＳシステムが、明らかではない何らかの原
因で故障する。この結果、活動ＭＶＳシステムは、その
ステータス・フィールドの更新を停止する。８．代替ＭＶＳシステムは、活動ＭＶＳシステムがその
シスプレックス監査信号を更新していないことを検出し
たから、これに基づいて、活動ＭＶＳシステムが故障し
たものと推定する。９．代替ＭＶＳシステムは、活動ＭＶＳシステムの故障
を回復するために、アベイラビリティ・ポリシーを処理
する。以下の説明は、このアベイラビリティ・ポリシー
内のステートメントについて、代替ＭＶＳシステムが実
行する処理を要約したものである。活動ＭＶＳシステム
の論理区画のシステム・リセット−これは、区画間シス
テム・リセット要求をＰＲ／ＳＭ機構へ発行して、活動
ＭＶＳシステムの論理区画をシステム・リセットし且つ
活動ＭＶＳシステムを当該シスプレックスから除去する
ことを要求する。活動ＭＶＳシステムの論理区画の非活
動化−これは、区画間非活動化要求をＰＲ／ＳＭ機構へ
発行して、活動ＭＶＳシステムの論理区画を非活動化し
且つ活動ＭＶＳシステムを当該シスプレックスから除去
することを要求する。全ての非活動化−これは、無指定
の区画間非活動化要求をＰＲ／ＳＭ機構へ発行して、代
替ＭＶＳシステムのために予約されている記憶機構資源
を共用している論理区画を、非活動化することを要求す
る。プロセッサ資源の獲得−これは、要求をＰＲ／ＳＭ
機構へ発行して、予約してある使用可能なプロセッサ資
源を、代替ＭＶＳシステムの論理区画へ再割り当てする
ことを要求する。活動ＭＶＳシステムの論理区画の資源
が、代替ＭＶＳシステムの論理区画へ再割り当てされる
のは、アベイラビリティ・ポリシーが活動ＭＶＳシステ
ムの論理区画の非活動化を指定していた場合であって、
しかもその非活動化が正常に終了した場合だけである。
一方、他の論理区画の資源が、代替ＭＶＳシステムの論
理区画へ再割り当てされるのは、アベイラビリティ・ポ
リシーが全てを非活動化することを指定していた場合で
あって、しかも代替ＭＶＳシステムが所有する記憶機構
資源を共用している全ての論理区画が正常に非活動化さ
れた場合だけである。１０．この時点で、活動論理区画を非活動化（又はシス
テム・リセット）する。この結果、共用資源に対する以
後の処理又はアクセスが行えなくなる。１１．活動ＭＶＳシステムが故障してから暫くして、代
替ＣＩＣＳ領域は、活動ＣＩＣＳ領域のＣＩＣＳ￣ＸＲ
Ｆ監査信号が消失したという理由で、活動ＣＩＣＳ領域
が故障したと推定する。次に、代替ＣＩＣＳ領域は、一
般的な方法で、ＸＲＦの引継ぎ処理を自動的に開始す
る。代替ＣＩＣＳ領域が、当該シスプレックスのステー
タスを照会して、活動ＭＶＳシステムが除去されたこと
を検出すると、この引継ぎ処理が、オペレータの介入を
必要とせずに完了する。

【００６１】『同一プロセッサ上のシステムを対象とし
たシステム・リセット』幾つかのアプリケーション（例えば、ＩＭＳ￣ＸＲＦ）
については、バックアップ・システム（ＢＡＣＫＵＰ）
が、プライマリ・システム（ＰＲＩＭＡＲＹ）と同量の
記憶機構を必要とすることがある。この場合、ＰＲＩＭ
ＡＲＹが故障しても、ＢＡＣＫＵＰは、ワークロードを
ランさせるのに十分な量の資源を既に所有しているか
ら、論理区画を非活動化したり記憶機構を再構成する必
要はない。この場合、ＢＡＣＫＵＰにとって必要なこと
は、ＰＲＩＭＡＲＹが、もはや共用資源をアクセスする
ことがないという肯定的確認である。

【００６２】非活動化ではなく、システム・リセット
（ＳＹＳＲＥＳＥＴ）だけを使用する他の理由は、シス
テム故障の後にＳＡＤＭＰ（スタンド・アローン・ダン
プ）が必要となることもあるという点にある。

【００６３】図１３には、このシステム・リセットの具
体例が示されている。説明を簡明にするため、この構成
には、システムが２つしか含まれていないものとし、そ
れらを、ＰＲＩＭＡＲＹ（１３０１、１３０１Ａ）及び
ＢＡＣＫＵＰ１（１３０２、１３０２Ａ）と呼ぶことに
する。また、これらの２つのシステムは、同一のＰＲ／
ＳＭマシン内に存在していて、同一のシスプレックス内
に構成されているものとする。以上において、ＰＲＩＭ
ＡＲＹに故障が存在すれば（この故障は、導入処理の際
にパラメータ・ライブラリ内に指定された故障検出期間
の経過後に検出される）、ＰＲＩＭＡＲＹのワークロー
ドの引継ぎをＢＡＣＫＵＰ１に実行させる前に、追加の
２０秒間待機する（この２０秒間は、アベイラビリティ
・ポリシーＡＶＡＩＬ０１内のＲＥＳＥＴＴＩＭＥキー
ワードに指定されている）。一方、ＢＡＣＫＵＰ１シス
テムに故障が存在すれば（この故障は、導入処理の際に
パラメータ・ライブラリ内に指定された故障検出期間の
経過後に検出される）、ＰＲＩＭＡＲＹのバックログを
防止するため、ＢＡＣＫＵＰ１のリセットをＰＲＩＭＡ
ＲＹに行わせる前に、追加の１０秒間待機する（この１
０秒間は、ＡＶＡＩＬ０１内のＲＥＳＥＴＴＩＭＥキー
ワードに指定されている時間である）。

【００６４】ＰＲＩＭＡＲＹとＢＡＣＫＵＰ１との双方
のシステムにおいてポリシーを活動化するために、ユー
ザの導入設備は下記のオペレータ・コマンドを発行す
る。ＳＥＴＡＶＡＩＬ￣ＰＯＬＩＣＹ，ＡＣＴＩＶＡＴ
Ｅ＝ＡＶＡＩＬ０１

【００６５】アベイラビリティ・ポリシーＡＶＡＩＬ０
１の、パラメータ・ライブラリ内に含まれているメンバ
は次の通りである。ＮＯＳＴＡＴＵＳ（ＰＲＩＭＡＲＹ）ＲＥＳＥＴＴＩ
ＭＥ（２０）ＮＯＳＴＡＴＵＳ（ＢＡＣＫＵＰ１）ＲＥＳＥＴＴＩ
ＭＥ（１０）

【００６６】前記の内容を持つアベイラビリティ・ポリ
シーが設定されていると、ＰＲＩＭＡＲＹシステムが待
機状態へ入る場合には、以下の一連の事象が生ずる。１．ＰＲＩＭＡＲＹが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。２．故障検出期間（図１７の１７０５）の経過後に、Ｂ
ＡＣＫＵＰ１システムが、ステータス更新欠落事象の発
生を宣言する。３．ステータス更新欠落事象の発生がＢＡＣＫＵＰ１に
おいて検出されたことに応じて、ポリシー活動化タスク
が現ポリシーの処理を開始する。なお、この現ポリシー
には、ステータス更新欠落状態が２０秒間解消せずに続
いたならば、システム・リセットを実行すべきことが指
定されている。４．２０秒が経過した後、ＢＡＣＫＵＰ１は、ＰＲＩＭ
ＡＲＹのステータスをチェックして、ステータス更新が
再開されていないことを知る。この場合、ＢＡＣＫＵＰ
１上のポリシー活動化タスクが、ＰＲＩＭＡＲＹの区画
間システム・リセットを要求する。５．このシステム・リセットが正常に終了したのに続い
て、ＢＡＣＫＵＰ１上のＭＶＳが、システム消滅（ＳＹ
ＳＧＯＮＥ）通知を当該シスプレックス内の全てのシス
テムへ向けてトリガして、ＰＲＩＭＡＲＹシステムがも
はや共用資源のいずれをも使用していないことを表示す
る。この時点で、ＰＲＩＭＡＲＹは非活動状態となって
おり（１３０１Ａ）、ＢＡＣＫＵＰ１は、通常の処理を
実行している（１３０２Ａ）。ただし、これらの２つの
論理区画は、従前のもの（１３０１及び１３０２）と同
様に定義されている。６．アプリケーションが、一般的な方法で、ワークロー
ドの引継ぎを実行する。

【００６７】前記の内容を持つアベイラビリティ・ポリ
シーが設定されていると、ＢＡＡＣＫＵＰ１がステータ
ス更新欠落状態へ入る場合にも、同様の事象が生ずる。
この場合には、ＰＲＩＭＡＲＹは、１０秒後にＢＡＣＫ
ＵＰ１のシステム・リセットを実行する。

【００６８】『同一プロセッサ上のシステムを対象とし
た非活動化』図１４には、同一プロセッサ上のシステムを対象とする
非活動化の具体例が示されている。説明を簡明にするた
め、この構成には、システムが２つしか含まれていない
ものとし、それらを、ＰＲＩＭＡＲＹ（１４０１）及び
ＢＡＣＫＵＰ１（１４０２、１４０２Ａ）と呼ぶことに
する。また、これら２つのシステムは、同一のＰＲ／Ｓ
Ｍマシン内に存在していて、同一のシスプレックス内に
構成されているものとする。以上において、ＰＲＩＭＡ
ＲＹに故障が存在すれば（この故障は指定されている故
障検出期間の経過後に検出される）、ＰＲＩＭＡＲＹの
ワークロードの引継ぎをＢＡＣＫＵＰ１に実行させる前
に、追加の５秒間待機する（この５秒間は、ＡＶＡＩＬ
０１内のＲＥＳＥＴＴＩＭＥキーワードに指定されてい
る）。また、ＢＡＣＫＵＰ１においてポリシーを活動化
するために、導入設備は下記のコマンドを呼び出す。ＳＥＴＡＶＡＩＬ￣ＰＯＬＩＣＹ，ＡＣＴＩＶＡＴＥ＝
ＡＶＡＩＬ０１この具体例については、ＰＲＩＭＡＲＹ内でＰＯＬＩＣ
Ｙ（アベイラビリティ・ポリシー）を指定しておく必要
はない。ユーザは、ＰＲＩＭＡＲＹについても同一のＰ
ＯＬＩＣＹを指定することができるが、かかるＰＯＬＩ
ＣＹは、ＰＲＩＭＡＲＹが実行すべきいかなる動作も定
義しない。

【００６９】アベイラビリティ・ポリシーＡＶＡＩＬ０
１のパラメータ・ライブラリのメンバの内容は、次の通
りである。ＮＯＳＴＡＴＵＳ（ＰＲＩＭＡＲＹ）ＤＥＡＣＴＴＩ
ＭＥ（５）ＳＹＳＧＯＮＥ（ＰＲＩＭＡＲＹ）ＳＹＳＴＥＭ（Ｂ
ＡＣＫＵＰ１）ＤＥＡＣＴＩＶＡＴＥ（ＰＲＩＭＡＲＹ）ＳＴＯＲＥ（ＹＥＳ）ＥＳＴＯＲＥ（ＹＥＳ）

【００７０】この内容を持つアベイラビリティ・ポリシ
ーが設定されていると、ＰＲＩＭＡＲＹシステムが待機
状態へ入った場合に、以下の一連の事象が生ずる。１．ＰＲＩＭＡＲＹが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。２．故障検出期間（導入処理の際にパラメータ・ライブ
ラリ内に指定されている）の経過後に、ＢＡＣＫＵＰ１
システムが、ステータス更新欠落事象の発生を宣言す
る。３．ステータス更新欠落事象の発生がＢＡＣＫＵＰ１に
おいて検出されたことに応じて、ポリシー活動化タスク
が現ポリシーの処理を開始する。なお、この現ポリシー
には、ステータス更新欠落状態が５秒間解消せずに続い
たならば、区画間非活動化を実行すべきことが指定され
ている。４．５秒が経過した後、ＢＡＣＫＵＰ１は、ＰＲＩＭＡ
ＲＹのステータスをチェックして、ステータス更新が再
開されていないことを知る。この場合、ＢＡＣＫＵＰ１
上のポリシー活動化タスクが、ＰＲＩＭＡＲＹの区画間
非活動化を要求する。５．この区画間非活動化が正常に終了したのに続いて、
ＢＡＣＫＵＰ１上のＭＶＳが、システム消滅（ＳＹＳＧ
ＯＮＥ）通知を当該シスプレックス内の全てのシステム
へ向けてトリガして、ＰＲＩＭＡＲＹシステムがもはや
共用資源のいずれも使用していないことを表示する。こ
のＳＹＳＧＯＮＥ通知は、マルチシステム・アプリケー
ションに対し、機能の引継ぎが可能になったことを知ら
せるための信号の役割を果たす。６．このＳＹＳＧＯＮＥ通知は、このポリシーにおける
他の動作をトリガする。この場合、ＢＡＣＫＵＰ１上の
ポリシー活動化タスクが、区画間非活動化を要求する。
この区間非活動化を２回目に呼び出すのは、システム消
滅事象が、当該シスプレックス内の他の動作の結果とし
て生ずることもあるからである。７．もし、以前の任意のステップにおいて非活動化機能
が正常に終了していたならば、このポリシーに従って、
ポリシー活動化タスクが、ＣＯＮＦＩＧ￣ＳＴＯＲ，Ｏ
ＮＬＩＮＥコマンドと、ＣＯＮＦＩＧ￣ＥＳＴＯＲ，Ｏ
ＮＬＩＮＥコマンドとを内部的に発行して、全ての記憶
機構をオンライン状態に構成する。これが実行される
と、以前にＰＲＩＭＡＲＹが使用していた記憶機構を、
ＢＡＣＫＵＰ１が使用できるようになる。

【００７１】『２つのマシンのセットアップ』図１５には、２つのマシンのセットアップの具体例が示
されている。この構成は、システムを３つ含んでおり、
それらを、ＰＲＩＭＡＲＹ（１５０１、１５０１Ａ）、
ＢＡＣＫＵＰ及びＴＥＳＴと呼ぶことにする。ＰＲＩＭ
ＡＲＹが、専用のＣＰＣ上に置かれているのに対し、Ｂ
ＡＣＫＵＰ（１５０３、１５０３Ａ）とＴＥＳＴ（１５
０２）は、同一のＣＰＣ上にＰＲ／ＳＭ論理区画として
置かれている。ＰＲＩＭＡＲＹとＢＡＣＫＵＰとは、同
一のシスプレックス内に所属している。以上において、
ＰＲＩＭＡＲＹに故障が存在すれば（この故障は指定さ
れた故障検出期間の経過後に検出される）、そのワーク
ロードがＢＡＣＫＵＰへ移転される。また、導入設備
は、ＢＡＣＫＵＰ上で下記のオペレータ・コマンドを発
行することによって、ポリシーを活動化する。ＳＥＴＡＶＡＩＬ￣ＰＯＬＩＣＹ，ＡＣＴＩＶＡＴＥ＝
ＡＶＡＩＬ０１この具体例については、ＰＲＩＭＡＲＹシステムとＴＥ
ＳＴシステム内では、ＰＯＬＩＣＹの指定を行わない。

【００７２】アベイラビリティ・ポリシーＡＶＡＩＬ０
１のパラメータ・ライブラリのメンバの内容は、次の通
りである。ＳＹＳＧＯＮＥ（ＰＲＩＭＡＲＹ）ＳＹＳＴＥＭ（Ｂ
ＡＣＫＵＰ）ＤＥＡＣＴＩＶＡＴＥ（ＡＬＬ）ＳＴＯＲＥ（ＹＥＳ）ＥＳＴＯＲＥ（ＹＥＳ）

【００７３】この内容を持つアベイラビリティ・ポリシ
ーが設定されていると、ＰＲＩＭＡＲＹシステムが待機
状態へ入った場合に、以下の一連の事象が生ずる。１．ＰＲＩＭＡＲＹが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。２．故障検出期間の経過後に、ＢＡＣＫＵＰシステム
が、ステータス更新欠落事象の発生を宣言する。３．ステータス更新欠落事象の発生がＢＡＣＫＵＰにお
いて検出されたことに応じて、ポリシー活動化タスクが
現ポリシーの処理を開始するが、いかなる動作も不要で
あることを発見する。４．ＳＣＰが、オペレータに対し、ＰＲＩＭＡＲＹの故
障を確認するよう求めるプロンプトを出す。５．オペレータは、結局、ＰＲＩＭＡＲＹシステムがダ
ウン（ＤＯＷＮ）しているとの応答を返す。６．ＢＡＣＫＵＰ上のＭＶＳが、システム消滅（ＳＹＳ
ＧＯＮＥ）通知を当該シスプレックス内の全てのシステ
ムへ向けてトリガして、ＰＲＩＭＡＲＹシステムが、も
はや共用資源のいずれも使用していないことを表示す
る。このＳＹＳＧＯＮＥ通知は、マルチシステム・アプ
リケーションに対し、機能の引継ぎが可能になったこと
を知らせるための信号の役割を果たす。７．このＳＹＳＧＯＮＥ通知は、このポリシーにおける
他の動作をトリガする。この場合、ＢＡＣＫＵＰ上のポ
リシー活動化タスクが、ＢＡＣＫＵＰシステムの論理区
画のアドレッシング・レンジ内に位置している、ＰＲ／
ＳＭマシン内の全ての論理区画を対象とした、無指定の
区画間非活動化を実行する。８．もし、この非活動化が正常に終了したならば、この
ポリシーに従って、ポリシー活動化タスクが、ＣＯＮＦ
ＩＧ￣ＳＴＯＲ，ＯＮＬＩＮＥコマンドと、ＣＯＮＦＩ
Ｇ￣ＥＳＴＯＲ，ＯＮＬＩＮＥコマンドとを内部的に発
行して、全ての記憶機構をオンライン状態にする。これ
が実行されると、以前にＴＥＳＴシステムが使用してい
た記憶機構を、ＢＡＣＫＵＰ（１５０３Ａ）が使用でき
るようになる。

【図面の簡単な説明】

【図１】本発明の主要な機能間の流れを示したブロック
図である。

【図２】本発明の初期化段階のフローチャートである。

【図３】論理区画セキュリティ・フレームを示す概略図
である。

【図４】本発明のモニタ段階のフローチャートである。

【図５】本発明の分離段階のフローチャートである。

【図６】本発明の資源再構成段階のフローチャートであ
る。

【図７】本発明のワークロード引継ぎ段階のフローチャ
ートである。

【図８】区画間イネーブルメント機能のフローチャート
である。

【図９】区画間システム・リセット機能及び区画間非活
動化機能のフローチャートである。

【図１０】無指定の区画間非活動化機能のフローチャー
トである。

【図１１】アベイラビリティ・ポリシーのシンタックス
を示す図である。

【図１２】活動システムから代替システムへの引継ぎを
行う場合の動作を示す図である。

【図１３】同一プロセッサ上の一のシステムをリセット
する場合の、「実行前」と「実行後」の構成を示す図で
ある。

【図１４】同一プロセッサ上の一のシステムを非活動化
する場合の、「実行前」と「実行後」の構成を示す図で
ある。

【図１５】２つのマシンのセットアップを実行する場合
の、「実行前」と「実行後」の構成を示す図である。

【図１６】ＳＣＣＢのフォーマットを示す図である。

【図１７】シスプレックス・データ・セットの主要部分
のフォーマットを示す図である。

【図１８】本発明に関連する、ＰＲ／ＳＭ機構の主要な
制御フィールドを示す図である。

【符号の説明】

１１初期化段階１２モニタ段階１３分離段階１４資源再構成段階１５ワークロード引継ぎ段階７６シスプレックス・データ・セット１００１サービス・コール制御ブロック（ＳＣＣＢ）１６０１機能コード１６０２応答コード１６０３ターゲット論理区画識別子１６０４許可コード１７０１シスプレックス・データ・セット１７０２システムＩＤ１７０４ステータス・フィールド１７０５故障検出期間１８０２ステータス・テーブル

───────────────────────────────────────────────────── フロントページの続き (72)発明者デービッド・ブラッドレイ・ピーターセンアメリカ合衆国12590、ニューヨーク州ワッピンガーズ・フォールズ、ヴァレー・ロード 25番地 (72)発明者イアン・ジョフレー・レディングイギリス国ハンプシャー、エスオー21・１エヌダブリュー、ウィンチェスター、トゥワイフォード、ハイ・ストリート、ホーム・ミード（番地なし) (72)発明者スティーブン・ジョン・シュマント東京都渋谷区上原２−22−６ホーマット・スワン 301 (56)参考文献特開昭62−115547（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】複数の論理区画へ分割された少なくとも
１つの物理プロセッサを備え、各論理区画が当該論理区
画に関連する制御プログラムを保持するための記憶資源
及び当該制御プログラムを実行するためのプロセッサ資
源を有し、各論理区間が異なるステータスを有すること
ができるようにした論理区画式データ処理装置におい
て、下記の各手段を含む区画間制御装置。（ａ）前記各論理区画へ接続され、一の論理区画に関す
る応答動作を開始するための一の制御プロセスを、他の
１つの論理区間内の制御プログラムが実行することを許
可するための許可手段。（ｂ）前記各論理区画の前記記憶資源内に設けられ、１
組のトリガ事象と当該トリガ事象に関連する応答動作定
義とを指定するポリシー定義手段であって、当該応答動
作定義の各々は、前記トリガ事象が生起する際に、関連
する論理区画内の制御プログラムが遂行すべき前記応答
動作のうちの少なくとも１つを指定するように構成され
ているポリシー定義手段。（ｃ）前記他の１つの論理区画内に設けられ、前記一の
論理区間におけるトリガ事象を検出するように、当該一
の論理区画のステータスをモニタするためのモニタ手
段。（ｄ）前記各論理区間へ接続され、前記応答動作を開始
させることにより、前記一の論理区間の前記記憶資源及
びプロセッサ資源を再構成させるとともに、前記他の１
つの論理区間内の前記制御プログラムに前記制御プロセ
スを実行させて、当該再構成済みの記憶資源及びプロセ
ッサ資源における動作を指示させるためのサービス・プ
ロセッサ手段。（ｅ）前記各論理区画内に設けられ、前記モニタ手段が
前記トリガ事象を検出し且つ前記許可手段が当該トリガ
事象に関連する前記応答動作定義によって指定された一
の応答動作を開始するように前記制御プロセスの実行を
許可しているときに、前記他の１つの論理区間における
前記制御プロセスから前記サービス・プロセッサ手段
へ、前記応答動作の開始要求を通信するための通信手
段。
【請求項２】前記サービス・プロセッサ手段が前記許
可手段を含み、前記ポリシー定義手段が、前記サービス
・プロセッサ手段に対し、前記一の論理区間を非活動化
及びリセットするよう要求するための区画間非活動化手
段を含むことを特徴とする請求項１記載の区画間制御装
置。
【請求項３】前記ポリシー定義手段が、前記サービス
・プロセッサ手段に対し、前記一の論理区間の前記記憶
資源及びプロセッサ資源を再構成するよう要求するため
の資源再構成手段を含むことを特徴とする請求項２記載
の区画間制御装置。
【請求項４】一のサービス・プロセッサと、２つ以上
の論理区画へ分割された少なくとも１つの物理プロセッ
サとを備え、各論理区画が当該論理区画に関連する制御
プログラムを保持するための記憶資源及び当該制御プロ
グラムを実行するためのプロセッサ資源を有し、各論理
区間が異なるステータスを有することができるようにし
た論理区画式データ処理装置において、下記の各ステッ
プを含む区画制御方法。（ａ）一の論理区間に関する応答動作を開始するための
一の制御プロセスを、他の１つの論理空間内の制御プロ
グラムが実行することを許可するステップ。（ｂ）前記各論理区画の記憶資源内に、１組のトリガ事
象と当該トリガ事象に関連する応答動作定義から成る、
ポリシー定義データをそれぞれロードするステップであ
って、当該応答動作定義の各々は、前記トリガ事象が生
起する際に、関連する論理区画内の制御プログラムが遂
行すべき前記応答動作のうちの少なくとも１つを指定す
るように構成されているステップ。（ｃ）前記他の１つの論理区画に、前記一の論理区画に
おけるトリガ事象を検出するように、当該一の論理区画
のステータスをモニタさせるステップ。（ｄ）前記ポリシー定義データを介して前記応答動作を
開始させることにより、前記サービス・プロセッサに前
記一の論理区間の前記記憶資源及びプロセッサ資源を再
構成させるとともに、前記他の１つの論理区間内の前記
制御プログラムに前記制御プロセスを実行させて当該再
構成済みの記憶資源及びプロセッサ資源における動作を
指示させるステップ。（ｅ）前記他の１つの論理区間が前記トリガ事象を検出
し且つ当該トリガ事象に関連する前記応答動作定義によ
って指定された一の応答動作を開始するように前記制御
プロセスの実行が許可されているときに、前記他の１つ
の論理区間における前記制御プロセスから前記サービス
・プロセッサ手段へ、前記応答動作の開始要求を通信す
るためのステップ。
【請求項５】前記サービス・プロセッサ手段が、区画
間非活動化動作を指定する一の応答動作定義に応答し
て、前記一の論理区間を非活動化及びリセットさせるよ
うにしたことを特徴とする請求項４記載の区画間制御方
法。
【請求項６】前記サービス・プロセッサ手段が、資源
再構成動作を指定する一の応答動作定義に応答して、前
記一の論理区間の前記記憶資源及びプロセッサ資源を再
構成させるようにしたことを特徴とする請求項５記載の
区画間制御方法。