JPH0831047B2 - 論理区画式データ処理装置における区画間制御のための装置及び方法 - Google Patents

論理区画式データ処理装置における区画間制御のための装置及び方法

Info

Publication number
JPH0831047B2
JPH0831047B2 JP3192231A JP19223191A JPH0831047B2 JP H0831047 B2 JPH0831047 B2 JP H0831047B2 JP 3192231 A JP3192231 A JP 3192231A JP 19223191 A JP19223191 A JP 19223191A JP H0831047 B2 JPH0831047 B2 JP H0831047B2
Authority
JP
Japan
Prior art keywords
logical
partition
logical partition
processor
policy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3192231A
Other languages
English (en)
Other versions
JPH05181823A (ja
Inventor
ドナルド・フレッド・オウルト
デービッド・ブラッドレイ・ピーターセン
イアン・ジョフレー・レディング
スティーブン・ジョン・シュマント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05181823A publication Critical patent/JPH05181823A/ja
Publication of JPH0831047B2 publication Critical patent/JPH0831047B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、論理区画式データ処理
システムに係り、一層詳細に説明すれば、1つの論理区
画内で活動状態にあるプロセスが他の論理区画内のプロ
セスに対して影響を及ぼす活動を行わねばならない場合
の、区画間対話のメカニズムに係る。
【0002】
【従来の技術】『論理区画』 論理区画化の機能を利用すると、1台の大型コンピュー
タ・システムを、マイクロコードの制御下で複数の論理
区画へ分割することができる。例えば、IBM社のプロ
セッサ・リソース/システム・マネジャ(PR/SM)
機構を利用すると、IBM3090プロセッサを複数の
論理区画へ分割することができる。論理区画(logical
partition: LP)とは、システム制御プログラム(sys
tem control program: SCP)を実行するのに十分な
1組のハードウェア資源(プロセッサ、メモリ、チャネ
ル、等)をいう。一層詳細な背景技術については、IB
M社発行のマニュアルである「ES/3090プロセッ
サ・コンプレックス:プロセッサ・リソース/システム
・マネジャ(Form Number: GA22-7123)」に記述されて
いる。
【0003】論理区画式マシンの内部では、各SCPが
互いに分離されていて、あたかもそれ自体の物理セント
ラル・プロセッサ・コンプレックス(CPC)内に置か
れているかのようにランする。論理区画化は、非常に大
きな融通性を与える。例えば、導入設備において、一日
のうちに何回かの作業交替が行われる場合や、長期間に
わたる新しいソフトウェア又は新しいソフトウェア・バ
ージョンの試験及び移行が行われる場合には、異なった
論理区画が活動化されることがある。また、論理区画化
によれば、ユーザが、マシンの物理資源を最大限に利用
することが可能となる。
【0004】同一の物理マシン上に複数のSCPが置か
れるにも拘わらず、これらのSCPは、互いに他のSC
Pと直接的に通信したり、これを直接的に制御するため
の手段を備えていない。一方、オペレータによる各論理
区画の制御は、サービス・プロセッサに接続された1台
のシステム・コンソールを介して行われる。論理区画式
マシンの内部では、複数のSCPが実際には同一のCP
C上に置かれていて、これらのSCPが単一のサービス
・プロセッサを共用する。さらに、ハードウェアによる
論理区画化を提供するマシンは、再構成サポート機能も
併せて提供し、この再構成サポート機能によって、各S
CPがチャネルや記憶機構のような資源を追加できるよ
うになっている。ただし、この場合において、これらの
資源を各論理区画の構成に追加できるのは、これらの資
源が「解放されている」場合に限られ、ここで「解放さ
れている」とは、これらの資源が他の論理区画によって
使用されていないことをいう。
【0005】論理区画の非活動化とは、オペレータによ
って開始される処の、一の論理区画を閉鎖(シャットダ
ウン)するための機能である。一の論理区画が非活動化
される場合、この論理区画は、それまでこの論理区画に
割り当てられていたプロセッサや記憶機構を全て解放す
るとともに、この論理区画へ構成されていたチャネル経
路をリセットする。(これ以上の詳細については、IB
M社発行のマニュアルである「ES/3090プロセッ
サ・コンプレックス:プロセッサ・リソース/システム
・マネジャ(Form Number: GA22-7123)」を参照された
い)。
【0006】PR/SM機構の重要な機能の1つに、記
憶機構や物理CPCの処理能力を区画化するという能力
がある。これにより、各論理区画には、主記憶機構や拡
張記憶機構の一部分が付与される。
【0007】PR/SM機構の記憶機構再構成機能は、
複数の論理区画の間で記憶機構の動的な再構成を行うこ
とを可能にする。すなわち、一の論理区画に割り当てら
れていた記憶機構の一部を、この論理区画から構成解除
(除去)して、他の論理区画を活動化するのに使用する
ことができる。或いは、一の論理区画を非活動化した後
に、この論理区画に割り当てられていた記憶機構の全て
を、他の論理区画へ構成することもできる。
【0008】SCPは、サービス・コールを介して、サ
ービス・プロセッサに対し記憶機構の再構成を実行する
よう要求する。
【0009】各論理区画用の記憶機構の構成を定義する
ために、論理区画定義フレームが使用される。また、記
憶機構の再構成機能を利用するためには、一の論理区画
用の記憶機構の割当分を、2つの別個の量で以て定義し
ておく必要がある。その1つは初期記憶量であり、他の
1つは予約記憶量である。これに加えて、物理構成内の
開始アドレスも定義しておかねばならない。第1の論理
区画用のものとして定義されていた記憶機構を、第2の
論理区画へ追加することができるのは、第1の論理区画
の記憶機構が、第2の論理区画の記憶機構の予約記憶部
分と同一の物理アドレスから開始するように定義されて
いる場合だけである。(これ以上の詳細については、I
BM社発行のマニュアルである「ES/3090プロセ
ッサ・コンプレックス:プロセッサ・リソース/システ
ム・マネジャ(Form Number: GA22-7123)」と、「プロ
セッサ・リソース/システム・マネジャの動的記憶機構
再構成のためのMVSガイド(Form Numer: GC28-136
5)」を参照されたい)。
【0010】各SCPは、サービス・プロセッサ・イン
ターフェースを有しており、これを介して「サービス・
コール論理プロセッサ(Service Call Logical Process
or:SCLP)」との通信を行う。SCPは、その記憶
機構内に制御情報をセットアップした上で、サービス・
コール命令を実行する。このサービス・コール命令に応
じて、サービス・コール論理プロセッサ(以下「サービ
ス・プロセッサ」という)が、この制御情報内で指定し
た機能を実行する。サービス・プロセッサ・インターフ
ェースの目的は、サービス・プロセッサとの通信を行
い、サービス・プロセッサが提供するサービスを呼び出
すことにある。特定の機能に応じた実行が行われるの
は、CPC内であったり、サービス・プロセッサ内であ
ったり、又は両者の内部であったりする。
【0011】サービス・コール命令は、「SCLPコマ
ンド・ワード」と呼ばれる32ビットの値と、サービス
・コール制御ブロック(Service Call Control Block:
SCCB)の実アドレスとを必要とする。SCCBは、
SCLPコマンドに関連する制御情報を保持する。サー
ビス・コール命令が完了するのは、そのSCLPコマン
ドがサービス・プロセッサによって受入れられた場合で
ある。実際の機能は、非同期的に実行される。SCLP
コマンドの完了は、外部割り込みコード「’2401’
X」(サービス信号)を持つ外部割り込みによって通知
される。
【0012】『マルチシステム・アプリケーション』 既存のアプリケーション(例えば、CICS、IMS)
について云えば、マルチシステム環境内の一のSCP
(例えば、MVS)上で実行されている各アプリケーシ
ョンには、2通りの立場がある。その1つは「活動」
(プライマリ)であり、他の1つは「代替」(バックア
ップ)である。プライマリ・アプリケーションが、その
サービスを実行できない場合は、その役割をバックアッ
プ・アプリケーションが引継ぐようになっている。ただ
し、アプリケーションの故障ばかりでなく、SCPの故
障や、通信アクセス方式(例えば、VTAM)の故障に
対しても、機能保護を提供することが望まれる場合に
は、マルチシステム構成が必要となる。これらの保護を
可能とする拡張回復機能(Extended Recovery Facilit
y:XRF)は、故障が生ずる際にそのアプリケーション
の最終ユーザが直面する処の、サービス中断時間を短縮
するのに大いに役立つものである。これ以上の詳細につ
いては、IBM社発行のマニュアルである「CICS/
ESA ̄XRFガイドV3.1(Form Number: SC33-06
61)」を参照されたい。
【0013】かかるバックアップ能力を提供するために
は、導入処理の際に、各々が完全に構成された2組のシ
ステムを構築しなければならなかった。一方をプライマ
リとして機能させ、他方をバックアップとして機能させ
るためである。さらに、プライマリの故障を確認するた
めのプロセスは、オペレータの頻繁な介入や、追加のハ
ードウェア及びソフトウェアを必要としていた。例え
ば、CICS ̄XRFは、通常、CICS又はVTAM
の故障から自動的に回復することができるが、MVSの
故障からの回復処理は、本発明以前には、オペレータの
介入なしには完了することができなかった。すなわち、
オペレータ(又は自動化運用ツール)が、代替CICS
から発行されたメッセージを見た上で、活動CICSが
ランしていた場合はMVSイメージのシステム・リセッ
トを行うとともに、その代替CICSのメッセージに応
答して、このリセットの正常な完了を確認しなければな
らなかった。
【0014】かかる所望の機能を達成するには、2通り
の方法がある。第1はオペレータが介入するというもの
であり、第2は追加のハードウェアやソフトウェア・パ
ッケージを使用するというものである。
【0015】『オペレータの介入による解決法』 以下のシナリオは、複数の論理区画を利用して高いアベ
イラビリティを達成するためには、どのようにすれば良
いかを、説明するためのものである。 1.活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能となるように、これら
の論理区画を定義する。 2.第1のシステムは、活動アプリケーション(例え
ば、CICS)をランさせている。 3.第2のシステムは、代替アプリケーションをランさ
せている。 4.第1のシステムが故障する。 5(ユーザによって制御された)所定時間の経過後に、
第1のシステムのステータスについて、第2のシステム
がオペレータにプロンプトを出す。 6.オペレータが、第1のシステムを手動的にリセット
する。 7.オペレータが、第1のシステムを手動的に非活動化
する(以前のリセットが行われていなかった場合には、
この非活動化によって第1のシステムのリセットも併せ
て行われる)。 8.オペレータが、第1のシステムから記憶機構を獲得
するための再構成コマンドを、第2のシステム上で手動
的に発行するとともに、そのオペレーションが完了する
のを待機する。 9.オペレータが、ステップ5で出されたプロンプトに
応答する。 10.この時点では、ワークロードを第2のシステムへ
切替えるためのプロセスを、アプリケーションが開始す
る。
【0016】前述のシナリオにおいて、ステップ5−9
は、オペレータの手動操作を必要とする。かかる手動的
な介入が存在するために、遅延時間が長くなるのに加え
て、誤操作の可能性も生ずるから、最終ユーザにとって
の、アプリケーションのアベイラビリティが低いものと
なっている。
【0017】『追加のハードウェア及びソフトウェアに
よる解決法』 以下のシナリオは、NETVIEW及びISCFという
製品を使用し且つ購入済みの追加のハードウェアを接続
して、高いアベイラビリティを達成するには、どのよう
にすれば良いかを説明するためのものである。(これに
ついては、IBM社発行のマニュアルである「ISCF
の計画及び導入ガイド」(Form Number:SC30-3472)を
参照されたい)。 1.活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能となるように、これら
の論理区画を定義する。 2.NETVIEW及びISCFという製品を購入し
て、これを導入する。また、PS/2と、ISCFを両
システムのシステム・コンソール及びオペレータ・コン
ソールに接続するためのケーブルを購入する。 3.ユーザは、所望の動作を実行するように、NETV
IEW及びISCFの制御情報を、カストマイズしなけ
ればならない。 4.第1のシステムは、活動アプリケーション(例え
ば、CICS)をランさせている。 5.第2のシステムは、代替アプリケーションをランさ
せている。 6.第1のシステムが故障する。 7(ユーザによって制御された)所定時間の経過後に、
第1のシステムのステータスについて、第2のシステム
がオペレータにプロンプトを出す。 8.NETVIEWが、このメッセージを捕捉して、ユ
ーザ側の自動化運用ツールを呼び出す。 9.この自動化運用ツールは、第1のシステムの論理区
画を非活動化するために、一のISCF機能を呼び出
す。 10.ISCFは、VTAMを介して、ISCFのPS
/2と通信を行う。 11.ISCFのPS/2は、システム・コンソールと
通信を行って、非活動化機能を要求する。 12.ISCFのPS/2は、システム・コンソールを
モニタして、その非活動化機能の完了を確認する。この
機能が完了した場合、この機能は、第2のシステム上で
ISCFと通信を行い、かかる通信を受けたISCF
は、NETVIEWの自動化運用ツールへ制御を返し
て、この機能が完了したことを知らせる。 13.この時点で、自動化運用ツールは、諸資源を再構
成するために、MVS再構成コマンドを呼び出さなけれ
ばならない。 14.自動化運用ツールは、ステップ7で出されたプロ
ンプトに応答する。 15.この時点で、ワークロードを第2のシステムへ切
替えるためのプロセスを、アプリケーションが開始す
る。
【0018】この解決法は、オペレータによる介入が必
要とされている場合に生じがちな、長時間にわたる予測
不可能な遅延を防止するには大いに役立つものである
が、本発明と比較した場合には、著しく劣ったものと云
わざるを得ない。なぜなら、この解決法によれば、MV
Sの故障後に、CICS ̄XRFの引継ぎ処理を行おう
とした場合に、適正な動作が適正な順序で行われること
を保証できないからである。このような状況における誤
動作が、極めて重大であると云われる所以は、かかる誤
動作がユーザのデータを損傷させてしまうおそれがあ
り、しかもそのことが最終的に判明するまでの間に、か
かる損傷データによって、他の大量のデータの不正な更
新が行われてしまうおそれがあるからである。
【0019】前述のISCF/NETVIEWによる解
決法を、CICS ̄XRFについて利用するのに適して
いない具体的な理由は、次の通りである。 1.このプロセスは、PS/2、ISCFの接続機器
(追加の制御装置)、NETVIEW、ISCF及びV
TAMという夫々の製品の信頼性に依存するだけでな
く、自動化運用ツールの信頼性にも依存する。このいず
れによっても、故障発生率が増大することに加えて、追
加のハードウェア製品及びソフトウェア製品の費用も余
分にかかることになる。 2.このプロセスは、既存のメッセージを代行受信(in
tercept)して、これらのメッセージに対する応答を含
む、必要な動作を自動化することを基礎とするものであ
る。従って、オペレータが、メッセージに対して早まっ
て応答してしまうという誤操作の可能性を、払拭するこ
とができない。 3.このISCF/NETVIEWによる解決法では、
システム・リセットを必要とするようなSCPインスタ
ンスに固有の識別子を、受け取ることも、使用すること
もできない。この欠点は、データを損傷してしまうとい
う問題、健全なSCPがその必要もないのにユーザから
引き離されてしまうという問題、又はMVSの故障原因
を診断するためにそれまで実行していたスタンド・アロ
ーン・ダンプが失われてしまうという問題を導くおそれ
がある。 4.各導入設備には、関係するメッセージを代行受信し
たときに実行すべき動作を決定するための、比較的複雑
なプログラムを書き込まねばならない。このプログラム
を開発し且つ維持するにはかなりの費用がかかり、しか
もこのプログラムは誤りを含んだものとなり易いにもか
かわらず、これをテストするのは困難である。なぜな
ら、生起しうる故障には、極めて多種類のケースが存在
するからである。また、このプログラムに誤りがあった
場合には、結果的にデータを損傷してしまうことが多い
が、かかるデータ損傷の存在は、長期にわたって表面化
しないため、その回復を行うことが非常に困難である。
また、たとえデータ損傷の存在が速やかに判明したとし
ても、損傷したデータの正しいバージョンが、バックア
ップ・コピーからの前進回復によって元の状態に復元さ
れるまでの間は、最終ユーザに対するサービスが、機能
低下したままに留まらざるを得ない。
【0020】
【発明の概要】本発明は、第1の論理区画内のプロセス
を使用して、第2の論理区画内の全てのプロセスを、効
率的にしかも自動的に監視したり中止させることによっ
て、第2の論理区画内のワークロードを、第1の論理区
画へ移動させることができるようにするための方法及び
装置を提供するものである。
【0021】動作について説明すると、論理区画式シス
テム内の選択された論理区画を、区画間機能を実行でき
るようにイネーブルする。次に、これらの選択された論
理区画において、オペレーティング・システムを起動さ
せる。起動された各オペレーティング・システムは、自
らを区画間機能のターゲットとしてイネーブルするとと
もに、他の論理区画内のオペレーティング・システムが
故障した際の動作を指定するポリシーを活動化する。も
し、これらの他のシステムのうちの1つが故障したなら
ば、故障システムを除く他のシステムが、自らのポリシ
ーを照会して、適正な動作を自動的に実行する。これら
の動作は、非活動化や、リセットや、故障したターゲッ
ト・システムの論理区画からの資源を再構成することを
含んでいる。
【0022】従って、本発明の目的は、一の論理区画内
のプロセスに、他の論理区画内の故障システムの下でラ
ンしている他のプロセスの機能を引継がせる、というプ
ロセスを自動化することにある。本発明の他の目的は、
区画間制御のための信頼性の高いメカニズムを提供する
ことにある。本発明の他の目的は、複数の論理区画内で
それぞれランしているプロセス用のアベイラビリティ・
ポリシーを、高い信頼性を以て定義し且つ実現するため
のメカニズムを提供することにある。本発明の他の目的
は、一の論理区画内でランしているプロセスを、他の論
理区画内でランしているプロセスで自動的にバックアッ
プするに当たり、追加の又は信頼性の劣るハードウェア
又はソフトウェアの必要性を低減させることにある。
【0023】
【実施例】本発明は、マルチシステム環境が確立されて
いることを必要とする。以下の説明では、マルチシステ
ム環境内の複数システムのセット(集合)を表すため
に、シスプレックスという用語(「システム」と「コン
プレックス」との合成語)を使用する。どのような複数
システムが一のシスプレックスの限界を定めるか、とい
う点を説明すると、このシスプレックス内の各システム
については、次の条件が真でなければならない(図17
を参照のこと)。 −各システムは、共用DASD上の、共通のシスプレッ
クス・データ・セット1701を共用しなければならな
い。 −各システムは、他のシステムが当該システムと通信で
きるように、共通のシスプレックス・データ・セット1
701へ、当該システムに固有のシステム許可識別子1
702を書き込む。この識別子の固有の値は「システム
ID」とも呼ばれ、これについては以下で詳述する。 −各システムは、シスプレックス・データ・セット17
01の固有のセクション(1703A、1703B、1
703C)を要求して、これを更新する。各システム
は、この固有のセクションにおいて、タイム・スタンプ
を含むステータス・フィールド1704を一定の期間ご
とに更新する。また、各システムは、当該システムの故
障検出期間1705(この期間は導入の際に指定され
る)を書き込む。もし、一のシステムが、この故障検出
期間1705を超える時間にわたってステータス・フィ
ールドの更新を停止するならば、これをもって「ステー
タス更新欠落」が生じたものと判断する。 −当該シスプレックス内の各システムは、他の全てのシ
ステムのステータス・フィールドを読み取る。こうする
と、ステータス更新欠落状態を、他のシステムが検出で
きるからである。 −もし、当該シスプレックス内の一のシステムが、当該
シスプレックス内の他のシステムを対象として、アベイ
ラビリティ・ポリシーに従った動作を行うことを必要と
すれば、後者のシステムID(1702)が、シスプレ
ックス・データ・セット1701から得られる。こうし
て得られたシステムIDは、区画間リセット又は区画間
非活動化を行うために、PR/SM機構へ渡される。ま
た、このシステムIDは許可値として使用されて、前者
の論理区画が、後者(故障側)の論理区間を対象として
区画間機能を発行し得ることを表す。
【0024】図1には、本発明の全体的なフローチャー
トが示されている。初期化段階11は、他の論理区画を
対象とする動作を、それとは別のどの論理区画に許可し
ておくかを定義するのに必要なセットアップと、オペレ
ーティング・システムの初期プログラム・ロード(IP
L)と、このオペレーティング・システムが実行すべき
動作を制御するアベイラビリティ・ポリシーの活動化と
を含んでいる。オペレーティング・システムのIPLが
正常に終了した後は、モニタ段階12が開始する。この
モニタ動作は、故障しているように見えるオペレーティ
ング・システムを識別するためのものである。次の分離
段階13は、故障したシステムによる共用資源のアクセ
スを防止するためのプロセスである。(一の論理区画内
でランしている)一のシステムが故障していることを確
認し、この故障システムを共用資源から分離した後は、
資源再構成段階14により、この故障システムの資源
(例えば、記憶機構、プロセッサ、等)を解放して、同
一マシン内の異なる論理区画内でランしている他のシス
テムに、これらの資源を獲得させることができる。資源
再構成段階14と同時に、ワークロード引継ぎ段階15
は、故障システムのワークロードの引継ぎを行わせて、
これをバックアップ・システム上のワークロードとする
ことができる。このように、ワークロードを他の論理区
画内でランしているバックアップ・システムへ移転させ
ると、故障システムから獲得したシステム資源を利用す
ることが可能となる。
【0025】図2には、初期化段階11中の制御の流れ
が示されている。オペレーティング・システムのIPL
を行う前に、該当する論理区画をイネーブルすることに
より(ステップ21)、後でいずれかのシステムが故障
した場合に必要となる、区画間機能を実行できるように
しておく必要がある。この制御は、同一のCPC上に置
かれた、ユーザが異なる複数の論理区画を、互いに適正
に分離した状態に維持することを可能にする。また、当
該技術分野では公知の、論理区画セキュリティ(LPS
EC)フレームは、各論理区画用の、種々のセキュリテ
ィ関係の制御信号を保持している。(LPSECフレー
ムの詳細については、例えばIBM社発行のマニュアル
である「ES/3090プロセッサ・リソース/システ
ム・マネジャ(Form Number: GA22-7123)を参照された
い)。本発明は、このLPSECフレームに区画間制御
許可情報を追加して、他の論理区画に影響を及ぼすよう
な区画間機能(例えば、区画間システム・リセット機
能)を、各論理区画が発行する能力を制限するようにし
ている。図3には、かかるLPSECフレームが示され
ている。同図に示すように、各論理区画用の区画間制御
許可情報は、LPSECフレームのXLP欄31で指定
されている。
【0026】図3の例では、1つのLPSECフレーム
で、2つの論理区画(「PRIMARY」32及び「B
ACKUP1」33)を定義している。「BACKUP
1」論理区画は、区画間機能を発行することを許可され
ている(XLP欄31において、「BACKUP1」論
理区画に対応する位置34には、「イエス」を表わす
「Y」が指定されている)。このXLP情報は、セキュ
リティ制御テーブル(図18の1803)内に維持され
る。
【0027】次に(図2のステップ22)、通常の方法
で、該当する論理区画内に、オペレーティング・システ
ムを初期プログラム・ロード(IPL)する。なお、本
実施例では、MVSをIPLするように示しているが、
この機能は、MVSオペレーティング・システムには限
られない。
【0028】次に(図2のステップ23)、このオペレ
ーティング・システムは、その初期化段階のいずれかの
時点で、他のオペレーティング・システム・インスタン
スに対して、次の許可を与える。すなわち、その許可と
は、このオペレーティング・システムに故障が発生した
場合に、他のオペレーティング・システム・インスタン
スが、このオペレーティング・システムを対象とする動
作を実行することの許可である。この機能は図8に一層
詳細に示してあり、また同図を参照して以下で詳述す
る。
【0029】オペレーティング・システムが動作してい
る任意の時点で、オペレータ(又は自動化運用ツール)
は、アベイラビリティ・ポリシーを活動化することがで
きる(ステップ24)。このアベイラビリティ・ポリシ
ーは、このオペレーティング・システムに対して、他の
オペレーティング・システム・インスタンスの故障を検
出した場合に実行すべき動作を通知するものである。ア
ベイラビリティ・ポリシーについては、アベイラビリテ
ィ・ポリシーの初期化に関連して、以下で詳細に説明す
る。
【0030】図4には、複数システムの活動をモニタす
るためのプロセスが示されている。一のシステムの故障
を検出するため、関与している各システムは、共用DA
SD上の共用データ・セット(46)に、タイム・スタ
ンプを周期的に書き込む(ステップ41)。このタイム
・スタンプの書き込みは、各システム内の高優先順位の
タスク(可能な最高の指名順位にセットされたタスク)
によって行われる。というのは、もし高優先順位のタス
クがその作業を完了できないのであれば、アプリケーシ
ョンがランしていない可能性も非常に高いからである。
このタイム・スタンプとともに、各システムは、共用デ
ータ・セット(46)内に、このシステムの故障検出期
間(図17の1705)を書き込む。(なお、この故障
検出期間はユーザが指定するものであって、例えば1分
に指定される)。各システムは、そのタイム・スタンプ
を書き込むことに加えて、他の全てのシステムのタイム
・スタンプを読み取ることも行う(ステップ42)。
【0031】他のシステムのタイム・スタンプを読み取
った後、このタイム・スタンプを現在時刻と比較する
(ステップ43)。もし、読み取ったタイム・スタンプ
がその故障検出期間内に(例えば、最近の1分間の間
に)更新されていなければ、そのシステムがステータス
更新欠落状態にあるものと判断し(ステップ44)、そ
の旨の表示をポリシー活動化タスク(45)へ渡す。こ
の時点で、ポリシー活動化タスク(45)は、アベイラ
ビリティ・ポリシーを照会して、何らかの動作を実行す
べきか否かを決定する(後述する「アベイラビリティ・
ポリシー」内のNOSTATUSポリシー・ステートメ
ントを参照されたい)。一方、各システムが故障検出期
間内に自らのステータスの更新を行っていたならば、ス
テータスのタイム・スタンプを次に読み取るまでの間、
これ以上の動作は何も行わない。一のシステムがステー
タス更新欠落状態にあると識別され、しかもアベイラビ
リティ・ポリシーがこのシステムをマルチシステム環境
から除去すべきである旨を表示している場合には、次の
分離段階へ入る。
【0032】図5には、分離段階の制御の流れが示され
ている。ステータス更新欠落状態を検出したシステムに
おける、オペレーティング・システム上のポリシー活動
化タスク(Policy Activation Task: PAT)は、故障
システムがもはや共用資源をアクセスしないようにする
ために、区画間システム・リセット機能又は区画間非活
動化機能を呼び出す(ステップ51)。この機能の詳細
については、図9及び同図に関する後述の説明を参照さ
れたい。
【0033】区画間システム・リセット機能又は区画間
非活動化機能の実行結果をチェックして(ステップ5
2)、この機能が正常に完了したか否かを決定する。も
し、この機能が正常に完了したならば、当該シスプレッ
クスの区画化を開始する(ステップ53)。シスプレッ
クスの区画化とは、当該シスプレックス内の一のシステ
ムが、当該シスプレックスから他のシステムを除去する
際に使用するプロセスである。(なお、一のシステムを
閉鎖する代替方法には、手動操作又はオペレータが駆動
するインターフェース(58)を介するものもある)。
このシステムを除去する際に実行される動作は、次の通
りである。 −当該シスプレックス内にある複数システムのリスト
(図17参照)から、ターゲット・システム(処理対象
のシステム、ここでは故障システムのこと)を除去する
(ステップ54)。この結果、当該シスプレックス内に
ある複数システムのリストに対する将来の全ての要求に
は、この故障システムが割り当てられることはなくな
る。 −該当するオペレーティング・システム内のマルチシス
テム構成要素は、故障システムのシステム・レコード
(図17の1705)が存在しないことを検出し、従っ
て以前にこの故障システムが所有していた全ての資源を
一掃して構わないということを知る。 −当該シスプレックス内の各システムが、故障システム
のかかる確認を検出した場合、追加のポリシー動作を行
わせるために、各システム上のポリシー活動化タスク
(PAT)へ、SYSGONE(システム消滅)事象が
渡される。
【0034】SYSGONE状態を知らされた場合、ポ
リシー活動化タスク56は、何らかの動作を実行する必
要があるか否かを決定する。SYSGONE状態につい
てのポリシー活動化タスクの主たる目的は、資源再構成
段階とワークロード引継ぎ段階とをトリガすることにあ
る。これらの段階は、同時並行的に処理される。(その
詳細については、図6及び図7、並びにこれらの図面に
関連する説明を参照されたい)。
【0035】もし分離処理が正常に完了しなければ、故
障システムがリセットされたことを確認するように、オ
ペレータに対し、プロンプトが出される。なお、オペレ
ータが故障を確認した場合には、本発明に関連する自動
運用化ツールの残りの部分の処理を続行することができ
る。
【0036】(なお、アベイラビリティ・ポリシーに
は、分離段階を実行した後に、資源再構成段階とワーク
ロード引継ぎ段階とをバイパスさせるようなものもあ
る。)
【0037】一のシステムが共用資源から分離された後
に、資源に関係する任意のポリシー動作が実行される。
図6には、図5のポリシー活動化タスク(56)が、図
5の55に示すようなSYSGONE状態の通知を受け
取ったときに実行する処の、資源再構成に関する主要な
機能が示されている。
【0038】一の資源を一の論理区画に移転できるよう
にするためには、この資源が、他の論理区画内の故障オ
ペレーティング・システムにもはや割り当てられていな
いことを確認する必要がある。これを達成するには、区
画間非活動化機能を呼び出して(ステップ61)、(ア
ベイラビリティ・ポリシーが指定している)ターゲット
論理区画(故障システムの論理区画)に現に割り当てら
れている全ての資源を解放するか、又は無指定の区画間
非活動化機能を呼び出して、このポリシー動作を実行し
ているシステムの論理区画アドレッシング・レンジ内に
位置している処の、複数の論理区画に割り当てられてい
る全ての資源を解放するようにすれば良い。これらのサ
ービスの詳細については、図9及び図10、並びにこれ
らの図面に関連する説明を参照されたい。
【0039】故障システム及びその論理区画の資源を解
放した後は、これらの資源を、同一のCPC上に置かれ
ている他の論理区画へ再構成することができる。このよ
うにして処理される資源は、アベイラビリティ・ポリシ
ー内で指定されている。MVSは、適当なMVS ̄CO
NFIGコマンドを内部的に発行して、これらの資源
を、このシステムに対してオンライン状態となるように
構成する(このコマンドの詳細については、IBM社発
行のマニュアルである「MVS/ESA動作:システム
・コマンド(Form Number: GC28-1826)」を参照された
い)。もし、このアベイラビリティ・ポリシー内で、S
TORE(YES)が指定されているならば(ステップ
62)、PATは、CONFIG ̄STOR(E=
1),ONLINEコマンドを内部的に発行して(ステ
ップ63)、主記憶機構をこのシステムに対してオン・
ライン状態となるように構成する。もし、このアベイラ
ビリティ・ポリシー内で、ESTORE(YES)が指
定されているならば(ステップ64)、MVSは、CO
NFIG ̄ESTOR(E=X),ONLINEコマン
ド(BACKUP1が現にESTORE(拡張記憶機
構)を割り当てられていなければ、X=0であり、BA
CKUP1が既に幾らかのESTOREを割り当てられ
ていれば、X=1である)を内部的に発行して(ステッ
プ65)、主記憶機構又は拡張記憶機構を、そのシステ
ムに対してオンライン状態となるように構成する。
【0040】図7には、ワークロード引継ぎの処理が示
されている。故障システムからバックアップ・システム
への引継ぎを、一のアプリケーションに行わせる場合の
最初のステップは、問題が発生していることを、このア
プリケーションに知らせるためのものである。これは次
のようにして行われる。−バックアップ・アプリケーシ
ョンは、プライマリ・アプリケーションをモニタする手
段を有するから(ステップ71)、プライマリ・アプリ
ケーションが作業の実行を停止した場合には、バックア
ップ・アプリケーションは、これを知ることができる。
前述のように、これは、CICS及びXRFという既知
の製品で採用されている。 −バックアップ・アプリケーションが、プライマリ・ア
プリケーションの故障を検出する場合(ステップ7
2)、バックアップ・アプリケーションは、SCPが提
供する照会サービスを呼び出す。 −この照会サービスはシスプレックス・データ・セット
76を読み取り(ステップ73)、当該シスプレックス
内の複数システムのステータスを返す。この場合、プラ
イマリ・システムの可能な状態と、その状態に応じたバ
ックアップ・アプリケーションの反応は次の通りであ
る。 −プライマリ・システムは、ステータス更新欠落状態に
ある。バックアップ・アプリケーションは、プライマリ
・システムが既に故障していて共用資源から分離された
状態にあると決定するまでは、プライマリ・アプリケー
ションのモニタ動作とシスプレックスの照会動作とを続
行する。 −プライマリ・システムは、正常な動作を再開した状態
にある。バックアップ・アプリケーションは、通常のモ
ニタ動作へ復帰する(これはテスト・ステップ74の結
果が「NO」であった場合である)。 −プライマリ・システムは、当該シスプレックスの区画
化が実行された結果として、正常に停止し且つ既に消滅
している。(これはテスト・ステップ74の結果が「Y
ES」であった場合である)。バックアップ・アプリケ
ーションは、従来技術において行われているように、通
常のXRF処理を行って、ワークロードをバックアップ
・システムへ移転させるプロセスを開始する(ステップ
75)。
【0041】図8には、区画間イネーブルメントの制御
の流れが示されている。ステップ81では、SCPが、
共用DASD上の共用データ・セット82を読み取っ
て、固有のシーケンス番号(システム許可IDの一部−
図17の1702を参照)を獲得する。このシーケンス
番号は、「システムID」とも呼ばれるシステム許可識
別子(システム許可ID)の一部として使用される。こ
のシステムIDは、シスプレックス名と、システム番号
と、固有のシーケンス番号とから成る。新しいシステム
・レコードが作成されるたびに、システムID内にある
シーケンス番号が「1」ずつインクリメントされる。ス
テップ83では、SCPからPR/SM機構へSCCB
(84)を転送して、PR/SM機構の区画間イネーブ
ルメント機能を呼び出す。この区画間イネーブルメント
機能は、区画間機能をロックして、ハードウェア・シス
テム領域(HSA)内のステータス・テーブル(図18
の1802)にシステムIDを記憶させた後、ロックを
解除するというものである。(注:SCCBは、かかる
要求を取り扱う論理区画コントローラ(本実施例ではP
R/SM機構)と通信を行うために、SCPが使用する
一般的な機構である。ハードウェア・システム領域(図
18の1802)に記憶されるSCCBの通常のフォー
マットは、図16に示した通りであって、機能コード1
601、応答コード1602、ターゲット論理区画の識
別子1603、及び許可コード1604を含んでい
る)。次のステップ85では、システムIDが、ハード
ウェア・システム領域に正常に書き込まれたか否かをテ
ストする。(このテスト結果は、PR/SM機構が応答
コード(図16の1602)をセットして、EXTER
NAL割り込みを発生することによって表される)。も
し、ハードウェア・システム領域への書き込みが正常に
行われたならば、このシステムに関連するシステム・レ
コード内の共用データ・セット(図17の1702)
へ、そのシステムIDを書き込む(ステップ86)。こ
のシステムIDは、当該シスプレックス内の他のシステ
ムが、これとは別のシステムの論理区画を対象とする区
画間機能を発行しようとするときに(特に、NOSTA
TUS事象又はSYSGONE事象が生ずるときに)、
当該他のシステムによって読み取られ、そしてこのシス
テムIDに対応するシステムを対象とする後の区画間リ
セット又は区画間非活動化のコールの際に使用される。
もし、ステップ85のテスト結果として、このシステム
IDが、ハードウェア・システム領域に正常に書き込ま
れなかったことが判明すれば、そのシステムIDを
「0」にセットした上で、「0」を共用データ・セット
に書き込む(ステップ87)。こうすると、このシステ
ム及び論理区画を対象とする区画間リセット又は区画間
非活動化の実行を阻止することができる。
【0042】図9には、区画間非活動化及び区画間シス
テム・リセットの制御の流れが示されている。SCCB
91は、これらの2つの機能(非活動化機能、システム
・リセット機能)の双方へ入力される。SCCB91に
は、区画間非活動化機能の機能コード又は区画間システ
ム・リセット機能の機能コードと、ターゲット論理区画
用の16バイトの区画間許可ID(システムID−図1
7の1702)と、ターゲット論理区画用の論理区画I
Dが保持されている。ステップ92では、初期有効性チ
ェックを実行するとともに(このチェックは、前述のよ
うに、この論理区画が他の論理区画を対象とする区画間
機能を発行する許可を与えられているか否かというチェ
ックを含んでいる−許可を与えるか否かはLPSECフ
レームにおいて指定する)、タイマをセットする。さら
に、ターゲット論理区画に関する排他的ロックを獲得し
て、この機能が完了するまでは、オペレータが入力する
可能性のある競合コマンドが実行されず、そして他の区
画間機能の実行が試みられないことを保証する。タイマ
の目的は、この機能が妥当な時間内(例えば、30秒以
内)に完了するのを保証することにある。ステップ93
では、ターゲット論理区画用の許可IDの値が、SCC
B91を介してこのサービスへ渡されてきた許可IDの
値(この値は論理区画ステータス・テーブル−図18の
1802−に維持されている)と一致するか否かをテス
トする。もし一致しなければ、応答コードをセットした
上で、割り込みを発生して戻りコードをSCPへ送り返
す(ステップ95)。(この後、ロックを解除する)。
一方、それらのIDの値が一致すれば、SCCB91を
介して転送されてきた機能コードに従って、この論理区
画をリセットするか、又はこれを非活動化する(ステッ
プ94)。もし、リセット機能が指定されていたなら、
サービス・プロセッサは、SCCB内で指定されている
ターゲット論理区画について、システム・コンソールか
ら入力される「SYSRESET」コマンドやOPRC
TLフレームで指定される「03」コマンドを処理する
際に呼び出すサービスと同一のサービスを呼び出す。
(システム・コンソールについては、IBM社発行のマ
ニュアルである「システム・コンソールのオペレータ制
御(Form Number: SC38-0068)」を参照されたい)。か
くて、論理CPがリセットされ、浮動割り込みがリセッ
トされ、論理区画のI/Oサブシステムがリセットされ
る(これについては、IBM社発行のマニュアルである
「ESA/370のオペレーションの原則(Form Numbe
r: SA22-7200)」の、第12章「オペレータによって開
始される機能」と、第4章「外部から開始されるシステ
ム・リセットの定義のための機能」とを参照された
い)。最後に、論理区画をリセットした原因をオペレー
タに知らせるための情報メッセージ(監査証跡メッセー
ジ)を、システム・コンソール上に発行する。以上によ
る総合的な結果は、ターゲット・システムが、これ以後
いかなる作業も実行せず、また共用資源へのその全ての
I/Oが停止されるということである。このシステム・
リセットが完了した場合(これは、非同期的に通知され
る)、他のシステムは、リセットされたシステムが以前
に共用していた資源に対して、変更を加えても良いこと
を知る。続いて、タイマのリセットを行なった後、ステ
ップ95において、SCPへの応答のための「正常終
了」応答コードをSCCB内にセットする。(また、ロ
ックの解除も行う)。
【0043】もし、入力された機能コードが「非活動
化」を指定しているならば、サービス・プロセッサは、
SCCB内で指定されているターゲット論理区画につい
て、システム・コンソールから入力される「DEACT
LP」コマンドを処理するときに呼び出すサービスと同
一のサービスを呼び出す(これについては、IBM社発
行のマニュアルである「PR/SM計画ガイド(Form N
umber: GA22-7123)」を参照されたい)。このサービス
は、同一のCPC上の他の論理区画が使用することがで
きるように、ターゲット論理区画の資源を解放するとと
もに、システム・リセットをも行う。以上が終了したな
らば、非活動化の完了を表示する情報メッセージを、シ
ステム・コンソール上に書き込む。このシステム非活動
化による総合的な結果は、このシステムがこれ以後いか
なる作業も実行せず、また共用資源へのその全てのI/
Oが停止されるということである。このシステム非活動
化が完了した場合(これは、非同期的に通知される)、
他のシステムは、その非活動化されたシステムとの間で
これまで共用してきた資源に対して変更を加えても良
く、また解放された資源を獲得できることを知ることに
なる。続いて、タイマをリセットし、ロックを解除し、
「正常終了」応答コードをセットするとともに、その応
答コードをSCPへ返すようにする(ステップ95)。
【0044】もし、タイマにセットした時間内(例え
ば、30秒以内)に、リセット又は非活動化が完了しな
かったならば、タイム・アウトが生じ、これに応じた適
当な応答コードをSCPへ返すようにする(ステップ9
6)。この場合、コマンドを発行した論理区画には、後
にリセット又は非活動化が完了しても、特に表示を与え
ることはしない。
【0045】図10には、無指定の区画間システム非活
動化の制御の流れが示されている。入力されたSCCB
は、無指定の区画間非活動化機能の機能コードを入力と
して与える(ステップ1001)。無指定の非活動化機
能は、初期有効性チェックを実行するとともに、タイマ
を起動する(ステップ1002)。このタイマの目的
は、この無指定の非活動化機能が完了するか、又は然る
べき応答コードが送出されるかの、いずれかが確実に行
われるようにすることにある。ステップ1003では、
この無指定の非活動化機能をコールした論理区画を除
く、全ての論理区画を順次に処理する。ステップ100
4では、処理中の論理区画が、この機能をコールした論
理区画と、記憶機構(主記憶機構又は拡張記憶機構)を
共用しているか否かをチェックする。(この情報は、各
論理区画ごとの記憶機構割り振りテーブル−図18の1
801−に維持される)。もし、処理中の論理区画が、
記憶機構を共用していなかったならば、次に続く論理区
画を処理する。もし、この論理区画が記憶機構を共用し
ていたならば、その論理区画を非活動化する(ステップ
1005)。この非活動化は、先に図9に関連して説明
した論理区画の非活動化と同様にして行われるものであ
る。全ての論理区画の処理が完了した後、タイマををリ
セットし、応答コードをセットし、割り込みを発生し、
その応答コードを元のSCPへ返す(ステップ100
6)。もし、タイマにセットした時間内(例えば、30
秒以内)に、この無指定の非活動化の全てが完了しなか
ったならば、タイム・アウトが生じ(ステップ100
7)、適当な応答コードを元のSCPへ返すようにす
る。
【0046】図11には、本発明に係るアベイラビリテ
ィ・ポリシー指定法のシンタックスが示されている。こ
のポリシーのキーワード及びオプションは、次のような
意味を有する。
【0047】『NOSTATUS(failsys)』 これは、ステータス更新欠落状態が発生した場合に、故
障システム(failsys)をターゲット・システム
(動作対象のシステム)として、指定した動作を実行す
べきことを表わす。
【0048】『RESETTIME(nnnnn)』 このRESETTIMEオプションは、指定した時間が
経過した後に、故障システムを、「システム・リセット
(SYSRESET)」することを要求するオプション
である。時間の長さ「nnnnn」は、秒単位で指定す
る。例えば、RESETTIME(10)として指定し
た場合は、ステータス更新欠落状態が検出されてから1
0秒の後に、故障システムのシステム・リセットを実行
する。また、RESETTIME(0)として指定した
場合は、オペレーティング・システムがステータス更新
欠落状態を検出すると即座に、システム・リセットを実
行する。SYSRESETを発行することができるの
は、PR/SM機構の制御下においてLPARモードで
ランしている、当該シスプレックス内の他のシステムで
あって、しかも故障システムと同じCPC上に置かれて
いるシステムだけである。注:もし故障システムが、時
間「nnnnn」の経過前に、そのステータス更新を再
開するのであれば、SYSRESETの機能は実行され
ない。
【0049】『DEACTTIME(nnnnn)』 このDEACTTIMEオプションは、故障システムが
存在している論理区画を、指定した時間が経過した後に
「非活動化(DEACTIVATE)」することを要求
するオプションである。時間の長さ「nnnnn」は、
秒単位で指定する。例えば、DEACTTIME(1
0)を指定した場合は、「ステータス更新欠落」状態が
検出されてから10秒後に、故障システムのDEACT
IVATEを実行する。また、DEACTIVATEが
実行される場合は、SYSRESETも実行される。D
EACTIVATEを発行することができるのは、PR
/SM機構の制御下においてLPARモードでランして
いる、当該シスプレックス内の他のシステムであって、
しかも故障システムと同一のCPC上に置かれているシ
ステムだけである。注:もし故障システムが、時間「n
nnnn」の経過前に、そのステータス更新を再開する
のであれば、このDEACTIVATEの機能は実行さ
れない。
【0050】『SYSGONE(failsys)』 これは、故障システム(failsys)が、アベイラ
ビリティ・ポリシー又はオペレータによってリセット
(又は非活動化)された場合に、オペレーティング・シ
ステムがポリシー活動化タスクへ、システム消滅(SY
SGONE)事象を通知するためのものである。
【0051】『SYSTEM(sysname)』 必須パラメータである、このSYSTEMパラメータ
は、故障システムの消滅を知らせるSYSGONE通知
を受け取った場合に、指定された動作を実行すべき当該
シスプレックス内のシステムを特定するものである。P
OLICY(アベイラビリティ・ポリシー)は、全ての
システム上に実現されているから、このSYSTEMパ
ラメータで特定したシステムだけが、SYSGONEの
通知に応答するようにしているのである。もし、このS
YSTEMパラメータで特定してあるsysname
が、現システムのSYSNAME(システム名)と一致
しなければ、このポリシー・ステートメントは、現シス
テムについては何ら影響を及ぼさない。
【0052】『DEACTIVATE(othersy
s/ALL)』 このDEACTIVATEキーワードは、非活動化(D
EACTIVATE)すべきシステムをユーザが指定す
ることを可能にする。このDEACTIVATEは、必
須のキーワードである。DEACTIVATE(oth
ersys)を指定する場合、そのothersysに
は、当該シスプレックス内の他のシステムを指定しなけ
ればならず、さもなければ、いかなる動作も行われな
い。この非活動化の機能が、ターゲット論理区画のオペ
レーティング・システム及びハードウェアに、どのよう
な影響を及ぼすかについての説明は、図9及び同図に関
連する記述を参照されたい。特に、SYSTEMパラメ
ータで指定したシステムと、othersysとは、同
一のCPC上でランしているシステムでなければならな
いことに注意されたい。一方、DEACTIVATE
(ALL)を指定した場合には、SYSTEMパラメー
タで指定してあるシステムは、PR/SM機構に対し、
そのアドレッシング・レンジ内にある他の全ての論理区
画を非活動化するように要求する。これは、無指定の区
画間非活動化と呼ばれる。この機能が、ターゲット論理
区画のオペレーティング・システム及びハードウェアに
対し、どのような影響を及ぼすかについては、図10及
び同図に関連する記述を参照されたい。もし、NOST
ATUS処理の一部として、DEACTIVATEが既
に実行されていたならば、SYSGONE処理のために
実行されたDEACTIVATEは、ターゲット・シス
テムが既に消滅していることを検出して、要求された再
構成動作を依然として試みることになる。
【0053】『STORE(YES/NO)』 他の論理区画の非活動化が正常に終了したのに続いて、
もしYESが指定されたならば、SYSTEMパラメー
タで指定してあるシステムが、主記憶機構をオンライン
状態に構成するよう要求するコマンドを発行する。例え
ば、MVS内では、このコマンドは次のようになる。 CONFIG ̄STOR(E=1),ONLINE このコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された主記憶機構を獲得す
る。注:もし、DEACTIVATEが正常に終了され
ないで、ターゲットLPARが活動状態にないことを表
示したのであれば、記憶機構再構成コマンドが依然とし
て試みられることになる。STORE(NO)はデフォ
ールト値である。
【0054】『ESTORE(YES/NO)』 他の論理区画の非活動化が正常に終了したのに続いて、
もしYESが指定されたならば、SYSTEMパラメー
タで指定してあるシステムが、拡張記憶機構をオンライ
ン状態に構成するよう要求するコマンドを発行する。例
えば、MVS内の一般的なコマンドは、次のようにな
る。 CONFIG ̄ESTOR(E=X),ONLINE このコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された拡張記憶機構を獲得す
る。ESTORE(NO)はデフォールト値である。
【0055】『OTHERRESOURCE(YES/
NO)』 他の論理区画の非活動化が正常に終了したのに続いて、
もしYESが指定されたならば、SYSTEMパラメー
タで指定してあるシステムが、他の資源をオンライン状
態にすることを要求する。この構成を拡張して、システ
ムが動的に再構成し得る任意の資源をも包含させること
も可能である。OTHERRESOURCE(NO)は
デフォールト値である。
【0056】『アベイラビリティ・ポリシーの初期化』 アベイラビリティ・ポリシーは、パラメータ・ライブラ
リ(PARMLIB)内に保持できるようにしてあり、
これは、従来技術に属するMVSの制御値のセットがそ
のようにしてあるのと同様である。また、アベイラビリ
ティ・ポリシーは、オペレータ・コマンドにより、通常
の方法で初期化できるようにしてある。(他の通常の方
法、例えばシステム初期化パラメータ、又はシステム・
サービスを利用することもできる)。アベイラビリティ
・ポリシーを初期化するためのMVS ̄SETAVAI
Lコマンドの使用法のシンタックスは、次の通りであ
る。 SETAVAIL ̄POLICY,ACTIVATE=
memname DEACTIVATE このシンタックスにおいて、memnameは、パラメ
ータ・ライブラリのメンバを識別する。POLICYの
指定は、次のようにして行うことができる。 「ACTIVATE=memname」 このようにポリシーのメンバ名を指定した場合、MVS
は、指定されたメンバ名をパラメータ・ライブラリから
読み取り、これを活動ポリシーとする。もし新しいメン
バ名を処理している間に、シンタックス・エラー又は他
の問題が発生したならば、旧ポリシー(もしそれがあれ
ば)が有効のままに留まる。 「DEACTIVATE」 DEACTIVATEを指定した場合には、オペレーテ
ィング・システムは、全てのアベイラビリティ・ポリシ
ー処理を停止する。
【0057】『アベイラビリティ・ポリシー処理』 アベイラビリティ・ポリシー処理が行われるのは、当該
シスプレックスのモニタ中に、ステータス更新欠落状態
の存在が検出されるか、又はシスプレックス区画化機能
によって、当該シスプレックスから一のシステムが除去
されるときである。アベイラビリティ・ポリシーの処理
は、ポリシー活動化タスク(PAT)によって行われ
る。
【0058】当該シスプレックスのモニタ中に、一のシ
ステムがステータス更新欠落状態にあることが検出され
た場合、PATは、アベイラビリティ・ポリシーのNO
STATUS部分を処理する。アベイラビリティ・ポリ
シーを処理するPATは、ステータス更新欠落状態を検
出するシステム上のPATである。このPATがNOS
TATUSポリシー・ステートメントを処理する方法
は、次の通りである。「RESETTIME(nnnn
n)」−PATは「nnnnn」秒間だけ待機し、その
期間中、ステータス更新欠落状態が持続したならば、こ
のステータス更新欠落状態が発生しているシステムの論
理区画を、区画間システム・リセット機能を使用してシ
ステム・リセットし、そしてシスプレックス区画化機能
に対し、そのシステムがもはや活動状態にはないことを
通知する。「DEACTTIME(nnnnn)−PA
Tは「nnnnn」秒間だけ待機し、その期間中、ステ
ータス更新欠落状態が持続したならば、このステータス
更新欠落状態が発生しているシステムの論理区画を、区
画間非活動化機能を使用して非活動化し、そしてシスプ
レックス区画化機能に対し、そのシステムがもはや活動
状態にはないことを通知する。
【0059】シスプレックス区画化機能が、当該シスプ
レックスから一のシステムを除去した場合、PATは、
アベイラビリティ・ポリシーのSYSGONE部分を処
理する。SYSGONE(failsys)が指定して
いるシステムが、当該シスプレックスから除去された場
合には、SYSTEM(sysname)が指定してい
るシステム上のPATが、そのポリシーを処理する。こ
のPATがSYSGONEポリシー・ステートメントを
処理する方法は、次の通りである。「DEACTIVA
TE(othersys)」−PATは、シスプレック
ス区画化機能によって当該シスプレックスから除去され
たシステムの論理区画を、区画間非活動化機能を使用し
て非活動化する(ただし、その論理区画は、アベイラビ
リティ・ポリシーのNOSTATUS部分を処理したP
ATによって、既に非活動化されている場合もある)。
「DEACTIVATE(ALL)」−PATは、その
アドレッシング・レンジ内にある全ての論理区画を、無
指定の区画間非活動化機能を使用して非活動化する。
「STORE(YES)」−もし中央記憶機構(主記憶
機構)が使用可能であれば、PATは、適当なMVS ̄
CONFIG ̄STOR,ONLINEコマンドを内部
的に発行して、中央記憶機構をオンライン状態に構成す
る。「ESTORE(YES)」−もし拡張記憶機構が
使用可能であれば、PATは、適当なMVS ̄CONF
IG ̄ESTOR(E=X),ONLINEコマンドを
内部的に発行して、拡張記憶機構をオンライン状態に構
成する。「OTHERRESOURCE(YES)」−
PATは、適当なMVS ̄CONFIGコマンドを内部
的に発行して、他のプロセッサ資源をオンライン状態に
構成する。
【0060】以下に示す具体例は、システム故障が発生
した後に、システム資源を再構成するためのアベイラビ
リティ・ポリシーを活動化する場合に、実行が必要とな
る全てのステップを記述したものである。なお、図12
には、一般的なケースが示されている。 1.一の論理区画内で、活動MVSシステムの初期プロ
グラム・ロード(IPL)を行う。この活動MVSシス
テムは、IPLを行う最初のシステムであるから、当該
シスプレックスの動作は、この活動MVSシステムをも
って開始することになる。 2.この活動MVSシステムは、MVSのIPL実行中
に、当該シスプレックスに最終的に参加し且つこの活動
MVSシステムの論理区画に対し破壊的動作を実行する
ことがある、他の任意のMVSシステム(例えば、代替
MVSシステム)に対し、許可を与える。この活動MV
Sシステムは、区画間リセット/非活動化イネーブルメ
ント要求をPR/SM機構へ送出することによって、他
のMVSシステムに対し許可を与える。このように活動
MVSシステムが他のシステムに許可を与えた場合に
は、当該シスプレックス内の他のMVSシステムが、こ
の活動MVSシステムの論理区画を、システム・リセッ
ト又は非活動化することができるようになる。 3.次に、他の論理区画内で、代替MVSシステムのI
PLを行う。活動MVSシステムと代替MVSシステム
とは、同一プロセッサ上の別々の論理区画内で、又は互
いに異なるプロセッサ上の夫々の論理区画内で、それぞ
れの実行を行うことができる。代替MVSシステムの論
理区画へ定義されたプロセッサ資源の割当量は、アベイ
ラビリティ・ポリシーにどのような指定が行われている
かに依存する。もし、アベイラビリティ・ポリシーが、
活動MVSシステムの論理区画を、システム・リセット
すべきであると指定しているのであれば、代替MVSシ
ステムの論理区画には、活動MVSシステムのワークロ
ードをランさせるのに十分な量のプロセッサ資源を割り
当てておかねばならない。一方、アベイラビリティ・ポ
リシーが、活動MVSシステムの論理区画を、非活動化
すべきであると指定しているのであれば、代替MVSシ
ステムの論理区画には、MVSのIPLを行うことがで
き且つVTAM及び必要な代替CICSをランさせるこ
とができる程度の、プロセッサ資源を割り当てておくだ
けで十分である。この場合には、代替MVSシステムの
論理区画は、活動MVSシステムの論理区画に割り当て
られていたプロセッサ資源を、獲得することができる。 4.活動MVSシステム上で、活動CICS領域を起動
する。活動CICS領域を起動した後に、CICSのワ
ークロードの処理が行われる。しかしながら、この場合
には、この活動CICS領域は、XRF機能を持たない
ままランしている。 5.代替MVSシステム上で、代替CICS領域を起動
する。代替CICS領域は、一般的な方法で、XRF機
能を確立する。活動CICS領域がCICSのワークロ
ードを処理しているとき、代替CICS領域は、故障に
備えて待機している。活動CICS領域が、一般的な方
法で、代替CICS領域へCICS ̄XRF監査信号を
送出するのに対し、代替CICS領域は、その監査信号
をモニタして、故障の徴候が現れているか否かをチェッ
クする。 6.活動MVSシステムに関するアベイラビリティ・ポ
リシーのNOSTATUS条件を、代替MVSシステム
上で活動化する。このアベイラビリティ・ポリシーは、
活動MVSシステムが故障した場合に代替MVSシステ
ムが実行すべき回復動作を指定したものである。 7.活動MVSシステムが、明らかではない何らかの原
因で故障する。この結果、活動MVSシステムは、その
ステータス・フィールドの更新を停止する。 8.代替MVSシステムは、活動MVSシステムがその
シスプレックス監査信号を更新していないことを検出し
たから、これに基づいて、活動MVSシステムが故障し
たものと推定する。 9.代替MVSシステムは、活動MVSシステムの故障
を回復するために、アベイラビリティ・ポリシーを処理
する。以下の説明は、このアベイラビリティ・ポリシー
内のステートメントについて、代替MVSシステムが実
行する処理を要約したものである。活動MVSシステム
の論理区画のシステム・リセット−これは、区画間シス
テム・リセット要求をPR/SM機構へ発行して、活動
MVSシステムの論理区画をシステム・リセットし且つ
活動MVSシステムを当該シスプレックスから除去する
ことを要求する。活動MVSシステムの論理区画の非活
動化−これは、区画間非活動化要求をPR/SM機構へ
発行して、活動MVSシステムの論理区画を非活動化し
且つ活動MVSシステムを当該シスプレックスから除去
することを要求する。全ての非活動化−これは、無指定
の区画間非活動化要求をPR/SM機構へ発行して、代
替MVSシステムのために予約されている記憶機構資源
を共用している論理区画を、非活動化することを要求す
る。プロセッサ資源の獲得−これは、要求をPR/SM
機構へ発行して、予約してある使用可能なプロセッサ資
源を、代替MVSシステムの論理区画へ再割り当てする
ことを要求する。活動MVSシステムの論理区画の資源
が、代替MVSシステムの論理区画へ再割り当てされる
のは、アベイラビリティ・ポリシーが活動MVSシステ
ムの論理区画の非活動化を指定していた場合であって、
しかもその非活動化が正常に終了した場合だけである。
一方、他の論理区画の資源が、代替MVSシステムの論
理区画へ再割り当てされるのは、アベイラビリティ・ポ
リシーが全てを非活動化することを指定していた場合で
あって、しかも代替MVSシステムが所有する記憶機構
資源を共用している全ての論理区画が正常に非活動化さ
れた場合だけである。 10.この時点で、活動論理区画を非活動化(又はシス
テム・リセット)する。この結果、共用資源に対する以
後の処理又はアクセスが行えなくなる。 11.活動MVSシステムが故障してから暫くして、代
替CICS領域は、活動CICS領域のCICS ̄XR
F監査信号が消失したという理由で、活動CICS領域
が故障したと推定する。次に、代替CICS領域は、一
般的な方法で、XRFの引継ぎ処理を自動的に開始す
る。代替CICS領域が、当該シスプレックスのステー
タスを照会して、活動MVSシステムが除去されたこと
を検出すると、この引継ぎ処理が、オペレータの介入を
必要とせずに完了する。
【0061】『同一プロセッサ上のシステムを対象とし
たシステム・リセット』 幾つかのアプリケーション(例えば、IMS ̄XRF)
については、バックアップ・システム(BACKUP)
が、プライマリ・システム(PRIMARY)と同量の
記憶機構を必要とすることがある。この場合、PRIM
ARYが故障しても、BACKUPは、ワークロードを
ランさせるのに十分な量の資源を既に所有しているか
ら、論理区画を非活動化したり記憶機構を再構成する必
要はない。この場合、BACKUPにとって必要なこと
は、PRIMARYが、もはや共用資源をアクセスする
ことがないという肯定的確認である。
【0062】非活動化ではなく、システム・リセット
(SYSRESET)だけを使用する他の理由は、シス
テム故障の後にSADMP(スタンド・アローン・ダン
プ)が必要となることもあるという点にある。
【0063】図13には、このシステム・リセットの具
体例が示されている。説明を簡明にするため、この構成
には、システムが2つしか含まれていないものとし、そ
れらを、PRIMARY(1301、1301A)及び
BACKUP1(1302、1302A)と呼ぶことに
する。また、これらの2つのシステムは、同一のPR/
SMマシン内に存在していて、同一のシスプレックス内
に構成されているものとする。以上において、PRIM
ARYに故障が存在すれば(この故障は、導入処理の際
にパラメータ・ライブラリ内に指定された故障検出期間
の経過後に検出される)、PRIMARYのワークロー
ドの引継ぎをBACKUP1に実行させる前に、追加の
20秒間待機する(この20秒間は、アベイラビリティ
・ポリシーAVAIL01内のRESETTIMEキー
ワードに指定されている)。一方、BACKUP1シス
テムに故障が存在すれば(この故障は、導入処理の際に
パラメータ・ライブラリ内に指定された故障検出期間の
経過後に検出される)、PRIMARYのバックログを
防止するため、BACKUP1のリセットをPRIMA
RYに行わせる前に、追加の10秒間待機する(この1
0秒間は、AVAIL01内のRESETTIMEキー
ワードに指定されている時間である)。
【0064】PRIMARYとBACKUP1との双方
のシステムにおいてポリシーを活動化するために、ユー
ザの導入設備は下記のオペレータ・コマンドを発行す
る。SETAVAIL ̄POLICY,ACTIVAT
E=AVAIL01
【0065】アベイラビリティ・ポリシーAVAIL0
1の、パラメータ・ライブラリ内に含まれているメンバ
は次の通りである。 NOSTATUS(PRIMARY) RESETTI
ME(20) NOSTATUS(BACKUP1) RESETTI
ME(10)
【0066】前記の内容を持つアベイラビリティ・ポリ
シーが設定されていると、PRIMARYシステムが待
機状態へ入る場合には、以下の一連の事象が生ずる。 1.PRIMARYが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。 2.故障検出期間(図17の1705)の経過後に、B
ACKUP1システムが、ステータス更新欠落事象の発
生を宣言する。 3.ステータス更新欠落事象の発生がBACKUP1に
おいて検出されたことに応じて、ポリシー活動化タスク
が現ポリシーの処理を開始する。なお、この現ポリシー
には、ステータス更新欠落状態が20秒間解消せずに続
いたならば、システム・リセットを実行すべきことが指
定されている。 4.20秒が経過した後、BACKUP1は、PRIM
ARYのステータスをチェックして、ステータス更新が
再開されていないことを知る。この場合、BACKUP
1上のポリシー活動化タスクが、PRIMARYの区画
間システム・リセットを要求する。 5.このシステム・リセットが正常に終了したのに続い
て、BACKUP1上のMVSが、システム消滅(SY
SGONE)通知を当該シスプレックス内の全てのシス
テムへ向けてトリガして、PRIMARYシステムがも
はや共用資源のいずれをも使用していないことを表示す
る。この時点で、PRIMARYは非活動状態となって
おり(1301A)、BACKUP1は、通常の処理を
実行している(1302A)。ただし、これらの2つの
論理区画は、従前のもの(1301及び1302)と同
様に定義されている。 6.アプリケーションが、一般的な方法で、ワークロー
ドの引継ぎを実行する。
【0067】前記の内容を持つアベイラビリティ・ポリ
シーが設定されていると、BAACKUP1がステータ
ス更新欠落状態へ入る場合にも、同様の事象が生ずる。
この場合には、PRIMARYは、10秒後にBACK
UP1のシステム・リセットを実行する。
【0068】『同一プロセッサ上のシステムを対象とし
た非活動化』 図14には、同一プロセッサ上のシステムを対象とする
非活動化の具体例が示されている。説明を簡明にするた
め、この構成には、システムが2つしか含まれていない
ものとし、それらを、PRIMARY(1401)及び
BACKUP1(1402、1402A)と呼ぶことに
する。また、これら2つのシステムは、同一のPR/S
Mマシン内に存在していて、同一のシスプレックス内に
構成されているものとする。以上において、PRIMA
RYに故障が存在すれば(この故障は指定されている故
障検出期間の経過後に検出される)、PRIMARYの
ワークロードの引継ぎをBACKUP1に実行させる前
に、追加の5秒間待機する(この5秒間は、AVAIL
01内のRESETTIMEキーワードに指定されてい
る)。また、BACKUP1においてポリシーを活動化
するために、導入設備は下記のコマンドを呼び出す。 SETAVAIL ̄POLICY,ACTIVATE=
AVAIL01 この具体例については、PRIMARY内でPOLIC
Y(アベイラビリティ・ポリシー)を指定しておく必要
はない。ユーザは、PRIMARYについても同一のP
OLICYを指定することができるが、かかるPOLI
CYは、PRIMARYが実行すべきいかなる動作も定
義しない。
【0069】アベイラビリティ・ポリシーAVAIL0
1のパラメータ・ライブラリのメンバの内容は、次の通
りである。 NOSTATUS(PRIMARY) DEACTTI
ME(5) SYSGONE(PRIMARY) SYSTEM(B
ACKUP1) DEACTIVATE(PRIMARY) STORE(YES) ESTORE(YES)
【0070】この内容を持つアベイラビリティ・ポリシ
ーが設定されていると、PRIMARYシステムが待機
状態へ入った場合に、以下の一連の事象が生ずる。 1.PRIMARYが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。 2.故障検出期間(導入処理の際にパラメータ・ライブ
ラリ内に指定されている)の経過後に、BACKUP1
システムが、ステータス更新欠落事象の発生を宣言す
る。 3.ステータス更新欠落事象の発生がBACKUP1に
おいて検出されたことに応じて、ポリシー活動化タスク
が現ポリシーの処理を開始する。なお、この現ポリシー
には、ステータス更新欠落状態が5秒間解消せずに続い
たならば、区画間非活動化を実行すべきことが指定され
ている。 4.5秒が経過した後、BACKUP1は、PRIMA
RYのステータスをチェックして、ステータス更新が再
開されていないことを知る。この場合、BACKUP1
上のポリシー活動化タスクが、PRIMARYの区画間
非活動化を要求する。 5.この区画間非活動化が正常に終了したのに続いて、
BACKUP1上のMVSが、システム消滅(SYSG
ONE)通知を当該シスプレックス内の全てのシステム
へ向けてトリガして、PRIMARYシステムがもはや
共用資源のいずれも使用していないことを表示する。こ
のSYSGONE通知は、マルチシステム・アプリケー
ションに対し、機能の引継ぎが可能になったことを知ら
せるための信号の役割を果たす。 6.このSYSGONE通知は、このポリシーにおける
他の動作をトリガする。この場合、BACKUP1上の
ポリシー活動化タスクが、区画間非活動化を要求する。
この区間非活動化を2回目に呼び出すのは、システム消
滅事象が、当該シスプレックス内の他の動作の結果とし
て生ずることもあるからである。 7.もし、以前の任意のステップにおいて非活動化機能
が正常に終了していたならば、このポリシーに従って、
ポリシー活動化タスクが、CONFIG ̄STOR,O
NLINEコマンドと、CONFIG ̄ESTOR,O
NLINEコマンドとを内部的に発行して、全ての記憶
機構をオンライン状態に構成する。これが実行される
と、以前にPRIMARYが使用していた記憶機構を、
BACKUP1が使用できるようになる。
【0071】『2つのマシンのセットアップ』 図15には、2つのマシンのセットアップの具体例が示
されている。この構成は、システムを3つ含んでおり、
それらを、PRIMARY(1501、1501A)、
BACKUP及びTESTと呼ぶことにする。PRIM
ARYが、専用のCPC上に置かれているのに対し、B
ACKUP(1503、1503A)とTEST(15
02)は、同一のCPC上にPR/SM論理区画として
置かれている。PRIMARYとBACKUPとは、同
一のシスプレックス内に所属している。以上において、
PRIMARYに故障が存在すれば(この故障は指定さ
れた故障検出期間の経過後に検出される)、そのワーク
ロードがBACKUPへ移転される。また、導入設備
は、BACKUP上で下記のオペレータ・コマンドを発
行することによって、ポリシーを活動化する。 SETAVAIL ̄POLICY,ACTIVATE=
AVAIL01 この具体例については、PRIMARYシステムとTE
STシステム内では、POLICYの指定を行わない。
【0072】アベイラビリティ・ポリシーAVAIL0
1のパラメータ・ライブラリのメンバの内容は、次の通
りである。 SYSGONE(PRIMARY) SYSTEM(B
ACKUP) DEACTIVATE(ALL) STORE(YES) ESTORE(YES)
【0073】この内容を持つアベイラビリティ・ポリシ
ーが設定されていると、PRIMARYシステムが待機
状態へ入った場合に、以下の一連の事象が生ずる。 1.PRIMARYが待機状態へ入り、自らのステータ
ス・フィールドの更新を止めてしまう。 2.故障検出期間の経過後に、BACKUPシステム
が、ステータス更新欠落事象の発生を宣言する。 3.ステータス更新欠落事象の発生がBACKUPにお
いて検出されたことに応じて、ポリシー活動化タスクが
現ポリシーの処理を開始するが、いかなる動作も不要で
あることを発見する。 4.SCPが、オペレータに対し、PRIMARYの故
障を確認するよう求めるプロンプトを出す。 5.オペレータは、結局、PRIMARYシステムがダ
ウン(DOWN)しているとの応答を返す。 6.BACKUP上のMVSが、システム消滅(SYS
GONE)通知を当該シスプレックス内の全てのシステ
ムへ向けてトリガして、PRIMARYシステムが、も
はや共用資源のいずれも使用していないことを表示す
る。このSYSGONE通知は、マルチシステム・アプ
リケーションに対し、機能の引継ぎが可能になったこと
を知らせるための信号の役割を果たす。 7.このSYSGONE通知は、このポリシーにおける
他の動作をトリガする。この場合、BACKUP上のポ
リシー活動化タスクが、BACKUPシステムの論理区
画のアドレッシング・レンジ内に位置している、PR/
SMマシン内の全ての論理区画を対象とした、無指定の
区画間非活動化を実行する。 8.もし、この非活動化が正常に終了したならば、この
ポリシーに従って、ポリシー活動化タスクが、CONF
IG ̄STOR,ONLINEコマンドと、CONFI
G ̄ESTOR,ONLINEコマンドとを内部的に発
行して、全ての記憶機構をオンライン状態にする。これ
が実行されると、以前にTESTシステムが使用してい
た記憶機構を、BACKUP(1503A)が使用でき
るようになる。
【図面の簡単な説明】
【図1】本発明の主要な機能間の流れを示したブロック
図である。
【図2】本発明の初期化段階のフローチャートである。
【図3】論理区画セキュリティ・フレームを示す概略図
である。
【図4】本発明のモニタ段階のフローチャートである。
【図5】本発明の分離段階のフローチャートである。
【図6】本発明の資源再構成段階のフローチャートであ
る。
【図7】本発明のワークロード引継ぎ段階のフローチャ
ートである。
【図8】区画間イネーブルメント機能のフローチャート
である。
【図9】区画間システム・リセット機能及び区画間非活
動化機能のフローチャートである。
【図10】無指定の区画間非活動化機能のフローチャー
トである。
【図11】アベイラビリティ・ポリシーのシンタックス
を示す図である。
【図12】活動システムから代替システムへの引継ぎを
行う場合の動作を示す図である。
【図13】同一プロセッサ上の一のシステムをリセット
する場合の、「実行前」と「実行後」の構成を示す図で
ある。
【図14】同一プロセッサ上の一のシステムを非活動化
する場合の、「実行前」と「実行後」の構成を示す図で
ある。
【図15】2つのマシンのセットアップを実行する場合
の、「実行前」と「実行後」の構成を示す図である。
【図16】SCCBのフォーマットを示す図である。
【図17】シスプレックス・データ・セットの主要部分
のフォーマットを示す図である。
【図18】本発明に関連する、PR/SM機構の主要な
制御フィールドを示す図である。
【符号の説明】
11 初期化段階 12 モニタ段階 13 分離段階 14 資源再構成段階 15 ワークロード引継ぎ段階 76 シスプレックス・データ・セット 1001 サービス・コール制御ブロック(SCCB) 1601 機能コード 1602 応答コード 1603 ターゲット論理区画識別子 1604 許可コード 1701 シスプレックス・データ・セット 1702 システムID 1704 ステータス・フィールド 1705 故障検出期間 1802 ステータス・テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 デービッド・ブラッドレイ・ピーターセン アメリカ合衆国12590、ニューヨーク州 ワッピンガーズ・フォールズ、ヴァレー・ ロード 25番地 (72)発明者 イアン・ジョフレー・レディング イギリス国ハンプシャー、エスオー21・1 エヌダブリュー、ウィンチェスター、トゥ ワイフォード、ハイ・ストリート、ホー ム・ミード(番地なし) (72)発明者 スティーブン・ジョン・シュマント 東京都渋谷区上原2−22−6 ホーマッ ト・スワン 301 (56)参考文献 特開 昭62−115547(JP,A)

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数の論理区画へ分割された少なくとも
    1つの物理プロセッサを備え、各論理区画が当該論理区
    画に関連する制御プログラムを保持するための記憶資源
    及び当該制御プログラムを実行するためのプロセッサ資
    源を有し、各論理区間が異なるステータスを有すること
    ができるようにした論理区画式データ処理装置におい
    て、下記の各手段を含む区画間制御装置。 (a)前記各論理区画へ接続され、一の論理区画に関す
    る応答動作を開始するための一の制御プロセスを、他の
    1つの論理区間内の制御プログラムが実行することを許
    可するための許可手段。 (b)前記各論理区画の前記記憶資源内に設けられ、1
    組のトリガ事象と当該トリガ事象に関連する応答動作定
    義とを指定するポリシー定義手段であって、当該応答動
    作定義の各々は、前記トリガ事象が生起する際に、関連
    する論理区画内の制御プログラムが遂行すべき前記応答
    動作のうちの少なくとも1つを指定するように構成され
    ているポリシー定義手段。 (c)前記他の1つの論理区画内に設けられ、前記一の
    論理区間におけるトリガ事象を検出するように、当該一
    の論理区画のステータスをモニタするためのモニタ手
    段。 (d)前記各論理区間へ接続され、前記応答動作を開始
    させることにより、前記一の論理区間の前記記憶資源及
    びプロセッサ資源を再構成させるとともに、前記他の1
    つの論理区間内の前記制御プログラムに前記制御プロセ
    スを実行させて、当該再構成済みの記憶資源及びプロセ
    ッサ資源における動作を指示させるためのサービス・プ
    ロセッサ手段。 (e)前記各論理区画内に設けられ、前記モニタ手段が
    前記トリガ事象を検出し且つ前記許可手段が当該トリガ
    事象に関連する前記応答動作定義によって指定された一
    の応答動作を開始するように前記制御プロセスの実行を
    許可しているときに、前記他の1つの論理区間における
    前記制御プロセスから前記サービス・プロセッサ手段
    へ、前記応答動作の開始要求を通信するための通信手
    段。
  2. 【請求項2】 前記サービス・プロセッサ手段が前記許
    可手段を含み、前記ポリシー定義手段が、前記サービス
    ・プロセッサ手段に対し、前記一の論理区間を非活動化
    及びリセットするよう要求するための区画間非活動化手
    段を含むことを特徴とする請求項1記載の区画間制御装
    置。
  3. 【請求項3】 前記ポリシー定義手段が、前記サービス
    ・プロセッサ手段に対し、前記一の論理区間の前記記憶
    資源及びプロセッサ資源を再構成するよう要求するため
    の資源再構成手段を含むことを特徴とする請求項2記載
    の区画間制御装置。
  4. 【請求項4】 一のサービス・プロセッサと、2つ以上
    の論理区画へ分割された少なくとも1つの物理プロセッ
    サとを備え、各論理区画が当該論理区画に関連する制御
    プログラムを保持するための記憶資源及び当該制御プロ
    グラムを実行するためのプロセッサ資源を有し、各論理
    区間が異なるステータスを有することができるようにし
    た論理区画式データ処理装置において、下記の各ステッ
    プを含む区画制御方法。 (a)一の論理区間に関する応答動作を開始するための
    一の制御プロセスを、他の1つの論理空間内の制御プロ
    グラムが実行することを許可するステップ。 (b)前記各論理区画の記憶資源内に、1組のトリガ事
    象と当該トリガ事象に関連する応答動作定義から成る、
    ポリシー定義データをそれぞれロードするステップであ
    って、当該応答動作定義の各々は、前記トリガ事象が生
    起する際に、関連する論理区画内の制御プログラムが遂
    行すべき前記応答動作のうちの少なくとも1つを指定す
    るように構成されているステップ。 (c)前記他の1つの論理区画に、前記一の論理区画に
    おけるトリガ事象を検出するように、当該一の論理区画
    のステータスをモニタさせるステップ。 (d)前記ポリシー定義データを介して前記応答動作を
    開始させることにより、前記サービス・プロセッサに前
    記一の論理区間の前記記憶資源及びプロセッサ資源を再
    構成させるとともに、前記他の1つの論理区間内の前記
    制御プログラムに前記制御プロセスを実行させて当該再
    構成済みの記憶資源及びプロセッサ資源における動作を
    指示させるステップ。 (e)前記他の1つの論理区間が前記トリガ事象を検出
    し且つ当該トリガ事象に関連する前記応答動作定義によ
    って指定された一の応答動作を開始するように前記制御
    プロセスの実行が許可されているときに、前記他の1つ
    の論理区間における前記制御プロセスから前記サービス
    ・プロセッサ手段へ、前記応答動作の開始要求を通信す
    るためのステップ。
  5. 【請求項5】 前記サービス・プロセッサ手段が、区画
    間非活動化動作を指定する一の応答動作定義に応答し
    て、前記一の論理区間を非活動化及びリセットさせるよ
    うにしたことを特徴とする請求項4記載の区画間制御方
    法。
  6. 【請求項6】 前記サービス・プロセッサ手段が、資源
    再構成動作を指定する一の応答動作定義に応答して、前
    記一の論理区間の前記記憶資源及びプロセッサ資源を再
    構成させるようにしたことを特徴とする請求項5記載の
    区画間制御方法。
JP3192231A 1990-08-31 1991-07-31 論理区画式データ処理装置における区画間制御のための装置及び方法 Expired - Lifetime JPH0831047B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US57634490A 1990-08-31 1990-08-31
US576344 1990-08-31

Publications (2)

Publication Number Publication Date
JPH05181823A JPH05181823A (ja) 1993-07-23
JPH0831047B2 true JPH0831047B2 (ja) 1996-03-27

Family

ID=24304049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3192231A Expired - Lifetime JPH0831047B2 (ja) 1990-08-31 1991-07-31 論理区画式データ処理装置における区画間制御のための装置及び方法

Country Status (4)

Country Link
US (1) US5345590A (ja)
EP (1) EP0472861B1 (ja)
JP (1) JPH0831047B2 (ja)
DE (1) DE69113181T2 (ja)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2086691C (en) * 1992-03-30 1997-04-08 David A. Elko Communicating messages between processors and a coupling facility
JPH0635732A (ja) * 1992-07-14 1994-02-10 Hitachi Ltd 記憶装置の領域割り当て方法
CA2100540A1 (en) * 1992-10-19 1994-04-20 Jonel George System and method for performing resource reconfiguration in a computer system
US5758157A (en) * 1992-12-31 1998-05-26 International Business Machines Corporation Method and system for providing service processor capability in a data processing by transmitting service processor requests between processing complexes
EP0610583A1 (en) * 1993-02-08 1994-08-17 International Business Machines Corporation Multizone relocation facility computer memory system
US5634072A (en) * 1993-11-01 1997-05-27 International Business Machines Corporation Method of managing resources in one or more coupling facilities coupled to one or more operating systems in one or more central programming complexes using a policy
US5819061A (en) * 1994-07-25 1998-10-06 International Business Machines Corporation Method and apparatus for dynamic storage reconfiguration in a partitioned environment
US5564040A (en) * 1994-11-08 1996-10-08 International Business Machines Corporation Method and apparatus for providing a server function in a logically partitioned hardware machine
US5978933A (en) * 1996-01-11 1999-11-02 Hewlett-Packard Company Generic fault tolerant platform
US5884084A (en) * 1996-10-31 1999-03-16 Intel Corporation Circuit and method for using early reset to prevent CMOS corruption with advanced power supplies
US6076095A (en) * 1997-03-28 2000-06-13 International Business Machines Corporation Method of one system of a multisystem environment taking over log entries owned by another system
US6108667A (en) * 1997-03-28 2000-08-22 International Business Machines Corporation System of compressing a log stream using a scratch pad of logically deleted entries
US5956735A (en) * 1997-03-28 1999-09-21 International Business Machines Corporation System of compressing the tail of a sparse log stream of a computer system
US5999935A (en) * 1997-03-28 1999-12-07 International Business Machines Corporation Tail compression of a sparse log stream of a multisystem environment
US5920875A (en) * 1997-03-28 1999-07-06 International Business Machines Corporation Tail compression of a sparse log stream of a computer system
US6125393A (en) * 1997-03-28 2000-09-26 International Business Machines Corporation System of compressing the tail of a sparse log stream of a multisystem environment
US5966708A (en) * 1997-03-28 1999-10-12 International Business Machines Tail compression of a log stream using a scratch pad of logically deleted entries
US5960205A (en) * 1997-10-30 1999-09-28 Lucent Technologies Inc. Upgrading the control of switching systems
US6681238B1 (en) 1998-03-24 2004-01-20 International Business Machines Corporation Method and system for providing a hardware machine function in a protected virtual machine
US6253224B1 (en) 1998-03-24 2001-06-26 International Business Machines Corporation Method and system for providing a hardware machine function in a protected virtual machine
US7013305B2 (en) 2001-10-01 2006-03-14 International Business Machines Corporation Managing the state of coupling facility structures, detecting by one or more systems coupled to the coupling facility, the suspended state of the duplexed command, detecting being independent of message exchange
US6467007B1 (en) 1999-05-19 2002-10-15 International Business Machines Corporation Processor reset generated via memory access interrupt
US6691146B1 (en) 1999-05-19 2004-02-10 International Business Machines Corporation Logical partition manager and method
US6681240B1 (en) 1999-05-19 2004-01-20 International Business Machines Corporation Apparatus and method for specifying maximum interactive performance in a logical partition of a computer system independently from the maximum interactive performance in other partitions
US6279046B1 (en) * 1999-05-19 2001-08-21 International Business Machines Corporation Event-driven communications interface for logically-partitioned computer
US6959291B1 (en) 1999-05-19 2005-10-25 International Business Machines Corporation Management of a concurrent use license in a logically-partitioned computer
FR2794876B1 (fr) * 1999-06-10 2001-11-02 Bull Sa Procede de reconfiguration d'un systeme de traitement de l'information sur detection de defaillance d'un composant
US6981155B1 (en) 1999-07-14 2005-12-27 Symantec Corporation System and method for computer security
US7117532B1 (en) 1999-07-14 2006-10-03 Symantec Corporation System and method for generating fictitious content for a computer
WO2001004759A1 (en) 1999-07-14 2001-01-18 Recourse Technologies, Inc. System and method for computer security
US7203962B1 (en) 1999-08-30 2007-04-10 Symantec Corporation System and method for using timestamps to detect attacks
JP2001256066A (ja) * 2000-02-29 2001-09-21 Internatl Business Mach Corp <Ibm> コンピュータシステム、オペレーティングシステムの切り替えシステム、オペレーティングシステムの実装方法、オペレーティングシステムの切り替え方法、記憶媒体及びプログラム伝送装置
US6725317B1 (en) * 2000-04-29 2004-04-20 Hewlett-Packard Development Company, L.P. System and method for managing a computer system having a plurality of partitions
US6654906B1 (en) * 2000-06-08 2003-11-25 International Business Machines Corporation Recovery from instruction fetch errors in hypervisor code
US6658591B1 (en) * 2000-06-08 2003-12-02 International Business Machines Corporation Recovery from data fetch errors in hypervisor code
US6907533B2 (en) 2000-07-14 2005-06-14 Symantec Corporation System and method for computer security using multiple cages
GB0020488D0 (en) * 2000-08-18 2000-10-11 Hewlett Packard Co Trusted status rollback
US6751679B1 (en) * 2000-11-16 2004-06-15 International Business Machines Corporation Means of control bit protection in a logical partition environment
US6665759B2 (en) 2001-03-01 2003-12-16 International Business Machines Corporation Method and apparatus to implement logical partitioning of PCI I/O slots
US6567897B2 (en) 2001-03-01 2003-05-20 International Business Machines Corporation Virtualized NVRAM access methods to provide NVRAM CHRP regions for logical partitions through hypervisor system calls
US6820207B2 (en) 2001-03-01 2004-11-16 International Business Machines Corporation Method for rebooting only a specific logical partition in a data processing system as per a request for reboot
US6792514B2 (en) 2001-06-14 2004-09-14 International Business Machines Corporation Method, system and computer program product to stress and test logical partition isolation features
US7036020B2 (en) 2001-07-25 2006-04-25 Antique Books, Inc Methods and systems for promoting security in a computer system employing attached storage devices
US7925894B2 (en) * 2001-07-25 2011-04-12 Seagate Technology Llc System and method for delivering versatile security, digital rights management, and privacy services
US6971002B2 (en) * 2001-08-09 2005-11-29 International Business Machines Corporation Method, system, and product for booting a partition using one of multiple, different firmware images without rebooting other partitions
US6883116B2 (en) * 2001-09-27 2005-04-19 International Business Machines Corporation Method and apparatus for verifying hardware implementation of a processor architecture in a logically partitioned data processing system
US6968473B2 (en) * 2001-11-15 2005-11-22 International Business Machines Corporation Method and apparatus for generating a virtual clock in a data processing system
US6898731B2 (en) * 2002-01-10 2005-05-24 International Business Machines Corporation System, method, and computer program product for preventing machine crashes due to hard errors in logically partitioned systems
FR2835629B1 (fr) * 2002-02-07 2005-01-28 Bull Sa Procede et systeme de gestion d'un journal personnel d'evenements propre a une activite d'exploitation executee sur un perimetre materiel de ressources informatiques et memoire mise en oeuvre dans ce systeme
FR2835630B1 (fr) * 2002-02-07 2004-03-26 Bull Sa Procede de mise a jour automatique d'un chemin d'acces au disque systeme d'un perimetre materiel de ressources informatiques, systeme pour executer ce procede et memoire utilisee dans ce systeme
JP4119162B2 (ja) * 2002-05-15 2008-07-16 株式会社日立製作所 多重化計算機システム、論理計算機の割当方法および論理計算機の割当プログラム
US20030236852A1 (en) * 2002-06-20 2003-12-25 International Business Machines Corporation Sharing network adapter among multiple logical partitions in a data processing system
JP4054616B2 (ja) * 2002-06-27 2008-02-27 株式会社日立製作所 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
US6729589B2 (en) * 2002-10-07 2004-05-04 Gizmonics, Inc. Kinematic mount
US20040158834A1 (en) * 2003-02-06 2004-08-12 International Business Machines Corporation Apparatus and method for dynamically allocating resources of a dead logical partition
US7290260B2 (en) * 2003-02-20 2007-10-30 International Business Machines Corporation Dynamic processor redistribution between partitions in a computing system
US20040202185A1 (en) * 2003-04-14 2004-10-14 International Business Machines Corporation Multiple virtual local area network support for shared network adapters
US7496915B2 (en) * 2003-04-24 2009-02-24 International Business Machines Corporation Dynamic switching of multithreaded processor between single threaded and simultaneous multithreaded modes
US8892878B2 (en) * 2003-05-09 2014-11-18 Oracle America, Inc. Fine-grained privileges in operating system partitions
US7461080B1 (en) 2003-05-09 2008-12-02 Sun Microsystems, Inc. System logging within operating system partitions using log device nodes that are access points to a log driver
US20040226017A1 (en) * 2003-05-09 2004-11-11 Leonard Ozgur C. Mechanism for associating resource pools with operating system partitions
US7178015B2 (en) * 2004-01-12 2007-02-13 Hewlett-Packard Development Company, L.P. Security measures in a partitionable computing system
US20050154910A1 (en) * 2004-01-12 2005-07-14 Shaw Mark E. Security measures in a partitionable computing system
US7657889B2 (en) * 2004-04-06 2010-02-02 International Business Machines Corporation Method, system, and storage medium for searching multiple queues for prioritized work elements
US7392524B2 (en) * 2004-04-06 2008-06-24 International Business Machines Corporation Method, system, and storage medium for managing computer processing functions
US7370240B2 (en) * 2004-04-29 2008-05-06 International Business Machines Corporation Method and apparatus for preserving trace data in a logical partitioned data processing system
US7257811B2 (en) * 2004-05-11 2007-08-14 International Business Machines Corporation System, method and program to migrate a virtual machine
US7496729B2 (en) * 2004-05-13 2009-02-24 International Business Machines Corporation Method and apparatus to eliminate interpartition covert storage channel and partition analysis
US7343521B2 (en) * 2004-05-28 2008-03-11 International Business Machines Corporation Method and apparatus to preserve trace data
US7343515B1 (en) * 2004-09-30 2008-03-11 Unisys Corporation System and method for performing error recovery in a data processing system having multiple processing partitions
US8181182B1 (en) 2004-11-16 2012-05-15 Oracle America, Inc. Resource allocation brokering in nested containers
DE102005053275B4 (de) 2004-11-25 2021-11-11 Fujitsu Technology Solutions Gmbh Hochverfügbares Computerverbundsystem
US20060123204A1 (en) * 2004-12-02 2006-06-08 International Business Machines Corporation Method and system for shared input/output adapter in logically partitioned data processing system
US20060123111A1 (en) * 2004-12-02 2006-06-08 Frank Dea Method, system and computer program product for transitioning network traffic between logical partitions in one or more data processing systems
US7937616B2 (en) 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
GB0515395D0 (en) * 2005-07-27 2005-08-31 Ibm A method or apparatus for determining the memory usage of a program
US7478272B2 (en) * 2005-09-30 2009-01-13 International Business Machines Corporation Replacing a failing physical processor
US20070088931A1 (en) * 2005-10-17 2007-04-19 Nobuyuki Osaki Method and apparatus to authorize cross-partition commands
US7845008B2 (en) * 2005-12-07 2010-11-30 Lenovo (Singapore) Pte. Ltd. Virus scanner for journaling file system
US7904747B2 (en) * 2006-01-17 2011-03-08 International Business Machines Corporation Restoring data to a distributed storage node
US20070214233A1 (en) * 2006-03-07 2007-09-13 Daryl Cromer System and method for implementing a hypervisor for server emulation
US7814307B2 (en) 2006-03-16 2010-10-12 Microsoft Corporation Fast booting a computing device to a specialized experience
US7539890B2 (en) * 2006-04-25 2009-05-26 Seagate Technology Llc Hybrid computer security clock
US8429724B2 (en) 2006-04-25 2013-04-23 Seagate Technology Llc Versatile access control system
US8028166B2 (en) * 2006-04-25 2011-09-27 Seagate Technology Llc Versatile secure and non-secure messaging
US7865895B2 (en) * 2006-05-18 2011-01-04 International Business Machines Corporation Heuristic based affinity dispatching for shared processor partition dispatching
US7870551B2 (en) * 2006-05-18 2011-01-11 International Business Machines Corporation Optimization of thread wake up for shared processor partitions
US7653835B2 (en) * 2006-06-27 2010-01-26 Lenovo (Singapore) Pte. Ltd. Apparatus and methods for improved computer system error reporting and management
US7987464B2 (en) * 2006-07-25 2011-07-26 International Business Machines Corporation Logical partitioning and virtualization in a heterogeneous architecture
US7761738B2 (en) * 2006-09-07 2010-07-20 International Business Machines Corporation Establishing communications across virtual enclosure boundaries
US7877358B2 (en) * 2006-11-21 2011-01-25 Microsoft Corporation Replacing system hardware
US7934121B2 (en) * 2006-11-21 2011-04-26 Microsoft Corporation Transparent replacement of a system processor
US8473460B2 (en) * 2006-11-21 2013-06-25 Microsoft Corporation Driver model for replacing core system hardware
US8150870B1 (en) * 2006-12-22 2012-04-03 Amazon Technologies, Inc. Scalable partitioning in a multilayered data service framework
US8086906B2 (en) 2007-02-15 2011-12-27 Microsoft Corporation Correlating hardware devices between local operating system and global management entity
US8352960B2 (en) * 2007-08-13 2013-01-08 International Business Machines Corporation Limiting receipt of unsolicited events by a logical partition in a data storage system
US8055733B2 (en) * 2007-10-17 2011-11-08 International Business Machines Corporation Method, apparatus, and computer program product for implementing importation and converging system definitions during planning phase for logical partition (LPAR) systems
JP4548514B2 (ja) * 2008-05-23 2010-09-22 株式会社日立製作所 仮想計算機システムの制御方法
US8195704B2 (en) * 2009-01-06 2012-06-05 International Business Machines Corporation Validation and correction in a distributed namespace
JP5515766B2 (ja) * 2010-01-20 2014-06-11 富士通株式会社 情報処理装置、情報処理装置のハードウェア設定方法及びそのプログラム
US8862832B1 (en) * 2010-03-29 2014-10-14 Emc Corporation Techniques for global memory management and request processing
US9063868B2 (en) 2010-05-24 2015-06-23 Panasonic Intellectual Property Corporation Of America Virtual computer system, area management method, and program
US8505032B2 (en) * 2010-06-23 2013-08-06 International Business Machines Corporation Operating system notification of actions to be taken responsive to adapter events
US8677374B2 (en) 2011-09-14 2014-03-18 International Business Machines Corporation Resource management in a virtualized environment
US9244826B2 (en) 2013-03-15 2016-01-26 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
US9043575B2 (en) * 2013-03-15 2015-05-26 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
US9189381B2 (en) * 2013-03-15 2015-11-17 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
JP6175958B2 (ja) * 2013-07-26 2017-08-09 富士通株式会社 メモリダンプ方法及びプログラム、並びに、情報処理装置
US9959161B2 (en) * 2015-10-02 2018-05-01 International Business Machines Corporation Automated ticketing analytics

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU551032B2 (en) * 1981-03-31 1986-04-17 British Telecommunications Public Limited Company Safety arrangement in computer control system
DE3276598D1 (en) * 1982-12-07 1987-07-23 Ibm Deutschland Fail-safe data processing equipment
US4564903A (en) * 1983-10-05 1986-01-14 International Business Machines Corporation Partitioned multiprocessor programming system
US4823256A (en) * 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
JP2580113B2 (ja) * 1985-11-15 1997-02-12 富士通株式会社 仮想計算機システム
US4937760A (en) * 1988-09-19 1990-06-26 International Business Machines Corporation Method for sharing common values implicitly among communicating generative objects

Also Published As

Publication number Publication date
DE69113181D1 (de) 1995-10-26
EP0472861A2 (en) 1992-03-04
EP0472861A3 (en) 1993-01-27
EP0472861B1 (en) 1995-09-20
DE69113181T2 (de) 1996-05-02
US5345590A (en) 1994-09-06
JPH05181823A (ja) 1993-07-23

Similar Documents

Publication Publication Date Title
JPH0831047B2 (ja) 論理区画式データ処理装置における区画間制御のための装置及び方法
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
KR100612715B1 (ko) 입/출력 패브릭 내의 하드웨어 에러로부터의 자율 복구
KR920003497B1 (ko) 억세스 손실 처리용 시스템 및 그 보호방법
US5664088A (en) Method for deadlock recovery using consistent global checkpoints
US7870426B2 (en) Apparatus, system, and method for transactional peer recovery in a data sharing clustering computer system
JPH01269151A (ja) 多重プロセツサシステム試験方法
JP2010086181A (ja) 仮想計算機システム及びその管理方法、プログラム並びに記録媒体
WO2020001354A1 (zh) 主备容器系统切换
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
US20020073409A1 (en) Telecommunications platform with processor cluster and method of operation thereof
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
US20080294839A1 (en) System and method for dumping memory in computer systems
JP2001022709A (ja) クラスタシステム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
US7281153B2 (en) Apparatus, system, and method for transactional peer recovery in a data sharing clustering computer system
JPH09171475A (ja) 複合コンピュータシステム
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP2010146436A (ja) 監視システム、及びその制御方法、プログラム
JP2937857B2 (ja) 共通記憶装置のロックフラグ解除方式および方法
JP3103877B2 (ja) 多重構成システムによるプログラム実行方式
CN113206760B (zh) 用于vrf资源分配的接口配置更新方法、装置与电子设备
JPH0430245A (ja) マルチプロセッサ制御方式
JP2000099360A (ja) 2重系システム
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JP2730209B2 (ja) 入出力制御方式