JPH05181823A - 区画区分式プロセス環境における区画間制御のための方法及び装置 - Google Patents

区画区分式プロセス環境における区画間制御のための方法及び装置

Info

Publication number
JPH05181823A
JPH05181823A JP3192231A JP19223191A JPH05181823A JP H05181823 A JPH05181823 A JP H05181823A JP 3192231 A JP3192231 A JP 3192231A JP 19223191 A JP19223191 A JP 19223191A JP H05181823 A JPH05181823 A JP H05181823A
Authority
JP
Japan
Prior art keywords
partition
logical
inter
logical partition
logical partitions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3192231A
Other languages
English (en)
Other versions
JPH0831047B2 (ja
Inventor
Donald F Ault
ドナルド・フレッド・オウルト
David B Petersen
デービッド・ブラッドレイ・ピーターセン
Ian G Redding
イアン・ジョフレー・レディング
Jiyon Shiyumanto Suteiibun
スティーブン・ジョン・シュマント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05181823A publication Critical patent/JPH05181823A/ja
Publication of JPH0831047B2 publication Critical patent/JPH0831047B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 論理区画区分式データ処理システムにおいて
区画間のバックアップ機能を全自動化してオペレータの
介入を不要にする。 【構成】 論理区画ごとに各々システムを確立し11、
各々の論理区画のシステムの動作を別の論理区画のシス
テムに監視させる12。各論理区画のシステムには、他
の論理区画のシステムの故障を検出した際に取るべき動
作を規定したアベイラビリティ・ポリシーを備えてお
く。あるシステムが故障したならば、そのシステムの故
障の際の応答動作を許可されているシステムが、プロセ
ッサ・リソース/システム・マネジャ(PR/SM)機
構等のハイパーバイザと通信して、そのハイパーバイザ
に、故障したシステムの論理区画に対する、システム・
リセット、非活動化等の処理を行なわせる13。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、論理区画区分式データ
処理システムの分野に関するものである。より詳しく
は、本発明は、ある1つの論理区画において活動状態に
あるプロセスが別の論理区画の中のプロセスに対して影
響を及ぼす活動を行わねばならない場合の、区画間対話
のメカニズムに関するものである。
【0002】
【従来の技術】
『論理区画』論理区画区分の機能を利用すると、1台の
大型コンピュータ・システムを、マイクロコードの制御
下に置かれた複数の区画へ分割することができる(例え
ば、IBM社のPR/SM機構を利用して、IBM30
90プロセッサを複数の区画に分割することができ
る)。論理区画(logical partition:LP)とは、シス
テム制御プログラム(system control program: SC
P)を実行するのに充分な量のハードウェア資源(プロ
セッサ、メモリ、チャネル、等々)のセットのことをい
う。更なる背景技術は、IBM社の「ES/3090プ
ロセッサ・コンプレックス:プロセッサ・リソース/シ
ステム・マネジャ(GA22−7123)」の中に記載
されている。
【0003】論理区画区分式マシンでは、その中の各々
のSCPを互いに分離してあり、それらSCPの実行
は、あたかも、各SCPがそのSCPの専用の物理セン
トラル・プロセッサ・コンプレックス(CPC)の中に
置かれているかのようにして行なわれる。また、区画区
分の機能を利用することによって、非常に大きな融通性
が得られる。例えば、一日のうちの何回かの作業交替の
たびに行なわれる導入処理や、或いは、それより長い期
間に亙る、新たなソフトウェア、ないしはソフトウェア
の新たなバージョンに関する、試験ないし移行の際に行
なわれる導入処理において、その導入処理の際に異なっ
た論理区画を活動化することができる。更には、論理区
画区分の機能を利用することによって、ユーザがマシン
の物理資源を最大限に利用することが可能となる。
【0004】しかしながら、同じ1台の物理マシンの上
に複数のSCPが置かれているにもかかわらず、それら
SCPには、直接その他のSCPとの間で通信をした
り、直接その他のSCPを制御したりするための手段は
備えられていない。そして、サービス・プロセッサに接
続された1台のシステム・コンソールを介して、オペレ
ータが、論理区画の制御を行なうようにしている。ま
た、論理区画区分式マシンでは、複数のSCPを実際に
は同じ1つのCPCの上に置くようにしてあり、それら
複数のSCPが、単一のサービス・プロセッサを共用す
るようにしてある。更に、ハードウェアによる論理区画
区分の機能を装備したマシンには、再構成サポート機能
も併せて装備してあり、この再構成サポート機能によっ
て、SCPがチャネルや記憶機構等の資源を追加するこ
とができるようにしてある。ただしこの場合に、ある資
源を論理区画の構成に追加することができるのは、その
資源が「解放されている」場合に限られ、ここで「解放
されている」とは、その資源がその他の区画に使用され
ていない状態にあることをいう。
【0005】論理区画非活動化とは、オペレータによっ
て開始される、論理区画を閉鎖するための機能である。
ある論理区画を非活動化したならば、その論理区画は、
それまでその論理区画に割り振られていたプロセッサや
記憶機構を全て解放すると共に、その論理区画として構
成されていたチャネル経路をリセットする。(これにつ
いての更なる詳細は、IBM社の「ES/3090プロ
セッサ・コンプレックス:プロセッサ・リソース/シス
テム・マネジャ(GA22−7123)」を参照された
い)。
【0006】プロセッサ・リソース/システム・マネジ
ャ(PR/SM)機構の主要機能のうちの1つに、記憶
機構並びに物理CPCの処理能力を区画区分することの
できる能力がある。これは、論理区画の各々に主記憶機
構ないし拡張記憶機構の一部分を付与することのできる
能力である。
【0007】このPR/SM機構の、記憶機構再構成機
能を用いると、複数の区画の間で記憶機構の動的な再構
成を行なうことができる。即ち、ある区画に割り振られ
ている記憶機構の割当分のうちの一部を、その区画から
構成解除し(即ち除去し)、そしてその部分を、別の区
画を活動化する際に使用することができる。また、別の
方法として、ある区画を非活動化して、その区画に割り
振られていた記憶機構の割当分の全てを、別の区画のも
のとして構成することも可能である。
【0008】SCPがサービス・プロセッサに対して記
憶機構の再構成を実行するよう要求する際には、サービ
ス・コールによってその要求を発するようにしている。
【0009】夫々の区画の記憶機構の構成を規定するに
は、論理区画規定フレームを利用するようにしている。
また、記憶機構再構成機能を利用するためには、1つの
論理区画に対する記憶機構の割当分を規定する際に、そ
れを2つの割当量に関して規定しておく必要があり、そ
の1つは初期記憶量、もう1つは予約記憶量である。更
に、物理構成の中における開始アドレスも定めておかね
ばならない。即ち、ある区画(第1区画とする)に、そ
れとは別の区画(第2区画とする)の割当分として規定
されていた記憶機構を追加できるのは、その第2区画の
記憶機構が、この第1区画の記憶機構の予約記憶部分と
同一の物理アドレスの中から始まるように規定されてい
た場合に限られるのである。(これに関する更なる詳細
は、IBM社の「ES/3090プロセッサ・コンプレ
ックス:プロセッサ・リソース/システム・マネジャ
(GA22−7123)」、並びに「プロセッサ・リソ
ース/システム・マネジャの動的記憶機構再構成のため
のMVSガイド(GC28−1365)」を参照された
い)。
【0010】各々のSCPは、「サービス・コール論理
プロセッサ(Service Call LogicalProcessor: SCL
P)」との間で通信を行なう際に使用する、サービス・
プロセッサ・インターフェースを備えている。SCP
は、それ自身の記憶機構の中に制御情報をセットアップ
した上で、サービス・コール命令を実行する。このサー
ビス・コール命令は、その制御情報の中に指定した機能
を、サービス・コール論理プロセッサ(以下、サービス
・プロセッサ)に実行させるための命令である。また、
サービス・プロセッサ・インターフェースの、その全体
的な目的は、サービス・プロセッサとの間で通信を行な
い、サービス・プロセッサによって提供されるサービス
を起動することにある。個々の具体的な機能の種類に応
じて、実際の実行が行なわれるのは、CPCの中であっ
たり、サービス・プロセッサの中であったり、或いは、
それら両方の中であったりする。
【0011】サービス・コール命令には、「SCLPコ
マンド・ワード」と呼ばれる32ビットの値と、サービ
ス・コール制御ブロック(Service Call Control Bloc
k: SCCB)の実アドレスとが含まれていなければな
らない。このSCCBには、SCLPコマンドに関連し
た制御情報を入れてある。サービス・コール命令は、そ
のSCLPコマンドがサービス・コール論理プロセッサ
(SCLP)に受入れられたときをもって、その実行が
完了する。そして実質的な機能は、非同期的に実行され
る。SCLPコマンドが実行を完了したことは、「’2
401’X」という外部割込みコード(サービス信号)
を持った外部割込みによって通知されるようにしてあ
る。
【0012】『マルチシステムにおけるアプリケーショ
ン』従来より公知となっている多くのアプリケーション
(例えばCICS、IMS等)では、マルチシステム環
境の中の1つのSCP(例えばMVS等)の上で各々が
実行されるアプリケーションには、2とおりの立場があ
り、その1つは「活動」(ないしは「プライマリ」)、
もう1つは「代替」(ないしは「バックアップ」)の立
場である。あるプライマリ・アプリケーションが、その
サービスを実行不能な状態に陥ったときには、そのプラ
イマリ・アプリケーションの役割をバックアップ・アプ
リケーションが引継ぐようにしている。ただし、アプリ
ケーションの故障ばかりでなく、SCPの故障や、遠隔
通信アクセス法の処理プログラム(例えばVTAM等)
の故障に対しても、機能防護できるようにすることが望
まれる場合には、マルチシステム式の構成が必要とな
る。これらの防護を可能とする拡張回復機能(Extended
Recovery Facility: XRF)は、故障が発生した際に
そのアプリケーションのエンド・ユーザが直面すること
になるサービス中断時間を短縮するのに大いに役立つも
のである。これについての更なる詳細は、IBM社の
「CICS/ESA ̄XRFガイドV3.1(SC33
−0661)」を参照されたい。
【0013】この種のバックアップ能力を備えるために
は、導入処理の際に、各々が完全に構成された、2組の
システムを構成しておけなければならない。それらシス
テムの一方をプライマリとして機能させ、他方をバック
アップとして機能させるのである。更には、プライマリ
の故障を確認するための処理には、これまで、オペレー
タの頻繁な介入や、追加のハードウェアないしソフトウ
ェアが必要とされていた。例えば、CICS ̄XRF
は、通常、CICSないしVTAMの故障からは自動的
に回復することができるが、MVSの故障からの回復処
理は、本発明以前にはオペレータの介入なしには、その
全てを行なうことができなかった。即ち、MVSが故障
した場合には、オペレータが(或いは、オペレーション
・オートメーション・ツールが)、代替CICSから送
出されたメッセージを見て、MVSのシステム・リセッ
トをし、活動CICSがどのあたりを走っていたのかを
推測し、そして更に、その代替CICSのメッセージに
応答して、リセットが正常に完了したことの確認を与え
るようにする必要があった。
【0014】必要な機能が達成されるようにするための
方法として2とおりの方法があり、第1はオペレータが
介入するというもの、そして第2は追加のハードウェア
ないしソフトウェア・パッケージを使用するというもの
である。
【0015】『オペレータの介入による解決法』以下に
示す想定状況は、論理区画を利用して高いアベイラビリ
ティを達成するためには、導入処理をどのように行なっ
ておけば良いかを、説明するためのものである。 1.活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能なように、論理区画を
規定する。 2.第1システムには、活動アプリケーション(例えば
CICS等)を走らせる。 3.第2システムには、代替アプリケーションを走らせ
る。 4.第1システムが故障する。 5.所定時間(この時間はユーザが制御することができ
る)の経過後に、第2システムがオペレータに対して、
第1システムのステータスに関するプロンプトを出す。 6.これに応えてオペレータは、手操作で第1システム
をリセットする。 7.次にオペレータは、手操作で第1システムを非活動
化する(上のリセットを行なっていなかった場合には、
この非活動化によって第1システムのリセットも併せて
行なわれる)。 8.次にオペレータは、第1システムから記憶機構を獲
得するための再構成コマンドを、手操作で第2システム
へ送出し、そして、そのオペレーションが完了するのを
待つ。 9.次にオペレータは、上のステップ5において出され
たプロンプトに対して応答する。 10.この時点で、ワークロードを第2システムへ切替
えるための処理を、アプリケーションが開始する。
【0016】以上の想定状況において、ステップ5、
6、7、8、及び9では、オペレータの手操作が必要と
されている。この手操作による介入があるために、遅延
時間が長くなっている上に誤操作の可能性も生じてお
り、それらによって、エンド・ユーザにとっての、アプ
リケーションのアベイラビリティが、低いものとなって
いる。
【0017】『追加のハードウェアないしソフトウェア
による解決法』次に示す想定状況は、NETVIEW並
びにISCFという製品を利用し且つ追加のハードウェ
アを購入して接続するという方法によって、高いアベイ
ラビリティを達成するためには、導入処理をどのように
行なえば良いのかを説明するためのものである。(これ
に関し、IBM社の「ISCFの計画及び導入ガイド」
(SC30−3472)を参照されたい)。以下の想定
状況は、それがどのようにして機能するかを示したもの
である。 1.活動システムの論理区画から代替システムの論理区
画への、記憶機構の再構成が可能なように、論理区画を
規定する。 2.導入処理に関しては、NETVIEW並びにISC
Fという製品を購入してシステムに導入する。ユーザは
更に、PS/2を購入すると共に、2つのシステムにお
ける夫々のシステム・コンソールとオペレータ・コンソ
ールとにISCFを接続するためのケーブルを購入す
る。 3.更にユーザは、NETVIEW並びにISCFの制
御情報を、必要な動作を実行させることができるように
設定する必要がある。 4.第1システムには、活動アプリケーション(例えば
CICS等)を走らせる。 5.第2システムには、代替アプリケーションを走らせ
る。 6.第1システムが故障する。 7.所定時間(この時間はユーザが制御することができ
る)の経過後に、第2システムがオペレータに対して、
第1システムのステータスに関するプロンプトを出す。 8.NETVIEWがそのメッセージを捕捉して、ユー
ザ側のオートメーション・ルーチンを起動する。 9.起動されたこのオートメーション・ルーチンは、I
SCFの諸機能のうちの、第1システムの論理区画を非
活動化する機能を起動する。 10.ISCFは、VTAMを介して、ISCFのPS
/2への通信を行なう。 11.ISCFのPS/2は、システム・コンソールへ
の通信を行なって、非活動化機能の実行を要求する。 12.続いてISCFのPS/2は、システム・コンソ
ールをモニタして、要求したその非活動化機能の実行完
了を確認する。それが実行完了したならば、ISCFの
PS/2は、第2システム上においてISCFへ応答を
返すための通信を行ない、その通信を受けたISCF
は、NETVIEWのオートメーション・ルーチンへ制
御を返して、その機能が実行完了したことを知らせる。 13.この時点で、オートメーション・ルーチンは、資
源を再構成するためのMVS再構成コマンドを起動する
必要がある。 14.次に、オートメーション・ルーチンは、上のステ
ップ7で出されたプロンプトに対して応答する。 15.この時点で、ワークロードを第2システムへ切替
えるための処理を、アプリケーションが開始する。
【0018】この方式は、人間による操作が必要とされ
ている場合に生じがちな、長時間に亙る予測不可能な遅
延を防止するためには大いに役立つものであるが、ただ
し、本発明と比較した場合には著しく劣った方式といわ
ざるを得ない。なぜならば、この方式では、MVSが故
障した場合に、CICS ̄XRFの引継ぎ処理を行なお
うとしたときに、適正な動作が適正な順序で行なわれる
ことが保証されないからである。この状況における誤動
作は、極めて重大なものであり、その理由は、この状況
において誤動作が発生したならば、そのためにユーザの
データを損傷させてしまうおそれがあり、しかも通常、
そのデータが損傷したことが判明するまでの間に、その
損傷したデータによって、その他の大量のデータが誤っ
た更新をされてしまうおそれがあるからである。
【0019】以上のISCF/NETVIEW方式が、
CICS ̄XRFに用いるのに適したものであることを
保証できない具体的な理由は、以下のとおりである。 1.この方式のプロセスは、PS/2、ISCFの接続
機器(追加の制御装置)、NETVIEW、ISCF、
及びVTAMという夫々の製品の信頼性、並びに、導入
の際に書き込むオートメーション・ルーチンの信頼性に
左右される。これらのいずれによっても、夫々に故障発
生率が増大することに加えて、更に、導入の費用とし
て、追加のハードウェア製品並びにソフトウェア製品の
費用もかかることになる。 2.このプロセスは、そのとき存在しているメッセージ
を横取りして、そして、それらメッセージに対する応答
等の、必要な動作を自動的に行なうものである。従っ
て、人間であるオペレータが、メッセージに対して早ま
って応答を返してしまうという誤操作の可能性を、払拭
することができない。 3.このISCF/NETVIEW方式では、システム
・リセットが必要となった原因を成すSCPの状況を示
す固有の識別子を、受け取ることも、利用することもで
きない。この欠点によって例えば次の問題が生じるおそ
れがある。即ち、データを損傷してしまうという問題、
健全なSCPがその必要もないのにユーザから引き離さ
れてしまうという問題、或いは、MVSの故障の原因を
診断することを目的としてそれまで実行していたスタン
ド・アローン・ダンプが失われてしまうという問題等が
生じる可能性がある。 4.導入処理のたび毎に、該当するメッセージを捉えた
際にいかなる動作を実行すべきかを指定したなんらか
の、しかも比較的複雑なプログラムを書き込まねばなら
ない。このプログラムを開発し、維持するにはかなりの
費用がかかる。しかもこのプログラムは、誤りを含んだ
ものとなり易いにもかかわらず、それをテストするのは
困難であり、なぜならば、起こり得る故障の状況には極
めて多くの種類があるからである。また、この種のプロ
グラムに誤りがあった場合には、結果的にデータを損傷
してしまうことが多いが、そのデータ損傷の事実はかな
り長期に亙って表面に出ないため、回復が非常に困難で
ある。また、たとえそのデータ損傷の事実が速やかに判
明したとしても、その損傷したデータの正しいバージョ
ンを、バックアップ・コピーから出発して、前向き回復
して行くことによって元の状態に復元するまでの間は、
エンド・ユーザに対するサービスは、機能低下したまま
の状態が続くことになる。
【0020】
【発明の概要】本発明は、第1の論理区画の中のプロセ
スを用いて、第2の論理区画の中の全てのプロセスを、
効率的にしかも自動的に監視し且つ中止させることがで
きるようにし、それによって、第2の論理区画内のワー
クロードを、第1の論理区画へ移動させることができる
ようにした、方法及び装置を提供するものである。
【0021】動作について説明すると、先ず、論理区画
区分式システムの中の選択した区画を、区画間機能を行
使できるようにイネーブルする。次いで、それら選択し
た区画においてオペレーティング・システムを始動させ
る。始動した各々のオペレーティング・システムは、み
ずからを区画間機能の処理対象となり得るようにイネー
ブルする。更に、それら各々のオペレーティング・シス
テムは、他の区画内のオペレーティング・システムが故
障した際の動作を指定したポリシーを活動化する。それ
ら他のシステムのうちの1つが故障したならば、その故
障システム以外のその他のシステムが、みずからのポリ
シーを調べて、自動的に適当な動作を実行する。この自
動的な動作には、非活動化、リセット、それに、故障し
たターゲット・システムの論理区画から資源を移動させ
る資源再構成等の動作が含まれている。
【0022】従って本発明の目的は、ある区画内のプロ
セスに、別の区画内の故障システムの下でランしていた
別のプロセスの機能を引継がせるプロセスを自動化する
ことにある。本発明の更なる目的は、区画間制御のため
の信頼性の高いメカニズムを提供することにある。本発
明の更なる目的は、異なった区画内をランしているプロ
セスに対して適用するアベイラビリティ・ポリシーを、
高い信頼性を持って規定し運用することのできるメカニ
ズムを提供することにある。本発明の更なる目的は、あ
る区画内でランしているプロセスを、別の区画内でラン
しているプロセスで自動的にバックアップするようにす
る際の、追加のハードウェアないしソフトウェアの必要
を低減し、また、信頼性の劣るハードウェアないしソフ
トウェアの必要を低減することにある。
【0023】
【実施例】本発明は、マルチシステム環境が確立されて
いることを必要とする。これに関して以下の説明では、
シスプレックスという用語(「システム」と「コンプレ
ックス」との合成語)を使用するが、この用語は、マル
チシステム環境内の複数のシステムから成る、システム
のセット(集合)を言い表わしたものである。どのよう
な場合に複数のシステムをシスプレックスと呼べるかと
いう、その限界を更に明瞭に示すならば、シスプレック
スであるためには、その中の複数のシステムの各々が、
以下の条件を満たしていなければならない(以下の説明
に関しては、図17を参照されたい)。 −それら複数のシステムの各々が、共用DASD上の、
共通の1つのシスプレックス・データ・セット1701
を共用できるようにしてあること。 −それら複数のシステムの各々が、そのシスプレックス
・データ・セットの中へ、固有のシステム使用許可識別
子1702を書き込むことによって、その他のシステム
がそのシステムとの間で通信できるようになるようにし
てあること。この識別子の固有の値は「システムID」
とも呼ばれるものであり、これについては後に詳述す
る。 −それら複数のシステムの各々が、シスプレックス・デ
ータ・セットの中の固有のセクション(1703A、1
703B、1703C)を要求することができ、且つ、
更新することができるようにしてあること。各システム
は、この固有の部分(セクション)の中において、タイ
ム・スタンプを含んだステータス・フィールド1704
を一定の期間ごとに更新する。各システムは更に、その
システムの故障検出期間1705(この期間は導入の際
に指定される)を書き込んでおく。そして、あるシステ
ムが、この故障検出期間1705を超える時間に亙って
ステータス・フィールドの更新を行なわずにいた場合に
は、それをもって「ステータス更新欠落」が発生したも
のと判断する。 −あるシスプレックスの中の複数のシステムは、その各
々のシステムが、そのシスプレックスの中の、その他全
てのシステムのステータス・フィールドを読み取れるよ
うにしてあること。こうしておくことによって、ステー
タス更新欠落状態を、その他のシステムが検出すること
ができる。 −シスプレックスの中のあるシステムに、別のあるシス
テムを対象とした、アベイラビリティ・ポリシーに従っ
た動作を実行する必要が生じた場合には、その対象とさ
れるシステムのシステムID(1702)が、シスプレ
ックス・データ・セットから得られるようにしてあるこ
と。こうして得られたシステムIDがPR/SM機構へ
渡されることによって、区画間リセット、ないしは区画
間非活動化が行なわれるようにする。また、このシステ
ムIDは、動作実行側システムの論理区画(LP)が、
故障側システムのLPに対して区画間機能を行使し得る
ものであることを示す、使用許可値でもある。
【0024】図1は、本発明のハイレベルなフローチャ
ートを示したものである。初期化段階11には、次のも
のが含まれている。即ち先ず、ある論理区画を対象とし
た動作を実行する権限を、それとは別のどの論理区画に
許可しておくかを規定するために必要なセットアップが
あり、また、オペレーティング・システムの初期プログ
ラム・ロード(IPL)があり、更に、そのオペレーテ
ィング・システムが実行すべき動作を管理するアベイラ
ビリティ・ポリシーの活動化が含まれている。オペレー
ティング・システムのIPLが正常に終了したならば、
モニタ動作段階12が開始される。このモニタ動作は、
あるオペレーティング・システムが故障していると判断
される場合に、その故障の事実を識別するためのもので
ある。次の13で示した分離段階は、故障したシステム
が共用資源にアクセスすることを防止するプロセスであ
る。あるシステム(ある論理区画の中でランしているシ
ステム)が故障していることを確認し、その故障システ
ムを共用資源から分離した後には、資源再構成段階14
において、その故障システムから、そのシステムの資源
(例えば記憶機構、プロセッサ、等々)を解放すること
ができ、そして、解放したそれら資源は、同じマシンの
中の異なった論理区画の中でランしているその他のシス
テムが、それらを獲得することができる。また、この資
源再構成と同時に、ワークロード引継ぎ段階15におい
て、故障システムのワークロードの引継ぎを行なって、
それを、バックアップ即ち代替システム上のワークロー
ドとすることができる。こうして、ワークロードを他の
論理区画の上をランしているバックアップ・システムへ
移転させることによって、故障システムから獲得したシ
ステム資源を利用することが可能となる。
【0025】図2は、初期化段階における制御の流れを
示したフローチャートである。オペレーティング・シス
テムのIPLを行なう前に、先ず、論理区画をイネーブ
ルして(21)、後刻、いずれかのシステムが故障した
場合に必要となる、区画間機能を実行することができる
ようにしておく必要がある。この制御を行なうようにし
てあることによって、導入処理の際に、同一のCPC上
に置かれた、夫々ユーザが異なった複数の論理区画どう
しを、互いから適切に分離した状態を維持することがで
きるようになっている。また、従来より公知の、論理区
画セキュリティ・フレーム(LPSECフレーム)(こ
れに関しては、例えばIBM社の「ES/3090プロ
セッサ・リソース/システム・マネジャ(GA22−7
123)等を参照されたい)の中に、論理区画のため
の、種々のセキュリティ関係の制御を包含させている。
更に本発明では、このLPSECフレームに、区画間制
御許可の機能を追加してあり、この区画間制御許可の機
能は、ある論理区画の、他の論理区画に影響を及ぼす区
画間機能(例えば区画間システム・リセット機能等)を
行使する能力を、制限するためのものである。図3は、
このLPSECフレームを示したものである。同図に示
したように、論理区画の区画間制御許可を、LPSEC
フレームのXLPの縦列31の中に指定するようにして
いる。
【0026】図3に示した例では、1つのLPSECフ
レームに、2つの論理区画(「PRIMARY」32と
「BACKUP1」33)を規定している。そして、
「BACKUP1」論理区画には、区画間機能を行使す
る権限を付与してある(即ち、XLP縦列の中のこの
「BACKUP1」論理区画に対応した位置34には
「イエス」を表わす「Y」を指定してある)。このXL
Pの情報は、セキュリティ制御テーブル(図8の180
3)の中に維持するようにしている。
【0027】次に(図2の22)、従来の一般的な仕方
で、オペレーティング・システムを論理区画の中に初期
プログラム・ロード(IPL)する。(本実施例ではM
VSをIPLするようにしているが、このときロードす
る機能は、MVSオペレーティング・システムには限ら
れない。
【0028】次に、23では、オペレーティング・シス
テムの初期化の実行中のいずれかの時点で、その他のオ
ペレーティング・システム・インスタンスに対して、次
の許可を与える。即ち、その許可とは、このオペレーテ
ィング・システムに故障が発生した場合に、その他のオ
ペレーティング・システム・インスタンスが、このオペ
レーティング・システムを対象とした動作を取ることの
許可である。この許可の機能は図8に更に詳細に示して
あり、また、後述する同図に関する記載の中で更に詳細
に説明する。
【0029】オペレーティング・システムが動作してい
る任意の時点で、オペレータが(或いはオートメーショ
ンによって)アベイラビリティ・ポリシーを活動化する
ことができるようにしてある(24)。このアベイラビ
リティ・ポリシーは、オペレーティング・システムに対
して、その他のオペレーティング・システムの故障を検
出した場合に取るべき動作を指定したものである。この
アベイラビリティ・ポリシーについては、アベイラビリ
ティ・ポリシー初期化の説明の中で、更に詳細に説明す
る。
【0030】複数のシステムの活動状態をモニタするた
めの、モニタ・プロセスの概要を示したものが、図4で
ある。ある1つのシステムが故障した場合にその故障を
検出できるようにするために、関与している複数のシス
テムの各々が、共用DASD上の共用データ・セットの
中に、周期的にタイム・スタンプを書き込むようにして
いる(41)。このタイム・スタンプの書込みは、当該
システムの中の優先順位が高位のタスク(可能最高位の
指名順位にセットされたタスク)によって行なわれるよ
うにしている。これに関して本発明が前提としているの
は、高位のタスクがその仕事を完了することができない
のであれば、アプリケーションが走っていない可能性が
非常に高いということである。また、このタイム・スタ
ンプと共に、各システムは、共用データ・セットの中に
そのシステムの故障検出期間(図17の1705)(こ
の故障検出期間はユーザが指定するものであり、例えば
1分に指定する)を書き込んでおくようにしている。更
に、各システムは、そのシステムのタイム・スタンプの
書込みを行なうと共に、その他全てのシステムのタイム
・スタンプの読取りを行なう(42)。
【0031】他の1つのシステムのタイム・スタンプを
読み取ったならば、その読み取ったタイム・スタンプを
現在時刻と比較する(43)。そして、その読み取った
タイム・スタンプが、その故障検出期間内に(例えば最
近の1分間の間に)更新されていなかったならば、その
システムをステータス更新欠落状態にあるものと判断し
(44)、その旨の表示をポリシー活動化タスク(4
5)へ渡すようにしている。このとき、ポリシー活動化
タスクは、アベイラビリティ・ポリシーを調べることに
よって、何らかの動作を実行すべきか否かを判断する
(後述する「アベイラビリティ・ポリシー」の中のNO
STATUSポリシー・ステートメントを参照された
い)。一方、そのシステムが、故障検出期間内にみずか
らのステータスの更新を行なっていたならば、ステータ
スのタイム・スタンプの次回の読取りを行なうまでの
間、これ以上の動作は何も行なわない。あるシステムが
ステータス更新欠落状態にあると識別されて、しかもア
ベイラビリティ・ポリシーがそのシステムをマルチシス
テム環境から排除すべきである旨を表示していた場合に
は、分離段階へ入る。
【0032】図5は、分離段階における制御の流れを示
したフロー・チャートである。検出動作を実行している
側のシステムにおける、オペレーティング・システム上
のポリシー活動化タスク(Policy Activation Task: P
AT)が、区画間システム・リセット機能または区画間
非活動化機能を起動し(51)、それによって、故障シ
ステムがそれ以後、共用資源へは決してアクセスできな
いようにする。これについては、図9、並びに後述の同
図に関する説明を参照されたい。
【0033】区画間システム・リセットないし区画間非
活動化を実行したならば、その実行の結果を調べて(5
2)、実行した機能が正常に終了したか否かを判断す
る。そして、その機能が正常に終了していたならば、シ
スプレックス区画区分を開始する(53)。このシスプ
レックス区画区分は、シスプレックス内のある1つのシ
ステムが、他の1つのシステムをそのシスプレックスか
ら排除する際に使用するプロセスである。(尚、あるシ
ステムを閉鎖するための別の方法として、手操作による
方法、即ち、オペレータが駆動するインターフェース介
してシステムを閉鎖する(58)方法もあることを特記
しておく)。このシステムの排除の際に実行される動作
は次のとおりである。 −そのシスプレックス内のシステムのリスト(図17参
照)から、そのターゲット・システム(処理対象のシス
テム、ここでは故障したシステムのこと)を除去する
(54)。これによって、以後発せられる、このシスプ
レックス内のそのリストに載っているシステムを求める
要求に対して、その故障システムが割り当てられること
はなくなる。。 −マルチシステムの構成要素のうち、当該故障オペレー
ティング・システムの中に組み入れられていた構成要素
は、その故障システムのシステム・レコード(図17の
1705A)の不在を検出し、それによって、それまで
その故障システムが所有していた資源の全てを一掃して
構わないということを知る。 −当該シスプレックス内の各々のシステムは、こうして
故障システムが確認されたことを検出したならば、みず
からのシステム上のPATへ、SYSGONE(システ
ム消滅)事象を渡して、更なるポリシー動作(アベイラ
ビリティ・ポリシーに従って実行する動作)を実行させ
る。
【0034】ポリシー活動化タスク56は、SYSGO
NE状態を知らされたならば、何らかの動作を実行する
必要があるか否かを判定する。ポリシー活動化タスクの
目的のうちの、SYSGONE状態に関する主目的は、
資源再構成段階、並びにワークロード引継ぎ段階をトリ
ガすることにある。これら2つの段階は同時並行的に処
理される。(これらについての更なる詳細は、図6、図
7、並びに本明細書中のそれらの図面に関する説明を参
照されたい)。
【0035】分離処理が正常に終了しなかった場合に
は、オペレータに対して、故障システムが既にリセット
されていることを確認して応答するよう求める、プロン
プトが出される。尚、オペレータが故障の確認応答をし
た後には、本発明に関するオートメーションの残りが部
分の処理が、続行可能となるようにしてあることを、特
記しておく。
【0036】(尚、与えられたアベイラビリティ・ポリ
シーには、分離段階を実行した後には、資源再構成段階
とワークロード引継ぎ段階とを実行せずにとばしてしま
うよう指定されていることもあることを、特記してお
く。)
【0037】あるシステムを共有資源から分離した後に
は、もし資源関係のポリシー動作が必要とされていたな
らば、そのポリシー動作を実行する。図6は、ポリシー
活動化タスクが、図5に55で示したようにSYSGO
NE通知を受け取ったときに実行する、資源再構成に関
する重要な機能を示したものである。
【0038】ある資源を移転して別の論理区画に組み込
むためには、その前に先ず、その資源を、以前の論理区
画上の故障オペレーティング・システムには、もはや割
り当てられていない状態にする必要がある。そうするた
めには、区画間非活動化機能を起動して(61)、(ア
ベイラビリティ・ポリシーが指定している)ターゲット
論理区画(即ち故障システムの論理区画)にそのとき割
り当てられている全ての資源を解放するか、或いは、無
指定の区画間非活動化機能を起動して、このポリシー動
作を実行しているシステムの論理区画の、アドレッシン
グ・レンジ内に位置している複数の論理区画に割り当て
られている、全ての資源を解放するようにすれば良い。
これらのサービスの詳細については、図9と図10、並
びにそれらの図に関する本明細書中の説明を参照された
い。
【0039】故障システム即ち故障論理区画から、その
資源を解放した後には、その解放した資源を、その故障
論理区画と同じCPC上に置かれている他の論理区画へ
再構成することができる。この場合に処理される資源
は、アベイラビリティ・ポリシーの中に指定されている
資源である。MVSは、該当するMVS ̄CONFIG
コマンドを内部的に発生して、それら資源を、システム
に対してオン・ラインとなるように構成する(このコマ
ンドの詳細については、「MVS/ESA動作:システ
ム・コマンド(GC28−1826)」を参照された
い)。そのアベイラビリティ・ポリシーの中に、STO
RE(YES)が指定されていた場合には、(62)、
PATが、CONFIG ̄STOR(E=1),ONL
INEコマンドを内部的に発生して(63)、主記憶機
構をそのシステムに対してオン・ライン状態となるよう
に構成する。また、もし、そのアベイラビリティ・ポリ
シーの中に、ESTORE(YES)が指定されていた
ならば(64)、MVSが、CONFIG ̄ESTOR
(E=X),ONLINEコマンド(このコマンドは、
「BACKUP1」(バックアップ・システム)がその
ときESTORE(拡張記憶機構)を割り当てられてい
なければX=0とし、一方、「BACKUP1」が既に
幾らかのESTOREを割り当てられているならばX=
1とする)を内部的に発生して(65)、主記憶機構な
いし拡張記憶機構を、そのシステムに対してオン・ライ
ン状態となるように構成する。
【0040】図7は、ワークロード引継ぎ処理を図示し
たものである。アプリケーションに故障したシステムか
らバックアップ即ち代替システムへの引継ぎを行なわせ
る際の最初のステップは、そのアプリケーションが、問
題が発生していることを知るステップである。このステ
ップは次のようにして行なわれる。 −バックアップ・アプリケーションには、プライマリ・
アプリケーションをモニタする(71)手段を備えてあ
り、そのため、プライマリ・アプリケーションが仕事の
実行を停止したときには、バックアップ・アプリケーシ
ョンは、それを知ることができる。既述の如く、これ
は、CICS並びにXRFという製品において既に採用
されている従来技術である。 −バックアップ・アプリケーションは、プライマリ・ア
プリケーションが故障したことを検出したならば(7
2)、SCPに実行させる調査サービスを起動する。 −調査サービスはシスプレックス・データ・セット76
を読取り(73)、シスプレックス内のシステムのステ
ータスを返す。この場合、プライマリ・システムの取り
得る状態と、その状態に応じたバックアップ・アプリケ
ーションの反応は次のとおりである。 −プライマリ・システムは、ステータス更新欠落状態に
ある。バックアップ・アプリケーションは、このプライ
マリ・システムが既に故障していて共用資源から分離さ
れた状態にあると判断されるまでは、プライマリ・アプ
リケーションのモニタとシスプレックスの調査とを続行
する。 −プライマリ・システムは、正常動作を再開した状態に
ある。バックアップ・アプリケーションは、通常モニタ
動作へ復帰する(これはテスト74の結果が「NO」で
あった場合である)。 −プライマリ・システムは、シスプレックス区画区分と
いう処理が実行されたことによって、その停止処理が正
常に終了し、既に消滅している。(これはテスト74の
結果が「YES」であった場合である)。バックアップ
・アプリケーションは、従来技術において行なわれてい
るように、通常のXRF処理を行なうことによってワー
クロードをバックアップ・システムへ移転させる処理
を、開始する(75)。
【0041】図8は、区画間イネーブルメントにおける
制御の流れを示したフローチャートである。81では、
SCPが、共用DASD上の共用データ・セット82を
読み取った上で、固有のシーケンス番号(これはシステ
ム使用許可IDの一部である−図17の1702を参照
されたい)を生成している。生成されたそのシーケンス
番号は、システム使用許可識別子(即ちシステム使用許
可ID)の一部として使用され、このシステム使用許可
IDを「システムID」と呼ぶこともある(図17の1
702)。このシステムIDの構成は、シスプレックス
名と、システム番号と、固有のシーケンス番号とから成
るものである。システムIDの中のこのシーケンス番号
は、新たなシステム・レコードを生成するたびに「1」
ずつインクリメントするようにした番号である。83で
は、SCPが、PR/SM機構の機能のうちの、論理区
画に対する区画間イネーブルメント機能を起動し、この
機能の起動は、PR/SM機構へSCCBを転送する
(84)ことによって行なっている。区画間イネーブル
メント機能は、区画間機能をロックした上で、ハードウ
ェアで構成した、システム領域の中のステータス・テー
ブル(図18の1802)の中に、システムIDを記憶
させるというものである(記憶させた後にロックを解除
する)。(注:このSCCBは、SCPが、要求を取扱
う論理区画コントローラ(本実施例ではPR/SM機
構)と間で通信を行なうために使用する、一般的な機構
である。SCCBの通常のフォーマットは図16に示し
たとおりであり、機能コード1601、応答コード16
02、ターゲットLP識別子1603、及び許可コード
1604を含んでおり、これらは、ハードウェアで構成
したシステム領域(図18の1802)の中に記憶させ
るようにしている)。次に、85では、識別子(システ
ムID)が、そのハードウェアのシステム領域の中に正
常に書き込まれたか否かを調べるテストを行なう。(こ
のことは、PR/SM機構がセットした応答コード(図
16の1602)によって、しかもこのPR/SM機構
がEXTERNAL割込みを発生することによって示さ
れるようにしてある)。そして、ハードウェアのシステ
ム領域への書込みが正常に行なわれていたならば、更に
そのシステムIDを、共用データ・セットの中の当該シ
ステムに関連したシステム・レコード(図17の170
2を参照されたい)の中へ書き込む(86)。ここへ書
き込まれたシステムIDは、このシスプレックスの中の
別のシステムが、その他のシステムの論理区画を対象と
した区画間機能を発生しようとするときに(特に、NO
STATUS事象またはSYSGONE事象が発生した
ときに)、それらのシステムによって読み取られ、そし
て、以後の、このシステムIDに対応したシステムを対
象とした区画間リセットないし区画間非活動化のコール
の際に使用されるものである。一方、85におけるテス
トの結果、そのシステムIDが、ハードウェアのシステ
ム領域(HSA)の中に正常に書き込まれていないこと
が判明したならば、そのシステムIDを「0」にセット
した上で(87)、その「0」を共用データ・セットに
書き込む。これによって、当該システム及び論理区画を
対象とした区画間リセットないし区画間非活動化は、い
ずれも実行を阻止されるようになる。
【0042】図9は、区画間非活動化並びに区画間シス
テム・リセットにおける制御の流れを示したフローチャ
ートである。SCCB(制御ブロック)91は、これら
2つの機能(非活動化機能とシステム・リセット機能)
の双方へ入力される。SCCB91は、その中に、区画
間非活動化機能の機能コード或いは区画間システム・リ
セット機能の機能コードと、ターゲット論理区画に対応
した16バイトの区画間許可ID(即ちシステムID−
図17の1702)と、ターゲット論理区画に対応した
論理区画IDとを含んでいる。92では、初期有効性チ
ェックを実行し(この初期有効性チェックは、上で説明
した、当該論理区画がその他の論理区画を対象とした区
画間機能を発生する許可を与えられているかというチェ
ックを含んでいる−許可を与えるか否かはLPSECフ
レームにおいて指定する)、そしてタイマをセットす
る。更に、ターゲット論理区画に対して、排他的ロック
を施すことによって、この機能が完了するまでは、オペ
レータが入力する可能性のある競合コマンドが決して実
行されないように、そして、2つのうちの他方の区画間
機能が、決して実行を試みられることがないようにす
る。タイマを使用する目的は、この機能を、妥当な時間
の範囲内(例えば30秒以内)で必ず終了させるためで
ある。93では、ターゲット論理区画に対応した許可I
Dの値が、SCCBに入れられてこのサービスへ転送さ
れてきた許可IDの値(この値は論理区画ステータス・
テーブル−図18の1802−の中に保持してある)と
一致するか否かのテストを行なう。もし一致しなけれ
ば、応答コードをセットした上で、割込みを発生してそ
の応答コードをSCPへ送り返す(95)。(この後、
ロックを解除する)。一方、それらのIDの値が一致し
ていたならば、SCCBに入れられて転送されてきた機
能コードに従って、当該論理区画をリセットするか、或
いは非活動化するかのいずれかを行なう(94)。リセ
ット機能が指定されていた場合には、サービス・コール
論理プロセッサ(SCLP)が、システム・コンソール
から入力される「SYSRESET」コマンドやOPR
CTLフレームで指定される「03」コマンドを処理す
る際に起動するサービスと同一のサービスを起動する。
また、このサービスの起動の際には、SCCBの中に指
定されているターゲット論理区画を、起動したサービス
のターゲット論理区画とする(これについては、IBM
社の「システム・コンソールのオペレータ制御(SC3
8−0068)」を参照されたい)。このサービスの実
行により、論理CPがリセットされ、浮動割込みがリセ
ットされ、論理区画のI/Oサブシステムがリセットさ
れる(これについては、IBM社の「ESA/370の
オペレーションの原則(SA22−7200)」の、第
12章「オペレータによって開始される機能」と、第4
章「外部から開始されるシステム・リセットの定義のた
めの機能」とを参照されたい)。尚、最後に、論理区画
をリセットすることになった原因をオペレータに知らせ
るための情報メッセージ(監査証跡メッセージ)を、シ
ステム・コンソール上に発生させるようにしている。以
上による総合的な結果は、ターゲット・システムが、こ
れ以後いかなる仕事も実行しなくなり、また、共用資源
への、その全てのI/Oが停止されるということであ
る。このシステム・リセットが完了したならば(このこ
とは、非同期的に信号で通知される)、他のシステム
は、そのリセットされたシステムとの間でそれまで共用
していた資源に対して、変更を加えても大丈夫であるこ
とを知ることになる。続いて、タイマのリセットを行な
った後に、当該SCPへの応答のための「正常終了」応
答コードを、SCCBの中にセットする(95)。(ま
た、ロックの解除も行なう)。
【0043】一方、入力された機能コードが「非活動
化」を指定していた場合には、SCLPは、システム・
コンソールから入力される「DEACTLP」コマンド
を処理するときに起動するサービスと同一のサービスを
起動し、そしてその際に、SCCBの中に指定されてい
るターゲット論理区画を、起動したサービスのターゲッ
ト論理区画とする(これについては、IBM社の「PR
/SM計画ガイド(GA22−7123)」を参照され
たい)。このサービスの実行によって資源が解放され、
解放された資源は、同じプロセッサ・コンプレックス
(即ちシスプレックス)上のその他の論理区画が、それ
を使用することができるようになる(また更に、システ
ム・リセットを行なう)。以上が終了したならば、非活
動化の完了を表示する情報メッセージをシステム・コン
ソール上に映し出すようにしている。このシステム非活
動化による総合的な結果は、当該システムがこれ以後い
かなる仕事も実行しなくなり、また、共用資源への、そ
の全てのI/Oが停止されるということである。このシ
ステム非活動化が完了したならば(このことは、非同期
的に信号で通知される)、他のシステムは、その非活動
化されたシステムとの間でこれまで共用してきた資源に
対して変更を加えても大丈夫であり、また解放された資
源を獲得することができることを知ることになる。続い
て、タイマをリセットし、ロックを解除した後に、「正
常終了」応答コードをセットした上、その応答コードを
当該SCPへ返すようにする(95)。
【0044】タイマにセットした時間内(例えば30秒
以内)に、リセットないし非活動化が完了しなかった場
合には、タイム・アウトを発生させ(96)、該当する
応答コードをSCPへ返すようにする。この場合、コマ
ンドを発生した論理区画に対しては、後にリセットない
し非活動化が終了しても、特に表示を送出することはし
ない。
【0045】図10は、無指定区画間システム非活動化
における制御の流れを示したフローチャートである。入
力されたSCCB(1001)からは、無指定区画間非
活動化機能の機能コードが入力として与えられる。する
と、無指定非活動化機能が、初期有効性チェックを実行
すると共に、タイマを始動させる(1002)。このタ
イマを使用する目的は、この無指定非活動化機能が完了
するか、さもなくば、然るべき応答コードが送出される
かの、いずれかが確実に行なわれるようにするためであ
る。1003では、この無指定非活動化機能をコールし
た論理区画を除いた全ての論理区画を順次処理して行
く。1004では、処理中の論理区画が、この機能をコ
ールした論理区画と、記憶機構を(主記憶機構と拡張記
憶機構とのいずれについても)共用しているか否かをチ
ェックする。(この情報は、各々の論理区画に対応した
記憶機構割り振りテーブル−図18の1801−に保持
しておく)。その処理中の論理区画が記憶機構を共用し
ていなかったならば、その論理区画の次の順番の論理区
画を処理する。一方、その処理中の論理区画が記憶機構
を共用していたならば、その論理区画を非活動化し(1
005)、この非活動化は、先に図9に関して説明した
論理区画非活動化と同様に行なう。全ての論理区画の処
理が完了したならば、タイマををリセットし、応答コー
ドをセットし、そして割込みを送出して、その応答コー
ドを元のSCPへ返す(1006)。また、もしタイマ
にセットした時間内(例えば30秒以内)に、この無指
定非活動化の全てが完了しなかったならば、タイム・ア
ウトを発生させて(1007)、該当する応答コードを
元のSCPへ返すようにする。
【0046】図11は、本発明に係るアベイラビリティ
・ポリシー指定法のシンタックスを示したものである。
このポリシーのキーワード並びにオプションには、次の
ような意味を持たせてある。
【0047】『NOSTATUS(failsys)』
これは、ステータス更新欠落状態が発生した場合に、そ
の状態を発生した故障システム(failsys)をタ
ーゲット・システム(動作対象のシステム)として、指
定された動作を実行すべきことを表わす。
【0048】『RESETTIME(nnnnn)』こ
のRESETTIMEオプションは、故障システムを、
指定した時間が経過した後に「システム・リセット(S
YSRESET)」することを要求するオプションであ
る。時間の長さ「nnnnn」は、秒単位で指定する。
例えば、RESETTIME(10)として指定したな
らば、ステータス更新欠落状態が検出されてから10秒
の後に、故障システムのシステム・リセットが実行され
ることになる。また、RESETTIME(0)として
指定した場合には、ステータス更新欠落状態がオペレー
ティング・システムによって検出されると即座に、シス
テム・リセットが実行されることになる。SYSRES
ETを送出することができるのは、PR/SM機構の制
御下においてLPARモードでランしている、当該シス
プレックス内のその他のシステムであって、しかも故障
システムと同じCPCの上に置かれているシステムだけ
である。 注:故障していたシステムが、時間「nnnnn」が経
過する以前に、そのステータス更新を再開した場合に
は、SYSRESETの機能は実行されない。
【0049】『DEACTTIME(nnnnn)』こ
のDEACTTIMEオプションは、故障システムが存
在している論理区画を、指定した時間が経過した後に
「非活動化(DEACTIVATE)」することを要求
するオプションである。時間の長さ「nnnnn」は、
秒単位で指定する。例えば、DEACTTIME(1
0)を指定したならば、「ステータス更新欠落」状態が
検出されてから10秒の後に、故障システムのDEAC
TIVATEが実行されることになる。また、DEAC
TIVATEが実行されるときにはSYSRESETも
実行されるようにしてある。DEACTIVATEを送
出することができるのは、PR/SM機構の制御下にお
いてLPARモードでランしている、当該シスプレック
ス内のその他のシステムであって、しかも故障システム
と同じCPCの上に置かれているシステムだけである。 注:故障していたシステムが、時間「nnnnn」が経
過する以前に、そのステータス更新を再開した場合に
は、このDEACTIVATEの機能は実行されない。
【0050】『SYSGONE(failsys)』こ
れは、故障システム(failsys)が、アベイラビ
リティ・ポリシーによって、或いはオペレータによって
リセット(或いは非活動化)されたときに、オペレーテ
ィング・システムがポリシー活動化タスクへ、システム
消滅(SYSGONE)事象を通知するためのものであ
る。
【0051】『SYSTEM(sysname)』必須
パラメータである、このSYSTEMパラメータ上に指
定してあるシステムは、当該シスプレックス内のシステ
ムであって、故障システムの消滅を知らせるSYSGO
NE通知を受け取ったときに、指定された動作を実行す
べきシステムを特定したものである。POLICY(ア
ベイラビリティ・ポリシー)は、全てのシステムの中に
組み込んであるため、このSYSTEMパラメータで特
定したシステムが、そのSYSGONEの通知に対して
応答すべき唯一のシステムであるようにしているのであ
る。このSYSTEMパラメータに特定してあるsys
nameが、現在システムのSYSNAME(システム
名)と一致しない場合には、そのポリシー・ステートメ
ントは現在システムには何ら影響を及ぼさない。
【0052】『DEACTIVATE(othersy
s/ALL)』このDEACTIVATEキーワード
は、非活動化(DEACTIVATE)すべきシステム
をユーザが指定するためのキーワードである。また、こ
のDEACTIVATEは、必須のキーワードである。
DEACTIVATE(othersys)を指定する
場合、そのothersysには、当該シスプレックス
内の別のシステムを指定しなければならず、さもなく
ば、いかなる動作も行なわれないことになる。この非活
動化の機能が、ターゲット論理区画のオペレーティング
・システム並びにハードウェアに、どのような影響を及
ぼすかについての説明は、図9並びに同図に関する本明
細書中の記載を参照されたい。特に、SYSTEMパラ
メータに指定したシステムと、othersysとは、
同じ1つのCPCの上をランしているシステムでなけれ
ばならないことに注意されたい。一方、DEACTIV
ATE(ALL)を指定した場合には、SYSTEMパ
ラメータに指定してあるシステムが、PR/SM機構に
対して、そのシステムのアドレッシング・レンジ内にあ
る他の全ての論理区画を非活動化するように要求するこ
とになる。この要求が、無指定区画間非活動化と呼んで
いるものである。この無指定区画間非活動化の機能が、
ターゲット論理区画のオペレーティング・システム並び
にハードウェアに、どのような影響を及ぼすかについて
は、図10並びに同図に関する本明細書中の記載を参照
されたい。NOSTATUS処理の一部としてDEAC
TIVATEが既に実行されていた場合には、SYSG
ONE処理のために実行されたDEACTIVATE
は、ターゲット・システムが既に消滅していることを検
出することになるが、その場合にも、再構成の機能が要
求されていれば、その再構成の機能を実行する。
【0053】『STORE(YES/NO)』YESを
指定しておいた場合には、他の論理区画の非活動化が正
常終了したときに、それに続いて、SYSTEMパラメ
ータに指定してあるシステムが、主記憶機構をオンライ
ン状態に構成するよう要求するコマンドを発生する。例
えば、MVSの中では、このコマンドは次のようにな
る。 CONFIG ̄STOR(E=1),ONLINE このコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された主記憶機構を獲得す
る。 注:たとえDEACTIVATEが正常に終了しなくて
も、ターゲットLPARが活動状態にはないことが表示
されれば、記憶機構再構成コマンドの実行に取りかかる
ようにしてある。STORE(NO)はデフォールト値
である。
【0054】『ESTORE(YES/NO)』YES
を指定しておいた場合には、他の論理区画の非活動化が
正常終了したときに、それに続いて、SYSTEMパラ
メータに指定してあるシステムが、拡張記憶機構をオン
ライン状態に構成するよう求めるコマンドを発生する。
例えば、MVSの中では一般的なコマンドとしては次の
ようになる。 CONFIG ̄ESTOR(E=X),ONLINE このコマンドが実行されると、当該システムは、非活動
化された論理区画から解放された拡張記憶機構を獲得す
る。ESTORE(NO)はデフォールト値である。
【0055】『OTHERRESOURCE(YES/
NO)』YESを指定しておいた場合には、他の論理区
画の非活動化が正常終了したときに、それに続いて、S
YSTEMパラメータに指定してあるシステムが、その
他の資源をオンライン状態にするよう求めるコマンドを
発生する。この構成を拡張して、システムが動的に再構
成し得るいかなる資源をも包含するようにすることも可
能である。OTHERRESOURCE(NO)はデフ
ォールト値である。
【0056】『アベイラビリティ・ポリシーの初期化』
アベイラビリティ・ポリシーは、パラメータ・ライブラ
リ(PARMLIB)の中に入れておくことができるよ
うにしてあり、これは、従来技術におけるその他多くの
MVSの制御値のセットがそのようにしてあるのと同様
である。また、アベイラビリティ・ポリシーは、オペレ
ータが発するコマンドにより、従来の通常の仕方で初期
化することができるようにしてある。(その他の従来の
方法、例えばシステム初期化パラメータ、或いはシステ
ム・サービスを利用する方法とすることもできる)。ア
ベイラビリティ・ポリシーを初期化するためのMVS ̄
SETAVAILコマンドの使用法のシンタックスは次
のとおりである。 SETAVAIL ̄POLICY,ACTIVATE=memname DEACTIVATE この式において、memnameは、パラメータ・ライ
ブラリのメンバを表わしている。POLICYの指定
は、次の夫々のようにして、行なうことができる。 「ACTIVATE=memname」このようにポリ
シーのメンバ名を指定したならば、MVSが、指定され
たメンバ名をパラメータ・ライブラリから読み取り、そ
れを活動ポリシーとする。もし新たなメンバ名を処理し
ている間に、シンタックス・エラー等の問題が発生した
場合には、旧ポリシーを(もしそれがあれば)有効のま
まにしておくようにしている。 「DEACTIVATE」DEACTIVATEを指定
した場合には、オペレーティング・システムが、全ての
アベイラビリティ・ポリシー処理を停止するようにして
ある。
【0057】『アベイラビリティ・ポリシー処理』アベ
イラビリティ・ポリシー処理が行なわれることになるの
は、シスプレックスのモニタ実行中に、ステータス更新
欠落状態の存在が検出されたときか、或いは、シスプレ
ックス区画区分機能によって、シスプレックスからある
システムが排除されたときかの、いずれかの場合であ
る。アベイラビリティ・ポリシー処理は、ポリシー活動
化タスク(PAT)が行なう。
【0058】シスプレックスのモニタ実行中に、あるシ
ステムがステータス更新欠落状態にあることが検出され
たならば、PATは、アベイラビリティ・ポリシーの中
のNOSTATUSの部分を処理する。このとき、その
アベイラビリティ・ポリシーの処理にあたるPATは、
そのステータス更新欠落状態を検出したシステムの上の
PATである。このPATがそのNOSTATUSポリ
シー・ステートメントを処理する仕方は次のとおりであ
る。「RESETTIME(nnnnn)」−PATは
「nnnnn」秒間待機し、その間中、そのステータス
更新欠落状態が持続したならば、そのステータス更新欠
落状態が発生しているシステムの論理区画を、区画間シ
ステム・リセット機能を用いてシステム・リセットし、
そして更に、シスプレックス区画区分機能へ、そのシス
テムがもはや活動状態にはないことを通知する。「DE
ACTTIME(nnnnn)−PATは「nnnn
n」秒間、待機し、その間、そのステータス更新欠落状
態が持続したならば、そのステータス更新欠落状態が発
生しているシステムの論理区画を、区画間非活動化機能
を用いて非活動化し、そして更に、シスプレックス区画
区分機能へ、そのシステムがもはや活動状態にはないこ
とを通知する。
【0059】シスプレックス区画区分機能によって、シ
スプレックスからあるシステムが排除されたときには、
PATは、アベイラビリティ・ポリシーの中のSYSG
ONEの部分を処理する。SYSGONE(fails
ys)が指定しているシステムがシスプレックスから排
除されたときには、SYSTEM(sysname)が
指定しているシステム上のPATがそのポリシーの処理
にあたる。このPATがSYSGONEポリシー・ステ
ートメントを処理する仕方は、次のとおりである。「D
EACTIVATE(othersys)」−PAT
は、シスプレックス区画区分機能によってシスプレック
スから排除されたシステムの論理区画を、区画間非活動
化機能を用いて非活動化する(ただしその論理区画は、
アベイラビリティ・ポリシーのNOSTATUS部分を
処理したPATによって既に非活動化されている場合も
ある)。「DEACTIVATE(ALL)」−PAT
は、そのPATのアドレッシング・レンジ内にある全て
の論理区画を、無指定区画間非活動化機能を用いて非活
動化する。「STORE(YES)」−PATは、中央
記憶機構(主記憶機構)が使用可能であるならば、該当
するMVS ̄CONFIG ̄STOR,ONLINEコ
マンドを内部的に発生して、中央記憶機構をオンライン
状態に構成する。「ESTORE(YES)」−PAT
は、拡張記憶機構が使用可能であるならば、該当するM
VS ̄CONFIG ̄ESTOR(E=X),ONLI
NEコマンドを内部的に発生して、拡張記憶機構をオン
ライン状態に構成する。「OTHERRESOURCE
(YES)」−PATは、該当するMVS ̄CONFI
Gコマンドを内部的に発生して、その他のプロセッサ資
源をオンライン状態に構成する。
【0060】以下に示す具体例は、システム故障が発生
した後に、システム資源を再構成するためのアベイラビ
リティ・ポリシーを活動化するようにした場合に、実行
することが必要となる全てのステップを示したものであ
る。尚、図12に全体の状況を示してある。 1.ある論理区画の中において、活動MVSシステムの
初期プログラム・ロード(IPL)を行なう。この活動
MVSシステムは、IPLを行なう最初のシステムであ
るため、複数のシステムから成るコンプレックスである
シスプレックスの動作は、この活動MVSシステムをも
って開始することになる。 2.この活動MVSシステムは、そのMVSのIPLの
実行中に、場合によってはこのシスプレックスに参加し
てこの活動MVSシステムの論理区画を対象とした破壊
的動作を実行することになる可能性のある、他の全ての
MVSシステム(例えば代替MVSシステム等)に、そ
の動作の許可を与える。この活動MVSシステムは、区
画間リセット/非活動化イネーブルメント要求をPR/
SM機構へ送出することによって、それら他のMVSシ
ステムにその許可を与えるようにしている。このように
活動MVSシステムが他のシステムに許可を与えたなら
ば、それによって、シスプレックスの中の他のMVSシ
ステムが、この活動MVSシステムの論理区画をシステ
ム・リセットないし非活動化することができるようにな
る。 3.次に、別の論理区画の中に、代替MVSシステムの
IPLを行なう。活動MVSシステムと代替MVSシス
テムとは、同一のプロセッサ上の別々の論理区画の中の
ものとしても、また、互いに異なったプロセッサ上の夫
々の論理区画の中のものとしても、それらシステムの実
行に支障は生じない。代替MVSシステムの論理区画と
するプロセッサ資源の割当量をどれ程の量に定めるか
は、アベイラビリティ・ポリシーにどのような指定をす
るのかによって異なったものとなる。即ち、アベイラビ
リティ・ポリシーに、活動MVSシステムの論理区画
を、(非活動化すべき論理区画ではなく)システム・リ
セットすべき論理区画であると指定するのであれば、代
替MVSシステムの論理区画には、活動MVSシステム
のワークロードを走らせるのに充分な分量のプロセッサ
資源を割り当てておかねばならない。一方、アベイラビ
リティ・ポリシーに、活動MVSシステムの論理区画は
(システム・リセットすべき論理区画ではなく)非活動
化すべき論理区画であると指定するのであれば、代替M
VSシステムの論理区画には、MVSのIPLを行なう
ことができ、且つ、VTAM並びに必要な代替CICS
を走らせることができる程度の、プロセッサ資源を割り
当てておくだけで充分である。なぜならば、この場合に
は、代替MVSシステムの論理区画は、活動MVSシス
テムの論理区画に以前割り当てられていたプロセッサ資
源を、獲得することができるからである。 4.活動MVSシステム上で、活動CICS領域を始動
させる。活動CICS領域を始動した後には、CICS
のワークロードの処理が行なわれることになる。しかし
ながら、このとき、この活動CICS領域は、XRF能
力を持たないまま処理を行なっている。 5.代替MVSシステム上で、代替CICS領域を始動
させる。代替CICS領域は、一般的な方法でXRFの
機能を確立する。活動CICS領域がCICSのワーク
ロードを処理しているとき、代替CICS領域は、故障
に備えて待機している。活動CICS領域は一般的な方
法で、代替CICS領域へCICS ̄XRF監査信号を
送出し、一方、代替CICS領域は、その監査信号をモ
ニタして、その中に故障の徴候が現れていないかを調べ
ている。 6.活動MVSシステムに関するアベイラビリティ・ポ
リシーのNOSTATUS条件を、代替MVSシステム
上で活動化する。このアベイラビリティ・ポリシーは、
活動MVSシステムが故障した際に代替MVSシステム
が実行すべき回復動作を指定したものである。 7.活動MVSシステムが、明らかではない何らかの原
因で故障する。この結果、活動MVSシステムは、その
ステータス・フィールドの更新を行なわなくなる。 8.代替MVSシステムは、活動MVSシステムがその
シスプレックス監査信号を更新していないことを検出
し、活動MVSシステムが故障したものと判断する。 9.代替MVSシステムは、活動MVSシステムの故障
を埋め合わせるために、アベイラビリティ・ポリシーの
処理を開始する。このアベイラビリティ・ポリシーの中
のステートメントに対応して代替MVSシステムが実行
する処理について、以下に要約して説明する。活動MV
Sシステムの論理区画のシステム・リセット−これは、
活動MVSシステムの論理区画をシステム・リセットし
て、その活動MVSシステムをシスプレックスから排除
するよう要求する、区画間システム・リセット要求を、
PR/SM機構へ送出することによって行なう。活動M
VSシステムの論理区画の非活動化−これは、活動MV
Sシステムの論理区画を非活動化して、その活動MVS
システムをシスプレックスから排除するよう要求する、
区画間非活動化要求を、PR/SM機構へ送出すること
によって行なう。全ての非活動化−これは、代替MVS
システムのために予約されている記憶機構資源を共用し
ている論理区画を、非活動化するよう要求する無指定区
画間非活動化要求を、PR/SM機構へ送出することに
よって行なう。プロセッサ資源の獲得−これは、予約し
てある使用可能なプロセッサ資源を、代替MVSシステ
ムの論理区画へ割り当てし直すことを要求する要求を、
PR/SM機構へ送出することによって行なう。アベイ
ラビリティ・ポリシーが活動MVSシステムの論理区画
の非活動化を指定していた場合であって、しかもその非
活動化が正常終了した場合に、活動MVSシステムの論
理区画の資源は、代替MVSシステムの論理区画へのみ
割り当てし直される。一方、アベイラビリティ・ポリシ
ーが全てを非活動化することを指定していた場合であっ
て、しかも代替MVSシステムが所有している記憶機構
資源を共用している全ての論理区画が正常に非活動化さ
れた場合には、それらの論理区画の資源が、この代替M
VSシステムの論理区画へのみ、割り当てし直される。 10.この時点で、活動論理区画を非活動化(またはシ
ステム・リセット)する。これによってこの活動論理区
画は、これ以後、共用資源に対する処理も、またアクセ
スも共に行なえなくなる。 11.活動MVSシステムが故障したならば、それから
しばらくして代替CICS領域は、活動CICS領域の
CICS ̄XRF監査信号が消失したことから、活動C
ICS領域が故障したものと判断する。このように判断
したならば、代替CICS領域は、一般的な方法でのX
RF引継ぎ処理を自動的に開始する。この引継ぎ処理
は、オペレータの介入を必要とすることなく完了し、ま
た、この処理の完了の時点は、この代替CICS領域
が、シスプレックスのステータスの照会を行なうことに
よって、活動MVSシステムが排除されたことを検出し
た時点である。
【0061】『同一プロセッサ上のシステムを対象とし
たシステム・リセット』アプリケーションの種類によっ
ては(例えばIMS ̄XRF等)、バックアップ・シス
テム(BACKUP)が、プライマリ・システム(PR
IMARY)と同量の記憶機構を必要とすることもあ
る。この場合、BACKUPはワークロードを走らせる
のに充分な量の資源を最初から所有しているため、PR
IMARYが故障した際にも、BACKUPは論理区画
を非活動化して再構成する必要はない。この場合、BA
CKUPにとって必要なことは、PRIMARYは、も
はや共用資源へアクセスすることはないという肯定的確
認である。
【0062】もう1つの別の理由から、非活動化ではな
く、システム・リセット(SYSRESET)の方が選
択されることもあり、その理由とは、システム故障の後
にはSADMP(スタンド・アローン・ダンプ)が必要
となることもあるということである。
【0063】このシステム・リセットの具体例を示した
のが、図13である。説明を簡明にするために、この構
成には、システムが2つしか含まれていないものとし、
それらを夫々、PRIMARY(1301ないし130
1A)、及びBACKUP1(1302ないし1302
A)と呼ぶことにする。また、これら2つのシステム
は、同じPR/SMマシンの中の、同じシスプレックス
に所属しているものとする。以上において、PRIMA
RYに故障が発生した場合には(この故障の発生は、導
入処理によってパラメータ・ライブラリの中に指定され
た故障検出期間の経過後に検出される)、導入処理は更
に20秒間待った後に(この20秒間というのはアベイ
ラビリティ・ポリシーAVAIL01の中のRESET
TIMEキーワードに指定されている時間である)BA
CKUP1にPRIMARYのワークロードの引継ぎを
実行させようとする。一方、BACKUP1システムの
方に故障が発生した場合には(この故障の発生は、導入
処理によってパラメータ・ライブラリの中に指定された
故障検出期間の経過後に検出される)、導入処理は更に
10秒間待った後に(この10秒間というのは、AVA
IL01の中のRESETTIMEキーワードに指定さ
れている時間である)PRIMARYにBACKUP1
のリセットを行なわせようとする。ここで、BACKU
P1のリセットを行なわせるのは、PRIMARYにバ
ックログが発生するのを防止するためである。
【0064】PRIMARYとBACKUP1との双方
のシステムにおいてポリシーを活動化するために、ユー
ザの導入処理においては、下記のオペレータ・コマンド
が発生される。 SETAVAIL ̄POLICY,ACTIVATE=AVAIL01
【0065】アベイラビリティ・ポリシーAVAIL0
1の、パラメータ・ライブラリの中に含まれているメン
バは次のとおりである。 NOSTATUS(PRIMARY) RESETTIME(20) NOSTATUS(BACKUP1) RESETTIME(10)
【0066】上記内容のアベイラビリティ・ポリシーが
設定されているときに、PRIMARYシステムが待機
状態へ入ったならば、以下の一連の事象が発生する。 1.PRIMARYが待機状態へ入り、みずからのステ
ータス・フィールドの更新を止めてしまう。 2.故障検出期間(図17の1705)の経過後に、B
ACKUP1システムが、ステータス更新欠落事象の発
生を宣言する。 3.ステータス更新欠落事象の発生がBACKUP1に
おいて検出されたことによって、ポリシー活動化タスク
が現在ポリシーの処理を開始し、この現在ポリシーに
は、このステータス更新欠落状態が20秒間解消せずに
続いたならばシステム・リセットを実行すべき旨指定さ
れている。 4.20秒が経過したならば、BACKUP1がPRI
MARYのステータスをチェックして、ステータス更新
が再開されていないことを知る。すると、BACKUP
1上のポリシー活動化タスクが、PRIMARYを区画
間システム・リセットするよう求める要求を発生する。 5.このシステム・リセットが正常終了したならば、そ
れに続いて、BACKUP1上のMVSが、システム消
滅(SYSGONE)通知をシスプレックス内の全ての
システムへ向けてトリガして、PRIMARYシステム
がもはや共用資源のいずれをも使用していないことを表
示する。この時点で、PRIMARYは非活動状態とな
っており(1301A)、一方、BACKUP1は、通
常の処理を実行している(1302A)。ただし、それ
ら2つの論理区画の定め方は、以前のもの(1301と
1302)と変わっていない。 6.アプリケーションが、一般的な方法で、ワークロー
ドの引継ぎを実行する。
【0067】上に示した内容のアベイラビリティ・ポリ
シーが設定されているときに、BAACKUP1がステ
ータス更新欠落状態へはいった場合にも、同様の事象が
発生する。この場合、PRIMARYは、10秒後にB
ACKUP1のシステム・リセットを実行する。
【0068】『同一プロセッサ上のシステムを対象とし
た非活動化』同一プロセッサ上のシステムに対する非活
動化の具体例を示したのが、図14である。説明を簡明
にするために、この構成には、システムが2つしか含ま
れていないものとし、それらを夫々、PRIMARY
(1401)、及びBACKUP1(1402ないし1
402A)と呼ぶことにする。また、これら2つのシス
テムは、同じPR/SMマシンの中に存在しており、同
じシスプレックスの中に構成されているものとする。以
上において、PRIMARYに故障が発生したならば
(この故障の発生は指定されている故障検出期間の経過
後に検出される)、導入処理は更に5秒間待った後に
(この5秒間というのはAVAIL01の中のRESE
TTIMEキーワードに指定されている時間である)B
ACKUP1にPRIMARYのワークロードの引継ぎ
を実行させようとする。また、導入処理によって、BA
CKUP1においてポリシーを活動化するために、下記
のコマンドが起動される。 SETAVAIL ̄POLICY,ACTIVATE=
AVAIL01 この具体例においては、PRIMARYの中にはPOL
ICY(アベイラビリティ・ポリシー)の指定をしてお
く必要はない。ユーザがPRIMARYにも同じPOL
ICYを指定しておいても支障はないが、ただしそのP
OLICYは、PRIMARYが実行するいかなる動作
も規定はしない。
【0069】アベイラビリティ・ポリシーAVAIL0
1のパラメータ・ライブラリのメンバの内容は次のとお
りである。 NOSTATUS(PRIMARY) DEACTTIME(5) SYSGONE(PRIMARY) SYSTEM(BACKUP1) DEACTIVATE(PRIMARY) STORE(YES) ESTORE(YES)
【0070】この内容のアベイラビリティ・ポリシーが
設定されているときに、PRIMARYシステムが待機
状態へ入ったならば、以下の一連の事象が発生する。 1.PRIMARYが待機状態へ入り、みずからのステ
ータス・フィールドの更新を止めてしまう。 2.故障検出期間(導入処理によってパラメータ・ライ
ブラリの中に指定されている)の経過後に、BACKU
P1システムが、ステータス更新欠落事象の発生を宣言
する。 3.ステータス更新欠落事象の発生がBACKUP1に
おいて検出されたことによって、ポリシー活動化タスク
が現在ポリシーの処理を開始し、この現在ポリシーに
は、このステータス更新欠落状態が5秒間解消せずに続
いたならば、区画間非活動化を実行すべき旨指定されて
いる。 4.5秒が経過したならば、BACKUP1がPRIM
ARYのステータスをチェックして、ステータス更新が
再開されていないことを知る。すると、BACKUP1
上のポリシー活動化タスクが、PRIMARYを区画間
非活動化するよう求める要求を発生する。 5.この区画間非活動化が正常終了したならば、それに
続いて、BACKUP1上のMVSが、システム消滅
(SYSGONE)通知をこのシスプレックス内の全て
のシステムへ向けてトリガし、それによって、PRIM
ARYシステムがもはや共用資源のいずれも使用してい
ないということを表示する。このSYSGONE通知
は、機能の引継ぎが可能な状態になったことをマルチシ
ステム・アプリケーションに知らせるための、信号の役
割を果たすことになる。 6.このSYSGONE通知によって、ポリシーに関す
る更にもう1つの動作がトリガされる。特にこの場合で
は、BACKUP1上のポリシー活動化タスクが、区画
間非活動化を実行するよう求める要求を発生する。この
2回目の区間非活動化要求の起動の理由は、システム消
滅事象は、このシスプレックス内における別の動作の結
果として、発生することもあるからである。 7.これまでのステップにおける非活動化機能のいずれ
もが正常終了していたならば、ポリシー活動化タスク
が、このポリシーに従って、CONFIG ̄STOR,
ONLINEコマンドと、CONFIG ̄ESTOR,
ONLINEコマンドとを内部的に発生して、全ての記
憶機構をオンライン状態に構成するようにする。これが
実行されることによって、以前PRIMARYが使用し
ていた記憶機構を、BACKUP1が使用することがで
きるようになる。
【0071】『2つのマシンのセットアップ』2つのマ
シンのセットアップの具体例を示したのが、図15であ
る。この構成は、システムを3つ含んでおり、それらを
夫々、PRIMARY(1501ないし1501A)、
BACKUP、及びTESTと呼ぶことにする。PRI
MARYは、専用のCPCの上に置かれており、一方、
BACKUP(1503ないし1503A)とTEST
(1502)とは互いに同一のCPCの上に、PR/S
M論理区画として置かれている。PRIMARYとBA
CKUPとは同じシスプレックスに所属している。以上
において、PRIMARYに故障が発生した場合には
(この故障の発生は指定されている故障検出期間の経過
後に検出される)、そのワークロードがBACKUPへ
移転される。また、導入処理によって、BACKUPに
おいてポリシーを活動化するために下記のオペレータ・
コマンドが発生される。 SETAVAIL ̄POLICY,ACTIVATE=AVAIL01 この具体例においては、PRIMARYシステムとTE
STシステムとに関してはPOLICYの指定を行なわ
ない。
【0072】アベイラビリティ・ポリシーAVAIL0
1のパラメータ・ライブラリのメンバの内容は、例えば
次のとおりである。 SYSGONE(PRIMARY) SYSTEM(BACKUP) DEACTIVATE(ALL) STORE(YES) ESTORE(YES)
【0073】この内容のアベイラビリティ・ポリシーが
設定されているときに、PRIMARYシステムが待機
状態へ入ったならば、以下の一連の事象が発生する。 1.PRIMARYが待機状態へ入り、みずからのステ
ータス・フィールドの更新を止めてしまう。 2.故障検出期間の経過後に、BACKUPシステム
が、ステータス更新欠落事象の発生を宣言する。 3.ステータス更新欠落事象の発生がBACKUPにお
いて検出されたことによって、ポリシー活動化タスクが
現在ポリシーの処理を開始するが、それによっていかな
る動作も不要であることを発見する。 4.SCPが、オペレータに対して、PRIMARYの
故障を確認するよう求めるプロンプトを出す。 5.オペレータは、結局、PRIMARYシステムはダ
ウン(DOWN)したとの応答を返すことになる。 6.BACKUP上のMVSが、システム消滅(SYS
GONE)通知をこのシスプレックス内の全てのシステ
ムへ向けてトリガし、それによって、PRIMARYシ
ステムは、もはや共用資源のいずれも使用していないと
いうことを表示する。このSYSGONE通知は、機能
の引継ぎが可能な状態になったことをマルチシステム・
アプリケーションに知らせるための、信号の役割を果た
すことになる。 7.このSYSGONE通知によって、ポリシーに関す
る更にもう1つの動作がトリガされる。特にこの場合で
は、BACKUP上のポリシー活動化タスクが、このP
R/SMマシンの中の他の論理区画であって、しかもB
ACKUPシステムの論理区画のアドレッシング・レン
ジ内に位置している、全ての論理区画を対象とした、無
指定区画間非活動化を実行することになる。 8.この非活動化が正常終了したならば、ポリシー活動
化タスクが、このポリシーに従って、CONFIG ̄S
TOR,ONLINEコマンドと、CONFIG ̄ES
TOR,ONLINEコマンドとを内部的に発生して、
全ての記憶機構をオンライン状態にする。これが実行さ
れることによって、以前TESTシステムが使用してい
た記憶機構を、BACKUPが使用することができるよ
うになる(1503A)。
【0074】以上に本発明の具体的な実施例を開示した
が、当業者には理解されるように、本発明の概念並びに
範囲から逸脱することなく、これらの具体的実施例に対
して変更を加えることが可能である。
【図面の簡単な説明】
【図1】本発明の主要な諸機能の間の流れを示したブロ
ック図である。
【図2】本発明の初期化段階のフローチャートである。
【図3】本発明に採用した論理区画セキュリティ・フレ
ームを示す模式図である。
【図4】本発明のモニタ段階のフローチャートである。
【図5】本発明の分離段階のフローチャートである。
【図6】本発明の資源再構成段階のフローチャートであ
る。
【図7】本発明のワークロード引継ぎ処理のフローチャ
ートである。
【図8】区画間イネーブルメント機能のフローチャート
である。
【図9】区画間システム・リセット機能並びに区画間非
活動化機能のフローチャートである。
【図10】無指定区画間非活動化機能のフローチャート
である。
【図11】アベイラビリティ・ポリシーのシンタックス
を示した図である。
【図12】「活動」システムの中の処理ステップと「代
替」システムの中の処理ステップとを並べて図示した、
本発明における、活動システムからの引継ぎを代替シス
テムに実行させる際に実行される動作を示した図であ
る。
【図13】本発明を用いて同一プロセッサ上のシステム
のシステム・リセットを実行したときの「実行前」と
「実行後」の夫々の構成を示した図である。
【図14】本発明を用いて同一プロセッサ上のシステム
の非活動化を実行したときの「実行前」と「実行後」の
夫々の構成を示した図である。
【図15】本発明を用いて2つのマシンのセットアップ
を実行したときの「実行前」と「実行後」の夫々の構成
を示した図である。
【図16】SCCBのフォーマットを示した制御ブロッ
クの図である。
【図17】本発明に採用したシスプレックス・データ・
セットの主要部分のフォーマットを示した図である。
【図18】PR/SM機構の、本発明に関係した主要な
制御フィールドを示した図である。
【符号の説明】
11 初期化段階 12 モニタ段階 13 分離段階 14 資源再構成段階 15 ワークロード引継ぎ段階 76 シスプレックス・データ・セット 1001 サービス・コール制御ブロック(SCCB) 1601 機能コード 1602 応答コード 1603 ターゲット論理区画識別子 1604 許可コード 1701 シスプレックス・データ・セット 1702 システムID 1704 ステータス・フィールド 1705 故障検出期間 1802 ステータス・テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 デービッド・ブラッドレイ・ピーターセン アメリカ合衆国12590、ニューヨーク州 ワッピンガーズ・フォールズ、ヴァレー・ ロード 25番地 (72)発明者 イアン・ジョフレー・レディング イギリス国ハンプシャー、エスオー21・1 エヌダブリュー、ウィンチェスター、トゥ ワイフォード、ハイ・ストリート、ホー ム・ミード(番地なし) (72)発明者 スティーブン・ジョン・シュマント 東京都渋谷区上原2−22−6 ホーマッ ト・スワン 301

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つの物理プロセッサを備
    え、該少なくとも1つの物理プロセッサに少なくとも2
    つの論理区画を設けるようにし、且つ、それら論理区画
    の各々にその論理区画に関連した制御プログラムを収容
    できるようにした論理区画区分式データ処理装置の、区
    画間制御装置において、 a)前記少なくとも2つの論理区画のうちの第1論理区
    画の中の制御プロセスに、該少なくとも2つの論理区画
    のうちの第2論理区画に関する応答動作を開始すること
    の許可を与える、許可手段と、 b)トリガ事象と該トリガ事象に関連付けた1組の応答
    動作規定とから構成したポリシー規定手段であって、該
    1組の応答動作規定のうちの各々の応答動作規定が夫々
    制御プログラムを有し、且つ前記トリガ事象の発生時に
    開始すべき応答動作を指定しているようにした、前記ポ
    リシー規定手段と、 c)前記少なくとも2つの論理区画のうちの前記第1論
    理区画の中に設けたモニタ手段であって、該少なくとも
    2つの論理区画のうちのその他の論理区画のステータス
    をモニタして、該少なくとも2つの論理区画のうちのそ
    れらその他の論理区画のうちの1つの論理区画の中のト
    リガ事象を検出するための、前記モニタ手段と、 d)前記少なくとも1つの物理プロセッサの中に設け
    た、前記応答動作を開始させるためのハイパーバイザ手
    段と、 e)前記少なくとも2つの論理区画のうちの前記第1論
    理区画の中の前記制御プロセスから前記ハイパーバイザ
    手段へ、応答動作の実行要求を伝達するための伝達手段
    であって、この要求伝達を行なうのは、前記モニタ手段
    が前記したように前記トリガ事象を検出し、且つ、前記
    許可手段が前記したように前記制御プロセスに許可を与
    えているときであり、更に、この要求伝達において実行
    要求される応答動作は、前記トリガ事象を生じる側の制
    御プログラムに関連付けられている応答動作規定が指定
    している応答動作である、前記伝達手段と、を備えた区
    画間制御装置。
  2. 【請求項2】 前記許可手段が、 a)前記少なくとも2つの論理区画のうちの前記第1論
    理区画に、該少なくとも2つの論理区画のうちの前記第
    2論理区画に関する応答動作を開始することの許可を与
    える、セキュリティ・フレーム手段と、 b)前記少なくとも2つの論理区画のうちの前記その他
    の論理区画のうちの前記1つの論理区画の中の前記制御
    プログラムに設けられた区画間イネーブルメント手段で
    あって、当該制御プログラムを対象とした応答動作を開
    始することの許可を前記制御プロセスに与える、前記区
    画間イネーブルメント手段と、を備えていることを特徴
    とする請求項1の区画間制御装置。
  3. 【請求項3】 前記トリガ事象には、前記制御プログラ
    ムの故障という事象が含まれていることを特徴とする請
    求項2の区画間制御装置。
  4. 【請求項4】 前記1組の応答動作規定には、区画間非
    活動化動作と、区画間システム・リセット動作と、無指
    定非活動化動作とが含まれていることを特徴とする請求
    項3の区画間制御装置。
  5. 【請求項5】 前記1組の応答動作規定には更に、資源
    再構成動作が含まれていることを特徴とする請求項4の
    区画間制御装置。
  6. 【請求項6】 前記伝達手段が、SCCB(サービス・
    コール制御ブロック)インターフェースを有するサービ
    ス・コール論理プロセッサ機構を備えていることを特徴
    とする請求項5の区画間制御装置。
  7. 【請求項7】 少なくとも1つの物理プロセッサを備
    え、該少なくとも1つの物理プロセッサに少なくとも2
    つの論理区画を設けるようにし、且つ、それら論理区画
    の各々にその論理区画に関連した制御プログラムを収容
    できるようにした論理区画区分式データ処理装置の、区
    画間制御方法において、 a)前記少なくとも2つの論理区画のうちの第1論理区
    画の中の制御プロセスに、該少なくとも2つの論理区画
    のうちの第2論理区画に関する応答動作を開始すること
    の許可を与える、許可ステップと、 b)トリガ事象と該トリガ事象に関連付けた1組の応答
    動作規定とから構成したポリシーであって、該1組の応
    答動作規定のうちの各々の応答動作規定が夫々制御プロ
    グラムを有し、且つ前記トリガ事象の発生時に開始すべ
    き応答動作を指定しているようにした前記ポリシーを、
    初期化するステップと、 c)前記少なくとも2つの論理区画のうちの前記第1論
    理区画に、該少なくとも2つの論理区画のうちのその他
    の論理区画のステータスをモニタさせ、それによって、
    該少なくとも2つの論理区画のうちのそれらその他の論
    理区画のうちの1つの論理区画の中のトリガ事象を検出
    させるステップと、 d)前記少なくとも1つの物理プロセッサの中に設けた
    ハイパーバイザによって、前記応答動作を開始させるス
    テップと、 e)前記少なくとも2つの論理区画のうちの前記第1論
    理区画の中の前記制御プロセスから前記ハイパーバイザ
    へ、応答動作の実行要求を伝達する、伝達ステップであ
    って、この要求伝達を行なうのは、前記少なくとも2つ
    の論理区画のうちの前記第1論理区画が前記したように
    前記トリガ事象を検出し、且つ、前記制御プロセスに許
    可が与えられているときであり、更に、この要求伝達に
    おいて実行要求される応答動作は、前記トリガ事象を生
    じる側の制御プログラムに関連付けられている応答動作
    規定が指定している応答動作である、前記伝達ステップ
    と、を含んでいる区画間制御方法。
  8. 【請求項8】 前記許可ステップが、 a)セキュリティ・フレーム手段によって、前記少なく
    とも2つの論理区画のうちの前記第1論理区画に、該少
    なくとも2つの論理区画のうちの前記第2論理区画に関
    する応答動作を開始することの許可を与えるステップ
    と、 b)前記少なくとも2つの論理区画のうちの前記その他
    の論理区画のうちの前記1つの論理区画の中の前記制御
    プログラムに設けられた区画間イネーブルメント手段に
    よって、当該制御プログラムを対象とした応答動作を開
    始することの許可を前記制御プロセスに与えるステップ
    と、を含んでいることを特徴とする請求項7の区画間制
    御方法。
  9. 【請求項9】 前記トリガ事象が、前記制御プログラム
    の故障という事象を含んでいるようにしたことを特徴と
    する請求項8の区画間制御方法。
  10. 【請求項10】 前記1組の応答動作規定が、区画間非
    活動化動作と、区画間システム・リセット動作と、無指
    定非活動化動作とを含んでいるようにしたことを特徴と
    する請求項9の区画間制御方法。
  11. 【請求項11】 前記1組の応答動作規定が更に、資源
    再構成動作を含んでいるようにしたことを特徴とする請
    求項10の区画間制御方法。
  12. 【請求項12】 前記伝達ステップを、SCCB(サー
    ビス・コール制御ブロック)インターフェースを有する
    サービス・コール論理プロセッサ機構によって実行する
    ようにしたことを特徴とする請求項11の区画間制御方
    法。
JP3192231A 1990-08-31 1991-07-31 論理区画式データ処理装置における区画間制御のための装置及び方法 Expired - Lifetime JPH0831047B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US57634490A 1990-08-31 1990-08-31
US576344 1990-08-31

Publications (2)

Publication Number Publication Date
JPH05181823A true JPH05181823A (ja) 1993-07-23
JPH0831047B2 JPH0831047B2 (ja) 1996-03-27

Family

ID=24304049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3192231A Expired - Lifetime JPH0831047B2 (ja) 1990-08-31 1991-07-31 論理区画式データ処理装置における区画間制御のための装置及び方法

Country Status (4)

Country Link
US (1) US5345590A (ja)
EP (1) EP0472861B1 (ja)
JP (1) JPH0831047B2 (ja)
DE (1) DE69113181T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030363A (ja) * 2002-06-27 2004-01-29 Hitachi Ltd 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
JP2005327279A (ja) * 2004-05-11 2005-11-24 Internatl Business Mach Corp <Ibm> 仮想計算機をマイグレーションするためのシステム、方法、およびプログラム
JP2007115234A (ja) * 2005-10-17 2007-05-10 Hitachi Ltd クロスパーティションコマンドを認定する為の方法と装置
JP2008276788A (ja) * 2008-05-23 2008-11-13 Hitachi Ltd 仮想計算機システムの制御方法
JP2013534664A (ja) * 2010-06-23 2013-09-05 インターナショナル・ビジネス・マシーンズ・コーポレーション アダプタ・イベントに応答して実行されるアクションの通信を容易にするためのコンピュータ・システム、方法、およびコンピュータ・プログラム

Families Citing this family (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2086691C (en) * 1992-03-30 1997-04-08 David A. Elko Communicating messages between processors and a coupling facility
JPH0635732A (ja) * 1992-07-14 1994-02-10 Hitachi Ltd 記憶装置の領域割り当て方法
CA2100540A1 (en) * 1992-10-19 1994-04-20 Jonel George System and method for performing resource reconfiguration in a computer system
US5758157A (en) * 1992-12-31 1998-05-26 International Business Machines Corporation Method and system for providing service processor capability in a data processing by transmitting service processor requests between processing complexes
EP0610583A1 (en) * 1993-02-08 1994-08-17 International Business Machines Corporation Multizone relocation facility computer memory system
US5634072A (en) * 1993-11-01 1997-05-27 International Business Machines Corporation Method of managing resources in one or more coupling facilities coupled to one or more operating systems in one or more central programming complexes using a policy
US5819061A (en) * 1994-07-25 1998-10-06 International Business Machines Corporation Method and apparatus for dynamic storage reconfiguration in a partitioned environment
US5564040A (en) * 1994-11-08 1996-10-08 International Business Machines Corporation Method and apparatus for providing a server function in a logically partitioned hardware machine
US5978933A (en) * 1996-01-11 1999-11-02 Hewlett-Packard Company Generic fault tolerant platform
US5884084A (en) * 1996-10-31 1999-03-16 Intel Corporation Circuit and method for using early reset to prevent CMOS corruption with advanced power supplies
US6108667A (en) * 1997-03-28 2000-08-22 International Business Machines Corporation System of compressing a log stream using a scratch pad of logically deleted entries
US5920875A (en) * 1997-03-28 1999-07-06 International Business Machines Corporation Tail compression of a sparse log stream of a computer system
US5966708A (en) * 1997-03-28 1999-10-12 International Business Machines Tail compression of a log stream using a scratch pad of logically deleted entries
US5956735A (en) * 1997-03-28 1999-09-21 International Business Machines Corporation System of compressing the tail of a sparse log stream of a computer system
US6076095A (en) * 1997-03-28 2000-06-13 International Business Machines Corporation Method of one system of a multisystem environment taking over log entries owned by another system
US5999935A (en) * 1997-03-28 1999-12-07 International Business Machines Corporation Tail compression of a sparse log stream of a multisystem environment
US6125393A (en) * 1997-03-28 2000-09-26 International Business Machines Corporation System of compressing the tail of a sparse log stream of a multisystem environment
US5960205A (en) * 1997-10-30 1999-09-28 Lucent Technologies Inc. Upgrading the control of switching systems
US6681238B1 (en) 1998-03-24 2004-01-20 International Business Machines Corporation Method and system for providing a hardware machine function in a protected virtual machine
US6253224B1 (en) 1998-03-24 2001-06-26 International Business Machines Corporation Method and system for providing a hardware machine function in a protected virtual machine
US7013305B2 (en) 2001-10-01 2006-03-14 International Business Machines Corporation Managing the state of coupling facility structures, detecting by one or more systems coupled to the coupling facility, the suspended state of the duplexed command, detecting being independent of message exchange
US6467007B1 (en) 1999-05-19 2002-10-15 International Business Machines Corporation Processor reset generated via memory access interrupt
US6959291B1 (en) 1999-05-19 2005-10-25 International Business Machines Corporation Management of a concurrent use license in a logically-partitioned computer
US6279046B1 (en) * 1999-05-19 2001-08-21 International Business Machines Corporation Event-driven communications interface for logically-partitioned computer
US6681240B1 (en) 1999-05-19 2004-01-20 International Business Machines Corporation Apparatus and method for specifying maximum interactive performance in a logical partition of a computer system independently from the maximum interactive performance in other partitions
US6691146B1 (en) 1999-05-19 2004-02-10 International Business Machines Corporation Logical partition manager and method
FR2794876B1 (fr) * 1999-06-10 2001-11-02 Bull Sa Procede de reconfiguration d'un systeme de traitement de l'information sur detection de defaillance d'un composant
US6981155B1 (en) 1999-07-14 2005-12-27 Symantec Corporation System and method for computer security
WO2001006386A1 (en) 1999-07-14 2001-01-25 Recourse Technologies, Inc. System and method for dynamically changing a computer port or address
US7117532B1 (en) 1999-07-14 2006-10-03 Symantec Corporation System and method for generating fictitious content for a computer
US7203962B1 (en) 1999-08-30 2007-04-10 Symantec Corporation System and method for using timestamps to detect attacks
JP2001256066A (ja) * 2000-02-29 2001-09-21 Internatl Business Mach Corp <Ibm> コンピュータシステム、オペレーティングシステムの切り替えシステム、オペレーティングシステムの実装方法、オペレーティングシステムの切り替え方法、記憶媒体及びプログラム伝送装置
US6725317B1 (en) * 2000-04-29 2004-04-20 Hewlett-Packard Development Company, L.P. System and method for managing a computer system having a plurality of partitions
US6654906B1 (en) * 2000-06-08 2003-11-25 International Business Machines Corporation Recovery from instruction fetch errors in hypervisor code
US6658591B1 (en) * 2000-06-08 2003-12-02 International Business Machines Corporation Recovery from data fetch errors in hypervisor code
US6907533B2 (en) 2000-07-14 2005-06-14 Symantec Corporation System and method for computer security using multiple cages
GB0020488D0 (en) * 2000-08-18 2000-10-11 Hewlett Packard Co Trusted status rollback
US6751679B1 (en) * 2000-11-16 2004-06-15 International Business Machines Corporation Means of control bit protection in a logical partition environment
US6820207B2 (en) 2001-03-01 2004-11-16 International Business Machines Corporation Method for rebooting only a specific logical partition in a data processing system as per a request for reboot
US6665759B2 (en) 2001-03-01 2003-12-16 International Business Machines Corporation Method and apparatus to implement logical partitioning of PCI I/O slots
US6567897B2 (en) 2001-03-01 2003-05-20 International Business Machines Corporation Virtualized NVRAM access methods to provide NVRAM CHRP regions for logical partitions through hypervisor system calls
US6792514B2 (en) 2001-06-14 2004-09-14 International Business Machines Corporation Method, system and computer program product to stress and test logical partition isolation features
US7925894B2 (en) * 2001-07-25 2011-04-12 Seagate Technology Llc System and method for delivering versatile security, digital rights management, and privacy services
US7036020B2 (en) * 2001-07-25 2006-04-25 Antique Books, Inc Methods and systems for promoting security in a computer system employing attached storage devices
US6971002B2 (en) * 2001-08-09 2005-11-29 International Business Machines Corporation Method, system, and product for booting a partition using one of multiple, different firmware images without rebooting other partitions
US6883116B2 (en) * 2001-09-27 2005-04-19 International Business Machines Corporation Method and apparatus for verifying hardware implementation of a processor architecture in a logically partitioned data processing system
US6968473B2 (en) * 2001-11-15 2005-11-22 International Business Machines Corporation Method and apparatus for generating a virtual clock in a data processing system
US6898731B2 (en) * 2002-01-10 2005-05-24 International Business Machines Corporation System, method, and computer program product for preventing machine crashes due to hard errors in logically partitioned systems
FR2835630B1 (fr) * 2002-02-07 2004-03-26 Bull Sa Procede de mise a jour automatique d'un chemin d'acces au disque systeme d'un perimetre materiel de ressources informatiques, systeme pour executer ce procede et memoire utilisee dans ce systeme
FR2835629B1 (fr) * 2002-02-07 2005-01-28 Bull Sa Procede et systeme de gestion d'un journal personnel d'evenements propre a une activite d'exploitation executee sur un perimetre materiel de ressources informatiques et memoire mise en oeuvre dans ce systeme
JP4119162B2 (ja) * 2002-05-15 2008-07-16 株式会社日立製作所 多重化計算機システム、論理計算機の割当方法および論理計算機の割当プログラム
US20030236852A1 (en) * 2002-06-20 2003-12-25 International Business Machines Corporation Sharing network adapter among multiple logical partitions in a data processing system
US6729589B2 (en) * 2002-10-07 2004-05-04 Gizmonics, Inc. Kinematic mount
US20040158834A1 (en) * 2003-02-06 2004-08-12 International Business Machines Corporation Apparatus and method for dynamically allocating resources of a dead logical partition
US7290260B2 (en) * 2003-02-20 2007-10-30 International Business Machines Corporation Dynamic processor redistribution between partitions in a computing system
US20040202185A1 (en) * 2003-04-14 2004-10-14 International Business Machines Corporation Multiple virtual local area network support for shared network adapters
US7496915B2 (en) * 2003-04-24 2009-02-24 International Business Machines Corporation Dynamic switching of multithreaded processor between single threaded and simultaneous multithreaded modes
US7461080B1 (en) 2003-05-09 2008-12-02 Sun Microsystems, Inc. System logging within operating system partitions using log device nodes that are access points to a log driver
US20040226017A1 (en) * 2003-05-09 2004-11-11 Leonard Ozgur C. Mechanism for associating resource pools with operating system partitions
US8892878B2 (en) * 2003-05-09 2014-11-18 Oracle America, Inc. Fine-grained privileges in operating system partitions
US20050154910A1 (en) * 2004-01-12 2005-07-14 Shaw Mark E. Security measures in a partitionable computing system
US7178015B2 (en) * 2004-01-12 2007-02-13 Hewlett-Packard Development Company, L.P. Security measures in a partitionable computing system
US7392524B2 (en) * 2004-04-06 2008-06-24 International Business Machines Corporation Method, system, and storage medium for managing computer processing functions
US7657889B2 (en) * 2004-04-06 2010-02-02 International Business Machines Corporation Method, system, and storage medium for searching multiple queues for prioritized work elements
US7370240B2 (en) * 2004-04-29 2008-05-06 International Business Machines Corporation Method and apparatus for preserving trace data in a logical partitioned data processing system
US7496729B2 (en) * 2004-05-13 2009-02-24 International Business Machines Corporation Method and apparatus to eliminate interpartition covert storage channel and partition analysis
US7343521B2 (en) * 2004-05-28 2008-03-11 International Business Machines Corporation Method and apparatus to preserve trace data
US7343515B1 (en) * 2004-09-30 2008-03-11 Unisys Corporation System and method for performing error recovery in a data processing system having multiple processing partitions
US8181182B1 (en) 2004-11-16 2012-05-15 Oracle America, Inc. Resource allocation brokering in nested containers
DE102005053275B4 (de) 2004-11-25 2021-11-11 Fujitsu Technology Solutions Gmbh Hochverfügbares Computerverbundsystem
US20060123204A1 (en) * 2004-12-02 2006-06-08 International Business Machines Corporation Method and system for shared input/output adapter in logically partitioned data processing system
US20060123111A1 (en) * 2004-12-02 2006-06-08 Frank Dea Method, system and computer program product for transitioning network traffic between logical partitions in one or more data processing systems
US7937616B2 (en) 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
GB0515395D0 (en) * 2005-07-27 2005-08-31 Ibm A method or apparatus for determining the memory usage of a program
US7478272B2 (en) * 2005-09-30 2009-01-13 International Business Machines Corporation Replacing a failing physical processor
US7845008B2 (en) * 2005-12-07 2010-11-30 Lenovo (Singapore) Pte. Ltd. Virus scanner for journaling file system
US7904747B2 (en) * 2006-01-17 2011-03-08 International Business Machines Corporation Restoring data to a distributed storage node
US20070214233A1 (en) * 2006-03-07 2007-09-13 Daryl Cromer System and method for implementing a hypervisor for server emulation
US7814307B2 (en) 2006-03-16 2010-10-12 Microsoft Corporation Fast booting a computing device to a specialized experience
US8028166B2 (en) * 2006-04-25 2011-09-27 Seagate Technology Llc Versatile secure and non-secure messaging
US7539890B2 (en) * 2006-04-25 2009-05-26 Seagate Technology Llc Hybrid computer security clock
US8429724B2 (en) 2006-04-25 2013-04-23 Seagate Technology Llc Versatile access control system
US7870551B2 (en) * 2006-05-18 2011-01-11 International Business Machines Corporation Optimization of thread wake up for shared processor partitions
US7865895B2 (en) * 2006-05-18 2011-01-04 International Business Machines Corporation Heuristic based affinity dispatching for shared processor partition dispatching
US7653835B2 (en) * 2006-06-27 2010-01-26 Lenovo (Singapore) Pte. Ltd. Apparatus and methods for improved computer system error reporting and management
US7987464B2 (en) * 2006-07-25 2011-07-26 International Business Machines Corporation Logical partitioning and virtualization in a heterogeneous architecture
US7761738B2 (en) * 2006-09-07 2010-07-20 International Business Machines Corporation Establishing communications across virtual enclosure boundaries
US7877358B2 (en) * 2006-11-21 2011-01-25 Microsoft Corporation Replacing system hardware
US7934121B2 (en) * 2006-11-21 2011-04-26 Microsoft Corporation Transparent replacement of a system processor
US8473460B2 (en) * 2006-11-21 2013-06-25 Microsoft Corporation Driver model for replacing core system hardware
US8150870B1 (en) * 2006-12-22 2012-04-03 Amazon Technologies, Inc. Scalable partitioning in a multilayered data service framework
US8086906B2 (en) * 2007-02-15 2011-12-27 Microsoft Corporation Correlating hardware devices between local operating system and global management entity
US8352960B2 (en) * 2007-08-13 2013-01-08 International Business Machines Corporation Limiting receipt of unsolicited events by a logical partition in a data storage system
US8055733B2 (en) * 2007-10-17 2011-11-08 International Business Machines Corporation Method, apparatus, and computer program product for implementing importation and converging system definitions during planning phase for logical partition (LPAR) systems
US8195704B2 (en) * 2009-01-06 2012-06-05 International Business Machines Corporation Validation and correction in a distributed namespace
JP5515766B2 (ja) * 2010-01-20 2014-06-11 富士通株式会社 情報処理装置、情報処理装置のハードウェア設定方法及びそのプログラム
US8862832B1 (en) * 2010-03-29 2014-10-14 Emc Corporation Techniques for global memory management and request processing
CN102597972B (zh) 2010-05-24 2016-06-08 松下电器(美国)知识产权公司 虚拟计算机系统、区域管理方法
US8677374B2 (en) 2011-09-14 2014-03-18 International Business Machines Corporation Resource management in a virtualized environment
US9244826B2 (en) 2013-03-15 2016-01-26 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
US9043575B2 (en) * 2013-03-15 2015-05-26 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
US9189381B2 (en) * 2013-03-15 2015-11-17 International Business Machines Corporation Managing CPU resources for high availability micro-partitions
JP6175958B2 (ja) * 2013-07-26 2017-08-09 富士通株式会社 メモリダンプ方法及びプログラム、並びに、情報処理装置
US9959161B2 (en) * 2015-10-02 2018-05-01 International Business Machines Corporation Automated ticketing analytics

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62115547A (ja) * 1985-11-15 1987-05-27 Fujitsu Ltd 二重化システム・シミユレ−シヨン装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA821999B (en) * 1981-03-31 1983-05-25 British Telecomm Computor or processor control systems
DE3276598D1 (en) * 1982-12-07 1987-07-23 Ibm Deutschland Fail-safe data processing equipment
US4564903A (en) * 1983-10-05 1986-01-14 International Business Machines Corporation Partitioned multiprocessor programming system
US4823256A (en) * 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
US4937760A (en) * 1988-09-19 1990-06-26 International Business Machines Corporation Method for sharing common values implicitly among communicating generative objects

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62115547A (ja) * 1985-11-15 1987-05-27 Fujitsu Ltd 二重化システム・シミユレ−シヨン装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030363A (ja) * 2002-06-27 2004-01-29 Hitachi Ltd 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
JP2005327279A (ja) * 2004-05-11 2005-11-24 Internatl Business Mach Corp <Ibm> 仮想計算機をマイグレーションするためのシステム、方法、およびプログラム
JP2007115234A (ja) * 2005-10-17 2007-05-10 Hitachi Ltd クロスパーティションコマンドを認定する為の方法と装置
JP2008276788A (ja) * 2008-05-23 2008-11-13 Hitachi Ltd 仮想計算機システムの制御方法
JP4548514B2 (ja) * 2008-05-23 2010-09-22 株式会社日立製作所 仮想計算機システムの制御方法
JP2013534664A (ja) * 2010-06-23 2013-09-05 インターナショナル・ビジネス・マシーンズ・コーポレーション アダプタ・イベントに応答して実行されるアクションの通信を容易にするためのコンピュータ・システム、方法、およびコンピュータ・プログラム

Also Published As

Publication number Publication date
EP0472861A2 (en) 1992-03-04
DE69113181T2 (de) 1996-05-02
JPH0831047B2 (ja) 1996-03-27
EP0472861A3 (en) 1993-01-27
US5345590A (en) 1994-09-06
DE69113181D1 (de) 1995-10-26
EP0472861B1 (en) 1995-09-20

Similar Documents

Publication Publication Date Title
JPH05181823A (ja) 区画区分式プロセス環境における区画間制御のための方法及び装置
KR920003497B1 (ko) 억세스 손실 처리용 시스템 및 그 보호방법
US5805790A (en) Fault recovery method and apparatus
KR100612715B1 (ko) 입/출력 패브릭 내의 하드웨어 에러로부터의 자율 복구
JP2552651B2 (ja) 再構成可能なデュアル・プロセッサ・システム
US5437033A (en) System for recovery from a virtual machine monitor failure with a continuous guest dispatched to a nonguest mode
EP2095231B1 (en) Computer system and method of control thereof
US8132057B2 (en) Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair
US5386551A (en) Deferred resource recovery
US5416921A (en) Apparatus and accompanying method for use in a sysplex environment for performing escalated isolation of a sysplex component in the event of a failure
US20050102603A1 (en) In-service raid mirror reconfiguring
US7266815B2 (en) Automated control of a licensed internal code update on a storage controller
EP2518627B1 (en) Partial fault processing method in computer system
WO2016202364A1 (en) A method of live migration
US5615370A (en) Computer system with automatic degradation/initialization function
Le et al. Applying microreboot to system software
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
US7392420B2 (en) Automated error recovery of a licensed internal code update on a storage controller
JP2937857B2 (ja) 共通記憶装置のロックフラグ解除方式および方法
JP5321658B2 (ja) フェイルオーバ方法、およびその計算機システム。
Lee et al. Resolving automatic high availability operations and users commands to virtual machines on openstack
JPH0430245A (ja) マルチプロセッサ制御方式
JP2730209B2 (ja) 入出力制御方式
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JPH05158905A (ja) 分散処理機能を持つマイクロプロセッサ応用装置