JPH10283332A

JPH10283332A - ソフトウェア・アプリケーションの中断のない処理の実現方法

Info

Publication number: JPH10283332A
Application number: JP10077775A
Authority: JP
Inventors: D Lohrer Francis; フランシス・ディー・ローラー; Wendel Arendt James; ジェームズ・ウェンデル・アレント; Raymond Strong Hovey; ホヴェイ・レイモンド・ストロング
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-03-31
Filing date: 1998-03-25
Publication date: 1998-10-23
Also published as: JP2001109639A; JP3737686B2; US6038677A; TW510988B

Abstract

(57)【要約】【課題】高可用性クラスタ・ネットワーク構成中の資
源グループを定義する「自動」機構を提供すること。【解決手段】資源グループが「自動的に」生成される
と言われるのは、どの資源がある特定の資源グループに
入るかを定義することにシステム管理者が直接関わらな
いことが好ましいからである。そうではなくて、管理者
は単に、所与のアプリケーションをその時に実行してい
るコンピュータで故障が発生した場合に、そのアプリケ
ーションと並置しなければならない資源のセットを識別
するだけである。この場合、資源グループが、１組のコ
ロケーション「制約」または規則を使用して自動的に生
成される。第１のコロケーション制約は、所与のアプリ
ケーションについて任意のユーザ定義コロケーションを
実施することが好ましく、第２の制約は、同一の物理デ
ィスク上に常駐するディスク区画資源を並置する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は一般にフォールト・
トレラント・コンピュータ・ネットワークに関し、より
詳細には、これらのネットワーク中の資源のセットを、
それらが「グループ」として利用可能なままであって、
ソフトウェア・アプリケーションの中断のない処理が実
現されるように管理する技術に関する。

【０００２】

【従来の技術】ネットワーク中のある種のコンピュータ
資源をフォルト・トレラントとなるように冗長方式で実
施することは当技術分野で周知である。このような技術
の１つに、ネットワークの所与のノードおよびそれが関
連する資源（例えばそのプロセッサやディスク・ドライ
ブ）が基本的に「ミラー化」されて冗長性を確保する、
いわゆる「クラスタ」構成がある。「高可用性」クラス
タは通常、１対のノードＡおよびＢを含み、これらは同
時に活動作業の実行中であることができる。どちらかの
ノードで故障が発生した場合には、もう一方のノードが
故障したノードの作業の一部または全てを引き継ぐこと
ができる。完全冗長クラスタ構成は、ノード、データ、
およびネットワーク自体が可用性のために複製されるた
め、クラスタ構成内に故障点が１つも存在しない構成で
ある。

【０００３】クラスタ構成を管理するツールも当技術分
野で周知である。通常、クラスタは一般に「資源グルー
プ」と呼ばれる構成を使用して管理される。資源グルー
プは、アプリケーションやネットワーク・アドレスやデ
ィスクなど、主コンピュータで故障が発生した際にバッ
クアップ・コンピュータによって引き継がれることが期
待される、高可用性資源のセットである。これらの資源
は、調整のとれた形で一緒に同じバックアップ・システ
ムに移動させる必要があるので、「グループ」になって
いると言われる。換言すれば、資源グループ中の資源
は、常に同じコンピュータ上に「一緒に滞在する」また
は「集合する」必要がある。通常は、ユーザは資源グル
ープの内容を定義するよう求められる。しかし、このア
プローチでは重大な問題が生じる。ユーザによる資源グ
ループの管理に伴う１つの主な問題は、ユーザが特定の
資源グループのメンバシップを常に正しく定義している
とは限らないことである。全てのアプリケーションおよ
びそれらが関係する資源は、それらが何らかの資源を共
有する場合に同じ資源グループ中にあることが不可欠で
ある。例として、コンピュータ・ネットワークが、ＤＢ
／２^TMおよびＬｏｔｕｓＮｏｔｅｓ^(R)を実行するい
くつかのワークステーションを含むものと想定する。特
定のＩＰアドレスを異なる２つのコンピュータが引き継
ぐことはできないので、これらのプログラムは、同じＩ
Ｐアドレスを共有する場合、同じ資源グループ中にある
必要がある。それにはアプリケーション間の共有関係を
作成することが必要であるが、そのことをユーザが知ら
ない可能性がある。クラスタ構成自体が、資源グループ
を作成するユーザに分かりにくい何らかのタイプの人為
的共有を強制する時には、さらに微妙な問題がある。そ
の一例は、実施態様によって、単一のコンピュータしか
ディスクの制御権（およびアクセス権）を持つことがで
きないようにディスクの引継ぎが制限される場合であ
る。この例では、構成自体が、そのディスク上の全ての
区画をこのコンピュータしか引き継ぐことができないと
その結果、このディスク上に常駐する区画を使用するア
プリケーション間に「人為的共有」が存在する。このた
め、これらのアプリケーションは、それらが最初は何も
共有しているように見えなくても強制的に並置される。
資源グループを定義する管理者がこの要件に気付いてい
ない場合には、資源グループを定義する際に、正しい条
件下で引継ぎの障害が発生することになる。

【０００４】クラスタ構成中の様々な資源の保守では、
しばしばこの問題が大きくなる。例えば、どの区画がど
のディスクに適合するかをシステム管理者が再編成する
場合、または様々なアプリケーションで使用するＩＰア
ドレスを管理者が変更する場合には、このような処置
が、１つまたは複数の以前に定義した資源グループの内
容に影響を及ぼす可能性がある。いずれかの資源グルー
プが改変されていることが、これらの保守作業を実行す
る者には分からないこともある。しかし、適当な環境下
で、必要なときに重要資源が適当な資源グループ中にな
いこともあり、これは受け入れることができない。

【０００５】

【発明が解決しようとする課題】したがって、本発明の
主目的は、高可用性クラスタ・ネットワーク構成中の資
源グループを定義する「自動」機構を提供することであ
る。

【０００６】本発明の他の目的は、システム管理者が手
動で介入することなく、資源グループを生成し再構成す
ることである。

【０００７】本発明の他の目的は、クラスタ構成につい
ての資源グループの定義が妥当であり、ネットワークの
構成が変化するときにより容易かつ安全にそれらが保守
されるようにすることである。

【０００８】したがってより一般的な目的は、管理ツー
ルを提供して資源グループの定義をさらに容易にする、
高可用性クラスタ・ネットワーク構成を提供することで
ある。

【０００９】本発明の他の重要な目的は、高可用性クラ
スタ・ネットワーク構成でのシステム管理者の管理作業
を簡単にすることである。

【００１０】本発明の他の目的は、高可用性複数クラス
タ・コンピュータのネットワーク環境のサポートに関連
する保守コストを削減することである。

【００１１】本発明の他の一般的な目的および副産物
は、資源グループの形成および保守の改善により、消費
者のソフトウェア・アプリケーションの可用性をさらに
大きくすることである。

【００１２】

【課題を解決するための手段】本発明の上記その他の目
的は、クラスタ構成について資源グループを自動的に生
成し保守する機構によって実現される。本明細書におい
ては、資源グループが「自動的に」生成されると言われ
るのは、どの資源がある特定の資源グループに入るかを
定義することにシステム管理者が直接関わらないことが
好ましいからである。そうではなく、管理者は単に、所
与のアプリケーションをその時に実行しているコンピュ
ータで故障が発生した場合に、そのアプリケーションと
並置しなければならない資源のセットを識別するだけで
ある。この場合、本明細書に記載のシステム・ツール
は、１組のコロケーション「制約」または規則を使用し
て１つまたは複数の資源グループを自動的に生成する。
第１のコロケーション制約は、所与のアプリケーション
について任意のユーザ定義コロケーションを実施するこ
とが好ましく、第２の制約は、同一の物理ディスク上に
常駐するディスク区画資源を並置する。このようにして
生成された資源グループは効果的なフォールト・トレラ
ントな動作を確保し、容易に保守される。具体的に言う
と、クラスタ規模の資源の任意の再構成に応答して、こ
のツールはこの再構成が既存のいずれかの資源グループ
に影響を与えるかどうかを評価する。影響を与える場合
には、システム管理者に訂正処置をとるよう通知が行わ
れ、または自動的に訂正処置が実行される。

【００１３】本発明のより具体的なもう１つの態様によ
れば、コンピュータ・ネットワーク中のクラスタ規模の
資源を使用する方法も記載される。コンピュータ・ネッ
トワークは、完全にまたは少なくとも部分的に冗長なノ
ード、データ、およびネットワーク接続を有するクラス
タとして構成されることが好ましい。この方法は、資源
グループの生成から始まる。具体的に言えば、その処理
を中断なしにする複数のアプリケーションのそれぞれに
ついて、ユーザ（システム管理者など）は、このような
アプリケーションをその時に実行しているコンピュータ
で故障が発生した場合に、そのアプリケーションのそれ
ぞれと並置しなければならない資源のセットを識別す
る。次いで上記のようにコロケーション規則を使用し
て、システム管理者が直接入力を行うことなく１つまた
は複数の資源グループが生成される。各資源グループは
複数のアプリケーションおよびそれらが関係する資源
を、１つまたは複数含むことが好ましい。次いで、所与
の障害が発生した直後に、この方法は資源グループの資
源の制御権をバックアップ・コンピュータに移す。

【００１４】

【発明の実施の形態】次に図１を参照すると、ブロック
・ダイアグラムは本発明を実施する高可用性クラスタ構
成を示している。図１に示す構成は「完全冗長」になる
ようになされており、このことはこの構成内には障害点
が１つも存在しないことを意味する。完全冗長性は、ノ
ード、データ、およびネットワーク接続のそれぞれが可
用性のために複製されることを意味する。この目的のた
めに、図１の構成は、二重共有ＳＣＳＩバス１８および
１９を介して接続された二重ネットワーク１０および１
２、ノードＡおよびＢ、ならびに１対のミラー化ディス
ク１４および１６を含む。ノードＡは関連するディスク
記憶装置２０を有し、ノードＢは関連するディスク記憶
装置２２を有する。「相互引継ぎ」方式では、両ノード
ＡおよびＢはともに活動状態になり作業を行うことがで
きる。どちらかのノードで故障が発生した場合には、も
う一方のノードが故障したノード作業の一部または全て
を引き継ぐことができる。この方式では、故障したノー
ドは、回復した時にクラスタとして再統合することがで
き、次いで再結合ポリシーによって作業負荷の再分配が
決定される。別法として「待機」方式では、引継ぎまた
は冗長ノードは他の作業を行わず、専用となって主ノー
ドのジョブの実行に備えている。この使用モードでは、
専用の待機資源が必要になるという欠点があるが、待機
ノードがその引継ぎの役割に備えることが可能になると
いう利点もある。例えば、引継ぎアプリケーションが既
に始動していて、ディスクおよびネットワーク接続があ
る程度まで使用可能になっている可能性がある。これに
より、引継ぎ時間を短縮することができる。このように
準備ができていることは、時に待機ノードの「ウォーム
状態」と呼ばれる。真のフォールト・トレラント構成で
は、待機ノードはこのように準備され、時には「ホッ
ト」待機と呼ばれる。

【００１５】本発明によれば、各ノードは、ＡＩＸ（拡
張対話式エグゼクティブＶｅｒｓｉｏｎ４．１以上）
を実行するＩＢＭＲＩＳＣＳｙｓｔｅｍ／６０００
コンピュータ（縮小命令セットのいわゆるＲＩＳＣベー
スのワークステーション）や、ＷｉｎｄｏｗｓＮＴま
たはＯＳ／２^(R)オペレーティング・システムを実行す
るＩｎｔｅｌベースのプロセッサ・システムなどのコン
ピュータを含むことができる。このコンピュータは、マ
ネージメントおよび管理のためにグラフィカル・ユーザ
・インタフェース（ＧＵＩ）を含む。ＲＩＳＣベースの
コンピュータの様々なモデルは、ＩＢＭＣｏｒｐｏｒ
ａｔｉｏｎの多くの出版物、例えばＲＩＳＣＳｙｓｔ
ｅｍ／６０００，７０１３ａｎｄ７０１６ＰＯＷ
ＥＲｓｔａｔｉｏｎａｎｄＰＯＷＥＲｓｅｒｖｅｒ
ＨａｒｄｗａｒｅＴｅｃｈｎｉｃａｌＲｅｆｅｒ
ｅｎｃｅ、資料番号ＳＡ２３−２６４４−００などに記
載されている。ＡＩＸＯＳは、ＩＢＭから出版された
ＡＩＸＯｐｅｒａｔｉｎｇＳｙｓｔｅｍＴｅｃｈ
ｎｉｃａｌＲｅｆｅｒｅｎｃｅの初版（１９８５年１
１月）、およびその他の出版物に記載されている。上記
のプラットフォームが有用であるが、その他任意の適当
なハードウェア／オペレーティング・システムの組合せ
を使用することができる。したがって、例えば、適当な
代替マシンには下記のものが含まれる。Ｎｏｖｅｌｌ
ＵｎｉｘＷａｒｅ２．０を実行するＩＢＭ互換ＰＣ４
８６またはその上位機種、ＡＴ＆ＴＵＮＩＸＳＶＲ
４ＭＰ−ＲＡＳＲｅｌｅａｓｅ２．０２以上を実
行するＡＴ＆Ｔ３０００シリーズ、ＤＧ／ＵＸｖｅ
ｒｓｉｏｎ５．４Ｒ３．００以上を実行するＤａｔａ
ＧｅｎｅｒａｌＡＶｉｉＯＮシリーズ、ＨＰ／ＵＸ
９．００ないしＨＰ／ＵＸ９．０５を実行するＨＰ９
０００／７００および８００シリーズ、ＳＶＲ４ｖｅ
ｒｓｉｏｎＲ４０Ｖ４．２を実行するＭｏｔｏｒｏｌ
ａ８８Ｋシリーズ、Ｓｏｌａｒｉｓ２．３または
２．４を実行するＳｕｎＳＰＡＲＣシリーズ、あるい
はＳｕｎＯＳ４．１．２または４．１．３を実行するＳ
ｕｎＳＰＡＲＣシリーズ。

【００１６】本発明によれば、上記で論じたように複数
のクラスタ規模の「資源」がいわゆる「資源グループ」
を構成する。具体的にいえば、好ましい実施態様には、
３種の基本的な「資源」タイプ、すなわちアプリケーシ
ョン、ＩＰアドレス、およびディスク区画が含まれる。
その他の「タイプ」の資源をこれらの代用とする、また
はこれらとともに使用することも可能である。本発明に
おいては、資源はいわゆる「コロケーション」を介して
その他の資源と関連付けられる。コロケーション・リン
クはアプリケーション（それ自体が資源である）と別の
資源（例えばＩＰアドレスやディスク区画など）の間の
２進リンクである。図２は、アプリケーションＡ、Ｂ、
Ｃ、ＩＰアドレスＩＰ１およびＩＰ２、ならびにディス
ク区画Ｐ＿Ｆを有する例示的な資源グループを示す図で
ある。この図で識別される直線は、以下に記載する本発
明によれば、システム管理者が最初に指定したコロケー
ション要件を表す。図３はアプリケーションＤ、ＩＰア
ドレスＩＰ３、およびディスク区画Ｐ＿Ｇを含む別の例
示的な資源グループである。この場合も、直線はユーザ
が指定したコロケーション要件を表す。ただし、図２お
よび図３は、本発明に従って完全に「構成」されてはい
ない、例示的な資源グループを表すものであることを理
解されたい。

【００１７】この目的のために、本発明では、好ましく
は以下に述べる１対のコロケーション「制約」または規
則を実施することによって、資源から資源グループを
「自動的に構成する」。（ａ）並置された資源は同一の資源グループとなる。（ｂ）同一ディスク内の区画は同一の資源グループとな
る。規則（ａ）および（ｂ）は限定的なものではなく、１つ
または複数のその他の制約または規則を追加または代用
することもできる。したがって、例えば制約は、あるア
プリケーションがパフォーマンス考慮事項に基づいてグ
ループ中で保守されるように、「パフォーマンス」ベー
スにすることもできる。別のタイプの制約は、何らかの
ハードウェア依存性を実施することもできる、など。分
かるように、上記の規則（ａ）は、任意のユーザ定義コ
ロケーションが確実に実施されるようにする。上記のよ
うに図２または図３は、規則（ａ）のみが実施されてい
るかどうかを資源グループがどのようにして調べるか示
す図である。

【００１８】図４は、コンピュータの表示画面に表示さ
れるユーザ・インタフェース・メニューを示す図であ
る。このメニューは、システム管理者がクラスタ規模の
資源を特定のアプリケーションに関連付けることができ
るように、複数のテキスト・ボックス、テキスト・フレ
ーム、およびテキスト制御を含んでいる。この特定の管
理画面のレイアウトは例示的なものにすぎない。動作に
際して、管理者は、Ａｐｐｌｉｃａｔｉｏｎ名フィール
ド３０にアプリケーション名（この場合は「ｗｅｂ＿ｓ
ｅｒｖｅｒ」）を入力する。「ＯｐｔｉｏｎａｌＣｏ
ｍｍｅｎｔ」フィールド３２にコメントを入力すること
もできる。管理者は、コマンド・フィールド３４および
３６に開始コマンドおよび停止コマンドを入力すること
ができる。本発明によれば、次いで管理者は、そのアプ
リケーションと並置しようとする１つまたは複数の資源
の識別を入力する。この動作は、それだけに限定される
のではないが、最初に管理者に、「ＡｌｌＡｐｐｌｉ
ｃａｔｉｏｎｓ」メニュー３８中のエントリを強調表示
させることによって実施することができる。このメニュ
ーは、管理しようとする全てのクラスタ・アプリケーシ
ョンを含む。ｗｅｂ＿ｓｅｒｖｅｒアプリケーションは
資源グループの一部分であるので、ユーザはこのエント
リをメニュー３８中で強調表示し、これを自動的にＡｐ
ｐｌｉｃａｔｉｏｎＣｏｌｌｏｃａｔｉｏｎメニュー
４０中に複写させる。別法として、行３０のアプリケー
ション・エントリをＣｏｌｌｏｃａｔｉｏｎメニュー４
０のデフォルト・エントリにすることもできる。同様に
して、ユーザは次いで、並置するためのＩＰアドレスを
「ＡｌｌＩＰＡｄｄｒｅｓｓｅｓ」メニュー４２か
ら、またディスク区画を「ＡｌｌＤｉｓｋＰａｒｔ
ｉｔｉｏｎｓ」メニュー４４から選択することができ
る。選択されたエントリは、次いで図のようにＣｏｌｌ
ｏｃａｔｉｏｎメニュー４０に複写される。このように
して、図４に示すように、システム管理者は、所与のア
プリケーションと並置しようとする資源を定義する。た
だし、管理者は、資源グループ自体を直接定義するわけ
ではない。

【００１９】次に図５を参照すると、ここでは自動的に
資源グループを生成する助けとするためにどのようにコ
ロケーション制約を使用するかが分かる。管理者は、図
４のインタフェース技術を使用して、上記で「ｗｅｂ＿
ｓｅｒｖｅｒ」とした第１アプリケーション「Ａｐｐ＿
１」に対するコロケーション要件を生成するものと想定
する。このアプリケーションは「ｄｕｃｋｈｏｒｎ」と
呼ばれるＩＰアドレス（ＩＰ１）、および「ｓｄ１＿
１」と呼ばれるディスク区画（ＤＰ＿Ｅ）を有する。ま
た、管理者は、ＩＰ２およびＤＰ＿Ｆを含む第２アプリ
ケーション「Ａｐｐ＿２」に対するコロケーション要件
を作成したものと想定する。ディスク区画ＥおよびＦが
図５に示すように同一の物理ディスク上にある場合に
は、上記で論じたコロケーション制約（ｂ）は、次に図
示の全ての資源を含む新規の資源グループの生成を強制
する。分かるように、アプリケーションＡｐｐ＿１およ
びＡｐｐ＿２は、それらが論理資源を共有しない場合で
も、強制的に同一の資源グループに入れられる。

【００２０】資源グループを自動的に形成するプロセス
について、以下にさらに詳細に説明する。このプロセス
では下記の定義を使用する。資源リスト（ＲＬ）：最初は全ての資源のセット。資源グループｎ（Ｒｇｎ）：資源グループｎを構成する
資源のセット。必要資源リスト（Ｒｑｄ）：資源グループ中に既存の何
らかの資源が必要とすることが分かった資源のセット。全体のプロセスは図６のフローチャートに示すようにし
て開始する。段階１００で、資源リストに全ての資源の
リストが記入される。次いでルーチンは段階１０２に進
み、次の資源グループ（Ｒｇｎ）を作成する。この方法
については下記で図７に関して説明する。段階１０２の
後、ルーチンは段階１０４で試験を行って、資源リスト
ＲＬ中に資源が残っているかどうかを判定する。段階１
０４の試験の結果が肯定であれば、ルーチンは段階１０
２に戻ってこれを繰り返す。これによって次の資源グル
ープが作成される。しかし、段階１０４の試験の結果が
否定であれば、資源リスト中に資源が残っていないこと
を意味し、したがってルーチンはブロック１０６で示す
ように終了する。

【００２１】次の資源グループを作成する段階（すなわ
ち図６の段階１０２）を、図７のフローチャートにさら
に詳細に図示する。このルーチンは、段階１０８で空の
次の資源グループＲｇｎのデータ構造を作成することか
ら開始する。段階１１０で、ルーチンは資源リストから
資源を取り出し、これをその資源グループの必要資源リ
ストＲｑｄに入れる。選択される資源はアプリケーショ
ン資源であることが好ましいが、これは必ずしも必要で
はない。段階１１４で、ルーチンは次いでＲｑｄリスト
から取り出した資源が必要とする資源を見つける。「必
要資源を見つける」と呼ばれるこのサブステップでは、
任意の資源が必要とする資源のサブツリーを見つける
が、これについては下記で図８に関してさらに詳細に説
明する。段階１１４の後、段階１１６で試験を行って、
Ｒｑｄリストがその時点で空であるかどうか、すなわち
そのリスト中の全てのエントリ処理済みであるかどうか
を判定する。段階１１６での試験の結果が否定であれ
ば、追加のエントリが依然としてＲｑｄリスト中に存在
し、したがってルーチンは分岐して段階１１４に戻り、
再循環する。しかし、段階１１６での試験の結果が肯定
であれば、Ｒｑｄリスト中にはそれ以上の追加エントリ
は存在せず、したがってルーチンは続行する。具体的に
いうと、必要とする側の資源を見つけるために段階１２
０が次いで実行される。この段階では、下記で図９に関
してさらに詳細に説明するように、この資源グループ中
のいずれかの資源を必要とする、資源グループ中の現在
知られている資源以外の任意の即時資源を見つける。段
階１２０の後、段階１２２で再度試験を行って、Ｒｑｄ
リストが空であるかどうか判定する。空でない場合に
は、ルーチンは再度分岐して段階１１２に戻り、再循環
する。しかし、段階１２２での試験の結果が、必要とす
る側の資源について処理するエントリがそれ以上のＲｑ
ｄリスト中に存在しないことを示す場合には、ブロック
１２４に示すようにルーチンは戻る。

【００２２】次に図８を参照すると、必要とする側の資
源を見つけるルーチンが示されている。上記のように、
このルーチンはいずれかの資源が必要とする資源のサブ
ツリーを見つける。好ましい実施の形態では、通常はア
プリケーション資源は全ての資源を必要とするので、ア
プリケーション資源のみを選び出すとこのプロセスは最
適化される。このルーチンは段階１２６で、Ｒｑｄリス
トから資源を取り出してこれをＲｇｎデータ構造に入れ
ることから開始する。このルーチンは段階１２８に進
み、必要とする任意の資源をＲｑｄリストに追加して、
資源リストからこれらを除去する。次いでルーチンは、
段階１３０でＲｑｄリストが空であるかどうか試験す
る。段階１３０での試験の結果が否定である、すなわち
処理を必要とするエントリがさらに存在する場合には、
ルーチンは段階１２６に戻って再循環する。しかし、段
階１３０での試験の結果が肯定であれば、全てのエント
リは処理済みであり、ブロック１３２に示すようにルー
チンは戻る。

【００２３】必要とする側の資源を見つけるルーチン
を、図９のフローチャートに示す。上記のように、この
ルーチンは、このグループ中のいずれかの資源を必要と
する、資源グループ中の現在知られている資源以外の任
意の即時資源を見つける。このルーチンは、所有および
交差ツリーまたは資源を反復して見つける。これは段階
１３４で、資源リストをチェック・リスト（Ｃｈｋ）デ
ータ構造に複写することから開始する。段階１３６で、
ルーチンはＣｈｋから資源を取り出す。次いで段階１３
８で試験を行って、その資源がＲｇｎ中のいずれかの資
源を必要とするかどうかを判定する。この段階で上述の
コロケーション制約を使用する。段階１３８での試験の
結果が肯定であれば、ルーチンは分岐して段階１４０に
進み、そこでルーチンはこの資源をＲｑｄに追加し、資
源リストからそれを除去する。しかし、段階１３８での
試験の結果が否定である場合、または段階１４０の後
で、ルーチンは段階１４２で、Ｃｈｋが空であるかどう
か、すなわちその中の全てのエントリが処理済みである
かどうかを調べる。段階１４２での試験の結果が否定で
あれば、まだ他のエントリを分析しなければならず、し
たがってルーチンは段階１３６に戻って再循環する。し
かし、段階１４２での試験の結果が肯定であれば、ルー
チンはブロック１４４に示すように戻る。これで高水準
処理は完了する。

【００２４】本発明ではこのようにして資源グループの
自動生成を構想する。「自動生成」とは、本発明で、形
成される資源グループができる限り小さく、（コロケー
ション要件によって）並置する必要のある資源の各セッ
トが１つの資源グループ内に完全に含まれるという制約
を受けるような形で、各資源をある資源グループに計算
によって割り当てることを意味する。したがって、この
プロセスへの人間の関与は、コロケーション要件の指定
に限定されることが好ましい。

【００２５】上記のフローチャートは、「資源中心」方
式での自動資源グループ生成を実施するものであること
をさらに理解されたい。当業者なら、「コロケーション
中心」方式で資源グループの自動生成を実施することも
可能であることに気付くであろう。後者の場合、この実
施態様では、資源をループし、次いで関連するコロケー
ションおよび場合によっては関連するディスク区画をル
ープするのではなく、コロケーションを、かつ同じ複数
のディスク（ディスク・コロケーションと呼ばれること
もある）上に常駐するディスク区画のリストをループす
る。このようにして、コロケーション（ディスク・コロ
ケーションも含む）を処理してコロケーション中に挙げ
られる資源に資源グループ名を割り当てることによっ
て、資源グループを計算し保守することができる。

【００２６】下記の疑似コードは、コロケーション関係
を使用して資源グループの形成を最適化する、本発明に
従って実施される様々な方法を説明するものである。一
般に資源グループは、そのメンバ資源のそれぞれに同一
の名前を割り当てることによって形成される。新規のコ
ロケーションに応答して、第１グループの名前を第２グ
ループの全てのメンバに割り当てる（かつ資源グループ
の名前のリストから第２グループの名前を削除する）こ
とによって、資源グループをマージすることが必要にな
ることもある。コロケーションが除去されると、コロケ
ーションによって関係付けられたエレメントがメンバで
ある資源グループを再計算する必要がある。これを行う
最も簡単な方法は、その資源グループの全てのメンバに
新規の名前を割り当てて全てのコロケーションを再処理
し、必要に応じてグループをマージすることである。

【００２７】この第１命令セットは、新規のコロケーシ
ョン・リンク（Ａ、Ｂ）の追加に応答する。ｒｇａ＝Ａの資源グループ；ｒｇｂ＝Ｂの資源グループ；ｉｆ（ｒｇａ≠ｒｇｂ）Ｍｅｒｇｅ（ｒｇａ，ｒｇｂ）；ｉｆ（Ｂがディスク区画である）｛ｃ＝Ｂのディスク；ｄｐ＝Ｃの第１ディスク区画；ｒｇｃ＝ｄｐの資源グループ；ｉｆ（ｒｇａ≠ｒｇｃ）Ｍｅｒｇｅ（ｒｇａ，ｒｇｃ）；｝中括弧｛｝の間の論理は、２つの資源グループが同一物
理ディスク上の区画を共有するかどうかを判定する試験
である。共有する場合には、資源グループは図５に示す
ようにマージされる。

【００２８】以下の命令はコロケーション・リンク
（Ａ，Ｂ）の除去に応答する。ｒｇ＝Ａの資源グループ；Ｋ＝資源グループｒｇを有するアプリケーションのリスト；Ｌ＝資源グループｒｇを有する資源のリスト；ｆｏｒＬ中の各資源｛ｒｇのクローンを形成し、それをｒｅｓの資源グループとして割り当てる｝ｆｏｒＫ中の各アプリケーション｛Ｍ＝フォーム（ａｐｐ，^*）のコロケーションのリスト；Ｍ中の各コロケーションについて、｛コロケーションの追加（上記）に応答を適用｝Ｎ＝フォーム（^*，ａｐｐ）のコロケーションのリスト；ｆｏｒＮ中の各コロケーション｛コロケーションの追加（上記）に応答を適用｝｝上記において、資源グループのクローンは同じポリシー
およびユーザから与えられたコメントを有する別の資源
グループであることに留意されたい。

【００２９】上記で参照した「Ｍｅｒｇｅ（ｒｇａ，ｒ
ｇｂ）」サブルーチンは、ｒｇｂの全てのオカレンスを
ｒｇａで置き換え、資源グループｒｇｂを削除する効果
を有する。そのポリシーおよびコメントはその時点で失
われる。パフォーマンス上の理由から、何らかのアプリ
ケーションと並置されない全ての非アプリケーション資
源に、ＮＵＬＬ資源グループを割り当てることが望まし
いことがある。Ｍｅｒｇｅ（ｒｇａ，ｒｇｂ）を適用し
た時にｒｇｂがＮＵＬＬになる場合、これはｒｇａで置
き換えるだけでよい（大域置換は必要でない）。ＮＵＬ
Ｌは、Ｍｅｒｇｅへの引数として許されず、したがって
Ｍｅｒｇｅの呼出しの代わりに、適当な置換を実行しな
ければならない。以下の疑似コードは、やはりコロケー
ション関係を使用して資源グループの形成を最適化す
る、パフォーマンス最適化である。新規のコロケーショ
ン・リンク（Ａ，Ｂ）の追加に応答する。ｒｇａ＝Ａの資源グループ；ｒｇｂ＝Ｂの資源グループ；ｉｆ（ｒｇａ≠ｒｇｂ）｛ｉｆ（ｒｇｂ＝＝ＮＵＬＬ）Ｂの資源グループ＝ｒｇａ；ｅｌｓｅＭｅｒｇｅ（ｒｇａ，ｒｇｂ）；｝ｉｆ（Ｂがディスク区画である）｛Ｃ＝Ｂのディスク；ｄｐ＝Ｃの第１ディスク区画；ｒｇｃ＝ｄｐの資源グループ；ｉｆ（ｒｇａ≠ｒｇｃ）｛ｉｆ（ｒｇｃ＝＝ＮＵＬＬ）ｄｐの資源グループ＝ｒｇａ；ｅｌｓｅＭｅｒｇｅ（ｒｇａ，ｒｇｃ）；｝｝コロケーション・リンク（Ａ、Ｂ）の除去に応答する。ｒｇ＝Ａの資源グループ；Ｋ＝資源グループｒｇを有するアプリケーションのリスト；ｆｏｒＫ中の各アプリケーション｛ｒｇのクローンを形成し、それをアプリケーションの資源グループとして割り当てる；｝ｆｏｒＫ中の各アプリケーション｛Ｍ＝フォーム（ａｐｐ，^*）のコロケーションのリスト；ｆｏｒＭ中の各コロケーション｛コロケーションの追加（上記）に応答を適用｝Ｎ＝フォーム（^*，ａｐｐ）のコロケーションのリスト：ｆｏｒＮ中の各コロケーション｛コロケーションの追加（上記）に応答を適用｝｝

【００３０】図１０は、本発明による、クラスタ規模の
資源を使用してソフトウェア・アプリケーションの中断
のない処理を実現する方法を示す簡略化したフローチャ
ートである。段階１５０で、最初に試験を行って、ユー
ザによる全てのコロケーション指定がアプリケーション
に対してなされているかどうかを判定する。段階１５０
での試験の結果が否定であれば、ルーチンは段階１５２
に進む。この段階で、所与のアプリケーションについ
て、ユーザは、並置しなければならないネットワーク資
源のセットを識別する。ルーチンは次いで段階１５４戻
り、資源グループを自動的に生成する。段階１５６で試
験を行って、ネットワーク中でアプリケーションに影響
を及ぼす障害イベントが発生したかどうか判定する。段
階１５６での試験の結果が否定であれば、ルーチンは循
環する。しかし、段階１５６での試験の結果が肯定であ
れば、ルーチンは段階１５８に進み、資源グループの資
源の制御権をバックアップ・コンピュータに移す。

【００３１】本発明はこのようにして、ＡＩＸオペレー
ティング・システム環境用のＨＡ／ＣＭＰなどの従来技
術のクラスタ構成に関するいくつかの問題を解決する。
本発明によれば、システム管理者は一般に、資源グルー
プの内容を直接定義することを禁止される。そうではな
く、ユーザは単に、各アプリケーションについて、その
アプリケーションと「並置」しなければならないと分か
っている他の資源（ＩＰアドレス、区画、その他のアプ
リケーション）をシステムに（従来のＧＵＩを使用し
て）告げるだけである。したがってユーザはアプリケー
ションにのみ集中すればよいか、これは資源グループと
いうより抽象的な概念よりもユーザには理解しやすいと
予想される。クラスタ構成ルーチンは、全てのアプリケ
ーション定義における直接および間接の（人為的）資源
共有を検査し、それらのアプリケーションと、何らかの
タイプの依存性（実施態様により定義されるものも含
む）を有するそれらが関係する資源とからなる資源グル
ープを自動的に形成する。したがってこの動作は、全て
の資源のコロケーション依存性の遷移的閉止を実施す
る。ユーザが後で何らかの再構成（例えばＩＰアドレス
や、ディスク／区画内容、コロケーション要件の変更な
ど）を行う場合には、本発明は資源グループへの影響を
評価し、その影響をユーザに通知し、クラスタを保守す
るために何を行わなければならないかを管理者に指令す
ることができる。したがって、例えば、管理者に、「Yo
u no longer need to have DB/2 and Lotus Notes in t
he same resource group. Do you want to let them be
in their own groups now?」などのメッセージ照会が
与えられる。その応答によって、本発明は影響を受ける
資源グループを再構成する。

【００３２】本発明の１つの好ましい実施態様は、コン
ピュータのランダム・アクセス・メモリに常駐のコード
・モジュール中の命令のセット（プログラム・コード）
である。コンピュータが必要とするまで、この命令セッ
トは別のコンピュータ・メモリ、例えばハード・ディス
ク・ドライブ、または光ディスク（最終的にはＣＤＲＯ
Ｍで使用する）やフロッピー・ディスク（最終的にはフ
ロッピー・ディスク・ドライブで使用する）などの取外
し可能メモリに記憶する、あるいはインターネットその
他のコンピュータ・ネットワークを介してダウンロード
することができる。さらに、上記の様々な方法は、ソフ
トウェアによって選択的に活動化または再構成される汎
用コンピュータで都合良く実施されるが、当業者なら、
ハードウェア、ファームウェア、または必要とされる方
法の各段階を実行するように構築されたさらに専門化さ
れた装置で上記方法を実行できることにも気付くであろ
う。

【００３３】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００３４】（１）複数のノードを有するコンピュータ
・ネットワーク中でクラスタ規模の資源を使用して、ソ
フトウェア・アプリケーションの中断のない処理を実現
する方法であって、その処理を中断なしにする複数のア
プリケーションのそれぞれについて、そのアプリケーシ
ョンをその時点で実行しているコンピュータで故障が発
生した場合に、このようなアプリケーションのそれぞれ
と並置しなければならない資源のセットをユーザに識別
させる段階と、複数のアプリケーションおよびそれらが
関係する資源をそれぞれが１つまたは複数含む、１つま
たは複数の資源グループを自動的に生成する段階と、所
与のオカレンスに応じて、ある資源グループの資源の制
御権をバックアップ・コンピュータに移す段階とを含む
方法。（２）資源のセットが、アプリケーション、ＩＰアドレ
ス、およびディスク区画からなるグループから選択した
資源を含む、上記（１）に記載の方法。（３）１つまたは複数の資源グループを自動的に生成す
る段階が、資源グループができる限り小さくなり、並置
する必要がある資源の各セットが所与の資源グループ内
に完全に含まれるような所定の方式で各資源を１つの資
源グループに計算によって割り当てる、上記（１）に記
載の方法。（４）１つまたは複数の資源グループを自動的に生成す
る段階が、１組のコロケーション制約を実施する段階を
含む、上記（１）に記載の方法。（５）コロケーション制約が、所与のアプリケーション
についてのユーザ定義コロケーションを含む、上記
（４）に記載の方法。（６）コロケーション制約が、物理ディスク上に常駐す
るディスク区画資源を並置する、上記（４）に記載の方
法。（７）複数のノードを有するコンピュータ・ネットワー
ク中でクラスタ規模の資源を、ソフトウェア・アプリケ
ーションの中断のない処理が容易になるように構成する
方法であって、その処理を中断なしにする複数のアプリ
ケーションのそれぞれについて、そのアプリケーション
をその時点で実行しているコンピュータで故障が発生し
た場合に、このようなアプリケーションのそれぞれと並
置しなければならない資源のセットをユーザに識別させ
る段階と、複数のアプリケーションおよびそれらが関係
する資源をそれぞれが１つまたは複数含む、１つまたは
複数の資源グループを自動的に生成する段階とを含む方
法。（８）資源のセットが、アプリケーション、ＩＰアドレ
ス、およびディスク区画からなるグループから選択した
資源を含む、上記（７）に記載の方法。（９）１つまたは複数の資源グループを自動的に生成す
る段階が、１組のコロケーション制約を実施する段階を
含む、上記（７）に記載の方法。（１０）コロケーション制約が、所与のアプリケーショ
ンについてのユーザ定義コロケーションを含む、上記
（９）に記載の方法。（１１）コロケーション制約が、物理ディスク上に常駐
するディスク区画資源を並置する、上記（９）に記載の
方法。（１２）複数のノードを有するコンピュータ・ネットワ
ーク中でクラスタ規模の資源を、ソフトウェア・アプリ
ケーションの中断のない処理が容易になるように管理す
る方法であって、その処理を中断なしにする複数のアプ
リケーションのそれぞれについて、そのアプリケーショ
ンをその時点で実行しているコンピュータで故障が発生
した場合に、このようなアプリケーションのそれぞれと
並置しなければならない資源のセットをユーザに識別さ
せる段階と、複数のアプリケーションおよびそれらが関
係する資源をそれぞれが１つまたは複数含む、１つまた
は複数の資源グループを自動的に生成する段階と、クラ
スタ規模の資源の任意の再構成に応答して、その再構成
がいずれかの資源グループに影響を及ぼすかどうかを評
価する段階と、その再構成がいずれかの資源グループに
影響を及ぼす場合に、ユーザに通知する段階とを含む方
法。（１３）通知する段階が、資源グループがどのように影
響を受けるかを示す情報をユーザに提供する、上記（１
２）に記載の方法。（１４）資源のセットが、アプリケーション、ＩＰアド
レス、およびディスク区画からなるグループから選択し
た資源を含む、上記（１２）に記載の方法。（１５）コンピュータ・ネットワーク中のクラスタ規模
の資源を管理するためにデータ処理システム中で使用す
る、コンピュータ可読媒体中のコンピュータ・プログラ
ム製品であって、ユーザ入力に応答して、アプリケーシ
ョンをその時点で実行しているコンピュータで故障が発
生した場合に、そのアプリケーションと並置しなければ
ならない資源のセットを識別する第１プログラム・デー
タ手段と、ユーザ入力および１組のコロケーション制約
に応答して、１つまたは複数の資源グループを生成する
第２プログラム・データ手段とを含む製品。（１６）第２プログラム・データ手段が、所与のアプリ
ケーションについてのユーザ定義コロケーションを実施
する、コンピュータ・プログラム製品。（１７）第２プログラム・データ手段が、物理ディスク
上に常駐するディスク区画資源を並置する、コンピュー
タ・プログラム製品（１８）主コンピュータおよびバックアップ・コンピュ
ータを有するコンピュータ・ネットワークにおいて、ク
ラスタ規模の資源を使用して、ソフトウェア・アプリケ
ーションの中断のない処理を実現する方法であって、そ
の処理を中断なしにする複数のアプリケーションのそれ
ぞれについて、主コンピュータで故障が発生した場合
に、このようなアプリケーションのそれぞれと並置しな
ければならない資源のセットをユーザに識別させる段階
と、複数のアプリケーションおよびそれらが関係する資
源をそれぞれが１つまたは複数含む、１つまたは複数の
資源グループを自動的に生成する段階と、主コンピュー
タでの所与のオカレンスに応じて、資源グループの資源
の制御権をバックアップ・コンピュータに移す段階とを
含む方法。

【図面の簡単な説明】

【図１】本発明をその中で実施する代表的な高可用性ク
ラスタ構成を示す図である。

【図２】ユーザのコロケーション要件によって確立され
る代表的な資源グループを示すブロック・ダイアグラム
である。

【図３】ユーザのコロケーション要件によって確立され
る代表的な資源グループを示すブロック・ダイアグラム
である。

【図４】特定のアプリケーションに関連する資源のコロ
ケーションを定義するためにシステム管理者が使用す
る、代表的なユーザ・インタフェースの一部分を示す図
である。

【図５】２つのユーザ定義コロケーションが同一ディス
ク上のディスク区画に含まれる結果としての、資源グル
ープの形成を示すブロック・ダイアグラムである。

【図６】本発明による資源グループの自動形成手順を示
すフローチャートである。

【図７】図６のフローチャートの「次の資源グループを
作成する」サブルーチンを示すフローチャートである。

【図８】図７のフローチャートの「必要とされる資源を
見つける」サブルーチンを示すフローチャートである。

【図９】図７のフローチャートの「必要とする側の資源
を見つける」サブルーチンを示すフローチャートであ
る。

【図１０】本発明による、資源グループ中のクラスタ資
源をバックアップ・コンピュータに移す方法を示すフロ
ーチャートである。

【符号の説明】

１０二重ネットワーク１２二重共有ＳＣＳＩバス１４ミラー化ディスク１６ミラー化ディスク１８二重共有ＳＣＳＩバス１９二重共有ＳＣＳＩバス２０ディスク記憶装置２２ディスク記憶装置

フロントページの続き (72)発明者ジェームズ・ウェンデル・アレントアメリカ合衆国78681 テキサス州ラウンドロックブラックジャック・ドライブ 1501 (72)発明者ホヴェイ・レイモンド・ストロングアメリカ合衆国95120 カリフォルニア州サンノゼマーリントン・コート 975

Claims

【特許請求の範囲】

【請求項１】複数のノードを有するコンピュータ・ネッ
トワーク中でクラスタ規模の資源を使用して、ソフトウ
ェア・アプリケーションの中断のない処理を実現する方
法であって、その処理を中断なしにする複数のアプリケーションのそ
れぞれについて、そのアプリケーションをその時点で実
行しているコンピュータで故障が発生した場合に、この
ようなアプリケーションのそれぞれと並置しなければな
らない資源のセットをユーザに識別させる段階と、複数のアプリケーションおよびそれらが関係する資源を
それぞれが１つまたは複数含む、１つまたは複数の資源
グループを自動的に生成する段階と、所与のオカレンスに応じて、ある資源グループの資源の
制御権をバックアップ・コンピュータに移す段階とを含
む方法。
【請求項２】資源のセットが、アプリケーション、ＩＰ
アドレス、およびディスク区画からなるグループから選
択した資源を含む、請求項１に記載の方法。
【請求項３】１つまたは複数の資源グループを自動的に
生成する段階が、資源グループができる限り小さくな
り、並置する必要がある資源の各セットが所与の資源グ
ループ内に完全に含まれるような所定の方式で各資源を
１つの資源グループに計算によって割り当てる、請求項
１に記載の方法。
【請求項４】１つまたは複数の資源グループを自動的に
生成する段階が、１組のコロケーション制約を実施する
段階を含む、請求項１に記載の方法。
【請求項５】コロケーション制約が、所与のアプリケー
ションについてのユーザ定義コロケーションを含む、請
求項４に記載の方法。
【請求項６】コロケーション制約が、物理ディスク上に
常駐するディスク区画資源を並置する、請求項４に記載
の方法。
【請求項７】複数のノードを有するコンピュータ・ネッ
トワーク中でクラスタ規模の資源を、ソフトウェア・ア
プリケーションの中断のない処理が容易になるように構
成する方法であって、その処理を中断なしにする複数のアプリケーションのそ
れぞれについて、そのアプリケーションをその時点で実
行しているコンピュータで故障が発生した場合に、この
ようなアプリケーションのそれぞれと並置しなければな
らない資源のセットをユーザに識別させる段階と、複数のアプリケーションおよびそれらが関係する資源を
それぞれが１つまたは複数含む、１つまたは複数の資源
グループを自動的に生成する段階とを含む方法。
【請求項８】資源のセットが、アプリケーション、ＩＰ
アドレス、およびディスク区画からなるグループから選
択した資源を含む、請求項７に記載の方法。
【請求項９】１つまたは複数の資源グループを自動的に
生成する段階が、１組のコロケーション制約を実施する
段階を含む、請求項７に記載の方法。
【請求項１０】コロケーション制約が、所与のアプリケ
ーションについてのユーザ定義コロケーションを含む、
請求項９に記載の方法。
【請求項１１】コロケーション制約が、物理ディスク上
に常駐するディスク区画資源を並置する、請求項９に記
載の方法。
【請求項１２】複数のノードを有するコンピュータ・ネ
ットワーク中でクラスタ規模の資源を、ソフトウェア・
アプリケーションの中断のない処理が容易になるように
管理する方法であって、その処理を中断なしにする複数のアプリケーションのそ
れぞれについて、そのアプリケーションをその時点で実
行しているコンピュータで故障が発生した場合に、この
ようなアプリケーションのそれぞれと並置しなければな
らない資源のセットをユーザに識別させる段階と、複数のアプリケーションおよびそれらが関係する資源を
それぞれが１つまたは複数含む、１つまたは複数の資源
グループを自動的に生成する段階と、クラスタ規模の資源の任意の再構成に応答して、その再
構成がいずれかの資源グループに影響を及ぼすかどうか
を評価する段階と、その再構成がいずれかの資源グループに影響を及ぼす場
合に、ユーザに通知する段階とを含む方法。
【請求項１３】通知する段階が、資源グループがどのよ
うに影響を受けるかを示す情報をユーザに提供する、請
求項１２に記載の方法。
【請求項１４】資源のセットが、アプリケーション、Ｉ
Ｐアドレス、およびディスク区画からなるグループから
選択した資源を含む、請求項１２に記載の方法。
【請求項１５】主コンピュータおよびバックアップ・コ
ンピュータを有するコンピュータ・ネットワークにおい
て、クラスタ規模の資源を使用して、ソフトウェア・ア
プリケーションの中断のない処理を実現する方法であっ
て、その処理を中断なしにする複数のアプリケーションのそ
れぞれについて、主コンピュータで故障が発生した場合
に、このようなアプリケーションのそれぞれと並置しな
ければならない資源のセットをユーザに識別させる段階
と、複数のアプリケーションおよびそれらが関係する資源を
それぞれが１つまたは複数含む、１つまたは複数の資源
グループを自動的に生成する段階と、主コンピュータでの所与のオカレンスに応じて、資源グ
ループの資源の制御権をバックアップ・コンピュータに
移す段階とを含む方法。