JPH10283332A - ソフトウェア・アプリケーションの中断のない処理の実現方法 - Google Patents

ソフトウェア・アプリケーションの中断のない処理の実現方法

Info

Publication number
JPH10283332A
JPH10283332A JP10077775A JP7777598A JPH10283332A JP H10283332 A JPH10283332 A JP H10283332A JP 10077775 A JP10077775 A JP 10077775A JP 7777598 A JP7777598 A JP 7777598A JP H10283332 A JPH10283332 A JP H10283332A
Authority
JP
Japan
Prior art keywords
resources
resource
application
applications
resource group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10077775A
Other languages
English (en)
Inventor
D Lohrer Francis
フランシス・ディー・ローラー
Wendel Arendt James
ジェームズ・ウェンデル・アレント
Raymond Strong Hovey
ホヴェイ・レイモンド・ストロング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH10283332A publication Critical patent/JPH10283332A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 高可用性クラスタ・ネットワーク構成中の資
源グループを定義する「自動」機構を提供すること。 【解決手段】 資源グループが「自動的に」生成される
と言われるのは、どの資源がある特定の資源グループに
入るかを定義することにシステム管理者が直接関わらな
いことが好ましいからである。そうではなくて、管理者
は単に、所与のアプリケーションをその時に実行してい
るコンピュータで故障が発生した場合に、そのアプリケ
ーションと並置しなければならない資源のセットを識別
するだけである。この場合、資源グループが、1組のコ
ロケーション「制約」または規則を使用して自動的に生
成される。第1のコロケーション制約は、所与のアプリ
ケーションについて任意のユーザ定義コロケーションを
実施することが好ましく、第2の制約は、同一の物理デ
ィスク上に常駐するディスク区画資源を並置する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般にフォールト・
トレラント・コンピュータ・ネットワークに関し、より
詳細には、これらのネットワーク中の資源のセットを、
それらが「グループ」として利用可能なままであって、
ソフトウェア・アプリケーションの中断のない処理が実
現されるように管理する技術に関する。
【0002】
【従来の技術】ネットワーク中のある種のコンピュータ
資源をフォルト・トレラントとなるように冗長方式で実
施することは当技術分野で周知である。このような技術
の1つに、ネットワークの所与のノードおよびそれが関
連する資源(例えばそのプロセッサやディスク・ドライ
ブ)が基本的に「ミラー化」されて冗長性を確保する、
いわゆる「クラスタ」構成がある。「高可用性」クラス
タは通常、1対のノードAおよびBを含み、これらは同
時に活動作業の実行中であることができる。どちらかの
ノードで故障が発生した場合には、もう一方のノードが
故障したノードの作業の一部または全てを引き継ぐこと
ができる。完全冗長クラスタ構成は、ノード、データ、
およびネットワーク自体が可用性のために複製されるた
め、クラスタ構成内に故障点が1つも存在しない構成で
ある。
【0003】クラスタ構成を管理するツールも当技術分
野で周知である。通常、クラスタは一般に「資源グルー
プ」と呼ばれる構成を使用して管理される。資源グルー
プは、アプリケーションやネットワーク・アドレスやデ
ィスクなど、主コンピュータで故障が発生した際にバッ
クアップ・コンピュータによって引き継がれることが期
待される、高可用性資源のセットである。これらの資源
は、調整のとれた形で一緒に同じバックアップ・システ
ムに移動させる必要があるので、「グループ」になって
いると言われる。換言すれば、資源グループ中の資源
は、常に同じコンピュータ上に「一緒に滞在する」また
は「集合する」必要がある。通常は、ユーザは資源グル
ープの内容を定義するよう求められる。しかし、このア
プローチでは重大な問題が生じる。ユーザによる資源グ
ループの管理に伴う1つの主な問題は、ユーザが特定の
資源グループのメンバシップを常に正しく定義している
とは限らないことである。全てのアプリケーションおよ
びそれらが関係する資源は、それらが何らかの資源を共
有する場合に同じ資源グループ中にあることが不可欠で
ある。例として、コンピュータ・ネットワークが、DB
/2TMおよびLotus Notes(R)を実行するい
くつかのワークステーションを含むものと想定する。特
定のIPアドレスを異なる2つのコンピュータが引き継
ぐことはできないので、これらのプログラムは、同じI
Pアドレスを共有する場合、同じ資源グループ中にある
必要がある。それにはアプリケーション間の共有関係を
作成することが必要であるが、そのことをユーザが知ら
ない可能性がある。クラスタ構成自体が、資源グループ
を作成するユーザに分かりにくい何らかのタイプの人為
的共有を強制する時には、さらに微妙な問題がある。そ
の一例は、実施態様によって、単一のコンピュータしか
ディスクの制御権(およびアクセス権)を持つことがで
きないようにディスクの引継ぎが制限される場合であ
る。この例では、構成自体が、そのディスク上の全ての
区画をこのコンピュータしか引き継ぐことができないと
その結果、このディスク上に常駐する区画を使用するア
プリケーション間に「人為的共有」が存在する。このた
め、これらのアプリケーションは、それらが最初は何も
共有しているように見えなくても強制的に並置される。
資源グループを定義する管理者がこの要件に気付いてい
ない場合には、資源グループを定義する際に、正しい条
件下で引継ぎの障害が発生することになる。
【0004】クラスタ構成中の様々な資源の保守では、
しばしばこの問題が大きくなる。例えば、どの区画がど
のディスクに適合するかをシステム管理者が再編成する
場合、または様々なアプリケーションで使用するIPア
ドレスを管理者が変更する場合には、このような処置
が、1つまたは複数の以前に定義した資源グループの内
容に影響を及ぼす可能性がある。いずれかの資源グルー
プが改変されていることが、これらの保守作業を実行す
る者には分からないこともある。しかし、適当な環境下
で、必要なときに重要資源が適当な資源グループ中にな
いこともあり、これは受け入れることができない。
【0005】
【発明が解決しようとする課題】したがって、本発明の
主目的は、高可用性クラスタ・ネットワーク構成中の資
源グループを定義する「自動」機構を提供することであ
る。
【0006】本発明の他の目的は、システム管理者が手
動で介入することなく、資源グループを生成し再構成す
ることである。
【0007】本発明の他の目的は、クラスタ構成につい
ての資源グループの定義が妥当であり、ネットワークの
構成が変化するときにより容易かつ安全にそれらが保守
されるようにすることである。
【0008】したがってより一般的な目的は、管理ツー
ルを提供して資源グループの定義をさらに容易にする、
高可用性クラスタ・ネットワーク構成を提供することで
ある。
【0009】本発明の他の重要な目的は、高可用性クラ
スタ・ネットワーク構成でのシステム管理者の管理作業
を簡単にすることである。
【0010】本発明の他の目的は、高可用性複数クラス
タ・コンピュータのネットワーク環境のサポートに関連
する保守コストを削減することである。
【0011】本発明の他の一般的な目的および副産物
は、資源グループの形成および保守の改善により、消費
者のソフトウェア・アプリケーションの可用性をさらに
大きくすることである。
【0012】
【課題を解決するための手段】本発明の上記その他の目
的は、クラスタ構成について資源グループを自動的に生
成し保守する機構によって実現される。本明細書におい
ては、資源グループが「自動的に」生成されると言われ
るのは、どの資源がある特定の資源グループに入るかを
定義することにシステム管理者が直接関わらないことが
好ましいからである。そうではなく、管理者は単に、所
与のアプリケーションをその時に実行しているコンピュ
ータで故障が発生した場合に、そのアプリケーションと
並置しなければならない資源のセットを識別するだけで
ある。この場合、本明細書に記載のシステム・ツール
は、1組のコロケーション「制約」または規則を使用し
て1つまたは複数の資源グループを自動的に生成する。
第1のコロケーション制約は、所与のアプリケーション
について任意のユーザ定義コロケーションを実施するこ
とが好ましく、第2の制約は、同一の物理ディスク上に
常駐するディスク区画資源を並置する。このようにして
生成された資源グループは効果的なフォールト・トレラ
ントな動作を確保し、容易に保守される。具体的に言う
と、クラスタ規模の資源の任意の再構成に応答して、こ
のツールはこの再構成が既存のいずれかの資源グループ
に影響を与えるかどうかを評価する。影響を与える場合
には、システム管理者に訂正処置をとるよう通知が行わ
れ、または自動的に訂正処置が実行される。
【0013】本発明のより具体的なもう1つの態様によ
れば、コンピュータ・ネットワーク中のクラスタ規模の
資源を使用する方法も記載される。コンピュータ・ネッ
トワークは、完全にまたは少なくとも部分的に冗長なノ
ード、データ、およびネットワーク接続を有するクラス
タとして構成されることが好ましい。この方法は、資源
グループの生成から始まる。具体的に言えば、その処理
を中断なしにする複数のアプリケーションのそれぞれに
ついて、ユーザ(システム管理者など)は、このような
アプリケーションをその時に実行しているコンピュータ
で故障が発生した場合に、そのアプリケーションのそれ
ぞれと並置しなければならない資源のセットを識別す
る。次いで上記のようにコロケーション規則を使用し
て、システム管理者が直接入力を行うことなく1つまた
は複数の資源グループが生成される。各資源グループは
複数のアプリケーションおよびそれらが関係する資源
を、1つまたは複数含むことが好ましい。次いで、所与
の障害が発生した直後に、この方法は資源グループの資
源の制御権をバックアップ・コンピュータに移す。
【0014】
【発明の実施の形態】次に図1を参照すると、ブロック
・ダイアグラムは本発明を実施する高可用性クラスタ構
成を示している。図1に示す構成は「完全冗長」になる
ようになされており、このことはこの構成内には障害点
が1つも存在しないことを意味する。完全冗長性は、ノ
ード、データ、およびネットワーク接続のそれぞれが可
用性のために複製されることを意味する。この目的のた
めに、図1の構成は、二重共有SCSIバス18および
19を介して接続された二重ネットワーク10および1
2、ノードAおよびB、ならびに1対のミラー化ディス
ク14および16を含む。ノードAは関連するディスク
記憶装置20を有し、ノードBは関連するディスク記憶
装置22を有する。「相互引継ぎ」方式では、両ノード
AおよびBはともに活動状態になり作業を行うことがで
きる。どちらかのノードで故障が発生した場合には、も
う一方のノードが故障したノード作業の一部または全て
を引き継ぐことができる。この方式では、故障したノー
ドは、回復した時にクラスタとして再統合することがで
き、次いで再結合ポリシーによって作業負荷の再分配が
決定される。別法として「待機」方式では、引継ぎまた
は冗長ノードは他の作業を行わず、専用となって主ノー
ドのジョブの実行に備えている。この使用モードでは、
専用の待機資源が必要になるという欠点があるが、待機
ノードがその引継ぎの役割に備えることが可能になると
いう利点もある。例えば、引継ぎアプリケーションが既
に始動していて、ディスクおよびネットワーク接続があ
る程度まで使用可能になっている可能性がある。これに
より、引継ぎ時間を短縮することができる。このように
準備ができていることは、時に待機ノードの「ウォーム
状態」と呼ばれる。真のフォールト・トレラント構成で
は、待機ノードはこのように準備され、時には「ホッ
ト」待機と呼ばれる。
【0015】本発明によれば、各ノードは、AIX(拡
張対話式エグゼクティブVersion 4.1以上)
を実行するIBM RISC System/6000
コンピュータ(縮小命令セットのいわゆるRISCベー
スのワークステーション)や、Windows NTま
たはOS/2(R)オペレーティング・システムを実行す
るIntelベースのプロセッサ・システムなどのコン
ピュータを含むことができる。このコンピュータは、マ
ネージメントおよび管理のためにグラフィカル・ユーザ
・インタフェース(GUI)を含む。RISCベースの
コンピュータの様々なモデルは、IBM Corpor
ationの多くの出版物、例えばRISC Syst
em/6000,7013 and 7016 POW
ERstation and POWERserver
Hardware Technical Refer
ence、資料番号SA23−2644−00などに記
載されている。AIX OSは、IBMから出版された
AIX Operating System Tech
nical Referenceの初版(1985年1
1月)、およびその他の出版物に記載されている。上記
のプラットフォームが有用であるが、その他任意の適当
なハードウェア/オペレーティング・システムの組合せ
を使用することができる。したがって、例えば、適当な
代替マシンには下記のものが含まれる。Novell
UnixWare 2.0を実行するIBM互換PC4
86またはその上位機種、AT&T UNIX SVR
4 MP−RAS Release 2.02以上を実
行するAT&T 3000シリーズ、DG/UX ve
rsion 5.4R3.00以上を実行するData
General AViiONシリーズ、HP/UX
9.00ないしHP/UX 9.05を実行するHP9
000/700および800シリーズ、SVR4 ve
rsion R40V4.2を実行するMotorol
a 88Kシリーズ、Solaris 2.3または
2.4を実行するSun SPARCシリーズ、あるい
はSunOS4.1.2または4.1.3を実行するS
un SPARCシリーズ。
【0016】本発明によれば、上記で論じたように複数
のクラスタ規模の「資源」がいわゆる「資源グループ」
を構成する。具体的にいえば、好ましい実施態様には、
3種の基本的な「資源」タイプ、すなわちアプリケーシ
ョン、IPアドレス、およびディスク区画が含まれる。
その他の「タイプ」の資源をこれらの代用とする、また
はこれらとともに使用することも可能である。本発明に
おいては、資源はいわゆる「コロケーション」を介して
その他の資源と関連付けられる。コロケーション・リン
クはアプリケーション(それ自体が資源である)と別の
資源(例えばIPアドレスやディスク区画など)の間の
2進リンクである。図2は、アプリケーションA、B、
C、IPアドレスIP1およびIP2、ならびにディス
ク区画P_Fを有する例示的な資源グループを示す図で
ある。この図で識別される直線は、以下に記載する本発
明によれば、システム管理者が最初に指定したコロケー
ション要件を表す。図3はアプリケーションD、IPア
ドレスIP3、およびディスク区画P_Gを含む別の例
示的な資源グループである。この場合も、直線はユーザ
が指定したコロケーション要件を表す。ただし、図2お
よび図3は、本発明に従って完全に「構成」されてはい
ない、例示的な資源グループを表すものであることを理
解されたい。
【0017】この目的のために、本発明では、好ましく
は以下に述べる1対のコロケーション「制約」または規
則を実施することによって、資源から資源グループを
「自動的に構成する」。 (a)並置された資源は同一の資源グループとなる。 (b)同一ディスク内の区画は同一の資源グループとな
る。 規則(a)および(b)は限定的なものではなく、1つ
または複数のその他の制約または規則を追加または代用
することもできる。したがって、例えば制約は、あるア
プリケーションがパフォーマンス考慮事項に基づいてグ
ループ中で保守されるように、「パフォーマンス」ベー
スにすることもできる。別のタイプの制約は、何らかの
ハードウェア依存性を実施することもできる、など。分
かるように、上記の規則(a)は、任意のユーザ定義コ
ロケーションが確実に実施されるようにする。上記のよ
うに図2または図3は、規則(a)のみが実施されてい
るかどうかを資源グループがどのようにして調べるか示
す図である。
【0018】図4は、コンピュータの表示画面に表示さ
れるユーザ・インタフェース・メニューを示す図であ
る。このメニューは、システム管理者がクラスタ規模の
資源を特定のアプリケーションに関連付けることができ
るように、複数のテキスト・ボックス、テキスト・フレ
ーム、およびテキスト制御を含んでいる。この特定の管
理画面のレイアウトは例示的なものにすぎない。動作に
際して、管理者は、Application名フィール
ド30にアプリケーション名(この場合は「web_s
erver」)を入力する。「Optional Co
mment」フィールド32にコメントを入力すること
もできる。管理者は、コマンド・フィールド34および
36に開始コマンドおよび停止コマンドを入力すること
ができる。本発明によれば、次いで管理者は、そのアプ
リケーションと並置しようとする1つまたは複数の資源
の識別を入力する。この動作は、それだけに限定される
のではないが、最初に管理者に、「All Appli
cations」メニュー38中のエントリを強調表示
させることによって実施することができる。このメニュ
ーは、管理しようとする全てのクラスタ・アプリケーシ
ョンを含む。web_serverアプリケーションは
資源グループの一部分であるので、ユーザはこのエント
リをメニュー38中で強調表示し、これを自動的にAp
plication Collocationメニュー
40中に複写させる。別法として、行30のアプリケー
ション・エントリをCollocationメニュー4
0のデフォルト・エントリにすることもできる。同様に
して、ユーザは次いで、並置するためのIPアドレスを
「All IP Addresses」メニュー42か
ら、またディスク区画を「All Disk Part
itions」メニュー44から選択することができ
る。選択されたエントリは、次いで図のようにColl
ocationメニュー40に複写される。このように
して、図4に示すように、システム管理者は、所与のア
プリケーションと並置しようとする資源を定義する。た
だし、管理者は、資源グループ自体を直接定義するわけ
ではない。
【0019】次に図5を参照すると、ここでは自動的に
資源グループを生成する助けとするためにどのようにコ
ロケーション制約を使用するかが分かる。管理者は、図
4のインタフェース技術を使用して、上記で「web_
server」とした第1アプリケーション「App_
1」に対するコロケーション要件を生成するものと想定
する。このアプリケーションは「duckhorn」と
呼ばれるIPアドレス(IP1)、および「sd1_
1」と呼ばれるディスク区画(DP_E)を有する。ま
た、管理者は、IP2およびDP_Fを含む第2アプリ
ケーション「App_2」に対するコロケーション要件
を作成したものと想定する。ディスク区画EおよびFが
図5に示すように同一の物理ディスク上にある場合に
は、上記で論じたコロケーション制約(b)は、次に図
示の全ての資源を含む新規の資源グループの生成を強制
する。分かるように、アプリケーションApp_1およ
びApp_2は、それらが論理資源を共有しない場合で
も、強制的に同一の資源グループに入れられる。
【0020】資源グループを自動的に形成するプロセス
について、以下にさらに詳細に説明する。このプロセス
では下記の定義を使用する。 資源リスト(RL):最初は全ての資源のセット。 資源グループn(Rgn):資源グループnを構成する
資源のセット。 必要資源リスト(Rqd):資源グループ中に既存の何
らかの資源が必要とすることが分かった資源のセット。 全体のプロセスは図6のフローチャートに示すようにし
て開始する。段階100で、資源リストに全ての資源の
リストが記入される。次いでルーチンは段階102に進
み、次の資源グループ(Rgn)を作成する。この方法
については下記で図7に関して説明する。段階102の
後、ルーチンは段階104で試験を行って、資源リスト
RL中に資源が残っているかどうかを判定する。段階1
04の試験の結果が肯定であれば、ルーチンは段階10
2に戻ってこれを繰り返す。これによって次の資源グル
ープが作成される。しかし、段階104の試験の結果が
否定であれば、資源リスト中に資源が残っていないこと
を意味し、したがってルーチンはブロック106で示す
ように終了する。
【0021】次の資源グループを作成する段階(すなわ
ち図6の段階102)を、図7のフローチャートにさら
に詳細に図示する。このルーチンは、段階108で空の
次の資源グループRgnのデータ構造を作成することか
ら開始する。段階110で、ルーチンは資源リストから
資源を取り出し、これをその資源グループの必要資源リ
ストRqdに入れる。選択される資源はアプリケーショ
ン資源であることが好ましいが、これは必ずしも必要で
はない。段階114で、ルーチンは次いでRqdリスト
から取り出した資源が必要とする資源を見つける。「必
要資源を見つける」と呼ばれるこのサブステップでは、
任意の資源が必要とする資源のサブツリーを見つける
が、これについては下記で図8に関してさらに詳細に説
明する。段階114の後、段階116で試験を行って、
Rqdリストがその時点で空であるかどうか、すなわち
そのリスト中の全てのエントリ処理済みであるかどうか
を判定する。段階116での試験の結果が否定であれ
ば、追加のエントリが依然としてRqdリスト中に存在
し、したがってルーチンは分岐して段階114に戻り、
再循環する。しかし、段階116での試験の結果が肯定
であれば、Rqdリスト中にはそれ以上の追加エントリ
は存在せず、したがってルーチンは続行する。具体的に
いうと、必要とする側の資源を見つけるために段階12
0が次いで実行される。この段階では、下記で図9に関
してさらに詳細に説明するように、この資源グループ中
のいずれかの資源を必要とする、資源グループ中の現在
知られている資源以外の任意の即時資源を見つける。段
階120の後、段階122で再度試験を行って、Rqd
リストが空であるかどうか判定する。空でない場合に
は、ルーチンは再度分岐して段階112に戻り、再循環
する。しかし、段階122での試験の結果が、必要とす
る側の資源について処理するエントリがそれ以上のRq
dリスト中に存在しないことを示す場合には、ブロック
124に示すようにルーチンは戻る。
【0022】次に図8を参照すると、必要とする側の資
源を見つけるルーチンが示されている。上記のように、
このルーチンはいずれかの資源が必要とする資源のサブ
ツリーを見つける。好ましい実施の形態では、通常はア
プリケーション資源は全ての資源を必要とするので、ア
プリケーション資源のみを選び出すとこのプロセスは最
適化される。このルーチンは段階126で、Rqdリス
トから資源を取り出してこれをRgnデータ構造に入れ
ることから開始する。このルーチンは段階128に進
み、必要とする任意の資源をRqdリストに追加して、
資源リストからこれらを除去する。次いでルーチンは、
段階130でRqdリストが空であるかどうか試験す
る。段階130での試験の結果が否定である、すなわち
処理を必要とするエントリがさらに存在する場合には、
ルーチンは段階126に戻って再循環する。しかし、段
階130での試験の結果が肯定であれば、全てのエント
リは処理済みであり、ブロック132に示すようにルー
チンは戻る。
【0023】必要とする側の資源を見つけるルーチン
を、図9のフローチャートに示す。上記のように、この
ルーチンは、このグループ中のいずれかの資源を必要と
する、資源グループ中の現在知られている資源以外の任
意の即時資源を見つける。このルーチンは、所有および
交差ツリーまたは資源を反復して見つける。これは段階
134で、資源リストをチェック・リスト(Chk)デ
ータ構造に複写することから開始する。段階136で、
ルーチンはChkから資源を取り出す。次いで段階13
8で試験を行って、その資源がRgn中のいずれかの資
源を必要とするかどうかを判定する。この段階で上述の
コロケーション制約を使用する。段階138での試験の
結果が肯定であれば、ルーチンは分岐して段階140に
進み、そこでルーチンはこの資源をRqdに追加し、資
源リストからそれを除去する。しかし、段階138での
試験の結果が否定である場合、または段階140の後
で、ルーチンは段階142で、Chkが空であるかどう
か、すなわちその中の全てのエントリが処理済みである
かどうかを調べる。段階142での試験の結果が否定で
あれば、まだ他のエントリを分析しなければならず、し
たがってルーチンは段階136に戻って再循環する。し
かし、段階142での試験の結果が肯定であれば、ルー
チンはブロック144に示すように戻る。これで高水準
処理は完了する。
【0024】本発明ではこのようにして資源グループの
自動生成を構想する。「自動生成」とは、本発明で、形
成される資源グループができる限り小さく、(コロケー
ション要件によって)並置する必要のある資源の各セッ
トが1つの資源グループ内に完全に含まれるという制約
を受けるような形で、各資源をある資源グループに計算
によって割り当てることを意味する。したがって、この
プロセスへの人間の関与は、コロケーション要件の指定
に限定されることが好ましい。
【0025】上記のフローチャートは、「資源中心」方
式での自動資源グループ生成を実施するものであること
をさらに理解されたい。当業者なら、「コロケーション
中心」方式で資源グループの自動生成を実施することも
可能であることに気付くであろう。後者の場合、この実
施態様では、資源をループし、次いで関連するコロケー
ションおよび場合によっては関連するディスク区画をル
ープするのではなく、コロケーションを、かつ同じ複数
のディスク(ディスク・コロケーションと呼ばれること
もある)上に常駐するディスク区画のリストをループす
る。このようにして、コロケーション(ディスク・コロ
ケーションも含む)を処理してコロケーション中に挙げ
られる資源に資源グループ名を割り当てることによっ
て、資源グループを計算し保守することができる。
【0026】下記の疑似コードは、コロケーション関係
を使用して資源グループの形成を最適化する、本発明に
従って実施される様々な方法を説明するものである。一
般に資源グループは、そのメンバ資源のそれぞれに同一
の名前を割り当てることによって形成される。新規のコ
ロケーションに応答して、第1グループの名前を第2グ
ループの全てのメンバに割り当てる(かつ資源グループ
の名前のリストから第2グループの名前を削除する)こ
とによって、資源グループをマージすることが必要にな
ることもある。コロケーションが除去されると、コロケ
ーションによって関係付けられたエレメントがメンバで
ある資源グループを再計算する必要がある。これを行う
最も簡単な方法は、その資源グループの全てのメンバに
新規の名前を割り当てて全てのコロケーションを再処理
し、必要に応じてグループをマージすることである。
【0027】この第1命令セットは、新規のコロケーシ
ョン・リンク(A、B)の追加に応答する。 rga=Aの資源グループ; rgb=Bの資源グループ; if(rga≠rgb)Merge(rga,rgb); if(Bがディスク区画である) { c=Bのディスク; dp=Cの第1ディスク区画; rgc=dpの資源グループ; if(rga≠rgc)Merge(rga,rgc); } 中括弧{}の間の論理は、2つの資源グループが同一物
理ディスク上の区画を共有するかどうかを判定する試験
である。共有する場合には、資源グループは図5に示す
ようにマージされる。
【0028】以下の命令はコロケーション・リンク
(A,B)の除去に応答する。 rg=Aの資源グループ; K=資源グループrgを有するアプリケーションのリスト; L=資源グループrgを有する資源のリスト; for L中の各資源 { rgのクローンを形成し、それをresの資源グループとして割り当てる } for K中の各アプリケーション { M=フォーム(app,*)のコロケーションのリスト; M中の各コロケーションについて、{コロケーションの追加(上記)に応答を 適用} N=フォーム(*,app)のコロケーションのリスト; for N中の各コロケーション{コロケーションの追加(上記)に応答を適 用} } 上記において、資源グループのクローンは同じポリシー
およびユーザから与えられたコメントを有する別の資源
グループであることに留意されたい。
【0029】上記で参照した「Merge(rga,r
gb)」サブルーチンは、rgbの全てのオカレンスを
rgaで置き換え、資源グループrgbを削除する効果
を有する。そのポリシーおよびコメントはその時点で失
われる。パフォーマンス上の理由から、何らかのアプリ
ケーションと並置されない全ての非アプリケーション資
源に、NULL資源グループを割り当てることが望まし
いことがある。Merge(rga,rgb)を適用し
た時にrgbがNULLになる場合、これはrgaで置
き換えるだけでよい(大域置換は必要でない)。NUL
Lは、Mergeへの引数として許されず、したがって
Mergeの呼出しの代わりに、適当な置換を実行しな
ければならない。以下の疑似コードは、やはりコロケー
ション関係を使用して資源グループの形成を最適化す
る、パフォーマンス最適化である。新規のコロケーショ
ン・リンク(A,B)の追加に応答する。 rga=Aの資源グループ; rgb=Bの資源グループ; if(rga≠rgb) { if(rgb==NULL)Bの資源グループ=rga; else Merge(rga,rgb); } if(Bがディスク区画である) { C=Bのディスク; dp=Cの第1ディスク区画; rgc=dpの資源グループ; if(rga≠rgc) { if(rgc==NULL)dpの資源グループ=rga; else Merge(rga,rgc); } } コロケーション・リンク(A、B)の除去に応答する。 rg=Aの資源グループ; K=資源グループrgを有するアプリケーションのリスト; for K中の各アプリケーション { rgのクローンを形成し、それをアプリケーションの資源グループとして割 り当てる; } for K中の各アプリケーション { M=フォーム(app,*)のコロケーションのリスト; for M中の各コロケーション{コロケーションの追加(上記)に応答を 適用} N=フォーム(*,app)のコロケーションのリスト: for N中の各コロケーション{コロケーションの追加(上記)に応答を 適用} }
【0030】図10は、本発明による、クラスタ規模の
資源を使用してソフトウェア・アプリケーションの中断
のない処理を実現する方法を示す簡略化したフローチャ
ートである。段階150で、最初に試験を行って、ユー
ザによる全てのコロケーション指定がアプリケーション
に対してなされているかどうかを判定する。段階150
での試験の結果が否定であれば、ルーチンは段階152
に進む。この段階で、所与のアプリケーションについ
て、ユーザは、並置しなければならないネットワーク資
源のセットを識別する。ルーチンは次いで段階154戻
り、資源グループを自動的に生成する。段階156で試
験を行って、ネットワーク中でアプリケーションに影響
を及ぼす障害イベントが発生したかどうか判定する。段
階156での試験の結果が否定であれば、ルーチンは循
環する。しかし、段階156での試験の結果が肯定であ
れば、ルーチンは段階158に進み、資源グループの資
源の制御権をバックアップ・コンピュータに移す。
【0031】本発明はこのようにして、AIXオペレー
ティング・システム環境用のHA/CMPなどの従来技
術のクラスタ構成に関するいくつかの問題を解決する。
本発明によれば、システム管理者は一般に、資源グルー
プの内容を直接定義することを禁止される。そうではな
く、ユーザは単に、各アプリケーションについて、その
アプリケーションと「並置」しなければならないと分か
っている他の資源(IPアドレス、区画、その他のアプ
リケーション)をシステムに(従来のGUIを使用し
て)告げるだけである。したがってユーザはアプリケー
ションにのみ集中すればよいか、これは資源グループと
いうより抽象的な概念よりもユーザには理解しやすいと
予想される。クラスタ構成ルーチンは、全てのアプリケ
ーション定義における直接および間接の(人為的)資源
共有を検査し、それらのアプリケーションと、何らかの
タイプの依存性(実施態様により定義されるものも含
む)を有するそれらが関係する資源とからなる資源グル
ープを自動的に形成する。したがってこの動作は、全て
の資源のコロケーション依存性の遷移的閉止を実施す
る。ユーザが後で何らかの再構成(例えばIPアドレス
や、ディスク/区画内容、コロケーション要件の変更な
ど)を行う場合には、本発明は資源グループへの影響を
評価し、その影響をユーザに通知し、クラスタを保守す
るために何を行わなければならないかを管理者に指令す
ることができる。したがって、例えば、管理者に、「Yo
u no longer need to have DB/2 and Lotus Notes in t
he same resource group. Do you want to let them be
in their own groups now?」などのメッセージ照会が
与えられる。その応答によって、本発明は影響を受ける
資源グループを再構成する。
【0032】本発明の1つの好ましい実施態様は、コン
ピュータのランダム・アクセス・メモリに常駐のコード
・モジュール中の命令のセット(プログラム・コード)
である。コンピュータが必要とするまで、この命令セッ
トは別のコンピュータ・メモリ、例えばハード・ディス
ク・ドライブ、または光ディスク(最終的にはCDRO
Mで使用する)やフロッピー・ディスク(最終的にはフ
ロッピー・ディスク・ドライブで使用する)などの取外
し可能メモリに記憶する、あるいはインターネットその
他のコンピュータ・ネットワークを介してダウンロード
することができる。さらに、上記の様々な方法は、ソフ
トウェアによって選択的に活動化または再構成される汎
用コンピュータで都合良く実施されるが、当業者なら、
ハードウェア、ファームウェア、または必要とされる方
法の各段階を実行するように構築されたさらに専門化さ
れた装置で上記方法を実行できることにも気付くであろ
う。
【0033】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0034】(1)複数のノードを有するコンピュータ
・ネットワーク中でクラスタ規模の資源を使用して、ソ
フトウェア・アプリケーションの中断のない処理を実現
する方法であって、その処理を中断なしにする複数のア
プリケーションのそれぞれについて、そのアプリケーシ
ョンをその時点で実行しているコンピュータで故障が発
生した場合に、このようなアプリケーションのそれぞれ
と並置しなければならない資源のセットをユーザに識別
させる段階と、複数のアプリケーションおよびそれらが
関係する資源をそれぞれが1つまたは複数含む、1つま
たは複数の資源グループを自動的に生成する段階と、所
与のオカレンスに応じて、ある資源グループの資源の制
御権をバックアップ・コンピュータに移す段階とを含む
方法。 (2)資源のセットが、アプリケーション、IPアドレ
ス、およびディスク区画からなるグループから選択した
資源を含む、上記(1)に記載の方法。 (3)1つまたは複数の資源グループを自動的に生成す
る段階が、資源グループができる限り小さくなり、並置
する必要がある資源の各セットが所与の資源グループ内
に完全に含まれるような所定の方式で各資源を1つの資
源グループに計算によって割り当てる、上記(1)に記
載の方法。 (4)1つまたは複数の資源グループを自動的に生成す
る段階が、1組のコロケーション制約を実施する段階を
含む、上記(1)に記載の方法。 (5)コロケーション制約が、所与のアプリケーション
についてのユーザ定義コロケーションを含む、上記
(4)に記載の方法。 (6)コロケーション制約が、物理ディスク上に常駐す
るディスク区画資源を並置する、上記(4)に記載の方
法。 (7)複数のノードを有するコンピュータ・ネットワー
ク中でクラスタ規模の資源を、ソフトウェア・アプリケ
ーションの中断のない処理が容易になるように構成する
方法であって、その処理を中断なしにする複数のアプリ
ケーションのそれぞれについて、そのアプリケーション
をその時点で実行しているコンピュータで故障が発生し
た場合に、このようなアプリケーションのそれぞれと並
置しなければならない資源のセットをユーザに識別させ
る段階と、複数のアプリケーションおよびそれらが関係
する資源をそれぞれが1つまたは複数含む、1つまたは
複数の資源グループを自動的に生成する段階とを含む方
法。 (8)資源のセットが、アプリケーション、IPアドレ
ス、およびディスク区画からなるグループから選択した
資源を含む、上記(7)に記載の方法。 (9)1つまたは複数の資源グループを自動的に生成す
る段階が、1組のコロケーション制約を実施する段階を
含む、上記(7)に記載の方法。 (10)コロケーション制約が、所与のアプリケーショ
ンについてのユーザ定義コロケーションを含む、上記
(9)に記載の方法。 (11)コロケーション制約が、物理ディスク上に常駐
するディスク区画資源を並置する、上記(9)に記載の
方法。 (12)複数のノードを有するコンピュータ・ネットワ
ーク中でクラスタ規模の資源を、ソフトウェア・アプリ
ケーションの中断のない処理が容易になるように管理す
る方法であって、その処理を中断なしにする複数のアプ
リケーションのそれぞれについて、そのアプリケーショ
ンをその時点で実行しているコンピュータで故障が発生
した場合に、このようなアプリケーションのそれぞれと
並置しなければならない資源のセットをユーザに識別さ
せる段階と、複数のアプリケーションおよびそれらが関
係する資源をそれぞれが1つまたは複数含む、1つまた
は複数の資源グループを自動的に生成する段階と、クラ
スタ規模の資源の任意の再構成に応答して、その再構成
がいずれかの資源グループに影響を及ぼすかどうかを評
価する段階と、その再構成がいずれかの資源グループに
影響を及ぼす場合に、ユーザに通知する段階とを含む方
法。 (13)通知する段階が、資源グループがどのように影
響を受けるかを示す情報をユーザに提供する、上記(1
2)に記載の方法。 (14)資源のセットが、アプリケーション、IPアド
レス、およびディスク区画からなるグループから選択し
た資源を含む、上記(12)に記載の方法。 (15)コンピュータ・ネットワーク中のクラスタ規模
の資源を管理するためにデータ処理システム中で使用す
る、コンピュータ可読媒体中のコンピュータ・プログラ
ム製品であって、ユーザ入力に応答して、アプリケーシ
ョンをその時点で実行しているコンピュータで故障が発
生した場合に、そのアプリケーションと並置しなければ
ならない資源のセットを識別する第1プログラム・デー
タ手段と、ユーザ入力および1組のコロケーション制約
に応答して、1つまたは複数の資源グループを生成する
第2プログラム・データ手段とを含む製品。 (16)第2プログラム・データ手段が、所与のアプリ
ケーションについてのユーザ定義コロケーションを実施
する、コンピュータ・プログラム製品。 (17)第2プログラム・データ手段が、物理ディスク
上に常駐するディスク区画資源を並置する、コンピュー
タ・プログラム製品 (18)主コンピュータおよびバックアップ・コンピュ
ータを有するコンピュータ・ネットワークにおいて、ク
ラスタ規模の資源を使用して、ソフトウェア・アプリケ
ーションの中断のない処理を実現する方法であって、そ
の処理を中断なしにする複数のアプリケーションのそれ
ぞれについて、主コンピュータで故障が発生した場合
に、このようなアプリケーションのそれぞれと並置しな
ければならない資源のセットをユーザに識別させる段階
と、複数のアプリケーションおよびそれらが関係する資
源をそれぞれが1つまたは複数含む、1つまたは複数の
資源グループを自動的に生成する段階と、主コンピュー
タでの所与のオカレンスに応じて、資源グループの資源
の制御権をバックアップ・コンピュータに移す段階とを
含む方法。
【図面の簡単な説明】
【図1】本発明をその中で実施する代表的な高可用性ク
ラスタ構成を示す図である。
【図2】ユーザのコロケーション要件によって確立され
る代表的な資源グループを示すブロック・ダイアグラム
である。
【図3】ユーザのコロケーション要件によって確立され
る代表的な資源グループを示すブロック・ダイアグラム
である。
【図4】特定のアプリケーションに関連する資源のコロ
ケーションを定義するためにシステム管理者が使用す
る、代表的なユーザ・インタフェースの一部分を示す図
である。
【図5】2つのユーザ定義コロケーションが同一ディス
ク上のディスク区画に含まれる結果としての、資源グル
ープの形成を示すブロック・ダイアグラムである。
【図6】本発明による資源グループの自動形成手順を示
すフローチャートである。
【図7】図6のフローチャートの「次の資源グループを
作成する」サブルーチンを示すフローチャートである。
【図8】図7のフローチャートの「必要とされる資源を
見つける」サブルーチンを示すフローチャートである。
【図9】図7のフローチャートの「必要とする側の資源
を見つける」サブルーチンを示すフローチャートであ
る。
【図10】本発明による、資源グループ中のクラスタ資
源をバックアップ・コンピュータに移す方法を示すフロ
ーチャートである。
【符号の説明】
10 二重ネットワーク 12 二重共有SCSIバス 14 ミラー化ディスク 16 ミラー化ディスク 18 二重共有SCSIバス 19 二重共有SCSIバス 20 ディスク記憶装置 22 ディスク記憶装置
フロントページの続き (72)発明者 ジェームズ・ウェンデル・アレント アメリカ合衆国78681 テキサス州ラウン ドロックブラックジャック・ドライブ 1501 (72)発明者 ホヴェイ・レイモンド・ストロング アメリカ合衆国95120 カリフォルニア州 サンノゼマーリントン・コート 975

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】複数のノードを有するコンピュータ・ネッ
    トワーク中でクラスタ規模の資源を使用して、ソフトウ
    ェア・アプリケーションの中断のない処理を実現する方
    法であって、 その処理を中断なしにする複数のアプリケーションのそ
    れぞれについて、そのアプリケーションをその時点で実
    行しているコンピュータで故障が発生した場合に、この
    ようなアプリケーションのそれぞれと並置しなければな
    らない資源のセットをユーザに識別させる段階と、 複数のアプリケーションおよびそれらが関係する資源を
    それぞれが1つまたは複数含む、1つまたは複数の資源
    グループを自動的に生成する段階と、 所与のオカレンスに応じて、ある資源グループの資源の
    制御権をバックアップ・コンピュータに移す段階とを含
    む方法。
  2. 【請求項2】資源のセットが、アプリケーション、IP
    アドレス、およびディスク区画からなるグループから選
    択した資源を含む、請求項1に記載の方法。
  3. 【請求項3】1つまたは複数の資源グループを自動的に
    生成する段階が、資源グループができる限り小さくな
    り、並置する必要がある資源の各セットが所与の資源グ
    ループ内に完全に含まれるような所定の方式で各資源を
    1つの資源グループに計算によって割り当てる、請求項
    1に記載の方法。
  4. 【請求項4】1つまたは複数の資源グループを自動的に
    生成する段階が、1組のコロケーション制約を実施する
    段階を含む、請求項1に記載の方法。
  5. 【請求項5】コロケーション制約が、所与のアプリケー
    ションについてのユーザ定義コロケーションを含む、請
    求項4に記載の方法。
  6. 【請求項6】コロケーション制約が、物理ディスク上に
    常駐するディスク区画資源を並置する、請求項4に記載
    の方法。
  7. 【請求項7】複数のノードを有するコンピュータ・ネッ
    トワーク中でクラスタ規模の資源を、ソフトウェア・ア
    プリケーションの中断のない処理が容易になるように構
    成する方法であって、 その処理を中断なしにする複数のアプリケーションのそ
    れぞれについて、そのアプリケーションをその時点で実
    行しているコンピュータで故障が発生した場合に、この
    ようなアプリケーションのそれぞれと並置しなければな
    らない資源のセットをユーザに識別させる段階と、 複数のアプリケーションおよびそれらが関係する資源を
    それぞれが1つまたは複数含む、1つまたは複数の資源
    グループを自動的に生成する段階とを含む方法。
  8. 【請求項8】資源のセットが、アプリケーション、IP
    アドレス、およびディスク区画からなるグループから選
    択した資源を含む、請求項7に記載の方法。
  9. 【請求項9】1つまたは複数の資源グループを自動的に
    生成する段階が、1組のコロケーション制約を実施する
    段階を含む、請求項7に記載の方法。
  10. 【請求項10】コロケーション制約が、所与のアプリケ
    ーションについてのユーザ定義コロケーションを含む、
    請求項9に記載の方法。
  11. 【請求項11】コロケーション制約が、物理ディスク上
    に常駐するディスク区画資源を並置する、請求項9に記
    載の方法。
  12. 【請求項12】複数のノードを有するコンピュータ・ネ
    ットワーク中でクラスタ規模の資源を、ソフトウェア・
    アプリケーションの中断のない処理が容易になるように
    管理する方法であって、 その処理を中断なしにする複数のアプリケーションのそ
    れぞれについて、そのアプリケーションをその時点で実
    行しているコンピュータで故障が発生した場合に、この
    ようなアプリケーションのそれぞれと並置しなければな
    らない資源のセットをユーザに識別させる段階と、 複数のアプリケーションおよびそれらが関係する資源を
    それぞれが1つまたは複数含む、1つまたは複数の資源
    グループを自動的に生成する段階と、 クラスタ規模の資源の任意の再構成に応答して、その再
    構成がいずれかの資源グループに影響を及ぼすかどうか
    を評価する段階と、 その再構成がいずれかの資源グループに影響を及ぼす場
    合に、ユーザに通知する段階とを含む方法。
  13. 【請求項13】通知する段階が、資源グループがどのよ
    うに影響を受けるかを示す情報をユーザに提供する、請
    求項12に記載の方法。
  14. 【請求項14】資源のセットが、アプリケーション、I
    Pアドレス、およびディスク区画からなるグループから
    選択した資源を含む、請求項12に記載の方法。
  15. 【請求項15】主コンピュータおよびバックアップ・コ
    ンピュータを有するコンピュータ・ネットワークにおい
    て、クラスタ規模の資源を使用して、ソフトウェア・ア
    プリケーションの中断のない処理を実現する方法であっ
    て、 その処理を中断なしにする複数のアプリケーションのそ
    れぞれについて、主コンピュータで故障が発生した場合
    に、このようなアプリケーションのそれぞれと並置しな
    ければならない資源のセットをユーザに識別させる段階
    と、 複数のアプリケーションおよびそれらが関係する資源を
    それぞれが1つまたは複数含む、1つまたは複数の資源
    グループを自動的に生成する段階と、 主コンピュータでの所与のオカレンスに応じて、資源グ
    ループの資源の制御権をバックアップ・コンピュータに
    移す段階とを含む方法。
JP10077775A 1997-03-31 1998-03-25 ソフトウェア・アプリケーションの中断のない処理の実現方法 Pending JPH10283332A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/829569 1997-03-31
US08/829,569 US6038677A (en) 1997-03-31 1997-03-31 Automatic resource group formation and maintenance in a high availability cluster configuration

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000268308A Division JP3737686B2 (ja) 1997-03-31 2000-09-05 ソフトウェア・アプリケーションの中断のない処理の実現方法

Publications (1)

Publication Number Publication Date
JPH10283332A true JPH10283332A (ja) 1998-10-23

Family

ID=25254886

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10077775A Pending JPH10283332A (ja) 1997-03-31 1998-03-25 ソフトウェア・アプリケーションの中断のない処理の実現方法
JP2000268308A Expired - Lifetime JP3737686B2 (ja) 1997-03-31 2000-09-05 ソフトウェア・アプリケーションの中断のない処理の実現方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2000268308A Expired - Lifetime JP3737686B2 (ja) 1997-03-31 2000-09-05 ソフトウェア・アプリケーションの中断のない処理の実現方法

Country Status (3)

Country Link
US (1) US6038677A (ja)
JP (2) JPH10283332A (ja)
TW (1) TW510988B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005539320A (ja) * 2002-09-20 2005-12-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 自己管理分散計算システムを構築する方法、コンピュータ・プログラム、およびデータ処理システム(自己管理計算処理システム)
US8427910B2 (en) 1998-06-10 2013-04-23 U.S. Philips Corporation Storing audio-centered information with a multi-level table-of-contents (TOC) mechanism having redundant sub-TOCs
JP2013522716A (ja) * 2010-03-12 2013-06-13 シマンテック コーポレーション 高可用性障害回復環境において複合サービスグループを定義し、視覚化し、管理するためのシステムおよび方法
JP2020126504A (ja) * 2019-02-06 2020-08-20 富士通株式会社 計算機資源管理システム及び計算機資源管理プログラム

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490610B1 (en) 1997-05-30 2002-12-03 Oracle Corporation Automatic failover for clients accessing a resource through a server
US6366876B1 (en) * 1997-09-29 2002-04-02 Sun Microsystems, Inc. Method and apparatus for assessing compatibility between platforms and applications
US6173420B1 (en) * 1997-10-31 2001-01-09 Oracle Corporation Method and apparatus for fail safe configuration
US6363420B1 (en) * 1998-06-04 2002-03-26 Mortel Networks Limited Method and system for heuristically designing and managing a network
US6154849A (en) * 1998-06-30 2000-11-28 Sun Microsystems, Inc. Method and apparatus for resource dependency relaxation
US6314526B1 (en) * 1998-07-10 2001-11-06 International Business Machines Corporation Resource group quorum scheme for highly scalable and highly available cluster system management
US6427163B1 (en) * 1998-07-10 2002-07-30 International Business Machines Corporation Highly scalable and highly available cluster system management scheme
US7774469B2 (en) * 1999-03-26 2010-08-10 Massa Michael T Consistent cluster operational data in a server cluster using a quorum of replicas
US7797367B1 (en) 1999-10-06 2010-09-14 Gelvin David C Apparatus for compact internetworked wireless integrated network sensors (WINS)
US7293255B2 (en) * 2000-09-25 2007-11-06 Sun Microsystems, Inc. Apparatus and method for automated creation of resource types
US7836329B1 (en) * 2000-12-29 2010-11-16 3Par, Inc. Communication link protocol optimized for storage architectures
US7353380B2 (en) * 2001-02-12 2008-04-01 Aventail, Llc, A Subsidiary Of Sonicwall, Inc. Method and apparatus for providing secure streaming data transmission facilities using unreliable protocols
US7360075B2 (en) 2001-02-12 2008-04-15 Aventail Corporation, A Wholly Owned Subsidiary Of Sonicwall, Inc. Method and apparatus for providing secure streaming data transmission facilities using unreliable protocols
US7383329B2 (en) 2001-02-13 2008-06-03 Aventail, Llc Distributed cache for state transfer operations
US6836750B2 (en) * 2001-04-23 2004-12-28 Hewlett-Packard Development Company, L.P. Systems and methods for providing an automated diagnostic audit for cluster computer systems
WO2003013675A1 (en) * 2001-08-07 2003-02-20 Rebel Arts Llc Distributed and fault tolerant server system and method
US6820218B1 (en) * 2001-09-04 2004-11-16 Microsoft Corporation Persistent stateful component-based applications via automatic recovery
US6993566B2 (en) * 2001-09-13 2006-01-31 International Business Machines Corporation Entity self-clustering and host-entity communication such as via shared memory
US20030131146A1 (en) * 2002-01-09 2003-07-10 International Business Machines Corporation Interactive monitoring and control of computer script commands in a network environment
US6857053B2 (en) * 2002-04-10 2005-02-15 International Business Machines Corporation Method, system, and program for backing up objects by creating groups of objects
US8103748B2 (en) * 2002-05-20 2012-01-24 International Business Machines Corporation Rule-based method and system for managing heterogenous computer clusters
US6925541B2 (en) * 2002-06-12 2005-08-02 Hitachi, Ltd. Method and apparatus for managing replication volumes
US20040153748A1 (en) * 2002-12-19 2004-08-05 Alfio Fabrizi Method for configuring a data processing system for fault tolerance
US20040181707A1 (en) * 2003-03-11 2004-09-16 Hitachi, Ltd. Method and apparatus for seamless management for disaster recovery
US7739543B1 (en) * 2003-04-23 2010-06-15 Netapp, Inc. System and method for transport-level failover for loosely coupled iSCSI target devices
US8020034B1 (en) * 2004-03-12 2011-09-13 Microsoft Corporation Dependency filter object
US20050223088A1 (en) * 2004-03-31 2005-10-06 Cisco Technology, Inc. System using planning information to modify operation of a digital network
US7203864B2 (en) * 2004-06-25 2007-04-10 Hewlett-Packard Development Company, L.P. Method and system for clustering computers into peer groups and comparing individual computers to their peers
US7383430B1 (en) * 2004-07-29 2008-06-03 Emc Corporation System and method for validating resource groups
US7743333B2 (en) * 2004-08-12 2010-06-22 Oracle International Corporation Suspending a result set and continuing from a suspended result set for scrollable cursors
US7415470B2 (en) * 2004-08-12 2008-08-19 Oracle International Corporation Capturing and re-creating the state of a queue when migrating a session
US7613710B2 (en) * 2004-08-12 2009-11-03 Oracle International Corporation Suspending a result set and continuing from a suspended result set
US7587400B2 (en) * 2004-08-12 2009-09-08 Oracle International Corporation Suspending a result set and continuing from a suspended result set for transparent session migration
US7502824B2 (en) * 2004-08-12 2009-03-10 Oracle International Corporation Database shutdown with session migration
US20060041668A1 (en) * 2004-08-19 2006-02-23 International Business Machines Corporation Method and system to automatically define resources forming an it service
US9176772B2 (en) * 2005-02-11 2015-11-03 Oracle International Corporation Suspending and resuming of sessions
US7496783B1 (en) * 2006-02-09 2009-02-24 Symantec Operating Corporation Merging cluster nodes during a restore
JP4813975B2 (ja) * 2006-06-09 2011-11-09 株式会社日立製作所 無共有型データベースシステムの構成変更方法、管理サーバ及び無共有型データベースシステム
US8601539B1 (en) 2006-09-06 2013-12-03 Dell Software Inc. Systems and methods for managing user permissions
US20080065680A1 (en) * 2006-09-12 2008-03-13 Microsoft Corporation Change and release management system
US8725886B1 (en) * 2006-10-20 2014-05-13 Desktone, Inc. Provisioned virtual computing
US7886301B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Namespace merger
US20090164767A1 (en) * 2007-12-20 2009-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for generating availability management framework (amf) configurations
FR2931970B1 (fr) * 2008-05-27 2010-06-11 Bull Sas Procede de generation de requetes de manipulation d'une base de donnees d'initialisation et d'administration d'une grappe de serveurs , support de donnees et grappe de serveurs correspondants
US9037715B2 (en) * 2008-06-10 2015-05-19 International Business Machines Corporation Method for semantic resource selection
US20100114940A1 (en) * 2008-10-27 2010-05-06 Scott Alan Isaacson Self-organizing managed resources
US10079723B2 (en) * 2008-12-31 2018-09-18 International Business Machines Corporation Dynamic high availability policy creation based upon entries in a configuration management database (CMDB) and a best practices template
US8135985B2 (en) * 2009-06-17 2012-03-13 International Business Machines Corporation High availability support for virtual machines
US8688838B2 (en) * 2009-12-14 2014-04-01 Hewlett-Packard Development Company, L.P. Profile management systems
US8639827B1 (en) 2010-04-23 2014-01-28 Dell Software Inc. Self-service systems and methods for granting access to resources
US8752003B2 (en) 2010-05-03 2014-06-10 Telefonaktiebolaget L M Ericsson (Publ) Model driven approach for availability management framework (AMF) configuration generation
US8375394B2 (en) * 2011-01-18 2013-02-12 Novell, Inc. Techniques to automatically classify processes
US8949428B2 (en) * 2011-06-17 2015-02-03 International Business Machines Corporation Virtual machine load balancing
US8966084B2 (en) * 2011-06-17 2015-02-24 International Business Machines Corporation Virtual machine load balancing
US8843924B2 (en) 2011-06-17 2014-09-23 International Business Machines Corporation Identification of over-constrained virtual machines
JP6129290B1 (ja) 2015-12-24 2017-05-17 財團法人工業技術研究院Industrial Technology Research Institute 分散計算におけるアプリケーションパラメータ設定およびシステム仕様設定を推奨する方法およびシステム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4377000A (en) * 1980-05-05 1983-03-15 Westinghouse Electric Corp. Automatic fault detection and recovery system which provides stability and continuity of operation in an industrial multiprocessor control
US4837680A (en) * 1987-08-28 1989-06-06 International Business Machines Corporation Controlling asynchronously operating peripherals
US5003464A (en) * 1988-05-23 1991-03-26 Bell Communications Research, Inc. Methods and apparatus for efficient resource allocation
US5187787B1 (en) * 1989-07-27 1996-05-07 Teknekron Software Systems Inc Apparatus and method for providing decoupling of data exchange details for providing high performance communication between software processes
US5327553A (en) * 1989-12-22 1994-07-05 Tandem Computers Incorporated Fault-tolerant computer system with /CONFIG filesystem
US5263157A (en) * 1990-02-15 1993-11-16 International Business Machines Corporation Method and system for providing user access control within a distributed data processing system by the exchange of access control profiles
US5214778A (en) * 1990-04-06 1993-05-25 Micro Technology, Inc. Resource management in a multiple resource system
JPH04271454A (ja) * 1991-02-27 1992-09-28 Toshiba Corp 疎結合計算機システム
JP3118855B2 (ja) * 1991-04-10 2000-12-18 株式会社日立製作所 マルチプロセッサシステム
WO1993009494A1 (en) * 1991-10-28 1993-05-13 Digital Equipment Corporation Fault-tolerant computer processing using a shadow virtual processor
US5574897A (en) * 1992-09-30 1996-11-12 International Business Machines Corporation System managed logging of objects to speed recovery processing
US5615329A (en) * 1994-02-22 1997-03-25 International Business Machines Corporation Remote data duplexing
US5732266A (en) * 1994-09-02 1998-03-24 Compaq Computer Corporation Storage medium storing application programs and application initialization files and automatic launching of computer applications stored on the storage medium
US5553234A (en) * 1994-09-23 1996-09-03 International Business Machines Corporation System and method for including stored procedures, user-defined functions, and trigger processing in an existing unit of work
SE9404295D0 (sv) * 1994-12-09 1994-12-09 Ellemtel Utvecklings Ab Sätt och anordning vid telekommunikation
US5734817A (en) * 1995-03-01 1998-03-31 Unisys Corporation Method for making a data base available to a user program during data base recovery
US5696895A (en) * 1995-05-19 1997-12-09 Compaq Computer Corporation Fault tolerant multiple network servers
US5704032A (en) * 1996-04-30 1997-12-30 International Business Machines Corporation Method for group leader recovery in a distributed computing environment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8427910B2 (en) 1998-06-10 2013-04-23 U.S. Philips Corporation Storing audio-centered information with a multi-level table-of-contents (TOC) mechanism having redundant sub-TOCs
JP2005539320A (ja) * 2002-09-20 2005-12-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 自己管理分散計算システムを構築する方法、コンピュータ・プログラム、およびデータ処理システム(自己管理計算処理システム)
JP2013522716A (ja) * 2010-03-12 2013-06-13 シマンテック コーポレーション 高可用性障害回復環境において複合サービスグループを定義し、視覚化し、管理するためのシステムおよび方法
JP2020126504A (ja) * 2019-02-06 2020-08-20 富士通株式会社 計算機資源管理システム及び計算機資源管理プログラム

Also Published As

Publication number Publication date
JP2001109639A (ja) 2001-04-20
JP3737686B2 (ja) 2006-01-18
US6038677A (en) 2000-03-14
TW510988B (en) 2002-11-21

Similar Documents

Publication Publication Date Title
JP3737686B2 (ja) ソフトウェア・アプリケーションの中断のない処理の実現方法
US11212286B2 (en) Automatically deployed information technology (IT) system and method
US7293255B2 (en) Apparatus and method for automated creation of resource types
KR102443172B1 (ko) 멀티테넌트 어플리케이션 서버 환경에서 패치를 지원하는 시스템 및 방법
US8843561B2 (en) Common cluster model for configuring, managing, and operating different clustering technologies in a data center
US7937455B2 (en) Methods and systems for modifying nodes in a cluster environment
US9817721B1 (en) High availability management techniques for cluster resources
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
US9710250B2 (en) Mechanism for safe and reversible rolling upgrades
US7130897B2 (en) Dynamic cluster versioning for a group
US8627028B2 (en) Method of constructing replication environment and storage system
US20050278273A1 (en) System and method for using root cause analysis to generate a representation of resource dependencies
US20090083405A1 (en) Maximizing application availability during automated enterprise deployments
CA2298404A1 (en) Method, system and program products for managing the checkpoint/restarting of resources of a computing environment
US20060101059A1 (en) Employment method, an employment management system and an employment program for business system
US20210089379A1 (en) Computer system
CN106657167A (zh) 管理服务器、服务器集群、以及管理方法
JPH11345130A (ja) 複数のデ―タストアの同期をとってデ―タ整合性を達成する方法
US5946463A (en) Method and system for automatically performing an operation on multiple computer systems within a cluster
KR19990013389A (ko) 사건을 롤업하는 방법 및 장치
KR100763781B1 (ko) 서버 관리 시스템 및 마이그레이션 방법
US11100000B2 (en) Embedded image management
Vargas et al. Sun Cluster Environment: Sun Cluster 2.2
De Palma et al. Autonomic Administration of Clustered J2EE Applications.
CN115827216A (zh) 集群服务高可用方法、装置、计算机设备、存储介质