JP2005056392A - 地理的ミラーリングに関するリソースの妥当性検査およびランキングのための方法および装置 - Google Patents

地理的ミラーリングに関するリソースの妥当性検査およびランキングのための方法および装置 Download PDF

Info

Publication number
JP2005056392A
JP2005056392A JP2004173796A JP2004173796A JP2005056392A JP 2005056392 A JP2005056392 A JP 2005056392A JP 2004173796 A JP2004173796 A JP 2004173796A JP 2004173796 A JP2004173796 A JP 2004173796A JP 2005056392 A JP2005056392 A JP 2005056392A
Authority
JP
Japan
Prior art keywords
resource
node
resource pool
switchable
pool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004173796A
Other languages
English (en)
Inventor
Michael James Mcdermott
マイケル・ジェイムス・マクダーモット
Amartey Scott Pearson
アマーティ・スコット・ペアーソン
Kiswanto Thayib
キスワント・タイブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005056392A publication Critical patent/JP2005056392A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0634Configuration or reconfiguration of storage systems by changing the state or mode of one or more devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】地理的に分散された場所に冗長なリソースを維持していたコンピューティングシステムグループにおいて、グループ全体の可用性を向上させる。
【解決手段】地理的に分散されたコンピューティングシステムグループの一部として動作するノード内のリソースのマネジメントを行うため、その使用に関してリソースのコンフィギュレーションを行い、リソースプールに関して、リソースの可用性の検査を行い、その1つを選択する。リソースは少なくとも1つのディスクユニットを含み、リソースプールを切り替え可能なディスクプールとしてコンフギュレーションを行う。またリソースプールに関して各ディスクユニットの可用性のランキングを行い、少なくとも1つの有効なディスクユニットを選択する。
【選択図】図1

Description

本発明は、概してコンピュータ・リソースのマネジメントに関する。より詳細に述べると、本発明は、物理的に分散されているリソース・プールに関するリソースのコンフィギュレーションならびにアクセス可能性に関する。
最近の、大企業の販売もしくは製造オペレーションといったエンタープライズ・オペレーションの用に供するコンピュータ・システムは、長期間にわたって使用不能となることが許されない。伝統的に障害リカバリは、たとえば電源遮断、自然災害、サイトの災害、システム・ハードウエアまたはソフトウエアのエラー、アプリケーションの誤動作、および破壊行為による故意の動作に起因するスケジュールされていないダウンタイムに焦点が当てられてきた。スケジュールされていないダウンタイムは、通常、コンピュータ・リソースの使用不能を招き、その結果、リモート・リカバリ・サイトからのバックアップ・システムが使用されてオペレーションが復帰される。ビジネスの中断は、長時間に渡り、場合によっては数日に及ぶこともある。
近年の電子商取引では、連続的なシステム可用性およびスケジュールされたダウンタイムからの保護が求められる。スケジュールされたシステム(たとえばサーバ)のダウンタイムもしくは遮断の間は、ユーザ(たとえばクライアント)に対してシステムが意図的な使用不能状態に設定される。これらのスケジュールされたダウンタイムは、システムのオペレーションに分断をもたらし、適応も困難である。スケジュールされたダウンタイム/遮断の例としては、新しいオペレーティング・システムおよびアプリケーション・ソフトウエアのリリースのインストール、システムのハードウエア・アップグレード、追加、削除、ならびにメンテナンス、システムのバックアップ、サイトのメンテナンス、およびプログラムの一時的な修正(PTF)の適用が挙げられる。『連続的可用性(continuous availability)』を有するシステムは、スケジュールされた遮断ならびにスケジュールされていない遮断のいずれも有することのないシステムとして定義される。
システムの可用性を向上させ、かつ強化するための1つの方法は、クラスタ化されたシステムを使用する。クラスタは、単一サイトにおいてローカライズされているか、複数サイトに分散され、単一の統合されたコンピューティング・ケイパビリティを提供するべくすべてが協働して共通動作を行うコンピュータ・システム・ノードの集合である。クラスタ化されたシステムは、データベース・サーバまたはアプリケーション・サーバ等のコンピューティング・システムにフェイルオーバおよびスイッチオーバ・ケイパビリティを提供する。システムの遮断もしくはサイトのロスが生じた場合には、クラスタ化されたプライマリ・サーバ・システム上に提供されている機能を、リソースの現在のコピー(レプリカ)を含む1ないし複数の専用バックアップ・システムへ、スイッチオーバ(またはフェイルオーバ)することができる。フェイルオーバは、スケジュールされていない遮断のために自動化することができる。スケジュールされた遮断の場合には、スイッチオーバを、スケジュールされた遮断手続きの一部として自動的に、あるいはマニュアルで起動することができる。
クラスタ・リソース・グループは、クラスタのサブセットであり、多数のメンバを有するが、通常、それらのメンバの1つをそのクラスタ・リソース・グループに関するプライマリ・メンバとして定義する。プライマリ・メンバは、そのグループに関するプライマリ・アクセス・ポイントであり、そのグループによって現在使用されているリソースをホストする。グループ内のそのほかの、プライマリ・メンバの機能を肩代わりできるべく適切にコンフィギュレーションがなされたメンバ、すなわちプライマリ・メンバの機能を肩代わりするべく適切にリソースのコンフィギュレーションがなされているノードは、バックアップ・メンバと呼ばれる。一例においては、バックアップ・メンバが冗長リソースをホストする。別の例においては、バックアップ・メンバが、通常はプライマリ・メンバによってホストされているプライマリ・リソースに対するアクセスを有することができる。プライマリ・メンバがフェイルした場合には、バックアップ・メンバがそのプライマリ・メンバの役割を肩代わりする。バックアップ・メンバは、プライマリ・メンバの機能を肩代わりするとき、以前のプライマリ・メンバのリソースを引き継ぐか、あるいはその冗長リソースをプライマリ・リソースとする変更を行う。
フェイルオーバまたはスイッチオーバを生じる場合には、サーバ・オペレーティング・システムの一部とすることが可能であり、かつすべてのシステム上において実行することのできるクラスタ・リソース・サービス(CRS)が、プライマリ・システムからバックアップ・システムへのスイッチオーバを提供する。このスイッチオーバは、エンド・ユーザもしくはサーバ・システム上において実行中のアプリケーションへ最小限の影響を与える。データ要求は、バックアップ・システム(つまり新しいプライマリ・システム)へ自動的に再ルーティングされる。またクラスタ・リソース・サービスは、クラスタへのシステムの自動的な再導入または再結合のための手段を提供し、再結合されたシステムのオペレーション・ケイパビリティを復元する。
システムの可用性をさらに向上させ、強化するための別の方法は、コンピューティング・システムならびにコンピュータ・リソース、たとえばデータ・ストレージ・ユニット等を地理的に分散させることを伴う。その種の地理的に分散されたコンピュータ・システムにおいては、異なる地理的サイトが1ないしは複数のコンピュータ・サブシステム、またはノードを有し、それらが、同じくそのサイトに配置されるコンピュータ・リソースをコントロールし、あるいはホストすることができる。コンピューティング・システムのノードならびにリソースを有する複数の地理的ロケーションのそれぞれは、『サイト』と呼ばれる。地理的に分散されたコンピューティング・システムの部分を含む複数のサイトは、概して、すべてのサイトおよびそれらのサイトに配置されたコンピュータ・ノードの間におけるデータ交換をサポートするデータ通信システムを用いて相互接続される。物理的に分散されたコンピュータ・システムの一部となる個々のコンピューティング・ノードは、概して、そのノードと同じ場所に配置されたデータ・ストレージ・デバイス、プリンタ、およびそのほかの共有周辺デバイスといったリソースへの直接アクセスを有している。これらのシステムは、冗長な、データ・ストレージ・ユニット等のリソースを一般に維持しており、それらは、プライマリ・リソースの複製を含んでいる。通常、これらの冗長リソースは、必要であれば、コンフィギュレーションを迅速に行ってプライマリ・リソースにすることが可能である。地理的に分散されたコンピューティング・システムは、リソースのミラーリング・データをプライマリ・サイトから別のサイトへ伝達することによって、冗長リソースを維持している。グループ内における冗長リソースの維持は、そのグループのオペレーションに関するシングル・ポイント故障を回避する。
データは、1ないしは複数のサーバ・システムに接続されたディスク・プール内へストアすることができる。ディスク・プールは、ディスク・ユニットのタワーおよび独立ディスクの冗長アレイ(RAID)等のディスク・ユニットのセットである。ディスク・プールは、そのディスク・プールのディスク・ユニットを包含するハードウエア・エンティティの所有権をプライマリ・システムからバックアップ・システムへ切り替えることによって、プライマリ・システムからバックアップ・システムへ切り替えられる。しかしながら、ディスク・プール内のディスク・ユニットは、適正なハードウエア・エンティティ(たとえば、プライマリ・システムならびにバックアップ・システムがアクセスできるタワー)内に物理的に配置されていなければならず、また多くのコンフィギュレーションならびにハードウエア配置規則に従っていなければならない。ユーザもまた、ディスク・プールに関してディスク・ユニットを選択するとき、およびそのディスク・プールへアクセスするためのプライマリ・システムならびにバックアップ・システムを選択するとき、それらのコンフィギュレーションならびにハードウエア置換規則に従わなければならない。それを怠ると、スイッチオーバが試みられたとき、もしくはフェイルオーバが生じたときに、そのディスク・プールをプライマリ・システムおよび/またはバックアップ・システムが利用できなくなることがある。さらにユーザは、ハードウエア・コンフィギュレーションを変更するときにもこれらの規則に従わなければならない。ユーザは、ディスク・ユニットならびにクラスタ・システムのコンフィギュレーションを適正に行うために、このコンフィギュレーションならびにハードウエア置換規則を理解し、それに従う責任がある。しかしながら、コンフィギュレーションならびにハードウエア置換規則の複雑性に起因して、ユーザには試行錯誤状態が余儀なくされ、スイッチオーバが生じたときに使用不能なディスク・ユニットがもたらされることもあり得る。
地理的に分散されたコンピューティング・システムは、サーバ・システムに対するディスク・プール等のリソースの割り当てに、追加の条件を導入する。ディスク・プール等のリソースは、一般に同一の物理サイトに配置されたコンピュータ・システムに対して割り当てられる。1つのサイトに配置されたコンピュータ・システムは、別のサイトに配置されている、たとえばディスク・プールをホストすることが一般にできない。従来のコンピュータ・リソース・グループは、概して、そのコンピュータ・リソース・グループ内のすべてのノードが、そのコンピュータ・リソース・グループに割り付けられているすべてのリソースへのアクセスを有するように、すべてのノードならびにリソースが同じ場所に配置されることを要求し、そのため、コンピュータ・リソース・グループの柔軟性が制限される。
したがって、ディスク・プールのコンフィギュレーションを行うとき、同一サイトのシステムに対してディスクのセット(つまり、ディスク・プール、ASPとしても知られる)がアクセス可能となることを保証するためのシステムおよび方法が必要とされている。さらに、ディスク・プール内におけるコンフィギュレーションのための有効なディスク・ユニットの選択を保証することが求められている。
概して言えば、本発明の実施態様は、たとえばコンピューティング・システム・グループ全体の可用性を向上させるために、地理的に分散された場所に冗長なリソースを維持していたコンピューティング・システム・グループにおいて使用するためのシステムおよび方法を提供する。各サイトに維持されているディスク・プール内のディスク・ユニット等のリソースは、1つのサイトのプライマリ・システムと1ないしは複数のバックアップ・ノードの間において切り替えが可能である。それぞれの地理的に離れた場所が『サイト』と呼ばれる。所定のサイトに配置されているプライマリ・システム、バックアップ・システム(数は任意)、および1ないしは複数のリソースは、クラスタとしてコンフィギュレーションが行われ、そのサイトの可用性を向上させることができる。クラスタは、1つのサイトに配置されているか、複数のサイトに分散されているシステムまたはノードのグループとして定義され、それにおいてノードは、ともに単一システムとして働く。そのクラスタ内の各コンピュータ・システムは、クラスタ・ノードと呼ばれる。コンピューティング・システム・グループ内の各サイトは、1ないしは複数のコンピューティング・システムまたはノードを有することが可能であり、例示の実施態様のオペレーションは、ノードを1つだけ伴ってサイトが動作することを許容する。コンピュータ・システム・グループ内の各サイトは、現在のオペレーションのために使用されるプライマリ・リソースを含むプロダクション・サイトとして、あるいはプロダクション・サイトに配置されているプライマリ・リソースをミラーリングする冗長ソースを含むミラー・サイトとしてコンフィギュレーションを行うことができる。本発明の例として示す実施態様は、サイトのリソースの、そのサイトのクラスタまたはコンピュータ・ノードによる使用に関する適正な妥当性検査ならびにランキングを容易にする。サイトのクラスタ内におけるノードの作成、追加、変更、および削除のために、インターフェースのセットが提供されている。
一実施態様においては、同一サイト内に配置されている1ないしは複数のディスク・ユニットの妥当性検査およびランキングを、指定されたディスク・プールに関して行うためのメカニズムが提供される。別の実施態様においては、ディスク・プールへアクセスするプライマリ・ノードとして、あるいはバックアップ・ノードとしてノードのコンフィギュレーションを行う前に、そのディスク・プール内のディスク・ユニットのアクセス可能性を、そのノードに関して検査するためのメカニズムが提供される。さらに別の実施態様では、あるサイトに配置されたプライマリ・システムとバックアップ・システムの間のスイッチオーバを起動するための準備において、そのサイトの複数のノードのクラスタリングを開始するときに、切り替え可能なディスク・プール内のディスク・ユニットの妥当性検査を行うためのメカニズムが提供される。
簡潔に述べれば、本発明によると、システム内のリソースのマネジメントを行うためのシステム、方法、および信号担持メディアは、システムによる使用のための少なくとも1つのリソースのコンフィギュレーションを含む。システムは、そのリソースを含むサイトに関連付けされる。またこの方法は、その少なくとも1つのリソースの可用性を、リソース・プールに関して検査することも含む。この検査には、システムによるアクセス可能性の決定、およびリソースがそのサイトに配置されていることの検証が含まれる。またこの方法は、この検査(ランキングを含めてもよい)に基づいて、上記の少なくとも1つのリソースのうちの少なくとも1つを、リソース・プールに関して選択することも含む。同一サイトのシステムだけがチェックされて、それらがそのサイトのリソースへのアクセスを有することが保証され、システムは、ほかのサイトのリソースへのアクセスを求めない。
本発明の別の側面においては、システムがサイトに関連付けされるプライマリ・システムおよびプライマリ・システムに接続されるリソース・プールを有する。さらにこのシステムは、そのリソース・プールに関して、少なくとも1つのリソースの可用性を検査し、かつそのリソース・プールに関して、少なくとも1つの有効なリソースを選択するべくコンフィギュレーションが行われたプロセッサを有する。この可用性の検査は、そのサイトに配置されている少なくとも1つのリソースを、少なくとも部分的に基礎として行われる。
以上の、およびこのほかの本発明の特徴ならびに利点は、添付図面に例示されているとおり、以下の本発明の好ましい実施態様のより詳細な説明から明らかなものとなるであろう。
本発明に関する発明の内容は、この明細書を総括する特許請求の範囲において詳細に、かつ明確に示されている。以上の、およびそのほかの本発明の特徴ならびに利点は、これに続く添付図面を参照した詳細な説明から明らかになるであろう。なお、参照番号の最左翼の数字は、その参照番号が最初に現れる図面を識別している。
(コンピューティング・システム・グループ)
図面においては、類似の部分の参照に類似の番号を用いており、以下、それらの図面を参照してより詳細な説明を行うが、まず図1を参照すると、本発明の実施態様の一例の全体的なシステム・アーキテクチャを例証するコンピューティング・システム・グループ100が示されている。この例のコンピューティング・システム・グループ100は、2つのサイト、すなわちサイトA 102、およびサイトB 104を示している。本発明の実施態様は、1つ以上、可能最大数までの間の任意数のサイトを有するコンピューティング・システム・グループを用いて実施できる。この例において使用されるサイトは、そのサイトの物理ロケーション内に配置されるリソースへのアクセスを有するコンピュータ・ノードのグループとして定義される。たとえば、サイトA 102内のノード、すなわちノードA 110およびノードB 108は、リソース・プールA 130内のリソース、すなわちリソースA 116、リソースB 118、およびリソースZ 120へのアクセスを有する。同様にサイトB 104内のノード、すなわちノードC 112およびノードD 114は、リソース・プールB 132内のリソース、すなわちリソースC 121、リソースD 122、およびリソースY 124へのアクセスを有する。関連するサイトにおける複数のノードによってアクセス可能なこれらのリソースに加えて、サイトA 102は、そのサイトのノードA 110によるアクセスだけが可能なリソースを含むリソース・プールE 140を包含している。この例のリソース・プールE 140は、ノードB 108によるアクセス、あるいはサイトB 104に配置されているノードによるアクセスが可能でない。サイト内の複数のノードによってアクセス可能なリソース・プールは、切り替え可能リソース・プールとしてコンフィギュレーションを行うことが可能であり、その結果、そのリソースのオペレーションをホストしているノードは、同じサイトの別のノードへの切り替えが可能になる。
例示の実施態様におけるそれぞれのサイトは、多数のノードを有する。サイトA 102は、ノードA 110およびノードB 108を有することが示されている。これらのノードは、同一サイトの部分であるノードならびに異なるサイトの部分であるノードの間におけるデータ通信をサポートするデータ通信ネットワーク106を介して接続されている。
この例においては、これらのサイトが地理的に互いに隔てられており、サイト間通信システム126によって相互接続されている。サイト間通信システム126は、通常は、より高速なそれぞれのサイト内に含まれるデータ通信ネットワーク106を接続する。例示の実施態様のサイト間通信システム126は高速接続を使用している。本発明の実施態様は、通常のWANアーキテクチャ、陸上通信線、地上波ならびに衛星無線リンク、およびそのほかの通信テクニック等の各種のサイト間通信システム126を使用する。また本発明の実施態様は、類似の相互接続を有する任意数のサイトを伴って動作し、それらのサイトのすべてのノード間における連続的な通信ネットワークを構成する。さらに本発明の実施態様は、物理的に互いに近いが、同一リソース・プール内のリソースに対するアクセスを持たないコンピュータ・ノードを有する『サイト』も含む。物理的に近いサイトは、単一のデータ通信ネットワーク106の共有が可能であり、独立したサイト間通信システム126を含んでいない。
リソース・プールA 130およびリソース・プールB 132等のリソース・プール内に包含されているリソースには、データ・ストレージ・デバイス、プリンタ、およびそのほかの、グループ内の1つのノードによってコントロールされる周辺装置が含まれる。コンピューティング・システム・グループ100内においては、1つのノードまたはメンバが、そのグループに関するプライマリ・メンバとして指定される。グループのプライマリ・メンバは、そのコンピューティング・グループに関するプライマリ・リソースをホストし、アクセス・ポイントとして動作し、さらにそのグループによってマネージされるリソースをホストする。
本発明に従った一例の実施態様におけるサイトA 102に関するノードおよびリソースのコンフィギュレーション800を図8に示す。サイトA 102に関する一例のノードおよびリソースのコンフィギュレーション800は、ノードA 110、ノードB 108、ディスク・ユニットの第1のタワーであるリソース・プールA 130、およびディスク・ユニットの第2のタワーであるリソース・プールE 140を含む。ノードA 110またはノードB 108内のオペレーティング・システムを使用して、クラスタ・マネジメント・オペレーションを実行することができる。オプションとして、ノードおよびリソースのコンフィギュレーション800は、ノードおよびリソースのコンフィギュレーション820に関するコンフィギュレーション、変更、メンテナンス、およびそのほかのタスクに関係するオペレーションの実行に特化することのできるクラスタ・マネジメント・コンピュータ・システム820を含むこともできる。クラスタ・マネジメント・コンピュータ・システム820は、ネットワークを介してノードおよびリソースのコンフィギュレーション800のそのほかのコンポーネントと接続されることもあり、また図2を参照して以下に説明するコンピュータ・システム200等のコンピュータ・システムを含むこともできる。
この例示の実施態様のリソース・プールA 130ならびにリソース・プールE 140は、それぞれ複数のディスク・ユニット、たとえば複数のダイレクト・アクセス・ストレージ・ディスク(DASD)等を含んでいる。この例示の実施態様のリソース・プールA 130は、DASD 11 802、DASD 12 804、DASD 13 806、およびDASD 14 808を含んでおり、それらは、ともに独立補助ストレージ・プール(IASP)として定義されるべく企図されているとすることができる。リソース・プールE 140は、DASD 21 810およびDASD 22 812を含み、それらは、ともに補助ストレージ・プール(ASP)として定義されるべく企図されているとすることができる。リソース・プールA 130は、ノードA 110ならびにノードB 108と接続されており、したがって、それらによるアクセスが可能である。リソースEは、ノードA 110とだけ接続されており、したがってそれだけがアクセスできる。この例示の実施態様においてノードA 110は、リソース・プールA 130に関するプライマリ・ノードとしてコンフィギュレーションが行われており、ノードB 108は、サイトA 102におけるリソース・プールA 130のためのバックアップ・ノードとしてコンフィギュレーションが行われている(つまり、ノードB 108は、スケジュールされた遮断もしくはスケジュールされていない遮断に起因してノードA 110が使用不可となったときに、リソース・プールA 130に関する新しいプライマリ・ノードになる)。
(コンピュータ・ノードおよびグループ・メンバ)
本発明の一実施態様に従ったグループ100の、一例の実施態様においてはコンピュータ・システムとなるグループ・メンバ200のブロック図を図2に示す。この例示の実施態様のグループ・メンバ200は、IBMのeServer iSeries(eサーバ・iシリーズ)サーバ・システム(eServerおよびiSeriesはIBM Corporationの米国およびその他の国における商標)である。任意の適切にコンフィギュレーションの行われたプロセッシング・システムは、同様に本発明の実施態様による使用が可能である。コンピュータ・システム200は、プロセッサ202を有し、それがメイン・メモリ204、大容量ストレージ・インターフェース206、端末インターフェース208、およびネットワーク・インターフェース210と接続されている。これらのシステム・コンポーネントは、システム・バス212によって相互接続される。大容量ストレージ・インターフェース206は、DASDデバイス214等の大容量ストレージ・デバイスをコンピュータ・システム200へ接続するために使用される。DASDデバイスの1つの具体的なタイプはフレキシブル・ディスク・ドライブであり、データをフレキシブル・ディスク216へストアするとき、およびそこからデータを読み出すときに使用することができる。
メイン・メモリ204は、アプリケーション・プログラム220、オブジェクト222、データ226、およびオペレーティング・システムのイメージ228を含んでいる。ここではメイン・メモリ204内にこれらが同時に常駐する形で示されているが、アプリケーション・プログラム220、オブジェクト222、データ226、およびオペレーティング・システム228は、メイン・メモリ204内に常時完全に常駐している必要はなく、同時に常駐する必要さえもないことは明らかである。コンピュータ・システム200は、従来の仮想アドレッシング・メカニズムを使用してプログラムが、メイン・メモリ204およびDASDデバイス214といった複数のより小さいストレージ・エンティティではなく、ここでコンピュータ・システム・メモリと呼ぶ、大きな単一ストレージ・エンティティへアクセスしているかのように振る舞うことを可能にする。ここで注意する必要があるが、これに使用している『コンピュータ・システム・メモリ』という用語は、コンピュータ・システム200の全仮想メモリを包括的に指す。
オペレーティング・システム228は、IBMのOS/400(OS/400はIBM Corporationの米国およびその他の国における商標)オペレーティング・システム等のような適切なマルチタスキング・オペレーティング・システムである。本発明の実施態様は、任意のそのほかの適切なオペレーティング・システムを使用することができる。オペレーティング・システム228は、DASDマネジメント・ユーザ・インターフェース・プログラム230、DASDストレージ・マネジメント・プログラム232、およびグループ・ユーザ・インターフェース・プログラム234を含んでいる。本発明の実施態様は、オペレーティング・システム228のコンポーネントのインストラクションをコンピュータ・システム200内の任意のプロセッサ上において実行すること可能にするオブジェクト指向フレームワーク・メカニズム等のアーキテクチャを使用する。
コンピュータ202に関して1つのCPU 202だけを示したが、複数のCPUを伴うコンピュータ・システムを、同様に効果的に使用することができる。本発明の実施態様は、それぞれが個別の完全にプログラムされた、CPU 202のプロセッシング負荷の軽減に使用されるマイクロプロセッサを含むインターフェースを組み込んでいる。端末インターフェース208は、1ないしは複数の端末218をコンピュータ・システム200へ直接接続するために使用される。これらの端末218は、非インテリジェントあるいは完全なプログラマブル・ワークステーションとすることが可能であり、それらを使用してシステム管理者およびユーザは、コンピュータ・システム200と通信することができる。
ネットワーク・インターフェース210は、ほかのコンピュータ・システムまたはクラスタ・リソース・グループのメンバ、たとえばステーションA 240およびステーションB 242をコンピュータ・システム200へ接続するために使用される。本発明は、現存するアナログおよび/またはディジタルテクニックを含む任意のデータ通信接続、あるいは将来のネットワーク・メカニズムを介したデータ通信接続を取り扱う。
例示した本発明の実施態様は、完全に機能するコンピュータ・システムの観点から説明されているが、当業者にあっては、これらの実施態様が、プログラム・プロダクトとして、フレキシブル・ディスク、たとえばフレキシブル・ディスク216、CD‐ROM、もしくはそのほかの形式の記録可能メディアを介して、あるいは任意のタイプの電気送信メカニズムを介して配信できることを認識されるであろう。
本発明の実施態様は、コンフィギュレーション、オペレーション、およびそのほかのマネジメント機能に関連した機能を実行するDASDマネジメント・ユーザ・インターフェース・プログラム230を含むオペレーティング・システム228を包含し、それには、補助ストレージ・プール(ASP)用に1ないしは複数のDASDを選択する機能も含まれる。ASPは、ディスク・ユニットのセットとして定義され、独立補助ストレージ・プール(IASP)は、システムに依存しないディスク・ユニットのセットである。IASPは、そのディスク・ユニットが切り替え可能であり、コンフィギュレーションならびに配置規則に従っている場合には、システム間において切り替えが可能である。DASDマネジメント・ユーザ・インターフェース・プログラム230は、ディスク・ユニットのマネージのための内部サポートを提供するオペレーティング・システム228のコンポーネントであるDASDストレージ・マネジメント(DSM)プログラム232と通信することができる。
(プロセッシング・フローおよびソフトウエア設計の例)
図3に、一例とする本発明の実施態様に従った、ASPに関して1ないしは複数のDASDを選択するプロセスのフローチャート300を示す。例示の実施態様においては、方法300を、サイトに配置されるノードに接続されるASPに関する1ないしは複数のDASDの選択に関連するDASDマネジメント・ユーザ・インターフェース・プログラム230の部分を例証しているものと理解することができる。方法300は、ステップ310において開始し、ステップ320においてはASPのユーザ選択を待機するが、それに関して1ないしは複数のDASDのコンフィギュレーションが行われることになる。ユーザは、現存するASPもしくは新しいASPを選択することができる。一実施態様においては、複数のDASDならびにASPが選択され、並列に処理される。ユーザがASPの選択を行うと妥当性インスペクタが起動され、ステップ330において、このノードのサイトにあるコンフィギュレーション未済の全DASDの妥当性ならびにランキング結果が提供される。一例の妥当性インスペクタの詳細については後述する。妥当性インスペクタの結果は、選択されたASPに関するコンフィギュレーション未済の各DASDの妥当性ならびにランキングも含めて、ステップ340においてユーザに表示される。
一実施態様においては、ディスク・プールに関するディスク・ユニットの選択時に、妥当性インスペクタが、次に述べる規則をチェックして妥当性を決定する。ここでは、次に述べる規則が例示であり、別のシステムに関しては別の規則のセットに従ってもよいことを理解されたい。最初の規則は、選択されたDASDがすべて関連付けされ、かつ、この方法300を実行しているノードを含むサイトに配置されていることを決定し、保証することである。もう1つの規則は、別々に切り替え可能な異なるディスク・プール内のディスク・ユニットは、同一の切り替え可能なエンティティ内とし得ないということである。たとえば、別々に切り替え可能なディスク・プールは、同一のタワー内に配置されたディスク・ユニットを有することができない。さらに別の規則は、切り替えられる予定のないディスク・ユニットは、切り替えられる予定のあるディスク・プールのためのディスク・ユニットを含む切り替え可能なハードウエア・エンティティ内に存在できないということである。たとえば、システムとともにとどまるディスク・ユニット(たとえば、システムASP、リソース・プールE 140のASP 32)は、切り替え可能なディスク・プール内のディスク・ユニット(たとえば、リソース・プールA 130のIASP 33)を伴う同じタワー内に存在することができない。さらに別の規則は、特定のシステムとの間において切り替えられることになる切り替え可能なディスク・プール内のディスク・ユニットは、それらの特定のシステムがアクセスすることのできるハードウエア・エンティティ内に存在しなければならないことを指定する。たとえば、バックアップ・システムへの切り替えが意図されているディスク・ユニットは、そのバックアップ・システムがアクセスできないタワー内に存在することができない。さらに別の規則は、同一ディスク・プール内のディスク・ユニットは、同一パワー・ドメイン内のハードウエア・エンティティの下になければならないことである(つまり、電源オン/オフがともになされる)。このほかの規則、たとえばシステムの制約に関係する規則等をDASD選択の妥当性の決定に使用することもできる。
一実施態様においては、そのサイトにおける有効なDASDが、ランク付けされた順序で表示される。妥当性インスペクタの出力は、次のうちの1つになる:すなわち、完全、有効、警告、および無効である。出力『完全』は、選択されたDASDが指定されたASPに関して最良のDASDであることを示す。出力『有効』は、そのDASDは最良のランキングを有していないが、そのDASDを指定されたASP内に入れることが可能であることを示す。出力『警告』は、指定されたASPに関して、そのDASDが無効のおそれがあるか、疑わしいことを示す。出力『無効』は、そのDASDを指定されたASP内に入れることができないことを示す。選択されたDASDならびにそのほかのコンフィギュレーション未済のDASDに関する詳細は、LdValidityForAspオブジェクト(つまり、後述するLdValidityForAspオブジェクト502)から獲得することができる。
一実施態様においては、有効なDASD選択のランク付けのために以下に示すファクタが使用される。第1に、1つのディスク・プールに関するディスク・ユニットが、好ましくは同一の切り替え可能なハードウエア・エンティティの下に維持される。第2に、プライマリおよび/またはバックアップ・システムが、好ましくは切り替え可能なハードウエア・エンティティへの直接アクセスを有する(つまり、ほかのエンティティを間に介さない)。第3に、1つのディスク・プールに関するディスク・ユニットが、好ましくは1つの切り替え可能なハードウエア・エンティティ内に包含される(つまり、切り替え可能なハードウエア・エンティティは、1を超える数のIASPを含まない)。なお、ここで理解されるように、上記のファクタが例示であり、別のファクタのセットを別のシステムに使用することができる。
別の実施態様においては、有効なDASDに加えて、無効なDASDを表示することができる。しかしながら、例の実施態様の方法300は、選択されたASPに関して、ユーザが無効なDASDを選択してコンフィギュレーションを行うことはできない。さらに別の実施態様においては、それぞれの無効なDASDが、選択されたASPに関してその無効なDASDが不適切な選択となる1ないしは複数の理由を伴って表示される。たとえば、切り替え可能性の理由とは別に、容量、保護、あるいはそのほかのシステム規則違反に起因して無効なDASDが無効とされることがある。ユーザは、この無効理由に従って無効なDASDを変更し、有効なDASDにすることができる(たとえば、DASDを適切な場所へ、物理的に移動する)。
ステップ350においては、この方法300が、ユーザによる、このASPに関する、ランキング順序内の1ないしは複数のコンフィギュレーション未済の有効なDASDの選択があるまでを待機する。ステップ360においては、方法300が、DSMサンドボックス、すなわちDASDストレージ・マネジメント・プログラム234に関するパラメータを保持するためのオブジェクトへこのDASD選択を渡す。このASP(またはIASP)に関する、選択された有効なDASDのコンフィギュレーションは、ステップ370において、この分野で周知のように完成されるものとしてもよく、その後、ステップ380においてこの方法300が終了する。
一実施態様においては、オブジェクト指向プログラミングを使用して方法300を具体化することができる。本発明の一実施態様に従ったソフトウエア・クラスの設計400および各ソフトウエア・クラスの役割の一例を図4に示す。関連するオブジェクトならびにクラスのメソッドについては、図5および7を参照してさらに詳しい説明を後述する。例示した設計400のソフトウエア・クラスは、DASD Management(DM:DASDマネジメント)クラス405、LdValidityForAspクラス410、ToyAspクラス415、ToyLdクラス420、HdwSwitchingCapabilitiesクラス430、SwitchableEntityクラス435、CRGM(Cluster Resource Group Management:クラスタ・リソース・グループ・マネジメント)クラス440、およびCRG(Cluster Resource Group:クラスタ・リソース・グループ)クラス445を含んでいる。
DASD Management(DM:DASDマネジメント)クラス405は、IASPのコンフィギュレーションのためのユーザ・インターフェースを提供する。一実施態様においては、DASD Management(DM:DASDマネジメント)クラス405が、LdValidityForAspオブジェクトおよびLdAdderサンドボックス・オブジェクトを作成することによってIASPコンフィギュレーションを具体化し、その後、そのサンドボックス内の各オブジェクト(ここでは、『ToyLd』と呼ぶ)のクエリ(query(ing))を行う。LdValidityForAsp(つまり、Logical DASD Validity For ASP:ASPに関する論理DASDの妥当性)クラス410は、LdValidityForAspオブジェクト内に、コンフィギュレーション未済のDASDに関する妥当性ならびにランキングの結果を保持する。
LdAdder(つまり、Logical DASD Adder:論理DASDアダー)クラス425は提案されたDASDならびにASPの選択を提供する。例示として、LdAdderクラス425は、選択されたASPを表すToyAsp(つまり、Toy ASP:トイASP)クラス415およびコンフィギュレーション未済のDASDを表すToyLd(つまり、Toy Logical DASD:トイ論理DASD)クラス420を含む。
HdwSwitchingCapabilities(つまり、Hardware Switching Capabilities:ハードウエア切り替えケイパビリティ)クラス430は、DASDが物理的に配置されているタワーの切り替え可能性を決定するための関数/メソッドを提供する。一実施態様においては、HdwSwitchingCapabilitiesクラス430が、isParentSwitchableメソッドを提供し、SwitchableEntityクラス435をサポートする。isParentSwitchableメソッドは、そのディスク・ユニットを含むエンティティが切り替え可能か否かを決定する。
SwitchableEntityクラス435は、切り替え可能性を評価するための関数/メソッド提供し、isResourceSwitchable関数、isResourceAccessible関数、およびevaluateEntities関数を含む。isResourceSwitchable関数は、そのIASPがクラスタ・リソース・グループ(CRG)内に定義されているかを決定する。isResourceAccessible関数は、CRGリカバリ・ドメイン(つまり、そのリソースを含むサイトのプライマリならびにバックアップ・システム)内のノードが、そのリソースへアクセスできるか否かを決定する。evaluateEntities関数は、そのエンティティが同一のCRG内にあるか否かを決定する。
CRGM(つまり、Cluster Resource Group Management:クラスタ・リソース・グループ・マネジメント)クラス440は、クラスタ・リソース・グループのマネジメントに関連する作成、追加、変更、削除、およびそのほかのオペレーションのための関数/サポートを含む。CRG(つまり、Cluster Resource Group:クラスタ・リソース・グループ)クラス445は、リソース(たとえば、IASP)のスイッチオーバおよびフェイルオーバをコントロールし、かつCRG内のノードおよびリソースのコンフィギュレーションを行うためのユーザ・インターフェースを提供する。一実施態様においては、CRGクラス445のオペレーションの具体化が、SwitchableEntityクラス435内に提供される関数を使用するクエリを含む。
本発明の一実施態様に従ってノードに作用を及ぼす一例の妥当性インスペクタ330に関する妥当性インスペクタのオブジェクト指向設計500を図5に示す。また、本発明の一実施態様に従ってノードに作用を及ぼす、選択されたASPに関する一例のコンフィギュレーション未済DASDの妥当性検査およびランキングのプロセッシング・フロー600を図6に示す。プロセッシング・フロー600は、ステップ330における妥当性インスペクタの具体化として理解することができる。
方法600は、ステップ602において開始し、ステップ605に進んで、LdValidityForAspオブジェクト502ならびにLdAdderサンドボックス510を作成する。LdValidityForAspオブジェクト502は、切り替え可能性の結果を保持しており、それには、このノードを含んでいるサイトに配置されたコンフィギュレーション未済のDASDの妥当性およびランキングが含まれる。LdAdderサンドボックス510は、提案されたASPオブジェクト545(たとえば、コンフィギュレーションが行われたときに、ノードおよびリソースのコンフィギュレーション800のリソース・プールE 140およびリソース・プールA 130にそれぞれ対応することになるToyAsp 32 545およびToyAsp 33 545)およびハードウエアDASDのソフトウエア等価オブジェクト(たとえば、ToyLd 505、すなわち図示されているように、DASD 11 802、DASD 12 804、DASD 13 806、DASD 14 808、DASD 21 810、DASD 22 812を含む、DASDごとに1つのToyLd)を保持する。
ステップ610においては、方法600が、指定されたASPへのコンフィギュレーションに関して、LdAdderサンドボックス510内の各ToyLd 505(つまり、各コンフィギュレーション未済のDASD)のクエリを行う。このクエリは、DASD Management 515により、validToBeInAsp関数520を介して各ToyLdオブジェクト505上において起動される。ステップ615においては、続いて各ToyLd 505が、そのToyLd 505に対応するDASDを物理的に包含するハードウエア・エンティティ(たとえば、親エンティティ)の切り替えケイパビリティを提供する、それぞれの対応するHdwSwitchingCapabilitiesオブジェクト525のクエリを行う。ハードウエア・エンティティの切り替えケイパビリティは、isParentSwitchable関数530を介して提供される。
その後この方法600は、ステップ620において、SwitchabilityEntityオブジェクト535のクエリを行って、そのリソース(つまり、処理中のToyLdに対応するDASDを含むディスク・プール)が切り替え可能か否かを決定する。SwitchableEntityオブジェクト535が、CRGオブジェクト540のクエリを行って、そのリソース(たとえばToyAsp 33)がCRG内において定義されているか否かを決定する。たとえば、ToyLd DASD 11について、SwitchableEntityオブジェクト535は、リソースToyAsp 33が切り替え可能IASPとしてCRG内に定義されているか否か(たとえば、リソース550)を決定する。
次に、ステップ625において、そのリソースが切り替え可能である場合に(つまり、そのリソースがCRG内において定義されたIASPである場合に)この方法は、ステップ630および635に進んで追加のクエリを行う。ステップ630においてこの方法600は、クエリを行ってCRGリカバリ・ドメイン555(つまり、そのリソースを含んでいるサイトに配置されたプライマリ・システムおよびバックアップ・システム)内のノードが、そのリソースへアクセス可能か否かを決定し、さらにステップ635においては、方法600が、そのエンティティ(たとえば、リソースおよびノード・システム)が同じCRG内において定義されているか否かの評価を行う。たとえば、リソースと異なるサイトに配置されているノードは、そのリソースへアクセスする必要がない。続いてステップ640において、コンフィギュレーション未済のDASDの切り替え可能性の結果がLdValidityForAspオブジェクト502へ返される。ステップ625に戻って参照するが、リソースが切り替え可能でない場合には、方法600がステップ640へ進み、コンフィギュレーション未済のDASDの切り替え可能性の結果をLdValidityForAspオブジェクト502へ返す。その後ステップ650において、この方法600が終了する。
別の実施態様においては、コンピュータ・システム200のオペレーティング・システム228はまた、クラスタ内の2もしくはそれを超える数のコンピュータ・システムのクラスタリングを行うためにクラスタ・ユーザ・インターフェース・プログラム234を含んでいる。その場合においても妥当性インスペクタを起動して、クラスタ・ユーザ・インターフェース・プログラム234の特定のオペレーションを実行することができる。本発明の一実施態様に従ったオペレーションのクラスタリングのためのIASPの切り替え可能性のチェックに使用される一例のソフトウエア・オブジェクトのセットを図7に示す。概して言えば、以下の実施態様のそれぞれにおいては、CRGMオブジェクト710が、SwitchableEntityオブジェクト720内の1ないしは複数の関数を起動し、それが、CRGオブジェクト730を介してオペレーションのクラスタリングの妥当性を検査する。
一実施態様においては、CRGのリカバリ・ドメインへノードを追加するとき、提案された新しいノードがそのIASP(1ないしは複数)内のDASDに対するアクセスを有しているか否かについてCRGMがチェックする。CRGMのadd_node_to_recovery_domain関数712は、isResourceAccessible関数722を起動し、提案された新しいノードならびに現存するIASP(1ないしは複数)を含むパラメータを渡す。isResourceAccessible関数722は、Resourceオブジェクト732内のIASPおよびRecoveryDomainオブジェクト734内のノードをチェックし、提案された新しいノードが、そのノードが属するサイトのIASP内のDASDへのアクセスを有するか否かを決定する。提案された新しいノードがそのIASP内のDASDへアクセスできる場合に、ユーザは、このCRGMオペレーションを完成することが可能になる。提案された新しいノードがそのIASP内のDASDへのアクセスを有していない場合には、提案された新しいノードのコンフィギュレーションを行っているユーザに警告が表示される。
別の実施態様においては、CRGへIASPを追加するとき、CRGMが、指定されたリカバリ・ドメイン内のすべてのノードが、追加されることになるIASP内のDASDに対するアクセスを有するか否かについてチェックする。CRGMのadd_iasp関数714がisResourceAccessible関数722を起動し、提案された新しいIASPならびに指定のリカバリ・ドメイン内の現存するノードを含むパラメータを渡す。isResourceAccessible関数722は、Resourceオブジェクト732内のIASPおよびRecoveryDomainオブジェクト734内のノードをチェックし、そのリソースのサイトにある指定されたリカバリ・ドメイン内のすべてのノードが、追加されることになるIASP内のDASDに対するアクセスを有するか否かについてチェックする。それを有している場合に、ユーザは、このCRGMオペレーションを完成することが可能になる。それを有していない場合には、提案された新しいIASPのコンフィギュレーションを行っているユーザに警告が表示される。
CRGへIASPを追加するとき、CRGMは、ほかのいずれかのCRGが、そのIASPを含む同一の切り替え可能なエンティティ(たとえば,切り替え可能なタワー)を有しているか否かについてチェックすることもできる。CRGMのadd_iasp関数714が、getEntities関数724を起動して、提案された新しいIASPに関するSwitchableEntity(1ないしは複数)を検索する。続いてCRGMは、ほかの現存するCRGをサーチし、ほかのいずれかのCRGが同一の切り替え可能なエンティティを有しているか否かを決定する。ほかのいずれのCRGも同一の切り替え可能なエンティティを有していない場合に、ユーザは、このCRGMオペレーションを完成することが可能になる。ほかのCRGが同一の切り替え可能なエンティティを有している場合には、CRGへの提案されたIASPの追加を行っているユーザに対して警告が表示される。
別の実施態様においては、IASPのCRGを開始するとき(つまり、クラスタリングを開始するとき)、CRGMが、そのIASPの切り替え可能性について検査する。この追加の妥当性検査は、ハードウエアの再配置(たとえば、ケーブルおよびディスク・ユニットの移動)に起因する潜在的な切り替え可能性のエラー検出を提供する。また、この追加の妥当性検査は、不適切なDASDコンフィギュレーション(たとえば、クラスタリングがアクティブになってなく、ユーザが、コンフィギュレーション警告を無視してDASDのコンフィギュレーションを行ったとき)に起因するエラーも検出する。CRGMのstart_clustering関数716は、isResourceAccessible関数722を起動し、Resourceオブジェクト732内の現存するIASP(1ないしは複数)を含むパラメータを渡す。isResourceAccessible関数722は、Resourceオブジェクト732内のIASPおよびRecoveryDomainオブジェクト734内のノードをチェックし、そのリカバリ・ドメイン内の同一サイトのすべてのノードが、そのIASP内のDASDに対するアクセスを有するか否かを決定する。それを有している場合に、ユーザは、CRGMのstart_clustering関数を完成することが可能になる。それを有していない場合には、クラスタリング・オペレーションを試みているユーザに対して警告が表示される。
本発明の実施態様は、複数の地理的ロケーションの間に分散されるコンピュータ・システム・グループ100内に組み込まれる。全体のコンピュータ・システム・グループ100を構成するノードは、任意の組み合わせに従って複数の地理的ロケーションの間に分散され得る。2もしくはそれを超えるノードが配置された地理的ロケーション、またはサイトは、これに述べているように、クラスタ・リソース・グループ内においてコンフィギュレーションが可能であり、それらのサイトに配置されるリソースを含むリカバリ・ドメインの一部として動作することができる。それに代えて、サイトは、そのサイトにおけるリソースをコントロールする唯一のノードを持つことができる。これは、そのサイトにおけるその1つのノードの故障が、別のサイトのノードへのフェイルオーバをもたらすことができるため、全体のコンピューティング・システム・グループの可用性を維持しつつ、それぞれのサイトに複数のノードを要求しないことによって、コストの削減を可能にする。単一のコンピューティング・システムのノードを伴うサイトの別の利点は、そのサイトが切り替え可能ハードウエアを必要としないことである。
本発明の一実施態様に従った初期コンフィギュレーションのプロセッシング・フロー900の例を図9に示す。例示した初期コンフィギュレーションのプロセッシング・フロー900は、単一ノードを有するサイト・コンフィギュレーションに適合しており、しかもより可用性の高い複数のノードを有するサイトのコンフィギュレーションを保証する。例示した初期コンフィギュレーションのプロセッシング・フロー900は、ステップ902において開始し、ステップ904へ進んで、現在のサイトが1を超える数のノードを有するか否かを決定する。このサイトが1を超える数のノードしている場合には、プロセッシングがステップ908へ進み、このサイトに配置されるリソースに関するリカバリ・ドメインを伴うサイトにおいてノードのコンフィギュレーションを行う。このサイトが1つのノードだけを有している場合には、プロセッシングがステップ906へ進み、このサイトのリソースをホストするべくそのノードのコンフィギュレーションを行う。このサイトのノードのコンフィギュレーションの後は、ステップ910へ進み、コンピューティング・システム・グループ100のメンバとしてサイトのノードのオペレーションを行うことによってプロセッシングが継続される。
(限定を意図しないソフトウエアおよびハードウエアの例)
本発明の実施態様は、たとえば図1に示し、ここで説明したクラスタ・コンピューティング環境等のコンピュータ・システムとともに使用するためのプログラム・プロダクトとして具体化することができる。プログラム・プロダクトのプログラム(1ないしは複数)は、これらの実施態様(ここで述べた方法を含む)の関数を定義し、各種の信号担持メディア上に包含させることができる。信号担持メディアの例としては、限定を意図するわけではないが;(i)情報を永久的にストアする書き込み禁止ストレージ・メディア(たとえば、CD‐ROMドライブによって読み出すことが可能なCD‐ROMディスク等のコンピュータ内の読み出し専用メモリ・デバイス);(ii)情報を変更可能にストアする書き込み可能なストレージ・メディア(たとえばフレキシブル・ディスク・ドライブ内のフレキシブル・ディスクまたはハードディスク・ドライブ);または(iii)コンピュータへ情報を伝達する、たとえば、ワイヤレス通信を含むコンピュータ・ネットワークまたは電話ネットワークを介した通信メディアが挙げられる。最後の実施態様は、特に、インターネットもしくはそのほかのネットワークからの情報のダウンロードを含む。この種の信号担持メディアが、本発明の機能を伝えるコンピュータ可読インストラクションを運ぶとき、本発明の実施態様を表すことになる。
概して、本発明の実施態様を具体化するために実行されるルーチンは、オペレーティング・システムの一部として具体化されるか、あるいは特定のアプリケーション、コンポーネント、プログラム、モジュール、オブジェクト、またはインストラクションのシーケンスとして具体化されるかによらず、ここで『プログラム』と呼ぶことができる。コンピュータ・プログラムは、通常、ネイティブ・コンピュータによって機械可読フォーマットに、したがって、実行可能インストラクションに翻訳されることになる複数のインストラクションからなる。またプログラムは、プログラムに対してローカルに常駐するか、あるいはメモリ内もしくはストレージ・デバイス上に見つかる変数およびデータ構造を包含している。それに加えて、ここに述べた各種のプログラムは、本発明の特定の実施態様においてそれらが具体化される対称となる応用に基づいて識別することができる。しかしながら、いかなる特定のプログラムの名前も便宜上使用されているだけであり、したがって、本発明が、その種の名前によって識別および/または含意される特定の応用における使用にのみ限定されないことを認識する必要がある。
さらに、通常はコンピュータ・プログラムをルーチン、プロシージャ、メソッド、モジュール、オブジェクト等々に系統化し得る方法が無数にあることはもとより、一般のコンピュータ内に常駐する各種のソフトウエア・レイヤ間にプログラムの機能を割り付ける各種の方法があることを考えれば(たとえば、オペレーティング・システム、ライブラリ、API、アプリケーション、アプレット等)、次のことも明らかである。本発明が、ここに述べられている特定の系統化および割り付け、またはプログラムの機能に限定されないことを認識される必要がある。
本発明は、ハードウエア、ソフトウエア、もしくはハードウエアとソフトウエアの組み合わせにおいて実現することができる。本発明の好ましい実施態様に従ったシステムは、1つのコンピュータ・システム内に集約された態様で、あるいは分散された態様で、すなわち各種のエレメントがいくつかの相互接続されたコンピュータ・システムにわたって分散される態様で実現することが可能である。任意の種類のコンピュータ・システム、もしくはそのほかの、ここに述べられている方法を実施するために適合された装置が適している。代表的なハードウエアとソフトウエアの組み合わせを、ロードされて実行されたときに、ここに述べられている方法をコンピュータが実施するようにコンピュータ・システムをコントロールするコンピュータ・プログラムを伴った汎用コンピュータ・システムとすることができる。
各コンピュータ・システムは、特に、1ないしは複数のコンピュータおよび少なくとも1つの信号担持メディア(signal bearing media)、すなわちコンピュータがデータ、インストラクション、メッセージもしくはメッセージ・パケット、およびそのほかの情報を担持する信号をそこから読み取ることのできる信号担持メディアを含むものとすることができる。信号担持メディアには、ROM、フラッシュ・メモリ、ディスク・ドライブ・メモリ、CD‐ROM、およびそのほかの永久ストレージ等の不揮発性メモリを含めることができる。それに加えて、コンピュータ・メディアに、たとえば、RAM、バッファ、キャッシュ・メモリ、およびネットワーク回路等の揮発性ストレージを含めてもよい。さらに、信号担持メディアは、有線ネットワークもしくはワイヤレス・ネットワークを含めたネットワーク・リンクおよび/またはネットワーク・インターフェース等の一時的状態メディア内に情報を担持する信号であって、コンピュータがその種の情報を担持する信号を読み取ることが可能な信号を包含することができる。
以上のとおり、本発明の特定の実施態様を開示してきたが、当業者であれば理解されるように、本発明の精神ならびに範囲から逸脱することなしに、特定の実施態様に対して変更を行うことは可能である。したがって、本発明の範囲は、これらの特定の実施態様に限定されない。さらに、付随する特許請求の範囲には、その種の応用、修正、および本発明の範囲内に含まれる実施態様をすべて保護することが意図されている。
まとめとして、本発明の構成に関して以下の事項を開示する。
(1)ノード内のリソースのマネジメントを行うための方法において:ノードによる使用に関して少なくとも1つのリソースのコンフィギュレーションを行うことであって、前記ノードは、前記リソースを含むサイトに関連付けされているものとすること;リソース・プールに関して、前記少なくとも1つのリソースの可用性の検査を行うことであって、前記ノードによるアクセス可能性の決定および前記リソースが前記サイトに配置されていることの検証を含む前記検査を行うこと;および、前記検査に基づいて、前記リソース・プールに関して、前記少なくとも1つのリソースのうちの少なくとも1つを選択すること;を含む方法。
(2)前記少なくとも1つのリソースは、少なくとも1つのディスク・ユニットを包含するものとし、かつ前記方法は、さらに:前記リソース・プールを切り替え可能なディスク・プールとしてコンフィギュレーションを行うこと;を含むものとする、上記(1)に記載の方法。
(3)前記ノードは、前記サイトに配置される単一のノードであり、前記ノードは、地理的に分散されたコンピューティング・システム・グループの一部として動作するものとする、上記(1)に記載の方法。
(4)前記少なくとも1つのリソースは、少なくとも1つのディスク・ユニットを包含するものとし、かつ前記方法は、さらに:前記リソース・プールに関して、各ディスク・ユニットの可用性のランキングを行うこと;および、前記可用性のランキングに従って前記リソース・プールに関して少なくとも1つの有効なディスク・ユニットを選択すること;を含むものとする、上記(1)に記載の方法。
(5)さらに:少なくとも1つの理由をユーザへ提供し、各ディスク・ユニットの妥当性およびランキングを説明すること;を含むものとする、上記(4)に記載の方法。
(6)前記ノードは、クラスタ・リソース・グループの一部であるとする、上記(1)に記載の方法。
(7)前記クラスタ・リソース・グループは、プライマリ・ノードおよび少なくとも1つのバックアップ・ノードを包含するものとする、上記(6)に記載の方法。
(8)さらに:クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記リソース・プール内のリソースの可用性の検査を行うことを含み、それにおいて前記検査は、前記ノードが前記リソース・プールを含むサイトに関連付けされていることの決定を含むものとする、上記(6)に記載の方法。
(9)さらに:切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記サイトに配置された前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性の検証を行うこと;を含むものとする、上記(6)に記載の方法。
(10)前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティは、別のクラスタ・リソース・グループ内に含まれないものとする、上記(9)に記載の方法。
(11)さらに:クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性の検査を行うこと;を含むものとする、上記(6)に記載の方法。
(12)プロセッサによって実行されたときに、ノード内のリソースのマネジメントに関するオペレーションを行うプログラムを包含する信号担持メディアにおいて、前記オペレーションが:ノードによる使用に関して少なくとも1つのリソースのコンフィギュレーションを行うことであって、前記ノードは、前記リソースを含むサイトに関連付けされているものとすること;リソース・プールに関して、前記少なくとも1つのリソースの可用性の検査を行うことであって、前記ノードによるアクセス可能性の決定および前記リソースが前記サイトに配置されていることの検証を含む前記検査を行うこと;および、前記検査に基づいて、前記リソース・プールに関して、前記少なくとも1つのリソースのうちの少なくとも1つを選択すること;を含むものとする、信号担持メディア。
(13)さらに前記ステップが:前記リソース・プールを切り替え可能なディスク・プールとしてコンフィギュレーションを行うこと;を含むものとする、上記(12)に記載の信号担持メディア。
(14)前記ノードは、前記サイトに配置される単一のノードであり、前記ノードは、地理的に分散されたコンピューティング・システム・グループの一部として動作するものとする、上記(12)に記載の信号担持メディア。
(15)さらに前記ステップが:前記リソース・プールに関して、各リソースのランクキングを行うこと;および、前記ランキングの結果に従って前記リソース・プールに関して少なくとも1つの有効なリソースを選択すること;を含むものとする、上記(12)に記載の信号担持メディア。
(16)さらに前記ステップが:少なくとも1つの理由をユーザへ提供し、各リソースの妥当性およびランキングを説明すること;を含むものとする、上記(15)に記載の信号担持メディア。
(17)前記ノードは、クラスタ・リソース・グループの一部であるとする、上記(12)に記載の信号担持メディア。
(18)さらに前記ステップが:前記クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記リソース・プール内のリソースの可用性の検査を行うこと;を含むものとする、上記(17)に記載の信号担持メディア。
(19)さらに前記ステップが:切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性の検証を行うこと;を含むものとする、上記(17)に記載の信号担持メディア。
(20)さらに前記ステップが:前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティが、別のクラスタ・リソース・グループ内に含まれないことを検証すること;を含むものとする、上記(17)に記載の信号担持メディア。
(21)さらに前記ステップが:クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性の検査を行うこと;を含むものとする、上記(17)に記載の信号担持メディア。
(22)サイトに関連付けされたプライマリ・ノード;前記プライマリ・ノードに接続されたリソース・プール;および、前記リソース・プールに関して、少なくとも1つのリソースの可用性の検査を行い、かつ前記リソース・プールに関して、少なくとも1つの有効なリソースを選択するべくコンフィギュレーションが行われたプロセッサを備え、前記可用性は、前記サイトに配置されている前記少なくとも1つのリソースを、少なくとも部分的に基礎として検査されるものとするシステム。
(23)前記プロセッサは、さらに、前記リソース・プールに関して各リソースのランキングを行い、かつランキングに従って前記リソース・プールに関して少なくとも1つの有効なリソースを選択するべくコンフィギュレーションが行われているものとする、上記(22)に記載のシステム。
(24)前記プロセッサは、さらに、少なくとも1つの理由をユーザへ提供し、各リソースの妥当性およびランキングを説明するべくコンフィギュレーションが行われているものとする、上記(23)に記載のシステム。
(25)前記リソース・プールは、切り替え可能なリソース・プールとしてコンフィギュレーションが行われるものとする、上記(22)に記載のシステム。
(26)さらに、前記切り替え可能なリソース・プールに接続された少なくとも1つのバックアップ・ノードを備えるものとする、上記(25)に記載のシステム。
(27)前記プロセッサは、さらに、前記クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記切り替え可能なリソース・プール内の各リソースのアクセス可能性を検査するべくコンフィギュレーションが行われているものとする、上記(25)に記載のシステム。
(28)前記プロセッサは、さらに、前記切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性を検証するべくコンフィギュレーションが行われているものとする、上記(25)に記載のシステム。
(29)前記プロセッサは、さらに、前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティが、別のクラスタ・リソース・グループ内に含まれないことを検証するべくコンフィギュレーションが行われているものとする、上記(25)に記載のシステム。
(30)前記プロセッサは、さらに、クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性を検査するべくコンフィギュレーションが行われているものとする、上記(25)に記載のシステム。
本発明の一例の実施態様の全体的なシステム・アーキテクチャを例示したコンピューティング・システム・グループのブロック図である。 本発明の一例の実施態様に従った、図1に示されているグループのグループ・メンバを図示したブロック図である。 本発明の一例の実施態様に従った、ASPに関して1ないしは複数のDASDを選択するプロセスを示したフローチャートである。 本発明の一例の実施態様に従った、ソフトウエア・クラスの設計および各ソフトウエア・クラスの役割の一例を示した説明図である。 本発明の一例の実施態様に従った、一例の妥当性インスペクタに関する妥当性インスペクタのオブジェクト指向設計を示した説明図である。 本発明の一例の実施態様に従った、選択されたASPに関する一例のコンフィギュレーション未済DASDの妥当性検査およびランキングのプロセスを示したフローチャートである。 本発明の一例の実施態様に従った、オペレーションのクラスタリングのためのIASPの切り替え可能性のチェックに使用される一例のソフトウエア・オブジェクトのセットを示した説明図である。 本発明の一例の実施態様に従った、図1のサイトに関するノードおよびリソースのコンフィギュレーションを示したブロック図である。 本発明の一例の実施態様に従った、初期コンフィギュレーションのプロセスを示したフローチャートである。
符号の説明
100 コンピュータ・システム・グループ/コンピューティング・システム・グループ
102 サイトA
104 サイトB
106 データ通信ネットワーク
108 ノードB
110 ノードA
112 ノードC
114 ノードD
116 リソースA
118 リソースB
120 リソースZ
121 リソースC
122 リソースD
124 リソースY
126 サイト間通信システム
130 リソース・プールA
132 リソース・プールB
140 リソース・プールE
200 グループ・メンバ/コンピュータ・システム
202 CPU/プロセッサ
204 メイン・メモリ
206 大容量ストレージ・インターフェース
208 端末インターフェース
210 ネットワーク・インターフェース
212 システム・バス
214 DASDデバイス
216 フレキシブル・ディスク
218 端末
220 アプリケーション・プログラム
222 オブジェクト
226 データ
228 オペレーティング・システム/オペレーティング・システムのイメージ
230 DASDマネジメント・ユーザ・インターフェース・プログラム
232 DASDストレージ・マネジメント・プログラム/DSMプログラム
234 クラスタ・ユーザ・インターフェース・プログラム/グループ・ユーザ・インターフェース・プログラム
240 ステーションA
242 ステーションB
300 フローチャート/方法
330 妥当性インスペクタ
400 設計
405 DASD Management(DM)クラス
410 LdValidityForAspクラス
415 ToyAspクラス
420 ToyLdクラス
425 LdAdderクラス
430 HdwSwitchingCapabilitiesクラス
435 SwitchableEntityクラス
440 CRGMクラス
445 CRGクラス
500 設計
502 LdValidityForAspオブジェクト
505 ToyLdオブジェクト
510 LdAdderサンドボックス
515 DASD Management
520 validToBeInAsp関数
525 HdwSwitchingCapabilitiesオブジェクト
530 isParentSwitchable関数
535 SwitchabilityEntityオブジェクト/SwitchableEntityオブジェクト
540 CRGオブジェクト
545 ASPオブジェクト/ToyAsp 32/ToyAsp 33
550 リソース
555 CRGリカバリ・ドメイン
600 プロセッシング・フロー/方法
710 CRGMオブジェクト
712 add_node_to_recovery_domain関数
714 add_iasp関数
716 start_clustering関数
720 SwitchableEntityオブジェクト
722 isResourceAccessible関数
724 getEntities関数
730 CRGオブジェクト
732 Resourceオブジェクト
734 RecoveryDomainオブジェクト
800 ノードおよびリソースのコンフィギュレーション
802 DASD 11
804 DASD 12
806 DASD 13
808 DASD 14
810 DASD 21
812 DASD 22
820 クラスタ・マネジメント・コンピュータ・システム
900 プロセッシング・フロー

Claims (30)

  1. ノード内のリソースのマネジメントを行うための方法において:
    ノードによる使用に関して少なくとも1つのリソースのコンフィギュレーションを行うことであって、前記ノードは、前記リソースを含むサイトに関連付けされているものとすること;
    リソース・プールに関して、前記少なくとも1つのリソースの可用性の検査を行うことであって、前記ノードによるアクセス可能性の決定および前記リソースが前記サイトに配置されていることの検証を含む前記検査を行うこと;および、
    前記検査に基づいて、前記リソース・プールに関して、前記少なくとも1つのリソースのうちの少なくとも1つを選択すること;
    を含む方法。
  2. 前記少なくとも1つのリソースは、少なくとも1つのディスク・ユニットを包含するものとし、かつ前記方法は、さらに:
    前記リソース・プールを切り替え可能なディスク・プールとしてコンフィギュレーションを行うこと;
    を含むものとする、請求項1に記載の方法。
  3. 前記ノードは、前記サイトに配置される単一のノードであり、前記ノードは、地理的に分散されたコンピューティング・システム・グループの一部として動作するものとする、請求項1に記載の方法。
  4. 前記少なくとも1つのリソースは、少なくとも1つのディスク・ユニットを包含するものとし、かつ前記方法は、さらに:
    前記リソース・プールに関して、各ディスク・ユニットの可用性のランキングを行うこと;および、
    前記可用性のランキングに従って前記リソース・プールに関して少なくとも1つの有効なディスク・ユニットを選択すること;
    を含むものとする、請求項1に記載の方法。
  5. さらに:
    少なくとも1つの理由をユーザへ提供し、各ディスク・ユニットの妥当性およびランキングを説明すること;
    を含むものとする、請求項4に記載の方法。
  6. 前記ノードは、クラスタ・リソース・グループの一部であるとする、請求項1に記載の方法。
  7. 前記クラスタ・リソース・グループは、プライマリ・ノードおよび少なくとも1つのバックアップ・ノードを包含するものとする、請求項6に記載の方法。
  8. さらに:
    クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記リソース・プール内のリソースの可用性の検査を行うことを含み、それにおいて前記検査は、前記ノードが前記リソース・プールを含むサイトに関連付けされていることの決定を含むものとする、請求項6に記載の方法。
  9. さらに:
    切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記サイトに配置された前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性の検証を行うこと;
    を含むものとする、請求項6に記載の方法。
  10. 前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティは、別のクラスタ・リソース・グループ内に含まれないものとする、請求項9に記載の方法。
  11. さらに:
    クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性の検査を行うこと;
    を含むものとする、請求項6に記載の方法。
  12. プロセッサによって実行されたときに、ノード内のリソースのマネジメントに関するオペレーションを行うプログラムを包含する信号担持メディアにおいて、前記オペレーションが:
    ノードによる使用に関して少なくとも1つのリソースのコンフィギュレーションを行うことであって、前記ノードは、前記リソースを含むサイトに関連付けされているものとすること;
    リソース・プールに関して、前記少なくとも1つのリソースの可用性の検査を行うことであって、前記ノードによるアクセス可能性の決定および前記リソースが前記サイトに配置されていることの検証を含む前記検査を行うこと;および、
    前記検査に基づいて、前記リソース・プールに関して、前記少なくとも1つのリソースのうちの少なくとも1つを選択すること;
    を含むものとする、信号担持メディア。
  13. さらに前記ステップが:
    前記リソース・プールを切り替え可能なディスク・プールとしてコンフィギュレーションを行うこと;
    を含むものとする、請求項12に記載の信号担持メディア。
  14. 前記ノードは、前記サイトに配置される単一のノードであり、前記ノードは、地理的に分散されたコンピューティング・システム・グループの一部として動作するものとする、請求項12に記載の信号担持メディア。
  15. さらに前記ステップが:
    前記リソース・プールに関して、各リソースのランクキングを行うこと;および、
    前記ランキングの結果に従って前記リソース・プールに関して少なくとも1つの有効なリソースを選択すること;
    を含むものとする、請求項12に記載の信号担持メディア。
  16. さらに前記ステップが:
    少なくとも1つの理由をユーザへ提供し、各リソースの妥当性およびランキングを説明すること;
    を含むものとする、請求項15に記載の信号担持メディア。
  17. 前記ノードは、クラスタ・リソース・グループの一部であるとする、請求項12に記載の信号担持メディア。
  18. さらに前記ステップが:
    前記クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記リソース・プール内のリソースの可用性の検査を行うこと;
    を含むものとする、請求項17に記載の信号担持メディア。
  19. さらに前記ステップが:
    切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性の検証を行うこと;
    を含むものとする、請求項17に記載の信号担持メディア。
  20. さらに前記ステップが:
    前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティが、別のクラスタ・リソース・グループ内に含まれないことを検証すること;
    を含むものとする、請求項17に記載の信号担持メディア。
  21. さらに前記ステップが:
    クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性の検査を行うこと;
    を含むものとする、請求項17に記載の信号担持メディア。
  22. サイトに関連付けされたプライマリ・ノード;
    前記プライマリ・ノードに接続されたリソース・プール;および、
    前記リソース・プールに関して、少なくとも1つのリソースの可用性の検査を行い、かつ前記リソース・プールに関して、少なくとも1つの有効なリソースを選択するべくコンフィギュレーションが行われたプロセッサを備え、前記可用性は、前記サイトに配置されている前記少なくとも1つのリソースを、少なくとも部分的に基礎として検査されるものとするシステム。
  23. 前記プロセッサは、さらに、前記リソース・プールに関して各リソースのランキングを行い、かつランキングに従って前記リソース・プールに関して少なくとも1つの有効なリソースを選択するべくコンフィギュレーションが行われているものとする、請求項22に記載のシステム。
  24. 前記プロセッサは、さらに、少なくとも1つの理由をユーザへ提供し、各リソースの妥当性およびランキングを説明するべくコンフィギュレーションが行われているものとする、請求項23に記載のシステム。
  25. 前記リソース・プールは、切り替え可能なリソース・プールとしてコンフィギュレーションが行われるものとする、請求項22に記載のシステム。
  26. さらに、前記切り替え可能なリソース・プールに接続された少なくとも1つのバックアップ・ノードを備えるものとする、請求項25に記載のシステム。
  27. 前記プロセッサは、さらに、前記クラスタ・リソース・グループのリカバリ・ドメインへノードを追加するときに、前記切り替え可能なリソース・プール内の各リソースのアクセス可能性を検査するべくコンフィギュレーションが行われているものとする、請求項25に記載のシステム。
  28. 前記プロセッサは、さらに、前記切り替え可能なリソース・プールを前記クラスタ・リソース・グループへ追加するとき、前記切り替え可能なリソース・プール内の各リソースの、前記クラスタ・リソース・グループのリカバリ・ドメイン内の各ノードによるアクセス可能性を検証するべくコンフィギュレーションが行われているものとする、請求項25に記載のシステム。
  29. 前記プロセッサは、さらに、前記切り替え可能なリソース・プールを包含する切り替え可能なエンティティが、別のクラスタ・リソース・グループ内に含まれないことを検証するべくコンフィギュレーションが行われているものとする、請求項25に記載のシステム。
  30. 前記プロセッサは、さらに、クラスタリングの開始時に、前記切り替え可能なリソース・プールの切り替え可能性を検査するべくコンフィギュレーションが行われているものとする、請求項25に記載のシステム。
JP2004173796A 2003-07-31 2004-06-11 地理的ミラーリングに関するリソースの妥当性検査およびランキングのための方法および装置 Pending JP2005056392A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/631,936 US20050044226A1 (en) 2003-07-31 2003-07-31 Method and apparatus for validating and ranking resources for geographic mirroring

Publications (1)

Publication Number Publication Date
JP2005056392A true JP2005056392A (ja) 2005-03-03

Family

ID=34193513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004173796A Pending JP2005056392A (ja) 2003-07-31 2004-06-11 地理的ミラーリングに関するリソースの妥当性検査およびランキングのための方法および装置

Country Status (4)

Country Link
US (1) US20050044226A1 (ja)
JP (1) JP2005056392A (ja)
CN (1) CN1313929C (ja)
TW (1) TW200513871A (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680933B2 (en) * 2003-12-15 2010-03-16 International Business Machines Corporation Apparatus, system, and method for on-demand control of grid system resources
US8332483B2 (en) * 2003-12-15 2012-12-11 International Business Machines Corporation Apparatus, system, and method for autonomic control of grid system resources
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
WO2005089235A2 (en) 2004-03-13 2005-09-29 Cluster Resources, Inc. System and method providing object messages in a compute environment
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
US7383430B1 (en) * 2004-07-29 2008-06-03 Emc Corporation System and method for validating resource groups
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
US7765369B1 (en) 2004-11-05 2010-07-27 Commvault Systems, Inc. Method and system for selectively deleting stored data
CA2827035A1 (en) 2004-11-08 2006-05-18 Adaptive Computing Enterprises, Inc. System and method of providing system jobs within a compute environment
US8631130B2 (en) 2005-03-16 2014-01-14 Adaptive Computing Enterprises, Inc. Reserving resources in an on-demand compute environment from a local compute environment
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
US9015324B2 (en) * 2005-03-16 2015-04-21 Adaptive Computing Enterprises, Inc. System and method of brokering cloud computing resources
WO2006108187A2 (en) 2005-04-07 2006-10-12 Cluster Resources, Inc. On-demand access to compute resources
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US9466036B1 (en) * 2012-05-10 2016-10-11 Amazon Technologies, Inc. Automated reconfiguration of shared network resources
US9672264B2 (en) * 2015-01-26 2017-06-06 Netapp, Inc. Method and system for backup verification
US9917740B2 (en) 2015-09-09 2018-03-13 International Business Machines Corporation Reducing internodal communications in a clustered system
US11593223B1 (en) 2021-09-02 2023-02-28 Commvault Systems, Inc. Using resource pool administrative entities in a data storage management system to provide shared infrastructure to tenants

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE511848C2 (sv) * 1994-09-12 1999-12-06 Ericsson Telefon Ab L M Resursseparering i ett tjänste- och förbindelseseparerat nät
US5937189A (en) * 1996-11-12 1999-08-10 International Business Machines Corporation Object oriented framework mechanism for determining configuration relations
US6151688A (en) * 1997-02-21 2000-11-21 Novell, Inc. Resource management in a clustered computer system
US5983316A (en) * 1997-05-29 1999-11-09 Hewlett-Parkard Company Computing system having a system node that utilizes both a logical volume manager and a resource monitor for managing a storage pool
US6493804B1 (en) * 1997-10-01 2002-12-10 Regents Of The University Of Minnesota Global file system and data storage device locks
US6317815B1 (en) * 1997-12-30 2001-11-13 Emc Corporation Method and apparatus for formatting data in a storage device
FI981028A (fi) * 1998-05-08 1999-11-09 Ericsson Telefon Ab L M Palvelun tarjoajalle pääsymenetelmä ja -laite
US6389459B1 (en) * 1998-12-09 2002-05-14 Ncr Corporation Virtualized storage devices for network disk mirroring applications
US6260125B1 (en) * 1998-12-09 2001-07-10 Ncr Corporation Asynchronous write queues, reconstruction and check-pointing in disk-mirroring applications
US7203732B2 (en) * 1999-11-11 2007-04-10 Miralink Corporation Flexible remote data mirroring
US6745305B2 (en) * 2000-12-13 2004-06-01 Ncr Corporation Zeroed block optimization in disk mirroring applications
US6728818B2 (en) * 2001-06-27 2004-04-27 International Business Machines Corporation Dual storage adapters utilizing clustered adapters supporting fast write caches
US6675259B2 (en) * 2001-07-26 2004-01-06 International Business Machines Corporation Method and apparatus for validating and ranking disk units for switching
US20030135609A1 (en) * 2002-01-16 2003-07-17 Sun Microsystems, Inc. Method, system, and program for determining a modification of a system resource configuration
US6944788B2 (en) * 2002-03-12 2005-09-13 Sun Microsystems, Inc. System and method for enabling failover for an application server cluster

Also Published As

Publication number Publication date
TW200513871A (en) 2005-04-16
CN1581086A (zh) 2005-02-16
CN1313929C (zh) 2007-05-02
US20050044226A1 (en) 2005-02-24

Similar Documents

Publication Publication Date Title
JP2005056392A (ja) 地理的ミラーリングに関するリソースの妥当性検査およびランキングのための方法および装置
US10678622B2 (en) Optimizing and scheduling maintenance tasks in a dispersed storage network
US7849221B2 (en) Online instance deletion in a multi-instance computer system
US7155462B1 (en) Method and apparatus enabling migration of clients to a specific version of a server-hosted application, where multiple software versions of the server-hosted application are installed on a network
US6249883B1 (en) System and method for monitoring domain controllers
US20030074426A1 (en) Dynamic cluster versioning for a group
EP3745269B1 (en) Hierarchical fault tolerance in system storage
US8984108B2 (en) Dynamic CLI mapping for clustered software entities
KR20060051477A (ko) 컴퓨터 클러스터 노드의 장애를 처리하는 방법 및 시스템
US20070237162A1 (en) Method, apparatus, and computer product for processing resource change
US7246261B2 (en) Join protocol for a primary-backup group with backup resources in clustered computer system
US8031637B2 (en) Ineligible group member status
JP2007018407A (ja) データ複製システム
CN1278254C (zh) 确定高可用性集群之活跃度的方法和系统
US6675259B2 (en) Method and apparatus for validating and ranking disk units for switching
CN111752892B (zh) 分布式文件系统及其实现方法、管理系统、设备及介质
US7590811B1 (en) Methods and system for improving data and application availability in clusters
WO2016046951A1 (ja) 計算機システム及びそのファイル管理方法
US10360107B2 (en) Modifying allocation of storage resources in a dispersed storage network
US10678639B2 (en) Quasi-error notifications in a dispersed storage network
CN117714476A (zh) 云盘管控方法、系统、电子设备及存储介质
CN115878269A (zh) 集群迁移方法、相关装置及存储介质
US20030158941A1 (en) Apparatus, method and computer software for real-time network configuration
Austin et al. Oracle Clusterware and RAC Administration and Deployment Guide, 10g Release 2 (10.2) B14197-02
Bauer et al. Oracle Real Application Clusters Administration and Deployment Guide, 11g Release 1 (11.1) B28254-07

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080213

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080213

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20080213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080411

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080416

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080416