JP2008517358A - ストレージ管理を容易にするための装置、システム、および方法 - Google Patents
ストレージ管理を容易にするための装置、システム、および方法 Download PDFInfo
- Publication number
- JP2008517358A JP2008517358A JP2007535142A JP2007535142A JP2008517358A JP 2008517358 A JP2008517358 A JP 2008517358A JP 2007535142 A JP2007535142 A JP 2007535142A JP 2007535142 A JP2007535142 A JP 2007535142A JP 2008517358 A JP2008517358 A JP 2008517358A
- Authority
- JP
- Japan
- Prior art keywords
- management
- logical entity
- peer
- logical
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/167—Interprocessor communication using a common memory, e.g. mailbox
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1034—Reaction to server failures by a load balancer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1059—Inter-group management mechanisms, e.g. splitting, merging or interconnection of groups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1029—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1031—Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1087—Peer-to-peer [P2P] networks using cross-functional networking aspects
- H04L67/1093—Some peer nodes performing special functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
Abstract
【課題】ストレージ・リソースの編成を通じてストレージ管理を容易にするための、装置、システム、および方法を提供すること。
【解決手段】この装置は、各論理エンティティが他方の論理エンティティの動作をミラーリングし、直接通信するように、第1の論理エンティティおよび第2の論理エンティティをピア・ツー・ピア領域内で互いに対話するように構成する、構成モジュールを含む。情報モジュールは、ローカル・リソースが管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを、管理ノードに公開する。アドレス・モジュールは、管理ノードからの管理コマンドを、管理コマンドのタイプによって決定された第1の論理エンティティのローカル・リソースあるいは第2の論理エンティティのローカル・リソースまたはその両方に向かって、選択的にアドレッシングする。
【選択図】 図2
【解決手段】この装置は、各論理エンティティが他方の論理エンティティの動作をミラーリングし、直接通信するように、第1の論理エンティティおよび第2の論理エンティティをピア・ツー・ピア領域内で互いに対話するように構成する、構成モジュールを含む。情報モジュールは、ローカル・リソースが管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを、管理ノードに公開する。アドレス・モジュールは、管理ノードからの管理コマンドを、管理コマンドのタイプによって決定された第1の論理エンティティのローカル・リソースあるいは第2の論理エンティティのローカル・リソースまたはその両方に向かって、選択的にアドレッシングする。
【選択図】 図2
Description
本発明は、データ・ストレージ・コンピュータ・システムに関する。具体的に言えば、本発明は、ストレージ・リソースの編成を通じてストレージ管理を容易にするための装置、システム、および方法に関する。
コンピュータおよび情報技術は、その機能および複雑さにおける向上および成長を続けている。特にデータ・ストレージ・システムは、物理データ・ストレージ・システムならびにそのハードウェア、ソフトウェア、および様々な他のコンポーネントの信頼性、可用性、および保守性に対する増え続ける需要を満たすために、進化を続けている。データ・ストレージ・システムは、しばしば主幹業務データを処理する。したがってデータ・ストレージ・システムは、24時間毎日(24/7)のスケジュールに従ってオンラインを維持し、使用可能であることが期待される。さらにデータ・ストレージ・システムは、ホストからのデータの入力/出力(I/O)を処理するための信頼性および可用性を大幅に損なうことなく、電源およびサービスの停止、ハードウェアおよびソフトウェア障害、さらにはルーチン・システム保守までをも、処理することが期待される。
図1は、従来のデータ・ストレージ・システム100を示す図である。システム100は、ストレージ・エリア・ネットワーク(SAN)106などのネットワーク106によってストレージ・サブシステム104に接続された、1つまたは複数のホスト102を含む。ホスト102は、データI/Oをストレージ・サブシステム104に送る。ホスト102は当分野で周知であり、データI/Oをストレージ・サブシステム104に送るように構成された任意のコンピュータ・システムを備える。
本発明と共に使用するのに好適なストレージ・サブシステム104の一例が、ニューヨーク州アーモンクのインターナショナル・ビジネス・マシンズ・コーポレーション(IBM)から入手可能な、IBM Enterprise Storage Server(R)である。信頼性、可用性、および冗長性を提供するために、ストレージ・サブシステム104は、別々のチャネルを介してSAN 106に接続された複数のホスト・アダプタ(図示せず)を含む。ホスト・アダプタ108は、ファイバー・チャネルなどの高速通信プロトコルをサポートすることができる。もちろん、様々な他のホスト・アダプタ108を使用して、Internet Small Computer Interface(iSCSI)、Fibre Channel over IP(FCIP)、Enterprise Systems Connection(ESCON)、InfiniBand、およびEthernetを含むが、これらに限定されることのない、他のプロトコルをサポートすることができる。ストレージ・サブシステム104は、直接アクセス・ストレージ・デバイス、テープ・ストレージ・デバイスなどであるが、これらに限定されることのない、1つまたは複数の大容量ストレージ・デバイス108を使用して、データの格納および取り出しを行う。
ハードウェアのコストが下がったため、データ・ストレージ・システム100は、冗長ハードウェアおよびハードウェア・サブシステムを含めることによってさらに複雑になってきた。ハードウェア・コンポーネントは、しばしば障害を受けやすい。したがって、ストレージ・サブシステム104は、1つまたは複数のプロセッサ、電子メモリ・デバイス、ホスト・アダプタ、などを含むことができる。
典型的には、冗長ハードウェアを最も生産的に使用するために、ハードウェアは複数の論理ノード間で明確に割り振られるかまたは共有される。論理ノード110は、各論理ノード110が、他の論理ノード110とは独立にオペレーティング・システム(OS)112を実行できるような、ストレージ・サブシステム104のコンピューティング・ハードウェア・リソースの割り振りを表す。加えて各論理ノード110は、アプリケーション114の独立セットを動作させる。論理ノード110は、ホスト102に対して別の物理コンピューティング・システムとして現れる。
調整モジュール116はハイパーバイザ(PHYP)116とも呼ばれ、2つまたはそれ以上の画定された論理ノード110間での、専用および共有のハードウェア・リソースの使用を調整する。PHYP 116は、専用プロセッサ上のファームウェアに実装することができる。通常、論理ノード110はメモリを共有する。PHYP 116は、論理ノード110がメモリの不適切なセクションにアクセスしないように保証する。
ストレージ・サブシステム104を複数の論理ノード110内に分離することによって、より高度な信頼性が得られる。ソフトウェアまたはハードウェア問題によって1つの論理ノード110にクラッシュ/障害が発生した場合、1つまたは複数の他の論理ノード110を使用して、クラッシュした論理ノード110によって実行されていたタスクを続行または再開することができる。
複数の論理ノード110の管理、制御、およびサービス提供は難題である。いずれの管理、制御、保守、監視、トラブルシューティング、またはサービス・オペレーションも、不断のI/O処理によって調整されるはずであるため、ストレージ・サブシステム104の24時間毎日の可用性が損なわれることはない。通常、管理コンソール118は、I/Oチャネルとは分離された制御通信(ここでは「アウト・オブ・バンド通信」と呼ばれる)を介してストレージ・サブシステム104を管理する。
ストレージ・サブシステム104は、イーサネット・カードなどのアウト・オブ・バンド通信用のネットワーク・アダプタを含むことができる。管理コンソール118は、別のOSおよび管理アプリケーションのセットを実行するワークステーションなどの、別のコンピュータ・システムを備えることができる。管理コンソール118は、管理者がPHYP 116とインターフェースして、論理ノード110を開始(作成)、停止、および構成できるようにする。
残念ながら、管理コンソール118の管理機能はかなり制限されている。特に、論理ノード110は完全に独立し、無関係である。したがって、たとえばストレージ・スペースの割り当てを設定するために複数の論理ノード110を管理する場合、管理者は各ノードに別々にログインし、変更を行い、その後ログアウトしなければならない。このプロセスは非常に面倒であり、動作に関連する論理ノード110の数が増加するほど、エラーにつながる可能性がある。現在、2つまたはそれ以上の論理ノード110を同時に管理する方法はない。ノード110は1回に1つずつ、逐次管理される。
信頼性および可用性の特典により、各ノード110が他方のノードのすべての動作をアクティブにミラーリングするように、2つまたはそれ以上の論理ノード110を関連付けることが望ましい。この様式では、一方のノード110に障害/クラッシュが発生した場合、他方のノードが引き継ぎ、I/O要求の処理を続行する。また、関連付けられた論理ノード110を単一のエンティティとして、または単一の管理ノードからの必要に応じて個々に、まとめて管理することも望ましい。しかしながら、現時点では、論理ノード110間には何の関係もなく、複数の論理ノード110を一度に同時に管理する方法はない。
ノード110がかなり均一であり、名前のように比較的重要でない属性によって構成が異なる可能性のある、ストレージ・サブシステム104内では、管理の反復性およびサービスの変化がさらに悪化する。ストレージ機構は、1つまたは複数の一般的に構成されたノード110に様々な組み合わせのポリシー、属性、または制約を適用しようとする可能性もある。現時点でこれを実行するには、管理者は、ポリシーを実施および維持できるように、ノード110間の類似点および相違点を別々に追跡しなければならない。ノード110のサブセットに適用されるいずれのポリシーも、実施および維持するのは困難であり、時間がかかる。
たとえノード110が関係付けられていても、管理者は各ノード110に別々にログインしなければならず、管理操作を完了するためには、異なる管理コンソール118マシンに物理的に移動しなければならない可能性がある。関係ノード110は、冗長I/O動作を提供する場合がある。しかしながら、関係ノード110の管理は困難であり、時間がかかる。それぞれを個別に管理しなければならない多数のノード110は、管理者の実効性を制限する。
したがって、本発明は、当分野における前述の欠点の多くまたはすべてを克服する単一の管理モジュールを介して、論理ノードの管理を容易にするための装置、システム、および方法を提供する。
本発明の一態様に従った装置は、構成モジュール、情報モジュール、およびアドレス・モジュールを含む。構成モジュールは、各論理エンティティが他方の論理エンティティの動作をミラーリングし、他方の論理エンティティと直接通信するように、ピア・ツー・ピア領域内で互いに対話するための第1の論理エンティティおよび第2の論理エンティティを構成する。
ピア・ツー・ピア領域は、1つのエンティティによって実行されるI/Oおよび管理動作が他方のエンティティによって自動的に実行されるように関係付けられた、2つまたはそれ以上の論理エンティティを含むことができる。2つまたはそれ以上の論理エンティティは、それぞれの論理エンティティ専用のハードウェアの冗長性を提供するために関係付けることができる。論理エンティティは、論理ノード、仮想マシン、論理区画(LPAR)、ストレージ機能イメージ(SFI)、ストレージ・アプリケーション・イメージ(SAI)などに対応することができる。ピア・ツー・ピア領域の論理エンティティは、それぞれ互いに監視および管理するために実質的に同等の権限を有することができる。一実施形態では、ピア・ツー・ピア領域内の第1の論理エンティティおよび第2の論理エンティティが、論理エンティティのうちの1つの障害に応答して他方の論理エンティティの動作を引き継ぐように構成される。動作可能な論理エンティティは、障害が発生した論理エンティティがオフラインになってからの変更のセットをログに記録し、障害が発生した論理エンティティがオンラインに戻るのに応答して変更のセットを復元することができる。
情報モジュールは、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを管理ノードに公開する。ローカル・リソースは、第1の論理エンティティおよび第2の論理エンティティのローカル・リソースが、管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように公開される。情報モジュールは、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを、管理ノードにブロードキャストすることができる。別の方法では、情報モジュールは、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを、管理ノードがアクセス可能な中央リポジトリ内に登録することができる。
管理ノードは、第1の論理エンティティおよび第2の論理エンティティと管理関係にあるものとすることができる。管理関係は、管理ノードが論理エンティティを管理および監視できる管理領域を定義する。しかしながら、論理エンティティは管理ノードを管理または監視することができない。
ある実施形態では、管理領域は、互いにピア・ツー・ピア領域内にある論理エンティティの第1のセットと、互いにピア・ツー・ピア領域内にある論理エンティティの第2のセットとを備える。各論理エンティティのローカル・リソースは、管理コマンドのターゲット・リソースとして使用するために管理ノードに公開することができる。さらに、各セットの論理エンティティは、他方のセットの論理エンティティと通信できない場合がある。管理コマンドは、両方のセット、1つのセット、あるいは、どちらかまたは両方のセットの個々の論理エンティティをターゲットとすることができる。
他の実施形態では、管理領域が、管理ピア・ツー・ピア領域内の管理ノードと対話するように構成された第2の管理ノードを備える。管理ピア・ツー・ピア領域は、いずれかの管理ノードが、管理ノードのうちの1つの障害に応答して管理動作を監視および引き継ぐことを可能にする。
ある実施形態では、同期化モジュールが、第1の論理エンティティまたは第2の論理エンティティによってローカル・リソースに対して行われた修正に応答して、第1の論理エンティティおよび第2の論理エンティティのローカル・リソースを代表するリソース定義を同期化する。
第1の論理エンティティおよび第2の論理エンティティは、共通ハードウェア・プラットフォームの論理区画(LPAR)を備えることができる。LPARは、各LPARが共通ハードウェア・プラットフォームの別々の中央電子複合システム(CEC)上で実行するように構成される。第1の論理エンティティおよび第2の論理エンティティは、独立に管理可能なストレージ機能イメージ(SFI)を定義することができる。管理モジュールは、管理領域内の複数のSFIに管理コマンドを送信するように構成することができる。別の方法では、または加えて、独立に管理可能なストレージ・アプリケーション・イメージ(SAI)内に論理エンティティのペアが定義される。
ストレージ・リソースの編成を通じてストレージ管理を容易にするための動作を実行するように構成されたマシン読み取り可能命令を含む、本発明の信号担持媒体も提示される。一実施形態では、この動作は、各論理エンティティが他方の論理エンティティの動作をミラーリングし、他方の論理エンティティと直接通信するように、ピア・ツー・ピア領域内で互いに対話するために第1の論理エンティティおよび第2の論理エンティティを構成するための動作を含む。他の動作は、第1の論理エンティティおよび第2の論理エンティティのローカル・リソースが、管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースを管理ノードに公開する。最後に、管理ノードからの管理コマンドを、第1の論理エンティティのローカル・リソースおよび第2の論理エンティティのローカル・リソースに向けて選択的にアドレッシングするために、動作が実行される。
本発明は、コンポーネントとほぼ同じ機能と、装置および方法に関して上記で説明したステップを含む、システム、方法、および装置として配置構成された、諸実施形態も含む。
したがって、本発明の諸実施形態では、ストレージ管理を容易にするための装置、システム、および方法が提供される。有利なことに、こうした装置、システム、および方法は、必要に応じて単一のエンティティとして、または別個に、2つまたはそれ以上の関係ノードを自動的に管理する。同様に、この装置、システム、および方法は、グループ間のセキュリティは維持されるが、異なるポリシーが容易に実施および維持できるように、関係ノードのグループの管理をサポートする。さらにこの装置、システム、および方法は、たとえば異なるノードのグループに関するストレージ・サブシステムなどの、複数のハードウェア・プラットフォームの管理をサポートする。この装置、システム、および方法は、複数の関係あるいは無関係またはその両方のノードをアクティブに管理するための冗長管理ノードを可能にする。
次に、本発明の諸実施形態について、添付の図面を参照しながら単なる例として説明する。
本発明の例示的実施形態は、全体を通じて同じ部分が同じ数字で指定された図面を参照することによって、最も良く理解されるであろう。以下の説明は単なる例であることが意図され、本明細書に記載された発明と一致するデバイス、システム、およびプロセスのある選択された実施形態を示すものに過ぎない。
図2は、ストレージ管理を容易にする管理ストラクチャ200の論理的表現を示す図である。ある実施形態では、第1の論理エンティティ200および第2の論理エンティティ204がピア・ツー・ピア関係206を共有する。本明細書で使用される場合、「論理エンティティ」とは、関係を共有する2つまたはそれ以上の物(論理的または物理的)を表すための任意の論理構造を指す。したがって、本明細書全体を通じて使用される論理エンティティは、論理ノード、仮想マシン、論理区画(LPAR)、ストレージ機能イメージ(SFI、以下でより詳細に考察)、ストレージ・アプリケーション・イメージ(SAI、以下でより詳細に考察)などを備えることができる。
ピア・ツー・ピア関係206によって関係付けられた論理エンティティのペア202、204は、有利である。一実施形態では、論理エンティティ202、204は、ホスト102がアクセス可能な複数の論理ストレージ・デバイスを定義するストレージ・エンティティとしての働きをすることができる。言い換えれば、ストレージ・デバイス上のストレージ・スペースを各論理デバイスに割り振り、ホスト102が使用するための論理ストレージ・デバイスを提示するように構成することができる。
好ましくは、第1の論理エンティティ202は、第2の論理エンティティ204とほぼ同じに構成される。各論理エンティティ202、204は、一方のエンティティ202、204に障害が発生した場合、他方のエンティティ202、204がいかなる中断もなくI/O通信の処理をさらに続行することができるように、I/O通信をアクティブに処理することができる。論理エンティティ202、204は、互いに「ホット」(アクティブ)バックアップとして働く。一方の論理エンティティ202、204または、一方の論理エンティティに障害が発生した場合は他方202、204を使用する際に、遅延はない。一方の論理エンティティ202、204の障害にホスト102が気付かないことが望ましいため、論理エンティティ202、204は同じサイズ、パラメータ、および他の属性で構成される。
同様に構成された論理エンティティ202、204も、エンティティ202、204がその構成において他のエンティティ202、204との同期を維持するように、同じコマンドを使用して管理するべきである。本発明は、論理エンティティ202、204をピア・ツー・ピア領域208内に編成する。ピア・ツー・ピア領域208は、1つまたは複数のエンティティ202、204の論理グループ化を表す。各論理エンティティ202、204は、一方のエンティティ202、204で実行される動作は、自動的に他方のエンティティ202、204でも実行されるように、他方の論理エンティティ202、204と通信している。第2のピア・ツー・ピア領域210も、ピア・ツー・ピア関係206にある第3の論理エンティティ212および第4の論理エンティティ214を有するように定義することができる。好ましくは、第1のピア・ツー・ピア領域208のメンバは、第2のピア・ツー・ピア領域210のメンバへの通信、これらの監視、または制御が阻止されており、その逆もまた同様である。ここでは、ピア・ツー・ピア領域208およびローカル・エンティティ202、204について言及する。当業者であれば、この説明がピア・ツー・ピア領域210ならびに第3の論理エンティティ212および第4の論理エンティティ214にも容易に適用できることを理解されよう。
好ましくは、ピア・ツー・ピア領域208は、ピア・ツー・ピア領域208の論理エンティティ202、204の間に直接通信(中継なし)を提供する。もちろん、ピア・ツー・ピア領域208は2つより多くの論理エンティティ202、204を含むことができる。
2つまたはそれ以上の論理エンティティ202、204をピア・ツー・ピア領域208内に配置することにより、通常は、論理エンティティ202、204から使用可能なリソースの可用性がより高くなる。一方のエンティティ202、204に障害が発生した場合、他方は動作を続行する。しかしながら前述のように、管理ノード216が個々に各論理エンティティ202、204に接続し、それらを管理する必要があった場合、論理エンティティ202、204の従来の管理では困難な可能性がある。
本発明では、ピア・ツー・ピア領域208のグループ化により、一方のエンティティ202、204によって実行されるI/O動作および管理動作が他方のエンティティ202、204上でミラーリングされることが保証される。ある実施形態では、ピア・ツー・ピア領域208の第1のメンバ(すなわち、最初にオンラインになったメンバ)がピア・リーダとなる。管理ノード216は、ピア・ツー・ピア領域208のいずれかのメンバへ、あるいは直接ピア・リーダへ、管理コマンドを送る218。エンティティ202、204がピア・リーダでない場合、コマンドはピア・リーダに転送することができる。ピア・リーダはコマンドを解釈する。ピア・ツー・ピア領域208内のすべてのメンバに適用可能であれば、コマンドはすべてのメンバ間でミラーリングされる。この様式では、単一の管理コマンドをピア・ツー・ピア領域208内の単一のエンティティ202、204に発行することが可能であり、ピア・ツー・ピア領域208のすべてのメンバに対して変更が行われる。同じく、第2のピア・ツー・ピア領域210も同様に動作する。
エンティティ202、204をピア・ツー・ピア領域208内に編成することにより、管理者は、互いに冗長自動バックアップとして働くストレージ・エンティティなどの同様のエンティティをグループ化することができる。管理ノード216は必要に応じて各エンティティ202、204と通信218できるが、管理ノード216は単一の管理コマンドを単一のエンティティ208としてのピア・ツー・ピア領域208に向けて送ることもできる。この様式では、管理の負荷/オーバヘッドが削減される。
管理ノード216は、1つまたは複数のエンティティ202、204、212、214の動作を監視および管理する、物理または論理コンピューティング・デバイスである。好ましくは、管理ノード216はアウト・オブ・バンド通信チャネル218を使用して、エンティティ202、204、212、214との対話および監視を行う。管理ノード216と通信218するエンティティ202、204、212、214は、管理領域220を画定する。
管理領域220は、少なくとも1つの管理ノード216および少なくとも1つの被管理エンティティを備える。管理ノード216は状況照会または構成変更などの管理コマンドを、被管理エンティティ202、204、212、214に送信する。
ある監視および管理コマンドは、管理ノード216が、各エンティティ202、204に対して定義されたリソース222、223にアクセスできることを必要とする。本明細書で使用される「リソース」とは、論理エンティティ202、204、212、214に対して物理的に割り振られるかまたは論理的に定義された、ファームウェア、ソフトウェア、ハードウェア、および論理エンティティを指す。リソースの例には、物理および論理ストレージ・デバイス、ストレージ・デバイス・コントローラ、I/Oデバイス、I/Oデバイス・ドライバ、メモリ・デバイス、メモリ・コントローラ、プロセッサ、対称型マルチプロセッサ・コントローラ、ファームウェア・デバイス、ファームウェア実行可能コード、オペレーティング・システム、アプリケーション、プロセス、スレッド、オペレーティング・システム・サービス、などが含まれる。
ピア・ツー・ピア領域208内の各エンティティ202、204のリソース222、223は同じとすることができる。別の方法では、領域208、210にかかわらず、すべてのエンティティ202、204、212、214にまたがるリソース222、223は、同じであるかまたは異なるとすることができる。図3に関してより詳細に説明するように、本発明は、管理領域220内のすべてのエンティティ202、204、212、214のリソース222、223を公開する。管理ノード216はリソース222、223に関する情報を使用して、管理コマンドのターゲットを、ターゲット・リソース222、223とも呼ばれる特定のリソース222、223とする。典型的には、ターゲット・リソースは管理コマンドの対象であり、全エンティティ202を含むことができる。
図2は、管理領域220内のピア・ツー・ピア領域208、210への、エンティティ202、204、212、214の1つの潜在的配置構成を示す図である。もちろん、他の構成も可能である。たとえば、第3の論理エンティティ212は、ピア・ツー・ピア領域208内に配置し、第1のエンティティ202および第2のエンティティ204との直接ピア・ツー・ピア関係206を有することが可能である。エンティティを管理領域220内のピア・ツー・ピア領域208、210でグループ化することにより、同種の論理エンティティ202、204のペアを単一のエンティティ(ピア・ツー・ピア領域208)として管理できるようになる。さらに編成は、エンティティ202、204の目的、機能、または地理的場所を含む様々な要素に従って、エンティティ202、204をグループ化することができる。ピア・ツー・ピア領域208、210は、セキュリティおよびプライバシーの目的で分けながらも、依然として単一の管理ノード216を介して管理することができる。
一実施形態では、第1のエンティティ202および第2のエンティティ204が、第1のピア・ツー・ピア領域208のピア・ツー・ピア関係206にある、論理エンティティ202、204の第1のセットを備える。第3のエンティティ212および第4のエンティティ214が、第2のピア・ツー・ピア領域210のピア・ツー・ピア関係206にある、論理エンティティ212、214の第2のセットを備える。好ましくは、論理エンティティ202、204の第1のセットと論理エンティティ212、214の第2のセットとの間には通信が存在しない。論理エンティティ202、204の第1のセット、論理エンティティ212、214の第2のセット、および管理ノード216はまとめて、管理領域220を形成する。管理ノード216がいずれかのセットのリソース222、223をターゲットとする管理コマンドを送信できるように、論理エンティティ202、204の第1のセットおよび論理エンティティ212、214の第2のセットのリソース222、223が管理ノード216に公開される。
この様式では、論理エンティティ202、204の第1のセットおよび論理エンティティ212、214の第2のセットは互いに分離される。しかしながら、管理ノード216は、単一エンティティとしてのセットのうちの1つへ、個々のエンティティへ、または両方のセットにまとめて、管理コマンドを送信することができる。こうした編成は、特に、2つまたはそれ以上のエンティティのセットを単一ユニットとして管理することができるため、柔軟性が与えられる。前述のように、セットのピア・リーダに送信された管理コマンドは、必要に応じて、セットの関係エンティティへと適宜ルーティングされる。管理ノード216は、第1セット、第2セット、または、第1セットおよび第2セットの両方へ、コマンドを送信することができる。
たとえば、論理エンティティ212、214の第2のセット上でサービス・プロシージャが必要な場合、管理ノード216は、両方の論理エンティティ212、214上で自動的に、キューに入れられたI/Oを処理し、任意の他のI/O通信処理を停止する、単一の静止ストレージ・コマンドを発行することができる。その後、サービス・プロシージャは、論理エンティティ212、214を(再度単一のコマンドを使用して)オフラインにするなどの、追加の管理コマンドを含むことができる。
前述のように、システムの物理および論理エンティティの冗長性により、コンピューティング・システムに高度な可用性、信頼性、および保守性が提供される。冗長リソース222、223のユーザが、使用不可のエンティティに気付くことなくリソース222、223の使用を続行するように、一方の冗長エンティティが使用不可であり、他方が使用可能な場合がある。
一実施形態では、冗長管理ノード224は管理ノード216の動作をミラーリングする。管理ノード216、224は、ピア・ツー・ピア関係206で対話することができる。管理ノード216、224はまとめて、管理ノード216、224のうちの1つの障害に応答して、管理ノード216、224のいずれかが、複数のピア・ツー・ピア領域208、210に関する管理動作を監視および引き継げるようにする、管理ピア・ツー・ピア領域226を形成する。管理ピア・ツー・ピア領域226は、管理ノード216、224のみを含み、管理ノード216、224が互いに監視し合い、必要に応じてプロシージャの引継ぎを実施できるようにする。この様式では、システムの信頼性、保守性、および可用性をさらに向上させるために、冗長管理を提供することができる。
図3は、ストレージ管理を容易にするための装置300の一実施形態を示す図である。装置300は、コンピュータ・システム管理者が、ユニバーサル領域306内に定義されたその他の形で解体(disorganize)された複数のエンティティ302および管理ノード304に対して、編成および配列(order)を適用できるようにする。編成の必要性および物理ハードウェアに応じて、ユニバーサル領域306内のエンティティの数は2つから数百の範囲内とすることができる。エンティティ302またはそのリソース222、223を管理コマンドの宛先またはターゲットとして識別することは、いくつかの編成形式なしでは困難な場合がある。編成が冗長同種エンティティの実装を希望する場合、問題はさらに複雑である。本発明の装置300は、いくつかの配列および編成を実施し、特に相互のミラーリングおよびバックアップすることが意図されたエンティティについて、管理を容易化および自動化するために、エンティティ間通信に関する一定の規則を遵守させる。したがって、異なる論理エンティティに対処する重複管理コマンドの必要性が少なくなる。加えて、配列および編成が、2つまたはそれ以上の同様に構成されたエンティティ302間の区別を容易にする。
装置300は、構成モジュール308、情報モジュール310、および同期化モジュール312を含むことができる。構成モジュール308は、第1の論理エンティティ314を、ピア・ツー・ピア領域208内の第2の論理エンティティ316と対話するように構成する。第1の論理エンティティ314は、第2の論理エンティティ316の動作と直接通信し、これをミラーリングする。言い換えれば、第1の論理エンティティ314および第2の論理エンティティ316はピア・ツー・ピア関係206を有する。
一実施形態のピア・ツー・ピア領域208では、論理エンティティ314、316が互いに監視および管理するために実質的に同等の権限を有する。これにより、論理エンティティ314、316のいずれかがピア・リーダとして働き、他方の論理エンティティ314、316に管理コマンドを渡すことができる。したがって、本発明の異なるシステムおよびサブシステムで提供される冗長性を用いれば、単一ポイントの障害は存在しない。好ましくは、各コンポーネントが冗長な対応コンポーネントを有することから、高可用性が提供される。
一実施形態では、論理エンティティ314、316は、各LPARにコンピュータ・ハードウェア(プロセッサ、メモリ、I/O、ストレージ)の独立セットが割り振られた、コンピュータ・システムの論理区画(LPAR)を備える。ピア・ツー・ピア領域208は、冗長性が提供されるようにLPARのペアを含むことができる。
一実施形態では、構成モジュール308は、各論理エンティティが、ピア・ツー・ピア領域208内の他の論理エンティティ314、316の動作のミラーリングおよび管理のみを実行するように、論理制御通信および論理エンティティ314、316のミラーリングを定義する。たとえば、1つの論理エンティティ314、316をピア・リーダとして指定することができる。ピア・ツー・ピア領域208に送信されたすべての管理コマンドは、ピア・リーダを介してルーティングされる。管理コマンドおよびI/O通信は、必要に応じて各論理エンティティ314、316にミラーリングすることができる。
情報モジュール310は、第1の論理エンティティ314および第2の論理エンティティ316のローカル・リソース222を、管理ノード318に公開する。一実施形態では、情報モジュール310は、ローカル・リソース222を定義する情報を、各管理ノード318に関して事前に決定された通信アドレスを使用して、管理領域220内の各管理ノード318にブロードキャストする。情報モジュール310は、ローカル・リソース222を定義する初期情報、ならびにローカル・リソース222を定義する情報に対して行われた修正を、ブロードキャストすることができる。各管理ノード318はこの情報を受け取り、この情報を適切なエンティティ314、316の識別子に関連付けることができる。
別の方法では、情報モジュール310は、論理エンティティ314、316に関するローカル・リソース222を中央リポジトリ322に登録する。情報モジュール310は、初期情報を登録することができる。その後論理エンティティは、必要に応じて情報に対する更新を登録する。ターゲット・リソース222の中央リポジトリ322は、ターゲット・リソース222が適切な論理エンティティ314、316に関連付けられたデータベースを備えることができる。別の方法では、中央リポジトリ322は、ローカル・リソース222を論理エンティティ314、316に関連付け、管理ノード318がアクセス可能な、ファイルまたは任意の他のデータ・ストラクチャを備えることができる。
ある実施形態では、管理ノード318は、管理ノードおよび論理エンティティが属性および方法の両方を含むソフトウェア・オブジェクトによって表される、オブジェクト指向フレームワークを使用して、論理エンティティ314、316を管理する。属性はオブジェクトに関するデータを格納する。方法は、オブジェクトに関する一定の機能を実施するように特別に構成された論理を含む。オブジェクト指向フレームワークは、リソース222に関する情報へのアクセスを制御することができる。たとえば管理ノード318が許可マネージャの場合、エンティティ314、316を表すソフトウェア・オブジェクトは、アクセス方法がローカル・リソースに関する情報を報告することを許可できる。言い換えれば、通常は、オブジェクトに関するプライベートな属性あるいは方法またはその両方を構築することになる情報を、管理ノード318を表すソフトウェア・オブジェクトが使用できるようにすることが可能である。
同期化モジュール312は、ローカル・リソース222を表すリソース定義を同期化する。リソース定義は、中央リポジトリ322内に格納することができる。同期化モジュール312は、論理エンティティ314、316によって、または管理ノード318によって直接、ローカル・リソース222に対して修正が実行された後に、リソース定義を同期化する。修正は、構成変更、更新済みバージョン情報、リソース222の定義または削除などを含むことができる。ある実施形態では、同期化モジュール312あるいはその一部またはそれらの両方が、論理エンティティ314、316あるいは管理ノード318またはその両方に常駐することができる。
一実施形態では、装置300は、管理ノード318に常駐するアドレス・モジュール324を含む。ある実施形態では、アドレス・モジュール324あるいはその一部またはそれらの両方が、論理エンティティ314、316あるいは管理ノード318またはその両方に常駐することができる。アドレス・モジュール324は、管理ノード318から論理エンティティ314、316のローカル・リソース222へと、管理コマンドを選択的にアドレッシングする。前述のように、および本明細書で使用される場合、ローカル・リソース222は、論理エンティティ314、316に関連付けられた様々な物理および論理コンポーネント、あるいはエンティティ314、316自体を表すことができる。たとえばローカル・リソース222は、ルートとしての論理エンティティ、ならびに下層としての様々な論理および物理オブジェクトを有する、リソースの階層を備えることができる。
どのローカル・リソース222がアドレッシングされるかは、管理コマンドの性質および意図される作用によって異なる。たとえば、1メガバイトの追加メモリを各論理エンティティ314、316の論理メモリ・デバイス「D」に割り振るなどの、ピア・ツー・ピア領域208内のグローバル変更が実行されると想定する。管理コマンドを、論理エンティティ314、316へ直接アドレッシングすることはできない。その代わりに、各論理エンティティ314、316の論理メモリ・デバイス「D」は、管理コマンドを受け取る必要がある場合がある。従来は、別々のコマンドが各論理エンティティ314、316の論理メモリ・デバイス「D」に送られることになった。しかしながら、論理エンティティ314、316が共通のピア・ツー・ピア領域208内にあり、それぞれが論理メモリ・デバイス「D」を有するため、管理ノード318は、論理メモリ・デバイス「D」へとアドレッシングされた単一の管理コマンドを、ピア・リーダに送る。その後ピア・リーダは、管理コマンドをピア・ツー・ピア領域208内の他のピアへとリレーする。
当業者であれば、特定のリソース222をターゲットとする管理コマンドの送信に使用可能な、様々なアドレッシング技法を理解されよう。たとえばリソース222は、リソース222、論理エンティティ316、およびピア・ツー・ピア領域208に関する固有の識別子を含む、固有の識別子と共に登録することができる。本明細書で使用される場合、特定のリソースをターゲットとすること、またはターゲットとされたリソースという言い方は、管理コマンドがその特定のリソース上で働くこと、および管理コマンドを実行するための引数としてリソース222をリストすることの、両方を意味する。どちらのインスタンスでも、管理ノード318は、リソース222を定義する情報を正確に参照できなければならない。
一実施形態では、アドレス・モジュール324は、オブジェクト指向メッセージングを使用して、管理コマンドをターゲット・リソース222へとアドレッシングする。アドレス・モジュール324は、ピア領域208のリストを維持することができる。アドレス・モジュール324は、特定の論理エンティティ314への特定のハードウェア・コマンドなどの管理コマンドを実行できるように、ピア領域208のメンバと管理領域220のメンバとの間の関連も維持することができる。
アドレス・モジュール324は、オブジェクト指向フレームワークを利用して、管理コマンドを所望の論理エンティティ314、316あるいはローカル・リソース222またはその両方へ送信することができる。とりわけ、ピア・ツー・ピア領域208は、オブジェクト指向フレームワーク内で固有の名前/識別子によって固有に識別されたソフトウェア・オブジェクトによって表すことができる。領域208に対する論理エンティティの関連を参照することにより、アドレス・モジュール324は、論理エンティティ314を表すソフトウェア・オブジェクトを直接参照することができる。オブジェクト指向フレームワークは、その後、ターゲットとされる管理コマンドを、特定の論理エンティティ314あるいはローカル・リソース222またはその両方にリレーする。これは、管理ノード318がどのようにローカル・リソース222をターゲットとすることができるかの一例に過ぎない。
第1の論理エンティティ314および第2の論理エンティティ316は、管理ノード318との管理関係326を有する。管理関係326は、管理ノード318が(管理コマンドを介して)エンティティ314、316の動作を監視および管理できるようにする。しかしながらエンティティ314、316は、管理ノード318を管理または監視することができない(したがって、単方向の矢印は管理権限を表す)。エンティティ314、316をまとめて含む管理ノード318およびピア・ツー・ピア領域208は、管理領域220を備える。
図4は、ストレージ管理を容易にするためのシステム400を実装するのに好適な、システム・ハードウェアを示す図である。前述のように、より安価なハードウェアが単一の物理エンクロージャに組み込まれるにつれて、データ処理システムはより複雑になっていく。その後、ハードウェアは、物理的に、論理的に、または物理および論理区画の組み合わせのいずれかで、複数の論理エンティティ202、204に区分される(図2を参照)。重複ハードウェアを使用することで、論理エンティティ202、204などの冗長サブコンポーネントを含めることによって、より高い可用性が可能になる。
ストレージ・サブシステムとして使用するのに好適な一実施形態では、システム400は、共通ハードウェア・プラットフォーム402によって結合された少なくとも2つの物理的に別々の中央電子複合システム(CEC)を含む。共通ハードウェア・プラットフォーム402は、単純な物理エンクロージャを備えることができる。
CECとは、PHYP 116(図1を参照のこと)などの、共通調整モジュール116に接続された物理コンピューティング・デバイスの独立した集まりのことである。CECは、プロセッサ複合システム404、複数の電子メモリ・デバイス406、複数の直接アクセス・ストレージ・デバイス(DASD)408、ホスト・アダプタ410などの複数のネットワークI/Oインターフェース・デバイス410、およびネットワーク・アダプタ412などの複数の管理インターフェース・デバイス412に編成された、複数の対称型マルチプロセッサを含む。CECは、独立型電力結合および電力インフラストラクチャ、ならびに換気および冷却システムを含むことができる。各CECは、独立に電力循環(power cycle)させることができる。一定のサブシステムは、CECの他の部分の性能に影響を与えることなく、電力循環させることまでもが可能である。もちろん、当業者であれば、前述のあるハードウェア・デバイスはサブシステムへの編成が可能であり、本発明には関連しないが、CECが複数の論理ノード206をサポートできるようにする、様々なコントローラを含むことが可能であることを理解されよう。
一実施形態では、システム400は第1のCEC 414および第2のCEC 416を含む。好ましくは、第2のCEC 416は、第1のCEC 414とほぼ同じ量、タイプ、ブランド、および構成のハードウェアを含む。共通のハードウェアを有することで、問題が発生した場合のトラブルシューティングに関連する変数(variables)が減少する。一実施形態では、第1のCEC 414および第2のCEC 416を、ネットワーク・アダプタ412を介して接続された単一のハードウェア管理コンソール(HMC)によって管理および制御することができる。一実施形態では、HMC 418は、LINUXオペレーティング・システムおよび好適な管理アプリケーションを実行する、パーソナル・コンピュータなどの専用ハードウェア管理デバイスである。
たとえ単一のCEC内であっても、ハードウェアのこうした複合システム400を管理することは、非常に困難な場合があることに留意されたい。したがってHMC 418は、最高水準の可用性が維持できるように、管理者がCECを処理する際に指針となる複合的なサービスおよび保守のスクリプトおよびルーチンを含む。1つのミスが劇的な結果を招く可能性がある。ある実施形態では、管理論理は複数のリソース・マネージャ内で具体化される。様々なリソース・マネージャは、ESSの様々なハードウェアおよびソフトウェアのサブシステムの正常性を監視およびチェックする。ソフトウェア・モジュールおよびスクリプトは、問題の診断および修正ならびに予防的保守の実行の際に、サービス技術者およびシステムを指導する。通常、これらのルーチンは、ハードウェア・コンポーネントがオンラインのままで、サブコンポーネントあるいはシステムまたはその両方を適切にシャットダウン(電力循環)する。
図5は、図4のハードウェア・システム400を示し、ハードウェア上で動作するソフトウェアおよび論理エンティティを含む。システム400は、共通ハードウェア・プラットフォーム402内に第1のCEC 414および第2のCEC 416を含む。一実施形態では、CEC 414、416は完全に独立しており、ストレージ・サブシステム内で動作する。
システム400は、第1の論理区画(LPAR)502、第2のLPAR 504、第3のLPAR 506、および第4のLPAR 508を含む。あるシステム400は、図に示されたよりも多くのLPARを備えることができる。各LPAR 502〜508は、1つまたは複数のプロセッサ510、1つまたは複数のI/Oチャネル512、および永続あるいは非永続またはその両方のメモリ514を含む、コンピューティング・リソースの割り振りを含む。あるコンピューティング・ハードウェアは共有され、他のハードウェアは特定のLPAR専用とすることができる。本明細書で使用される場合、LPARとは、各LPARが他のLPARとは独立のオペレーティング・システムを実行できるような、1つまたは複数のプロセッサ、メモリ、およびI/O通信の管理および割り振りを指す。LPARを記述するために一般的に使用される他の用語には、仮想マシンおよび論理エンティティ202、204(図2を参照のこと)が含まれる。
一実施形態では、第1のLPAR 502および第2のLPAR 504が同種であるため、プロセッサ510、I/O 512、およびメモリ514の構成は同一である。同様に、メモリ514内で実行するソフトウェアも同種とすることができる。LPAR 502、504、メモリ514はそれぞれ、同じOS 516およびリソース・マネージャ518を実行することができる。
好ましくは、リソース・マネージャ518は、特定のLPAR 502、504に対する管理コマンドを処理するための論理を備える。リソース・マネージャ518は、同期化モジュール520を含むことができる。同期化モジュール520は、図3に関して説明した同期化モジュール312とほぼ同じ論理を備えることができる。
一実施形態では、第1のCEC 414上で動作する第1のLPAR 502が、第2のCEC 416上で動作する第2のLPAR 504とのピア・ツー・ピア関係524で動作する。第1のLPAR 502および第2のLPAR 504はまとめて、ストレージ機能イメージ(SFI)526を定義する。好ましくは、SFI 526は、図2に関して説明したピア・ツー・ピア領域208のグループ化、特徴、および機能にほぼ対応する。ある実施形態では、ピア・ツー・ピア208が2つまたはそれ以上のLPAR502、504を有することができる場合、一実施形態では、SFI 526は2つのLPAR 502、504に限定することができるため、SFI 526はピア・ツー・ピア領域208のサブセットを備えることができる。
SFI 526は、データの格納および取り出しのための冗長論理リソースを提供する。すべてのデータ・ストレージ処理は、通常、LPAR 502とLPAR 504との間で論理的に分割され、1つのLPARが使用不可の場合、残りのLPARがすべての作業を処理する。好ましくは、SFI 526は、第2のLPAR 504の物理ハードウェアとは完全に独立の、物理ハードウェア上で動作する1つのLPAR 502を含む。したがって、好ましい実施形態では、SFI 526はハードウェアの物理区分を有する。この様式では、1つのCEC 416がオフラインまたは物理的に電源オフとなり、SFI 526をオンラインのままとすることができる。CEC 416がオンラインに戻ると、第2のLPAR 504が第1のLPAR 502と再度一致するように、リソース・マネージャ518はメモリ514およびストレージを同期化する。
SFI 526は、さらに論理ストレージ・デバイスに分割することができる。SFI 526は、論理ストレージ・デバイスを管理するための仮想化ドライバ・ソフトウェアも含むことができる。SFI 526は、データの格納および取り出しに必要なソフトウェアのみを含む。たとえば、1つのSFI 526が、データの格納および取り出しを可能にするOS内のファイル・システムを備える。
システム400は、ピア・ツー・ピア関係524にある第3のLPAR 506および第4のLPAR 508からなる、ストレージ・アプリケーション・イメージ(SAI)528も含むことができる。好ましくは、SAI 528を定義するLPAR 506、508は、同じOS 516および同じリソース・マネージャ518を含む。ある実施形態では、SFI 526のOS 516あるいはリソース・マネージャ518またはその両方は、SAI 528のOS 516あるいはリソース・マネージャ518またはその両方と異なるものとすることができる。ある実施形態では、SAI 528は、図2に関して説明したピア・ツー・ピア領域208のグループ化、特徴、および機能にほぼ対応する。ある実施形態では、ピア・ツー・ピア領域208が2つまたはそれ以上のLPAR 502、504を有することが可能な場合、一実施形態では、SAI 528は2つのLPAR 502、504に限定することが可能であるため、SAI 528は、ピア・ツー・ピア領域208のサブセットを備えることができる。
好ましくは、ピア・ツー・ピア領域208、210は互いに別々に維持される。複数のピア・ツー・ピア領域208、210のメンバ間でピア・ツー・ピア関係が望ましい場合、複数のピア・ツー・ピア領域208、210は、単一のピア・ツー・ピア領域208を形成するように組み合わせられる。したがって、2つのSFI 526あるいはSAI 528またはその両方は、互いにピア・ツー・ピア領域208内に存在しないことになる。ストレージとの関連において、ストレージ機能イメージはストレージ・アプリケーション・イメージとは異なる目的を処理するため、これが有利な場合がある。言い換えれば、SFI 526上およびSAI 528上で実行されるI/O動作と管理動作との間には、ほとんど関係がないか、またはまったくない可能性がある。
SAI 528は、ストレージ・アプリケーションを、SFI 526の論理および物理ストレージ・デバイス408(図4を参照のこと)とは独立に管理可能な、単一の論理ユニットに編成する。SAI 528は、第3のLPAR 506および第4のLPAR 508が互いのデータ処理をミラーリングする場合の冗長性も含む。好ましくは、SFI 526は、第4のLPAR 508の物理ハードウェアからは完全に独立した物理ハードウェア上で動作する第3のLPAR 506を含む。したがって、好ましい実施形態では、SAI 528はハードウェアの物理区画を備える。この様式では、1つのCEC 416がオフラインまたは物理的に電源オフであり、SAI 528がオンラインを維持することができる。SAI 528のストレージ・アプリケーション530は、特にデータの格納および取り出しを管理するためのアプリケーションを備える。ストレージ・アプリケーションの例には、IBMのTivoli Storage Manager、データベース管理システムなどが含まれる。
管理モジュール532は、管理コマンドをSFI 526あるいはSAI 528またはその両方(ピア・ツー・ピア領域)に選択的に送るように構成される。別の方法では、または加えて、管理モジュール532は、管理コマンドを必要に応じて個々のLPAR 502〜508に直接送信することができる。LPAR 502〜508の公開されたローカル・リソース533は、管理モジュール532が、特定のリソース533に管理コマンドを送信すること、あるいは、ある管理コマンドに特定のリソース533の引数を含めること、またはその両方を、可能にする。
管理モジュール532は、図3に関して説明した構成モジュール308、情報モジュール310、およびアドレス・モジュール324とほぼ同じ機能を含む、構成モジュール534、情報モジュール536、およびアドレス・モジュール538を含む。具体的にいえば、情報モジュール536またはそのコンポーネントは、SFI 526あるいはSAI 528またはその両方のローカル・リソース533を定義する情報をブロードキャストすることができる。別の方法として、情報モジュール536またはそのコンポーネントは、SFI 526あるいはSAI 528またはその両方のローカル・リソース533を定義する情報を、管理モジュール532がアクセス可能なデータベースなどの中央リポジトリに登録することができる。
ある実施形態では、情報モジュール536は、定期的ポーリングを通じて、ローカル・リソースを定義する情報をLPAR 502〜508から取り出す。別の方法では、情報モジュール536は、LPAR 502〜508からの信号に基づいて、ローカル・リソースを定義する情報を取り出すことができる。有利なことに、管理モジュール532は、単一のSFI 526を表す複数のLPAR 502、504の細部を要約し、各LPAR 502、504への特定の変更が実行されるという確信をもって、ユーザが管理コマンドを全SFI 526にアドレッシングできるようにする。
好ましくは、管理モジュール532は、管理コマンドをSFI 526およびSAI 528へ、ならびに管理モジュール532およびLPAR 502〜508を論理的にリンクする管理サブシステム540を介して、LPAR 502〜508へと送る。本発明に従って修正可能なサブシステムの一例が、ニューヨーク州アーモンクのインターナショナル・ビジネス・マシンズ・コーポレーション(IBM)から入手可能な、リソース監視および制御(RMC)サブシステムである。当業者であれば、本発明をサポートする管理サブシステム540が、その起源である従来のRMCサブシステムと同じでないことを理解されよう。
RMCベースの管理サブシステム540は、典型的にはAIXなどのオペレーティング・システムに組み込まれた機能モジュールである。もちろん、管理サブシステム540は、LINUX、UNIX、Windows、などを含む他のオペレーティング・システムでも実施可能である。管理サブシステム540の補足コンポーネントは、管理モジュール532およびLPAR 502〜508の両方に常駐することができる。
管理サブシステム540は、ディスク・スペース、プロセッサ使用率、デバイス・ドライバ、アダプタ・カード状況などのリソースを監視する。管理サブシステム540は、事前に定義された条件に応答してアクションを実行するように設計される。しかしながら、従来のRMCは、ピア・ツー・ピア領域208(SFI 526またはSAI 528)内のLPAR 502〜508のペアと同時にインターフェースすることはできない。その代わりに、従来のRMCサブシステムは、1回に1つのLPARと通信する。
本発明のある実施形態では、ピア・ツー・ピア領域208内での管理および監視を可能にすること、ならびにLPARが他のピア・ツー・ピア領域208内のLPARを管理または監視できないようにすること、が実行可能な、修正済み管理サブシステム540を作成するように、従来のRMCサブシステムが拡張および修正される。修正済み管理サブシステム540は、管理モジュール532などの管理ノードが、2つまたはそれ以上のピア・ツー・ピア領域208、210を管理できるようにすることもできる。
修正済み管理サブシステム540は、1つまたは複数のLPAR 502〜508の各管理可能リソースを表すオブジェクトを備える、オブジェクト・モデルを含むことができる。オブジェクトとは、物理および論理リソースの特徴および属性の代表である。オブジェクトは、通信アドレス、バージョン情報、特徴情報、互換性情報、動作状況情報、などの情報を格納することができる。
管理サブシステム540は、リソース・マネージャ518のセットをさらに含む。一実施形態におけるリソース・マネージャ518は、管理コマンドを解釈し、オブジェクト・モデル内に定義されたリソース533に適用する。ある実施形態では、リソース・マネージャ518は、各LPAR 502〜508上で実行している既存のRMCモジュールのソフトウェア拡張である。リソース・マネージャ518は、オブジェクト指向RMCモジュールまたはプロシージャ的に設計されたRMCモジュールを拡張することができる。
ある実施形態では、管理モジュール532が、複数のSFI 526、SAI 528、およびそれらの中に定義された関連付けられたLPAR 502〜508に関する管理の中心点として働く。管理モジュール532は、アウト・オブ・バンド通信ネットワークを介して複数のハードウェア・プラットフォーム542へと結合することができる。管理モジュール532は、好ましくは1つまたは複数の管理コマンドを、複数のプラットフォーム542をまたがって分散されたSFI 526およびSAI 528へと送信するように構成される。さらに、各SFI 526あるいはSAI 528またはその両方は、異なるOS 516あるいはアプリケーション530のセットまたはその両方を備えることができる。SFI 526あるいはSAI 528またはその両方は、地形、または共通目的の機能、あるいは他の特徴に従って、共通管理領域544内に編成することができる。管理領域544は、複数のハードウェア・プラットフォーム542を含むことができることに留意されたい。管理モジュール532は、SFI 526、SAI 528、またはSFI 526およびSAI 528の組み合わせを含む、ピア・ツー・ピア領域208、210を選択するために、コマンドを発行することができる。
さらに図5を参照すると、管理サブシステム540およびリソース・マネージャ518は、好ましくは、LPAR 502、504のうちの1つの障害に応答して、第1のLPAR 502が第2のLPAR 504の動作を引き継ぐことになる、ならびにその逆もまた同様になるように、構成される。ピア・ツー・ピア領域208は、各LPAR 502、504が他方の動作をミラーリングするように通信チャネルを提供することによって、これを可能にする。ある実施形態では、ピア・ツー・ピア領域208の1つのLPAR 502、504に障害が発生した場合、管理サブシステム540は、障害が発生したLPARがオフラインになった後に障害の発生していないLPAR上で行われた変更のセットをログに記録することができる。加えて、管理サブシステム540は、障害が発生したLPARがオンラインに戻ってきた場合、アクティブなLPARのリソース・マネージャ518が変更のセットを復元するのを支援することができる。
ピア・ツー・ピア領域208は、各LPAR 502、504が他方をモニタリングできるようにする。したがってLPAR 502、504は、他方のLPARがオフラインになるなどのエラー条件を有することを検出する、論理を含むことができる。エラー条件が検出されると、ログ記録を開始することができる。LPARがオンラインに戻り、変更のセットの復元をトリガすると、同じモニタが信号を発信することができる。この様式では、ホスト102がピア・ツー・ピア領域208全体(あるいはSFI 526またはSAI 528)を利用可能な状態が維持されるような、リアルタイムの冗長性が提供される。
図6は、一実施形態に従った、ストレージ・リソースの編成を通じてストレージを容易にするための方法600を示す流れ図である。方法600は、管理者が、管理領域220内で、論理エンティティ202、204、212、214および管理ノード216、224を1つまたは複数のピア・ツー・ピア領域208、210に編成する(図2を参照のこと)ことを望むと、開始される602。たとえば管理者は、一方のLPARが他方のLPARに関する冗長アクティブ・バックアップであるように、LPARのペアをSFI 526などのピア・ツー・ピア領域208内に編成することができる。加えて、管理者は、単一の管理ノード216から、複数のハードウェア・プラットフォーム542をまたがって、複数のSFI 526を制御および管理することを望む場合がある。1つまたは複数のピア・ツー・ピア領域208、210を管理領域220内で編成することにより、ピア・ツー・ピア領域208、210のリソースまたはピア・ツー・ピア領域208内のLPARを、単一の管理コマンドでアドレッシングすることができる。
最初に管理者は、各論理エンティティ202、204が他方の動作をミラーリングするように、2つまたはそれ以上の論理エンティティ202、204をピア・ツー・ピア領域208内に構成する604。通常、これは、各論理エンティティ202、204がピア・ツー・ピア領域208内のあらゆる他の論理エンティティ202、204と直接通信するように、2つまたはそれ以上の論理エンティティ202、204間にある通信チャネルおよびプロトコルが確立されることを意味する。好ましくは、論理エンティティ202、204を論理的にリンクするために、専用管理チャネルが使用される。
次に、情報モジュール310は、単一の管理領域220の1つまたは複数のピア・ツー・ピア領域208、210内の各論理エンティティ314、316のローカル・リソース222を公開する606。前述のように、ローカル・リソース222を管理コマンドにおけるターゲット・リソース322として使用できるように、管理ノード318にローカル・リソース222について伝える際に使用可能な、様々な技法がある。加えて、情報モジュールは他の管理サブシステムと協働して、ローカル・リソース222が更新および修正された場合に、ターゲット・リソース322を維持することができる。
次に、管理ノード318によって管理コマンドが発行された場合、アドレス・モジュール324は、ピア・ツー・ピア領域208に関連付けられたローカル・リソース222に向けて、管理コマンドを選択的にアドレッシングする608。別の方法では、アドレス・モジュール324は、ピア・ツー・ピア領域208の第2の論理エンティティ314または第2の論理エンティティ316へ、管理コマンドをアドレッシングする608。管理コマンドがどのリソース222に向けて送られるかは、部分的に、管理コマンドのタイプに依存する。高水準の(ハードウェア・デバイスに関係付けられていないことを意味する)管理コマンドは、エンティティ314、316間で共通のリソース222のペアに送信することができる。低水準の(ハードウェア・デバイスに関係付けられていることを意味する)管理コマンドは、特定のエンティティ314、316の特定のリソース222に送信することができる。様々なアドレッシング技法が使用可能である。
次に、論理エンティティ314またはLPAR 502がオフラインであるかどうかが判別される610。LPAR 502をサービスまたはトラブルシューティングのために肯定的にオフラインとするか、あるいはLPAR 502がエラー条件によって非自発的にオフラインになる場合がある。LPAR 502がオフランの場合、ピア・ツー・ピア領域208を定義する論理(すなわちエンティティ314、316上で実行しているログ記録モジュール)は、ピア・ツー・ピア領域208の1つまたは複数のオンラインLPAR 504に対して実行された変更のセットの、ログ記録を開始する612。オフラインLPAR 502がオンラインに戻ると、ログ記録された変更のセットをLPAR 502に適用することによって、論理はLPAR 502を復元することができる。通常、オンラインのままのLPAR 504が、復元されたLPAR 502への更新の適用を実行する。
論理エンティティ314、316、またはLPAR 502、504のいずれもオフラインでない場合、管理領域220の論理エンティティ314、316に対して複数の管理コマンドが保留となっているかどうかが判別される614。保留となっている場合、方法600は、次の管理コマンドをアドレッシングする608ために戻る。保留となっていない場合、方法600は終了する616。
当業者であれば、本発明によって提供される潜在的な特典を即時に理解されよう。SFI 526およびSAI 528(ピア・ツー・ピア領域208全体)を個別に管理する機能、あるいは個々のLPAR 502〜508を管理する機能、またはその両方の機能が、管理者の時間を大幅に節約し、エラーおよび誤りの可能性を大幅に削減する。加えて、複数の管理ノード216、224を、管理ピア・ツー・ピア領域226内で関係付けることができる。論理エンティティ202と同様に、管理ノード216、224は、一方に障害が発生した場合に、障害の発生した管理ノード216がオフのままで他方が管理コマンドのセットの実施を続行できるように、互いに監視および管理することができる。したがって、本発明により、SFI 526およびSAI 528の形成に関係付けることが可能な論理エンティティの管理が改善される。本発明は、LPARレベルおよび管理ノード・レベルでの冗長性を提供する。最終的に本発明は、典型的には冗長性の目的で同様に構成された論理エンティティに関する管理上の負担を軽減する。
本発明は、その不可欠な特徴から逸脱することなく、他の特定の形で具体化することが可能である。説明された諸実施形態は、すべての点において、限定的ではなく単に例示的であるとみなされるべきである。したがって本発明の範囲は、前述の説明ではなく添付の特許請求の範囲によって示される。特許請求の範囲の意味および等価性の範囲内にあるすべての変更は、その範囲内に包含されるものとする。
本明細書で説明された多くの機能単位は、それらの実施の非依存性を特に強調するために、モジュールとしてラベル付けしてきた。たとえばモジュールは、カスタムVLSI回路またはゲート・アレイ、論理チップなどの既製の半導体、トランジスタ、または他の離散的コンポーネントを備える、ハードウェア回路として実施することができる。モジュールは、フィールド・プログラム可能ゲート・アレイ、プログラム可能アレイ論理、プログラム可能論理デバイスなどの、プログラム可能ハードウェア・デバイス内で実施することもできる。
モジュールは、様々なタイプのプロセッサによって実行されるソフトウェアでも実施可能である。たとえば、実行可能コードの識別されたモジュールは、たとえばオブジェクト、プロシージャ、関数、または他の構成として編成可能な、コンピュータ命令の1つまたは複数の物理または論理ブロックを含む。それにもかかわらず、識別されたモジュールの実行可能コードは、物理的にまとめて配置する必要はないが、論理的に一緒に結合された場合、モジュールを含み、モジュールに関して規定された目的を達成する、異なる場所に格納された異種命令を含むことができる。
実際、実行可能コードのモジュールは、単一の命令または多くの命令とすることが可能であり、いくつかの異なるコード・セグメントにわたって、異なるプログラム間で、およびいくつかのメモリ・デバイスにまたがって、分散することも可能である。同様に、運用(operational)データは、本明細書ではモジュール内に識別および図示することが可能であり、任意の好適な形で具体化することおよび任意の好適なタイプのデータ構造内で編成することが可能である。運用データは、単一のデータ・セットとしてまとめることが可能であるか、または異なるストレージ・デバイスにわたることを含む、異なる場所にわたって分散することが可能であり、さらに、少なくとも部分的に、システムまたはネットワーク上の単なる電子信号として存在することが可能である。
本明細書全体を通じて、「選択実施形態」、「一実施形態」、または「実施形態」という言い方は、その実施形態に関連して説明された特定の機能、構造、または特徴が、本発明の少なくとも一実施形態に含まれることを意味する。したがって、本明細書全体を通じて、様々な箇所で「選択実施形態」、「一実施形態では」、または「実施形態では」という句が出現する場合、すべてが同じ実施形態を言い表すとは限らない。
さらに、説明された機能、構造、または特徴は、1つまたは複数の実施形態において任意の好適な方法で組み合わせることが可能である。以下の説明では、本発明の諸実施形態を完全に理解するために、プログラミング、ソフトウェア・モジュール、ユーザ選択、ユーザ・インターフェース、ネットワーク・トランザクション、データベース照会、データベース・ストラクチャ、ハードウェア・モジュール、ハードウェア回路、ハードウェア・チップなどの例など、多数の特定の細部が提供される。しかしながら当業者であれば、本発明が、1つまたは複数の特定の細部なしに、または他の方法、コンポーネント、材料などを使用して、実施可能であることを理解されよう。他のインスタンスでは、周知のストラクチャ、材料、または動作については、本発明の諸態様を不明瞭にすることを避けるために、詳細には図示または説明していない。
Claims (29)
- 各論理エンティティが他方の論理エンティティの動作をミラーリングし、直接通信するように、第1の論理エンティティおよび第2の論理エンティティをピア・ツー・ピア領域内で互いに対話するように構成するための構成手段と、
前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースが管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースを、管理ノードに公開するように構成された情報手段と、
前記管理ノードからの管理コマンドを、前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースに向かって、選択的にアドレッシングするように構成されたアドレス手段と、
を備える、ストレージ管理を容易にするための装置。 - 前記構成手段が、管理領域を定義する管理関係において、前記第1の論理エンティティおよび前記第2の論理エンティティと対話するように、前記管理ノードを構成するように設計される、請求項1に記載の装置。
- 前記管理領域が、前記管理ノードおよび少なくとも1つの論理エンティティを備え、前記少なくとも1つの論理エンティティが、前記管理ノードによって管理および監視されるように、ならびに前記管理ノードを管理または監視できないように構成される、請求項2に記載の装置。
- 前記管理領域が、互いにピア・ツー・ピア領域内の3つまたはそれ以上の論理エンティティを備え、各論理エンティティの前記ローカル・リソースが、前記管理ノードからの管理コマンドのターゲット・リソースとして使用するために前記管理ノードに公開される、請求項2に記載の装置。
- 前記管理領域が、互いにピア・ツー・ピア領域内の論理エンティティの第1のセットと、互いにピア・ツー・ピア領域内の論理エンティティの第2のセットとを備え、各論理エンティティの前記ローカル・リソースが、管理コマンドのターゲット・リソースとして使用するために前記管理ノードに公開され、一方のセットの前記論理エンティティが他方のセットの論理エンティティと通信できない、請求項2に記載の装置。
- さらに前記アドレス手段が、前記第1のセットを管理コマンドの直接のターゲットとするように構成される、請求項5に記載の装置。
- さらに前記アドレス手段が、前記第1のセットおよび前記第2のセットを管理コマンドの直接のターゲットとするように構成される、請求項5に記載の装置。
- 前記管理領域が、管理ピア・ツー・ピア領域内の前記管理ノードと対話できるように構成された、第2の管理ノードをさらに備え、前記管理ノードのうちの一方の障害に応答して、いずれかの管理ノードが管理動作を管理および引き継げるようにする、請求項1に記載の装置。
- 前記ピア・ツー・ピア領域が、互いに監視および管理するために実質的に同等の権限を有するように構成された少なくとも2つの論理ノードを備える、請求項1に記載の装置。
- 前記ピア・ツー・ピア領域内の前記第1の論理エンティティおよび第2の論理エンティティが、前記論理エンティティのうちの一方の障害に応答して他方の論理エンティティの動作を引き継ぎ、前記障害の発生した論理エンティティがオフラインになってからの変更のセットをログ記録し、前記障害の発生した論理エンティティがオンラインに戻るのに応答して前記変更のセットを復元するように構成される、請求項1に記載の装置。
- さらに前記情報手段が、前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを、前記管理ノードにブロードキャストするように構成される、請求項1に記載の装置。
- さらに前記情報手段が、前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを、前記管理ノードがアクセス可能な中央リポジトリに登録するように構成される、請求項1に記載の装置。
- 前記第1の論理エンティティまたは前記第2の論理エンティティによって実行される前記ローカル・リソースに対する修正に応答して、前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを代表するリソース定義を同期化するように構成された同期化手段をさらに備える、請求項1に記載の装置。
- 前記管理ノードが、前記第1の論理エンティティおよび前記第2の論理エンティティによって使用される1つまたは複数の入力/出力(I/O)チャネルとは分離された通信チャネルを介して管理コマンドを送信する、請求項1に記載の装置。
- 前記第1の論理エンティティおよび前記第2の論理エンティティが、共通ハードウェア・プラットフォームの論理区画(LPAR)を備える、前記請求項のいずれか一項に記載の装置。
- 前記第1の論理エンティティおよび前記第2の論理エンティティが、独立に管理可能なストレージ機能イメージ(SFI)を定義し、さらに前記アドレス・モジュールが、管理領域内の複数のSFIに前記管理コマンドを送信するように構成される、請求項1に記載の装置。
- ハードウェア・プラットフォームに動作可能に結合された第1の中央電子複合システム(CEC)であって、前記第1のCECが、第1のプロセッサ複合システムに編成された複数の対称型マルチプロセッサと、複数の電子メモリ・デバイスと、複数の直接アクセス・ストレージ・デバイスと、複数のネットワーク入力/出力(I/O)インターフェース・デバイスと、複数の管理インターフェース・デバイスとを備え、前記CECの前記デバイスそれぞれが、データの交換および情報の制御のために電子的に結合された、第1のCECと、
前記ハードウェア・プラットフォームに動作可能に結合された第2のCECであって、前記第2のCECが、第2のプロセッサ複合システムに編成された複数の対称型マルチプロセッサと、複数の電子メモリ・デバイスと、複数の直接アクセス・ストレージ・デバイスと、複数のネットワーク入力/出力(I/O)インターフェース・デバイスと、複数の管理インターフェース・デバイスとを備え、前記CECの前記デバイスそれぞれが、データの交換および情報の制御のために電子的に結合された、第2のCECと、
前記第1のCECのコンピューティング・リソースを使用して動作するように定義された第1の論理区画(LPAR)と、前記第2のCECのコンピューティング・リソースを使用して動作するように定義された第2のLPARとを備える、少なくとも1つのストレージ機能イメージ(SFI)であって、前記第1のLPARおよび第2のLPARがデータの格納および取り出し専用である、少なくとも1つのSFIと、
前記第1のCECのコンピューティング・リソースを使用して動作するように定義された第3の論理区画(LPAR)と、前記第2のCECのコンピューティング・リソースを使用して動作するように定義された第4のLPARとを備える、少なくとも1つのストレージ・アプリケーション・イメージ(SAI)であって、前記第3のLPARおよび第4のLPARがデータ・ストレージ・アプリケーション専用である、少なくとも1つのSAIと、
各LPARが他方のLPARの動作をミラーリングし、直接通信するように、前記第1のLPARおよび前記第2のLPARをピア・ツー・ピア領域内で互いに対話するように構成し、各LPARが他方のLPARの動作をミラーリングし、直接通信するように、前記第3のLPARおよび前記第4のLPARをピア・ツー・ピア領域内で互いに対話するように構成する、構成モジュールと、
前記少なくとも1つのSFIおよび前記少なくとも1つのSAIのローカル・リソースが管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、前記少なくとも1つのSFIおよび前記少なくとも1つのSAIのローカル・リソース定義を、管理ノードに公開するように構成された情報モジュールと、
前記管理ノードからの管理コマンドを、前記少なくとも1つのSFIおよび前記少なくとも1つのSAIのローカル・リソースに向かって、選択的にアドレッシングするように構成されたアドレス・モジュールと、
を備える、ストレージ管理を容易にするためのシステム。 - 前記少なくとも1つのSFIまたは前記少なくとも1つのSAIのいずれかのLPARの前記ローカル・リソースに対する修正に応答して、前記少なくとも1つのSFIまたは前記少なくとも1つのSAIの前記ローカル・リソース代表するリソース定義を同期化するように構成された同期化モジュールをさらに備える、請求項17に記載のシステム。
- さらに前記情報モジュールが、前記少なくとも1つのSFIの前記ローカル・リソースおよび前記少なくとも1つのSAIのローカル・リソースを前記管理ノードにブロードキャストするように構成された、請求項17に記載のシステム。
- さらに前記情報モジュールが、前記少なくとも1つのSFIの前記ローカル・リソースおよび前記少なくとも1つのSAIのローカル・リソースを、前記管理ノードがアクセス可能な中央リポジトリに登録するように構成された、請求項17に記載のシステム。
- 各論理エンティティが他方の論理エンティティの動作をミラーリングし、直接通信するように、第1の論理エンティティおよび第2の論理エンティティをピア・ツー・ピア領域内で互いに対話するように構成するステップと、
前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースが管理ノードからの管理コマンドのターゲット・リソースとして使用可能なように、前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースを、管理ノードに公開するステップと、
前記管理ノードからの管理コマンドを、前記第1の論理エンティティのローカル・リソースおよび前記第2の論理エンティティのローカル・リソースに向かって、選択的にアドレッシングするステップと、
を含む、ストレージ管理を容易にするための方法。 - 管理領域を定義する管理関係において、前記第1の論理エンティティおよび前記第2の論理エンティティと対話するように、前記管理ノードを構成するステップをさらに含む、請求項21に記載の方法。
- 前記管理領域が、互いにピア・ツー・ピア領域内の論理エンティティの第1のセットと、互いにピア・ツー・ピア領域内の論理エンティティの第2のセットとを備え、各論理エンティティの前記ローカル・リソースが、管理コマンドのターゲット・リソースとして使用するために前記管理ノードに公開され、一方のセットの前記論理エンティティが他方のセットの論理エンティティと通信できない、請求項22に記載の方法。
- 前記動作が、前記第1のセットを管理コマンドの直接のターゲットとするための動作をさらに有する、請求項23に記載の方法。
- 前記動作が、前記第1のセットおよび前記第2のセットを管理コマンドの直接のターゲットとするための動作をさらに有する、請求項23に記載の方法。
- 前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを、前記管理ノードにブロードキャストするステップをさらに公開する、請求項21に記載の方法。
- 前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを、前記管理ノードがアクセス可能な中央リポジトリに登録するステップをさらに公開する、請求項21に記載の方法。
- 前記第1の論理エンティティまたは前記第2の論理エンティティによって実行される前記ローカル・リソースに対する修正に応答して、前記第1の論理エンティティの前記ローカル・リソースおよび前記第2の論理エンティティの前記ローカル・リソースを代表するリソース定義を同期化するステップをさらに含む、請求項21に記載の方法。
- 請求項21から請求項28のうちのいずれか一項に記載の前記方法のすべてのステップを実行するためのコンピュータ実行可能命令を含む、コンピュータ・プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/963,086 US20060080319A1 (en) | 2004-10-12 | 2004-10-12 | Apparatus, system, and method for facilitating storage management |
PCT/EP2005/054903 WO2006040264A1 (en) | 2004-10-12 | 2005-09-29 | Apparatus, system, and method for facilitating storage management |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008517358A true JP2008517358A (ja) | 2008-05-22 |
JP2008517358A5 JP2008517358A5 (ja) | 2008-08-14 |
Family
ID=35735175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007535142A Withdrawn JP2008517358A (ja) | 2004-10-12 | 2005-09-29 | ストレージ管理を容易にするための装置、システム、および方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20060080319A1 (ja) |
EP (1) | EP1810191A1 (ja) |
JP (1) | JP2008517358A (ja) |
KR (1) | KR20070085283A (ja) |
CN (1) | CN101019120A (ja) |
MX (1) | MX2007004210A (ja) |
WO (1) | WO2006040264A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016166867A1 (ja) * | 2015-04-16 | 2016-10-20 | 株式会社日立製作所 | 計算機システム、及び、リソース制御方法 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100643047B1 (ko) * | 2005-04-12 | 2006-11-10 | 최규준 | 미네랄을 다량 포함하는 활성용액의 제조방법 |
WO2007133294A2 (en) * | 2005-12-30 | 2007-11-22 | Bmo Llc | Ubiquitous navbar user interface across multiple heterogeneous digital media devices |
WO2007136423A2 (en) * | 2005-12-30 | 2007-11-29 | Bmo Llc | Digital content delivery via virtual private network(vpn) incorporating secured set-top devices |
JP4449931B2 (ja) * | 2006-03-30 | 2010-04-14 | ブラザー工業株式会社 | 管理装置、および管理システム |
US20080281718A1 (en) * | 2007-01-08 | 2008-11-13 | Barrett Morgan | Household network incorporating secure set-top devices |
US20080192643A1 (en) * | 2007-02-13 | 2008-08-14 | International Business Machines Corporation | Method for managing shared resources |
JP4480756B2 (ja) * | 2007-12-05 | 2010-06-16 | 富士通株式会社 | ストレージ管理装置、ストレージシステム制御装置、ストレージ管理プログラム、データ記憶システムおよびデータ記憶方法 |
US9071524B2 (en) * | 2008-03-31 | 2015-06-30 | Lenovo (Singapore) Pte, Ltd. | Network bandwidth control for network storage |
WO2009145764A1 (en) | 2008-05-28 | 2009-12-03 | Hewlett-Packard Development Company, L.P. | Providing object-level input/output requests between virtual machines to access a storage subsystem |
WO2010138972A2 (en) | 2009-05-29 | 2010-12-02 | Abacast, Inc. | Selective access of multi-rate data from a server and/or peer |
CN102122306A (zh) * | 2011-03-28 | 2011-07-13 | 中国人民解放军国防科学技术大学 | 一种数据处理方法及应用该方法的分布式文件系统 |
US8930959B2 (en) | 2011-05-13 | 2015-01-06 | Orions Digital Systems, Inc. | Generating event definitions based on spatial and relational relationships |
EP2715954A4 (en) * | 2011-06-01 | 2014-09-03 | Ericsson Telefon Ab L M | METHOD, N UD AND SYSTEM FOR MANAGING A MOBILE NETWORK |
CN103064757A (zh) * | 2012-12-12 | 2013-04-24 | 鸿富锦精密工业(深圳)有限公司 | 数据备份方法及系统 |
US10353631B2 (en) * | 2013-07-23 | 2019-07-16 | Intel Corporation | Techniques for moving data between a network input/output device and a storage device |
CN104951855B (zh) * | 2014-03-28 | 2022-08-02 | 伊姆西Ip控股有限责任公司 | 用于促进对资源的管理的装置和方法 |
WO2016130301A1 (en) * | 2015-02-10 | 2016-08-18 | Pure Storage, Inc. | Storage system architecture |
DE102015214385A1 (de) * | 2015-07-29 | 2017-02-02 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Absichern der Anwendungsprogrammierschnittstelle eines Hypervisors |
CN106874142B (zh) * | 2015-12-11 | 2020-08-07 | 华为技术有限公司 | 一种实时数据容错处理方法及系统 |
CN110798520B (zh) * | 2019-10-25 | 2021-12-03 | 苏州浪潮智能科技有限公司 | 一种业务处理方法、系统、装置及可读存储介质 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421679B1 (en) * | 1995-10-27 | 2002-07-16 | International Business Machines Corporation | Concurrent patch to logical partition manager of a logically partitioned system |
AU6440398A (en) * | 1997-02-26 | 1998-09-18 | Siebel Systems, Inc. | Method of using a cache to determine the visibility to a remote database client of a plurality of database transactions |
US6073209A (en) * | 1997-03-31 | 2000-06-06 | Ark Research Corporation | Data storage controller providing multiple hosts with access to multiple storage subsystems |
US6189145B1 (en) * | 1997-05-28 | 2001-02-13 | International Business Machines Corporation | Concurrent patch to logical partition manager of a logically partitioned system |
US5923890A (en) * | 1997-07-30 | 1999-07-13 | International Business Machines Corporation | Method and apparatus for optimizing the handling of synchronous requests to a coupling facility in a sysplex configuration |
US6477139B1 (en) * | 1998-11-15 | 2002-11-05 | Hewlett-Packard Company | Peer controller management in a dual controller fibre channel storage enclosure |
US6279046B1 (en) * | 1999-05-19 | 2001-08-21 | International Business Machines Corporation | Event-driven communications interface for logically-partitioned computer |
US6574655B1 (en) * | 1999-06-29 | 2003-06-03 | Thomson Licensing Sa | Associative management of multimedia assets and associated resources using multi-domain agent-based communication between heterogeneous peers |
AU1589401A (en) * | 1999-11-09 | 2001-06-06 | Jarna, Inc. | Synchronizing data among multiple devices in a peer-to-peer environment |
US7062648B2 (en) * | 2000-02-18 | 2006-06-13 | Avamar Technologies, Inc. | System and method for redundant array network storage |
US7069295B2 (en) * | 2001-02-14 | 2006-06-27 | The Escher Group, Ltd. | Peer-to-peer enterprise storage |
US7039692B2 (en) * | 2001-03-01 | 2006-05-02 | International Business Machines Corporation | Method and apparatus for maintaining profiles for terminals in a configurable data processing system |
US7065761B2 (en) * | 2001-03-01 | 2006-06-20 | International Business Machines Corporation | Nonvolatile logical partition system data management |
US6834340B2 (en) * | 2001-03-01 | 2004-12-21 | International Business Machines Corporation | Mechanism to safely perform system firmware update in logically partitioned (LPAR) machines |
US6779058B2 (en) * | 2001-07-13 | 2004-08-17 | International Business Machines Corporation | Method, system, and program for transferring data between storage devices |
WO2003014955A1 (en) * | 2001-08-09 | 2003-02-20 | Gigamedia Access Corporation | Hybrid system architecture for secure peer-to-peer-communication |
US7085827B2 (en) * | 2001-09-20 | 2006-08-01 | Hitachi, Ltd. | Integrated service management system for remote customer support |
JP4018900B2 (ja) * | 2001-11-22 | 2007-12-05 | 株式会社日立製作所 | 仮想計算機システム及びプログラム |
US7194656B2 (en) * | 2001-11-28 | 2007-03-20 | Yottayotta Inc. | Systems and methods for implementing content sensitive routing over a wide area network (WAN) |
US7146306B2 (en) * | 2001-12-14 | 2006-12-05 | International Business Machines Corporation | Handheld computer console emulation module and method of managing a logically-partitioned multi-user computer with same |
US7243103B2 (en) * | 2002-02-14 | 2007-07-10 | The Escher Group, Ltd. | Peer to peer enterprise storage system with lexical recovery sub-system |
JP2003323329A (ja) * | 2002-05-07 | 2003-11-14 | Fujitsu Ltd | 分散ファイル管理方法及びプログラム |
US7480911B2 (en) * | 2002-05-09 | 2009-01-20 | International Business Machines Corporation | Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system |
US7434220B2 (en) * | 2002-09-16 | 2008-10-07 | Clearcube Technology, Inc. | Distributed computing infrastructure including autonomous intelligent management system |
JP4119239B2 (ja) * | 2002-12-20 | 2008-07-16 | 株式会社日立製作所 | 計算機資源割当方法、それを実行するための資源管理サーバおよび計算機システム |
-
2004
- 2004-10-12 US US10/963,086 patent/US20060080319A1/en not_active Abandoned
-
2005
- 2005-09-29 JP JP2007535142A patent/JP2008517358A/ja not_active Withdrawn
- 2005-09-29 CN CNA2005800310261A patent/CN101019120A/zh active Pending
- 2005-09-29 WO PCT/EP2005/054903 patent/WO2006040264A1/en active Application Filing
- 2005-09-29 KR KR1020077009207A patent/KR20070085283A/ko not_active Application Discontinuation
- 2005-09-29 EP EP05797188A patent/EP1810191A1/en not_active Withdrawn
- 2005-09-29 MX MX2007004210A patent/MX2007004210A/es not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016166867A1 (ja) * | 2015-04-16 | 2016-10-20 | 株式会社日立製作所 | 計算機システム、及び、リソース制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US20060080319A1 (en) | 2006-04-13 |
WO2006040264A1 (en) | 2006-04-20 |
EP1810191A1 (en) | 2007-07-25 |
KR20070085283A (ko) | 2007-08-27 |
MX2007004210A (es) | 2007-06-11 |
CN101019120A (zh) | 2007-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008517358A (ja) | ストレージ管理を容易にするための装置、システム、および方法 | |
US7734753B2 (en) | Apparatus, system, and method for facilitating management of logical nodes through a single management module | |
US20190213093A1 (en) | Non-disruptive controller replacement in a cross-cluster redundancy configuration | |
US7370336B2 (en) | Distributed computing infrastructure including small peer-to-peer applications | |
US7941510B1 (en) | Management of virtual and physical servers using central console | |
US7496646B2 (en) | System and method for management of a storage area network | |
US7441024B2 (en) | Method and apparatus for applying policies | |
US8473692B2 (en) | Operating system image management | |
US20030158933A1 (en) | Failover clustering based on input/output processors | |
US20130111260A1 (en) | Dynamic resource allocation in recover to cloud sandbox | |
US20110289342A1 (en) | Method for the file system of figure 7 for the cluster | |
US20060085785A1 (en) | Method and apparatus for configuring, monitoring and/or managing resource groups including a virtual machine | |
US20060085530A1 (en) | Method and apparatus for configuring, monitoring and/or managing resource groups using web services | |
US7702757B2 (en) | Method, apparatus and program storage device for providing control to a networked storage architecture | |
US8316110B1 (en) | System and method for clustering standalone server applications and extending cluster functionality | |
US20060085668A1 (en) | Method and apparatus for configuring, monitoring and/or managing resource groups | |
US7730218B2 (en) | Method and system for configuration and management of client access to network-attached-storage | |
CN113849136B (zh) | 一种基于国产平台的自动化fc块存储处理方法和系统 | |
CN113765697B (zh) | 管理数据处理系统的日志的方法和系统及计算机可读介质 | |
US10305987B2 (en) | Method to syncrhonize VSAN node status in VSAN cluster | |
US20220342775A1 (en) | Storage system, storage node virtual machine restore method, and recording medium | |
Dell | ||
US20160274813A1 (en) | Storage system management and representation methods and apparatus | |
Vallath et al. | Testing for Availability | |
Bach et al. | Configuring Exadata |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080627 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080627 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100611 |