JP5235871B2 - エラー回復のための機器、方法及びプログラム - Google Patents

エラー回復のための機器、方法及びプログラム Download PDF

Info

Publication number
JP5235871B2
JP5235871B2 JP2009512599A JP2009512599A JP5235871B2 JP 5235871 B2 JP5235871 B2 JP 5235871B2 JP 2009512599 A JP2009512599 A JP 2009512599A JP 2009512599 A JP2009512599 A JP 2009512599A JP 5235871 B2 JP5235871 B2 JP 5235871B2
Authority
JP
Japan
Prior art keywords
node instance
virtual
virtual node
director
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009512599A
Other languages
English (en)
Other versions
JP2009539160A (ja
Inventor
クリストファ バリー ビーケン
ステファニー マークレイト
ロバート ブルース ニコルソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2009539160A publication Critical patent/JP2009539160A/ja
Application granted granted Critical
Publication of JP5235871B2 publication Critical patent/JP5235871B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、高可用性クラスタ化ソフトウェア、特にストレージ・ネットワーク・コントローラでのエラーから回復するための技術に関する。
高可用性クラスタ化ソフトウェアでは、いくつかのノードが協働してユーザにサービスを送達する。高可用性クラスタリングは、ソフトウェアの機能を送達するためにソフトウェアが使用する、ある量の複製状態またはメタデータ情報の存在を必要とする。製品の正しい動作のためには、このクラスタ状態が内部的に整合性のあることが重要である。内部的に整合性があることにより、例えば、ソフトウェア内の相異なる層がオブジェクト数の同一のカウントなどを有することを意味する。
高可用性クラスタ化ソフトウェアでは、100%の可用性、または可能な限りその目標に近い可用性を維持することが望ましい。しかし、ソフトウェア欠陥がコード中に存在する可能性がある。ソフトウェア・エラー回復手順が高可用性クラスタ化ソフトウェアに対して利用可能である。こうしたエラー回復手順により、ソフトウェア障害が発生した場合にクラスタが回復することが可能となる。エラー回復手順は、内部状態が依然として整合性のあることを保証するように設計される。遺憾ながら、ソフトウェア・エラーの結果、クラスタ状態の不整合が生じる可能性があり、それによって別のソフトウェア障害が誘発される可能性がある。こうしたソフトウェア・エラーは、別の障害が発生したときにだけ発見されることがあり、これにより、製作環境でのダウン時間が長くなり、高コストとなる可能性がある。こうしたソフトウェア・エラーが発生したときにそれを修正するために、クラスタ状態内の識別されたエラーにパッチを当てるように修正が適用される。しかし、クラスタ状態内に別の未発見のバグがないことを保証することは可能ではない。
以前のクラスタ回復の結果としてもう不整合がないことを保証するために、ストレージ仮想化ソフトウェアの再インストールと、クラスタ状態をその初期状態に再初期化することが必要であるが、これは破壊的な手順である。再インストールのための1つのオプションは、Tier3回復手順(アーカイブ・ストレージからのデータの復元)を実行することであるが、これはやはり破壊的である。別のオプションは、新しいクラスタを構築し、それを元のクラスタと等しく構成することである。データを転送しなければならないことになる(例えばホスト・ミラーリングを使用することにより)。あるシステムでは、このことを、I/Oを停止することなく行うことができる。この解決策の欠点はコストが高いことであり、追加のハードウェアが必要であり(2倍のノード、追加のストレージ)、新しいクラスタに移行するためにかなりの資源の使用を必要とする。新しいハードウェアの導入もハードウェア障害の危険を導入し、潜在的には問題が悪化する。
したがって、非破壊的であり、追加のハードウェアと、システムおよびストレージ管理者の時間および労力の形態の資源とに依存しない方式で、高可用性クラスタ化ソフトウェアでのエラーから回復するための技術的手段を有することが望ましいはずである。
したがって、本発明は、第1の態様では、クラスタ化システムでの非破壊的エラー回復のための機器であって、第1仮想ノード・インスタンスでの構成活動を静止するノード・インスタンス構成活動静止構成要素と、I/Oアクセスがブロックされた第2仮想ノード・インスタンスを作成するノード・インスタンス作成構成要素と、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスに構成データを転送するノード・インスタンス構成転送構成要素と、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスへの切換えをコミットするコミット構成要素と、第1仮想ノード・インスタンスへのインバウンド通信をブロックするノード・インスタンス通信ブロッキング構成要素と、前記第2仮想ノード・インスタンスでのI/Oアクセスをアンブロックするノード・インスタンス通信非ブロッキング構成要素と、前記第1仮想ノード・インスタンスからのアウトバウンド通信を監視し、すべての保留アウトバウンド通信の完了をシグナリングする通信制御構成要素と、前記第1仮想ノード・インスタンスを削除するノード・インスタンス削除構成要素とを備える機器を提供する。
好ましくは、単一ディレクタ構成要素が、前記静止構成要素、前記ノード・インスタンス作成構成要素、前記ノード・インスタンス構成転送構成要素、前記コミット構成要素、前記ノード・インスタンス通信ブロッキング構成要素、前記ノード・インスタンス通信非ブロッキング構成要素、前記通信制御構成要素、および前記ノード・インスタンス削除構成要素を制御する。
好ましくは、前記単一ディレクタ構成要素は、1つまたは複数のフィルタ構成要素と協働して、前記静止構成要素、前記ノード・インスタンス作成構成要素、前記ノード・インスタンス構成転送構成要素、前記コミット構成要素、前記ノード・インスタンス通信ブロッキング構成要素、前記ノード・インスタンス通信非ブロッキング構成要素、前記通信制御構成要素、および前記ノード・インスタンス削除構成要素のうちの1つまたは複数を制御する。
好ましい実施形態では、クラスタ化システムが、第1の態様による機器を備える。
好ましい実施形態では、ストレージ仮想化システムが、第1の態様による機器を備える。
第2の態様では、本発明は、クラスタ化システムで非破壊的エラー回復を実施する方法または論理構成であって、第1仮想ノード・インスタンスでの構成活動を静止するステップと、I/Oアクセスがブロックされた第2仮想ノード・インスタンスを作成するステップと、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスに構成データを転送するステップと、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスへの切換えをコミットするステップと、第1仮想ノード・インスタンスへのインバウンド通信をブロックするステップと、前記第2仮想ノード・インスタンスでのI/Oアクセスをアンブロックするステップと、前記第1仮想ノード・インスタンスからのアウトバウンド通信を監視し、すべての保留アウトバウンド通信の完了をシグナリングするステップと、前記第1仮想ノード・インスタンスを削除するステップとを含む方法または論理構成を提供する。
好ましくは、単一ディレクティング構成要素が、静止する前記ステップ、作成する前記ステップ、転送する前記ステップ、コミットする前記ステップ、ブロックする前記ステップ、アンブロックする前記ステップ、監視する前記ステップ、シグナリングする前記ステップ、および削除する前記ステップを制御する。
好ましくは、前記単一ディレクティング構成要素は、1つまたは複数のフィルタ構成要素と協働して、静止する前記ステップ、作成する前記ステップ、転送する前記ステップ、コミットする前記ステップ、ブロックする前記ステップ、アンブロックする前記ステップ、監視する前記ステップ、シグナリングする前記ステップ、および削除する前記ステップのうちの1つまたは複数を制御する。
第3の態様では、その上に機能データを有するデータ・キャリアであって、前記機能データが機能コンピュータ・データ構造を備え、前記機能コンピュータ・データ構造がコンピュータ・システムにロードされ、前記コンピュータ・システムによって操作されるときに、前記コンピュータ・システムが第2の態様による方法のすべてのステップを実施することを可能にするデータ・キャリアが提供される。
第4の態様では、コンピュータ・プログラム・コードを含むコンピュータ・プログラムであって、前記コンピュータ・プログラム・コードがコンピュータ・システムにロードされ、前記コンピュータ・システム上で実行されるときに、第2の態様による方法のすべてのステップを前記コンピュータ・システムに実施させるコンピュータ・プログラムが提供される。
したがって、本発明の好ましい実施形態は、その最も広い態様において、高可用性クラスタ化ソフトウェアでのエラーから回復するための技術的枠組みを企図する。
本発明の好ましい実施形態は、追加のハードウェア(ストレージ仮想化ノード、ストレージサブシステム)を必要とせず、したがってコストを削減し、新しいハードウェアを介する新しい問題を導入する危険も低減するという、周知のシステムに勝る利点を有する。別の利点は、ホストI/Oを停止する必要がないことである。好ましい実施形態も、追加のストレージならびにシステム管理者の時間および労力の形態の余分な資源を必要としないので、当技術分野による周知のシステムよりも効率的である。
これから、添付の図面図を参照しながら、単に例示として本発明の好ましい実施形態を説明する。
本発明の好ましい実施形態が、ストレージ仮想化コントローラをそのノードに有するストレージ・ネットワークとして実装される。
図1では、ストレージ仮想化を実現する記憶域ネットワーク・コントローラの一例が示されている。この図は、関与するハードウェア構成要素または構成の単一の例を示す。しかし、様々な構成要素がクラスタ内のすべてのノードについて同一となることが当業者には明らかであろう。当業者には周知のように、クラスタリングは、複数の装置および相互接続を使用して、外面的には単一システムとして提示されるものを形成することである。
図1では、仮想ハード・ディスク104が接続されたノード・インスタンス102を備える機器100の構成が示されている。ノード・インスタンス102は、フィルタ106に動作可能に接続され、フィルタ106は、1つまたは複数の仮想外部装置108に接続される。ノード・インスタンス102および仮想外部装置108は、ディレクタ110に動作可能に接続され、ディレクタ110は仮想マシン・モニタ112と通信する。仮想マシン・モニタ112は、ハード・ディスク・ドライブ114および1つまたは複数の外部装置116に従来の方式で接続される。
図1では、ノード・インスタンス102(第1仮想マシン)はストレージ仮想化ノード・ソフトウェアを実行する。
図2を参照すると、図1のすべての要素と、以下の追加の要素とを備える機器が示されている。ノード・インスタンス102’が仮想ハード・ディスク104’およびフィルタ106’に接続される。フィルタ106’と仮想外部装置108’の間の接続は使用不能にされる。ノード・インスタンス102’は、イベント履歴なしのストレージ仮想化のクリーン・インスタンスを実行し、クリーン・クラスタ状態を含む。
動作の際には、仮想マシン・モニタ112(VMM)が、例示的ノード・インスタンス102、102’などの仮想マシン(VM)を作成および削除する。VMMは、I/O装置(例えばイーサネット(登録商標)、シリアル・ポート、FCアダプタ)を仮想化し、それをすべての仮想マシンからアクセス可能にする。すなわち、VMMはI/Oを受け取り、それをターゲット仮想マシンに正しく配布する。VMMはまた、仮想マシンがI/Oを送ることも可能にする。一実施形態では、Xenなどの周知の仮想化技術を使用してこのことを達成することができるが、代替仮想化技術が当業者には明らかであろう。
ディレクタ110は、仮想マシンの作成、第1仮想マシンから第2仮想マシンへの切換え、および最終的には第1仮想マシンの削除を制御するための調整構成要素である。ディレクタ110は、両方の仮想マシン、それら仮想I/O装置、およびそれら仮想ハード・ディスクへのアクセスを有する。
フィルタ106、106’は、VMが受け取り、送ることのできるイベントのセットを定義する。通常動作中、イベントのセットは、制御アプリケーションに関する可能なイベントの完全なセットである。第2VMがノード・インスタンス102’で作成されるとき、その対応するフィルタ106’は、制御アプリケーションを構成するのに必要であるが、その外部ビューを定義するイベントではないイベントのそのサブセットを可能にする。
ストレージ仮想化ノードの1つのアクティブなインスタンスがあり、すなわち、まずこの例では、ノード・インスタンス102がある。VMMがストレージ仮想化クラスタ状態をリフレッシュする要求を受け取るとき、VMMは、第2インスタンスの作成を開始する(この例では、ノード・インスタンス102’)。ディレクタ110は、第1ノード・インスタンス102からのメタデータおよび構成情報を使用して第2ノード・インスタンス102’の構成を調整する。第2インスタンス106’のフィルタは、顧客I/Oがパススルーしないことを保証する。すべての仮想外部装置へのアクセスが使用不能にされる。必要なら、ディレクタ110は、こうした外部装置への偽インターフェース(例えば偽UPS)を提供する。
第2ノード・インスタンス102’が完全に作動可能となると、図3に示されるように、ディレクタ110は、両方のフィルタの挙動の変化を引き起こすコミットを発行する。第1ノード・インスタンス102は、もはや外部信号を受け取らない。しかし、第1ノード・インスタンス102は、未解決I/Oを完了することができる。そのとき第2ノード・インスタンス102’は、すべての仮想外部装置を使用して完全に作動可能であり、I/Oを受け取って完了する。ディレクタ110は、第1インスタンスで完了すべき未解決I/Oを監視する。
すべてのI/Oが第1ノード・インスタンス102から完了すると、図4に示されるように、ディレクタ110は、第1インスタンスの削除を開始する。次いで、すべてのクラスタ活動が、ノード・インスタンス102および構成要素104、106、108の代わりに、ノード・インスタンス102’の制御下で、その対応する付加構成要素104’、106’、108’を使用して行われる。
したがって、有利なことに、機器の形態の本発明の好ましい実施形態は、高可用性クラスタ化ソフトウェアでのエラーから回復するための技術的枠組みを提供する問題に対処する。
図5は、本発明の好ましい実施形態による一般化プロセス・フローを流れ図形式で示す。
STARTステップ200で、単一ノード・インスタンスが、通常動作モードで作動可能である。ステップ202で、クラスタ・リフレッシュ要求が受信される。ステップ204で、第2ノード・インスタンスが作成されるが、外部信号からブロックされる。ステップ206で、第2ノード・インスタンスが、第1ノード・インスタンスから取られた構成データ(状態データではない)を使用して、上述のように構成される。ステップ206の構成活動が完了したとき、ステップ208でコミットが発行される。ステップ210で、第1ノード・インスタンスが外部信号からブロックされ、ステップ212で、第2ノード・インスタンスでのI/Oがアンブロックされる。ステップ214で、第1ノード・インスタンスで保留中であったすべてのI/Oが完了しており、ステップ216で、第1ノード・インスタンスが削除される。ステップ218で、動作が続行する。
したがって、ノード・インスタンス2での置換ソフトウェアはノード・インスタンス1から構成データを継承するが、場合によっては欠陥のあるどんな状態データもノード・インスタンス1から継承しない。
以下はノード・インスタンス切換え手順の一実装の詳細な説明である。
1.ノード・インスタンス102のすべてのディスクに関するキャッシュをフラッシュする(すべてのストレージ仮想化ノード上のキャッシュをフラッシュし、すべてのvdiskについてキャッシュ使用不能モードに変更し/ストレージ仮想化キャッシュを使用不能にする)
2.ノード・インスタンス102に対するすべての構成活動を停止する。
3.ノード・インスタンス102のTier3メタデータおよび構成データをノード・インスタンス102’の仮想ハード・ディスクにコピーする。
4.ノード・インスタンス102’を作成し、仮想ハード・ディスクからのTier3メタデータおよびストレージ仮想化構成バックアップ・データを使用してインスタンス1の構成をミラーリングする。
5.ノード・インスタンス102’が完全に作動可能となるまで、すべてのI/Oはノード・インスタンス102をパススルーし続ける。
6.ノード・インスタンス102’はまだどんなI/Oも受け取らない。ノード・インスタンス102’のキャッシュは、ノード・インスタンス102のキャッシュと同様に空のままである。
7.ノード・インスタンス102’がノード・インスタンス102と同一となると(そのイベント履歴に関してではなく、その構成およびエクステント・マップに関して)、コミットが行われ、ノード・インスタンス102’に切り替わる。
8.ノード・インスタンス102’が除去される。
9.ノード・インスタンス102’上のキャッシュが動作可能にされる。
上記の説明はクラスタ内の単一エンティティに関するものであり、クラスタ内のすべてのノードに関して同一のプロセスを調整する必要があることは当業者には明らかであろう。このことはディレクタ110を介して達成される。クラスタ内のすべてのノード・インスタンス102’が上述のように完全にセットアップされると、ノード・インスタンス102’は、すべてのディレクタ110に通知し、次いですべてのディレクタ110は、対応するノード・インスタンス102に通知する。このようにして、制御された切換えを行うことができる。
したがって、有利なことに、方法または論理構成の形態の本発明の好ましい実施形態は、高可用性クラスタ化ソフトウェアでのエラーから回復するための技術的枠組みを提供する問題に対処する。
したがって、好ましい実施形態は、クラスタ状態の非破壊的再インストール/リフレッシュが要求されたときに、仮想化技術を使用するすべてのストレージ仮想化ノードの資源の仮想化を活動化することによって動作する。これにより、クラスタ状態内の可能性のある不整合を有する元のバージョンと、そのクラスタ状態が再初期化されたフレッシュ・バージョンという、ストレージ仮想化ソフトウェアの2つのインスタンスが、同一のストレージ仮想化ノード上で動作することが可能となる。フレッシュ・バージョンは、そのエクステント・マップで元の構成を再現するために、元のバージョンから必要な最小限のデータをコピーする。ストレージ仮想化ソフトウェアのフレッシュ・バージョンがすべてのノード上で作動可能となると、ホスト・システムまたはストレージサブシステムに影響を及ぼすことなく、I/Oがフレッシュ・クラスタにリダイレクトされる。切換えが完了すると、元のバージョンが削除され、ストレージ資源の仮想化を非活動化することができる。一例として、Xenなどの周知の仮想化技術を使用することができるが、他の等価な仮想化技術が等しく適用可能であることが当業者には明らかであろう。
本発明の好ましい実施形態の方法のすべてまたは一部を、方法のステップを実施するように構成された論理要素を備える論理機器、または複数の論理機器として適切かつ有用に実施することができ、そのような論理要素がハードウェア構成要素、ファームウェア構成要素、またはそれらの組合せを含むことができることは当業者には明らかであろう。
本発明の好ましい実施形態による論理構成のすべてまたは一部を、方法のステップを実施するための論理要素を備える論理機器として実施することができ、そのような論理要素が、例えばプログラム可能論理アレイまたは特定用途向け集積回路内の論理ゲートなどの構成要素を含むことができることは当業者には同様に明らかであろう。そのような論理構成をさらに、例えば仮想ハードウェア記述子言語を使用して、そのようなアレイまたは回路内に論理構造を一時的または永続的に確立するイネーブリング要素として実施することができ、仮想ハードウェア記述子言語は、固定キャリア・メディアまたは伝送可能キャリア・メディアを使用して格納および伝送することができる。
上述の方法および構成を1つまたは複数のプロセッサ(図示せず)上で動作するソフトウェア内で完全に、または部分的に、適切に実施することもでき、磁気ディスクや光ディスクなどの任意の適切なデータ・キャリア(やはり図示せず)上で担持される1つまたは複数のコンピュータ・プログラム要素の形態でソフトウェアを提供できることを理解されよう。同様に、データの伝送用のチャネルは、すべての種類の記憶媒体ならびに有線またはワイヤレス信号搬送媒体などの信号搬送媒体を含むことができる。
本発明はさらに、コンピュータ・システムと共に使用されるコンピュータ・プログラム製品として適切に実施することができる。そのような実装は、コンピュータ可読媒体、例えばディスケット、CD−ROM、ROM、またはハード・ディスクなどの有形媒体上に固定され、あるいはモデムまたは他のインターフェース装置を介して、限定はしないが光学もしくはアナログ通信回線を含む有形媒体を介して、または限定はしないがマイクロ波、赤外線、もしくは他の伝送技法を含むワイヤレス技法を使用して無形にコンピュータ・システムに伝送可能な、一連のコンピュータ可読命令を含むことができる。この一連のコンピュータ可読命令は、本明細書で先に述べた機能のすべてまたは一部を実施する。
そのようなコンピュータ可読命令は、多数のコンピュータ・アーキテクチャまたはオペレーティング・システムと共に使用されるいくつかのプログラミング言語で書き込むことができることを当業者は理解されよう。さらに、限定はしないが半導体、磁気、または光を含む現在または将来の任意のメモリ技術を使用してそのような命令を格納することができ、あるいは限定はしないが光、赤外線、またはマイクロ波を含む現在または将来の任意の通信技術を使用して伝送することができる。そのようなコンピュータ・プログラム製品を、付随する印刷文書または電子文書を伴う取外し可能媒体、例えば収縮包装されたソフトウェアとして配布することができ、コンピュータ・システム、例えばシステムROMまたは固定ディスク上にプリロードすることができ、あるいはネットワーク、例えばインターネットまたはワールド・ワイド・ウェブを介してサーバまたは電子掲示板から配布することができることが企図される。
代替実施形態では、本発明の好ましい実施形態を、コンピュータ・インフラストラクチャ内に配置されてその上で実行されたときに、方法のすべてのステップを前記コンピュータ・システムに実施させるように動作可能なコンピュータ・プログラム・コードを配置するステップを含むサービスを配置するコンピュータで実装される方法の形態で実現することができる。
本発明の範囲から逸脱することなく、上記の例示的実施形態に対して多数の改善および修正を行えることは当業者には明らかであろう。
動作の際の、本発明の好ましい実施形態による機器、または機器の構成を略図形式で示す図である。 動作の際の、本発明の好ましい実施形態による機器、または機器の構成を略図形式で示す図である。 動作の際の、本発明の好ましい実施形態による機器、または機器の構成を略図形式で示す図である。 動作の際の、本発明の好ましい実施形態による機器、または機器の構成を略図形式で示す図である。 本発明の好ましい実施形態による動作の方法を実施することのできる一方法または一論理構成を流れ図形式で示す図である。

Claims (12)

  1. エラー回復のための機器であって、該機器は、
    ストレージ仮想ノード・ソフトウエアを実行する第1仮想ノード・インスタンスと、
    該第1仮想ノード・インスタンスに結合されたディレクタと、
    該ディレクタに接続された仮想マシン・モニタとを備え、
    前記仮想マシン・モニタが、仮想化クラスタ状態をリフレッシュする要求を受け取り、前記ディレクタに結合する追加の第2仮想ノード・インスタンスの作成を開始し、
    前記ディレクタが、前記第1仮想ノード・インスタンスからのメタデータ及び構成情報を使用して、前記第2仮想ノード・インスタンスの構成を調整し、
    前記ディレクタが、第2仮想ノード・インスタンスが完全に作動可能になると、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスへの切換えをコミットし、
    前記仮想マシン・モニタが、前記第1仮想ノード・インスタンスを削除する、機器。
  2. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、前記作成時に、前記フィルタが、該フィルタ及び前記仮想外部装置の間の接続を使用不能にする、請求項1に記載の機器。
  3. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、第2仮想ノード・インスタンスが完全に作動可能になると、前記フィルタが、該フィルタ及び前記仮想外部装置の間の接続を使用可能にする、請求項1に記載の機器。
  4. 前記第2仮想ノード・インスタンスが、クラスタ状態が再初期化されたフレッシュ・バージョンである、請求項1に記載の機器。
  5. ストレージ仮想ノード・ソフトウエアを実行する第1仮想ノード・インスタンスと、
    該第1仮想ノード・インスタンスに結合されたディレクタと、
    該ディレクタに接続された仮想マシン・モニタとを備える機器におけるエラー回復のための方法であって、
    前記仮想マシン・モニタが、仮想化クラスタ状態をリフレッシュする要求を受け取り、前記ディレクタに結合する追加の第2仮想ノード・インスタンスの作成を開始するステップと、
    前記ディレクタが、前記第1仮想ノード・インスタンスからのメタデータ及び構成情報を使用して、前記第2仮想ノード・インスタンスの構成を調整するステップと、
    前記ディレクタが、第2仮想ノード・インスタンスが完全に作動可能になると、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスへの切換えをコミットするステップと、
    前記仮想マシン・モニタが、前記第1仮想ノード・インスタンスを削除するステップとを含む方法。
  6. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、前記作成時に、前記フィルタが、該フィルタ及び仮想外部装置の間の接続を使用不能にするステップと含む、請求項5に記載の方法。
  7. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、第2仮想ノード・インスタンスが完全に作動可能になると、前記フィルタが、該フィルタ及び仮想外部装置の間の接続を使用可能にするステップを含む、請求項5に記載の方法。
  8. 前記第2仮想ノード・インスタンスが、クラスタ状態が再初期化されたフレッシュ・バージョンである、請求項5に記載の方法。
  9. ストレージ仮想ノード・ソフトウエアを実行する第1仮想ノード・インスタンスと、
    該第1仮想ノード・インスタンスに結合されたディレクタと、
    該ディレクタに接続された仮想マシン・モニタとを備える機器におけるエラー回復のためのプログラムであって、
    コンピュータに、
    前記仮想マシン・モニタが、仮想化クラスタ状態をリフレッシュする要求を受け取り、前記ディレクタに結合する追加の第2仮想ノード・インスタンスの作成を開始する手順と、
    前記ディレクタが、前記第1仮想ノード・インスタンスからのメタデータ及び構成情報を使用して、前記第2仮想ノード・インスタンスの構成を調整する手順と、
    前記ディレクタが、第2仮想ノード・インスタンスが完全に作動可能になると、前記第1仮想ノード・インスタンスから前記第2仮想ノード・インスタンスへの切換えをコミットする手順と、
    前記仮想マシン・モニタが、前記第1仮想ノード・インスタンスを削除する手順とを実行させるためのプログラム。
  10. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、前記作成時に、前記フィルタが、該フィルタ及び仮想外部装置の間の接続を使用不能にするステップと含む、請求項9に記載のプログラム。
  11. 前記追加の第2仮想ノード・インスタンスの作成時に、前記第2仮想ノード・インスタンス及び前記ディレクタの間にフィルタ及び仮想外部装置が接続され、第2仮想ノード・インスタンスが完全に作動可能になると、前記フィルタが、該フィルタ及び仮想外部装置の間の接続を使用可能にするステップを含む、請求項9に記載のプログラム。
  12. 前記第2仮想ノード・インスタンスが、クラスタ状態が再初期化されたフレッシュ・バージョンである、請求項9に記載のプログラム。
JP2009512599A 2006-06-02 2007-05-31 エラー回復のための機器、方法及びプログラム Active JP5235871B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0611038.1 2006-06-02
GBGB0611038.1A GB0611038D0 (en) 2006-06-02 2006-06-02 Apparatus and method for cluster recovery
PCT/EP2007/055304 WO2007141180A2 (en) 2006-06-02 2007-05-31 Apparatus and method for cluster recovery

Publications (2)

Publication Number Publication Date
JP2009539160A JP2009539160A (ja) 2009-11-12
JP5235871B2 true JP5235871B2 (ja) 2013-07-10

Family

ID=36694943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009512599A Active JP5235871B2 (ja) 2006-06-02 2007-05-31 エラー回復のための機器、方法及びプログラム

Country Status (5)

Country Link
US (1) US8107359B2 (ja)
JP (1) JP5235871B2 (ja)
CN (1) CN101449246B (ja)
GB (1) GB0611038D0 (ja)
WO (1) WO2007141180A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8302094B2 (en) * 2009-06-26 2012-10-30 Vmware, Inc. Routing a physical device request using transformer stack to an equivalent physical device in a virtualized mobile device
CN101925018B (zh) * 2010-08-19 2013-01-23 浙江元亨通信技术股份有限公司 一种虚拟集群系统
US9020895B1 (en) * 2010-12-27 2015-04-28 Netapp, Inc. Disaster recovery for virtual machines across primary and secondary sites
EP2911346B1 (en) 2012-11-13 2017-07-05 Huawei Technologies Co., Ltd. Method and network device for establishing virtual cluster
US9634886B2 (en) * 2013-03-14 2017-04-25 Alcatel Lucent Method and apparatus for providing tenant redundancy
US9483352B2 (en) * 2013-09-27 2016-11-01 Fisher-Rosemont Systems, Inc. Process control systems and methods
US9344364B2 (en) * 2014-03-31 2016-05-17 Metaswitch Networks Ltd. Data center networks
US9559950B2 (en) * 2014-03-31 2017-01-31 Tigera, Inc. Data center networks
US9813258B2 (en) 2014-03-31 2017-11-07 Tigera, Inc. Data center networks
CN111669362B (zh) 2014-06-09 2022-04-08 华为技术有限公司 信息处理方法、网络节点、验证方法和服务器
CN107665158A (zh) * 2017-09-22 2018-02-06 郑州云海信息技术有限公司 一种存储集群恢复方法及设备
JP7355778B2 (ja) 2021-04-27 2023-10-03 株式会社日立製作所 ストレージシステム、ストレージノード仮想計算機復旧方法、及び復旧プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4501096B2 (ja) * 1998-05-12 2010-07-14 オラクル・アメリカ・インコーポレーテッド 高可用性クラスタ仮想ディスク・システム
US6990547B2 (en) * 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
EP1231537A1 (de) * 2001-02-09 2002-08-14 Siemens Aktiengesellschaft Automatische Inbetriebnahme eines Clustersystems nach einem heilbaren Fehler
US6944785B2 (en) 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
US20030119457A1 (en) * 2001-12-19 2003-06-26 Standke Randolph E. Filter technique for increasing antenna isolation in portable communication devices
FI20021287A0 (fi) * 2002-06-28 2002-06-28 Nokia Corp Kuormituksen jako tietoliikennejärjestelmässä
FR2843209B1 (fr) * 2002-08-02 2006-01-06 Cimai Technology Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe.
FR2843210B1 (fr) * 2002-08-02 2005-10-14 Meiosys Procede de migration de connexions dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de migration, et systeme multi-ordinateurs ainsi equipe.
US7149918B2 (en) * 2003-03-19 2006-12-12 Lucent Technologies Inc. Method and apparatus for high availability distributed processing across independent networked computer fault groups
US7711977B2 (en) * 2004-04-15 2010-05-04 Raytheon Company System and method for detecting and managing HPC node failure
US7475274B2 (en) * 2004-11-17 2009-01-06 Raytheon Company Fault tolerance and recovery in a high-performance computing (HPC) system
US7590811B1 (en) * 2006-08-30 2009-09-15 Emc Corporation Methods and system for improving data and application availability in clusters

Also Published As

Publication number Publication date
WO2007141180A2 (en) 2007-12-13
CN101449246A (zh) 2009-06-03
GB0611038D0 (en) 2006-07-12
JP2009539160A (ja) 2009-11-12
WO2007141180A3 (en) 2008-03-20
US20100054120A1 (en) 2010-03-04
US8107359B2 (en) 2012-01-31
CN101449246B (zh) 2010-10-20

Similar Documents

Publication Publication Date Title
JP5235871B2 (ja) エラー回復のための機器、方法及びプログラム
US9753761B1 (en) Distributed dynamic federation between multi-connected virtual platform clusters
US20230185681A1 (en) High reliability fault tolerant computer architecture
US9552217B2 (en) Using active/active asynchronous replicated storage for live migration
US9400611B1 (en) Data migration in cluster environment using host copy and changed block tracking
US9575894B1 (en) Application aware cache coherency
US8875134B1 (en) Active/active storage and virtual machine mobility over asynchronous distances
US11570243B2 (en) Decommissioning, re-commissioning, and commissioning new metadata nodes in a working distributed data storage system
US7669073B2 (en) Systems and methods for split mode operation of fault-tolerant computer systems
US9454417B1 (en) Increased distance of virtual machine mobility over asynchronous distances
US8726083B1 (en) Synchronized taking of snapshot memory images of virtual machines and storage snapshots
US11650891B2 (en) Preventing non-detectable data loss during site switchover
US20100257326A1 (en) Method and apparatus for logical volume management for virtual machine environment
US10185636B2 (en) Method and apparatus to virtualize remote copy pair in three data center configuration
US20200142791A1 (en) Method for the implementation of a high performance, high resiliency and high availability dual controller storage system
US7603392B2 (en) System, method and computer program product for storing transient state information
US10747635B1 (en) Establishing quorums on an object-by-object basis within a management system
EP4250119A1 (en) Data placement and recovery in the event of partition failures
US8726067B1 (en) Utilizing both application and storage networks for distributed storage over asynchronous distances
US10891205B1 (en) Geographically dispersed disaster restart multitenancy systems
JP5947974B2 (ja) 情報処理装置及び情報処理装置の交換支援システム並びに交換支援方法
US12032944B2 (en) State machine operation for non-disruptive update of a data management system
US12019618B2 (en) Prechecking for non-disruptive update of a data management system
US20240095011A1 (en) State machine operation for non-disruptive update of a data management system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130326

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3