JP2008059583A - クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品 - Google Patents

クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品 Download PDF

Info

Publication number
JP2008059583A
JP2008059583A JP2007217739A JP2007217739A JP2008059583A JP 2008059583 A JP2008059583 A JP 2008059583A JP 2007217739 A JP2007217739 A JP 2007217739A JP 2007217739 A JP2007217739 A JP 2007217739A JP 2008059583 A JP2008059583 A JP 2008059583A
Authority
JP
Japan
Prior art keywords
replica
backup
client
failed
cluster system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007217739A
Other languages
English (en)
Inventor
Patrick A Buah
パトリック・エイ・ブアー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008059583A publication Critical patent/JP2008059583A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated

Abstract

【課題】少なくとも1つのクライアントと、少なくとも1つのノードと、クラスタ・システム上で実行されるプロセスをそれぞれが複製する第1レプリカ、第2レプリカ、および第2バックアップ(Sバックアップ)・レプリカとを有するクラスタ・システム内でレプリカをバックアップするための方法、システム、およびプログラム製品を提供する。
【解決手段】第1レプリカ、第2レプリカ、およびSバックアップ・レプリカのそれぞれに階層が割り当てられる。それらのレプリカのうちの1つの障害が検出され、障害の発生しているレプリカは、より低い階層のレプリカと交換される。最も低い影響のある階層を有するレプリカを再生成して、第1レプリカ、第2レプリカ、およびSバックアップ・レプリカを再び確立する。
【選択図】図2

Description

本発明は、クラスタ化されたコンピュータ・システムのコンポーネントの複製に関し、より詳細には、クラスタ化されたコンピュータ・システムのコンポーネントの副レプリカをバックアップするためのバックアップ複製に関する。
クラスタ化されたシステムにつきものの大きな問題は、そうしたシステムが障害に対して潜在的に脆弱であるという点である。クラスタ内の単一のノードがクラッシュすると、システム全体が利用できなくなるおそれがある。システムの信頼性を高めるための冗長性が、通常はコンポーネントの複製によってシステム内に導入される。分散システム内でサービスやプロセスを複製するには、そのサービスのそれぞれのレプリカが、一貫した状態を維持する必要がある。この一貫性は、特定の複製プロトコルによって確保される。プロセスのレプリカを編成するためのさまざまな方法があり、一般には、能動的(アクティブ)な複製、受動的(パッシブ)な複製、および準能動的(セミアクティブ)な複製に区分される。
能動的な複製技術(状態マシン・アプローチとも呼ばれる)においては、すべてのレプリカが、クライアントから受信した要求を処理し、応答を送信する。レプリカは、独立して動作し、この技術の本質は、すべてのレプリカが必ず同じ順序で要求を受信するようにすることにある。この技術では、クラッシュの場合の応答時間が短くなる。しかし、すべてのレプリカがすべての要求を並行して処理するため、著しいランタイム・オーバヘッドを招き、したがって、商用アプリケーションのための可用性の高いソリューションとしては非現実的な選択肢となっている。
受動的な複製技術(第1バックアップとも呼ばれる)では、レプリカのうちの1つ(第1レプリカと呼ばれる)が、クライアントから要求を受信し、応答を返す。バックアップは、第1レプリカのみと対話し、状態更新メッセージを第1レプリカから受信する。第1レプリカに障害が生じた場合には、バックアップのうちの1つが、後を引き受ける。能動的な複製とは異なり、能動的な複製よりも少ない処理能力ですみ、要求を処理することの決定論上の仮定をまったく行わない。しかし、障害の場合の応答時間が著しく長く、そのために、時間的にクリティカルなアプリケーションというコンテキストにおいては不適切となる。
準能動的な複製技術は、時間的にクリティカルなアプリケーションというコンテキストにおける、能動的な複製に伴う非決定論の問題を回避する。この技術は、能動的な複製に基づくものであり、リーダ(指導者)およびフォロワ(追随者)という概念を用いて拡張されている。要求の実際の処理は、すべてのレプリカによって実行されるが、処理のうちの非決定性の部分を実行してフォロワに知らせることは、リーダの担当である。この技術は、能動的な複製に近いが、非決定性の処理が可能であるという点が異なる。しかし、第1レプリカに障害が発生した場合には、著しい回復時間のオーバヘッドを招く。
「METHOD TO BE USED WITH A DISTRIBUTED DATABASE, AND A SYSTEM ADAPTED TO WORK ACCORDING TO THE METHOD」に関して2001年2月13日にRonstromらに対して交付された米国特許第6,189,017B1号は、ノードを形成するいくつかのコンピュータを有するシステム分散型のデータ・ベースの信頼性を確保する方法を開示している。このデータ・ベースの一部は、第1レプリカおよび第2レプリカを含む。第2レプリカは、第1のノードがクラッシュした場合に、第1レプリカを再生成するために使用される。
「DETERMINISTIC PREEMPTION POINTS IN OPERATINGSYSTEM EXECUTION」に関して2004年10月5日にUniceに対して交付された米国特許第6,802,024B2号は、サイクル・カウンタ機能のためのサポートを有する単一または複数のプロセッサを利用するフォルト・トレラントなソリューションを提供するための方法および装置を開示している。この装置は、第1システムおよび第2システムを含む。第1の中断のみが発生して、その第1の中断が第2システムによって生じたものである場合には、出力機能部は、第2システムのみからのシステム出力を提供する。
「SYSTEM, METHOD AND APPARATUS FOR DATAPROCESSING AND STORAGE TO PROVIDE CONTINUOUS OPERATIONS INDEPENDENT OF DEVICEFAILURE OR DISASTER」に関して2003年8月21日にFukuharaらによって公開された米国特許出願公開第2003/0159083A1号は、少なくとも2つのアプリケーション・サーバを有するユーザ・コンピューティング・デバイスにおけるユーザ・アプリケーションの継続的なオペレーションを提供するためのシステム、方法、および装置を開示している。アプリケーション・サーバのうちの一方が障害を起こし場合や、利用できなくなった場合には、ユーザの要求は、少なくとも他方のアプリケーション・サーバによって、まったく遅延することなく引き続き処理することができる。
「SYSTEMS AND METHODS FOR THEREPARTITIONING OF DATA」に関して2005年9月22日にShuttらによって公開された米国特許出願公開第2005/0210082A1号は、第2のサーバ上の第1のバックアップ・データ構造を新たなサーバへ移動し、その新たなサーバ上に第2のデータ構造を作成し、第2のサーバ上に第2のデータのための第2のバックアップ・データ構造を作成することによって、サーバの連合体を拡張して、その連合体のサーバのデータ負荷のバランスをとることを開示している。
「METHODS, APPARATUS AND COMPUTER PROGRAMSFOR RECOVERY FROM FAILURES IN A COMPUTING ENVIRONMENT」に関して2005年12月1日にHufferdらによって公開された米国特許出願公開第2005.0268145A1号は、一式のサーバが一式のリソース・インスタンスへのクライアントのアクセスをコントロールするデータ処理環境内のサーバに影響を与える障害からの回復のための方法、装置、およびコンピュータ・プログラムを開示している。障害の後に、クライアントは、以前に識別した第2サーバへ接続して、同じリソース・インスタンスにアクセスする。
Kim, Highly Available Systems for DatabaseApplications, Computing Surveys, Vol. 16, No. 1 (March 1984)は、可用性を主要な目的として設計されたデータベース・アプリケーション・システムにおいて使用されるアーキテクチャおよび可用性の技術の概観および分析を提供している。
Gummadi et al., An EfficientPrimary-Segmented backup scheme for Dependable Real-Time Communication inMultihop Networks, IEEE/ACM Transactions of Networking, Vol. 11, No 1(February, 2003)は、セグメント化されたバックアップ・スキームを開示している。
米国特許第6,189,017B1号 米国特許第6,802,024B2号 米国特許出願公開第2003/0159083A1号 米国特許出願公開第2005/0210082A1号 米国特許出願公開第2005.0268145A1号 Kim, Highly Available Systems forDatabase Applications, Computing Surveys, Vol. 16, No. 1 (March 1984) Gummadi et al., An EfficientPrimary-Segmented backup scheme for Dependable Real-Time Communication inMultihop Networks, IEEE/ACM Transactions of Networking, Vol. 11, No 1(February, 2003)
本発明の主要な目的は、「第2バックアップ複製」と呼ばれる複製スキームであり、これは、要求を処理することの決定論上の仮定をまったく行わず、その一方で同時にランタイム・オーバヘッドおよび回復時間オーバヘッドの双方を減らし、したがって、ミッションクリティカルなアプリケーションおよびタイムクリティカルなアプリケーションの可用性の高いフォルトトレラントな管理に適している。ニューヨーク州アーモンクのInternational Business Machines Corp.から市販されているHACMP、およびカリフォルニア州クパチーノのSymanticCorp.から市販されているVeritas Cluster Serverなど、既存の可用性の高いクラスタ・ソリューションは、このようなスキームから恩恵を享受して、電気通信環境などのタイムクリティカルな環境をサポートすることができる。
本発明の別の目的は、「第2バックアップ」複製と呼ばれるクラスタ化されたコンピュータ・システムのための新たな複製技術である。この技術においては、クラスタ内のプロセスやコンピュータ・ノードは、3つのレプリカすなわちクローンからなるグループへと複製される。これらの3つのプロセス・レプリカは、この技術によって導入される「第2バックアップ」すなわち「Sバックアップ」と呼ばれる新たな役割に加えて、従来の「第1」および「第2」の役割を伴って、第2バックアップ・プロトコルに加わる。Sバックアップは、第2レプリカへのウォーム・バックアップとして機能するプロセス・グループ内のプロセス・レプリカやシステム・レプリカのうちの1つである。第1レプリカおよび第2レプリカは、準能動的な複製プロトコルに加わり、その一方で第2レプリカとSバックアップとの間には、受動的な複製関係が存在する。
本発明の別の目的は、第3レプリカ、および第2レプリカと第3レプリカとの間におけるオーバヘッドの低いプロトコルの導入である。また、ここで採用される準能動的な複製スキームには、常に1つの「フォロワ」しか含まれない。
ここで採用される第1レプリカと第2レプリカとの間における準能動的な複製の構成によって、低いランタイム・オーバヘッドおよび瞬時のフェイルオーバ機能が確保され、その一方で第2バックアップの関係によって、クラスタ化されたシステム内での迅速な回復またはフェイルバック(障害回復)が可能となる。このようにして複製されたプロセスやシステムを伴うクラスタにとっては、継続的な可用性を保証することができ、その一方で、障害の場合の応答および回復の時間が大幅に短縮され、ミッションにクリティカルなアプリケーションおよび時間にクリティカルなアプリケーションにとって、改善された環境となる。
概要について上述した方法に対応するシステムおよびコンピュータ・プログラム製品についても、本明細書において説明し、特許請求する。
さらなる特徴および利点は、本発明の技術を通じて実現される。本発明のその他の実施形態および態様については、本明細書において詳細に説明し、特許請求される本発明の一部とみなす。本発明を利点および特徴と共によりよく理解するために、説明および図面を参照されたい。
本発明とみなされる主題については、本明細書に添付された特許請求の範囲において特に指摘し、明確に特許請求する。本発明の前述およびその他の目的、特徴、および利点は、以降の詳細な説明を添付の図面と併せて理解すれば、明らかとなる。
詳細な説明は、本発明の好ましい実施形態を、利点および特徴と共に、例示として図面を参照しながら説明する。
図1は、1つまたは複数のクライアント12a〜12nと、通信システム13および14と、ノード16a〜16nと、ディスク・バス18と、1つまたは複数の共有ディスク20a〜20nとを有するクラスタ化されたコンピュータ・システム10の一例を示している。システム10は一例にすぎず、本発明と共に使用できるその他のクラスタは、プロセッサの数、ネットワークの選択、および使用されるディスク・テクノロジなどに応じて、非常に異なった体裁を有する可能性があるということが理解できるであろう。クライアント12は、13で示されているようなパブリックLAN(public LAN)や、14で示されているようなプライベートLAN(private LAN)などのローカル・エリア・ネットワークを介してノード16にアクセスできるプロセッサであるということが理解できるであろう。クライアント12はそれぞれ、「フロント・エンド」またはクライアント・アプリケーションを実行し、この「フロント・エンド」またはクライアント・アプリケーションは、クラスタ・ノード16上で作動しているサーバ・アプリケーションにクエリーを行う。図1のシステムにおいては、それぞれのノード16は、1つまたは複数の共有された外部のディスク・デバイス20にアクセスすることができるということも理解できるであろう。それぞれのディスク・デバイス20は、複数のノードへ物理的に接続することができる。共有ディスク20は、通常はデータの冗長性のために構成されているミッションクリティカルなデータを保存する。ノード16は、クラスタ・システム10の中核を形成する。ノード16は、可用性の高いフォルトトレラントな管理ソフトウェアおよびアプリケーション・ソフトウェアを実行するプロセッサである。
可用性の高い分散システム内でプロセス・レプリカのグループを管理するために、新たな複製管理技術である第2バックアップ複製を開示する。第2バックアップ・プロセスにおいては、1つのレプリカは、通常の第1バックアップ・アプローチの場合の第1レプリカの代わりに第2レプリカのためのバックアップとして機能し、この場合、第2レプリカが第1レプリカをバックアップする。図2は、調整された複製プロトコルに加わる第1レプリカ22、第2レプリカ23、およびSバックアップ・レプリカ24という指定された役割を有する3つのレプリカから構成される統合された複製スキームを示している。第1レプリカ22および第2レプリカ23の双方が要求を処理するが、第1レプリカ22のみが、または第2レプリカ23のみが、クライアント12に応答を返信する。クラスタ・ソフトウェア26やその他の任意のスキーム利用者は、第1レプリカ22または第2レプリカ23のどちらがクライアントに応答を返信するかを事前に設定することができる。これは、第1レプリカ22と第2レプリカ23との間における負荷のバランスをとるために動的に設定することもできる。第2レプリカ23およびSバックアップ・レプリカ24は、第1レプリカ22と同じノード16に、または27で示されているように希望に応じてシステム10内の別の場所に保持することができるということが理解できるであろう。定期的に、第2レプリカ23は、自分の状態を、自分のバックアップ・レプリカであるSバックアップ・レプリカ24と同期化する。任意選択で、Sバックアップ・レプリカ24は、第2レプリカ23上の状態の変化がないか調べるように設定することができる。
図2は、クライアント12と、3つのレプリカ22、23、および24とから構成されるクラスタ化された第2バックアップ複製の構成を示している。それぞれのレプリカは、単一のプロセス、あるいは単一のコンピュータ・システムまたはLPARイメージ(LPAR image)上で作動するコンテナ(container)として考えることができる。レプリカは、AIXやLinuxなどの単一のオペレーティング・システム・イメージを表すこともできる。3つのレプリカ22、23、および24はすべて、単一のコンピュータ・システム上で実行される3つの別個のプロセスとみなすこともできる。第1レプリカ22および第2レプリカ23の双方が、すべてのクライアント要求を処理するが、第1レプリカ22のみが、すべての非決定性のオペレーションの処理を担当する。そして第2レプリカ23は、第1レプリカ22が行ったのと同じ決定を行うように強制される。第2レプリカ23は、Sバックアップ・レプリカ24の状態を定期的に更新し、この更新は、Sバックアップ・レプリカ24に対するその状態の変化をポイントチェックすること(checkpointing)から構成され、したがって、クラスタのランタイム・オーバヘッドに対するSバックアップ・レプリカ24の影響を最小限に抑える。
通常、グループ内の1つのレプリカの障害は、そのグループの構成を変え、ビューの変化を引き起こす。図2のシステムにおいては、システム内でのレプリカの障害や損失は、障害の発生したレプリカが担っていた役割に応じて、さまざまに処理される。Sバックアップ・レプリカ24は、グループを越えたいかなる対話にも加わらないため、その障害は、このレプリカの編成にとって完全に透過的である。図3は、第1レプリカ22の障害が検出されるプロセスのフローチャートである。30において、第1レプリカの障害が検出される。31において、第1レプリカ22の障害が検出されると、第2レプリカ23は、瞬時に後を引き受け、計算を続行して、第1レプリカ22の役割を引き継ぐ。32において、第2レプリカ23が最初に行うことは、障害の発生した第1レプリカ22から既に受信していた保留中のイベントをすべて再生して、第1レプリカ22の最後に分かっている状態によって自分自身を最新の状態にもっていくことである。33において、第2レプリカ23は、実行を継続し、すべての保留中のイベントを処理した後に自分自身をSバックアップ・レプリカ24と同期化する。そして34において、Sバックアップ・レプリカ24は、第2レプリカ24としての新たな第2の役割へと格上げされる。
図4は、現在の第2レプリカ23の障害が検出されるプロセスのフローチャートである。現在の第2レプリカ23に障害が発生した場合には、40において、その障害が検出される。41において、Sバックアップ・レプリカ24は、自分自身を格上げして、第2の役割を引き受ける。余分なリソースが存在する場合には、42において、第2レプリカ22は、新たなレプリカを始動することによってグループの再構成を開始し、この新たなレプリカは、Sバックアップ・レプリカ24の役割を引き受けて、元の複製の度合いを復元する。
図5は、Sバックアップ・レプリカ24の障害が検出されるプロセスを示すフローチャートである。Sバックアップ・レプリカ24は、要求および応答の処理に関与しないため、Sバックアップ・レプリカ24の障害は、クラスタの状態に影響を与えない。50において、Sバックアップ・レプリカ24の障害が検出される。51において、第2レプリカ22は、可能な場合には自分自身を複製して、新たなSバックアップ24を作成する。
本発明の機能は、ソフトウェア、ファームウェア、ハードウェア、あるいはそれらの何らかの組合せにおいて実装することができる。
一例として、本発明の1つまたは複数の態様は、たとえばコンピュータで使用可能なメディアを有する製品(たとえば、1つまたは複数のコンピュータ・プログラム製品)に含めることができる。そのメディアは、たとえば本発明の機能を提供して容易にするためのコンピュータ可読プログラム・コード手段を内部で具体化している。この製品は、コンピュータ・システムの一部として含めることもでき、あるいは別個に販売することもできる。
さらに、マシンによって読み取ることができる少なくとも1つのプログラム・ストレージ・デバイスであって、本発明の機能を実行するためにマシンによって実行可能な命令の少なくとも1つのプログラムを目に見える形で具体化するプログラム・ストレージ・デバイスを提供することができる。
本明細書に記載されている流れ図は、単なる例である。これらの図、あるいはそれらの中に記載されているステップ(またはオペレーション)に対して、本発明の趣旨から逸脱することなく、多くの変形形態が存在することができる。たとえば、これらのステップを異なる順序で実行することもでき、あるいは、ステップを追加、削除、または修正することもできる。これらの変形形態はすべて、特許請求される本発明の一部とみなされる。
本発明に対する好ましい実施形態について説明したが、現在および将来の双方において、添付の特許請求の範囲内に収まるさまざまな改良および機能強化を当業者なら行うことができるということが理解できるであろう。これらの特許請求の範囲は、最初に記載した本発明のための適切な保護を維持するものと解釈すべきである。
本発明のクラスタ化されたコンピュータ・システムの一例を示す図である。 図1のクラスタ化されたコンピュータ・システムのノード、クライアント、および通信チャネルを示す図であり、このシステムは、第1レプリカ、第2レプリカ、およびSバックアップ・レプリカを有する。 図2の第1レプリカの障害が検出されるプロセスを示すフローチャートである。 図2の現在の第2レプリカの障害が検出されるプロセスを示すフローチャートである。 図2のSバックアップ・レプリカの障害が検出されるプロセスを示すフローチャートである。
符号の説明
10 クラスタ化されたコンピュータ・システム
12a クライアント
12n クライアント
13 通信システム
14 通信システム
16a ノード
16n ノード
18 ディスク・バス
20a 共有ディスク
20n 共有ディスク
22 第1レプリカ
23 第2レプリカ
24 Sバックアップ・レプリカ
26 クラスタ・ソフトウェア

Claims (7)

  1. 少なくとも1つのクライアントと、少なくとも1つのノードと、クラスタ・システム上で実行されるプロセスをそれぞれが複製する第1レプリカ、第2レプリカ、および第2バックアップ(Sバックアップ)・レプリカとを有する前記クラスタ・システム内でレプリカをバックアップする方法であって、
    前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカのそれぞれに階層を割り当てるステップと、
    前記レプリカのうちの1つのレプリカの障害を検出するステップと、
    障害の発生している前記1つのレプリカを、より低い階層のレプリカと置き換えるステップと、
    影響を受けた階層のうちで最も低い階層を有するレプリカを再生成し、それによって、前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカを再び確立するステップと
    を含む方法。
  2. 前記障害の発生したレプリカが前記第1レプリカであり、
    前記第2レプリカを用いて前記プロセスの実行を引き継ぐステップと、
    前記第2レプリカを用いて保留中のイベントを再生するステップであって、それによって、前記第2レプリカが新たな第1レプリカになる、ステップと、
    前記第2レプリカを前記Sバックアップ・レプリカと同期させるステップと、
    前記Sバックアップ・レプリカを新たな第2レプリカとして格上げするステップと
    をさらに含む、請求項1に記載の方法。
  3. 前記障害の発生したレプリカが前記第2レプリカであり、
    前記Sバックアップ・レプリカを新たな第2レプリカとして格上げするステップと、
    新たなSバックアップ・レプリカを再構成して始動させるステップと
    をさらに含む、請求項1に記載の方法。
  4. 前記障害の発生したレプリカが前記Sバックアップ・レプリカであり、
    前記第2レプリカを、自分自身のコピーを用いて複製するステップであって、それにより、新たなSバックアップ・レプリカが形成される、ステップ
    をさらに含む、請求項1に記載の方法。
  5. 前記レプリカによって複製される前記プロセスが、AIXやLinuxオペレーティング・システムなどの単一のオペレーティング・システム・イメージである、請求項1に記載の方法。
  6. 少なくとも1つのクライアントと、
    前記クライアントに接続されている少なくとも1つのノードと、
    前記クライアントから要求を受信して前記クライアントへ応答を返信するプロセスを実行する第1レプリカと、
    前記クライアントから要求を受信して前記第1レプリカを複製する第2レプリカと、
    前記第2レプリカと同期させられている第2バックアップ(Sバックアップ)・レプリカと
    を備え、
    前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカのそれぞれが階層を割り当てられ、
    前記レプリカのうちの1つの障害を検出する検出機能部と、
    前記障害の発生しているレプリカを、より低い階層のレプリカと置き換える、置き換え機能部と、
    影響を受けた階層のうちで最も低い階層を有するレプリカを再生成し、それによって、前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカを再び確立する、再生成機能部と、
    を備える、クラスタ・システム。
  7. 少なくとも1つのクライアントと、少なくとも1つのノードと、クラスタ・システム上で実行されるプロセスをそれぞれが複製する第1レプリカ、第2レプリカ、および第2バックアップ(Sバックアップ)・レプリカとを有する前記クラスタ・システム内でレプリカをバックアップするために使用することができる、コンピュータ可読メディア上に記録されたコンピュータ・プログラムであって、当該クラスタ・システムに、
    前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカのそれぞれに階層を割り当てるステップと、
    前記レプリカのうちの1つのレプリカの障害を検出するステップと、
    障害の発生している前記1つのレプリカを、より低い階層のレプリカと置き換えるステップと、
    影響を受けた階層のうちで最も低い階層を有するレプリカを再生成し、それによって、前記第1レプリカ、前記第2レプリカ、および前記Sバックアップ・レプリカを再び確立するステップと
    を実行させるための、コンピュータ・プログラム。
JP2007217739A 2006-08-28 2007-08-24 クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品 Pending JP2008059583A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/467,645 US20080052327A1 (en) 2006-08-28 2006-08-28 Secondary Backup Replication Technique for Clusters

Publications (1)

Publication Number Publication Date
JP2008059583A true JP2008059583A (ja) 2008-03-13

Family

ID=39160587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007217739A Pending JP2008059583A (ja) 2006-08-28 2007-08-24 クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品

Country Status (3)

Country Link
US (1) US20080052327A1 (ja)
JP (1) JP2008059583A (ja)
CN (1) CN101136728A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128752A (ja) * 2008-11-27 2010-06-10 Internatl Business Mach Corp <Ibm> データベース・システム、サーバ、更新方法およびプログラム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685179B2 (en) * 2007-03-13 2010-03-23 Microsoft Corporation Network flow for constrained replica placement
US9355117B1 (en) * 2008-03-31 2016-05-31 Veritas Us Ip Holdings Llc Techniques for backing up replicated data
US20090276654A1 (en) * 2008-05-02 2009-11-05 International Business Machines Corporation Systems and methods for implementing fault tolerant data processing services
WO2010037794A2 (en) * 2008-10-03 2010-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Monitoring mechanism for a distributed database
US8140791B1 (en) * 2009-02-24 2012-03-20 Symantec Corporation Techniques for backing up distributed data
US8713060B2 (en) 2009-03-31 2014-04-29 Amazon Technologies, Inc. Control service for relational data management
US9207984B2 (en) 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US9705888B2 (en) 2009-03-31 2017-07-11 Amazon Technologies, Inc. Managing security groups for data instances
US8682954B2 (en) * 2009-07-15 2014-03-25 International Business Machines Corporation Replication in a network environment
CN101692227B (zh) * 2009-09-25 2011-08-10 中国人民解放军国防科学技术大学 大规模高可靠的归档存储系统构建方法
US9135283B2 (en) 2009-10-07 2015-09-15 Amazon Technologies, Inc. Self-service configuration for data environment
US8074107B2 (en) * 2009-10-26 2011-12-06 Amazon Technologies, Inc. Failover and recovery for replicated data instances
US8743680B2 (en) * 2011-08-12 2014-06-03 International Business Machines Corporation Hierarchical network failure handling in a clustered node environment
CN102508742B (zh) * 2011-11-03 2013-12-18 中国人民解放军国防科学技术大学 面向硬件不可恢复内存故障的内核代码软容错方法
CN104081370A (zh) * 2012-03-15 2014-10-01 惠普发展公司,有限责任合伙企业 访问和复制备份数据对象
US9824131B2 (en) 2012-03-15 2017-11-21 Hewlett Packard Enterprise Development Lp Regulating a replication operation
GB2508659A (en) * 2012-12-10 2014-06-11 Ibm Backing up an in-memory database
EP2997496B1 (en) 2013-05-16 2022-01-19 Hewlett Packard Enterprise Development LP Selecting a store for deduplicated data
WO2014185918A1 (en) 2013-05-16 2014-11-20 Hewlett-Packard Development Company, L.P. Selecting a store for deduplicated data
US9304815B1 (en) 2013-06-13 2016-04-05 Amazon Technologies, Inc. Dynamic replica failure detection and healing
CN103793296A (zh) * 2014-01-07 2014-05-14 浪潮电子信息产业股份有限公司 一种在集群中用于辅助备份复制计算机系统的方法
US9280432B2 (en) 2014-03-21 2016-03-08 Netapp, Inc. Providing data integrity in a non-reliable storage behavior
US9606873B2 (en) 2014-05-13 2017-03-28 International Business Machines Corporation Apparatus, system and method for temporary copy policy
US10387262B1 (en) * 2014-06-27 2019-08-20 EMC IP Holding Company LLC Federated restore of single instance databases and availability group database replicas
CN104239182B (zh) * 2014-09-03 2017-05-03 北京鲸鲨软件科技有限公司 一种集群文件系统脑裂处理方法和装置
US10872074B2 (en) 2016-09-30 2020-12-22 Microsoft Technology Licensing, Llc Distributed availability groups of databases for data centers
US10732867B1 (en) * 2017-07-21 2020-08-04 EMC IP Holding Company LLC Best practice system and method
US11416347B2 (en) 2020-03-09 2022-08-16 Hewlett Packard Enterprise Development Lp Making a backup copy of data before rebuilding data on a node

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212784A (en) * 1990-10-22 1993-05-18 Delphi Data, A Division Of Sparks Industries, Inc. Automated concurrent data backup system
US5799323A (en) * 1995-01-24 1998-08-25 Tandem Computers, Inc. Remote duplicate databased facility with triple contingency protection
US5721914A (en) * 1995-09-14 1998-02-24 Mci Corporation System and method for hierarchical data distribution
US6052718A (en) * 1997-01-07 2000-04-18 Sightpath, Inc Replica routing
SE9702015L (sv) * 1997-05-28 1998-11-29 Ericsson Telefon Ab L M Metod vid distribuerad databas, samt ett system anpassat att verka enligt metoden
US6167427A (en) * 1997-11-28 2000-12-26 Lucent Technologies Inc. Replication service system and method for directing the replication of information servers based on selected plurality of servers load
US6430622B1 (en) * 1999-09-22 2002-08-06 International Business Machines Corporation Methods, systems and computer program products for automated movement of IP addresses within a cluster
US6760861B2 (en) * 2000-09-29 2004-07-06 Zeronines Technology, Inc. System, method and apparatus for data processing and storage to provide continuous operations independent of device failure or disaster
US6850982B1 (en) * 2000-12-19 2005-02-01 Cisco Technology, Inc. Methods and apparatus for directing a flow of data between a client and multiple servers
US7039692B2 (en) * 2001-03-01 2006-05-02 International Business Machines Corporation Method and apparatus for maintaining profiles for terminals in a configurable data processing system
US6802024B2 (en) * 2001-12-13 2004-10-05 Intel Corporation Deterministic preemption points in operating system execution
US6973654B1 (en) * 2003-05-27 2005-12-06 Microsoft Corporation Systems and methods for the repartitioning of data
US7523341B2 (en) * 2004-05-13 2009-04-21 International Business Machines Corporation Methods, apparatus and computer programs for recovery from failures in a computing environment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128752A (ja) * 2008-11-27 2010-06-10 Internatl Business Mach Corp <Ibm> データベース・システム、サーバ、更新方法およびプログラム

Also Published As

Publication number Publication date
CN101136728A (zh) 2008-03-05
US20080052327A1 (en) 2008-02-28

Similar Documents

Publication Publication Date Title
JP2008059583A (ja) クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品
US11360854B2 (en) Storage cluster configuration change method, storage cluster, and computer system
KR100297906B1 (ko) 동적인구성변화를지원하는방법및그장치
JP4307673B2 (ja) マルチクラスタ化コンピュータ・システムを構成及び管理する方法及び装置
JP5172043B2 (ja) フォールトトレラント動作をする金融取引所用突き合わせサーバ
TWI625621B (zh) 用於資料庫中進行回復的方法、電腦可用程式產品、與資料處理系統
US9280428B2 (en) Method for designing a hyper-visor cluster that does not require a shared storage device
KR100326982B1 (ko) 높은 크기 조정 가능성을 갖는 고 가용성 클러스터 시스템 및 그 관리 방법
US8108722B1 (en) Method and system for providing high availability to distributed computer applications
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
EP0481231B1 (en) A method and system for increasing the operational availability of a system of computer programs operating in a distributed system of computers
CN105814544B (zh) 用于支持分布式数据网格中的持久化分区恢复的系统和方法
US8856091B2 (en) Method and apparatus for sequencing transactions globally in distributed database cluster
US20070174660A1 (en) System and method for enabling site failover in an application server environment
US20070061379A1 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
US20070094659A1 (en) System and method for recovering from a failure of a virtual machine
JP2000137694A (ja) 常用冗長コピ―を用いた継続的デ―タベ―スアクセスを提供するシステム及び方法
CN111460039A (zh) 关系型数据库处理系统、客户端、服务器及方法
CN104994168A (zh) 分布式存储方法及分布式存储系统
US9811432B2 (en) Systems and methods for resynchronizing mirroring partners in a storage system
US20090063486A1 (en) Data replication using a shared resource
US5961650A (en) Scheme to perform event rollup
CA2619778C (en) Method and apparatus for sequencing transactions globally in a distributed database cluster with collision monitoring
US20240028611A1 (en) Granular Replica Healing for Distributed Databases
CN105468446A (zh) 一种基于Linux的HPC作业调度实现高可用的方法