JP5066080B2 - 耐障害性コンピュータ・システム - Google Patents
耐障害性コンピュータ・システム Download PDFInfo
- Publication number
- JP5066080B2 JP5066080B2 JP2008510305A JP2008510305A JP5066080B2 JP 5066080 B2 JP5066080 B2 JP 5066080B2 JP 2008510305 A JP2008510305 A JP 2008510305A JP 2008510305 A JP2008510305 A JP 2008510305A JP 5066080 B2 JP5066080 B2 JP 5066080B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- computer
- quorum
- operations
- token
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 32
- 238000004891 communication Methods 0.000 claims description 24
- 210000004556 brain Anatomy 0.000 claims description 18
- 238000013475 authorization Methods 0.000 claims 1
- 230000007704 transition Effects 0.000 description 98
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 230000010076 replication Effects 0.000 description 10
- 230000033001 locomotion Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1629—Error detection by comparing the output of redundant processing systems
- G06F11/1633—Error detection by comparing the output of redundant processing systems using mutual exchange of the output between the redundant processing components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
Description
例えば、一度に一つのコンピュータだけがデータをマルチ・ドロップ通信ライン上で送信することができる。通信ラインの保全性を保護するためには、単一のマスター又は所有者を一義的に選択するためにある形式のアクセス所有権プロトコルを動作させる必要がある。調整すべきアイテムに応じて、制御方法は、例えば衝突検出、クォーラム、トークン、ロック・マネージャ、分散ロック・マネージャ、中央アービタ、バック・オフ・タイマ、ラウンド・ロビン・スケジューリング又は固定アービトレーションを含むことができる。
リンク221及びサーバ220の障害に対しては逆の場合が起り、結果としてサーバ210とクォーラム・コンピュータ230がリンク211、ネットワーク250、及びリンク231を介して通信する。
クォーラムの詳細な動作。
1)両方のサーバが互いに通信できるが、クォーラム・コンピュータとは通信できないときに、「トークン」が生成される。
2)一つサーバが選出されたクォーラム・コンピュータと通信できるが他のサーバとは通信できないとき、「トークン」が生成される可能性がある。
3)クォーラム・コンピュータは、両方のサーバが互いに通信でき、クォーラム・コンピュータと通信できるときにだけ、選出することができる。
4)「トークン」を有するサーバは独立に動作することができる。
図6は、ローカル・サーバの状態遷移図を表し耐障害性システム内のサーバの見地から描かれている。一つのサーバ(410又は420)はそれ自体を「ローカル」と見なし、耐障害性システム401内の他のサーバ(420又は410)を「リモート」と見なす。サーバ410の見地から図6を見るとき、「ローカル」はサーバ410を指し、「リモート」はサーバ420を指す。サーバ420の見地から図6を見るときは、「ローカル」はサーバ420を指し、「リモート」はサーバ410を指す。
状態「セグメント化」550からの第2の遷移は、状態「セーブ」GUID540への遷移551である。この遷移は、耐障害性システム401の両方のサーバがクォーラム・コンピュータに再接続されたときに起る。
状態「オンライン/オンライン」630を通過した後のパスについて以下に説明する。
2重トークンの解決
1) 任意のシステムGUIDに対して選出されたクォーラム・コンピュータが一つだけ存在することができる。システムGUIDに対応するシステム内のサーバは選出されたクォーラム・コンピュータのクォーラムGUIDを追跡する。クォーラムGUIDは、システムGUID内の両方のサーバが新しいクォーラム選出に同意するときにだけ変わることができる。
2) サーバは、「トークン」を、選出されたクォーラム・コンピュータから又は他のサーバからだけ取得することができる。
3) クォーラム・コンピュータは、「トークン」を、システムGUIDに対応するシステムの両方のサーバと通信しているときにだけ取得することができる。
4) ローカル又はリモート「トークン」が未決着であるとき、システムGUIDに対応するシステムのサーバは、選出されたクォーラム・コンピュータのクォーラムGUIDのトークンの状態を無視する。
クォーラム・コンピュータとサーバの間の相互作用
ステップ1 サーバ310及びサーバ320を起動する。両方のサーバは、「トークン」がなく利用できるクォーラム・コンピュータがないので、状態「オンライン/オンライン」630になる。
ステップ2 サーバがアービトレーションを行なう。クォーラム・コンピュータを待つタイムアウト時間の後、サーバはサーバ320への「トークン」のアービトレーションを行う。サーバ310は、トークンをもたないので状態「オンライン/アクティブ」620になる。サーバ320は、トークンをもつので状態「アクティブ/オンライン」660になる。
ステップ3 クォーラムが起動する。クォーラム・コンピュータ330が起動する。「システム」GUIDの情報がないので、最終状態は「インアクティブ」520である。
ステップ4 クォーラム・コンピュータ330を選出する。サーバ310及びサーバ320の両方は選出クォーラム・コンピュータ330を発見する。サーバ310及びサーバ320の両方は状態「アクティブ/アクティブ」640になり、一方クォーラム・コンピュータ330は状態「接続」530になる。「クォーラム」GUIDは330であり、「システム」GUIDは300(サーバ310及び320に関する「システム」GUID)であり、「トークン」はクォーラム・コンピュータ330に付属する。
ステップ5 クォーラム・コンピュータを再起動する。これは、両方のサーバ310及びサーバ320を状態「格下げ未決定」670にさせる。それらは、サーバ320への「トークン」のアービトレーションを行う。
ステップ6 分離脳を避ける。クォーラム・コンピュータを取得する試行のタイムアウト時間が終了した。「トークン」を使用して、サーバ310は状態「オンライン/アクティブ」620になり、一方サーバ320は状態「アクティブ/オンライン」650となる。クォーラム・コンピュータ330は、「システム」GUID300に関する事前情報をなにももたずに、再初期化して状態「インアクティブ」520になった。
ステップ7 クォーラムを再取得する。両方のサーバ310及び320は、クォーラム・コンピュータ330に接続して「トークン」を戻す。これは両方のサーバを状態「アクティブ/アクティブ」にする。クォーラム・コンピュータ330に対しては、これは状態「接続」530に至る選出である。
ステップ8 サーバ320を失う。サーバ320は通信を停止する。クォーラム・コンピュータ330は状態「セグメント化」550に遷移し、「トークン」をサーバ310に与える。サーバ310は、状態「アクティブ/不明」650に遷移する。
ステップ9 クォーラム・コンピュータ330を失う。サーバ310は既にトークンを有し、独立に動作する許可を有するので、サーバ310には変化がない。
ステップ10 サーバ310を再起動する。サーバ310が再起動するとき、それは依然としてトークンを有するので、状態「オフライン/不明」610から状態「アクティブ/不明」650へ遷移する。
ステップ11 クォーラムを再起動する。クォーラム・コンピュータ330は、サーバ310の「システム」GUIDが起動中にセーブされ、利用できるサーバは一つだけ存在するので状態「セグメント化」550になる。サーバ310には変化が起きない。
ステップ12 サーバ320が起動する。サーバ320は、サーバ310又はクォーラム・コンピュータ330の何れかへの接続が確立されるまでは状態「オフライン/不明」610状態に留まる。サーバ310は「トークン」を有し、サーバ320は「トークン」の記録を有しないことに注意されたい。サーバ320は、クォーラム・コンピュータ330に接続してトークンのアービトレーションを行う(これはステップ17に示される)か、又はサーバ310に接続してトークンのアービトレーションを行う必要がある。
ステップ13 サーバ320が接続する。サーバ310とサーバ320は通信できる。これはサーバ310を状態「アクティブ/オンライン」660とし、サーバ320を状態「オンライン/アクティブ」620にする。両方のサーバはトークン所有権について同意する。クォーラム・コンピュータ340は起動して、次のステップにおいて新しい選出を示す。
ステップ14 クォーラム・コンピュータ340を選出する。両方のサーバ310及びサーバ320は、新しいクォーラム・コンピュータ340を選出することに同意する。これは、両方のサーバ310及び320を、「クォーラム」GUIDが340に設定された状態「アクティブ/アクティブ」640にする。クォーラム・コンピュータ330は依然として状態「セグメント化」550にあって、依然として「システム」GUID300により選出されていることを確信している。クォーラム・コンピュータ320は、300の「システム」GUID及び「トークン」を有する状態「接続」530になる。
ステップ15 両方のサーバを再起動する。両方のサーバは再起動され、どちらのサーバも「トークン」をもたず、両方のサーバがタイムアウト時間前に存在するので、状態「オフライン/不明」610から「オンライン/オンライン」630への経路をたどる(遷移614)。クォーラム・コンピュータ340は、「システム」GUID300への接続をタイムアウトし、「システム」GUID300の全ての情報を失い、状態「インアクティブ」520になる。
ステップ16 サーバ320を失う。サーバ310は、「トークン」をもたないので、状態「オフライン/不明」610になる。クォーラム・コンピュータ340は依然としてシステム300に対する選出されたクォーラム・コンピュータである。
ステップ17 クォーラム及びタイムアウト。サーバ320が出現するのを待つタイムアウト時間の後、サーバ310は「トークン」に関してクォーラム・コンピュータの「クォーラム」GUID(340)とアービトレーションを行う。クォーラム・コンピュータ340は、「システム」GUID300の事前情報をもたないが、「トークン」を生成してサーバ310に与える。これは、サーバ310を状態「アクティブ/不明」650に、及びクォーラム・コンピュータ340を状態「セグメント化」550に残す。両者はサーバ310が「トークン」をもつことに同意する。
ステップ18 サーバ320が再起動する。サーバ320は、サーバ310が存在して「トークン」をもつので、状態「オンライン/アクティブ」620になる。サーバ310は状態「アクティブ/オンライン」660になる。クォーラム・コンピュータ340は、サーバ320が未だそれに接続していないので、状態「セグメント化」550に留まる。
ステップ19 サーバ320が復帰する。両方のサーバは、サーバ320がクォーラム・コンピュータ340に接続するときに状態「アクティブ/アクティブ」に遷移する。クォーラム・コンピュータ340は状態「接続」530になる。
ステップ20 分離脳を避ける。サーバ310とサーバ320はもはや通信できない。クォーラム・コンピュータ340は、状態「セーブ」GUID540に遷移して、「トークン」をサーバ320に与える。サーバ320はトークンを有する状態「アクティブ/不明650」になる。サーバ310は、「トークン」をもたず、クォーラム・コンピュータ340からそれを取得できないので、状態「オフライン/不明」610になる。
ステップ21 再接続。サーバ310及び320が再接続する。これは、両方のサーバを状態「アクティブ/アクティブ」640に遷移させる。クォーラム・コンピュータ340は、状態「接続」530に遷移して「トークン」を取り戻す。
ステップ22 クォーラム330を選出する。両方のサーバ310及び320は、状態「アクティブ/アクティブ」640状態に留まって、如何なる状態変化も起さずに、クォーラム・サーバ330を選出する。クォーラム・コンピュータ330は、状態「セグメント化」550から「セーブ」GUID540を経て状態「接続」530へ遷移する。クォーラム・コンピュータ340は、「システム」GUID300の事前情報のない状態「インアクティブ」520になる。サーバ310、320、及びクォーラム・コンピュータ330に関する「システム」GUID及び「クォーラム」GUIDはここで調和している。
Claims (22)
- 耐障害性コンピュータ・システムを動作させる方法であって、
各々が第1セットの動作を実行するように構成される、第1サーバ、前記第1サーバとネットワークの間の第1リンク、第2サーバ、及び前記第2サーバと前記ネットワークの間の第2リンクを少なくとも含む耐障害性コンピュータ・システムの各々のサーバに、前記第1セットの動作を実行しないコンピュータと前記ネットワークを通じて通信させ、
障害が発生した場合に、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを、
前記第1サーバ及び前記第2サーバがお互いに通信することができる場合に、前記第1サーバ及び前記第2サーバに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために通信させること、及び
前記第1サーバ及び前記第2サーバがお互いに通信することができない場合に、前記第1セットの動作を実行しない前記コンピュータに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために前記第1サーバ及び前記第2サーバと通信させること、
によって決定する
ステップを含むことを特徴とする方法。 - 前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するステップは、前記障害後に前記コンピュータと通信できる前記第1サーバ及び前記第2サーバの内の1つに、前記第1セットの動作の実行を継続させるステップを含むことを特徴とする、請求項1に記載の方法。
- 前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するステップは、前記障害後に前記コンピュータと通信できない前記第1サーバ及び前記第2サーバの内の1つに、前記第1セットの動作の実行を終了させるステップを含むことを特徴とする、請求項1に記載の方法。
- 前記障害が発生した場合に、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を終了することになるかを決定するステップをさらに含むことを特徴とする、請求項1に記載の方法。
- 前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を終了することになるかを決定するステップは、前記障害の後、前記コンピュータと通信できない前記第1サーバ及び前記第2サーバの内の1つに、前記第1セットの動作の実行を終了させるステップを含むことを特徴とする、請求項4に記載の方法。
- 前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを前記コンピュータとの通信に基づいて決定するステップは、前記第2リンクの障害が発生した場合に、前記第1サーバに前記第1セットの動作の実行を継続させ、前記第2サーバに前記第1セットの動作の実行を終了させることによって、分離脳動作を避けるステップをさらに含むことを特徴とする、請求項1に記載の方法。
- 前記コンピュータは前記ネットワークに第3リンクにより接続されることを特徴とする、請求項1に記載の方法。
- 前記第1サーバ及び前記第2サーバに、前記第1セットの動作を実行しない複数のコンピュータから、前記第1セットの動作を実行しない前記コンピュータを選出させるステップをさらに含むことを特徴とする、請求項1に記載の方法。
- 前記第1セットの動作を実行しない前記コンピュータは、独自の識別名を有することを特徴とする、請求項8に記載の方法。
- 前記第1セットの動作を実行しない前記コンピュータは、複数の耐障害性コンピュータ・システムと通信するように構成されることを特徴とする、請求項8に記載の方法。
- 前記複数の耐障害性コンピュータ・システムの各々は、独自の識別名を有することを特徴とする、請求項10に記載の方法。
- 前記第1サーバ及び前記第2サーバが前記第1セットの動作を実行しない前記コンピュータを選出した後で、第1サーバに、該第1サーバが前記コンピュータ及び第2サーバと独立に動作することを許可するトークンを与えるステップをさらに含むことを特徴とする、請求項8に記載の方法。
- 前記第1サーバに前記トークンを与えるステップは、前記第1サーバ及び前記第2サーバが互いに通信できるときにだけそれを実行するステップを含むことを特徴とする、請求項12に記載の方法。
- 前記第1サーバ及び前記第2サーバに、前記第1セットの動作を実行しない前記コンピュータを選出させるステップは、前記第1サーバ及び前記第2サーバが互いに通信できるときにだけそれを実行するステップを含むことを特徴とする、請求項8に記載の方法。
- 前記コンピュータに、前記第1サーバに前記トークンを与えさせるステップをさらに含むことを特徴とする、請求項12に記載の方法。
- 前記コンピュータに、前記第1サーバ及び前記第2サーバのどちらがより高レベルの機能を有するかを判断させ、前記第1サーバが前記より高レベルの機能を有するとき、前記第1サーバに前記トークンを与える、ステップをさらに含むことを特徴とする、請求項15に記載の方法。
- 前記コンピュータに、前記第1サーバ及び前記第2サーバが前記コンピュータとのネットワーク接続を有するかどうかを判断させ、前記第1サーバが前記コンピュータとのネットワーク接続を有し、前記第2サーバが前記コンピュータとのネットワーク接続を有しないとき、前記第1サーバに前記トークンを与えるステップをさらに含むことを特徴とする、請求項15に記載の方法。
- 第1セットの動作を実行するように構成され、前記第1セットの動作を実行しないコンピュータとのネットワーク接続を有する第1サーバと、
前記第1セットの動作を実行するように構成され、前記第1サーバ及び前記コンピュータとのネットワーク接続を有する第2サーバと、
を備える耐障害性コンピュータ・システムであって、
前記システムは、該システムのコンポーネントの障害が発生した場合に、前記サーバのどちらが前記第1セットの動作の実行を継続することになるかを、
前記第1サーバ及び前記第2サーバがお互いに直接通信することができる場合に、前記第1サーバ及び前記第2サーバに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために通信させること、及び
前記第1サーバ及び前記第2サーバがお互いに直接通信することができない場合に、前記第1セットの動作を実行しない前記コンピュータに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために前記第1サーバ及び前記第2サーバと通信させること、
によって決定するように構成されることを特徴とする、コンピュータ・システム。 - コンピュータ可読媒体に格納されたコンピュータ・ソフトウェアであって、実行されたときに、耐障害性コンピュータ・システムに、
それぞれが第1セットの動作を実行するように構成された、第1サーバ、前記第1サーバとネットワークの間の第1リンク、第2サーバ、及び前記第2サーバと前記ネットワークの間の第2リンクを少なくとも含む前記耐障害性コンピュータ・システムの各々のサーバに、前記第1セットの動作を実行しないコンピュータと前記ネットワークを通じて通信させ、
障害が発生した場合に、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを、
前記第1サーバ及び前記第2サーバがお互いに通信することができる場合に、前記第1サーバ及び前記第2サーバに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために通信させること、及び
前記第1サーバ及び前記第2サーバがお互いに通信することができない場合に、前記第1セットの動作を実行しない前記コンピュータに、前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定するために前記第1サーバ及び前記第2サーバと通信させること、
によって決定すること、
を行わせる命令を含むことを特徴とするコンピュータ・ソフトウェア。 - 前記第1サーバ及び前記第2サーバのどちらが前記第1セットの動作の実行を継続することになるかを決定する前記ステップは、前記第1サーバが前記第2サーバより高いレベルの機能性を有するときは前記第1サーバが前記第1セットの動作の実行を継続することになると決定するステップを含むことを特徴とする請求項1に記載の方法。
- 前記第1セットの動作の実行を継続することになると決定された前記第1サーバ及び前記第2サーバの内の1つに、前記決定された前記第1サーバ及び前記第2サーバの内の1つに、前記コンピュータ、及び前記第1サーバ及び前記第2サーバの内の他の1つと独立して動作することを許すトークンを与えるステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記トークンは、前記第1サーバ及び前記第2サーバの内の前記決定された1つが再起動又はパワーアップすることを許すことを特徴とする請求項21に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67816705P | 2005-05-06 | 2005-05-06 | |
US60/678,167 | 2005-05-06 | ||
PCT/US2006/017652 WO2006121990A2 (en) | 2005-05-06 | 2006-05-08 | Fault tolerant computer system |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008542858A JP2008542858A (ja) | 2008-11-27 |
JP2008542858A5 JP2008542858A5 (ja) | 2009-06-25 |
JP5066080B2 true JP5066080B2 (ja) | 2012-11-07 |
Family
ID=37397185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008510305A Active JP5066080B2 (ja) | 2005-05-06 | 2006-05-08 | 耐障害性コンピュータ・システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US7373545B2 (ja) |
EP (1) | EP1877901A4 (ja) |
JP (1) | JP5066080B2 (ja) |
WO (1) | WO2006121990A2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060259461A1 (en) * | 2005-05-16 | 2006-11-16 | Rajesh Kapur | Method and system for preserving access to deleted and overwritten documents by means of a system recycle bin |
US7627584B2 (en) * | 2005-11-30 | 2009-12-01 | Oracle International Corporation | Database system configured for automatic failover with no data loss |
US8255369B2 (en) * | 2005-11-30 | 2012-08-28 | Oracle International Corporation | Automatic failover configuration with lightweight observer |
US7668879B2 (en) * | 2005-11-30 | 2010-02-23 | Oracle International Corporation | Database system configured for automatic failover with no data loss |
US8201016B2 (en) * | 2007-06-28 | 2012-06-12 | Alcatel Lucent | Heartbeat distribution that facilitates recovery in the event of a server failure during a user dialog |
US8001413B2 (en) * | 2008-05-05 | 2011-08-16 | Microsoft Corporation | Managing cluster split-brain in datacenter service site failover |
US8565067B2 (en) * | 2009-01-09 | 2013-10-22 | International Business Machines Corporation | Apparatus, system, and method for link maintenance |
JP5589393B2 (ja) * | 2010-01-13 | 2014-09-17 | 富士通株式会社 | データベースシステムおよびデータベース制御方法 |
EP3129903B1 (en) | 2014-07-01 | 2018-11-28 | SAS Institute Inc. | Systems and methods for fault tolerant communications |
WO2016077570A1 (en) | 2014-11-13 | 2016-05-19 | Virtual Software Systems, Inc. | System for cross-host, multi-thread session alignment |
US9703789B2 (en) | 2015-07-27 | 2017-07-11 | Sas Institute Inc. | Distributed data set storage and retrieval |
US9946719B2 (en) | 2015-07-27 | 2018-04-17 | Sas Institute Inc. | Distributed data set encryption and decryption |
US10275468B2 (en) * | 2016-02-11 | 2019-04-30 | Red Hat, Inc. | Replication of data in a distributed file system using an arbiter |
EP3506099A4 (en) * | 2016-08-25 | 2019-09-04 | Fujitsu Limited | MAINTENANCE MANAGEMENT PROGRAM, MAINTENANCE MANAGEMENT METHOD, AND MAINTENANCE MANAGEMENT DEVICE |
US10764115B1 (en) | 2018-01-05 | 2020-09-01 | Open Invention Network Llc | EMS handling of faults in virtual network function components |
US10379985B1 (en) * | 2018-02-01 | 2019-08-13 | EMC IP Holding Company LLC | Automating and monitoring rolling cluster reboots |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6021508A (en) * | 1997-07-11 | 2000-02-01 | International Business Machines Corporation | Parallel file system and method for independent metadata loggin |
US5999712A (en) * | 1997-10-21 | 1999-12-07 | Sun Microsystems, Inc. | Determining cluster membership in a distributed computer system |
US6279032B1 (en) * | 1997-11-03 | 2001-08-21 | Microsoft Corporation | Method and system for quorum resource arbitration in a server cluster |
US6449734B1 (en) * | 1998-04-17 | 2002-09-10 | Microsoft Corporation | Method and system for discarding locally committed transactions to ensure consistency in a server cluster |
US6105099A (en) * | 1998-11-30 | 2000-08-15 | International Business Machines Corporation | Method for synchronizing use of dual and solo locking for two competing processors responsive to membership changes |
US6453426B1 (en) * | 1999-03-26 | 2002-09-17 | Microsoft Corporation | Separately storing core boot data and cluster configuration data in a server cluster |
US7774469B2 (en) * | 1999-03-26 | 2010-08-10 | Massa Michael T | Consistent cluster operational data in a server cluster using a quorum of replicas |
JP2000330814A (ja) * | 1999-05-19 | 2000-11-30 | Toshiba Corp | 二重化サーバシステム |
JP3833117B2 (ja) * | 2000-01-31 | 2006-10-11 | 富士通株式会社 | サーバ決定方法及び装置 |
JP2002169704A (ja) * | 2000-12-01 | 2002-06-14 | Hitachi Ltd | 代行処理方法、代行処理システム及びコンピュータシステム |
US6785678B2 (en) * | 2000-12-21 | 2004-08-31 | Emc Corporation | Method of improving the availability of a computer clustering system through the use of a network medium link state function |
US7016946B2 (en) * | 2001-07-05 | 2006-03-21 | Sun Microsystems, Inc. | Method and system for establishing a quorum for a geographically distributed cluster of computers |
US7320085B2 (en) * | 2004-03-09 | 2008-01-15 | Scaleout Software, Inc | Scalable, software-based quorum architecture |
US20050283641A1 (en) * | 2004-05-21 | 2005-12-22 | International Business Machines Corporation | Apparatus, system, and method for verified fencing of a rogue node within a cluster |
US20060100981A1 (en) * | 2004-11-04 | 2006-05-11 | International Business Machines Corporation | Apparatus and method for quorum-based power-down of unresponsive servers in a computer cluster |
GB0501697D0 (en) * | 2005-01-27 | 2005-03-02 | Ibm | Controlling service failover in clustered storage apparatus networks |
JP4177339B2 (ja) * | 2005-02-16 | 2008-11-05 | 株式会社東芝 | 分散システム、コンピュータおよび分散システムの状態遷移制御方法 |
US7631016B2 (en) * | 2005-05-04 | 2009-12-08 | Oracle International Corporation | Providing the latest version of a data item from an N-replica set |
-
2006
- 2006-05-08 JP JP2008510305A patent/JP5066080B2/ja active Active
- 2006-05-08 EP EP06759274.1A patent/EP1877901A4/en not_active Withdrawn
- 2006-05-08 US US11/382,133 patent/US7373545B2/en active Active
- 2006-05-08 WO PCT/US2006/017652 patent/WO2006121990A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP1877901A4 (en) | 2014-05-07 |
WO2006121990A2 (en) | 2006-11-16 |
US20060253727A1 (en) | 2006-11-09 |
US7373545B2 (en) | 2008-05-13 |
WO2006121990A3 (en) | 2009-04-30 |
JP2008542858A (ja) | 2008-11-27 |
EP1877901A2 (en) | 2008-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5066080B2 (ja) | 耐障害性コンピュータ・システム | |
US7711820B2 (en) | High availability for intelligent applications in storage networks | |
US8417899B2 (en) | System and method for controlling access to shared storage device | |
JP4505763B2 (ja) | ノードクラスタの管理 | |
JP3953549B2 (ja) | マルチプロセッサ・クラスタ・メンバシップ・マネージャ・フレームワーク | |
EP1370945B1 (en) | Failover processing in a storage system | |
US6279032B1 (en) | Method and system for quorum resource arbitration in a server cluster | |
KR100326982B1 (ko) | 높은 크기 조정 가능성을 갖는 고 가용성 클러스터 시스템 및 그 관리 방법 | |
JP3910539B2 (ja) | 準備処理を取り入れたクラスタード・コンピュータ・システムにおけるリソース・アクション | |
US7870230B2 (en) | Policy-based cluster quorum determination | |
US6839752B1 (en) | Group data sharing during membership change in clustered computer system | |
US8370494B1 (en) | System and method for customized I/O fencing for preventing data corruption in computer system clusters | |
US7464378B1 (en) | System and method for allowing multiple sub-clusters to survive a cluster partition | |
JP4820814B2 (ja) | スケラブルなソフトウェアをベースにしたクォーラムアーキテクチャ | |
US20040254984A1 (en) | System and method for coordinating cluster serviceability updates over distributed consensus within a distributed data system cluster | |
US7953890B1 (en) | System and method for switching to a new coordinator resource | |
KR100423225B1 (ko) | 클러스터링된 컴퓨터 시스템을 위한 통합 프로토콜 | |
US7120821B1 (en) | Method to revive and reconstitute majority node set clusters | |
CN100550894C (zh) | 对n路共享存储系统中快闪副本的高效锁管理 | |
EP2382541B1 (en) | Computer-implemented multi-resource shared lock | |
US11210187B1 (en) | Computer cluster with adaptive quorum rules | |
JP2003030167A (ja) | クラスタ化コンピュータ・システムでの入出力ブリッジ・デバイスのアトミック所有権変更動作 | |
WO2003054711A1 (en) | A system and method for management of a storage area network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090508 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090508 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120730 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5066080 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150817 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |