JP2008521127A - ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ - Google Patents
ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ Download PDFInfo
- Publication number
- JP2008521127A JP2008521127A JP2007543012A JP2007543012A JP2008521127A JP 2008521127 A JP2008521127 A JP 2008521127A JP 2007543012 A JP2007543012 A JP 2007543012A JP 2007543012 A JP2007543012 A JP 2007543012A JP 2008521127 A JP2008521127 A JP 2008521127A
- Authority
- JP
- Japan
- Prior art keywords
- node
- currently executing
- nodes
- executing node
- hpc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2005—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2051—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Abstract
Description
本発明は、一般にデータ処理に関し、より詳細には、HPCシステムにおけるフォルトトレランス及びリカバリに関する。
[背景]
ハイパフォーマンスコンピューティング(HPC)は、しばしば複雑な物理的又はアルゴリズム的現象をモデリング、シミュレート及び解析するため科学者やエンジニアにより使用される計算システムにより特徴付けされる。現在、HPCマシーンは、典型的には、ノードと呼ばれる1以上のプロセッサの多数のHPCクラスタを用いて設計される。大部分の大きな科学的及び技術的適用について、パフォーマンスは、個別のノードのスピードでなくパラレルスケーラビリティにより主として決定される。このため、スケーラビリティはしばしば、このようなハイパフォーマンスクラスを構築又は購入するに際して限定要因となる。スケーラビリティは、一般にはi)ハードウェア、ii)メモリ、入出力(I/O)及び通信帯域幅、iii)ソフトウェア、iv)アーキテクチャ、及びv)アプリケーションに基づくものであると考えられている。大部分の従来のHPC環境における処理、メモリ及びI/O帯域幅は、通常は良好にはバランスされておらず、このため、良好にスケーリングされない。多くのHPC環境は、ハイエンドデータ処理要求を充足するためのI/O帯域幅を有さず、又は多数の不要なコンポーネントがインストールされるブレードにより構築され、このことは、システムの信頼性を劇的に低減させる傾向がある。従って、多くのHPC環境は、製造用の環境における効率的な処理のためのロウバストなクラスタ管理ソフトウェアを提供しないかもしれない。
[概要]
本発明は、HPCシステムに係る短所、問題点又はその両方を軽減又は解消するかもしれない。
[発明の詳細な説明]
図1は、ソフトウェアのアプリケーション及び処理、例えば、大気シミュレーション、気象シミュレーションや衝撃シミュレーションを、HPC手法を用いて実行する高性能計算(HPC)システム100を示す構成図である。システム100は、処理性能にかなり同様なI/O性能を備えている、種々の計算ノード115の間で動的に割り当てられるHPC機能をユーザに備える。一般的に、これらのノード115は、とりわけ、この、入出力(I/O)性能の増加とファブリック・レーテンシの低減が理由で容易にスケーリング可能である。例えば、分散アークテクチャにおけるノード115のスケーラビリティは:
S(N)=1/((FP/N)+FS)*(1−Fc*(1−RR/L);
である、アムダールの法則の派生形によって表す場合があり、S(N)=Nプロセッサでの高速化であり、Fp=並列コードの割合であり、Fs=非並列コードの割合であり、Fc=通信に充てられる処理の割合であり、RR/L=遠隔メモリ帯域幅の局所メモリ帯域幅に対する比率である。したがって、HPCシステム100が、処理性能にかなり等しいか、かなり近づいているI/O性能を備えることによって、HPCシステム100はHPCアプリケーションの全体効率を向上させ、システム管理の容易化を可能にする。
のうちの何れかによってデータ・パケットを処理し、ルーティングする場合がある。データ・パケットは通常、ディスク・ファーム140内のデータを伝送するのに用いられる。データ・パケットは、発信元識別子と宛て先識別子とを有するヘッダを含み得る。発信元識別子、例えば、発信元アドレスは情報の発信元を識別し、宛て先識別子、例えば宛て先アドレスは情報の受信先を識別する。
を要求し得る。次元Sの全てが1よりも大きい場合、要求は3次元の要求である。次元Sのうちの1つが1に等しい場合、要求は2次元の要求である。次元Sのうちの2つが1に等しい場合、要求は1次元の要求である。要求をノード115に割り当てるよう、スケジューラ150は空間的な座標をMPIランクに:
;としてマッピングし得る。Sx、Sy、及びSzは要求のサイズを示し、xはゼロとSxとの間であり、yはゼロとSyとの間であり、zはゼロとSzとの間である。ノード115を2次元の要求に割り当てるよう、スケジューラ150は、空間座標をMPIランクに:
としてマッピングし得る。特定の実施例では、空間座標をMPIランクにマッピングするよう、スケジューラ515はまず、グリッド110のz軸に沿って増加させ、次にグリッド110のy軸に沿って増加させ、更にグリッド110のx軸に沿って増加させる。スケジューラ515がMPIランクに空間座標をマッピングすることに関して正しくない前提、例えば、まず、グリッド110のx軸に沿って増加させ、次にグリッド110のy軸に沿って増加させ、更にグリッド110のz軸に沿って増加させるという前提に対処するよう、クラスタ管理エンジン30は要求ジョブ150を、例えば、
特定の実施例では、スケジューラ515は、グリッド110のより小さい次元の前にグリッド110のより大きな次元を示すよう、グリッド110のスイッチ・ベースのサイズを形成させる。(アレイを含む)TorusMapは、グリッド110のより小さい次元の前にグリッド110のより大きな次元を示すよう、グリッド110のスイッチ・ベースのサイズを形成させたグリッド110のスイッチ・ベースのサイズを示す。スケジューラ515は、TorusMapをFreeNodeListに識別されているノード115の全てに適用する。(アレイを含む)InverseTorusMapはTorusMapの逆数であり、スケジューラ515はInverseTorusMapを、処理するようクラスタ管理エンジン130にリストを戻す前にジョブ150に割り当てられるノード115のリストに適用する。制約ではなく例として、クラスタ管理エンジン130が14×16×15のスイッチ・ベースのトーラス・サイズをスケジューラ515に通信する場合、スケジューラ515はTorusMapを
の終点がメッシュを規定する。メッシュは、1つ又は複数の次元における終点よりも大きな始点を有する場合、1つ又は複数の次元において「ラッピング」する。制約ではなく例として、[3,7,5]での始点と[2,9,4]での始点とを備えているメッシュはx次元とy次元でラッピングする。グリッド110における点
である場合、非ラッピング・メッシュに存在する。スケジューラ515が要求を満たすメッシュ・リストを生成した後、スケジューラ515は、要求への割り当てに利用可能なノード155の群に対してスケジューリング可能なメッシュをスケジューラ515が識別するまでスケジューラ515はリストをループする。一般的に、3次元の要求は、要求を満たす6つのメッシュをもたらす傾向にあり、2次元の要求は、要求を満たす数百のメッシュをもたらす傾向にあり、1次元の要求は、要求を満たす数十のメッシュをもたらす傾向にある。特定の実施例では、スケジューラ515は、要求を満たすメッシュ数を最大にするよう、2次元又は3次元の要求に対するノード・ベースのトーラスを設定する。
までの線{i,j,k}に沿ったフリー・ノード155の数を含む。スケジューラ515は、FreeY[i,j,k]とFreeX[i,j,k]とを用いて、以下に説明するようにスキャン・アルゴリズムを実行する。特定の実施例では、SpatialAllowed又はCompactAllowedがTrueである場合のみ、FreeY[i,j,k]と FreeX[i,j,k]とを構成する。
の最大6つの一意の向きを有する。これらの6つの向きは、スケジューラ515がメッシュに適用し得る、4つの一意の90°の回転と2つの一意の180°の回転とに相当する。いずれかの2つの次元がお互いに等しい場合、3つの一意の向きのみが利用可能である。スケジューラ515はメッシュをスケジューリングする場合、考えられる向きを全て考慮する。ジョブ150が2次元である、すなわちジョブ150の1つの次元が1に等しい場合、スケジューラ515は、ジョブ150の2つの使用次元、すなわちジョブ150の1より大きい次元、の何れかを、ジョブ150の未使用次元、すなわちジョブ150の1に等しい次元にアコーディオンに似たかたちでフォールディングして、よりコンパクトな3次元のメッシュを生成し得る。スケジューラ515がフォールディングの長さの整数の倍数でない次元をフォールディングする場合、最後のフォールディングは先行するフォールティングの全てよりも短くなり、それによって2次元のメッシュが3次元メッシュ上に連結されることになる。ジョブ150が1次元の場合、スケジューラ515はジョブ150を2つの未使用次元の何れかにフォールディングし得る。スケジューラ515は更に、2つの結果次元の何れかを残りの未使用次元にフォールディングし得る。メッシュの結果形状は、一般的に言えば、4つのメッシュを連結したものとなる。
の場合、スケジューラ515は終了する。さもなければ、スケジューラ515は、以下に説明するように、BuildCompactFits関数によってBestFitの1つ又は複数の次元を増やすことになる。スケジューラ515は更に、BestFitの次元以上でかつグリッド110の次元以下である次元を有するメッシュ全てを構成して、(アレイを含む)Fitを用いてメッシュを記録する。
{1,1,27}のメッシュは合理的なメッシュ数をもたらさないことになり、要求を満たす少なくとも1つのメッシュを常にもたらすことになるが、これは、Fitがグリッド110に等しいメッシュを含むことになり、Nがグリッド110におけるノード115の数以下である場合にのみクラスタ管理エンジン130がスケジューラ515をコールするからである。
などの非フリー・ノード115を識別するまでz軸を増やし得る。スケジューラ515はFreeMesh.start[2]をk1に設定する場合があり、FreeMesh.end[2]をk2―1に設定する場合がある。FreeMesh.start[2]はz軸に沿ったフリー・メッシュの開始値に相当し、FreeMesh.end[2]はフリー・メッシュの終了値に相当する。スケジューラ515は、
が少なくとも1つの非フリー・ノードを含むように、更に、y軸をj1から始めて第1値j2を識別し得る。スケジューラ515は更に、FreeMesh.start[1]をj1に設定し、FreeMesh.end[2]をj2―1に設定する。スケジューラ515は更に、
が少なくとも1つの非フリー・ノードを含むように、x軸をi1から始めて第1値i2を識別する。スケジューラは更に、FreeMesh.start[0]をi1 に設定し、FreeMesh.end[0]をi2−1に設定する。スケジューラ515は、上記処理を繰り返し、グリッド110における全てのノード115を対象とする。上記処理は一意のフリー・メッシュ群をもたらすものでない。別の順序でループすることは、異なるフリー・メッシュ群を生成する傾向にあるが、それは2つ以上のフリー・メッシュがお互いに境界を共有する場合のみである。ノード115において全体が取り囲まれるフリー・メッシュは常に一意である。図9及び図10は、2次元の場合に、y軸を内部ループとして用いる場合とx軸を内部ループとして用いる場合との違いを示す。図9は、y軸を内部ループとして用いて構成される2つのフリー・メッシュを示し、図10は、x軸を内部ループとして用いて構成される2つのフリー・メッシュを示す。図9では、領域530は使用中のノード115を含み、領域532aは第1のフリー・メッシュであり、領域532bは第2のフリー・メッシュである。同様に、図10では、領域530は使用中のノード115を含み、領域532aは第1のフリー・メッシュであり、領域532bは第2のフリー・メッシュである。
のz軸に沿った2次元のメッシュのシーケンスにおけるフリー・ノード115をカウントする。zループは1つのメッシュを取り除き、別のものを追加する。 y ループでは同様な効果がy軸に沿って生じる。(その両方ともアレイを含む)そのFreeX及びFreeY は処理時間を削減することを容易にする。特定の実施例では、スケジューラ515は以下のアルゴリズムを用いて、コンパクトな要求をスキャンする:
特定の実施例では、スケジューラ515は次元におけるパーティション・ラッピングに対応するよう以下の修正の1つ又は複数のものを適用する:(1)次元における指数がアレイ限界を超える場合、スケジューラ515は、何れかのアレイ参照の前に指数にモジュラス関数を適用する;(2)パーティションがx次元又はy次元においてラッピングする場合、例えば点aから点bまでの、線区間についてフリー・ノード115を計算するよう、スケジューラ515は、x次元又はy次元における点aからパーティションの終点までの1つのものと、パーティションの始点から点bまでの別のものとの2つの線区間についてフリー・ノード115を計算する。
特定の実施例では、Try構造を用いてグリッド110における始点でジョブ150がスケジューリング可能であるということをスケジューラ515が判定した後、スケジューラ515は以下のようにMPIランクを割り当てる。
特定の実施例では、コンパクト・スケジューリング・アルゴリズムは、機能するTry機能を識別するまで、Try機能のリストにおける各メッシュにスキャン・あるごりリズムを適用する。リストにおけるメッシュ数は比較的大きい場合がある。制約ではなく例として、トーラスが16×16×16のノード115を含み、要求が100のノード115に対するものである場合、BestFit={4,4,5}であり、このことは、Try構造リストにおいて2000を超えるメッシュをもたらす。2進サーチをTry構造に適用することは望ましい場合があるが、Try構造リストの2進サーチは特定の実施例では機能しないものである。条件Cを含む2進サーチは:(1)Cが要素iについて真であったならば、i以上の全てのjについてCが真であったということ;及び(2)Cが要素iについて偽であったならば、i以下の全てのjについてCが偽であったということ;でない限り機能しないものである。特定の実施例では、Try構造の2進サーチは機能しないものであるが、それは、例えばメッシュM1={4,4,4}を用いたスキャンが、要求を満たすのに十分なノードを見つけることになる一方、Try構例えば、メッシュM2={2,2,10}を用いたスキャンが、造リストにおいてM2がM1を上回っているにもかかわらず、要求を満たすのに十分なノードを見つけないことになるという可能性が存在するからである。特定の実施例では、最大距離の2進サーチは機能する。スケジューラ515は、最大距離によってTry構造リストにおけるメッシュをグループ化する場合、最大距離iを有する、リストにおけるメッシュに対するフィットを識別すれば、i以上のj全てについて、最大距離jを有する、リストにおける少なくとも1つのメッシュもフィットすることになる。最大距離iを有する、リストにおけるメッシュが何らフィットしない場合、i以下の最大距離を有する、リストにおけるメッシュも何らフィットしないことになる。制約ではなく例として、{x,y,z}が、フィットする最大距離iを有するメッシュであると仮定する。したがって、{x,y,z+1}はi+1の最大距離を有し、{x,y,z+1}は{x,y,z}に及ぶので{x,y,z+1}も機能する。帰納的推論はi以上のj全てにあてはまる。最大距離iを有する、リストにおけるメッシュが何ら機能しない場合、最大距離i2−1を有する何れかのメッシュ{x,y,z}に対して、{x,y,z+1}は最大距離iを有し、{x,y,z+1}もフィットしない。{x,y,z}もフィットしないが、それは{x,y,z+1}が{x,y,z}に及ぶからである。よって、スケジューラ515は初期化中にMaxDistance[NumMaxDistances,2]を構成する。
スケジューラ515は、MPIランクによるAssignedNodeListにおけるノード・ベースの座標を用いた選択ノード115を示す。AssignedNodeList[i,0]はMPIランクiのノード115のx座標であり、AssignedNodeList[i,1]はMPIランクiのノード115のy座標であり、AssignedNodeList[i,2]はMPIランクiのノード115のz座標である。FreeNodeListはスイッチ・ベースの座標における、スケジューラ515に転送される、利用可能ノード115のリストである。特定の実施例では、FreeNodeListにおけるmpiRankフィールドを設定するよう、スケジューラ515は以下のアルゴリズム例を用いる:
以下のロジック例は、スケジューラ515の特定の実施例を記述する。特定の実施例では、ジョブ150をスケジューリングするよう、クラスタ管理エンジン130がスケジューラ515をコールする場合、クラスタ管理エンジン130はスケジューラ515に、以下の入力パラメータ値を伝達する。
スケジューラ515は、ジョブ150をスケジューリングする場合、適宜、FreeNode構造のmpiRankフィールドを設定する。特定の実施例では、クラスタ管理エンジン130とスケジューラ515との間のラッパ機能が、クラスタ管理エンジン130からの入力を、スケジューラ515が想定する形式に変換し、スケジューラ515からの出力を、クラスタ管理エンジン130が想定する形式に変換する。
特定の実施例では、ジョブ・サイズを評価するようスケジューラ515がコールするRankは以下のロジック例を包含する。Rankに対するInputは3つの要素を有する1次元アレイIn[3]を含む。RankからのOutputは、Inの指数をサイズの昇順によって示す3つの要素を有する1次元アレイRank[3]を含む。
特定の実施例では、可能なスケジューリング種類を設定するinitSchedulerは以下のロジック例を包含する。ジョブ150が1つのノード115しか要求しない場合、initSchedulerは、元の要求にかかわらず、可能な種類をAnyに設定する:
TはTorusSizeである。最初の3つの構成は、スイッチ166毎のノード115をスケジューラ515が2×2のノード115として構成することによってもたらされる。後の3つの構成は、スイッチ166毎のノード115をスケジューラ515が1×1のノード115として構成することによってもたらされる。特定の実施例では、setTorusFor2Dは、スケジューラ515がマップ毎に生成することになるTry構造をカウントし、最大のTry構造数を生成することになるマップを選択する。互角の場合には、setTorusFor2Dは上記の順序によってマップを選択する。スケジューラ515はpSize[6,4]を:
特定の実施例では、build1Tryは、1次元の要求のフォールディングのリストを生成し、フォールディング毎に、build2DFoldをコールして、1つ又は複数の追加のフォールディングのリストを生成する。build1Tryは、以下の構造例を包含するOneDFoldListにフォールディングのリストを記録する:
特定の実施例では、oneDは第一フォールドを含む。特定の実施例では、twoDは第一フォールドから生成されるフォールディングのリストを含む。NumTwoDFoldsは、twoDにおけるフォールディング数を示す。特定の実施例では、build2Dfoldに転送されるメッシュ・サイズを示す。スケジューラ515は、twoDの要素についてTry構造を生成し、build3Dtryをコールして各Try構造の、考えられる回転全てを構築する。特定の実施例では、build1Tryは以下のロジック例を包含する:
特定の実施例では、スケジューラ515は、以下に定義する以下の構造例を用いてノード115をジョブ150に割り当てる。上記のように、クラスタ管理エンジン130はFreeNode構造のリストをジョブ150とともにスケジューラ515に伝達する。このリストはスケジューリングに利用可能なノード115全てを含む。このリストでは、スイッチ・ベースの座標がリストにおける利用可能ノード115を識別する。スケジューラ515がジョブ150をスケジューリングする場合、スケジューラ515は戻す前にmpiRankを設定する。
特定の実施例では、スケジューラ515はTry構造を用いて、空間的なジョブ150をスケジューリングするのに用いるメッシュに関する情報を記憶する。Try構造は、ベース・メッシュと、最大2つまでの連結メッシュとに関する情報を含む。
Claims (38)
- ハイパフォーマンスコンピューティング(HPC)システムにおけるフォルトトレランス・リカバリシステムであって、
HPCシステムの複数のノードを互いに接続するファブリックと、
前記ファブリックに接続され、前記ノードのそれぞれにアクセス可能であって、各々が前記ノードの何れかにおいて実行可能な複数のホストを格納するよう動作可能なストレージと、
前記ファブリックに接続され、ホストを実行する前記HPCシステムにおいて現在実行中のノードをモニタし、前記現在実行中のノードにフォルトが発生した場合、前記現在実行中のノードの処理を中断し、前記ストレージから前記HPCシステムのフリーノードにおいて前記ホストをブート処理するよう動作可能なマネージャと、
を有するシステム。 - 前記マネージャはさらに、前記現在実行中のノードの状態を示す前記現在実行中のノードのデーモンからの1以上のメッセージに従って、前記現在実行中のノードにおける前記フォルトを特定するよう動作可能である、請求項1記載のシステム。
- 前記現在実行中のノードの状態は、該現在実行中のノードにおけるファンの平均速度、該現在実行中のノードの現在の温度及び該現在実行中のノードにおける電力消費レベルの1以上から構成される、請求項2記載のシステム。
- 前記デーモンは、定期的な間隔により前記メッセージを前記マネージャに通信する、請求項2記載のシステム。
- 前記デーモンは、前記現在実行中のノードと前記ファブリックとの間の各インタフェースを介し前記メッセージを前記マネージャに通信する、請求項1記載のシステム。
- 前記マネージャはさらに、前記マネージャがチェックポイントから前記フリーノードのホストをブート処理することを可能にするため、前記ホストをチェックポイント処理するよう動作可能である、請求項1記載のシステム。
- 前記マネージャはさらに、前記現在実行中のノードにおいてフォルトが発生した場合、前記フリーノードのホストとの通信を可能にするため、前記HPCシステムにおいて1以上のルーティングテーブルを更新するよう動作可能である、請求項1記載のシステム。
- 前記マネージャはさらに、前記現在実行中のノードにおいてフォルトが発生した場合、該フォルトの発生を前記HPCシステムの管理者に通知するよう動作可能である、請求項1記載のシステム。
- 前記マネージャは、
前記現在実行中のノードとの通信を回避するため、
前記現在実行中のノードが前記ストレージにアクセスすることを回避するため、
前記現在実行中のノードをアイドル状態にするため、
前記現在実行中のノードをパワーダウン状態にするため、又は
前記現在実行中のノードをリブートするため、
の1以上を実行するため、前記現在実行中のノードの処理を中断するよう動作可能である、請求項1記載のシステム。 - 前記ファブリックは、3次元トーラスを構成するトポロジーに従って、前記ノードを互いに接続する複数のスイッチを有する、請求項1記載のシステム。
- 前記スイッチは、INFINIBANDスイッチである、請求項10記載のシステム。
- ホストは、前記HPCシステムのノードにおいて該ホストブート処理するのに利用可能なIP(Internet Protocol)アドレス、ブートイメージ、コンフィギュレーション及びファイルシステムを有する、請求項1記載のシステム。
- 前記現在実行中のノードにおけるフォルトは、前記現在実行中のノードのハードウェアコンポーネントにおけるフォルトから構成される、請求項1記載のシステム。
- 前記現在実行中のノードにおけるフォルトは、前記現在実行中のノードのソフトウェアコンポーネントにおけるフォルトから構成される、請求項1記載のシステム。
- 前記現在実行中のノードにおけるフォルトは、前記現在実行中のノードと前記ファブリックとの間のインタフェースにおけるフォルトから構成される、請求項1記載のシステム。
- ハイパフォーマンスコンピューティング(HPC)システムにおけるフォルトトレランス・リカバリ方法であって、
複数のノードと、該複数のノードを互いに接続し、該複数のノードのそれぞれにアクセス可能であって、各々が該複数のノードの何れかにおいて実行可能な複数のホストを格納するよう動作可能なストレージと該複数のノードとを接続するファブリックとから構成されるHPCシステムにおいて現在実行中のノードをモニタするステップと、
前記現在実行中のノードにおいてフォルトが発生した場合、前記現在実行中のノードの処理を中断し、前記ストレージから前記HPCシステムのフリーノードにおけるホストをブート処理するステップと、
を有する方法。 - 前記現在実行中のノードの状態を示す前記現在実行中のノードのデーモンからの1以上のメッセージに従って、前記現在実行中のノードにおいて前記フォルトを特定するステップをさらに有する、請求項16記載の方法。
- 前記現在実行中のノードの状態は、該現在実行中のノードにおけるファンの平均速度、該現在実行中のノードの現在の温度及び該現在実行中のノードにおける電力消費レベルの1以上から構成される、請求項17記載の方法。
- 前記デーモンは、定期的な間隔により前記メッセージを前記マネージャに通信する、請求項17記載の方法。
- 前記デーモンは、前記現在実行中のノードと前記ファブリックとの間の各インタフェースを介し前記メッセージを前記マネージャに通信する、請求項16記載の方法。
- チェックポイントから前記フリーノードのホストをブート処理することを可能にするため、前記ホストをチェックポイント処理するステップをさらに有する、請求項16記載の方法。
- 前記現在実行中のノードにおいてフォルトが発生した場合、前記フリーノードのホストとの通信を可能にするため、前記HPCシステムにおいて1以上のルーティングテーブルを更新するステップをさらに有する、請求項16記載の方法。
- 前記現在実行中のノードにおいてフォルトが発生した場合、該フォルトの発生を前記HPCシステムの管理者に通知するステップをさらに有する、請求項16記載の方法。
- 前記現在実行中のノードの処理を中断するステップは、
前記現在実行中のノードとの通信を回避するステップと、
前記現在実行中のノードが前記ストレージにアクセスすることを回避するステップと、
前記現在実行中のノードをアイドル状態にするステップと、
前記現在実行中のノードをパワーダウン状態にするステップと、
前記現在実行中のノードをリブートするステップと、
の1以上から構成される、請求項16記載の方法。 - 前記ファブリックは、3次元トーラスを構成するトポロジーに従って、前記ノードを互いに接続する複数のスイッチを有する、請求項16記載の方法。
- 前記スイッチは、INFINIBANDスイッチである、請求項25記載の方法。
- ハイパフォーマンスコンピューティング(HPC)システムにおけるフォルトトレランス・リカバリロジックであって、
当該ロジックは、コンピュータ可読媒体に符号化され、実行されると、
複数のノードと、該複数のノードを互いに接続し、該複数のノードのそれぞれにアクセス可能であって、各々が該複数のノードの何れかにおいて実行可能な複数のホストを格納するよう動作可能なストレージと該複数のノードとを接続するファブリックとから構成されるHPCシステムにおいて現在実行中のノードをモニタし、
前記現在実行中のノードにおいてフォルトが発生した場合、前記現在実行中のノードの処理を中断し、前記ストレージから前記HPCシステムのフリーノードにおけるホストをブート処理する、
よう動作可能であるロジック。 - 前記現在実行中のノードの状態を示す前記現在実行中のノードのデーモンからの1以上のメッセージに従って、前記現在実行中のノードにおいて前記フォルトを特定するようさらに動作可能である、請求項27記載のロジック。
- 前記現在実行中のノードの状態は、該現在実行中のノードにおけるファンの平均速度、該現在実行中のノードの現在の温度及び該現在実行中のノードにおける電力消費レベルの1以上から構成される、請求項28記載のロジック。
- 前記デーモンは、定期的な間隔により前記メッセージを前記マネージャに通信する、請求項28記載のロジック。
- 前記デーモンは、前記現在実行中のノードと前記ファブリックとの間の各インタフェースを介し前記メッセージを前記マネージャに通信する、請求項27記載のロジック。
- チェックポイントから前記フリーノードのホストをブート処理することを可能にするため、前記ホストをチェックポイント処理するようさらに動作可能である、請求項27記載のロジック。
- 前記現在実行中のノードにおいてフォルトが発生した場合、前記フリーノードのホストとの通信を可能にするため、前記HPCシステムにおいて1以上のルーティングテーブルを更新するようさらに動作可能である、請求項27記載のロジック。
- 前記現在実行中のノードにおいてフォルトが発生した場合、該フォルトの発生を前記HPCシステムの管理者に通知するようさらに動作可能である、請求項27記載のロジック。
- 前記現在実行中のノードとの通信を回避するため、
前記現在実行中のノードが前記ストレージにアクセスすることを回避するため、
前記現在実行中のノードをアイドル状態にするため、
前記現在実行中のノードをパワーダウン状態にするため、又は
前記現在実行中のノードをリブートするため、
の1以上を実行するため、前記現在実行中のノードの処理を中断するよう動作可能である、請求項27記載のロジック。 - 前記ファブリックは、3次元トーラスを構成するトポロジーに従って、前記ノードを互いに接続する複数のスイッチを有する、請求項27記載のロジック。
- 前記スイッチは、INFINIBANDスイッチである、請求項36記載のロジック。
- ハイパフォーマンスコンピューティング(HPC)システムにおけるフォルトトレランス・リカバリシステムであって、
複数のノードと、該複数のノードを互いに接続し、該複数のノードのそれぞれにアクセス可能であって、各々が該複数のノードの何れかにおいて実行可能な複数のホストを格納するよう動作可能なストレージと該複数のノードとを接続するファブリックとから構成されるHPCシステムにおいて現在実行中のノードをモニタする手段と、
前記現在実行中のノードにおいてフォルトが発生した場合、前記現在実行中のノードの処理を中断し、前記ストレージから前記HPCシステムのフリーノードにおけるホストをブート処理する手段と、
を有するシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/991,754 | 2004-11-17 | ||
US10/991,754 US7475274B2 (en) | 2004-11-17 | 2004-11-17 | Fault tolerance and recovery in a high-performance computing (HPC) system |
PCT/US2005/012242 WO2006055026A1 (en) | 2004-11-17 | 2005-04-13 | Fault tolerance and recovery in a high-performance computing (hpc) system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008521127A true JP2008521127A (ja) | 2008-06-19 |
JP5570095B2 JP5570095B2 (ja) | 2014-08-13 |
Family
ID=34965798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007543012A Active JP5570095B2 (ja) | 2004-11-17 | 2005-04-13 | ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ |
Country Status (4)
Country | Link |
---|---|
US (1) | US7475274B2 (ja) |
EP (1) | EP1815341A1 (ja) |
JP (1) | JP5570095B2 (ja) |
WO (1) | WO2006055026A1 (ja) |
Families Citing this family (115)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8336040B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | System and method for topology-aware job scheduling and backfilling in an HPC environment |
US20050235055A1 (en) * | 2004-04-15 | 2005-10-20 | Raytheon Company | Graphical user interface for managing HPC clusters |
US7711977B2 (en) * | 2004-04-15 | 2010-05-04 | Raytheon Company | System and method for detecting and managing HPC node failure |
US8335909B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | Coupling processors to each other for high performance computing (HPC) |
US8190714B2 (en) * | 2004-04-15 | 2012-05-29 | Raytheon Company | System and method for computer cluster virtualization using dynamic boot images and virtual disk |
US9178784B2 (en) | 2004-04-15 | 2015-11-03 | Raytheon Company | System and method for cluster management based on HPC architecture |
US7370224B1 (en) * | 2005-02-17 | 2008-05-06 | Alcatel Usa Sourcing, Inc | System and method for enabling redundancy in PCI-Express architecture |
US8244882B2 (en) * | 2004-11-17 | 2012-08-14 | Raytheon Company | On-demand instantiation in a high-performance computing (HPC) system |
US7433931B2 (en) * | 2004-11-17 | 2008-10-07 | Raytheon Company | Scheduling in a high-performance computing (HPC) system |
US7475274B2 (en) | 2004-11-17 | 2009-01-06 | Raytheon Company | Fault tolerance and recovery in a high-performance computing (HPC) system |
US7870106B1 (en) | 2004-12-30 | 2011-01-11 | Panta Systems, Inc. | Client side caching in a global file system |
US7721282B1 (en) * | 2004-12-30 | 2010-05-18 | Panta Systems, Inc. | Block-level I/O subsystem for distributed application environment management |
US8332844B1 (en) | 2004-12-30 | 2012-12-11 | Emendable Assets Limited Liability Company | Root image caching and indexing for block-level distributed application management |
US7827435B2 (en) * | 2005-02-15 | 2010-11-02 | International Business Machines Corporation | Method for using a priority queue to perform job scheduling on a cluster based on node rank and performance |
DE102005022547B4 (de) * | 2005-05-18 | 2008-07-03 | Adc Gmbh | Verteilereinrichtung im Teilnehmeranschlussbereich |
DE102005022689B4 (de) * | 2005-05-18 | 2007-09-20 | Adc Gmbh | Aktive Verteilereinrichtung im Teilnehmeranschlussbereich |
DE102005027387A1 (de) * | 2005-06-14 | 2006-12-28 | Deutsche Thomson-Brandt Gmbh | Netzwerkverbindungs-Schalteinheit sowie Netzwerkstation |
JP4920391B2 (ja) * | 2006-01-06 | 2012-04-18 | 株式会社日立製作所 | 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム |
US8437344B2 (en) * | 2006-03-07 | 2013-05-07 | Adc Telecommunications, Inc. | Telecommunication distribution device with multi-circuit board arrangement |
US20070211740A1 (en) * | 2006-03-07 | 2007-09-13 | Jorg Franzke | Telecommunications distribution system with line sharing |
US20070211882A1 (en) * | 2006-03-07 | 2007-09-13 | Francois Hatte | Control method for a telecommunication distribution system |
US20070211883A1 (en) * | 2006-03-07 | 2007-09-13 | Jorg Franzke | Telecommunications device having distribution units arranged in block configuration |
US8065737B1 (en) * | 2006-03-30 | 2011-11-22 | Panta Systems, Inc. | Virus scanning for block-level distributed application management |
US20070234123A1 (en) * | 2006-03-31 | 2007-10-04 | Inventec Corporation | Method for detecting switching failure |
US7523344B2 (en) * | 2006-05-08 | 2009-04-21 | Sun Microsystems, Inc. | Method and apparatus for facilitating process migration |
GB0611038D0 (en) * | 2006-06-02 | 2006-07-12 | Ibm | Apparatus and method for cluster recovery |
US7814364B2 (en) * | 2006-08-31 | 2010-10-12 | Dell Products, Lp | On-demand provisioning of computer resources in physical/virtual cluster environments |
US20080077635A1 (en) * | 2006-09-22 | 2008-03-27 | Digital Bazaar, Inc. | Highly Available Clustered Storage Network |
JP2008085916A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | 通信システムの主装置及びこの主装置で使用される登録方法 |
US7752174B2 (en) * | 2006-10-11 | 2010-07-06 | Teamon Systems, Inc. | Computer server system including a database pool module providing database connectivity recovery features and related methods |
US7840846B2 (en) * | 2006-10-30 | 2010-11-23 | International Business Machines Corporation | Point of sale system boot failure detection |
US20080101395A1 (en) * | 2006-10-30 | 2008-05-01 | Raytheon Company | System and Method for Networking Computer Clusters |
US8402201B2 (en) | 2006-12-06 | 2013-03-19 | Fusion-Io, Inc. | Apparatus, system, and method for storage space recovery in solid-state storage |
US20090232032A1 (en) * | 2007-01-17 | 2009-09-17 | Verbal World, Inc. | Methods and Apparatus for the Manipulation of Conferenced Data |
US8417762B2 (en) * | 2007-04-10 | 2013-04-09 | International Business Machines Corporation | Mechanism for execution of multi-site jobs in a data stream processing system |
US8359347B2 (en) * | 2007-04-10 | 2013-01-22 | International Business Machines Corporation | Method and apparatus for cooperative data stream processing |
US8225129B2 (en) * | 2007-04-10 | 2012-07-17 | International Business Machines Corporation | Methods and apparatus for effective on-line backup selection for failure recovery in distributed stream processing systems |
US20080256549A1 (en) * | 2007-04-10 | 2008-10-16 | International Business Machines Corporation | System and Method of Planning for Cooperative Information Processing |
US8892624B2 (en) * | 2007-04-10 | 2014-11-18 | International Business Machines Corporation | Method for the interoperation of virtual organizations |
US8688850B2 (en) * | 2007-04-10 | 2014-04-01 | International Business Machines Corporation | Method for inter-site data stream transfer in cooperative data stream processing |
US8201016B2 (en) * | 2007-06-28 | 2012-06-12 | Alcatel Lucent | Heartbeat distribution that facilitates recovery in the event of a server failure during a user dialog |
US20090158250A1 (en) * | 2007-12-18 | 2009-06-18 | International Business Machines Corporation | Systems, methods and computer program products for operation history management for hpc programs optimization |
US9141437B2 (en) * | 2008-01-29 | 2015-09-22 | International Business Machines Corporation | Methods and systems for migrating network resources to improve network utilization |
US7958184B2 (en) * | 2008-03-04 | 2011-06-07 | International Business Machines Corporation | Network virtualization in a multi-node system with multiple networks |
JP5056504B2 (ja) * | 2008-03-13 | 2012-10-24 | 富士通株式会社 | 制御装置、情報処理システム、情報処理システムの制御方法および情報処理システムの制御プログラム |
US8812469B2 (en) * | 2008-05-15 | 2014-08-19 | International Business Machines Corporation | Configurable persistent storage on a computer system using a database |
US8918624B2 (en) * | 2008-05-15 | 2014-12-23 | International Business Machines Corporation | Scaling and managing work requests on a massively parallel machine |
US8225324B2 (en) * | 2008-05-15 | 2012-07-17 | International Business Machines Corporation | Resource management on a computer system utilizing hardware and environmental factors |
US8065433B2 (en) | 2009-01-09 | 2011-11-22 | Microsoft Corporation | Hybrid butterfly cube architecture for modular data centers |
US9053295B1 (en) * | 2009-02-04 | 2015-06-09 | Sprint Communications Company L.P. | Facilitating application development using protected components |
US8321057B2 (en) * | 2009-03-12 | 2012-11-27 | Red Hat, Inc. | Infrastructure for adaptive environmental control for equipment in a bounded area |
US8302077B2 (en) * | 2009-03-13 | 2012-10-30 | Oracle America, Inc. | Method and system for configuring software modules to execute in an execution environment |
US20100241783A1 (en) * | 2009-03-23 | 2010-09-23 | Honeywell International Inc. | Memory node for use within a data storage system having a plurality of interconnected memory nodes |
US8990397B2 (en) * | 2009-07-31 | 2015-03-24 | Ntt Docomo, Inc. | Resource allocation protocol for a virtualized infrastructure with reliability guarantees |
US8411684B1 (en) * | 2009-10-26 | 2013-04-02 | Mcafee, Inc. | System, method, and computer program product for determining a hop count between network devices utilizing a binary search |
US20110202682A1 (en) * | 2010-02-12 | 2011-08-18 | Microsoft Corporation | Network structure for data center unit interconnection |
US9710595B2 (en) * | 2010-02-24 | 2017-07-18 | International Business Machines Corporation | Multi-view user interface for server cabling display |
US8914538B2 (en) * | 2010-05-13 | 2014-12-16 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Implementing network manager quarantine mode |
US8812907B1 (en) * | 2010-07-19 | 2014-08-19 | Marathon Technologies Corporation | Fault tolerant computing systems using checkpoints |
JP5893628B2 (ja) * | 2010-09-17 | 2016-03-23 | オラクル・インターナショナル・コーポレイション | ミドルウェアマシン環境における部分的なサブネット初期化の実行 |
US8990618B2 (en) * | 2010-12-10 | 2015-03-24 | Mitel Networks Corporation | Partial fault tolerance in an embedded appliance |
US8930774B1 (en) * | 2011-03-02 | 2015-01-06 | Monster Patents, Llc | Computer kiosk and related systems and methods |
US9240937B2 (en) * | 2011-03-31 | 2016-01-19 | Microsoft Technology Licensing, Llc | Fault detection and recovery as a service |
US8904398B2 (en) * | 2011-03-31 | 2014-12-02 | International Business Machines Corporation | Hierarchical task mapping |
US10044548B2 (en) * | 2012-10-15 | 2018-08-07 | Jetflow Technologies | Flowlet-based processing |
US9838242B2 (en) | 2011-04-13 | 2017-12-05 | Jetflow Technologies | Flowlet-based processing with key/value store checkpointing |
JP5965478B2 (ja) | 2011-06-03 | 2016-08-03 | オラクル・インターナショナル・コーポレイション | ネットワークにおけるコンポーネントを認証するためのシステムおよび方法 |
US9935848B2 (en) | 2011-06-03 | 2018-04-03 | Oracle International Corporation | System and method for supporting subnet manager (SM) level robust handling of unkown management key in an infiniband (IB) network |
US9262201B2 (en) * | 2011-07-13 | 2016-02-16 | International Business Machines Corporation | Performing collective operations in a distributed processing system |
US9037898B2 (en) | 2012-12-18 | 2015-05-19 | International Business Machines Corporation | Communication channel failover in a high performance computing (HPC) network |
US9251002B2 (en) | 2013-01-15 | 2016-02-02 | Stratus Technologies Bermuda Ltd. | System and method for writing checkpointing data |
JP2014191401A (ja) * | 2013-03-26 | 2014-10-06 | Fujitsu Ltd | 処理装置、制御プログラム、及び制御法 |
US9225638B2 (en) | 2013-05-09 | 2015-12-29 | Vmware, Inc. | Method and system for service switching using service tags |
EP2804105B1 (en) | 2013-05-17 | 2015-10-07 | Fujitsu Limited | Method of improving fault tolerance in a computing system arranged to find a computational solution |
US9137587B2 (en) * | 2013-08-14 | 2015-09-15 | American Megatrends, Inc. | System event assisted live keyboard, video and mouse (KVM) capture |
GB2517780A (en) | 2013-09-02 | 2015-03-04 | Ibm | Improved checkpoint and restart |
US9766992B2 (en) * | 2013-10-31 | 2017-09-19 | Sandisk Technologies Llc | Storage device failover |
EP3090336A1 (en) | 2013-12-30 | 2016-11-09 | Paul A. Leveille | Checkpointing systems and methods of using data forwarding |
ES2652262T3 (es) | 2013-12-30 | 2018-02-01 | Stratus Technologies Bermuda Ltd. | Método de retardar puntos de comprobación inspeccionando paquetes de red |
JP6518672B2 (ja) | 2013-12-30 | 2019-05-22 | ストラタス・テクノロジーズ・バミューダ・リミテッド | 動的チェックポインティングシステムおよび方法 |
US9575854B1 (en) * | 2014-01-08 | 2017-02-21 | Google Inc. | Cascade failure resilient data storage |
US9372766B2 (en) * | 2014-02-11 | 2016-06-21 | Saudi Arabian Oil Company | Circumventing load imbalance in parallel simulations caused by faulty hardware nodes |
US9465704B2 (en) | 2014-03-26 | 2016-10-11 | Vmware, Inc. | VM availability during management and VM network failures in host computing systems |
US9703652B2 (en) * | 2014-06-07 | 2017-07-11 | Vmware, Inc. | VM and host management function availability during management network failure in host computing systems in a failover cluster |
US9678838B2 (en) * | 2014-06-20 | 2017-06-13 | Vmware, Inc. | Protecting virtual machines from network failures |
CN106462612A (zh) | 2014-07-01 | 2017-02-22 | 萨思学会有限公司 | 用于容错通信的系统和方法 |
US10516568B2 (en) | 2014-09-30 | 2019-12-24 | Nicira, Inc. | Controller driven reconfiguration of a multi-layered application or service model |
US9774537B2 (en) | 2014-09-30 | 2017-09-26 | Nicira, Inc. | Dynamically adjusting load balancing |
US9531590B2 (en) | 2014-09-30 | 2016-12-27 | Nicira, Inc. | Load balancing across a group of load balancers |
US10609091B2 (en) | 2015-04-03 | 2020-03-31 | Nicira, Inc. | Method, apparatus, and system for implementing a content switch |
WO2016192025A1 (en) | 2015-06-01 | 2016-12-08 | SZ DJI Technology Co., Ltd. | Systems and methods for memory architecture |
US9703789B2 (en) | 2015-07-27 | 2017-07-11 | Sas Institute Inc. | Distributed data set storage and retrieval |
US9946719B2 (en) | 2015-07-27 | 2018-04-17 | Sas Institute Inc. | Distributed data set encryption and decryption |
US10200310B2 (en) | 2015-12-24 | 2019-02-05 | Intel Corporation | Fabric-integrated data pulling engine |
CN106936616B (zh) * | 2015-12-31 | 2020-01-03 | 伊姆西公司 | 备份通信方法和装置 |
US10805181B2 (en) | 2017-10-29 | 2020-10-13 | Nicira, Inc. | Service operation chaining |
US11012420B2 (en) | 2017-11-15 | 2021-05-18 | Nicira, Inc. | Third-party service chaining using packet encapsulation in a flow-based forwarding element |
US10797910B2 (en) | 2018-01-26 | 2020-10-06 | Nicira, Inc. | Specifying and utilizing paths through a network |
US10805192B2 (en) | 2018-03-27 | 2020-10-13 | Nicira, Inc. | Detecting failure of layer 2 service using broadcast messages |
US10817361B2 (en) * | 2018-05-07 | 2020-10-27 | Hewlett Packard Enterprise Development Lp | Controlling error propagation due to fault in computing node of a distributed computing system |
US11595250B2 (en) | 2018-09-02 | 2023-02-28 | Vmware, Inc. | Service insertion at logical network gateway |
US10944673B2 (en) | 2018-09-02 | 2021-03-09 | Vmware, Inc. | Redirection of data messages at logical network gateway |
US11627049B2 (en) * | 2019-01-31 | 2023-04-11 | Hewlett Packard Enterprise Development Lp | Failsafe firmware upgrade for cloud-managed devices |
US11042397B2 (en) | 2019-02-22 | 2021-06-22 | Vmware, Inc. | Providing services with guest VM mobility |
US20200389352A1 (en) * | 2019-06-04 | 2020-12-10 | Microsoft Technology Licensing, Llc | Automated upgrade of multiple hosts |
CN110442377B (zh) * | 2019-08-13 | 2023-11-24 | 网易(杭州)网络有限公司 | 补丁包生成方法、应用更新方法、装置和电子设备 |
US11283717B2 (en) | 2019-10-30 | 2022-03-22 | Vmware, Inc. | Distributed fault tolerant service chain |
US11140218B2 (en) | 2019-10-30 | 2021-10-05 | Vmware, Inc. | Distributed service chain across multiple clouds |
US11223494B2 (en) | 2020-01-13 | 2022-01-11 | Vmware, Inc. | Service insertion for multicast traffic at boundary |
US11153406B2 (en) | 2020-01-20 | 2021-10-19 | Vmware, Inc. | Method of network performance visualization of service function chains |
US11659061B2 (en) | 2020-01-20 | 2023-05-23 | Vmware, Inc. | Method of adjusting service function chains to improve network performance |
US11277331B2 (en) | 2020-04-06 | 2022-03-15 | Vmware, Inc. | Updating connection-tracking records at a network edge using flow programming |
US11734043B2 (en) | 2020-12-15 | 2023-08-22 | Vmware, Inc. | Providing stateful services in a scalable manner for machines executing on host computers |
US11611625B2 (en) | 2020-12-15 | 2023-03-21 | Vmware, Inc. | Providing stateful services in a scalable manner for machines executing on host computers |
US11966292B2 (en) | 2022-05-27 | 2024-04-23 | Hewlett Packard Enterprise Development Lp | Fault management in a distributed computer system |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6224358A (ja) * | 1985-07-24 | 1987-02-02 | Hitachi Ltd | 信号ル−テイングテ−ブル方式 |
JPH10187638A (ja) * | 1996-10-28 | 1998-07-21 | Mitsubishi Electric Corp | クラスタ制御システム |
JPH11341042A (ja) * | 1998-05-29 | 1999-12-10 | Toshiba Corp | コンピュータネットワークにおける通信経路の決定方法ならびにシステム及び同方法がプログラムされ記録される記録媒体 |
JP2000112906A (ja) * | 1998-10-01 | 2000-04-21 | Mitsubishi Electric Corp | クラスタシステム |
JP2002041348A (ja) * | 2000-05-26 | 2002-02-08 | Emc Corp | 可用性が高い通信を提供する通信パススルー共有システムリソース、ネットワークファイルサーバ及び方法 |
JP2003162515A (ja) * | 2001-11-22 | 2003-06-06 | Fujitsu Ltd | クラスタシステム |
JP2004126968A (ja) * | 2002-10-03 | 2004-04-22 | Fujitsu Ltd | 並列計算機のジョブスケジューリング装置 |
JP2004206562A (ja) * | 2002-12-26 | 2004-07-22 | Hitachi Ltd | 情報処理システムの制御方法、情報処理システム、及びプログラム |
JP2004242337A (ja) * | 2003-02-07 | 2004-08-26 | Fujitsu Ltd | 交換のためにメモリに書き込まれるパケットをキューイングするシステム、方法及び論理 |
JP2004532447A (ja) * | 2001-02-24 | 2004-10-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 動的再分割を介するスーパーコンピュータでのフォールト・トレランス |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4868818A (en) | 1987-10-29 | 1989-09-19 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Fault tolerant hypercube computer system architecture |
US5020059A (en) | 1989-03-31 | 1991-05-28 | At&T Bell Laboratories | Reconfigurable signal processor |
US5301104A (en) | 1990-08-07 | 1994-04-05 | Honeywell Inc. | Method for allocating processing elements interconnected in a hypercube topology |
US5280607A (en) | 1991-06-28 | 1994-01-18 | International Business Machines Corporation | Method and apparatus for tolerating faults in mesh architectures |
CA2106280C (en) | 1992-09-30 | 2000-01-18 | Yennun Huang | Apparatus and methods for fault-tolerant computing employing a daemon monitoring process and fault-tolerant library to provide varying degrees of fault tolerance |
US5781715A (en) | 1992-10-13 | 1998-07-14 | International Business Machines Corporation | Fault-tolerant bridge/router with a distributed switch-over mechanism |
US5513313A (en) | 1993-01-19 | 1996-04-30 | International Business Machines Corporation | Method for generating hierarchical fault-tolerant mesh architectures |
US5450578A (en) | 1993-12-23 | 1995-09-12 | Unisys Corporation | Method and apparatus for automatically routing around faults within an interconnect system |
US6408402B1 (en) | 1994-03-22 | 2002-06-18 | Hyperchip Inc. | Efficient direct replacement cell fault tolerant architecture |
EP1046994A3 (en) | 1994-03-22 | 2000-12-06 | Hyperchip Inc. | Efficient direct cell replacement fault tolerant architecture supporting completely integrated systems with means for direct communication with system operator |
JPH08227356A (ja) | 1994-12-21 | 1996-09-03 | Tec Corp | データ処理装置 |
US5682491A (en) | 1994-12-29 | 1997-10-28 | International Business Machines Corporation | Selective processing and routing of results among processors controlled by decoding instructions using mask value derived from instruction tag and processor identifier |
US5603044A (en) | 1995-02-08 | 1997-02-11 | International Business Machines Corporation | Interconnection network for a multi-nodal data processing system which exhibits incremental scalability |
US5805785A (en) | 1996-02-27 | 1998-09-08 | International Business Machines Corporation | Method for monitoring and recovery of subsystems in a distributed/clustered system |
US5805786A (en) | 1996-07-23 | 1998-09-08 | International Business Machines Corporation | Recovery of a name server managing membership of a domain of processors in a distributed computing environment |
US6393581B1 (en) | 1996-08-29 | 2002-05-21 | Cornell Research Foundation, Inc. | Reliable time delay-constrained cluster computing |
US6088330A (en) | 1997-09-09 | 2000-07-11 | Bruck; Joshua | Reliable array of distributed computing nodes |
US6167502A (en) | 1997-10-10 | 2000-12-26 | Billions Of Operations Per Second, Inc. | Method and apparatus for manifold array processing |
US6230252B1 (en) | 1997-11-17 | 2001-05-08 | Silicon Graphics, Inc. | Hybrid hypercube/torus architecture |
US6480927B1 (en) | 1997-12-31 | 2002-11-12 | Unisys Corporation | High-performance modular memory system with crossbar connections |
US6477663B1 (en) | 1998-04-09 | 2002-11-05 | Compaq Computer Corporation | Method and apparatus for providing process pair protection for complex applications |
US6195760B1 (en) | 1998-07-20 | 2001-02-27 | Lucent Technologies Inc | Method and apparatus for providing failure detection and recovery with predetermined degree of replication for distributed applications in a network |
US6496941B1 (en) | 1998-12-29 | 2002-12-17 | At&T Corp. | Network disaster recovery and analysis tool |
US6480972B1 (en) * | 1999-02-24 | 2002-11-12 | International Business Machines Corporation | Data processing system and method for permitting a server to remotely perform diagnostics on a malfunctioning client computer system |
US6453426B1 (en) | 1999-03-26 | 2002-09-17 | Microsoft Corporation | Separately storing core boot data and cluster configuration data in a server cluster |
US6718486B1 (en) * | 2000-01-26 | 2004-04-06 | David E. Lovejoy | Fault monitor for restarting failed instances of the fault monitor |
US6415323B1 (en) | 1999-09-03 | 2002-07-02 | Fastforward Networks | Proximity-based redirection system for robust and scalable service-node location in an internetwork |
US6629266B1 (en) | 1999-11-17 | 2003-09-30 | International Business Machines Corporation | Method and system for transparent symptom-based selective software rejuvenation |
US6748437B1 (en) | 2000-01-10 | 2004-06-08 | Sun Microsystems, Inc. | Method for creating forwarding lists for cluster networking |
US6460149B1 (en) | 2000-03-03 | 2002-10-01 | International Business Machines Corporation | Suicide among well-mannered cluster nodes experiencing heartbeat failure |
EP1301865A4 (en) | 2000-03-22 | 2009-04-01 | Yotta Yotta Inc | METHOD AND SYSTEM FOR PROVIDING MULTIMEDIA INFORMATION ON DEMAND THROUGH LONG DISTANCE NETWORKS |
US6658504B1 (en) | 2000-05-16 | 2003-12-02 | Eurologic Systems | Storage apparatus |
US6735660B1 (en) | 2000-12-21 | 2004-05-11 | International Business Machines Corporation | Sideband signal transmission between host and input/output adapter |
DE60237433D1 (de) | 2001-02-24 | 2010-10-07 | Ibm | Neuartiger massivparalleler supercomputer |
US6952766B2 (en) | 2001-03-15 | 2005-10-04 | International Business Machines Corporation | Automated node restart in clustered computer system |
US7028228B1 (en) | 2001-03-28 | 2006-04-11 | The Shoregroup, Inc. | Method and apparatus for identifying problems in computer networks |
US6918051B2 (en) | 2001-04-06 | 2005-07-12 | International Business Machines Corporation | Node shutdown in clustered computer system |
US6820221B2 (en) | 2001-04-13 | 2004-11-16 | Hewlett-Packard Development Company, L.P. | System and method for detecting process and network failures in a distributed system |
US6675264B2 (en) * | 2001-05-07 | 2004-01-06 | International Business Machines Corporation | Method and apparatus for improving write performance in a cluster-based file system |
EP1402355B1 (en) | 2001-05-23 | 2018-08-29 | Tekelec Global, Inc. | Methods and systems for automatically configuring network monitoring system |
US8010558B2 (en) * | 2001-06-05 | 2011-08-30 | Silicon Graphics International | Relocation of metadata server with outstanding DMAPI requests |
US6950833B2 (en) * | 2001-06-05 | 2005-09-27 | Silicon Graphics, Inc. | Clustered filesystem |
US6988193B2 (en) | 2001-06-28 | 2006-01-17 | International Business Machines Corporation | System and method for creating a definition for a target device based on an architecture configuration of the target device at a boot server |
US8032625B2 (en) | 2001-06-29 | 2011-10-04 | International Business Machines Corporation | Method and system for a network management framework with redundant failover methodology |
SE0102405D0 (sv) | 2001-07-04 | 2001-07-04 | Software Run Ab | A system and a method for selecting a preconfigured operating system for a server |
GB0116310D0 (en) | 2001-07-04 | 2001-08-29 | New Transducers Ltd | Contact sensitive device |
US7016299B2 (en) | 2001-07-27 | 2006-03-21 | International Business Machines Corporation | Network node failover using path rerouting by manager component or switch port remapping |
US6922791B2 (en) | 2001-08-09 | 2005-07-26 | Dell Products L.P. | Failover system and method for cluster environment |
US6904482B2 (en) | 2001-11-20 | 2005-06-07 | Intel Corporation | Common boot environment for a modular server system |
EP1318453A1 (en) | 2001-12-07 | 2003-06-11 | Hewlett-Packard Company | Scheduling system, method and apparatus for a cluster |
CA2365729A1 (en) | 2001-12-20 | 2003-06-20 | Platform Computing (Barbados) Inc. | Topology aware scheduling for a multiprocessor system |
US7093004B2 (en) | 2002-02-04 | 2006-08-15 | Datasynapse, Inc. | Using execution statistics to select tasks for redundant assignment in a distributed computing platform |
US6918063B2 (en) | 2002-02-04 | 2005-07-12 | International Business Machines Corporation | System and method for fault tolerance in multi-node system |
US7640547B2 (en) | 2002-02-08 | 2009-12-29 | Jpmorgan Chase & Co. | System and method for allocating computing resources of a distributed computing system |
DE10214067B4 (de) | 2002-03-28 | 2010-01-21 | Advanced Micro Devices, Inc., Sunnyvale | Integrierter Schaltkreischip mit Hochgeschwindigkeitsdatenschnittstelle sowie zugehöriges Southbridgebauelement und Verfahren |
US7139798B2 (en) | 2002-05-17 | 2006-11-21 | Groove Networks, Inc. | Method and apparatus for connecting a secure peer-to-peer collaboration system to an external system |
DE10234992A1 (de) | 2002-07-31 | 2004-02-19 | Advanced Micro Devices, Inc., Sunnyvale | Retry-Mechanismus für blockierende Schnittstellen |
US20040210656A1 (en) * | 2003-04-16 | 2004-10-21 | Silicon Graphics, Inc. | Failsafe operation of storage area network |
US7287179B2 (en) | 2003-05-15 | 2007-10-23 | International Business Machines Corporation | Autonomic failover of grid-based services |
US7007125B2 (en) | 2003-06-24 | 2006-02-28 | International Business Machines Corporation | Pass through circuit for reduced memory latency in a multiprocessor system |
WO2005036367A2 (en) * | 2003-10-08 | 2005-04-21 | Unisys Corporation | Virtual data center that allocates and manages system resources across multiple nodes |
US20050256942A1 (en) | 2004-03-24 | 2005-11-17 | Mccardle William M | Cluster management system and method |
US8190714B2 (en) | 2004-04-15 | 2012-05-29 | Raytheon Company | System and method for computer cluster virtualization using dynamic boot images and virtual disk |
US9178784B2 (en) | 2004-04-15 | 2015-11-03 | Raytheon Company | System and method for cluster management based on HPC architecture |
US8336040B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | System and method for topology-aware job scheduling and backfilling in an HPC environment |
US8335909B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | Coupling processors to each other for high performance computing (HPC) |
US20050235055A1 (en) | 2004-04-15 | 2005-10-20 | Raytheon Company | Graphical user interface for managing HPC clusters |
US8244882B2 (en) | 2004-11-17 | 2012-08-14 | Raytheon Company | On-demand instantiation in a high-performance computing (HPC) system |
US7475274B2 (en) | 2004-11-17 | 2009-01-06 | Raytheon Company | Fault tolerance and recovery in a high-performance computing (HPC) system |
US7433931B2 (en) | 2004-11-17 | 2008-10-07 | Raytheon Company | Scheduling in a high-performance computing (HPC) system |
-
2004
- 2004-11-17 US US10/991,754 patent/US7475274B2/en active Active
-
2005
- 2005-04-13 EP EP05735290A patent/EP1815341A1/en not_active Ceased
- 2005-04-13 JP JP2007543012A patent/JP5570095B2/ja active Active
- 2005-04-13 WO PCT/US2005/012242 patent/WO2006055026A1/en active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6224358A (ja) * | 1985-07-24 | 1987-02-02 | Hitachi Ltd | 信号ル−テイングテ−ブル方式 |
JPH10187638A (ja) * | 1996-10-28 | 1998-07-21 | Mitsubishi Electric Corp | クラスタ制御システム |
JPH11341042A (ja) * | 1998-05-29 | 1999-12-10 | Toshiba Corp | コンピュータネットワークにおける通信経路の決定方法ならびにシステム及び同方法がプログラムされ記録される記録媒体 |
JP2000112906A (ja) * | 1998-10-01 | 2000-04-21 | Mitsubishi Electric Corp | クラスタシステム |
JP2002041348A (ja) * | 2000-05-26 | 2002-02-08 | Emc Corp | 可用性が高い通信を提供する通信パススルー共有システムリソース、ネットワークファイルサーバ及び方法 |
JP2004532447A (ja) * | 2001-02-24 | 2004-10-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 動的再分割を介するスーパーコンピュータでのフォールト・トレランス |
JP2003162515A (ja) * | 2001-11-22 | 2003-06-06 | Fujitsu Ltd | クラスタシステム |
JP2004126968A (ja) * | 2002-10-03 | 2004-04-22 | Fujitsu Ltd | 並列計算機のジョブスケジューリング装置 |
JP2004206562A (ja) * | 2002-12-26 | 2004-07-22 | Hitachi Ltd | 情報処理システムの制御方法、情報処理システム、及びプログラム |
JP2004242337A (ja) * | 2003-02-07 | 2004-08-26 | Fujitsu Ltd | 交換のためにメモリに書き込まれるパケットをキューイングするシステム、方法及び論理 |
Non-Patent Citations (4)
Title |
---|
CSNH200300267007; 泓 宏優: '並列PCクラスタ「Express5800/Parallel PC-Cluster」' NEC技報 Vol.55,No.7(通巻401号), 20020725, pp.42〜43, 日本電気株式会社 * |
CSNH200900179006; 片山善夫、高橋 真、青柳真澄: 'HPCクラスタの最新技術動向と取り組み' PFU・テクニカルレビュー Vol.14,No.1(通巻25号), 20030501, pp.46〜49, 株式会社PFU * |
JPN6011014585; 片山善夫、高橋 真、青柳真澄: 'HPCクラスタの最新技術動向と取り組み' PFU・テクニカルレビュー Vol.14,No.1(通巻25号), 20030501, pp.46〜49, 株式会社PFU * |
JPN6011014586; 泓 宏優: '並列PCクラスタ「Express5800/Parallel PC-Cluster」' NEC技報 Vol.55,No.7(通巻401号), 20020725, pp.42〜43, 日本電気株式会社 * |
Also Published As
Publication number | Publication date |
---|---|
JP5570095B2 (ja) | 2014-08-13 |
US7475274B2 (en) | 2009-01-06 |
US20060112297A1 (en) | 2006-05-25 |
EP1815341A1 (en) | 2007-08-08 |
WO2006055026A1 (en) | 2006-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5570095B2 (ja) | ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ | |
JP4451806B2 (ja) | 高性能計算(hpc)システムにおけるオン・デマンド・インスタンシエーション | |
JP4185919B2 (ja) | 高性能計算(hpc)システムにおけるスケジューリング | |
US9928114B2 (en) | System and method for topology-aware job scheduling and backfilling in an HPC environment | |
US20190294576A1 (en) | High performance computing (hpc) node having a plurality of switch coupled processors | |
JP4833965B2 (ja) | Hpcアーキテクチャに基づいたクラスタ管理のシステム及び方法 | |
JP4986844B2 (ja) | Hpcノード障害の検出及び管理を行うシステム及び方法 | |
US20050235055A1 (en) | Graphical user interface for managing HPC clusters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110322 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110621 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110628 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110721 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110802 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120706 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120717 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20120907 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140324 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140424 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140624 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5570095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |