JP4577851B2 - 動的再分割を介するスーパーコンピュータでのフォールト・トレランス - Google Patents

動的再分割を介するスーパーコンピュータでのフォールト・トレランス Download PDF

Info

Publication number
JP4577851B2
JP4577851B2 JP2007144007A JP2007144007A JP4577851B2 JP 4577851 B2 JP4577851 B2 JP 4577851B2 JP 2007144007 A JP2007144007 A JP 2007144007A JP 2007144007 A JP2007144007 A JP 2007144007A JP 4577851 B2 JP4577851 B2 JP 4577851B2
Authority
JP
Japan
Prior art keywords
midplane
port
computer system
signal
torus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007144007A
Other languages
English (en)
Other versions
JP2007220147A (ja
Inventor
チェン、トン
コテウス、ポール、ダブリュー
ガラ、アラン、ジー
タッケン、トッド、イー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007220147A publication Critical patent/JP2007220147A/ja
Application granted granted Critical
Publication of JP4577851B2 publication Critical patent/JP4577851B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D25/00Pumping installations or systems
    • F04D25/16Combinations of two or more pumps ; Producing two or more separate gas flows
    • F04D25/166Combinations of two or more pumps ; Producing two or more separate gas flows using fans
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/004Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2051Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17356Indirect interconnection networks
    • G06F15/17368Indirect interconnection networks non hierarchical topologies
    • G06F15/17381Two dimensional, e.g. mesh, torus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • G06F9/526Mutual exclusion algorithms
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • G09G5/006Details of the interface to the display terminal
    • G09G5/008Clock recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L7/00Arrangements for synchronising receiver with transmitter
    • H04L7/02Speed or phase control by the received code signals, the signals containing no special synchronisation information
    • H04L7/033Speed or phase control by the received code signals, the signals containing no special synchronisation information using the transitions of the received signal to control the phase of the synchronising-signal-generating means, e.g. using a phase-locked loop
    • H04L7/0337Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals
    • H04L7/0338Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals the correction of the phase error being performed by a feed forward loop
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/70Control systems characterised by their outputs; Constructional details thereof
    • F24F11/72Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure
    • F24F11/74Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity
    • F24F11/77Control systems characterised by their outputs; Constructional details thereof for controlling the supply of treated air, e.g. its pressure for controlling air flow rate or air velocity by controlling the speed of ventilators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B30/00Energy efficient heating, ventilation or air conditioning [HVAC]
    • Y02B30/70Efficient control or regulation technologies, e.g. for control of refrigerant flow, motor or heating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mechanical Engineering (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

本発明は、全般的に、ソフトウェア制御される動的再分割による並列コンピュータの相互接続ネットワークでのフォールト・トレランスの提供に関する。
重要な計算の大きいクラスを、大量並列コンピュータ・システムによって実行することができる。そのようなシステムは、多数の同一の計算ノードからなり、計算ノードのそれぞれは、通常は、1つまたは複数のCPU、メモリ、およびそのノードを他のノードに接続する1つまたは複数のネットワーク・インターフェースからなる。
米国仮出願番号60/271,124
大量並列スーパーコンピュータに関する、2001年2月24日出願の米国仮出願番号60/271,124に記載のコンピュータでは、システムオンアチップ(SOC)技術を活用して、高いスループットを有する、スケーラブルでコスト効率のよいコンピューティング・システムが作成される。SOC技術によって、集積された第1レベル・キャッシュを伴うCPUコアを含む組込み構成要素のライブラリを使用して、単一のチップ上でマルチプロセッサ・ノード全体を作ることが可能になった。そのようなパッケージ化によって、ノードの構成要素カウントが大きく減り、信頼性がある大スケール計算機の作成が可能になる。
本発明は、動的再分割を介するスーパーコンピュータでのフォールト・トレランスを提供する。マルチプロセッサ並列コンピュータは、冗長な待機プロセッサの余分のグループを設けることと、これらのプロセッサの余分なグループを、ハードウェア障害を経験するグループと交換できるようにシステムを設計することによって、ハードウェア障害に対してトレラントにされる。この交換は、ソフトウェア制御の下で行うことができ、これによって、コンピュータ全体がハードウェア障害に耐えられるようになるが、待機プロセッサをスワップ・インした後に、ソフトウェアに対して元の完全に機能するシステムに見えるようにすることができる。
動的再分割を介するスーパーコンピュータでのフォールト・トレランスの提供に関する本発明の前述の目的および長所は、添付図面と共に検討される、本発明の複数の実施形態の以下の詳細な説明を参照して、当業者が簡単に理解することができる。添付図面では、類似する要素が、複数の図面を通じて同一の符号によって示される。
米国仮出願番号60/271,124に記載の大量並列スーパーコンピュータでは、複数の別々の通信ネットワークによって接続された(x、y、z)(ただし、x=64、y=32、z=32)個の計算ノードを有する大量並列スーパーコンピュータが記述される。これらのネットワークの第1のネットワークは、3次元(3D)トーラスであり、ここで、各計算ノードは、+および−のx、y、z方向の6つのリンクによって、6つの論理的に隣接する最近傍計算ノードに接続され、各計算ノードが、6つの両方向トーラス・ポートを有する。
大量並列スーパーコンピュータには、64×32×32個の計算ノードが含まれ、各計算ノードには、2つのプロセッサを有するASICが含まれ、このプロセッサの1つは、大量並列スーパーコンピュータの一部として処理を実行し、第2のプロセッサは、メッセージ受渡動作を実行する。
図4は、概念的に大量並列スーパーコンピュータの床配置図と見なすことができる図であり、この図には、サービスを容易にするために8つのアイルによって分離されたコンピュータ・ラックの9行が示されている。各行の9つのラックのそれぞれは、おおむね冷蔵庫のサイズであり、2つのミッドプレーンが含まれる。各ミッドプレーンは、基本構成要素であり、8×8×8個の計算ノードが含まれ、各計算ノードには、上で説明したようにマルチプロセッサが含まれる。
物理的な計算機アーキテクチャは、3Dトーラスに最も密に結合される。これは、エッジで「ラップ」される、単純な3次元最近傍相互接続である。計算ノードASICの異なるラックの間に存在するものなどの飛行時間の差を除いて、6つのすべてのトーラス近傍が、等しい距離にあり、コードの書き込みおよび最適化が楽になる。したがって、各ノードは、6つの独立の両方向最近傍リンクを有する。
図1に、並列スーパーコンピュータのトーラスの8つのノードの非常に単純化された図と、この8つのノードの間のリンクを示すが、図1は、ノードの全アレイの部分図であり、ここで、各ノードは、実際に+および−のx、y、z方向で6つのトーラス・リンクを有する。リンクは、最高の番号のノードから最低の番号のノードへ各論理方向(x、y、またはz)でラップして、システム内のすべてのノードの6方向で6つのトーラス・リンクが維持される。図1に、図4のx、y、z座標系との一貫性を有するx、y、z座標系も概略的に示されている。大量並列スーパーコンピュータは、ミッドプレーンに挿入される、計算回路カードおよびリンク回路カードを有する。回路カードは、2×2×2サブキューブで配線され、ラックごとに2つのミッドプレーンは、8×8×8サブキューブとして配線される。動作する64k計算機は、64×32×32のトーラスであるが、故障した構成要素を補償するための冗長性を設けるために、計算機は、物理的には72×32×32のトーラスとして実施され、ここで、追加の8×32×32個のノードが、冗長性のために設けられて、冗長待機プロセッサの余分なグループが設けられる。
6つの最近傍ノードへの各ノードの6つのトーラス・リンクのほかに、大量並列スーパーコンピュータには、2つの他の完全に別々の通信リンク・ネットワークが含まれる。第2の通信リンク・ネットワークは、図2および6に示されている、リンクのグローバル・コンバイニング・ツリーである。第3の通信リンク・ネットワークが、図7に示されている、グローバル割込み信号の組である。リンクのコンバイニング・ツリーおよびグローバル割込み信号は、ツリー構造において互いに類似し、計算機の区画全体(64×32×32個の計算ノード)にまたがる通信を提供するが、その両方を下で説明する。
図2は、大量並列スーパーコンピュータのグローバル・コンバイニング・ツリーの非常に簡略化された図であり、このグローバル・コンバイニング・ツリーは、計算機全体に延び、データを任意のノードからすべての他のノード(ブロードキャスト)またはノードのサブセットに送れるようにする。グローバル和、グローバル最小値、およびグローバル最大値も計算することができる。メッセージ受渡は、グローバル・コンバイニング・ツリーでサポートされ、各計算ノードの第2プロセッサによって制御され、すべて対すべての通信などの集中型動作を、計算ノードと独立に進行させることができる。
本発明によれば、冗長待機プロセッサの余分なグループを設けることと、これらのプロセッサの余分なグループを、ハードウェア障害を経験するグループと交換できるようにシステムを設計することによって、マルチプロセッサ並列コンピュータが、ハードウェア障害に耐えるようにされる。この交換は、ソフトウェア制御の下で行うことができ、これによって、コンピュータ全体がハードウェア障害に耐えられるようになるが、待機プロセッサをスワップ・インした後に、ソフトウェアに対して元の完全に機能するシステムに見えるようにすることができる。
システム再分割
本明細書で説明する大量並列スーパーコンピュータでは、3つの主要な別々の相互接続ネットワークすなわち、3次元トーラス、グローバル・コンバイニング・ツリー、およびグローバル割込みの組が、この動的再分割から利益を得ることができる。大量並列スーパーコンピュータは、ミッドプレーンの間のケーブルを介して信号をステアリングするリンク・チップと共に、ミッドプレーンごとに512個のマルチプロセッサ(8×8×8個のノード)のグループに編成される。リンク・チップ(リンク回路カードごとに6チップ)は、システムのソフトウェア再構成を可能にする主要な形である。
大量並列スーパーコンピュータを、ソフトウェア制御によって論理的に再分割することができる。これによって、物理的に1つのシステムとして一緒に配線された、ラックの大きいグループ(図4に示されたもの)を、複数のサブシステムに論理的に分割できるようになる。これらの論理的に分離されたサブシステムのそれぞれが、異なるコードを同時に実行することができ、あるいは、いくつかの分離されたシステムを、他のシステムの計算中にサービスすることができる。したがって、論理再分割によって、コード開発およびシステム保守が容易になる。
再分割を制御するリンク・チップの動作を、図3に示し、以下の節で説明する。後続の節で、可能な再分割のタイプを詳細に説明する。
リンク・チップ
大量並列スーパーコンピュータのトーラス、グローバル・コンバイニング・ツリー、およびグローバル割込み信号は、異なるミッドプレーンの間で追跡する時に、リンク・チップを通過する。このチップは、2つの機能をサービスする。第1に、リンク・チップは、ミッドプレーンの間でケーブル上の信号を再駆動し、異なるミッドプレーン上の計算ASICの間の長く損失があるトレースケーブルトレース接続の中央での高速信号の形状および振幅を改善する。第2に、リンク・チップは、その異なるポートの間で信号をリダイレクトすることができる。このリダイレクション機能が、大量並列スーパーコンピュータを複数の論理的に別々のシステムに動的に再分割できるようにする機能である。
リンク・チップは、正規リダイレクションおよびスプリット・リダイレクションと称する、システム再分割に関する2種類のトーラス信号リダイレクションを実行する。
正規リダイレクション
正規リダイレクションでは、大きいコンピュータ・システムの1論理方向から(図4に示されたx軸、y軸、またはz軸のいずれかに沿って)1つのミッドプレーンが除去される。正規リダイレクションを、図3のモード1および2に示す。これには、リンク・チップのポートC、F、A、およびBが用いられる。ポートCおよびFは、図5の上部に示されているように、特定のトーラス論理方向x、y、またはzで、現在のミッドプレーンと上位または下位のミッドプレーンとの間でケーブルによって+方向および−方向に接続される。これらのケーブル接続を、図4では、論理Xケーブル40、論理Yケーブル42、および論理Zケーブル44という符号を付けられた矢印によって示す。ポートAおよびBは、ミッドプレーン・トーラス・ループに接続され、このループは、図3および図5で、ミッドプレーンXトーラス51、ミッドプレーンYトーラス52、ミッドプレーンZトーラス53として示されているように、ミッドプレーン内で直列の8つの計算プロセッサを介して循環する。
モード1で動作する時に、リンク・チップは、前のミッドプレーンからのポートCを介する信号を、現在のミッドプレーンを介し、ミッドプレーン・トーラス・ループによって示されているように、ポートFを介して次のミッドプレーンに経路指定する。これによって、リンク・チップは、現在のミッドプレーンを、より大きい計算システムの一部にする。
モード2で動作する時に、前のミッドプレーンからのケーブル信号は、ポートCを介して入り、ポートFを介して次のミッドプレーンに直接に渡され、現在のミッドプレーンが、より大きい計算システムから除去される。また、モード2では、現在のミッドプレーンのトーラス信号が、ポートAおよびBを介してこのミッドプレーンに接続され、このミッドプレーン内でループし、より小さい計算システムが作成される。
スプリット・リダイレクション
スプリット・リダイレクションでは、計算機の大きい64×32×32ノード・セクションを、2つの同等の32×32×32である半分または4つの16×32×32である1/4に分割できるようになる。リンク・チップで実施される時に、スプリット・リダイレクションによって、システム分割の多数の変形を可能にすることができる。しかし、長いケーブルのコストおよび信号保全性の懸念に起因して、スプリット・リダイレクションが、論理X方向でのみ物理的に配線され、大きいシステムを2つの等しい半分または4つの1/4に分割できるようにするのに必要な数のラック行(図4)でのみ物理的に配線されることが好ましい。スプリット・リダイレクションを、図3のモード3および4に示す。3から10までの8つのモードが、スプリット・リダイレクションを達成するのに必要であるが、図3には、説明のためにそのうちの2つ、モード3および4だけが示され、残りのモードは、類似する形で動作する。スプリット・リダイレクションでは、リンク・チップによって、隣接するミッドプレーンへの+ケーブル方向または−ケーブル方向と見なされるケーブル・ポートが再定義される。リンク・チップは、正規ポートCからの+方向ポートを、スプリット・ポートDまたはEあるいはその両方に再定義し、あるいは、正規ポートFからの−方向ポートをスプリット・ポートDまたはEあるいはその両方に再定義する。正規ケーブルは、図4で矢印を有する細い線(論理xケーブル40、論理yケーブル42、および論理zケーブル44)によって示され、スプリット・ケーブル46は、矢印のない太い線(論理xケーブルの中央付近)として示されている。論理xケーブルは、x方向に沿って延び、同様に、論理yケーブルはy方向、論理zケーブルはz方向である。
図4に、論理Xケーブルがラックの間でどのように接続されるかを示す。行番号は、左側の0から8までの数字によって示されている。論理xケーブルが、しばしば、端の行0と1の間の1つのケーブルおよび行7と8の間の1つのケーブルを除いて、1つおきの行に接続され、ケーブルが、行0と2の間、1と3の間、2と4の間、3と5の間などにあることに留意されたい。これらのケーブルによって、どのケーブルも過度に長くならないようにして、ミッドプレーンをx軸に沿って隣接するミッドプレーンに接続できるようになる。類似するケーブル接続方式を、y軸およびz軸に沿って使用することができる。
スプリット・ケーブルによって、正規論理xケーブルに沿ったもの以外のx次元トーラス接続が可能になる。たとえば、計算機が、2つのより小さい計算機に分割され、第1の計算機が行0から4を有し、第2の計算機が行5から8を有する場合に、スプリット・ケーブル46’を、論理ケーブル40’の代わりに切り替え、その結果、第1の計算機のxケーブルが、0と2、2と4、4と3、3と1、および1と0になるようにし、第2の計算機が類似する形に切り替えられるようにすることができる。
トーラス分割
図4に、大量並列スーパーコンピュータの配線および分割を示す。
論理再分割によって、計算機をどのように再分割できるかに関するある範囲のオプションが可能になる。図4に、正規分割およびスプリット分割の両方の例を示し、サービスのためにミッドプレーンをどのようにしてシステムから分離できるかを示す。
スプリット分割によって、大きい72×32×32に配線された大量並列スーパーコンピュータを、2つのほぼ等しい半分の2つのサブシステムすなわち、40×32×32サブシステムおよび32×32×32サブシステムに分割することができる。これは、ミッドプレーンが誤動作している時に、ミッドプレーンが物理的にどこに配置されるかに無関係に、2つの32×32×32サブシステムを必ず作成できる(上のスプリット・リダイレクションで説明した形でスプリット・ケーブル46を使用することによって)ことを保証するために、2つの形の1つで行うことができる。40×32×32サブシステムがラックの上5行であり、32×32×32サブシステムがラックの下4行であるか、その逆のいずれかである。たとえば、図4の正方形4/5によって示される、ラック内の行1のミッドプレーンが、サービスを必要とする場合に、スプリット区画を使用して、ラックの上4行と下5行の間でシステムを分割することができる。この場合に、0、1、2、3、および4という番号の下5行が、40×32×32サブシステムを形成し、上4行5、6、7、および8(すべてがシステム区画6を示す番号6を付けられたラックを有する)が、別々の32×32×32サブシステムを形成する。両方のサブシステムを、このサイズで動作させることができ、あるいは、正規分割を使用してこれらをさらに再分割することができる。
正規分割によって、1つの1ミッドプレーン(8ノード)長のセクションを任意の論理トーラス方向から分離することができる。図4の行1のラック4/5のミッドプレーンが誤動作している場合に、正規分割を使用して、行1を、下側の40×32×32システムの残りから、論理x方向で分離することができ、これによって、行0、2、3、および4の1という符号を付けられた32×32×32システム(システム1)と、ラックに2、3、および4/5という符号を付けられた行1の8×32×32システムが作成される。この行1の8×32×32セクションの論理y方向での正規分割によって、ラック3およびラック4/5がラック2から分離され、8×24×32セクション(2ラック、システム2)および8×8×32セクション(ラック3およびラック4/5)が与えられる。8×8×32セクションの論理z方向での2回の正規分割によって、ラック4/5とラック3が分離され、8×8×16セクション(ラック2、システム3)および2つの8×8×8セクション(ラック4/5、システム4および5)がもたらされ、この8×8×8セクションの1つを、他のすべての再分割が計算している間にサービスすることができる。類似する分割を異なる組合せで使用して、異なるサブセクションを再分割し、分離することができる。
図5に、隣接するミッドプレーンに接続されたケーブルを介してリンク・カードに出入りし、リンク・カードを介し、現在のミッドプレーンのトーラスに出入りするトーラス信号の経路指定を示す。リンクASICによって、任意選択として、現在のミッドプレーンの3次元8×8×8トーラスが、より大きい計算機のトーラスに接続される。図5の上部で、+および−のx、y、およびzの信号が、それぞれ、図4の+および−の論理xケーブル40、論理yケーブル42、論理zケーブル44に結合される。図5のx方向の「スプリット1へ」および「スプリット2へ」に出入りする信号は、図4の+および−のスプリット・ケーブル46に結合される。上で説明したように、スプリット・ケーブル46は、x方向に沿ってのみ設けられるが、より複雑な実施形態では、y方向およびz方向に沿ってスプリット・ケーブルを設けることもできる。リンク・カードには、x方向、y方向、およびz方向のそれぞれの+および−のASICが含まれ、これは、図3に関して上で説明したように動作する。
ツリーおよび割込みの再分割
グローバル・コンバイニング・ツリー信号およびグローバル割込み信号は、図5、6、および7の上部を比較することによってわかるように、トーラス信号と同一のリンク・チップおよびケーブルを介して経路指定される。したがって、正規再分割およびスプリット再分割によって、ツリーが、トーラスと正確に同一の形で論理副区画に分割される。論理副区画内では、各ミッドプレーンの入出力プロセッサが、区画内のツリーを接続するようにソフトウェアによって再構成される。
図6および7に、トーラス信号も担持する、ミッドプレーンの間のケーブルおよびリンク・チップ(x、y、およびzのリンク・チップが示されている)を介するグローバル・コンバイニング・ツリー信号およびグローバル割込み信号の経路指定を示す。リンク・チップが再構成される時に、どのミッドプレーンがシステムの論理区画のそれぞれで接続されるかが設定される。しかし、再分割の際に、コンバイニング・ツリー・ネットワークおよび割込み信号ネットワークの両方が、さらに構成され、その結果、コンバイニング・ツリーの頭部および割込み信号ネットワークの頭部の両方が、各論理計算機区画全体を通じて定義されるようになることを必要とする。これは、多数の形で達成することができる。
図6に、グローバル・コンバイニング・ツリー・ネットワークの信号であり、図5のトーラス信号と正確に同一のケーブルを介して経路指定される、グローバル・ツリー信号の経路指定を示す。
グローバル・コンバイニング・ツリーについて、大量並列スーパーコンピュータは、各ミッドプレーンの最上レベル・ミッドプレーン計算プロセッサ(ASIC)のグループを使用して、隣接ミッドプレーンへの6つのミッドプレーンから出るケーブル方向(リンク・ケーブルを介する信号)のどれが、アップツリー(透視図から、図2のツリーの最上部に向かう)またはツリーのより高い論理レベルに移動するものとして定義されるか、および、どれがダウンツリー(透視図から、図2の木の最下部に向かう)として定義されるかを、集合的に定義する。これらの最上レベル・ミッドプレーンASICは、それぞれ3つのグローバル・ツリー・ポートを有し、これらのポートを、ソフトウェア制御の下で切り替えて、どのポートがアップツリーまたはダウンツリーであるかを定義することができる。集合的に、これらの最上レベル・ミッドプレーンASICによって、図6に示されているように、6つのミッドプレーンから出るケーブル・リンクの1つがアップツリーとして定義され、他の5つがダウンツリーとして定義され、これによって、他の下位レベル・ミッドプレーンASICのツリー接続がもたらされる。
図7に、グローバル割込み信号ネットワークの信号であり、図5のトーラス信号と正確に同一のケーブルを介して経路指定される、割込み信号の経路指定を示す。
割込みは、単純なAND機能およびOR機能なので、複数のダウンツリー分岐をアップツリー・リンクに接続する時に、ミッドプレーン計算ASICの複雑なプロセッサが算術演算を実行する必要はない。最上レベル計算ASICのグループが、割込みネットワークのミッドプレーンから出るアップツリー・リンクおよびダウンツリー・リンクを接続する必要はない。これによって、図7の割込み経路指定を、図6のグローバル・ツリー経路指定と比較して単純にすることができる。グローバル割込みについて、図7のリンク・チップは、信号線54を介してそれ自体の間で通信し、一緒に、リンク・カード上のリンクFPGA(ASIC Field Programmable Gate Array)への信号線55を介して単一の両方向アップツリー信号を提示する。このFPGAは、ダウンツリー・ブロードキャストと、アップツリーのAND論理機能およびOR論理機能を実行することができる。このFPGAは、5つのダウンツリー・ケーブル接続を介し、また、ミッドプレーンへ、ダウンツリー信号を通信する。
図5、6、および7に、ケーブルおよびリンク・カードの間のトーラス信号、グローバル・ツリー信号、および割込み信号のすべての経路指定が、正確に同一であることを示した。3つのネットワークのすべてが、同一のケーブルを介して移動し、各リンク・カードが、3つのすべてのタイプのネットワークの3つのすべてのタイプの信号の経路指定および再分割を処理する。
本明細書で、動的再分割を介するスーパーコンピュータでのフォールト・トレランスに関する本発明の複数の実施形態および変形形態を詳細に説明したが、本発明の開示および教示によって、当業者に多数の代替設計が提案されることは明白である。
並列コンピュータの非常に単純化された8個ノード・セクションと、この8つのノードの間のトーラス・リンクを示す図である。これは、ノードの完全なアレイのトーラス・リンクの部分的な図であり、ここで、各ノードは、実際に+および−のx、y、z方向で6つのトーラス・リンクを有し、リンクは、最高の番号のノードから最低の番号のノードへ各論理方向(x、y、またはz)でラップして、システム内のすべてのノードの6方向で6つのトーラス・リンクが維持される。 大量並列スーパーコンピュータのグローバル・コンバイニング・ツリーの非常に簡略化された図である。この図は、コンピュータ・ノードの区画全体にわたってすべてのノードを接続するグローバル・コンバイニング・ツリーの全体の部分図である。 再分割を制御するリンク・チップの動作を示す図である。 概念的に大量並列スーパーコンピュータの床配置図と見なすことができる図である。この図には、8つのアイルによって分離された8つのコンピュータ・ラックの9行が示され、ここで、各行の8つのラックのそれぞれに、2つのミッドプレーンが含まれ、各ミッドプレーンに、8×8×8個の計算ノードが含まれる。 隣接するミッドプレーンに接続されたケーブルを介してリンク・カードに出入りし、リンクカードを介し、現在のミッドプレーンのトーラスに出入りするトーラス信号の経路指定を示す図である。リンクASICによって、任意選択として、現在のミッドプレーンの3次元8×8×8トーラスが、より大きい計算機のトーラスに接続される。 リンク・カードに出入りし、隣接ミッドプレーンに接続されるケーブルを介し、リンク・カードを介し、ミッドプレーン計算ASICに出入りするグローバル・コンバイニング・ツリー・ネットワークの信号である、グローバル・ツリー信号の経路指定を示す図である。リンクASICおよび最上レベル計算ASICは、集合的に、現在のミッドプレーンのツリーをより大きいシステムのグローバル・コンバイニング・ツリーに接続する方法を決定する。 隣接ミッドプレーンに接続されたケーブルを介してリンク・カードに出入りし、リンク・カードASICおよびFPGAを介し、ミッドプレーンに出入りするグローバル割込み信号ネットワークの信号である、割込み信号の経路指定を示す図である。

Claims (7)

  1. 並列コンピュータ・システムをハードウェア障害に対してトレラントにするために並列コンピュータ・システムでフォールト・トレランスを提供する方法において、前記並列コンピュータ・システムは複数のミッドプレーンで構成されており、各ミッドプレーンは複数の計算ノードを有し、各計算ノードは1つまたは複数のプロセッサを有し、前記方法は、
    前記コンピュータ・システムに冗長待機プロセッサの余分なグループを設けることと、
    冗長待機プロセッサの前記余分なグループを、ハードウェア障害を経験する前記コンピュータ・システムのプロセッサのグループの代わりに動作するように切り替えることと、
    前記コンピュータ・システムが、3次元トーラスとして接続されたa×b×c個の計算ノードのアレイを含み、各計算ノードが、6つの隣接する計算ノードへの+および−のx、y、z方向6つのトーラス・リンクによって接続することと、
    前記コンピュータ・システムが、データを任意のノードからすべての他のノードまたはノードのサブセットに送れるようにするグローバル・コンバイニング・ツリーを介する通信リンク、グローバル割込み信号ネットワークを介する通信リンクも経路指定することと
    を含む方法であって、
    3次元トーラスとして接続された異なるミッドプレーンの間で追跡する時に、前記コンピュータ・システムのトーラス信号、グローバル・コンバイニング・ツリー信号、およびグローバル割込み信号が、+および−のx、y、z方向に6つのリンク・チップを介して通過し、ここで前記グローバル・コンバイニング・ツリー信号および前記グローバル割込み信号は、前記トーラス信号と同一のリンク・チップを介して経路指定され、
    前記6つのリンク・チップが、前記コンピュータ・システムを複数の論理的に別々のシステムに分割されることを可能にするために、前記6つの各リンク・チップの2つの正規ポート(INとOUT)2つのスプリット・ポート(INとOUT)2つのミッドプレーン・ポート(INとOUT)間で、正規ポート(IN)をミッドプレーン・ポート(OUT)に且つミッドプレーン・ポート(IN)を正規ポート(OUT)に経路指定したり、正規ポート(IN)を正規ポート(OUT)に且つミッドプレーン・ポート(IN)をミッドプレーン・ポート(OUT)に経路指定したり、ミッドプレーン・ポート(IN)を正規ポート(OUT)に且つスプリット・ポート(IN)をミッドプレーン・ポート(OUT)に経路指定したり、又はスプリット・ポート(IN)を正規ポート(OUT)に且つミッドプレーン・ポート(IN)をミッドプレーン・ポート(OUT)に経路指定したりすることで信号をリダイレクトする、前記方法。
  2. 前記切り替えることが、ソフトウェア制御下であり、これによって、前記コンピュータ・システム全体が、ハードウェア障害に耐えられるようになり、前記待機プロセッサのスワップ・インの後に、前記コンピュータ・システムが、ソフトウェアに、完全に機能し動作するコンピューティング・システムとして見える、請求項1に記載の方法。
  3. 前記コンピュータ・システムが、複数の実質的に同一の計算ノードを含む大量並列コンピュータ・システムを含み、前記計算ノードのそれぞれが、1つまたは複数の前記プロセッサ、メモリ、および前記計算ノードを他の計算ノードに接続する1つまたは複数のネットワーク・インターフェースを含む、請求項1に記載の方法。
  4. 各計算ノードが、マルチプロセッサを有するASICを含み、前記マルチプロセッサの1プロセッサが、大量並列スーパーコンピュータの一部として処理を実行し、前記マルチプロセッサの第2のプロセッサが、前記計算ノードのメッセージ受渡動作を実行する、請求項3に記載の方法。
  5. 各リンク・チップが、2種類の信号リダイレクション、すなわち、前記コンピュータ・システムのx軸、y軸、またはz軸のいずれかに沿った1つの論理方向から1つのプロセッサのグループであるミッドプレーンを除去する正規リダイレクションと、前記コンピュータ・システムを2つの半分または4つの1/4に分割できるようにするスプリット・リダイレクションとを実行する、請求項1に記載の方法。
  6. 前記グローバル・コンバイニング・ツリー信号および前記グローバル割込み信号が、前記3次元トーラスを介して経路指定される信号として同一の前記リンク・チップおよびリンクを介して経路指定され、それによって前記正規リダイレクションおよび前記スプリット・リダイレクションが、前記グローバル・コンバイニング・ツリーを前記3次元トーラスと正確に同一の様式の論理副区画に再分割する、請求項5に記載の方法。
  7. 再分割に応じて、前記グローバル・コンバイニング・ツリー信号および前記グローバル割込み信号は、前記コンバイニング・ツリーの頭部および前記グローバル割込み信号ネットワークの頭部の両方が各論理区画にわたって定義されるようにさらに構成される、請求項6に記載の方法。
JP2007144007A 2001-02-24 2007-05-30 動的再分割を介するスーパーコンピュータでのフォールト・トレランス Expired - Fee Related JP4577851B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US27112401P 2001-02-24 2001-02-24
PCT/US2002/005566 WO2002069469A1 (en) 2001-02-24 2002-02-25 Fault tolerance in a supercomputer through dynamic repartitioning
JP2002568482A JP4524073B2 (ja) 2001-02-24 2002-02-25 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002568482A Division JP4524073B2 (ja) 2001-02-24 2002-02-25 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Publications (2)

Publication Number Publication Date
JP2007220147A JP2007220147A (ja) 2007-08-30
JP4577851B2 true JP4577851B2 (ja) 2010-11-10

Family

ID=68499838

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002568482A Expired - Fee Related JP4524073B2 (ja) 2001-02-24 2002-02-25 動的再分割を介するスーパーコンピュータでのフォールト・トレランス
JP2007144007A Expired - Fee Related JP4577851B2 (ja) 2001-02-24 2007-05-30 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2002568482A Expired - Fee Related JP4524073B2 (ja) 2001-02-24 2002-02-25 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Country Status (6)

Country Link
US (1) US7185226B2 (ja)
EP (1) EP1374360A4 (ja)
JP (2) JP4524073B2 (ja)
KR (1) KR100570145B1 (ja)
CN (1) CN1319237C (ja)
WO (1) WO2002069469A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002069469A1 (en) * 2001-02-24 2002-09-06 International Business Machines Corporation Fault tolerance in a supercomputer through dynamic repartitioning
CN1322452C (zh) * 2001-02-24 2007-06-20 国际商业机器公司 环形和树形网络中的算术函数
US20060001669A1 (en) * 2002-12-02 2006-01-05 Sehat Sutardja Self-reparable semiconductor and method thereof
US7185225B2 (en) * 2002-12-02 2007-02-27 Marvell World Trade Ltd. Self-reparable semiconductor and method thereof
US7340644B2 (en) * 2002-12-02 2008-03-04 Marvell World Trade Ltd. Self-reparable semiconductor and method thereof
US7178059B2 (en) * 2003-05-07 2007-02-13 Egenera, Inc. Disaster recovery for processing resources using configurable deployment platform
JP3737810B2 (ja) * 2003-05-09 2006-01-25 株式会社東芝 計算機システム及び故障計算機代替制御プログラム
US7904663B2 (en) * 2003-12-18 2011-03-08 International Business Machines Corporation Secondary path for coherency controller to interconnection network(s)
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US8335909B2 (en) 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US8336040B2 (en) 2004-04-15 2012-12-18 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US7376890B2 (en) * 2004-05-27 2008-05-20 International Business Machines Corporation Method and system for checking rotate, shift and sign extension functions using a modulo function
US7475274B2 (en) * 2004-11-17 2009-01-06 Raytheon Company Fault tolerance and recovery in a high-performance computing (HPC) system
KR100748715B1 (ko) * 2005-12-27 2007-08-13 주식회사 텔레칩스 하드웨어 작업관리 장치
US20070174655A1 (en) * 2006-01-18 2007-07-26 Brown Kyle G System and method of implementing automatic resource outage handling
US8078907B2 (en) * 2006-01-19 2011-12-13 Silicon Graphics, Inc. Failsoft system for multiple CPU system
US8516444B2 (en) 2006-02-23 2013-08-20 International Business Machines Corporation Debugging a high performance computing program
US7512836B2 (en) 2006-12-11 2009-03-31 International Business Machines Corporation Fast backup of compute nodes in failing midplane by copying to nodes in backup midplane via link chips operating in pass through and normal modes in massively parallel computing system
JP2008165381A (ja) * 2006-12-27 2008-07-17 Ricoh Co Ltd 画像処理装置及び画像処理方法
US8412981B2 (en) * 2006-12-29 2013-04-02 Intel Corporation Core sparing on multi-core platforms
US20080235454A1 (en) * 2007-03-22 2008-09-25 Ibm Corporation Method and Apparatus for Repairing a Processor Core During Run Time in a Multi-Processor Data Processing System
US9330230B2 (en) * 2007-04-19 2016-05-03 International Business Machines Corporation Validating a cabling topology in a distributed computing system
US7984150B2 (en) * 2007-07-31 2011-07-19 Hewlett-Packard Development Company, L.P. Cell compatibilty in multiprocessor systems
JP2009104300A (ja) * 2007-10-22 2009-05-14 Denso Corp データ処理装置及びプログラム
US7870365B1 (en) 2008-07-07 2011-01-11 Ovics Matrix of processors with data stream instruction execution pipeline coupled to data switch linking to neighbor units by non-contentious command channel / data channel
US7958341B1 (en) 2008-07-07 2011-06-07 Ovics Processing stream instruction in IC of mesh connected matrix of processors containing pipeline coupled switch transferring messages over consecutive cycles from one link to another link or memory
US8145880B1 (en) 2008-07-07 2012-03-27 Ovics Matrix processor data switch routing systems and methods
US8131975B1 (en) 2008-07-07 2012-03-06 Ovics Matrix processor initialization systems and methods
US8327114B1 (en) 2008-07-07 2012-12-04 Ovics Matrix processor proxy systems and methods
JP2010086363A (ja) * 2008-10-01 2010-04-15 Fujitsu Ltd 情報処理装置及び装置構成組み換え制御方法
US20110202995A1 (en) * 2010-02-16 2011-08-18 Honeywell International Inc. Single hardware platform multiple software redundancy
US8718079B1 (en) 2010-06-07 2014-05-06 Marvell International Ltd. Physical layer devices for network switches
US8713362B2 (en) 2010-12-01 2014-04-29 International Business Machines Corporation Obviation of recovery of data store consistency for application I/O errors
US8694821B2 (en) 2010-12-03 2014-04-08 International Business Machines Corporation Generation of standby images of applications
CN111811116A (zh) * 2020-07-07 2020-10-23 北京丰联奥睿科技有限公司 一种多联空调系统的配置方法
WO2023068960A1 (ru) * 2021-10-20 2023-04-27 Федеральное Государственное Унитарное Предприятие "Российский Федеральный Ядерный Центр - Всероссийский Научно - Исследовательский Институт Технической Физики Имени Академика Е.И. Забабахина" Компактный суперкомпьютер

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61201365A (ja) * 1985-03-04 1986-09-06 Nippon Telegr & Teleph Corp <Ntt> 並列処理システムの自動再構成方式
JPS62274454A (ja) * 1986-05-23 1987-11-28 Hitachi Ltd 並列処理計算機
JPH03132861A (ja) * 1989-10-19 1991-06-06 Agency Of Ind Science & Technol マルチプロセッサ・システムの再構成制御方式
JPH0635872A (ja) * 1992-05-22 1994-02-10 Internatl Business Mach Corp <Ibm> コンピュータ・システム
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JP2004532447A (ja) * 2001-02-24 2004-10-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4907232A (en) * 1988-04-28 1990-03-06 The Charles Stark Draper Laboratory, Inc. Fault-tolerant parallel processing system
US5963746A (en) * 1990-11-13 1999-10-05 International Business Machines Corporation Fully distributed processing memory element
US5594918A (en) * 1991-05-13 1997-01-14 International Business Machines Corporation Parallel computer system providing multi-ported intelligent memory
US5715391A (en) * 1991-11-15 1998-02-03 International Business Machines Corporation Modular and infinitely extendable three dimensional torus packaging scheme for parallel processing
US5271014A (en) 1992-05-04 1993-12-14 International Business Machines Corporation Method and apparatus for a fault-tolerant mesh with spare nodes
US5592610A (en) * 1994-12-21 1997-01-07 Intel Corporation Method and apparatus for enhancing the fault-tolerance of a network
US5884018A (en) * 1997-01-28 1999-03-16 Tandem Computers Incorporated Method and apparatus for distributed agreement on processor membership in a multi-processor system
US6189112B1 (en) * 1998-04-30 2001-02-13 International Business Machines Corporation Transparent processor sparing
US6115829A (en) * 1998-04-30 2000-09-05 International Business Machines Corporation Computer system with transparent processor sparing
JP4154124B2 (ja) * 1998-11-10 2008-09-24 富士通株式会社 並列プロセッサシステム
FR2795840B1 (fr) * 1999-07-02 2001-08-31 Commissariat Energie Atomique Reseau de processeurs paralleles avec tolerance aux fautes de ces processeurs, et procede de reconfiguration applicable a un tel reseau
US6789213B2 (en) * 2000-01-10 2004-09-07 Sun Microsystems, Inc. Controlled take over of services by remaining nodes of clustered computing system
JP3674515B2 (ja) * 2000-02-25 2005-07-20 日本電気株式会社 アレイ型プロセッサ
ATE437476T1 (de) * 2000-10-06 2009-08-15 Pact Xpp Technologies Ag Zellenanordnung mit segmentierter zwischenzellstruktur
ATE479147T1 (de) 2001-02-24 2010-09-15 Ibm Neuartiger massivparalleler supercomputer
US7080156B2 (en) * 2002-03-21 2006-07-18 Sun Microsystems, Inc. Message routing in a torus interconnect

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61201365A (ja) * 1985-03-04 1986-09-06 Nippon Telegr & Teleph Corp <Ntt> 並列処理システムの自動再構成方式
JPS62274454A (ja) * 1986-05-23 1987-11-28 Hitachi Ltd 並列処理計算機
JPH03132861A (ja) * 1989-10-19 1991-06-06 Agency Of Ind Science & Technol マルチプロセッサ・システムの再構成制御方式
JPH0635872A (ja) * 1992-05-22 1994-02-10 Internatl Business Mach Corp <Ibm> コンピュータ・システム
JPH06290158A (ja) * 1993-03-31 1994-10-18 Fujitsu Ltd 再構成可能なトーラス・ネットワーク方式
JP2004532447A (ja) * 2001-02-24 2004-10-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 動的再分割を介するスーパーコンピュータでのフォールト・トレランス

Also Published As

Publication number Publication date
JP2004532447A (ja) 2004-10-21
JP4524073B2 (ja) 2010-08-11
JP2007220147A (ja) 2007-08-30
US20040153754A1 (en) 2004-08-05
CN1493101A (zh) 2004-04-28
WO2002069469A1 (en) 2002-09-06
KR20030077034A (ko) 2003-09-29
EP1374360A1 (en) 2004-01-02
KR100570145B1 (ko) 2006-04-12
EP1374360A4 (en) 2010-02-17
CN1319237C (zh) 2007-05-30
US7185226B2 (en) 2007-02-27

Similar Documents

Publication Publication Date Title
JP4577851B2 (ja) 動的再分割を介するスーパーコンピュータでのフォールト・トレランス
US10681136B2 (en) Memory network methods, apparatus, and systems
US8933715B2 (en) Configurable vertical integration
Despain et al. X-Tree: A tree structured multi-processor computer architecture
KR101091360B1 (ko) 토러스 네트워크를 가지는 병렬 컴퓨터 시스템 상의 오류 복구
EP1665065B1 (en) Integrated data processing circuit with a plurality of programmable processors
KR20100105414A (ko) 정보 처리 시스템, 통신 제어 장치 및 방법
CN112188325B (zh) 使用具有一对多光交换机的光网络的可重新配置的计算平台
US8117502B2 (en) Bisectional fault detection system
US7930584B2 (en) Cell boundary fault detection system
US7826379B2 (en) All-to-all sequenced fault detection system
Min et al. Design and analysis of a multiprocessor system with extended fault tolerance
Davis IV et al. The performance analysis of partitioned circuit switched multistage interconnection networks
Takanami et al. Degradable restructuring of mesh-connected processor arrays with spares on orthogonal sides
Rim et al. An architecture for high availability multi-user systems
Jindal Simulation Analysis of Permutation Passibility behavior of Multi-stage Interconnection Networks A Thesis Report Submitted in the partial fulfillment of the requirements for the award of the degree of ME in Software Engineering
Kaneko et al. A study of the number of tracks required for the reconfiguration of mesh‐connected processor‐element networks
Theobald The W‐Network: A low‐cost fault‐tolerant multistage interconnection network for fine‐grain multiprocessing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090402

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090402

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20090402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100727

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100818

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20100818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees