JPH01217641A - 並列計算機の冗長構成方式 - Google Patents

並列計算機の冗長構成方式

Info

Publication number
JPH01217641A
JPH01217641A JP63043615A JP4361588A JPH01217641A JP H01217641 A JPH01217641 A JP H01217641A JP 63043615 A JP63043615 A JP 63043615A JP 4361588 A JP4361588 A JP 4361588A JP H01217641 A JPH01217641 A JP H01217641A
Authority
JP
Japan
Prior art keywords
pes
spare
link
backup
links
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63043615A
Other languages
English (en)
Inventor
Tsutomu Ishikawa
勉 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63043615A priority Critical patent/JPH01217641A/ja
Publication of JPH01217641A publication Critical patent/JPH01217641A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、計算機の障害対策等のための冗長構成方式に
係り、特に複数の処理要素(以下PEと呼ぶ)をハイパ
キューブ状に結合した並列計算機の冗長構成方式に関す
るものである。
〔従来の技術〕
ハイパキューブ型並列計算機とは、該計算機を構成する
複数のPEにそれぞれ番号を付け、それを2進表現とし
た時、そのビットパターンが1ビツトだけ異なるPE同
志をすべて接続する構造のものをいう。従来、この種の
並列計算機の冗長構成としては、各PE毎に多重化(一
般には2重化)する方式、あるいは全PEに対し1つの
予備PEを設け、これをすべてのPEと結合する方式が
知られている。
〔発明が解決しようとする課題〕
従来技術において、各PE毎に多重化する方式は、信頼
性は大幅に向上するものシ、もとのPE数に対しく多重
度−1)倍の予備PEが必要であり、冗長度が大きいと
いう問題があった。又、全PEに対し1つの予備PEを
設けてそれを全PEと結合する方式は、予備PEに等し
い数のリンク(PE間の接続線をいう)を必要とする問
題があった。これはPE数が多い並列計算機では特に大
きな問題となり、リンク数の増加に伴う端子数の増加か
ら予備PEを実現すること自体が困難となる。
本発明の目的は、冗長度を最小としかつ予備PEのリン
ク数も少なくできるハイパキューブ型並列計算機の冗長
構成方式を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するため、本発明では、並列計算機機を
構成する全PEに対してに個の予備PEを設けると共に
、全PEをPEの番号を2進表現したビットパターンが
1つの集合内で互いに3以上のハミング距離を持つ複数
の集合に分け、各集合毎に集合内のすべてのPEから1
つのPEを選択する選択手段を設け、全PEを該選択手
段を介してそれぞれ全予備PEに結合し、各予備PEは
最大k−1個の他の予備PEと結合する。
〔作 用〕
あるPEが故障の場合、任意の予備PEが故障PEの機
能を代替し、故障PEと他のPEとのハイパキューブ結
合は、該予備PEと他のPEを選択手段を介して結合す
ることで代替する。また、複数のPEが故障の場合は、
故障PEの数だけの予備PEが代替する。
〔実施例〕
以下1本発明の一実施例について図面により説明する。
第1図は予備PEを1個とした本発明の基本的な実施例
を説明する図であって、1はハイパキューブ結合型並列
計算機の主構成要素であるPE、2はハイパキューブ結
合を実現する結合網、3はPE間を結合するリンク1,
4は予備リンク、5は選択手段、6は予備PEを示す。
全PE数NをN=2nとしたとき、各PEIは基本的に
はn本のリンク3を持つ。結合網2において各PEIの
リンク3は、PEの番号を2進表現したときのビットパ
ターンが1ビツトだけ異なるPE同志が直接接続される
ように結合される。
すなわち、PE、の番号を2進表現したビットパターン
をA1=aI、a□a、・−B、−□(atは110”
又は“1″)としたとき、PE、はa O〜a n−1
のうちいずれか1ビツトだけが異なるビットパターンを
有するPEと結合される。このビットパターンの異なる
程度を表わすものとして一般にハミング距離が用いられ
ており、ビットパターンAiとAjの間のハミング距d
 H(A L−A j)はAIとAjで異なるビットの
数と定義される。このハミング距離を用いてゴいかえれ
ば、結合網2はハミング距離H=1のPE同志を結合し
ている網ということになる。
第1図で、全PEは以下の条件を満たす80〜S H−
1のM個の集合に分けられ、各集合内のPEは選択手段
5を介して予備PE6に結合される。
選択手段5は、集合Sl内のすべてのPEの予備リンク
4のうちから一つを選択するものである。
〔集合Siの条件〕集合Si内の任意の2つのPE間の
ハミング距離が3以上。
すなわち、これら2つのPE の番号のビットパターンをA、。
AnとしたときH(Am= An) ≧3の関係がすべてのPEに ついて成立。
次に、第1図の動作を説明する。いずれかのPEが故障
の場合には、予備PE6がその故障PEの機能を代替し
、故障PEと他のPEとの結合は予備リンク4が代替す
る。具体的に、例えば集合S工のPF6(X印)が故障
とする。 PEclは結合網2によって、ハミング距離
が1の他のPEと結合されているが、集合Sの性質から
PE、はS工の他のPEとは結合されず、又、他の集合
Si内のPEとは同−集合内で高々1つしか結合されな
い。
前者は集合内のPEが互いにH≧3であり、かつハイパ
キューブではH=1同志のPEが結合されることから当
然である。又、後者は、もしPEヶ(ビットパターンA
(1)が他の1つの集合Si内のPEp、PEγ(それ
ぞれのビットパターンをA pHA、とする)と結合し
ていたとすると。
HCApv Ay) ”H(Al? Aa) +H(A
ye A4)=1+1=2 となってしまい、PE P+ P E yが同一の集合
内にあるための条件H(A p g A y )≧3と
矛盾することから、明らかである。従って、PE&を予
備PE6で代替したとき、 PF6と他のPEとの結合
は、各集合につき多くても1本の予備リンク4を用いる
ことにより代替できることになる。すなわち、予備PE
6を組込み、PE数Nのハイパキューブ結合を再構成で
きることになる。
予備リンク4の選択は選択手段5で行われるが、以上説
明したように予備PE6との結合は各集合について高々
1本でありかつ動的に切替える必要がないため、選択手
段5は極めて単純なバスにより実現できる。すなわち同
−集合内の予備リンク4をすべてWried OR接続
によるバスで結合することにより、選択手段5の機能を
実現できることになる。
第2図は本発明のより具体的な実施例であり、PE数N
=8 (=2’) 、選択手段5にバスを用いた場合に
ついて示している。1〜6は第1図と同様である。また
、図中の()内のビットパターンは各PEの番号を2進
表現して示したものである。
第2図の場合、全PEはS。−83の4つの集合に分け
られ、集合内でWried OR接続され予備PE6に
結合される。各集合内のPEIの番号のハミング距離は
すべて3になっている。いま、集合S1内の(001)
PE (X印)が故障とする。
この時、予備PE6は(001)のPEを代替し。
(001)のPEと(OOO)のPEとのリンクaは予
備リンクAで、(011)のPEとのリンクbは予備リ
ンクBで(101)のTJ EとのリンクCは予備リン
クCで代替される。これにより故障した(001)のP
Eを除き、代りに予備PE6を組込んでPE数N=8の
ハイパキューブ結合が再構成される。他のPEが故障し
た場合にも同様にして、予備PE6を代替としてハイパ
キューブ結合が再構成できることはいうまでもない。
第2図かられかるように、各集合内で予備リンクは高々
1本しか予備PEと結合されていない。
したがって1本丸jd4成では本来のPEのリンク数の
増加は1であり、予備PE6のリンク数は集合の数Mで
ある。PE#INと予備PEのリンク数M、バス結合さ
れるPEの数(集合内のPE数)Bの関係を第3図に示
す。同図かられかるように、本方式では予備PE数が1
と少ないだけでなく、予備PEのリンク数もMと少なく
できることがわかる。
これまでは説明を簡単にするため、予備PE数が1の場
合について示してきたが、一般に任意のに個のPEの故
障をも許容できるようにするには以下のようにすればよ
い、すなわち、予備PEをに個設け、本来のPEの予備
リンクは各に本とし、これまで説明してきた結合をすべ
ての予備PEに対し行い、かつ各予備PEは最大k−1
個の他の予備PEと結合する。予備PE間のリンクはハ
イパキューブ結合網において互いに結合されたPEが共
に故障のとき、その間のリンクの代替を行う。
第4図はPE数N=8、予備P Eが2個の場合の具体
的な実施例である。第4図において、(001)と(1
01)の2つのPEが故障の場合、これらの故障PEは
2つの予備PE6で代替され、故障PEのリンクa、b
、Q、d、eとは図中の太線のリンクで代替される。ニ
ーで、Cのリンクは故障PE同志を結合するリンクであ
り、これは ′予備PE間のリンクで代替される。なお
、このように予mPEをに個設けた場合には、予備PE
のリンク数Mは第3図のそれに対しk−1本増加する。
〔発明の効果〕
以上説明したように、本発明では、ハイパキューブ型並
列計算機において、全PEに対して1又は複数の予備P
Eを設け、全PEを集合内でPE間のハミング距離が互
いに3以上となる複数の集合に分け、各集合毎に1つの
I)Eを選択して予備PEと結合しているため、予備P
E数を少なく、かつ予備PEのリンク数を少なくできる
利点がある。又、集合内の1つのPEを選択する手段は
単なるWired OR接続からなるバスで実現できる
利点がある。
【図面の簡単な説明】
第1図は本発明の基本的な実施例を示す図、第2図は本
発明のより具体的な実施例を示す図、第3図は本発明に
おけるPE数と予備PEのリンク数、バス結合されるP
E数の関係を示す図。 第4図は本発明の別のより具体的な実施例を示す図であ
る。 1・・・PE、 2・・・ハイパキューブ結合網、3・
・・リンク、  4・・・予備リンク5・・・選択手段
、 6・・・予備P E。 第乙図

Claims (1)

    【特許請求の範囲】
  1. (1)複数の処理要素(以下PEと呼ぶ)をハイパキュ
    ーブ状に結合した並列計算機において、全PEに対しk
    個の予備PEを設けると共に、全PEをPEの番号を2
    進表現したビットパターンが1つの集合内で互いに3以
    上のハミング距離を持つ複数の集合に分け、各集合毎に
    集合内のすべてのPEから1つのPEを選択する選択手
    段を設け、全PEを該選択手段を介してそれぞれ全予備
    PEに結合し、各予備PEは最大k−1個の他の予備P
    Eと結合することを特徴とする並列計算機の冗長構成方
    式。
JP63043615A 1988-02-26 1988-02-26 並列計算機の冗長構成方式 Pending JPH01217641A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63043615A JPH01217641A (ja) 1988-02-26 1988-02-26 並列計算機の冗長構成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63043615A JPH01217641A (ja) 1988-02-26 1988-02-26 並列計算機の冗長構成方式

Publications (1)

Publication Number Publication Date
JPH01217641A true JPH01217641A (ja) 1989-08-31

Family

ID=12668745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63043615A Pending JPH01217641A (ja) 1988-02-26 1988-02-26 並列計算機の冗長構成方式

Country Status (1)

Country Link
JP (1) JPH01217641A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61201365A (ja) * 1985-03-04 1986-09-06 Nippon Telegr & Teleph Corp <Ntt> 並列処理システムの自動再構成方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61201365A (ja) * 1985-03-04 1986-09-06 Nippon Telegr & Teleph Corp <Ntt> 並列処理システムの自動再構成方式

Similar Documents

Publication Publication Date Title
US4523273A (en) Extra stage cube
Wu et al. The balanced hypercube: a cube-based system for fault-tolerant applications
JPH02287668A (ja) 再構成可能な信号プロセッサ
Chau et al. A proposal for a fault-tolerant binary hypercube architecture
JPH0628330A (ja) フォールト・トレラント・メッシュおよびその構成方法
JP5078347B2 (ja) 複数のノードを有するコンピュータ・システムの故障ノードをフェイルオーバー(修復)する方法
US4983961A (en) Three stage non-blocking switching array
US6643764B1 (en) Multiprocessor system utilizing multiple links to improve point to point bandwidth
US5812556A (en) Fault tolerant switch fabric with control and data correction by hamming codes and error inducing check register
Kumar et al. Design and analysis of fault-tolerant multistage interconnection networks with low link complexity
KR101162702B1 (ko) 패리티를 사용하지 않고 raid 레벨 6 보다 우수한 리던던시 및 내고장성을 확립하기 위한 방법
Ghafoor A class of fault-tolerant multiprocessor networks
JPH01217641A (ja) 並列計算機の冗長構成方式
JP2011243190A (ja) パリティとミラーリングを用いることなしにraidシステムにおいて高レベルな冗長性、耐故障性、及びパフォーマンスを確立する方法
JPH01217642A (ja) 並列計算機の冗長構成方式
Gholizadeh et al. Reliability improvement of fault-tolerant shuffle exchange interconnection networks
DeHon et al. Fault-tolerant design for multistage routing networks
CN113347029B (zh) 基于拓扑重构和路径规划的Torus网络容错方法
CA2011340A1 (en) Processor unit networks
JPH01217643A (ja) 並列計算機の冗長構成方式
Mahapatra et al. Hardware-efficient and highly reconfigurable 4-and 2-track fault-tolerant designs for mesh-connected arrays
US6880119B1 (en) Method for supervising parallel processes
JP2004173278A (ja) 送信ノード、受信ノードおよびネットワ−クシステム
Alam et al. Routing in modular fault-tolerant multiprocessor systems
CN105141445A (zh) 一种实现高可用集群系统中多流量组多备份的方法及装置