JPH07200508A - ノード間結合方式 - Google Patents

ノード間結合方式

Info

Publication number
JPH07200508A
JPH07200508A JP5349337A JP34933793A JPH07200508A JP H07200508 A JPH07200508 A JP H07200508A JP 5349337 A JP5349337 A JP 5349337A JP 34933793 A JP34933793 A JP 34933793A JP H07200508 A JPH07200508 A JP H07200508A
Authority
JP
Japan
Prior art keywords
node
type
nodes
mesh
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5349337A
Other languages
English (en)
Inventor
Noboru Tanabe
昇 田邊
Shinichi Sugano
伸一 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GIJUTSU KENKYU KUMIAI SHINJIYOUHOU SHIYORI KAIHATSU KIKO
Toshiba Corp
Original Assignee
GIJUTSU KENKYU KUMIAI SHINJIYOUHOU SHIYORI KAIHATSU KIKO
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GIJUTSU KENKYU KUMIAI SHINJIYOUHOU SHIYORI KAIHATSU KIKO, Toshiba Corp filed Critical GIJUTSU KENKYU KUMIAI SHINJIYOUHOU SHIYORI KAIHATSU KIKO
Priority to JP5349337A priority Critical patent/JPH07200508A/ja
Publication of JPH07200508A publication Critical patent/JPH07200508A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】本発明は、種々の制約及び課題を同時に解決す
る、超並列計算機向け結合トポロジーを与えることので
きる結合方式を提供することを目的とする。 【構成】n次元メッシュ状にリンクで接続された第1の
種類のノード(要素プロセッサ)(00、01、02・
・・)に対し、ある次元に関して第2の種類のノード
(クロスバースイッチまたは代替プロセッサ付きのクロ
スバースイッチまたは代替プロセッサ)(S0、S1、
S2、S3)を接続する。その次元を適当な自然数で座
標値を割った余りなどでグループ化を施す。代替プロセ
ッサ間は(n−1)次元メッシュで接続する。第2の種
類のノードを導入する次元を基板などの実装上の階層に
対応つける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、典型的には超並列計算
機のプロセッサ間結合網、さらにはスーパーコンピュー
タやワークステーションなどのコンピュータ間にハブス
イッチなどを併用して構築される高帯域ローカルエリア
ネットワーク(LAN)や高帯域ワイドエリアネットワ
ーク(WAN)を用いたヘテロジニアスな分散計算シス
テムやワークステーションクラスタなどのように、複数
のノードから構成されるシステムにおけるノード間の結
合方式に関する。
【0002】
【従来の技術】多数のノードから構成されるシステムの
典型的なシステム例である超並列計算機の相互結合網向
けの結合トポロジーとしては、多次元メッシュ、多次元
トーラス(k-ary n-cube)、binary n-cube 、base-m n-c
ube など、これまでに様々な結合トポロジーが提案され
ている。
【0003】並列計算機に用いられる場合には、2次元
メッシュ状の通信を伴う並列アルゴリズムが数多く存在
することから、2次元メッシュの効率的なエミュレーシ
ョンが行えることが望まれるために、上記に掲げたトポ
ロジーをベースとした結合網が有望視されており、数々
の商用超並列計算機や実験用超並列計算機に用いられて
いる。
【0004】また、超並列計算機のアプリケーションの
中には、必ずしも通信パターンが規則的でなかったり、
全対全通信が発生したりするようなアプリケーションが
存在するために、二分割バンド幅や直径やランダム通信
性能も軽視できない。
【0005】特に、実際に超並列計算機の相互結合網へ
の適用を行う際には、トポロジー的な意味からの直径の
短さ、二分割時の越境リンク本数や、2次元メッシュエ
ミュレーション時の中継回数、リンクの多重使用度だけ
でなく、実装される通信リンク当たりのバンド幅や、そ
れにより変動する通信遅延時間が重要となる。
【0006】例えば、binary n-cube は同じ通信リンク
バンド幅が実装可能とすれば、2次元メッシュエミュレ
ーションやランダム通信性能が良好であるが、実際に
は、LSIや基板間配線におけるピンネックによりノー
ド数の割には次数の大きくなりがちで、遠距離配線が多
数存在するbinary n-cubeは他の結合トポロジーに比較
して同じ通信リンクバンド幅の実装が困難であり、実質
的には高い性能の結合網が構築しにくい。
【0007】これに対し、base-m n-cube は、m×mク
ロスバスイッチを介してbinary n-cube における隣接ノ
ードを包含する多数のノードと隣接し、ビット幅をある
程度大きく設定した通信リンクの実装が可能となってお
り、2次元メッシュやbinaryn-cube のエミュレーショ
ンや、ランダム通信性能が実質的にはbinary n-cubeよ
り大幅に良好である。
【0008】しかし、base-m n-cube において、ノード
数を多くしていくためには、クロスバスイッチのポート
数mを大きくする(LSIのピンネックを誘発する)
か、次数nを大きくする(基板間配線数を増加させる)
必要があり、実装の観点から通信リンクのビット幅をあ
る程度大きく保ったままノード数を自由に増やすことは
困難である。
【0009】また、binary n-cube と同様base-m n-cub
e も本質的に遠距離な通信リンクを含むので、基板間配
線にケーブルの多用しない実装方法が取りにくいため
に、メッシュやトーラスに比較してバンド幅当たりの通
信リンクの実装コストが高くつくという欠点があった。
【0010】さらに、例えばbase-m 2-cube の各ノード
における隣接ノードは、m×mの2次元トーラスの隣接
ノードを完全に包含するが、2次元トーラスの各ノード
の次数が4であるのに対し、base-m 2-cube の次数はそ
の半分の2であるために、base-m 2-cube 2次元トーラ
スのエミュレーション時の通信リンクバンド幅は実質的
には半分になってしまうという欠点があった。
【0011】一方、単純な2次元メッシュや2次元トー
ラスは、実装の観点からはプロセッサ数によらず次数が
一定であり、配線も実装イメージにおいて遠隔配線を排
除することが可能であり、2次元メッシュ状の通信を伴
うアプリケーションにおける性能は申し分ない。
【0012】しかし、数千台以上の超並列計算機におい
ては、ウォームホールルーティングやバーチャルカット
スルールーティングなどの中継ノードをバイパスするよ
うなルーティングアルゴリズムを用いたとしても、直径
の大きさや二分割バンド幅の少なさが目立ち、ランダム
通信性能において、顕著な性能低下をきたすという欠点
があった。2次元メッシュでは、2次元トーラス以上に
その傾向が強い。
【0013】このような観点から数千台以上の超並列計
算機においては3次元メッシュまたは3次元トーラスが
望ましく、3次元実装を仮定すれば、2次元トーラスに
おける通信リンクと同等のバンド幅を持った通信リンク
の実装が可能であり、依然として直径は、binary n-cub
e やbase-m n-cu beと比較すると大きくなってしまうも
のの、直径の大きさや二分割バンド幅が2次元のものに
比べて大幅に改善され、ランダム通信性能も良好であ
る。
【0014】しかし、3次元メッシュや3次元トーラス
において、上記の改善を高めるためには、なるべく立方
体に近いような構成にすることが望ましいが、このこと
は良好にエミュレーションできる2次元メッシュの縦横
比をいびつなものとしてしまうという欠点があった。例
えば、16×16×16の3次元トーラス中に中継なし
に埋め込める2次元メッシュは、256×16の構成と
なってしまい、64×64の2次元メッシュを実質バン
ド幅の低下なしに埋め込むことは不可能であった。
【0015】また、トーラスやメッシュの場合、binary
n-cube やbase-m n-cube と異なり、FFTなどのアプ
リケーションで発生する一斉等間隔通信時には、特に、
間隔が大きな通信フェーズにおいて、同じ物理通信リン
クを複数のノード間通信が共有してしまうために実質的
な通信バンド幅が低下するという欠点があった。
【0016】上記のような実質的な通信バンド幅の細り
は、メッシュやトーラスにおける故障リンク通過回避に
おける迂回ルーティング時や、代替ノードへの迂回ルー
ティング時においても発生する。この問題は、単に代替
ノードを設けたり、仮想チャネルを増やしてデッドロッ
クフリーを保証しつつ健全なリンクを故障ノードの迂回
経路と兼用するだけでは回避できない。
【0017】特に、迂回箇所における局所的なバンド幅
の低下は、例えば文献JSPP’93「マルチパラダイ
ム超並列TFLOPSマシンにおける並列処理〜プロセ
ッサ間チェイニングとその応用」で示されている通信リ
ンクのバンド幅によって性能が規定される密行列乗算な
どのウェーブフロントアレイ動作においては、全体の性
能低下に直結してしまうので、故障ノードや故障リンク
の存在を前提としなければならない極めて多数のノード
からなるウェーブフロントアレイ動作可能な超並列計算
機においては、このような問題を回避する意義が大き
い。
【0018】2次元メッシュにおける故障回避時の性能
低下を避ける方法として従来は、主にウェーファスケー
ルインテグレーションでの実現を前提として、文献:電
子情報通信学会論文誌Vol.J76-D-I,No.11 「シストリッ
クアレイのフォールトトレランス化の検討」などで示さ
れているように1行1列分の代替プロセッサと、プロセ
ッサに上下左右のほかに斜めのリンクやプロセッサを飛
び越えるリンクを追加したりし、プロセッサアレイの中
に小規模なスイッチボックスを大量にばらまいておき、
これらのスイッチボックスの結合パターンを切り替える
という方式がいくつか提案されている。
【0019】しかし、これらの方式は、一枚のウェーフ
ァでの実現に適するものであり、大容量のローカルメモ
リが必要なために複数のLSIを搭載した基板を大量に
用いて構成されるべき汎用超並列計算機においては、ハ
ードウェア量はスイッチのクロスポイント数よりはチッ
プ数のほうが重要で、チップ数の観点から大量のスイッ
チボックスをばらまくことは必ずしも得策ではない。
【0020】また、従来の方法は、再構成を行うために
はかなり複雑なアルゴリズムに従ってスイッチの静的な
設定状態を計算しなければならない。このため、数万台
のノードからなるような大規模システムに適用するため
には、計算時間の観点から問題がある。その上、2次元
メッシュを対象としているので、容易には3次元メッシ
ュなどの次元数の多い結合への適用はできない。
【0021】数万台のノードからなるような超並列計算
機では、ウェーファスケールインテグレーションの場合
と異なり、全て良品というチェックを受けた部品を用い
て作られるので、故障発生率を比較的低めにすることは
できるが、数万台を全て故障無しの状態にするには故障
発生率を少なくとも0.01%以下にする必要があり、
かなり困難である。ゆえに、故障ノードの存在を許容で
きなければ、数万台の超並列計算機を安定的に動作させ
ることは現実的でなくなってしまう。
【0022】このように、汎用システムとして用いるた
めには、2次元メッシュ結合では、直径やランダム通信
性能の観点から無理があることから汎用システムとはな
りえず、従来法が3次元メッシュなどの次元数の多い結
合への故障回避法の適用が困難であることは、数万台規
模のウェーブフロントアレイシステムと汎用超並列計算
機がこのままでは両立しないことを意味する。
【0023】さらに、ウェーファスケールインテグレー
ション用の故障回避方式をそのまま基板を大量に用いた
構成に適用してしまうと、大量の基板間配線の増加を伴
うために実装不可能であったり、コストの増加を引き起
こしたり、基板内配線より信頼性の低い基板間配線のた
めに逆に信頼性が低下してしまう可能性もある。
【0024】また、これらの従来のフォールトトレラン
ト法は、結合網の直径の低下にはほとんど寄与しない。
【0025】
【発明が解決しようとする課題】以上のように従来の超
並列計算機向け結合トポロジーでは、高い実装容易性と
それに基づく高いノード数拡張性と高い通信リンクバン
ド幅および高い二分割バンド幅、短い直径、高いランダ
ム通信性能、ノード数の平方根に近い個数を一辺とする
2次元メッシュの効率的な埋め込み、一斉等間隔通信時
の実質通信バンド幅低下の防止、少ないチップ数での故
障ノードや故障通信リンク回避時の局所的通信バンド幅
低下の防止、故障回避のための配線による基板間配線の
増加とそれによる信頼性の低下の防止、汎用な数万ノー
ドシステムに適した3次元以上の多次元結合網への故障
回避の容易な拡張性といった複雑に絡み合った上記の全
ての制約と課題を同時に解決させることが困難であっ
た。
【0026】本発明は、以上のような数多くの課題を同
時に解決する結合トポロジーを与えることを目的とす
る。
【0027】
【課題を解決するための手段】第1の発明では、n(n
は自然数)次元の座標によりアドレスされるn次元メッ
シュまたはn次元トーラス状にリンクで接続された第1
の種類のノードのアレイに対し、1以上の次元に関して
各々1次元分の座標値が異なる2個以上の第1の種類の
ノード間を第2の種類のノードにより接続する。
【0028】第2の発明では、第1の発明の結合方式に
おいて、第2の種類のノードをクロスバースイッチとす
る。
【0029】第3の発明では、第1の発明の結合方式に
おいて、第1の種類のノードを1以上の次元に関して各
々1次元分の座標値だけが異なるノードをi(iは2以
上の自然数)個のグループに分け、このグループ内を共
通の第2の種類のノードで結合する。
【0030】第4の発明では、第3の発明の結合方式に
おいて、第1の種類のノードを1以上の次元に関して各
々1次元分の座標値だけが異なるノードをその座標値を
k(kは2以上の自然数)進表示した数の全桁または一
部の桁を次元ごとに異なる値をとることができるi(i
は2以上の自然数)で割った余りを共通にするi個のグ
ループに分け、このグループ内を共通の第2の種類のノ
ードで結合する。
【0031】第5の発明では、第1の発明の結合方式に
おいて、第2の種類のノードを第1の種類のノードが故
障した場合の代替ノードとする。
【0032】第6の発明では、第1の発明の結合方式に
おいて、第2の種類のノードに第1の種類のノードが故
障した場合の代替ノードを接続する。
【0033】第7の発明では、第6の発明の結合方式に
おいて、ある1次元分の座標が異なる第1の種類のノー
ド間を接続する1個以上の第2の種類のノードを第1の
種類のノードが故障した場合の代替ノードに接続する。
【0034】第8の発明では、第6の発明の結合方式に
おいて、代替ノード間に別途に結合手段を設ける。
【0035】第9の発明では、第8の発明の結合方式に
おいて、代替ノード間に別途に設ける結合手段を少なく
ともメッシュまたはトーラス結合を包含するものとす
る。
【0036】第10の発明では、第1の発明の結合方式
において、第2の種類のノードを用いて接続する次元を
実装状態における緊密に結合しやすい階層、望ましくは
基板やシャーシに対応付けて選択する。
【0037】
【作用】第1の発明では、まずn(nは自然数)次元の
座標によりアドレスされるn次元メッシュまたはn次元
トーラス状にリンクで第1の種類のノードが接続される
ので、このn次元メッシュ状リンクのうちノード当たり
4本を用いることによって、リンクn=1の場合を除
き、2次元メッシュを通信リンクの実質的なバンド幅低
下なしに埋め込むことが可能である。しかし、これだけ
ではn次元メッシュの欠点である、大きな直径、ノード
数の平方根に近い個数を一辺とする2次元メッシュの効
率的な埋め込み、故障ノードや故障通信リンク回避時の
局所的通信バンド幅低下、一斉等間隔通信時の実質通信
バンド幅低下という問題点が残されている。
【0038】そこで、第1の発明では、1以上の次元に
関して各々1次元分の座標値が異なる2個以上の第1の
種類のノード間を第2の種類のノードにより接続してい
るので、従来からあるメッシュ状のリンクを1つずつ通
って行かねば到達しえなかったノードに対して第2の種
類のノードを経由することによって多くの場合ノード間
の距離が短縮し、直径が短縮する。
【0039】また、第2の種類のノードを経由すること
によって容易に到達することができるようになったノー
ドの数が増加したために、結合トポロジーの埋め込み性
能が向上し、例えばn=3の場合に1つの次元に関して
座標値が異なる2個以上の第1の種類のノード間を第2
の種類のノードにより接続するだけでもノード数の平方
根に近い個数を一辺とする2次元メッシュの効率的な埋
め込みが容易になる。
【0040】第2の発明では第2の種類のノードをクロ
スバースイッチとしているので、第2の種類のノードに
接続される全ての第1の種類のノードへ距離1で到達で
きるので、より直径の短縮効果と結合トポロジーの埋め
込み性能とランダム通信性能の向上が顕著となる。
【0041】第3の発明では、第1の発明の結合方式に
おいて、第1の種類のノードを1以上の次元に関して各
々1次元分の座標値だけが異なるノードをi(iは2以
上の自然数)個のグループに分け、このグループ内を共
通の第2の種類のノードで結合するので、第2の種類の
ノードに具備できるリンク数に限りがあっても、グルー
プ間の移動をメッシュやトーラスを使って行い、グルー
プ内の移動を第2の種類のノードを経由して行える。よ
って、例えばbase-m n-cube において顕著に見られたク
ロスバスイッチのポート数で1つの次元方向に実装でき
るノード数が限定されてしまうという問題が回避できる
ようになる。
【0042】第4の発明では、第3の発明の結合方式に
おいて、第1の種類のノードを1以上の次元に関して各
々1次元分の座標値だけが異なるノードをその座標値を
k(kは2以上の自然数)進表示した数の全桁または一
部の桁を次元ごとに異なる値をとることができるi(i
は2以上の自然数)で割った余りを共通にするi個のグ
ループに分け、このグループ内を共通の第2の種類のノ
ードで結合する。
【0043】例えばi=2とし、ある1つの次元分の座
標値の全桁に対する剰余でグループ分けすれば、1つの
次元分の座標値に関して偶数のグループと奇数のグルー
プに分類される。偶数のグループ内は互いに共通の第2
のノードを介して距離1で到達でき、奇数のグループ内
は互いに共通の第2のノードを介して距離1で到達で
き、グループ間の移動はメッシュまたはトーラスのリン
クを用いて距離1で移動できるので、この次元方向の直
径は2となる。
【0044】i、kおよび剰余を計算する桁の位置を様
々に変えることによって、様々なノード数や各次元方向
のノード数や第2のノードのリンク数に対応することが
可能である。
【0045】上記の例のように適切にこれらの値を選択
すれば、FFTの実行時などで表れる一列に並べた時に
2のj(jは0以上の整数)乗の距離にあるノード間で
の一斉等方通信が、全て距離1で可能となるように設定
できる。
【0046】また、上記の例のように適切にこれらの値
を選択し、第2の種類のノードで結合した次元に直行す
る2次元メッシュ平面間を第2の種類のノードかメッシ
ュ状リンクにより隣接するように並べれば、ノード数の
平方根に近い個数を一辺とする2次元メッシュを実質バ
ンド幅の低下なしに埋め込むことが可能となる。
【0047】第5の発明では、第1の発明の結合方式に
おいて、第2の種類のノードを第1の種類のノードが故
障した場合の代替ノードとするので、第2の種類のノー
ドが接続する第1の種類のノードの内で1つが故障して
も、この故障ノードを第2の種類のノードで代替が可能
であり、第2の種類のノードは故障ノードの隣接ノード
とも近い位置に存在することができるので、故障回避に
伴う実質的な通信バンド幅の低下を排除または軽減する
ことが可能となる。
【0048】第6の発明では、第1の発明の結合方式に
おいて、第2の種類のノードに第1の種類のノードが故
障した場合の代替ノードを接続するので、第5の発明と
同様に第2の種類のノードが接続する第1の種類のノー
ドの内で1つが故障しても、この故障ノードを第2の種
類のノードに接続された代替ノードで代替が可能であ
り、第2の種類のノードは故障ノードの隣接ノードとも
近い位置に存在することができるので、故障回避に伴う
実質的な通信バンド幅の低下を排除または軽減すること
が可能となる。
【0049】第7の発明では、第6の発明の結合方式に
おいて、ある1次元分の座標が異なる第1の種類のノー
ド間を接続する1個以上の第2の種類のノードを第1の
種類のノードが故障した場合の代替ノードに接続するの
で、ある1次元分が複数のグループに分けられ、複数の
第2の種類のノードに分かれて接続されている場合に
も、代替ノードを省略することができ、故障回避に伴う
実質的な通信バンド幅の低下を排除または軽減すること
が可能である。
【0050】第8の発明を適用した場合は、第2の種類
のノードを用いて接続する次元を1つだけにしたとして
も、故障ノードの隣接ノードは自分が接続している代替
ノードを中継ノードとして、そこから代替ノード間結合
網によって故障ノードを代替している代替ノードに到達
できる。つまり、故障プロセッサの代替に伴う迂回路が
ベースとなるメッシュまたはトーラス結合網から追い出
され、故障回避による健全なノード間通信への悪影響を
抑えることができる。
【0051】第8の発明の結合方式において、第2の種
類のノードを用いて接続する次元を1つだけにしたとし
ても、故障回避における問題点はほぼ完全に解消するた
めに適切な代替ノード間結合網は第9の発明を適用して
メッシュまたはトーラス結合網とすることが望ましい。
【0052】なぜなら故障ノードと接続されていたノー
ドはメッシュまたはトーラス結合網における隣接ノード
であり、これらは故障ノードの接続した第1の代替ノー
ドと通信する必要があるため、一度、この隣接ノードが
接続されている第2の代替ノードを経由したとき、第1
の代替ノードと第2の代替ノードが隣接の関係にあるた
めには、代替ノード同士も第1のノードと同様にメッシ
ュまたはトーラス結合網であれば良い。このように故障
ノードの隣接ノードから代替ノードへの距離は2とする
ことが可能であり、故障回避によるバンド幅の細りは回
避できる。
【0053】第10の発明では、第1の発明の結合方式
において、第2の種類のノードを用いて接続する次元を
実装状態における緊密に結合しやすい階層、望ましくは
基板やシャーシに対応付けて選択するので、第2の種類
のノードの導入によって純粋なメッシュやトーラスに追
加された配線量の増加と、メッシュやトーラスでは隣接
しない遠隔ノードとの間の配線が同一基板上に実装され
ることにより、配線の困難さが軽減され、基板間をまた
がるメッシュやトーラスのリンクと同程度のバンド幅を
持った通信リンクを実装することが容易となる。
【0054】特に、第8の発明を適用した場合は、代替
ノード間結合網を適切に選択すれば、故障回避における
問題点はほぼ完全に解消されるので、実装しやすい階層
でのみ第2の種類のノードを用いて接続することの有効
性は高い。
【0055】
【実施例】以下、図面を参照しながら実施例を説明す
る。
【0056】第1の発明の実施例 第1の発明では、まずn(nは自然数)次元の座標によ
りアドレスされるn次元メッシュまたはn次元トーラス
状にリンクで第1の種類のノードが接続されるので、こ
のn次元メッシュ状リンクの内、ノード当たり4本を用
いることによって、リンクn=1の場合を除き、2次元
メッシュを通信リンクの実質的なバンド幅低下なしに埋
め込むことが可能である。
【0057】さらに、1以上の次元に関して各々1次元
分の座標値が異なる2個以上の第1の種類のノード間を
第2の種類のノードにより接続しているので、従来から
あるメッシュ状のリンクを一つずつ通って行かねば到達
しえなかったノードに対して第2の種類のノードを経由
することによって多くの場合ノード間の距離が短縮し、
直径が短縮する。
【0058】また、第2の種類のノードを経由すること
によって容易に到達することができるようになったノー
ドの数が増加したために、結合トポロジーの埋め込み性
能が向上し、例えばn=3の場合に1つの次元に関して
座標値が異なる2個以上の第1の種類のノード間を第2
の種類のノードにより接続するだけでもノード数の平方
根に近い個数を一辺とする2次元メッシュの効率的な埋
め込みが容易になる。
【0059】上記第1の発明によると、直径の短縮、ラ
ンダム通信性能の向上、他の結合トポロジーの埋め込み
能力の向上、一斉等間隔通信時の実質通信バンド幅低下
防止という効果がある。
【0060】図1は、第1の発明にかかる結合方式の実
施例を示しており、この図1における中に二桁の数字の
書かれた丸印は第1の種類のノードを表す。第1の種類
のノードは、例えば超並列計算機の要素プロセッサであ
ったり、1台のワークステーションであれば、この図1
はワークステーションクラスタの接続形態を示すものと
言える。
【0061】第1の種類のノードは、x、yの2次元座
標でアドレスすることができる2次元メッシュ状にリン
クにより結合される。図1における中に二桁の数字は左
がx座標、右がy座標を意味する。本実施例では、x方
向もy方向もサイズが4のものを示しているが、必ずし
も各方向のサイズが等しくなくても良い。
【0062】本実施例では、y方向に第2の種類のノー
ドによる接続を導入したものを示すが、x方向、y方向
とも第2の種類のノードによる接続を導入してもよい。
1つの第2の種類のノードS0は、第1の種類のノード
の集合{ノード00、ノード01、ノード02、ノード
03}のようにy座標のみ異なる第1の種類のノードと
接続される。
【0063】以上のように結合された場合、メッシュの
結合のみでは、例えばノード00からノード03に到達
するためには、ノード00→ノード01→ノード02→
ノード03のように中継されなければならないが、第2
の種類のノードを導入した場合は、ノード00→S0→
ノード03のように転送されるので、距離が短くなる。
このように本発明を適用すれば、結合網の直径を短縮す
ることができる。
【0064】また、例えばノード00とノード01を直
接接続するリンクが故障などで使用できなくなった場合
でもノード00→S0→ノード03のように転送できる
ので、耐故障性が向上する。
【0065】また、y方向のメッシュを構成するリンク
がある場合とない場合では、第2の種類のノードを通過
するのに何らかのオーバーヘッドがかかる場合は、y方
向のメッシュのみで直接到達できるノード間の移動はy
方向のメッシュを用いた方が短時間で移動できる。ま
た、y方向のメッシュがない場合は、y方向の移動が全
て第2の種類のノードに集中するので、2次元メッシュ
のエミュレーションを行うとy方向のメッシュがある場
合の半分のバンド幅しか実質的には得られないが、2次
元メッシュ状の通信が必要な場合は、y方向のリンクを
そのまま使用したほうが性能がよい。
【0066】図2は、第1の発明にかかる実施例の第1
変形例の結合方式を示しており、この図2のようにベー
スとなっていたメッシュをトーラスにしてもよい。特
に、第2の種類のノードにより接続を行わない次元に関
しては、直径の短縮効果が大きい。実装が困難な方向に
はメッシュで、実装が容易な方向にはトーラスにすると
いうように次元によりメッシュとトーラスを使い分けて
もよい。
【0067】また、図3は、第1の発明にかかる実施例
の第2変形例の結合方式を示しており、この第2変形例
のように、第2の種類のノードが導入されている次元に
関しては全てまたは一部のメッシュを構成するリンクを
省略しても良い。ただし、リンクを省略すれば、ハード
ウェア量は減るが、第1の種類のノードと第2の種類の
ノードとを接続するリンクに対する耐故障性や2次元メ
ッシュ状通信時のバンド幅が減る。
【0068】第2の発明の実施例 第2の発明にかかる実施例では、第1の発明の構成の要
素に加え、第2の種類のノードをクロスバースイッチと
しているので、第2の種類のノードに接続される全ての
第1の種類のノードへ距離1で到達できる。
【0069】この第2実施例によると、直径の短縮効果
と結合トポロジーの埋め込み性能とランダム通信性能の
向上が顕著となる。
【0070】図4は、第2の発明にかかる実施例の結合
方式を示した図である。この第2実施例が図1の第1実
施例と異なる点は、第2の種類のノードS0、S1、S
2、S3をクロスバースイッチと規定している点であ
る。図5はクロスバースイッチの構成の例を示す図であ
る。
【0071】第1の種類のノードがプロセッサであると
すれば、プロセッサ間の通信を行う場合は、プロセッサ
からの制御信号またはプロセッサからクロスバースイッ
チの入力ポートから入力制御部に入力されるメッセージ
データに含まれるルーティング制御情報に基づきクロス
バースイッチは自身の接続パターンを切り替える。出力
先の競合はクロスバースイッチ内部の、例えば出力制御
部などにある調停回路によって調停がなされる。
【0072】このように第2の種類のノードがクロスバ
ースイッチとなっているので、短時間の切り換え時間の
後には、接続しているノード間の通信が出力先が競合し
ないかぎり、自由な組み合わせで同時に実行できる。例
えば、ストア&フォワードルーティングアルゴリズムに
よっている場合のように、メッシュの隣接ノード間の通
過時間に比べてクロスバースイッチの通過遅延時間は十
分短いと見なせる場合には、メッシュのみではy方向は
直径3だが、第2の発明のようにy方向にクロスバース
イッチを導入した場合のy方向の直径は1とみなすこと
ができる。
【0073】上記第2の発明の実施例の変形例としてク
ロスバースイッチの代わりに多段結合網を用いてもよ
い。この場合は、第2の種類のノードの通過時間が増加
したり、結合トポロジーの埋め込み性能とランダム通信
性能が低下するが、ハードウェア量(クロスポイント
数)が削減される。
【0074】第3の発明の実施例 第3の発明では、第1の発明の結合方式において、第1
の種類のノードを1以上の次元に関して各々1次元分の
座標値だけが異なるノードをi(iは2以上の自然数)
個のグループに分け、このグループ内を共通の第2の種
類のノードで結合する。
【0075】よって、第2の種類のノードに具備できる
リンク数に限りがあっても、グループ間の移動をメッシ
ュやトーラスを使って行い、グループ内の移動を第2の
種類のノードを経由して行える。
【0076】例えば、base-m n-cube において顕著に見
られたクロスバスイッチのポート数で1つの次元方向に
実装できるノード数が限定されてしまうという問題が回
避できるようになる。
【0077】図6は、第3の発明にかかる結合方式の実
施例を示した図である。この本実施例では、y方向に8
つ、そしてx方向に4つの第1の種類のノードがメッシ
ュ状に配置されており、y方向に次数4の第2の種類の
ノードを用いて接続する。y方向は8ノード並んでいる
ので、例えばbase-m n-cube の場合は、第2の種類のノ
ードとして次数8のクロスバースイッチがなければ、y
方向を8とすることはできないが、本発明を適用すれ
ば、y方向をy座標が0から3までのグループaと4か
ら7までのグループbに分け、例えばノードのグループ
{ノード00、ノード01、ノード02、ノード03}
を第2の種類のノードS0aと接続し、ノードのグルー
プ{ノード04、ノード05、ノード06、ノード0
7}を第2の種類のノードS0bと接続することにより
y方向を8とすることができる。
【0078】このようにすると、グループ内では、第2
の種類のノードを用いて距離1で移動でき、グループ間
の移動は、例えばノード03とノード04の間を接続す
るメッシュのリンクにより移動ができる。本実施例の構
成では、y方向はグループ内2回とグループ間1回で移
動でき、例えばノード01→ノード07の移動の場合が
最も遠く、よってy方向の直径は3である。
【0079】図7は、第3の発明にかかる実施例の変形
例の結合方式を示している。この変形例によると、グル
ープaを接続する第2の種類のノード間にリンクがあっ
てもよい。その場合は第2の種類のノードが持つべきリ
ンクが1つ増えるがy方向の直径が2となり、直径が短
縮される。
【0080】第4の発明の実施例 第4の発明では、第3の発明の結合方式において、第1
の種類のノードを1以上の次元に関して各々1次元分の
座標値だけが異なるノードをその座標値をk(kは2以
上の自然数)進表示した数の全桁または一部の桁を次元
ごとに異なる値をとることができるi(iは2以上の自
然数)で割った余りを共通にするi個のグループに分
け、このグループ内を共通の第2の種類のノードで結合
する。
【0081】i,kおよび剰余を計算する桁の位置を様
々に変えることによって、様々なノード数や各次元方向
のノード数や第2のノードのリンク数に対応することが
可能である。
【0082】適切にこれらの値を選択すれば、FFTの
実行時などで表れる一列に並べた時に2のj(jは0以
上の整数)乗の距離にあるノード間での一斉等方通信
が、全て距離1で可能となるように設定できる。
【0083】また、上記の例のように適切にこれらの値
を選択し、第2の種類のノードで結合した次元に直行す
る2次元メッシュ平面間を第2の種類のノードかメッシ
ュ状リンクにより隣接するように並べれば、ノード数の
平方根に近い個数を一辺とする2次元メッシュを実質バ
ンド幅の低下なしに埋め込むことが可能となる。
【0084】上記第4の発明によると、様々なノード数
や各次元方向のノード数や第2のノードのリンク数に対
応することが可能となり、一斉等間隔通信時の実質通信
バンド幅低下の防止が可能となり、ノード数の平方根に
近い個数を一辺とする2次元メッシュを実質バンド幅の
低下なしに埋め込むことが可能となるように構成を決め
ることができる。
【0085】図8は、第4の発明にかかる実施例の結合
方式を示した図である。本実施例では、y方向に8つ、
そしてx方向に4つの第1の種類のノードがメッシュ状
に配置されており、y方向に次数4の第2の種類のノー
ドを用いて接続する。本実施例では、y方向のグループ
分けに第4の発明で規定される規則の1つを用いてい
る。具体的には、y座標を任意のk進数で表した数の全
桁(つまり、y座標そのもの)をi=2で割ったときの
剰余が0(つまり偶数)のグループと1(つまり奇数)
のグループに分け、グループ内を同一の第2の種類のノ
ードで接続している。
【0086】この場合、i=2なので、メッシュにおけ
る隣のノードは常に別のグループに属することになる。
また、グループ内は第2の種類のノードを経由すること
で距離1で移動できる。よって、本実施例のy方向の直
径は2である。
【0087】図7に示された例でも、y方向の直径は同
じく2であるが、図7の場合は、もし例えばノード00
→ノード04、ノード01→ノード05、ノード02→
ノード06、ノード03→ノード07、というようなF
FTなどで頻繁に表れる等方一斉通信が起こった場合
は、S0aとS0bの間のリンクがネックとなり、実質
通信バンド幅が低下してしまうことに対し、本実施例の
場合は、全て同一のグループ間通信で行われるので、上
記のような問題を回避または軽減できる。例えばノード
00→ノード05、ノード01→ノード06、ノード0
2→ノード07、ノード03→ノード00、というよう
なグループを必ずまたがるような通信を同時に行ったと
してもノード00→ノード01→(S0b)→ノード0
5、ノード01→ノード02→(S0a)→ノード0
6、ノード02→ノード03→(S0b)→ノード0
7、ノード03→ノード04→(S0a)→ノード0
0、というように全ての通信が別のリンクを用いて通信
することが可能となり、リンクの利用効率が高まる。
【0088】図9は、図8の結合を8枚分をメッシュ結
合して3次元メッシュにy方向のみに第2の種類のノー
ドを導入した実施例を示している。つまり、x方向4
つ、y方向8つ、そしてz方向8つの3次元メッシュに
おいて、y方向にy座標で偶数グループと奇数グループ
がグループ内で第2の種類のノードによって接続されて
いることになる。
【0089】図10は、図9の結合の中に16×16の
2次元メッシュを全て隣接リンクのみによって埋め込む
例を示している。xz平面で図9の結合を切ると、8枚
の4×8構成のサブ2次元メッシュができ、これらを図
10に示すように並べると、サブ2次元メッシュの境界
部にあるノードは、例えばノード307とノード31
7、ノード307とノード327、ノード327とノー
ド337、ノード337とノード317の同士が、y方
向の座標のみが1つ異なる、または同じグループに属す
る(互いに奇数、または互いに偶数である)ために隣接
ノードとなっている。よって、中継なしの16×16の
2次元メッシュ埋め込みができている。
【0090】図11は、第4の発明にかかる結合方式の
座標値をk進数表示した座標値の一部の桁を用いてグル
ープ分けを行う実施例を示している。本実施例では、y
方向に8つ、そしてx方向に4つの第1の種類のノード
がメッシュ状(x方向)およびトーラス状(y方向)に
配置されており、y方向に次数4の第2の種類のノード
を用いて接続されている。
【0091】本実施例では、y方向のグループ分けに第
4の発明で規定される規則の1つを用いている。具体的
には、y座標を任意の2進数で表した数の最下位ビット
を除く2ビットをi=2で割ったときの剰余が0(つま
り偶数)のグループaと1(つまり、奇数)のグループ
bに分け、グループ内を同一の第2の種類のノードで接
続している。具体的には、ノード00はy=0を2進表
示すると、000であり、上位2ビットが00なので、
グループa、ノード01はy=1を2進表示すると、0
01であり、上位2ビットが00なので、グループa、
ノード02は、y=2を2進表示すると、010であ
り、上位2ビットが01なので、グループb、ノード0
3はy=3を2進表示すると、011であり、上位2ビ
ットが01なので、グループb、ノード04はy=4を
2進表示すると、100であり、上位2ビットが10な
ので、グループa、ノード05はy=5を2進表示する
と、101であり、上位2ビットが10なのでグループ
a、ノード06はy=6を2進表示すると、110であ
り、上位2ビットが11なので、グループb、ノード0
7はy=7を2進表示すると、111であり、上位2ビ
ットが11なので、グループbに属することになる。
【0092】このように接続されると、y方向の直径は
2であり、必ず隣接ノードは、片方がグループaで、他
の片方がグループbとなる。両隣がそれぞれ同じグルー
プにならないことは、ノードの故障時の代替の際にメリ
ットがあるが、これについては第7の発明の説明の際に
詳しく説明する。
【0093】第5の発明の実施例 第5の発明では、第1の発明の結合方式において、第2
の種類のノードを第1の種類のノードが故障した場合の
代替ノードとするので、第2の種類のノードが接続する
第1の種類のノードの内で1つが故障しても、この故障
ノードを第2の種類のノードで代替が可能であり、第2
の種類のノードは故障ノードの隣接ノードとも近い位置
に存在することができる。
【0094】この実施例によると、故障回避に伴う実質
的な通信バンド幅の低下を排除または軽減することが可
能となる。
【0095】図12は、第5の発明にかかる実施例の結
合方式を示しれいる。本実施例では、第2の種類のノー
ドを第1の種類のノードと少なくとも同等な機能を持た
せることにより、第2の種類のノードが単純なクロスバ
ースイッチなどであった場合と同様に直径の短縮等の効
果があるとともに、例えばノード11自体が故障してし
まったとしてもその機能を代替ノードS1に行わせるこ
とにより、他の健全な第1の種類のノードが故障ノード
11の仕事と本来の自分の仕事をかけもちすることによ
る処理性能低下をある程度軽減できる。
【0096】故障ノード11は第2の種類のノード以外
ではノード01、ノード21、ノード10、ノード12
の4個の隣接ノードからのリンクが接続されているが、
代替ノードS1はこのうちの2個のノード(ノード1
0、ノード12)とも接続されており、代替に伴う距離
の増加はノード01、ノード21とのやりとりだけとい
うことになるので、性能低下を抑制することができる。
【0097】図13は、第5の発明にかかる実施例の変
形例の結合方式を示している。この変形例では、代替ノ
ード間にもリンクが設けられており、故障ノード11の
代替ノードS1と故障ノード11の隣接ノード01およ
びノード21とのやりとりは、例えばノード01→S0
→代替ノードS1のように接続できるので、第1の種類
のノードへの影響は排除される。
【0098】第6の発明の実施例 第6の発明では、第1の発明の結合方式において、第2
の種類のノードに第1の種類のノードが故障した場合の
代替ノードを接続するので、第5の発明と同様に第2の
種類のノードが接続する第1の種類のノードの内で1つ
が故障しても、この故障ノードを第2の種類のノードに
接続された代替ノードで代替が可能であり、第2の種類
のノードは故障ノードの隣接ノードとも近い位置に存在
することができる。
【0099】この実施例によると、故障回避に伴う実質
的な通信バンド幅の低下を排除または軽減することが可
能となる。
【0100】図14は、第6の発明にかかる実施例の結
合方式を示している。4×4構成の2次元メッシュ状に
第1の種類のノードを結合し、y方向に第2の種類のノ
ードS0,S1,S2,S3を導入してy座標のみ異な
るノード間を接続するとともに代替ノードP0,P1,
P2,P3を設け、S0とP0、S1とP1、S2とP
2、S3とP3の間を本実施例ではそれぞれ4本のリン
クで接続している。さらに、S0,S1,S2,S3の
間も互いに1次元メッシュ接続がなされている。
【0101】例えば、ノード11が故障した場合は、ノ
ード11が接続する第2の種類のノードS1に接続され
ている代替ノードP1が故障ノード11の機能の代行を
行う。よって、S1は単なるクロスバースイッチのよう
なスイッチボックスであってもよく、必ずしも第1の種
類のノード以上の機能を持たなければならないというこ
とはない。よって、第1の種類のノードの機能を第2の
種類のノードから取り去ることによって、例えばLSI
のゲート数やピン数の制約などから多くのリンクを第2
の種類のノードが持てるようになる場合は、第6の発明
を用いるよりは多くの第1の種類のノードを1つの第2
の種類のノードで接続できるようになる。
【0102】故障ノード11は、第2の種類のノード以
外ではノード01、ノード21、ノード10、ノード1
2の4個の隣接ノードからのリンクが接続されている
が、代替ノードS1はこのうちの2個のノード(ノード
10、ノード12)とも接続されており、ノード10、
ノード12と代替ノードP1とのやりとりはS1を介し
て行われる。ノード01とP1のやりとりはノード01
→S0→S1→代替ノードP1の経路で行われ、ノード
21とP1のやりとりはノード21→S2→S1→代替
ノードP1の経路で行われる。S1とP1の間には、4
本のリンクが設けられているので、代替によるバンド幅
の減少は回避されている。
【0103】上記第6の発明の実施例の変形例による
と、第2の種類のノード間のリンクが無かったり、第2
の種類のノードと代替ノードとの間のリンクの本数が4
本でない場合でも良いが、その場合はハードウェア量が
削減されるかわりに通信バンド幅は第2の種類のノード
が故障ノードの2つの隣接ノードと接続されていること
によるメリットは存在するが、バンド幅の細りは回避さ
れなくなる。
【0104】第7の発明の実施例 第7の発明では、第6の発明の結合方式において、ある
1次元分の座標が異なる第1の種類のノード間を接続す
る1個以上の第2の種類のノードを第1の種類のノード
が故障した場合の代替ノードに接続するので、ある1次
元分が複数のグループに分けられ、複数の第2の種類の
ノードに分かれて接続されている場合にも、代替ノード
を省略することができる。
【0105】上記実施例によると、代替ノードを適切な
個数に設定することができ、その上で故障回避に伴う実
質的な通信バンド幅の低下を排除または軽減することが
可能である。
【0106】図15は、第7の発明にかかる実施例の結
合方式を示している。本実施例は、基本的には図8の結
合からなり、第2の種類のノードS0a、S0bからそ
れぞれ2本ずつのリンクを出し、代替ノードP0と接続
し、以下同様にS1a、S1bからそれぞれ2本ずつの
リンクを出し、代替ノードP1と接続し、S2a、S2
bからそれぞれ2本ずつのリンクを出し、代替ノードP
2と接続し、S3a、S3bからそれぞれ2本ずつのリ
ンクを出し、代替ノードP3と接続する。
【0107】このような結合においては、同じx座標を
持つノードは全て一つの代替ノードと第2の種類のノー
ドを介して接続されており、代替ノードとの距離はy方
向のノード数が1つの第2の種類のノードの接続可能な
ノード数よりも多いにもかかわらず遠くなっていない。
また、第2の種類のノードごとに代替ノードを付加する
場合よりも少数の代替ノードで代替処理を行うことがで
きるため、故障率が低い場合はハードウェアコストが削
減されるというメリットがある。
【0108】本実施例においては、y方向の故障時の通
信バンド幅を確保しなければならない場合は、第2の種
類のノードと代替ノードとの間をそれぞれ2本ずつのリ
ンクで結合する必要がある。例えば、故障ノード11と
y方向で通信するはずだったノードはノード10とノー
ド12の2つがあり、これらは同一のグループに属し、
両方ともS1aに接続しているためである。一方、この
場合、S1bと代替ノードP1の間を接続している2本
のリンクは遊んでしまう。
【0109】このような問題を解決している例を以下に
示す。
【0110】図16は、第7の発明にかかる実施例にに
おける代替ノードとの間のリンクを節約した結合方式を
示している。本実施例は、基本的には図11の結合から
なり、第2の種類のノードS0a、S0bからそれぞれ
1本ずつのリンクを出し、代替ノードP0と接続し、以
下同様にS1a、S1bからそれぞれ1本ずつのリンク
を出し、代替ノードP1と接続し、S2a、S2bから
それぞれ1本ずつのリンクを出し、代替ノードP2と接
続し、S3a、S3bからそれぞれ1本ずつのリンクを
出し、代替ノードP3と接続する。
【0111】このように結合すると、例えば故障ノード
11とy方向で通信するはずだったノードはノード10
とノード12の2つがありこれらは別のグループに属す
るためにノード10→S1a→P1とノード12→S1
b→P1という全く別の経路を通るために第2の種類の
ノードと代替プロセッサとの間のリンクの使用効率が高
まる。
【0112】図17は、第7の発明にかかる実施例の変
形例の結合方式を示している。これは基本的には図15
の結合からなるが、aのグループを担当する第2の種類
のノード間を1次元メッシュで結合し、bのグループを
担当する第2の種類のノード間を1次元メッシュで結合
している。図16や図15の実施例では、x方向の通信
バンド幅が確保されていないが、本変形例では、第2の
種類のノード間の結合により確保される。
【0113】例えば、故障ノード11とx方向で通信す
るはずだったノードはノード01とノード21の2つが
ありこれらはbのグループに属するためにノード01→
S0b→S1b→P1という経路で接続され、同様にノ
ード21→S2b→S1b→P1という全く別の経路を
通る。よって第2の種類のノードと代替プロセッサとの
間のリンクの使用効率が高まるとともに、x方向のバン
ド幅も確保され、代替による性能低下は第2の種類のノ
ードの通過遅延時間以外なくなる。
【0114】第8の発明の実施例 第8の発明では、第6の発明の結合方式において、代替
ノード間に別途に結合手段を具備する。第8の発明を適
用した場合は第2の種類のノードを用いて接続する次元
を1つだけにしたとしても、故障ノードの隣接ノードは
自分が接続している代替ノードを中継ノードとして、そ
こから代替ノード間結合網によって故障ノードを代替し
ている代替ノードに到達できる。つまり、故障プロセッ
サの代替に伴う迂回路がベースとなるメッシュまたはト
ーラス結合網から追い出され、故障回避による健全なノ
ード間通信への悪影響を抑えることができる。
【0115】上記実施例によると、第2の種類のノード
を用いて接続する次元を1つだけにしたとしても、故障
回避による健全なノード間通信への悪影響を抑えること
ができる。
【0116】図18は、第8の発明にかかる実施例の結
合方式を示している。本実施例は、基本的には図16の
結合からなるが、代替ノード間が1次元メッシュで接続
されている。図16の実施例では、x方向の通信バンド
幅が確保されていないが、本実施例では代替ノード間の
結合により確保される。
【0117】例えば、故障ノード11とx方向で通信す
るはずだったノードはノード01とノード21の2つが
あり、ノード01→S0a→P0→P1という経路で接
続され、同様にノード21→S2a→P2→P1という
全く別の経路を通る。よって、x方向のバンド幅も確保
され、代替による性能低下は第2の種類のノードおよび
代替ノードの通過遅延時間以外なくなる。
【0118】第9の発明の実施例 第9の発明では、第8の発明の結合方式において、代替
ノード間結合網を少なくともメッシュまたはトーラス結
合を包含するものとする。故障ノードと接続されていた
ノードはメッシュまたはトーラス結合網における隣接ノ
ードであり、これらは故障ノードの接続した第1の代替
ノードと通信する必要があるため、一度この隣接ノード
が接続されている第2の代替ノードを経由させる。
【0119】代替ノード同士も第1のノードと同様なメ
ッシュまたはトーラス結合を包含する結合網で接続され
ているので、第1の代替ノードと第2の代替ノードが隣
接の関係にある。
【0120】上記実施例によると、故障ノードの隣接ノ
ードから代替ノードへの距離は2とすることが可能であ
り、故障回避によるバンド幅の細りは回避できる。多次
元結合網への容易な拡張性がある故障回避法が得られ
る。
【0121】図18は、代替ノード間結合が1次元では
あるものの第9の発明にかかる実施例を示していると言
うこともできる。例えば、故障ノード11の隣接ノード
であるノード01→ノード11→ノード21間の接続を
代替するには、これと同等の代替ノード間結合P0→P
1→P2があれば良いように、第2の種類のノードが導
入されていない方向に関する結合と同等なものがあれ
ば、故障回避によるバンド幅の細りは回避できる。
【0122】図19は、第9の発明にかかる実施例の3
次元構成を示している。本実施例は、図18を基本とし
て、これをz方向に4枚用意し、同じxy座標を持つノ
ード同士をz方向にメッシュ接続する。各ノードの座標
値および名前は図18におけるものの最後にzの値を加
えたものとする。すると、代替ノードはP00,P1
0,P20,P30,P01,P11,P21,P3
1,P02,P12,P22,P32,P03,P1
3,P23,P33の16ノードが2次元メッシュを構
成し、代替ノードPxzはそれぞれが対応する2個の第
2の種類のノードSxza、Sxzbを介して8個の第
1の種類のノードx0z、x1z,x2z,x3z,x
4z,x5z,x6z,x7zと接続している。
【0123】図20は、図19の実施例における故障回
避の例を示している。本例では、ノード111が故障し
ているとする。この場合、代替ノードはP11となり、
ノード111を取り囲んでいたノード110,ノード1
12,ノード011,ノード211,ノード101,ノ
ード121の6個のノードが代替ノードP11に迂回し
なければならない。
【0124】故障ノード111とxz座標が同じである
ノード101,ノード121はP11を共通の代替ノー
ドとしているので、ノード101は第2の種類のノード
S11aを介してP11と接続されており、ノード12
1は第2の種類のノードS11bを介してP11と接続
されている。
【0125】ノード110,ノード112,ノード01
1,ノード211は故障ノード111とxz座標が同じ
ではないので、まず、それぞれが第2の種類のノードを
介して接続している第2の種類のノードを経由する。具
体的には、ノード110は第2の種類のノードS10a
を介してP10を経由しP11に到達する。ノード11
2は第2の種類のノードS12aを介してP12を経由
しP11に到達する。ノード011は第2の種類のノー
ドS01aを介してP01を経由しP11に到達する。
ノード211は第2の種類のノードS21aを介してP
10を経由しP11に到達する。このようにxz座標が
異なる故障ノード111の隣接ノードが経由するP1
0、P12、P01、P10は、故障ノード111の代
替ノードP11と代替ノード間接続の2次元メッシュに
よって隣接の関係にあるので、短い遅延時間でP11に
迂回が実現される。
【0126】以上のように第1の種類のノード間を接続
するメッシュ結合を一切使わずに、代替ノード間を接続
するメッシュ結合を用いて代替ノードへの迂回が実現し
ているので、故障回避による通信バンド幅の細りはな
い。
【0127】また、本実施例で示されたように3次元以
上の多次元メッシュへの故障回避の容易な拡張が可能で
ある。つまり、元がn次元のメッシュからなるならば、
代替ノード間結合はn−1次元のメッシュとすれば良
い。トーラスについても同様である。故障時の再構成ア
ルゴリズムについても単純明快であり、従来法のように
スイッチの設定状態の決定のために大変な計算を伴うも
のではない。
【0128】第10の発明の実施例 第10の発明では、第1の発明の結合方式において、第
2の種類のノードを用いて接続する次元を実装状態にお
ける緊密に結合しやすい階層、望ましくは基板やシャー
シに対応付けて選択する。このため、第2の種類のノー
ドの導入によって純粋なメッシュやトーラスに追加され
た配線量の増加と、メッシュやトーラスでは隣接しない
遠隔ノードとの間の配線が同一基板上に実装されること
により、配線の困難さが軽減される。
【0129】この実施例によると、実装の困難さを軽減
し、基板間をまたがるメッシュやトーラスのリンクと同
程度のバンド幅を持った通信リンクで、故障回避時に用
いられるリンクを実装することが容易となる。
【0130】図21は、第10の発明にかかる実施例の
結合方式を示している。本実施例では、図18に示した
論理的な結合を電子回路基板で実現する際の実装イメー
ジを示している。1枚の基板には、第2の種類のノード
を用いて接続する次元であるy座標を対応づけ、y座標
のみ異なるものを搭載する。基板の向かい合う二辺には
コネクタが配置され、x方向のメッシュ接続用のリンク
はこのコネクタを介して隣接する基板間配線として実現
される。
【0131】図中では、故障回避時に用いられるリンク
を太線で示しているが、基板間接続で実現されるのは代
替ノード間接続のみであり、その他の大半の太線は基板
間接続より信頼性の高い基板内接続によって実現されて
いる。また、基板内配線の本数の制約と基板間配線の本
数の制約は基板内のほうがコネクタのより制限される基
板間配線よりもゆるいので、故障回避時に用いられるリ
ンクはやや長めの配線となるものの、基板間をまたがる
メッシュやトーラスのリンクと同程度のバンド幅を持つ
ように故障回避時に用いられるリンクを実装することが
容易である。
【0132】上記実施例の変形例として、基板のみなら
ず同一のバックプレインに接続される基板群からなるシ
ャーシ内とシャーシ間では配線の容易性が異なるので、
シャーシ内は第2の種類のノードを導入して接続を行う
ようにしても良い。
【0133】
【発明の効果】以上のように本発明によれば、高い実装
容易性とそれに基づく高いノード数拡張性と高い通信リ
ンクバンド幅および高い二分割バンド幅、短い直径、高
いランダム通信性能、ノード数の平方根に近い個数を一
辺とする2次元メッシュの効率的な埋め込み、一斉等間
隔通信時の実質通信バンド幅低下の防止、少ないチップ
数での故障ノードや故障通信リンク回避時の局所的通信
バンド幅低下の防止、故障回避のための配線による基板
間配線の増加とそれによる信頼性の低下の防止、汎用な
数万ノードシステムに適した3次元以上の多次元結合網
への故障回避の容易な拡張性といった、複雑に絡み合っ
た上記の全ての制約と課題を同時に解決する超並列計算
機向け結合網などを構築することができる。
【0134】以上のような特質を備えた超並列計算機向
け結合網などを構築することができることによって、例
えば16プロセッサと1個の代替ノードを搭載した基板
を用いて64×64×16構成の3次元トーラス状に結
合される65536台のプロセッサをからなる汎用超並
列計算機上で、例えば百〜数百個程度の故障ノードをか
かえながら256 ×256 の2次元メッシュを埋め込むこと
ができ、文献JSPP'93「マルチパラダイム超並列TFL
OPSマシンにおける並列処理〜プロセッサ間チェイニ
ングとその応用」で示されている通信リンクのバンド幅
によって性能が規定される密行列乗算などのウェーブフ
ロントアレイ動作を故障がないときと同じ性能で安定的
に動作させることが可能となる。
【0135】通信リンクあたりのバンド幅をParag
on XP/Sなどの商用超並列計算機で既に実現され
ている200MB/s程度を実現すれば、演算器が10
0MFLOPS程度のものであっても倍精度で3TFL
OPS程度の実効性能を512×512程度の大きさの
行列乗算時に実現できる。これはスーパーコンピュータ
の性能評価の基準として用いられるCray YMP-1のベンチ
マーク値の一万倍程度の性能を実現できることを意味す
る。
【0136】本発明を用いずに単純な3次元メッシュで
実現すれば、64×64の構成しか正方形のプロセッサ
アレイを構築できないので、同処理の性能は1/16ま
でしか実現できず、故障ノードが存在すれば、通信バン
ド幅の細りが迂回によって生じてしまうので更に半分以
下の性能にダウンしてしまう。よって本発明によって上
記の文献で実現される性能の約30倍の行列乗算性能の
向上が実現される。
【図面の簡単な説明】
【図1】第1の発明にかかる実施例の結合方式を示した
図。
【図2】図1の実施例のベースをトーラスにした変形例
の結合方式を示した図。
【図3】第1の発明にかかる実施例の第2の種類のノー
ドが導入されている次元に関しては全てのメッシュを構
成するリンクを省略した変形例を示した図。
【図4】第2の発明にかかる実施例の結合方式を示した
図。
【図5】図4の実施例をにおけるクロスバースイッチの
構成例を示した図。
【図6】第3の発明にかかる実施例の結合方式を示した
図。
【図7】第3の発明にかかる実施例の変形例の結合方式
を示した図。
【図8】第4の発明にかかる実施例の結合方式を示した
図。
【図9】図8の結合を8枚分をメッシュ結合して3次元
メッシュにy方向のみ第2の種類のノードを導入した実
施例の結合方式を示す図。
【図10】図9の結合の中に16×16の2次元メッシ
ュを全て隣接リンクのみによって埋め込む実施例の結合
方式を示した図。
【図11】第4の発明にかかる結合方式の座標値をk進
数表示したものの一部の桁を用いてグループ分けを行う
実施例の結合方式を示した図。
【図12】第5の発明にかかる実施例の結合方式を示し
た図。
【図13】第5の発明にかかる実施例の変形例の結合方
式を示した図。
【図14】第6の発明にかかる実施例の結合方式を示し
た図。
【図15】第7の発明にかかる実施例の結合方式を示し
た図。
【図16】第7の発明にかかる結合方式における代替ノ
ードとの間のリンクを節約した実施例の結合方式を示し
た図。
【図17】第7の発明にかかる実施例の変形例の結合方
式を示した図。
【図18】第8の発明にかかる実施例の結合方式を示し
た図。
【図19】第9の発明にかかる実施例の3次元構成を示
した図。
【図20】図19の実施例における故障回避の例を示し
た図。
【図21】第10の発明にかかる実施例の結合方式を示
した図。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 n(nは自然数)次元の座標によりアド
    レスされるn次元メッシュまたはn次元トーラス状にリ
    ンクで接続された第1の種類のノードのアレイに対し、
    1以上の次元に関して各々1次元分の座標値が異なる2
    個以上の第1の種類のノード間を第2の種類のノードに
    より接続することを特徴とする結合方式。
  2. 【請求項2】 前記第1の種類のノードを1以上の次元
    に関して各々1次元分の座標値だけが異なるノードをi
    (iは2以上の自然数)個のグループに分け、このグル
    ープ内を共通の第2の種類のノードで結合することを特
    徴とする請求項1の結合方式。
  3. 【請求項3】 前記第1の種類のノードを1以上の次元
    に関して各々1次元分の座標値だけが異なるノードをそ
    の座標値をk(kは2以上の自然数)進表示した数の全
    桁または一部の桁を次元ごとに異なる値をとることがで
    きるi(iは2以上の自然数)で割った余りを共通にす
    るi個のグループに分け、このグループ内を共通の前記
    第2の種類のノードで結合することを特徴とする請求項
    2の結合方式。
JP5349337A 1993-12-28 1993-12-28 ノード間結合方式 Pending JPH07200508A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5349337A JPH07200508A (ja) 1993-12-28 1993-12-28 ノード間結合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5349337A JPH07200508A (ja) 1993-12-28 1993-12-28 ノード間結合方式

Publications (1)

Publication Number Publication Date
JPH07200508A true JPH07200508A (ja) 1995-08-04

Family

ID=18403097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5349337A Pending JPH07200508A (ja) 1993-12-28 1993-12-28 ノード間結合方式

Country Status (1)

Country Link
JP (1) JPH07200508A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304568B1 (en) 1997-01-27 2001-10-16 Samsung Electronics Co., Ltd. Interconnection network extendable bandwidth and method of transferring data therein
WO2008099479A1 (ja) * 2007-02-14 2008-08-21 Fujitsu Limited ノード装置、ネットワークシステム、およびネットワークシステムの制御方法
US7516059B2 (en) 2002-12-27 2009-04-07 Fujitsu Limited Logical simulation device
WO2011059090A1 (ja) * 2009-11-16 2011-05-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワークを構成している複数のノード(プロセッサ)間において、全対全通信(A2A:all-to-allcommunication)を含む、複数の計算処理をスケジューリングする方法、プログラム及び並列計算機システム。
JP2012528416A (ja) * 2009-06-19 2012-11-12 ボード オブ レジェンツ,ユニヴァーシティ オブ テキサス システム 拡張可能なバスに基づくオンチップ相互接続ネットワーク
JP2020204913A (ja) * 2019-06-17 2020-12-24 富士通株式会社 演算処理装置、及び情報処理装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304568B1 (en) 1997-01-27 2001-10-16 Samsung Electronics Co., Ltd. Interconnection network extendable bandwidth and method of transferring data therein
US7516059B2 (en) 2002-12-27 2009-04-07 Fujitsu Limited Logical simulation device
WO2008099479A1 (ja) * 2007-02-14 2008-08-21 Fujitsu Limited ノード装置、ネットワークシステム、およびネットワークシステムの制御方法
JP2012528416A (ja) * 2009-06-19 2012-11-12 ボード オブ レジェンツ,ユニヴァーシティ オブ テキサス システム 拡張可能なバスに基づくオンチップ相互接続ネットワーク
WO2011059090A1 (ja) * 2009-11-16 2011-05-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワークを構成している複数のノード(プロセッサ)間において、全対全通信(A2A:all-to-allcommunication)を含む、複数の計算処理をスケジューリングする方法、プログラム及び並列計算機システム。
GB2487684A (en) * 2009-11-16 2012-08-01 Ibm Method for scheduling plurality of computing processes including all-to-all (a2a) communication across plurality of nodes (processors) constituting network, p
JP2013037723A (ja) * 2009-11-16 2013-02-21 Internatl Business Mach Corp <Ibm> ネットワークを構成している複数のノード(プロセッサ)間において、全対全通信(A2A:all−to−allcommunication)を含む、複数の計算処理をスケジューリングする方法、プログラム及び並列計算機システム。
JP5153945B2 (ja) * 2009-11-16 2013-02-27 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワークを構成している複数のノード(プロセッサ)間において、全対全通信(A2A:all−to−allcommunication)を含む、複数の計算処理をスケジューリングする方法、プログラム及び並列計算機システム。
US9251118B2 (en) 2009-11-16 2016-02-02 International Business Machines Corporation Scheduling computation processes including all-to-all communications (A2A) for pipelined parallel processing among plurality of processor nodes constituting network of n-dimensional space
GB2487684B (en) * 2009-11-16 2016-09-14 Ibm Method for scheduling plurality of computing processes including all-to-all (a2a) communication across plurality of nodes (processors) constituting network, p
JP2020204913A (ja) * 2019-06-17 2020-12-24 富士通株式会社 演算処理装置、及び情報処理装置

Similar Documents

Publication Publication Date Title
US6504841B1 (en) Three-dimensional interconnection geometries for multi-stage switching networks using flexible ribbon cable connection between multiple planes
US8433816B2 (en) Network topology for a scalable multiprocessor system
US5566342A (en) Scalable switch wiring technique for large arrays of processors
US20180107628A1 (en) Computer Subsystem and Computer System with Composite Nodes in an Interconnection Structure
JPH0833873B2 (ja) 超次元アレイ内のプロセツサ相互接続方法およびその装置
US5630162A (en) Array processor dotted communication network based on H-DOTs
KR20010015731A (ko) 복합 어레이 처리에 대한 방법 및 장치
JPH05506528A (ja) 並列処理アレイ用のスケーリング可能なプロセッサ間及びプロセッサ・i/oメッセージシステム
JPH07505490A (ja) 低近接3次元インターコネクト
JPH05207011A (ja) 再構築可能な故障耐久性能ある多重相互接続ネットワークとそのプロトコル
US20210303505A1 (en) Network Computer with Two Embedded Rings
JPH02503245A (ja) N次元網でm次元(mはnより小さい)結合網をシミュレートする方法と装置
JPH07200508A (ja) ノード間結合方式
GB2395581A (en) Array-type processor
Yeh et al. VLSI layout and packaging of butterfly networks
Seo et al. The composite banyan network
CN108183872B (zh) 交换机系统及其构建方法
US5396231A (en) Modular communications interconnection
US5142686A (en) Multiprocessor system having processors and switches with each pair of processors connected through a single switch using Latin square matrix
CN104579786A (zh) 一种基于融合和2D Torus网络拓扑架构的服务器设计方法
KR0170496B1 (ko) 병렬처리 컴퓨터 시스템에서 크로스바 스위치를 사용한 클러스터 연결구조
JPH0636060A (ja) スライド・ネットワークに使用するアレイ・プロセッサ
JPH0311455A (ja) 最適化された相互接続ネットワーク
KR0155266B1 (ko) 멀티프로세서 컴퓨터 시스템
JPH04113445A (ja) 並列計算機