JPH0954762A - ネットワーク構成 - Google Patents

ネットワーク構成

Info

Publication number
JPH0954762A
JPH0954762A JP7210415A JP21041595A JPH0954762A JP H0954762 A JPH0954762 A JP H0954762A JP 7210415 A JP7210415 A JP 7210415A JP 21041595 A JP21041595 A JP 21041595A JP H0954762 A JPH0954762 A JP H0954762A
Authority
JP
Japan
Prior art keywords
network
processors
lsi
group
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7210415A
Other languages
English (en)
Other versions
JP3119130B2 (ja
Inventor
Yuji Saeki
裕治 佐伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP07210415A priority Critical patent/JP3119130B2/ja
Publication of JPH0954762A publication Critical patent/JPH0954762A/ja
Application granted granted Critical
Publication of JP3119130B2 publication Critical patent/JP3119130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 並列計算機のネットワークに関し、任意プロ
セッサ間の通信効率と、大規模な数のプロセッサ間の配
線実装及びプロセッサ増設の容易性とを両立する。 【構成】 実装位置が近いプロセッサ群毎にグループ化
し、各グループ化されたプロセッサ群を完全クロスバー
スイッチ結合するネットワークLSIに接続し、更に、
グループ内のプロセッサ数と等しい数のデータ経路で隣
接ネットワークLSI同志を接続したリング型結合網構
成とする。 【効果】 通信効率の低下率を押さえ、各LSI間の配
線長を一定限度内に保ったまま、グループ単位でプロセ
ッサを増設でき、並列計算機システムを容易に大規模化
できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、並列計算機を構成する
複数のプロセッサをグループ化し、グループ間接続に要
する配線長をグループ内でのプロセッサ間配線長と同程
度に抑えることによって、任意プロセッサ間通信効率を
大きく低下させることなく、プロセッサ数大規模化に対
し容易に対応を可能とするネットワーク構成方式に関す
る。
【0002】
【従来の技術】並列計算機システムでは、任意の2プロ
セッサ間の通信を可能とするネットワークを構成する必
要があり、このようなネットワークとして、メッシュ
型、完全クロスバー型、ハイパークロスバー型などの構
成方式が知られている。
【0003】メッシュ型ネットワークの場合、プロセッ
サを一定次元の座標格子点上にマッピングして各次元方
向に隣接するプロセッサ同志を直接接続し、非隣接プロ
セッサ間は、プロセッサ間の座標格子点上での距離に応
じた数のプロセッサを経由することで間接的に接続され
る。各格子点上では、入力してくる通信データを、プロ
セッサに取り込む、或いは、いずれかの次元方向に中継
するかを判定し、通信路を確保するネットワークLSI
が設けられることになる。
【0004】N個のプロセッサを接続する完全クロスバ
ー型のネットワークの場合、データ経路は任意の2プロ
セッサ間を直結しており、プロセッサ間の接続路確定は
各プロセッサへの出力ポートに存在するN対1のセレク
タ回路を用いて行う。この完全クロスバースイッチを一
つのLSIとして実現することができると、その結果、
N×N本の任意プロセッサ間接続配線がLSI内に閉じ
込められ、配線スペースを節約することができ、高密度
な実装が可能となる。
【0005】ハイパークロスバー型のネットワークの場
合、プロセッサを一定次元の座標格子点上にマッピング
して、各次元方向の接続は完全クロスバースイッチによ
り行い、異なる次元方向のクロスバースイッチ間の通信
データの乗り換えは各プロセッサに付随する完全クロス
バースイッチにより行う。本ネットワークに関しては、
例えば、特開昭63−12416号、特開平5−812
16号に記載がある。
【0006】
【発明が解決しようとする課題】2プロセッサ間での通
信効率がプロセッサの位置関係によって大きく異なる並
列計算機システムでは、利用者は、プロセッサの位置関
係とプログラム或いはデータの関連性を考慮して、各プ
ロセッサに対するプログラム或いは計算データの割当て
を行い、効率の悪いプロセッサ間の通信発生を抑止しな
ければならない。また、そのプログラムは特定の並列計
算機に最適化されたものとなるため、異なるネットワー
ク構成方式によって実現された並列計算機上では効率の
良い計算ができなくなる。なお、通信効率とは、2つ以
上のプロセッサが通信を行う際の、データ経路が競合す
る確率であり、この確率が低いほど通信効率が高いとい
うことになる。
【0007】また、並列計算機システムが大規模になり
多数の利用者により共同利用されるものとなれば、同じ
アプリケーションプログラムであっても常に同じ位置関
係にあるプロセッサ群にプログラム及びデータが割り当
てられるとは限らなくなり、従って、効率の良い計算が
実行できなくなる場合がある。
【0008】例えば、メッシュ型ネットワークでは、通
信を行う2プロセッサの格子上での距離が大きくなれば
なるほど、多くの格子点及び隣接格子点をつなぐデータ
経路を使用する必要があるため、異なるプロセッサ対で
行われる通信の使用するデータ経路が競合する確率が高
くなり、従って通信効率は低くなる。
【0009】一方、完全クロスバー型ネットワークで
は、通信を行うプロセッサ対が異なればデータ経路の競
合は発生せず従って通信効率は最も良い。この完全クロ
スバー型ネットワーク用の完全クロスバースイッチを1
つのLSIで実現できる場合、配線に必要なスペースを
節約でき高密度実装が可能となる。しかしながら、1つ
のLSIのピン数には制限があるため、接続可能なプロ
セッサ数は当該LSIのピン数によって制限を受け、そ
の結果、大規模な並列計算機システムは実現できない。
また、1つのLSIで完全クロスバスイッチを構成した
場合、当該LSIの周辺に接続される各LSIと当該L
SIを結ぶ一点集中型の配線が必要になるために、当該
LSIと周辺LSI間の配線が長くなる問題がある。
【0010】また、ハイパークロスバー型ネットワーク
では、任意プロセッサ間の通信効率に対する位置依存性
が小さく、また、完全クロスバー接続可能プロセッサ数
の累乗だけのプロセッサが接続可能である。しかしなが
ら、各軸方向の接続を行うのは完全クロスバーであるた
めに、各軸方向の完全クロスバースイッチに配線が集中
する。従って、並列計算機システム全体の物理的大きさ
の程度の長さの配線が、プロセッサ総数に比例した数だ
けクロスバースイッチ群に対して張られねばならないこ
とになる。長い配線上を伝わる信号の電気的特性、及
び、莫大な配線物量を考慮すると、ハイパークロスバー
型ネットワークにおいても接続可能なプロセッサ総数に
は限りがあると考えられる。
【0011】本願発明の目的は、並列計算機に於いて、
任意プロセッサ間の通信効率の低下を押さえつつ、大規
模な数のプロセッサ間の配線実装及びプロセッサ増設の
容易性を確保することにある。
【0012】
【課題を解決するための手段】上記目的を達成するため
に、多数のプロセッサを相互に接続するためのネットワ
ークが、前記多数のプロセッサを適当な単位で分けた各
グループ内の各プロセッサ間の接続を行う、前記各グル
ープ対応の複数の完全クロスバースイッチと、前記複数
のグループをリング状に接続し、かつ、前記グループに
属するプロセッサの数と等しい数で前記リング上の任意
に隣接する前記グループ同志を接続し、お互いに異なる
グループに属するプロセッサ間の接続に用いられるデー
タ経路とを有するように構成する。
【0013】また、ネットワークが、前記データ経路は
片方向の転送路であり、第1のグループに属するプロセ
ッサから入力されるパケットを、前記第1のグループか
ら前記第1のグループの次段にあるグループへの前記デ
ータ経路のいずれかに出力する第1の回路と、前記第1
のグループの前段にあるグループから前記第1のグルー
プへの前記データ経路からのパケットを、前記第1のグ
ループに属するプロセッサへ、または、前記次段にある
グループへの前記データ経路へ出力する第2の回路とを
有するように構成する。
【0014】次に、並列計算機用のネットワークが、そ
れぞれが複数のプロセッサを接続して使用される複数の
ネットワークLSIと、前記複数のネットワークLSI
をリング状に接続する複数の片方向転送のデータ経路と
を有し、前記ネットワークLSIは、前記複数のプロセ
ッサの数に等しい数の、前記プロセッサに接続される複
数の入力ポート及び複数の出力ポートと、前記複数の入
力ポートと前記複数の出力ポートとを結合する完全クロ
スバスイッチ結合網とを有し、前記複数のデータ経路
は、任意の隣接するネットワークLSI間で前記複数の
プロセッサLSIの数と等しい数であり、異なるネット
ワークLSIに属するプロセッサ間の接続は、前記デー
タ経路を介して行うように構成する。
【0015】次にまた、前記ネットワークLSIが、前
記入力ポートから次段のネットワークLSIへの複数の
データ経路のいずれかへ接続する回路と、前段のネット
ワークLSIからの複数のデータ経路を前記出力ポート
へまたは次段のネットワークLSIへのデータ経路へ接
続する回路とを有するように構成する。
【0016】
【作用】本発明のネットワーク構成方式により、完全ク
ロスバー結合を容易に行いうる実装範囲に存在するプロ
セッサ群を単位としたグループを構成でき、グループ内
でのプロセッサ間通信は、完全クロスバー結合で効率良
く実行できる。他方、物理的距離が互いに遠い異なるグ
ループに属するプロセッサ間の接続は、隣接グループ間
を接続するのみで、配線長を短くとれ配線量の増加率も
小さいリング型結合により行うために、各LSI間の配
線長は一定限度内に保ったままで、配線長及び配線量の
制限に抑えられることなく、グループ単位で増設してい
くだけで、並列計算機システムを大規模化できる。
【0017】リング型結合の問題点であるプロセッサ間
距離による通信効率の低下に関しては、本構成ではリン
グ状のデータ経路がグループを構成するプロセッサ数だ
け多重化されるため、グループ数をg(g≧2)とする
と、完全クロスバー結合の場合と比較して、2/(g−
1)の通信効率の低下にとどまる。
【0018】この通信効率に関しては、グループを構成
するプロセッサ数が多いほどメッシュ型に対して有利と
なるが、一方容易に完全クロスバー結合できるプロセッ
サ数には限りがある。そこで、例えばハイパークロスバ
ーネットワークのような、任意プロセッサ間の通信効率
の良いキューブ型ネットワークの一部の次元に対し本構
成のネットワークを用いることで、より大規模かつ任意
プロセッサ間の通信効率の良い並列計算機システムを構
築することができる。
【0019】また、本構成では、リングを構成するネッ
トワークLSIの数が2である場合、グループを構成す
るプロセッサ数×2の入出力ポートを有する完全クロス
バーとして機能する。1LSIに実装できる論理ゲート
量に制限がある場合にも、本方式を用いることで2LS
Iにて所定の数のポートを有する完全クロスバースイッ
チを構成することができる。
【0020】更に、入力ポートの機能と出力ポートの機
能を別LSIに実装することにより、4LSIをもっ
て、グループを構成するプロセッサ数×2の入出力ポー
トを有する完全クロスバーとして機能させることがで
き、1LSIに実装できるピン数及び論理ゲート量に制
限がある場合にも、本方式を用いることで4LSIにて
所定の数のポートを有する完全クロスバースイッチを構
成することができる。
【0021】
【実施例】以下、本発明の実施例を図面を用いながら詳
述する。図1は、本発明の方式で構成されたネットワー
ク(1、3、4)によって、複数のプロセッサ(2)が
相互に接続されている並列計算機システムのブロック図
である。本並列計算機のネットワークは、プロセッサ間
の通信経路の確保を行う複数のネットワークLSI
(1)と、ネットワークLSIとプロセッサ(2)を接
続するデータ経路(3)、及び、ネットワークLSI同
志をリング状に接続する片方向転送の伝送路であるデー
タ経路(4)から構成される。
【0022】本並列計算機では、プロセッサ(2)は、
物理的に近距離に実装されるプロセッサ毎にグループ化
され、同一グループに属するプロセッサは、ネットワー
クを構成する1つのネットワークLSI(1)に接続さ
れる。この構成では、物理的に近距離にあるプロセッサ
同志は1つのネットワークLSIに接続され、物理的に
遠距離にあるプロセッサ同志はそれぞれのプロセッサか
ら近距離にある異なるネットワークLSIに接続される
ので、プロセッサから遠距離にあるネットワークLSI
へデータ経路が設けられることはなく、その結果、プロ
セッサからネットワークLSIまでのデータ経路(3)
の距離を短縮することができる。
【0023】各ネットワークLSI(1)は、当該ネッ
トワークLSIに直接接続されるプロセッサ相互間のデ
ータ転送に関する部分と当該ネットワークLSI間のデ
ータ転送に関する部分から構成される。1つのネットワ
ークLSIに直接接続されるプロセッサ相互間のデータ
転送に関する部分は、通信を行うプロセッサ対が異なれ
ばデータ経路の競合が起こらない完全クロスバー型で構
成することで、近距離同志のプロセッサ間の通信効率を
高めている。ネットワークLSI間のデータ転送に関す
る部分は、プロセッサからの入力ポート、プロセッサへ
の出力ポート、リング接続前段ネットワークLSIから
のデータ入力ポート、及び、リング接続次段ネットワー
クLSIへのデータ出力ポートを、それぞれ等しい数だ
け設ける構成とすることで、プロセッサグループとネッ
トワークLSIの間の通信容量を、ネットワークLSI
間の通信容量と等しく保つている。
【0024】図2は、データ経路によりリング型に互い
に接続されるN個のネットワークLSI<0>、<1
>...<N−1>のうちの任意の一つである、ネット
ワークLSI<n>の構成例を示す。なお、ここではネ
ットワークLSI<n>の構成例を示すが、他のネット
ワークLSIの構成もネットワークLSI<n>の構成
と同様である。以下、前述のプロセッサグループが4つ
のプロセッサ0〜プロセッサ3から構成され、この4つ
のプロセッサが接続されるネットワークLSIを例とし
て説明する。
【0025】本ネットワークLSIは、プロセッサ数に
対応した、それぞれ4つずつの、プロセッサからの入力
ポート(10、11、12、13)、プロセッサへの出
力ポート(20、21、22、23)、本LSIで構成
されるリングにおいて前段にあたるネットワークLSI
<n−1>からの入力ポート(30、31、32、3
3)、及び、次段にあたるネットワークLSI<n+1
>への出力ポート(40、41、42、43)を有す
る。各入力ポートから入力されるデータは、図2に示さ
れるLSI内のデータ経路を通って出力ポート群に達す
る。各入力ポートから出力ポート群に達したデータは、
出力ポート毎に存在するセレクタ回路(60、61、6
2、63、80、81、82、83)によって、当該出
力ポートへ転送すべき入力ポートからのデータのみが選
択され、その後、選択された出力ポートから出力され
る。この結果、本ネットワークLSIに接続されている
任意のプロセッサ或いは次段ネットワークLSI<n+
1>へ到達することが可能となる。
【0026】整理すると、本構成例のネットワークLS
I内におけるデータ経路は、図3に示される本ネットワ
ークLSIに接続されている4プロセッサ間での完全ク
ロスバー結合を実現する、即ち、入力ポート(10、1
1、12、13)と出力ポート(20、21、22、2
3)を完全クロスバースイッチ結合するデータ経路、図
4に示される本ネットワークLSI<n>に接続されて
いる4つのプロセッサ0〜プロセッサ3からの入力ポー
ト(10、11、12、13)と次段ネットワークLS
I<n+1>への4つの出力ポート(40、41、4
2、43)を結ぶ完全クロスバー型のデータ経路、図5
に示される前段ネットワークLSI<n−1>から本ネ
ットワークLSI<n>に接続されるプロセッサへの4
系統のデータ経路(90、91、92、93)、及び、
図6に示される本LSI接続のプロセッサが関与しない
通信データの経路となる前段ネットワークLSI<n−
1>と次段ネットワークLSI<n+1>を結ぶ4系統
のデータ経路(94、95、96、97)から構成され
ているといえる。
【0027】図5におけるデータ経路は、前段ネットワ
ークLSI<n−1>からのデータが入力される入力ポ
ート(30、31、32、33)と当該ネットワークL
SI<n>に接続されるプロセッサへデータを出力する
出力ポート(20、21、22、23)との間に1対1
の対応関係がある。従って、前段ネットワークLSI<
n−1>は、当該ネットワークLSI<n>に接続され
るプロセッサへ通信データを転送する際は、当該プロセ
ッサが接続されている出力ポート(20、21、22、
23)に対応する入力ポート(30、31、32、3
3)へ接続されたデータ経路へ通信データを送信する必
要がある。
【0028】また、図6におけるデータ経路は、前段ネ
ットワークLSI<n−1>からのデータが入力される
入力ポート(30、31、32、33)と次段ネットワ
ークLSI<n+1>へデータを出力する出力ポート
(41、42、43、40)との間に1対1の対応関係
がある。ここで、前段ネットワークLSI<n−1>か
らの入力ポート(30、31、32、33)と次段ネッ
トワークLSI<n+1>への出力ポート(40、4
1、42、43)との対応関係が、4に関する剰余に対
して1だけずれている。つまり、本ネットワークLSI
で中継される通信データは、入力ポートの位置に対して
一つずれた位置にある出力ポートに出力される(図6の
(30−41)、(31−42)、(32−43)、
(33−40)の関係)。なお、4に関する剰余に対し
て1だけずれているというのは、入力ポート番号/出力
ポート番号として、図6における説明番号の下一桁の番
号を割り振ったとき(例:30は0番入力ポート、43
は3番出力ポートとする)、対応関係にある入出力ポー
ト番号は、「出力ポート番号=Mod(入力ポート番号
+1、4)」となっているということである。
【0029】このため、図7に示される様に、本ネット
ワークLSI(1)を複数個用いてリング状にデータ経
路で接続して構成したネットワークは、次のような特徴
を有する(図7ではネットワークLSIが4個(1a,
1b,1c,1d)の場合を示している)。送信側プロ
セッサ(1a)が、異なるネットワークLSI(1d)
に接続される受信側プロセッサへ通信データを転送する
場合、ネットワークLSI同志を結ぶ4系統あるデータ
経路のうちのいずれを選ぶかは、受信プロセッサ(10
2)の位置により決まる。つまり、本構成例における送
信プロセッサと受信プロセッサを結ぶ通信経路選択は、
送信プロセッサが接続されるネットワークLSI(1
a)の、図3及び図4に示した2系統の完全クロスバー
型のデータ選択回路によってそのほとんどが行われ、こ
れ以降データを中継していくネットワークLSIにおい
ては、図5に示す関係で対応するプロセッサに出力する
か、或いは、図6に示す関係で次段ネットワークLSI
に出力するかの選択が行われていくだけである。
【0030】例えば、図7においてネットワークLSI
(1a)に接続されるプロセッサ(104、105、1
06、107)のいずれかからネットワークLSI(1
d)に接続されるプロセッサ(102)への通信を行う
ためには、まずネットワークLSI(1a)において、
次段ネットワークLSI(1b)への出力ポートのうち
(701(図4の40相当))を出力ポートとして選択
し、以下ネットワークLSI(1b)では図6のデータ
経路(94)、次にネットワークLSI(1c)では図
6でのデータ経路(95)、最後にネットワークLSI
(1d)では図5のデータ経路(92)を選択して、受
信プロセッサ(102)への通信経路を確立する。
【0031】なお、図6において、前段ネットワークL
SI<n−1>からの入力ポート(30、31、32、
33)と次段ネットワークLSI<n+1>への出力ポ
ート(40、41、42、43)との対応関係が、4に
関する剰余に対して1だけずれているのは、図8に示す
ような、ネットワークLSI間をデータが流れる方向と
は逆の方向の隣接プロセッサに向けて全プロセッサから
送信を行う場合に、各プロセッサからの通信が使用する
データ経路が互いに競合しないようにするためである。
【0032】次に、ネットワーク内でのルーティングに
ついて説明する。本ネットワークに於いては、プロセッ
サ間の通信は、受信プロセッサ番号を含むヘッダを有す
る一定の形式のパケットの交換によって行われるものと
する。
【0033】まず、パケットがネットワークLSIに接
続されているプロセッサからネットワークLSIに入力
される場合を説明する。図2に示されるネットワークL
SIは、プロセッサからの各入力ポートにバッファ(5
0、51、52、53)を有し、当該LSIに接続され
たプロセッサから入力されるパケットを、バッファに一
旦保持する。また、各入力ポート部には、入力されたパ
ケットのヘッダをデコードするデコーダ回路(54、5
5、56、57)を有しており、プロセッサから入力さ
れるパケットをバッファに取り込みながら、ヘッダ内の
受信プロセッサ番号を解析する。解析の結果、当該パケ
ットを受信するプロセッサが本ネットワークLSIに接
続されている場合には、デコーダ回路は、受信プロセッ
サへの出力ポートセレクタ(60、61、62、63)
が当該パケット入力ポートからのデータを選択するよ
う、ルーティング制御部(9)に対し要求を行う。ルー
ティング制御部(9)は、デコード回路から受信プロセ
ッサ番号の解析結果に基ずく要求を受信すると、要求に
従い出力ポートセレクタを制御する。一方、当該パケッ
ト受信プロセッサが他のネットワークLSIに接続され
るものであった場合には、デコーダ回路は、図6及び図
5に示したデータ経路を通って受信プロセッサ出力ポー
トに到達するデータ経路への出力ポートセレクタ(8
0、81、82、83)が当該入力ポートを選択するよ
う、ルーティング制御部(9)に対し要求を行う。
【0034】次に、パケットが前段のネットワークLS
I<n−1>から当該ネットワークLSI<n>に入力
される場合を説明する。ネットワークLSIは、前段ネ
ットワークLSI<n−1>からの各入力ポートにも、
プロセッサからの入力ポートと同様に、バッファ(7
0、71、72、73)とヘッダを解析するデコード回
路(74、75、76、77)を有している。前段ネッ
トワークLSI<n−1>からパケットの入力がある
と、パケットを一旦バッファに保持し、デコード回路に
よりヘッダの解析を行い、当該パケットを受信するプロ
セッサが自ネットワークLSIに接続されているか否か
を判定する。ヘッダの解析を行ったデコード回路は、受
信プロセッサが自ネットワークLSIに接続されている
場合には図5の関係で対応する出力ポートセレクタ(6
0、61、62、63)を、接続されていない場合には
図6の関係で対応する出力ポートセレクタ(80、8
1、82、83)が、当該パケットを受け取った入力ポ
ートを選択するようルーティング制御部(9)に対し要
求を行う。
【0035】今、図8に示したリング逆回り方向(ネッ
トワークLSI間のデータ経路の転送方向と逆の方向)
の隣接プロセッサ間でのデータ転送の場合のルーティン
グを考えてみる。プロセッサ(103)からリング逆回
り方向に隣接するプロセッサ(102)への通信は、2
つのプロセッサが同一のネットワークLSI(1d)に
接続されているため、ネットワークLSI(1d)にお
けるプロセッサ(103)が接続される入力ポート(8
00)からのルーティング要求は、プロセッサ(10
2)が接続される出力ポート(801)のセレクタ制御
に関するものとなる。一方、プロセッサ(100)から
リング逆回り方向に隣接するプロセッサ(115)への
通信は、ネットワークLSI(1a、1b、1c)及び
ネットワークLSI間をつなぐデータ経路(831、8
32、833)を経由する。そのため、ネットワークL
SI(1d)におけるプロセッサ(100)が接続され
る入力ポート(802)からルーティング制御部に対す
るルーティング要求は、ネットワークLSI(1d、1
a)間をつなぐデータ経路(831)への出力ポート
(803)のセレクタ制御に関するものとなる。データ
経路(831)を経由してネットワークLSI(1a)
にパケットが入力されると、当該入力ポート(804)
からルーティング制御部に対するルーティング要求は、
ネットワークLSI(1a、1b)間をつなぐデータ経
路(832)への出力ポート(805)のセレクタ制御
に関するものとなる。同じく、データ経路(832)を
経由してネットワークLSI(1b)にパケットが入力
されると、当該入力ポート(806)からのルーティン
グ要求は、ネットワークLSI(1b、1c)間をつな
ぐデータ経路(833)への出力ポート(807)のセ
レクタ制御に関するものとなる。更に、データ経路(8
33)を経由してネットワークLSI(1c)にパケッ
トが入力されると、当該入力ポート(808)からのル
ーティング要求は、受信プロセッサ(115)への出力
ポート(809)のセレクタ制御に関するものとなる。
【0036】なお、ネットワークLSIを3個以上経由
して行われる通信の場合、送信プロセッサから受信プロ
セッサに至る全ての入力バッファを確保した後パケット
を送信するものとする。全経路確保の確認をすることな
く次々と使用するバッファを確保していくと、同時に複
数のネットワークLSIからパケットが送出され始めた
場合に、図9に示すように複数のパケットがいずれも受
信されることなくネットワーク上に滞留してしまうから
である。例えば、図9では、ネットワークLSI(1
d)に接続されるプロセッサ(102)が、ネットワー
クLSI(1a、1b)を経由してネットワークLSI
(1c)に接続されるプロセッサ(114)に受信され
るパケットの送信を開始し、同時に、ネットワークLS
I(1b)に接続されるプロセッサ(111)が、ネッ
トワークLSI(1c、1d)を経由してネットワーク
LSI(1a)に接続されるプロセッサ(104)に受
信されるパケットの送信を開始した場合を示している。
この場合、両方のパケットはともにバッファ(900)
及び(901)を使用しなければならないのにもかかわ
らず、バッファ(900)はプロセッサ(102)送信
のパケットによって確保され、一方バッファ(901)
はプロセッサ(111)送信のパケットが確保されてし
まい、いずれのパケットも受信プロセッサに到達できな
いことになる。
【0037】送信プロセッサから受信プロセッサに至る
全経路確保は、次のように行う。まず、パケットヘッダ
をあらかじめ受信プロセッサの接続されるネットワーク
LSIまで経路確保要求として送る。受信プロセッサの
接続されるネットワークLSIは、このパケットヘッダ
を受信すると、このパケットヘッダに対する応答(経路
が確保できたのでパケット本体を送ってもよいという意
味のAcknowledge)を、リング逆回り方向に
返す。この応答を返されたネットワークLSIは、リン
グ逆回り方向に、順に、この応答を、送信プロセッサが
接続されるネットワークLSIに向けて返していく。こ
の応答が、送信プロセッサの接続されたネットワークL
SIまで到達すれば、全経路が確保できたことが送信側
で確認できる。その後、パケット本体の転送が開始され
る。他のプロセッサ対の行う通信により、途中の経路が
直ちには使用できない状態にある場合には、通信中のパ
ケットの転送が終了し当該経路が使用可能となった後、
受信プロセッサまでの経路確保要求を行う。
【0038】また、図9のような場合には、複数のヘッ
ダ同志が互いに同じ経路を要求することになる。この種
の競合調停のために、ネットワークLSIに循環しない
優先順位を割り当て、送信プロセッサの接続されたネッ
トワークLSIの持つ優先順位が高いヘッダが、優先順
位の低いヘッダを上書きする形で経路確保を行う。上書
きされた部分の低優先のルーティング要求に関しては、
高優先のパケット転送終了後にヘッダを再発行すること
で、受信プロセッサまでの経路確保を行う。
【0039】本実施例のネットワークを用いた並列計算
機を実装する場合、図10に示されるように、プロセッ
サ(2)とネットワークLSI(1)の間、及び、ネッ
トワークLSI(1)同志の間の各配線の長さを短くす
るため、ネットワークLSI(1)を中心として、当該
LSIに直接接続されるプロセッサ(2)群を配置し、
これらを1セット(7)として、複数セットをリング状
に配置する。更に、ネットワークLSIをリングの中心
に寄せて配置することで、リング状に形成されたネット
ワークに於いて、隣接するネットワークLSI(1)同
志の間の配線の長さを、一つのセット(7)内における
プロセッサとネットワークLSIとの間の距離程度に平
均化することが可能になる。
【0040】これを図10を用いて説明する。今、プロ
セッサ(2)をプロセッサを搭載したプロセッサボード
と考え、その大きさをKとし、ネットワークLSI
(1)を搭載するバックボードの大きさをLとし、ここ
で、 「プロセッサボードの大きさK」≒「バックボードの大
きさL」 とする。この結果、 「同一セット内のプロセッサとネットワークLSI間の
距離」 =「(K**2+L**2)**(1/2)」 ≒「隣接セット相互間のネットワークLSIとネットワ
ークLSIとの距離」 =「2**(1/2)L」 (ここで、**はベキ乗を示す。以下の明細書の中で同
様の意味で用いる。)となり、上記の関係となる。な
お、配線長は、2乗和の平方根で表すよりも代数和とし
て表す方がより望ましいが、何れにせよ、結果はほぼ等
しくなる。
【0041】また、このリング状配置により、プロセッ
サの増設は、セット(7)を単位として、リング状配線
中に追加することで行うことができる。この際、増設を
行うに比例してシステムの床面積は大きくなるものの、
隣接するネットワークLSI間の間の各配線の配線長が
伸びることはなく、既存部分のケーブルの交換も必要な
い。また、ネットワークLSIのピン数による制限のた
めに一つのネットワークLSIに接続できるプロセッサ
数は限られるが、上記の方法で実装する場合各配線の配
線長は、電気的には余裕のあるものとなる。例えば、上
記のシステムが、LSIの信号ピン数を約500、1バ
イト幅ネットワーク(1バイトに、パリティビットと制
御信号が加算され1系統あたり10数信号が必要)から
構成されると考えると、1つのネットワークLSIのポ
ート数(接続プロセッサ数)は約10以下となる。そこ
で、1セットが10個のプロセッサと1個のネットワー
クLSIから構成されると考える。この場合、例えば一
つのセットが一つのボードにコンパクトに実装されると
すると、標準的なボードの大きさから、プロセッサとネ
ットワークLSI間または隣接するネットワークLSI
間の配線長<約50cmであり、また、別の例として、
1プロセッサが1ボード(K≒25cm)から構成され
ると考えても、ボード間隔≒5cmならば、K≒L≒2
5cmのため、前述の配線長<約50cmとなる。一般
に、LSI間を1対1で結ぶ1m未満の配線は電気的に
問題とならず、上記配線長は電気的に余裕のあるものと
なる。
【0042】一方、大規模な並列計算機システムを実現
するためには、リングを構成するセット数が増大するこ
ととなり、プロセッサ間の通信効率が低下することにな
る。
【0043】電気特性の限界まで配線長を伸ばして、通
信効率の良い大規模並列計算機システムを実現するため
には、ハイパークロスバーネットワークのような通信効
率は良いが配線の難しいキューブ型ネットワークの一部
の次元に対し、本実施例のネットワークLSIを使用す
ればよい。
【0044】例として、特開平5−81216号に示さ
れるx、y、zの3次元のハイパークロスバーネットワ
ークにより、8×8×4個のプロセッサが配線接続され
た並列計算機を考える。ここで、配線の制限により、こ
れ以上の個数のプロセッサの接続は困難であったとす
る。この並列計算機に本実施例のネットワークを適用し
て、8×8×4×g個のプロセッサを接続する場合を説
明する。
【0045】まず、8(X方向)×8(Y方向)×4
(Z方向)個のプロセッサを接続するハイパークロスバ
ーネットワークにおいて、z方向の全ての4入力4出力
完全クロスバースイッチを、それぞれ本実施例の4入力
4出力の完全クロスバースイッチを包含するネットワー
クLSIと置き換えたネットワークを構成する。これ
は、この置き換えたネットワークに於いて、ネットワー
クLSIは、X方向の8本のクロスバースイッチとY方
向の8本のクロスバースイッチとの交点(64カ所)に
対応して計64個用いられることを意味する。ここで、
ハイパークロスバーネットワークのZ方向のクロスバー
スイッチに接続されていた乗り換えスイッチの出力ポー
ト及び入力ポートを、本実施例のネットワークLSIに
おけるプロセッサに対する入力ポート及び出力ポートに
接続する。この置き換えたネットワーク(以下セットと
呼ぶ)をg組作る。そして、g組のセットの各セットに
於いて、X方向のクロスバースイッチとY方向のクロス
バースイッチとの交点の位置が同一である、g個のネッ
トワークLSIを本実施例におけるデータ経路でリング
状に接続する。各セット内にはネットワークLSIが6
4個あるので、g個のネットワークLSIがリング状に
接続された組が、合計64組できる。1セットにはプロ
セッサ数は8×8×4個であるからgセットで、8×8
×4×g個のプロセッサから成る並列計算機が構成され
る。
【0046】図11には、8×8個のネットワークLS
I(1)と、8×8個のネットワークLSIにより相互
に結合された8×8×4個のプロセッサ(2)とを1セ
ットとして、これをgセット配置した図を示す。このよ
うにネットワークLSI(1)をリングの内側に向けて
配置すれば、ネットワークLSI(1)間を接続する8
×8×4系統のデータ経路は、8×8×4ハイパークロ
スバーネットワーク実現に要する配線長(78)を超え
ることなく、8×8×4×g個のプロセッサを有する並
列計算機システムを構築できることになる。この関係を
図15に示す(図15は、図11における配線長を説明
する図である)。図15に示されるように、8×8×4
のハイパークロスバーネットワークの最長配線長≒Mと
なり、一方、ネットワークLSI間の配線(ケーブル)
長は図15に示すようにM/(2**(1/2))また
はMとなり、いずれの場合もネットワークLSI間を接
続するデータ経路は、配線長Mを超えることはない。こ
こで、同数のプロセッサを有するハイパークロスバーネ
ットワークに対する通信効率の低下は2/(g−1)と
なる。
【0047】なお、図14は、上記関係の理解を助ける
ための模式図である。図14では、2×2×2のプロセ
ッサを有するセットを4組示しており、各セットにおけ
るX方向のクロスバースイッチとY方向のクロスバース
イッチは単純化して平面として示している。Z方向に2
個のプロセッサが存在するので、この平面は上面と下面
の2つとなる。図に於いて、各セットにおけるZ軸方向
のA、B、C、DがネットワークLSIを示す。この場
合、ネットワークLSIは2プロセッサ接続のネットワ
ークLSIとなる。ここで、各セットの同じ位置にある
ネットワークLSIをデータ経路でリング状に接続す
る。図14では、図が見にくくなるため、データ経路に
関しては、各セット内のAの位置にあるネットワークL
SIを上面に関して接続した例を示している。位置Aに
関する下面のリング状のデータ経路、位置B、C、Dに
関する上面および下面のリング状のデータ経路は示して
いない。黒く示した部分は、ネットワークLSIのリン
グ方向の出力ポート及び入力ポートを示している。
【0048】次に、本発明の並列計算機用ネットワーク
に於いて、リングを構成するネットワークLSIの数を
2とした場合について説明する。この場合、ネットワー
クは、完全クロスバー型の結合と同等となる。即ち、完
全クロスバー型のネットワークを2つのLSIにて実現
する方法を示していることになる。以下、2つのLSI
で完全クロスバースイッチを構成する方法を説明する。
【0049】リングを構成するネットワークLSIの数
を2と限定した場合、配線長を大きく伸ばすことなくネ
ットワークLSI同志を隣接して配置することが可能と
なる。そして、このようにネットワークLSIが隣接し
て配置された場合、図2におけるネットワークLSI間
をつなぐ経路上に存在する入力バッファ(70、71、
72、73)は必要なくなる。また、図2に示されるネ
ットワークLSIを単純に2個用いると、通信経路確定
のためのセレクタ(60、61、62、63、80、8
1、82、83)を、送信側プロセッサと受信側プロセ
ッサのそれぞれで持つことになり、つまり2段構成で持
つことになり、ルーティング制御に余分なオーバーヘッ
ドを要することになる。
【0050】上記を考慮し、図12に示すように、2つ
のネットワークLSIを構成するのがゲート量、性能の
観点から効率的である。図12では、2つのネットワー
クLSI(121、122)が、2n個のプロセッサ間
の完全クロスバースイッチを構成する。ネットワークL
SI(121)はプロセッサ0〜n−1に対する入出力
を担当し、ネットワークLSI(122)はプロセッサ
n〜2n−1に対する入出力を担当する。各ネットワー
クLSIには、接続されるプロセッサ対応に入力ポート
(10、14、15、19)が設けられ、入力ポート対
応にパケットを保持するバッファ(50、54、55、
59)およびヘッダを解析してルーティング制御部(1
23、124)に対しルーティング要求を出すデコーダ
(90、94、95、99)が1LSIあたりn個設け
られる。また、プロセッサからのデータ入力ポート(1
0、14、15、19)と一対一に対応するようネット
ワークLSI間を結ぶデータ経路の出力ポート(40、
44、45、49)を設ける。この出力ポート(40、
44、45、49)は、ネットワークLSI間を結ぶデ
ータ経路へそれぞれ対応するプロセッサからの入力パケ
ットを中継するのみである。またこの出力ポートは、ネ
ットワークLSI間を結ぶデータ経路を介して、相対す
るネットワークLSIの入力ポート(30、34、3
5、39)に接続される。この入力ポート対応に、ヘッ
ダを解析してルーティング制御部(123、124)に
対しルーティング要求を行うデコーダ(900、94
0、950、990)が1LSIあたりn個設けられて
いる。各ネットワークLSIに接続されているプロセッ
サへの各出力ポート(20、24、25、29)には、
2n対1のセレクタ回路(60、64、65、69)が
当該出力ポート対応に設けられる(即ち1LSIあたり
n個設けられる)。これら各セレクタは、自ネットワー
クLSIに接続されているプロセッサからの各入力ポー
トと相対するネットワークLSI接続のプロセッサから
の各入力ポートが接続され、ルーティング制御部により
どのポートからの信号を選択するのか制御される。ルー
ティング制御部へのルーティング要求は、送信プロセッ
サと受信プロセッサが同一LSI接続である場合、デコ
ーダ(90、94、95、99)が行い、パケットがL
SI間を渡る場合には、更に、デコーダ(900、94
0、950、990)がルーティング要求を行う。
【0051】本構成例(2個のネットワークLSIを使
用する構成)のそれぞれのLSIに必要とする論理ゲー
トの量は、1つのLSIで2n×2nの完全クロスバー
を実現する場合に比べ、入力バッファ及び出力セレクタ
の数が半分となっているだけ減少するため、容易に多く
の入出力ポートを有する完全クロスバースイッチを実現
することができる。
【0052】但し図12に示す構成では、1LSIで2
n×2nの完全クロスバーを実現する場合と比較して、
1LSIあたりの論理ゲート量は削減できるが、1LS
Iあたりのピン数は削減できない。そこで図12に示し
たLSIを、図13に示すように、入力ポート(13
1、132)側と出力ポート(133、134)側に分
割して、全体で4LSI構成とする。入力ポート側LS
I(131、132)には入力バッファ(50、54、
55、59)機能を配し、出力ポート側LSI(2、
6)では、ヘッダデコーダ(90、94、95、99、
900、940、950、990)、2n対1出力セレ
クタ(60、64、65、69)、及び、ルーティング
制御部(123、124)機能を配する。この場合、1
LSIあたりの論理ゲート量のみならず、1LSIあた
りのピン数も削減されて、容易に多くの入出力ポートを
有する完全クロスバースイッチを実現することができ
る。
【0053】
【発明の効果】以上説明したように本発明によれば、並
列計算機のネットワーク構成方式において、物理的距離
が互いに近い範囲に実装されるプロセッサ群をグループ
化すると、このグループ化したプロセッサ群に対して、
プロセッサ間接続は通信効率の良い完全クロスバースイ
ッチ構成方式で行い、他方、異なるグループに属し物理
的距離が互いに遠いプロセッサ間の接続は、グループ化
されたプロセッサ数と等しいデータ経路数でリング型結
合により行うために、任意プロセッサ間の通信効率の低
下率を2/(グループ数−1)にとどめることができ
る。低下率2/(グループ数−1)は次のように求める
ことができる。
【0054】グループ数をg、グループを構成するプロ
セッサ数をnとすと、通信効率は、各プロセッサ(g×
n個)が、受信先プロセッサをランダムに選んで送信を
行ったときのグループ間パスの競合確率で表すことがで
きる。今、グループ(g−1)とグループ0とをつなぐ
n系統のパス(データ経路)に着目すると、 1)グループ0に属するプロセッサ送信の通信で占有さ
れるパス本数期待値=0 2)グループ1に属するプロセッサ送信の通信で占有さ
れるパス本数期待値=(n×1)/g 3)グループ2に属するプロセッサ送信の通信で占有さ
れるパス本数期待値=(n×2)/g ・・・・ g)グループ(g−1)に属するプロセッサ送信の通信
で占有されるパス本数期待値=(n×(g−1))/g これら1)〜g)の総和量(n/2)×(g−1)と実
際に存在するパス(データ経路)nとの比が完全クロス
バースイッチに対する性能低下率を表す。即ち、 gグループに分割時の性能低下率=2/(g−1) となる。
【0055】また、本ネットワーク構成は、隣接グルー
プ間を接続するだけで配線でき、かつ、配線長が短く配
線量も少ないによりリング型結合を用いているため、各
LSI間の配線長は一定限度内に保ったまま、即ち、配
線長及び配線量による制限を被ることなく、グループ単
位で増設することができ、並列計算機システムを容易に
大規模化できる効果がある。
【0056】更に、本ネットワークのリングを構成する
ネットワークLSIの数を2とすることで、論理ゲート
量或いはピン数による制限により1LSIにては実現で
きない入出力ポート数を有する完全クロスバースイッチ
を、2LSI或いは4LSIにて構成することが可能と
なる。上記性能低下率の式にg=2を代入すると性能低
下率は1以上となり、従って、ネットワークLSIの数
を2とした場合は有意の性能低下は無い。
【図面の簡単な説明】
【図1】本発明の方式で構成されたネットワークを用い
た並列計算機の基本ブロック図である。
【図2】ネットワークLSIの構成例を示すブロック図
である。
【図3】同一ネットワークLSI接続のプロセッサ間結
合方式を示す図である。
【図4】プロセッサからリング型経路への接続の方式を
示す図である。
【図5】リング型経路からの入力ポートとプロセッサへ
の出力ポートの対応を示す図である。
【図6】リング型経路に対する入出力ポート間の対応を
示す図である。
【図7】受信プロセッサの接続位置と通信に使用される
リング型経路の対応を示す図である。
【図8】リング逆回り方向の隣接転送において使用され
るリング型経路を示す図である。
【図9】同時送信開始により複数のパケットがリング型
経路の一部を取り合って受信が開始されない様子を示す
図である。
【図10】本発明のネットワークを用いた並列計算機の
実装例を示す図である。
【図11】ハイパークロスバーネットワークの一次元に
本発明のネットワークを用いた並列計算機の実装例を示
す図である。
【図12】2LSIで完全クロスバースイッチを構成す
る例を示すブロック図である。
【図13】4LSIで完全クロスバースイッチを構成す
る例を示すブロック図である。
【図14】ハイパークロスバーネットワークの一次元に
本発明のネットワークを用いた並列計算機を示す説明図
である。
【図15】隣接するネットワークLSI同志の配線の長
さと一つのセットにおけるネットワークLSIとプロセ
ッサの間の距離との関係を示す図である。
【符号の説明】
1 ネットワークLSI 2 プロセッサ 3 ネットワークLSIとプロセッサの間のデータ経路 4 ネットワークLSI同志を結ぶリング状のデータ経
路 9 通信経路確定制御を行うルーティング制御回路 10、11、12、13 プロセッサからの入力ポート 20、21、22、23 プロセッサへの出力ポート 30、31、32、33 前段ネットワークLSIから
の入力ポート 40、41、42、43 次段ネットワークLSIへの
出力ポート 50、51、52、53、70、71、72、73 入
力パケットを一旦保持するためのバッファ 54、55、56、56、74、75、76、77 パ
ケットヘッダデコーダ 60、61、62、63 プロセッサへの出力データを
選択するセレクタ 80、81、82、83 リング型経路への出力データ
を選択するセレクタ

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 多数のプロセッサを相互に接続するため
    のネットワーク構成であって、 前記多数のプロセッサを適当な単位で分けた各グループ
    内の各プロセッサ間の接続を行う、前記各グループ対応
    の複数の完全クロスバースイッチと、 前記複数のグループをリング状に接続し、かつ、前記グ
    ループに属するプロセッサの数と等しい数で前記リング
    上の任意に隣接する前記グループ同志を接続し、お互い
    に異なるグループに属するプロセッサ間の接続に用いら
    れるデータ経路とを有することを特徴とするネットワー
    ク構成。
  2. 【請求項2】 請求項1のネットワーク構成であって、 前記データ経路は片方向の転送路であり、 第1のグループに属するプロセッサから入力されるパケ
    ットを、前記第1のグループから前記第1のグループの
    次段にあるグループへの前記データ経路のいずれかに出
    力する第1の回路と、 前記第1のグループの前段にあるグループから前記第1
    のグループへの前記データ経路からのパケットを、前記
    第1のグループに属するプロセッサへ、または、前記次
    段にあるグループへの前記データ経路へ出力する第2の
    回路とを有することを特徴とするネットワーク構成。
  3. 【請求項3】 それぞれが複数のプロセッサを接続して
    使用される複数のネットワークLSIと、前記複数のネ
    ットワークLSIをリング状に接続する複数の片方向転
    送のデータ経路とを有し、 前記ネットワークLSIは、前記複数のプロセッサの数
    に等しい数の、前記プロセッサに接続される複数の入力
    ポート及び複数の出力ポートと、前記複数の入力ポート
    と前記複数の出力ポートとを結ぶ完全クロスバスイッチ
    結合網とを有し、 前記複数のデータ経路は、任意の隣接するネットワーク
    LSI間で前記複数のプロセッサの数と等しい数であ
    り、 異なるネットワークLSIに属するプロセッサ間の接続
    は、前記データ経路を介して行うことを特徴とするネッ
    トワーク構成。
  4. 【請求項4】 前記ネットワークLSIは、前記入力ポ
    ートから次段のネットワークLSIへの複数のデータ経
    路のいずれかへ接続する回路と、前段のネットワークL
    SIからの複数のデータ経路を前記出力ポートへまたは
    次段のネットワークLSIへのデータ経路へ接続する回
    路とを有することを特徴とする請求項3記載のネットワ
    ーク構成。
  5. 【請求項5】 前記ネットワークLSIの数が2である
    ことを特徴とする請求項3または請求項4記載のネット
    ワーク構成。
  6. 【請求項6】多数のプロセッサを相互に接続するため
    に、リング状に接続されて用いられるネットワークLS
    Iであって、 当該ネットワークLSIに接続されるプロセッサ数に等
    しい数である、当該プロセッサからのパケットが入力さ
    れる複数の第1の入力ポート、および、当該プロセッサ
    へパケットを出力する複数の第1の出力ポートと、 当該ネットワークLSIに接続されるプロセッサ数に等
    しい数である、前記第1の入力ポートに入力されたパケ
    ットを次段のネットワークLSIへ出力する複数の第2
    の出力ポートと、 当該ネットワークLSIに接続されるプロセッサ数に等
    しい数である、前記第1の出力ポートまたは前記第2の
    出力ポートへ出力するパケットを前段のネットワークL
    SIから入力される複数の第2の入力ポートとを有し、 ここで、前記複数の第1の入力ポートと前記複数の第1
    の出力ポートは完全クロスバスイッチにより接続され、
    前記第1の入力ポートに入力されたパケットを前記複数
    の第2の出力ポートの何れへでも出力できることを特徴
    とするネットワークLSI。
  7. 【請求項7】 請求項6記載のネットワークLSIによ
    り複数の多次元キューブ型ネットワークを接続するネッ
    トワーク構成であって、 前記各多次元キューブ型ネットワークの一部の次元のネ
    ットワークに前記ネットワークLSIを配置し、前記多
    次元キューブ型ネットワークの前記一部の次元以外の次
    元のネットワークと前記ネットワークLSIの第1の入
    力と第1の出力に接続し、 前記ネットワークLSIを配置した複数の多次元キュー
    ブ型ネットワークを、前記配置されたネットワークLS
    Iに接続されるデータ経路により、リング状に接続した
    ことを特徴とするネットワーク構成。
  8. 【請求項8】 それぞれが複数のプロセッサを接続して
    使用される2つのネットワークLSIと、前記2つのネ
    ットワークLSIをリング状に接続する複数の片方向転
    送のデータ経路とを有し、 前記ネットワークLSIは、前記複数のプロセッサの数
    に等しい数の前記プロセッサに接続される複数の第1の
    入力ポートと、前記複数のプロセッサの数に等しい数の
    前記プロセッサに接続される複数の第1の出力ポート
    と、前記複数のプロセッサの数に等しい数の次段のネッ
    トワークLSIへのデータ経路が接続される複数の第2
    の出力ポートと、前記複数のプロセッサの数に等しい数
    の前段のネットワークLSIからのデータ経路が接続さ
    れる複数の第2の入力ポートと、前記複数の第1の入力
    ポートのそれぞれを前記複数の第2の出力ポートのそれ
    ぞれに1対1に接続する回路と、及び、前記複数の第1
    の入力ポートおよび前記複数の第2の入力ポートを前記
    複数の第1の出力ポートのいずれかへ接続する回路とを
    有することを特徴とするネットワーク構成。
  9. 【請求項9】 前記ネットワークLSIが、前記複数の
    第1の入力ポートを含むLSIと前記複数の第1の出力
    ポートを含むLSIの2つから構成されることを特徴と
    する請求項8記載のネットワーク構成。
  10. 【請求項10】 多数のプロセッサを相互に接続した並
    列計算機システムであって、 前記多数のプロセッサを適当な単位で分けた各グループ
    内の各プロセッサ間の接続を行う、前記各グループ対応
    の複数の完全クロスバースイッチと、 前記複数のグループをリング状に接続し、かつ、前記グ
    ループに属するプロセッサの数と等しい数で前記リング
    上の任意に隣接する前記グループ同志を接続し、お互い
    に異なるグループに属するプロセッサ間の接続に用いら
    れるデータ経路とから構成される前記多数のプロセッサ
    を相互に接続するネットワークを有することを特徴とす
    る並列計算機システム。
  11. 【請求項11】 同一グループに属する複数のプロセッ
    サは、当該ネットワーク構成を用いる装置の物理的に近
    距離な位置に実装されるプロセッサであることを特徴と
    する請求項1および2記載のネットワーク構成。
  12. 【請求項12】 同一LSIに属する複数のプロセッサ
    は、当該ネットワーク構成を用いる装置の物理的に近距
    離な位置に実装されるプロセッサであることを特徴とす
    る請求項3および4記載のネットワーク構成。
JP07210415A 1995-08-18 1995-08-18 ネットワーク構成 Expired - Fee Related JP3119130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07210415A JP3119130B2 (ja) 1995-08-18 1995-08-18 ネットワーク構成

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07210415A JP3119130B2 (ja) 1995-08-18 1995-08-18 ネットワーク構成

Publications (2)

Publication Number Publication Date
JPH0954762A true JPH0954762A (ja) 1997-02-25
JP3119130B2 JP3119130B2 (ja) 2000-12-18

Family

ID=16588943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07210415A Expired - Fee Related JP3119130B2 (ja) 1995-08-18 1995-08-18 ネットワーク構成

Country Status (1)

Country Link
JP (1) JP3119130B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008117367A1 (ja) * 2007-03-23 2008-10-02 Fujitsu Limited 集積回路チップ及び回路ネットワーク
JP2010079912A (ja) * 1997-10-10 2010-04-08 Altera Corp プロセッサアレイ及びその形成方法
JP2022524051A (ja) * 2019-03-14 2022-04-27 デジラム コーポレーション 並べ替えリングネットワーク相互接続型コンピューティングアーキテクチャ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079912A (ja) * 1997-10-10 2010-04-08 Altera Corp プロセッサアレイ及びその形成方法
JP2012133793A (ja) * 1997-10-10 2012-07-12 Altera Corp プロセッサアレイ及びその形成方法
WO2008117367A1 (ja) * 2007-03-23 2008-10-02 Fujitsu Limited 集積回路チップ及び回路ネットワーク
JPWO2008117367A1 (ja) * 2007-03-23 2010-07-08 富士通株式会社 集積回路チップ及び回路ネットワーク
JP5099122B2 (ja) * 2007-03-23 2012-12-12 富士通株式会社 集積回路チップ及び回路ネットワーク
JP2022524051A (ja) * 2019-03-14 2022-04-27 デジラム コーポレーション 並べ替えリングネットワーク相互接続型コンピューティングアーキテクチャ

Also Published As

Publication number Publication date
JP3119130B2 (ja) 2000-12-18

Similar Documents

Publication Publication Date Title
US4623996A (en) Packet switched multiple queue NXM switch node and processing method
US6314487B1 (en) Adaptive routing controller of a crossbar core module used in a crossbar routing switch
KR101802810B1 (ko) 하이브리드 회선 교환 및 패킷 교환 라우터의 아키텍처 및 그 방법
JPH08185380A (ja) 並列計算機
EP0018756A2 (en) Speed independent arbiter switch for digital communication networks
JP2001285291A (ja) 調停方式及びそれを用いたアービタ回路
JPH0118636B2 (ja)
US20080101395A1 (en) System and Method for Networking Computer Clusters
US7151752B2 (en) Method for the broadcasting of a data packet within a switched network based on an optimized calculation of the spanning tree
US7987313B2 (en) Circuit of on-chip network having four-node ring switch structure
Lusala et al. Combining SDM-Based circuit switching with packet switching in a router for on-chip networks
RU2607251C2 (ru) Сеть трансляции информации и соответствующий узел сети
JPH0954762A (ja) ネットワーク構成
CN112073336A (zh) 基于AXI4 Stream接口协议的高性能数据交换系统及方法
CN107018071B (zh) 一种基于“包-电路”交换技术的路由模式切换配置器
JPH05151183A (ja) 並列演算装置
JP3599095B2 (ja) ネットワーク装置
JP3661932B2 (ja) 並列計算機システムおよびクロスバスイッチ
EP1675015B1 (en) Reconfigurable multiprocessor system particularly for digital processing of radar images
JP2003178038A (ja) ノード間データ転送方法及びノード間データ転送装置
TWI616754B (zh) 快捷外設互聯標準(PCIe)資料交換裝置及傳輸系統
JP2585318B2 (ja) 相互結合ネツトワークおよびそのためのクロスバスイツチ
KR0164966B1 (ko) 접힌 구조와 루프백 기능을 갖는 다단계 상호연결망
JPH03209550A (ja) 並列プロセッサのプロセッサ間データ転送装置
Hill Design and Applications for the IMS C004

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees