JPH11212942A - Interconnection net work method of large scale parallel processing computer system - Google Patents

Interconnection net work method of large scale parallel processing computer system

Info

Publication number
JPH11212942A
JPH11212942A JP10298003A JP29800398A JPH11212942A JP H11212942 A JPH11212942 A JP H11212942A JP 10298003 A JP10298003 A JP 10298003A JP 29800398 A JP29800398 A JP 29800398A JP H11212942 A JPH11212942 A JP H11212942A
Authority
JP
Japan
Prior art keywords
network
node
nodes
new
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10298003A
Other languages
Japanese (ja)
Inventor
Shia Peisu
ペイス・シア
Han Chengude
チェングデ・ハン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHUGOKU KAGAKUIN KEISAN GIZU K
CHUGOKU KAGAKUIN KEISAN GIZU KENKYUSHO
Original Assignee
CHUGOKU KAGAKUIN KEISAN GIZU K
CHUGOKU KAGAKUIN KEISAN GIZU KENKYUSHO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHUGOKU KAGAKUIN KEISAN GIZU K, CHUGOKU KAGAKUIN KEISAN GIZU KENKYUSHO filed Critical CHUGOKU KAGAKUIN KEISAN GIZU K
Publication of JPH11212942A publication Critical patent/JPH11212942A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To make a communication bandwidth wide and also to reduce a delay time by connecting an inverse graph topological interconnection network to a crossbar switch or a high speed bus. SOLUTION: A four-element two dimensional interconnection network connects four nodes (e.g. CSX0 or CSY0) of one row or one column by a 4×4 crossbar switch (or a high speed bus). When a delay time until information arrives from one node to another node through the crossbar switch is tCS and a time until it arrives from one node to an adjacent node through one router is tR, network delays from a node N000 at the lower left to nodes N330 and N331 at the upper right become 2 (tCS+tR) and 2tCS+tR respectively. Also, the number of horizontal and vertical crossbar switches is four respectively. Then, it is possible to increase the number of nodes by more than double without increasing hardwares very so.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、計算機技術分野に
関するもの、特に大規模並行処理計算機システムの新型
相互連接ネットワーク方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the technical field of computers, and more particularly to a new interconnection network method for a large-scale parallel processing computer system.

【0002】[0002]

【従来の技術】並行処理機能のある計算機システムにお
いては、複数のプロセサーを有し、これらのプロセサー
が並行処理を行い、かつ相互連接ネットワークにより互
いに通信を行う。相互連接ネットワークに対する要求と
しては、機能が強い、通信遅延が小さい、データ転送率
が高い(即ち、通信バンド幅が広い)、ハードウェアの
複雑度が低い、拡張性が良いことなどがある。従来通常
の相互連接ネットワークとしては、バス、クロスバース
イッチ、k元n次元立方体で互いに連接する相互連接ネ
ットワーク等が知られている。次にこれらの相互連接ネ
ットワークについて動作の原理を説明する。
2. Description of the Related Art A computer system having a parallel processing function has a plurality of processors, which perform parallel processing and communicate with each other through an interconnected network. Requirements for interconnected networks include strong functionality, low communication delay, high data transfer rate (ie, wide communication bandwidth), low hardware complexity, and good scalability. Conventionally known interconnected networks include a bus, a crossbar switch, an interconnected network interconnected by a k-element n-dimensional cube, and the like. Next, the principle of operation of these interconnection networks will be described.

【0003】図1は従来のバスで複数のプロセサーを互
いに連接する原理を図示していて、複数のプロセサーは
バスBにより互いに連接し、複数のプロセサーの間の通
信はバスBを時分割に利用することによって行う。即
ち、二つのプロセサーの間に通信を行っている際には、
他のプロセサーは待たなければならず、その通信が完了
後、他のプロセサーがバスBを利用することができる。
バスで連接する相互連接ネットワークのメリットはコス
トが低いことであるが、各プロセサーの利用可能なバン
ド幅がより狭い、且つ拡張性がよくない問題が存在す
る。バスに連結できるプロセサーの数は通常4〜8個で
ある。
FIG. 1 illustrates the principle of connecting a plurality of processors to each other by a conventional bus. The plurality of processors are connected to each other by a bus B, and communication between the plurality of processors uses the bus B in a time-division manner. Do by doing. That is, when communicating between two processors,
Other processors must wait, and after their communication is complete, other processors can use bus B.
The advantage of an interconnected network interconnected by buses is that the cost is lower, but there is the problem that the available bandwidth of each processor is smaller and less scalable. The number of processors that can be connected to the bus is usually four to eight.

【0004】図2はクロスバースイッチを示す原理図で
ある。図2のPEi(i=0、1、…、7)はプロセサーを
表し、各プロセサーは同時に送信と受信を行うことがで
きる。一つのプロセサーの送信端は求めに応じてクロス
バースイッチに通じて他の一つのプロセサーの受信端と
連接する。クロスバースイッチの交叉点をONまたはO
FFとすることができ、図2の中の交叉点に黒点のある
ところはONを表し、黒点のないところはOFFを表
す。例えば、図2の中に左上の黒点AはPE7の送信端とP
E0の受信端を連接していることを表す。クロスバースイ
ッチの各行または及び各列の中に一つの交叉点だけON
とすることができる。図2の中に8個の交叉点が同時に
ONとなっている、即ち、8対のプロセサーの間に同時
に通信を行うことができる。クロスバースイッチのメリ
ットは相互連接ネットワークの通信バンド幅が広く、遅
延が小さく、プロセサーの数が4〜8個の場合、クロス
バースイッチは理想的な相互連接ネットワークである
が、クロスバースイッチのハードウェアの複雑度はプロ
セサーの数の二乗に従って複雑になり、プロセサーの数
が多い場合、コストが非常に高くなり、従ってクロスバ
ースイッチの拡張性にはよくない問題が存在する。
FIG. 2 is a principle diagram showing a crossbar switch. PEi (i = 0, 1,..., 7) in FIG. 2 represent processors, and each processor can simultaneously transmit and receive. The transmitting end of one processor is connected to the receiving end of another processor through a crossbar switch as required. Turn ON or O the cross point of the crossbar switch
It can be set to FF, and a portion having a black point at an intersection in FIG. 2 represents ON, and a portion having no black point represents OFF. For example, in FIG.
Indicates that the receiving end of E0 is connected. ON only one crossing point in each row or each column of the crossbar switch
It can be. In FIG. 2, eight cross points are ON at the same time, that is, communication can be performed simultaneously between eight pairs of processors. The advantage of the crossbar switch is that when the communication bandwidth of the interconnection network is wide, the delay is small, and the number of processors is 4 to 8, the crossbar switch is an ideal interconnection network. The complexity of the ware increases with the square of the number of processors, and when the number of processors is large, the cost is very high, and thus there is a problem with the scalability of the crossbar switch.

【0005】大量のプロセサーをもつ大規模並行処理計
算機システムにおいて、相互連接ネットワークは殆どk
元n次元立方体の相互連接ネットワーク或はその変形を
用いる。2次元相互連接ネットワークは簡略化したk元
n次元立方体の相互連接ネットワークで、それはn=2
としたものである。図3に示すような2次元相互連接ネ
ットワークにおいて、k=4としたものである。2次元
相互連接ネットワークの中の横線及び縦線はネットワー
クチャンネル(例えばCC)を表し、横ネットワークチ
ャンネルと縦ネットワークチャンネルの交叉点での黒点
はルーター(例えばR03)を表す。ルーターはルーチン
グアルゴリズムとルーチング機構に基づいて受信された
データを目的地に送る。
In a large-scale parallel processing computer system having a large number of processors, an interconnected network is almost k
An interconnected network of original n-dimensional cubes or a variant thereof is used. A two-dimensional interconnected network is a simplified k-ary n-dimensional cubic interconnected network, where n = 2
It is what it was. In a two-dimensional interconnection network as shown in FIG. 3, k = 4. The horizontal and vertical lines in the two-dimensional interconnected network represent network channels (eg, CC), and the black dots at the intersection of the horizontal and vertical network channels represent routers (eg, R03). The router sends the received data to the destination based on a routing algorithm and a routing mechanism.

【0006】図3の中の各ルーターは五つの端子を有
し、其の中の四つの端子はネットワークチャンネル(即
ち、二つの端子は横ネットワークチャンネル、他の二つ
の端子は縦ネットワークチャンネル)に連接し、残る一
つの端子は丸で表すプロセサーノード(例えばN00)と
連接する。プロセサーノードは以下にノードという。一
つのノードに一つのプロセサーを含んでも良いし、複数
のプロセサーを含んでも良い。
Each router in FIG. 3 has five terminals, four of which are connected to a network channel (ie, two terminals are horizontal network channels and the other two are vertical network channels). The remaining one terminal is connected to a processor node (for example, N00) indicated by a circle. Processor nodes are referred to below as nodes. One node may include one processor, or may include a plurality of processors.

【0007】図4は4元立方体の相互連接ネットワーク
を示す。図4に示すように、縦線と横線はネットワーク
チャンネル(例えばCC)を表し、黒点はルーター(例
えばN000)を表す。図の中に隠されたルーター及びネッ
トワークチャンネルを図示していないが、そのルーター
と連接しているノードも図示していない。相互連接ネッ
トワークにノードの数はNとすると、k元n次元立方体
の相互連接ネットワークにおいて、N=knになる。kと
nを与えるとNの値も確定値になる。クロスバースイッ
チと比較すると、k元n次元立方体の相互連接ネットワ
ークの拡張性は良いが、相互連接ネットワークの遅延が
大きい問題が存在する。図3に示すように、左下のノー
ドN00から右上のノードN33に至るまで少なくとも7つの
ルーターを経由する必要がある。
FIG. 4 shows a quaternary cube interconnected network. As shown in FIG. 4, vertical and horizontal lines represent network channels (eg, CC), and black dots represent routers (eg, N000). The routers and network channels hidden in the figure are not shown, but the nodes connected to the routers are not shown. Assuming that the number of nodes is N in the interconnection network, N = kn in a k-element n-dimensional cubic interconnection network. When k and n are given, the value of N also becomes a definite value. Compared with the crossbar switch, the k-element n-dimensional cubic interconnection network has good expandability, but has a problem that the interconnection network has a large delay. As shown in FIG. 3, it is necessary to pass at least seven routers from the lower left node N00 to the upper right node N33.

【0008】k元n次元立方体の相互連接ネットワーク
において、n>1、k>2としたとき、ネットワークチ
ャンネルの数はルーターの数より多い。プロセサーノー
ドはルーターと連接しなくて、ネットワークチャンネル
に連接すると、インバースグラフトポロジカル相互連接
ネットワークになる。図5はこのような2次元インバー
スグラフトポロジカル相互連接ネットワークを示してい
る。図5においては、ノードの数は図3と同じである
が、ルーターとネットワークチャンネルの数は図3より
半分減らした。図5の直線、丸と黒点で示すものは図3
と同じものである。インバースグラフトポロジカル相互
連接ネットワークは通信バンド幅が非常に広い光相互連
接ネットワークにとって有効的なものであるが、光相互
連接ネットワークのコストが高く、光電の転換も複雑で
ある。電気相互連接ネットワークにとっては、ネットワ
ークチャンネルの数を減らしたために、各プロセサーの
平均通信バンド幅は狭くなり、データの高速転送に影響
を与える。
In a k-element n-dimensional cubic interconnected network, when n> 1, k> 2, the number of network channels is larger than the number of routers. When a processor node is not connected to a router but is connected to a network channel, it becomes an inverse graph topological interconnected network. FIG. 5 shows such a two-dimensional inverse graph topological interconnected network. In FIG. 5, the number of nodes is the same as in FIG. 3, but the number of routers and network channels is reduced by half compared to FIG. FIG. 5 shows a straight line, a circle and a black dot in FIG.
Is the same as Inverse graph topological interconnected networks are effective for optical interconnected networks with very wide communication bandwidths, but the cost of optical interconnected networks is high and the conversion of photoelectrics is complex. For electrical interconnected networks, the reduced number of network channels reduces the average communication bandwidth of each processor, affecting high-speed data transfer.

【0009】[0009]

【発明が解決しようとする課題】本発明の目的は大規模
並行処理計算機システムの新型相互連接ネットワーク技
術を提供し、大量(例えば10000より多い)のプロセサ
ーを有する大規模並行処理計算機システムの各プロセサ
ーの間に連接する問題を解決する。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a new type of interconnected network technology for a large-scale parallel processing computer system, and to provide each processor of a large-scale parallel processing computer system having a large number (for example, more than 10,000) of processors. Solve the problem of interlocking.

【0010】[0010]

【課題を解決するための手段】本発明はインバースグラ
フトポロジカル相互連接ネットワークとクロスバースイ
ッチ又は高速バスのメリットを綜合した上で、大規模並
行処理計算機システムに適した新型相互連接ネットワー
クを提出する。このような新型相互連接ネットワークは
通信バンド幅が広く、遅延時間が短く、拡張性が良いも
のである。インバースグラフトポロジカル相互連接ネッ
トワークの最初の目的はルーターとネットワークチャン
ネルの数を減らすことであるが、ノードの数から見る
と、同数のkとnに対して、k元n次元インバースグラ
フトポロジカル相互連接ネットワークはk元n次元立方
体相互連接ネットワークより数の多いノードを連接でき
る。図6に示すような4元2次元インバースグラフトポ
ロジカル相互連接ネットワークにおいて、連接されたノ
ードの数は32個で、図3の16個ノードより倍多くなる。
図6の直線、丸と黒点で表すものは図5と同じものであ
る。インバースグラフトポロジカル相互連接ネットワー
クにおいての連接できるノードの数をNIGとすると、2
次元に対して、NIG=2Nで、3次元に対して、NIG=3N
で、n次元に対して、NIG=nNである。
SUMMARY OF THE INVENTION The present invention combines the advantages of an inverse graph topological interconnection network and a crossbar switch or high-speed bus, and proposes a new interconnection network suitable for a large-scale parallel processing computer system. Such a new type of interconnected network has a wide communication bandwidth, short delay time, and good expandability. The first purpose of the inverse graph topological interconnected network is to reduce the number of routers and network channels, but in terms of the number of nodes, for the same number of k and n, k-ary n-dimensional inverse graph topological interconnected network Can connect more nodes than the k-ary n-dimensional cubic interconnected network. In the four-dimensional two-dimensional inverse graph topological interconnection network shown in FIG. 6, the number of connected nodes is 32, which is twice as large as the 16 nodes in FIG.
What is represented by a straight line, a circle, and a black point in FIG. 6 is the same as that in FIG. When the number of nodes that can be connected in the inverse graph topological mutually connected networks and N IG, 2
For dimensions, N IG = 2N, for three dimensions, N IG = 3N
Where N IG = nN for n dimensions.

【0011】8元立方体のインバースグラフトポロジカ
ル相互連接ネットワークにおいては、ノードの数は3×8
3=1536であり、1個のノードに8つのプロセサーを連接
させると、相互連接ネットワークに12288個のプロセサ
ーを連接できる。しかし、通常の8元立方体相互連接ネ
ットワークにおいては、ノードの数は83=512だけである
ので、同様に1個のノードに8つのプロセサーを連接さ
せると、相互連接ネットワークに4096個のプロセサーだ
けを連接できる。
In an octagonal inverse graph topological interconnected network, the number of nodes is 3 × 8
3 = 1536, and if one node is connected to eight processors, 12288 processors can be connected to the interconnection network. However, in a normal 8-element cubic interconnected network, the number of nodes is only 8 3 = 512. Similarly, when 8 processors are connected to one node, only 4096 processors are connected to the interconnected network. Can be connected.

【0012】インバースグラフトポロジカル相互連接ネ
ットワークではノードの数を増やすことができるが、逆
に各ノードの平均チャンネルの数が減ることになり、通
信バンド幅が相対的に狭くなる。通信バンド幅が広く、
かつネットワーク遅延を短くするために、本発明はイン
バースグラフトポロジカル相互連接ネットワークの中に
数がそれ程多くないクロスバースイッチ(或は高速バ
ス)を入れることによって、新しい相互連接ネットワー
クを構成する。本発明は、インバースグラフトポロジカ
ル相互連接ネットワークとクロスバースイッチ或は高速
バスを結合して、インバースグラフトポロジカル相互連
接ネットワークにおいて、プロセサーノードはルーター
に連接することの替わりに、ネットワークチャンネルに
連接することにし、インバースグラフトポロジカル相互
連接ネットワークの同一行と同一列のネットワークチャ
ンネルのk個ノードをそれぞれk×kクロスバスイッチ
或は高速バスを用いて連接することによって、新しい相
互連接ネットワークを構成し、1個のk元n次元立方体
新型相互連接ネットワークを1個の超ノードに見なすこ
とができ、更に大規模の計算機システムは複数の超ノー
ドからなることができ、超ノードの中の対応するノード
を高速バスを用いて連接し、新型相互連接ネットワーク
のノードが複数の端子を備え、3個の端子がある場合、
其の中の2個端子がネットワークチャンネルと連接し、
第3端子がクロスバースイッチ或は高速バスと連接し、
4個の端子がある場合、第4端子が超ノードを連接する
高速バスに連接し、新型相互連接ネットワークのノード
の3個端子は4端子高速キャッシュメモリからなり、4
端子高速キャッシュメモリの2個の端子がノードをネッ
トワークチャンネルに連接し、1個の端子がノードの内
部と連接し、他の1個端子がクロスバースイッチ或は高
速バスと連接することを特徴とする。
Although the number of nodes can be increased in the inverse graph topological interconnection network, the number of average channels of each node is reduced, and the communication bandwidth is relatively narrowed. Wide communication bandwidth,
In order to reduce network delay and to reduce network delay, the present invention constructs a new interconnection network by placing a small number of crossbar switches (or high-speed buses) in the inverse graph topological interconnection network. The present invention combines an inverse graph topological interconnection network with a crossbar switch or high-speed bus so that in the inverse graph topological interconnection network, processor nodes are connected to network channels instead of connecting to routers. , K nodes of the same row and the same column of the inverse graph topological interconnected network are connected by using a k × k crossbar switch or a high-speed bus to form a new interconnected network. The k-ary n-dimensional cubic new interconnected network can be regarded as one super node, and a large-scale computer system can be composed of a plurality of super nodes. Connected using the new Node 互連 contact network comprising a plurality of terminals, if there are three terminals,
Two of them are connected to the network channel,
The third terminal is connected to a crossbar switch or a high-speed bus,
If there are four terminals, the fourth terminal is connected to the high-speed bus connecting the super nodes, and the three terminals of the node of the new interconnection network are composed of four-terminal high-speed cache memory,
Two terminals of the terminal high-speed cache memory connect the node to the network channel, one terminal connects to the inside of the node, and the other terminal connects to the crossbar switch or the high-speed bus. I do.

【0013】[0013]

【発明の実施の形態】更に、本発明の特徴及び効果を
解するために、以下に本発明を図面に基づいて更に説明
する。図7は、4元2次元新型相互連接ネットワークを
示している。図7の点線は4×4クロスバースイッチ
(或は高速バス)により一行或は一列の4個のノードを
連接していること(例えばCSX0或はCSY0)を表す。情報
が一つのノードからクロスバースイッチ(或は高速バ
ス)を経由して他の一つのノードに達するまでの遅延時
間をtCSとし、情報が一つのノードから一つのルーター
を経由して隣接のノードに達するまでの時間をtRとする
と、図7に示すように、左下のノードN000から右上のノ
ードN330とノードN331までのネットワーク遅延はそれぞ
れ2(tCS + tR)と2tCS +tRになる。隣接するノードの間
のネットワーク遅延はtCS 或はtRだけである。k=8と
し、また、8×8クロスバースイッチ(或は高速バス)
を用いる場合、ネットワークの最大遅延は2(tCS + tR)
になる。また、図7に示すように、クロスバースイッチ
(或は高速バス)を用いる数は横方向と縦方向それぞれ
4個で、全部で8個になる。従って、本発明の新型相互
連接ネットワークにおいては、ハードウェアをそれ程多
く増やさなくても、ネットワークノードの数を倍以上増
やすことができる。即ち、本発明の新型相互連接ネット
ワークはインバースグラフトポロジカル相互連接ネット
ワークとクロスバースイッチ(或は高速バス)のメリッ
トを兼ねることにしても、かつそれらの不具合が生じな
い。
DETAILED DESCRIPTION OF THE INVENTION Further, in order to sense <br/> solutions features and advantages of the present invention will be further described the present invention based on drawings. FIG. 7 shows a four-dimensional two-dimensional advanced interconnection network. The dotted line in FIG. 7 indicates that four nodes in one row or one column are connected by a 4 × 4 crossbar switch (or high-speed bus) (for example, CSX0 or CSY0). Information is the delay time from one node to via the crossbar switch (or high-speed bus) reaches the other one of the nodes and t CS, information of the adjacent via one router from one node Assuming that the time required to reach the node is t R , as shown in FIG. 7, the network delay from the lower left node N000 to the upper right node N330 and node N331 is 2 (t CS + t R ) and 2t CS + t, respectively. Become R. The network delay between adjacent nodes is only t CS or t R. k = 8, and 8 × 8 crossbar switch (or high-speed bus)
, The maximum delay of the network is 2 (t CS + t R )
become. As shown in FIG. 7, the number of crossbar switches (or high-speed buses) used is four in each of the horizontal and vertical directions, for a total of eight. Therefore, in the new interconnection network of the present invention, the number of network nodes can be more than doubled without increasing the hardware much. In other words, even if the new interconnection network of the present invention combines the advantages of the inverse graph topological interconnection network and the crossbar switch (or high-speed bus), these problems do not occur.

【0014】図8は他の2次元新型相互連接ネットワー
クを示している。その新型相互連接ネットワークは図7
に示すような相互連接ネットワークと似ているが、図7
のクロスバースイッチ(或は高速バス)をノードを含む
ネットワークチャンネルに沿って設けるに対して、図8
のクロスバースイッチ(或は高速バス)をノードを含む
ネットワークチャンネルと垂直に設ける(例えばCSX0或
はCSY0)ことで異なっている。図7と図8に示すネット
ワークの最大遅延時間が同じで、クロスバースイッチ
(或は高速バス)を用いる数も同じである。k元立方体
相互連接ネットワークに対して、k×kクロスバースイ
ッチ(或は高速バス)を用いると、ネットワークの最大
遅延時間は3(tCS + tR)である。
FIG. 8 shows another two-dimensional advanced interconnection network. Figure 7 shows the new interconnected network.
7 is similar to the interconnected network shown in FIG.
8 is provided along the network channel including the nodes in FIG.
Is provided vertically (for example, CSX0 or CSY0) with a crossbar switch (or high-speed bus) perpendicular to the network channel including the node. 7 and 8 have the same maximum delay time and the same number of crossbar switches (or high-speed buses). If a k × k crossbar switch (or high-speed bus) is used for a k-ary cubic interconnected network, the maximum delay time of the network is 3 (t CS + t R ).

【0015】新型相互連接ネットワークは良い拡張性を
持つ。一つのk元n次元立方体新型相互連接ネットワー
クを一つの超ノードに見なすことができ、複数の超ノー
ドから更に大規模並行処理計算機システムになることが
できる。図9に示すように、図7の4元2次元新型相互
連接ネットワークを一つの超ノードとすると16個超ノー
ドから16元2次元新型相互連接ネットワークになること
ができ、超ノードの対応するノードを高速バスで連接す
る。図9の点線グリッドは超ノード(例えばSN00)を表
し、各超ノードに32個のノード(図中に一行と一列のノ
ード、8個のノードだけを図示している)がある。超ノ
ードを連接する高速バス(例えばHSBX0)を太線で表
し、超ノード中のノード(例えばN301)を丸で表し、超
ノード内部の4個ノードを連接するクロスバースイッチ
(或は高速バス)(例えばCSX3)を細線で表す。拡張さ
れた新型相互連接ネットワークに連接されるノードの数
はもとの16倍に増加し、即ち、もとの32個から512個に
拡張した。各超ノードを32本のバスで同一行或は同一列
の他の超ノードと連接する。この場合、ネットワーク遅
延は超ノード内部の遅延以外に、二つのバス及び関連す
る連接回路の遅延だけが増えることになる。
The new interconnection network has good scalability. One k-ary n-dimensional cubic new interconnection network can be regarded as one super node, and a plurality of super nodes can become a larger-scale parallel processing computer system. As shown in FIG. 9, if the quaternary two-dimensional new interconnection network of FIG. 7 is made into one super node, a 16-element two-dimensional new interconnection network can be formed from more than 16 nodes, and the corresponding node of the super node Connect by highway bus. The dotted grid in FIG. 9 represents super nodes (for example, SN00), and each super node has 32 nodes (one row and one column, only eight nodes are shown in the figure). A high-speed bus (for example, HSBX0) connecting the super nodes is represented by a thick line, a node (for example, N301) in the super node is represented by a circle, and a crossbar switch (or a high-speed bus) that connects four nodes inside the super node ( For example, CSX3) is represented by a thin line. The number of nodes connected to the expanded new interconnection network has increased 16 times from the original, that is, from the original 32 to 512. Each super node is connected to another super node in the same row or column by 32 buses. In this case, the network delay is not only the delay inside the super node, but also the delay of the two buses and the associated connecting circuit.

【0016】同じように、k元立方体新型相互連接ネッ
トワークを超ノードとし、このような複数の超ノードか
ら更に大規模の立方体新型相互連接ネットワークになる
と、ノードの数は更に多く増やすことができ、且つネッ
トワーク遅延は三つのバス及び関連する直接回路の遅延
だけが増えることになる。図10は64個ノードからなる新
型相互連接ネットワークを示している。図中の一つの小
立方体は一つの超ノード(例えばSN030)を表し、各超
ノードは8元立方体新型相互連接ネットワークからな
る。各超ノードの一つのノードは二つのプロセサーを含
むと、この相互連接ネットワークは3×83×2×64=1966
08個のプロセサーを連接できる。各プロセサーの演算速
度は秒毎に5億回であれば、このような大規模並行処理
計算機システムの演算速度は秒毎に100兆回になる。
Similarly, if the k-ary cubic new interconnection network is a super node, and from such a plurality of super nodes to a larger cubic new interconnection network, the number of nodes can be further increased, And the network delay will only increase the delay of the three buses and associated direct circuits. FIG. 10 shows a new type of interconnected network consisting of 64 nodes. One small cube in the figure represents one super node (for example, SN030), and each super node is composed of an eight-way cube new interconnection network. If one node of each supernode contains two processors, this interconnected network becomes 3 × 8 3 × 2 × 64 = 1966
You can connect up to 08 processors. If the operation speed of each processor is 500 million operations per second, the operation speed of such a large-scale parallel processing computer system is 100 trillion operations per second.

【0017】本発明で提出された上記新型相互連接ネッ
トワークは数千、数万、更にもっと多いプロセサーを連
接でき、クロスバースイッチと、k元n次元立方体相互
連接ネットワークと、インバースグラフトポロジカル相
互連接ネットワークとのメリットを兼ね、かつそれらの
不具合が生じない。クロスバースイッチ(高速バス)と
比べると、新型相互連接ネットワークの拡張性はより良
く、k元n次元立方体相互連接ネットワークと比べる
と、同じ規模の相互連接ネットワークに対して、新型相
互連接ネットワークはもっと多いプロセサーを連接で
き、且つネットワーク遅延時間が短く、k元n次元立方
体インバースグラフトポロジカル相互連接ネットワーク
と比べると、新型相互連接ネットワークの通信バンド幅
が広く、且つネットワーク遅延時間が短い。従って、本
発明で提出された上記新型相互連接ネットワークのメリ
ットは以下のように:大量のプロセサーを連接でき、プ
ロセサーの数を数千、数万、更にもっと多くしても良い
こと、ネットワーク遅延時間が短いこと、通信バンド幅
が広いこと、拡張性はより良いこと、とまとめることが
できる。
The new interconnected network proposed in the present invention can connect thousands, tens of thousands, and even more processors, including crossbar switches, k-ary n-dimensional cubic interconnected networks, and inverse graph topological interconnected networks. And the disadvantages do not occur. Compared with the crossbar switch (high-speed bus), the new interconnected network has better scalability, and compared with the k-ary n-dimensional cubic interconnected network, the new interconnected network is more for the same size interconnected network. A large number of processors can be connected and the network delay time is short. Compared with the k-ary n-dimensional cube inverse graph topological interconnected network, the new interconnected network has a wider communication bandwidth and a shorter network delay time. Therefore, the advantages of the new interconnection network proposed in the present invention are as follows: a large number of processors can be connected, the number of processors can be thousands, tens of thousands, and even more; Is shorter, the communication bandwidth is wider, and the scalability is better.

【0018】新型相互連接ネットワークにおいて、図11
に示す1、2、3のように、ノードは3つの端子をも
ち、端子1はクロスバースイッチ(高速バス)と連接
し、端子2と端子3はそれぞれノード両側のネットワー
クチャンネルCCと連接する。ノードの3つの端子は4端
子高速キャッシュメモリで実現できる。
In the new interconnection network, FIG.
As shown in 1, 2, and 3, the node has three terminals, the terminal 1 is connected to the crossbar switch (high-speed bus), and the terminals 2 and 3 are connected to the network channels CC on both sides of the node. The three terminals of the node can be realized by a four-terminal high-speed cache memory.

【0019】図12は図7の一行或は一列のブロック図を
示している。図中の4端子メモリの4つの端子はそれぞ
れ二つのネットワークチャンネルCCと、4×4クロスバ
ースイッチ(高速バス)と、ノード内部のバスと連接す
る。ノードに4端子メモリを用いることは、メモリの4
つの端子はノードをネットワークチャンネルに便利に連
接させること、メモリは塞がれた相互連接ネットワーク
のデータを一時記憶できるため、ルーターの構造を簡略
化できること、ノードをネットワークチャンネルに連接
させるため、メモリの端子の数は相互連接ネットワーク
の次元の数に無関係になるので、2次元、3次元或はも
っと高い次元に対しても、メモリの端子の数も変えるこ
とを必要としないこと、の特徴がある。ノードに4端子
メモリを用いることは本発明の新型相互連接ネットワー
ク技術のキーポイントである。
FIG. 12 is a block diagram of one row or one column of FIG. The four terminals of the four-terminal memory in the figure are respectively connected to two network channels CC, a 4 × 4 crossbar switch (high-speed bus), and a bus inside the node. Using a four-terminal memory for a node requires only four
One terminal connects the node to the network channel conveniently, the memory can temporarily store the data of the closed interconnected network, so that the structure of the router can be simplified, and the node can be connected to the network channel. The feature is that the number of terminals does not need to be changed for two, three, or higher dimensions, since the number of terminals is independent of the number of dimensions of the interconnected network. . The use of a four-terminal memory for a node is a key point of the novel interconnected network technology of the present invention.

【0020】超ノードからなる相互連接ネットワークに
おいて、超ノードの間の連接について数種類の方式で行
うことができる。その一つの方式は、図13に示す1、
2、3と4のように、ノードが4つの端子をもち、端子
2と端子3はそれぞれノード両側のネットワークチャン
ネルCCと連接し、端子1は超ノード内部の高速バスと連
接し、端子4は超ノードを連接する高速バスと連接す
る。超ノードの間の連接は多級連接方式或は他の方式を
用いて連接しても良い。新型相互連接ネットワークにお
いて、ノードがルーターに連接しないため、このルータ
ーが通常のk元n次元立方体相互連接ネットワークのル
ーターより一つの端子をなくすことですむので、構造を
簡略化することができる。図14に示すように、2次元の
新型相互連接ネットワークに対して、ルーターは横ネッ
トワークチャンネルXと縦ネットワークチャンネルYと
の間にデータ転送をおこなうことだけでよく、3次元の
新型相互連接ネットワークに対して、ルーターはX、Y
とZの三つ方向のネットワークチャンネルの間にデータ
転送をおこなうことだけでよい。
In an interconnected network of supernodes, connections between supernodes can be made in several different ways. One of the methods is shown in FIG.
As in 2, 3, and 4, the node has four terminals, terminals 2 and 3 are connected to the network channels CC on both sides of the node, terminal 1 is connected to the high-speed bus inside the super node, and terminal 4 is Connect to the high-speed bus connecting the super nodes. The connection between the super nodes may be connected using a multi-level connection method or another method. In the new interconnection network, since the nodes do not connect to the router, the structure of the router can be simplified because the router need not have one terminal than the router of the usual k-dimensional n-dimensional cubic interconnection network. As shown in FIG. 14, for the new two-dimensional interconnected network, the router only needs to perform data transfer between the horizontal network channel X and the vertical network channel Y. On the other hand, the router is X, Y
It is only necessary to perform the data transfer between the three-way network channels Z and Z.

【0021】新型相互連接ネットワークのネットワーク
チャンネルと高速バスは電気転送線を用いるが、光ファ
イバーを用いてもよい。また、短距離転送に電気転送線
を用い、長距離転送に光ファイバーを用いてもよい。ネ
ットワークチャンネルに全部光ファイバーを用いてもよ
く、この場合、ルーターの機能は同一光ファイバーに異
なる波長の光信号で実現すれば良い。
The network channels and high-speed buses of the new interconnected network use electrical transfer lines, but may use optical fibers. Further, an electric transfer line may be used for short-distance transfer, and an optical fiber may be used for long-distance transfer. An optical fiber may be used for all the network channels. In this case, the function of the router may be realized by optical signals of different wavelengths on the same optical fiber.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 従来のバスで連接する複数のプロセサーを示
す概略図である。
FIG. 1 is a schematic diagram showing a plurality of processors connected by a conventional bus.

【図2】 従来のクロスバースイッチ相互連接ネットワ
ークを示す概略図である。
FIG. 2 is a schematic diagram showing a conventional crossbar switch interconnection network.

【図3】 従来の4元2次元相互連接ネットワークを示
す概略図である。
FIG. 3 is a schematic diagram showing a conventional four-dimensional two-dimensional interconnected network.

【図4】 従来の4元立方体相互連接ネットワークを示
す概略図である。
FIG. 4 is a schematic diagram showing a conventional quaternary cubic interconnection network.

【図5】 従来の2次元インバースグラフトポロジカル
相互連接ネットワークを示す概略図である。
FIG. 5 is a schematic diagram showing a conventional two-dimensional inverse graph topological interconnection network.

【図6】 4元2次元インバースグラフトポロジカル相
互連接ネットワークを示す概略図である。
FIG. 6 is a schematic diagram illustrating a quaternary two-dimensional inverse graph topological interconnected network.

【図7】 本発明の4元2次元新型相互連接ネットワー
クの一実施形態を示す概略図である。
FIG. 7 is a schematic diagram illustrating an embodiment of a new four-dimensional two-dimensional interconnected network of the present invention.

【図8】 本発明の4元2次元新型相互連接ネットワー
クの他の一実施形態を示す概略図である。
FIG. 8 is a schematic diagram showing another embodiment of the new four-dimensional two-dimensional interconnection network of the present invention.

【図9】 本発明の超ノードの中の対応するノードを高
速バスに通じて連接する概略図である。
FIG. 9 is a schematic diagram of connecting corresponding nodes in the super node of the present invention through a high-speed bus.

【図10】 本発明の64個の超ノードからなる相互連接
ネットワークを示す概略図である。
FIG. 10 is a schematic diagram illustrating an interconnected network of 64 supernodes of the present invention.

【図11】 本発明の3端子ノードを示す概略図であ
る。
FIG. 11 is a schematic diagram showing a three-terminal node of the present invention.

【図12】 図7に示した本発明の一行或は一列を示す
概略図である。
FIG. 12 is a schematic diagram showing one row or one column of the present invention shown in FIG. 7;

【図13】 本発明の4端子ノードを示す概略図であ
る。
FIG. 13 is a schematic diagram showing a four-terminal node of the present invention.

【図14】 本発明の2次元新型相互連接ネットワーク
のルーターの機能を示す概略図である。
FIG. 14 is a schematic diagram showing the function of a router of the two-dimensional new interconnection network of the present invention.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 インバースグラフトポロジカル相互連接
ネットワークとクロスバースイッチ或は高速バスを結合
して、前記インバースグラフトポロジカル相互連接ネッ
トワークにおいて、プロセサーノードはルーターに連接
する替わりに、ネットワークチャンネルに連接し、前記
インバースグラフトポロジカル相互連接ネットワークの
同一行と同一列のネットワークチャンネルのk個ノード
をそれぞれk×kクロスバースイッチ或は高速バスを用
いて連接することによって、新しい相互連接ネットワー
クを構成し、1個のk元n次元立方体新型相互連接ネッ
トワークを1個の超ノードに見なすことができ、複数の
前記超ノードから更に大規模の計算機システムになるこ
とができ、前記超ノードの中の対応するノードを高速バ
スを用いて連接し、前記新型相互連接ネットワークのノ
ードが複数の端子を備え、3個の端子がある場合、其の
中の2個端子がネットワークチャンネルと連接し、第3
端子が前記クロスバースイッチ或は前記高速バスと連接
し、4個の端子がある場合、第4端子が前記超ノードを
連接する高速バスに連接することを特徴とする大規模並
行処理計算システムの新型相互連接ネットワーク方法。
1. An inverse graph topological interconnection network coupled to a crossbar switch or a high-speed bus, wherein in the inverse graph topological interconnection network, a processor node is connected to a network channel instead of being connected to a router; A new interconnected network is constructed by interconnecting k nodes of the same row and column of the inverse graph topological interconnected network using k × k crossbar switches or high-speed buses, respectively. The k-ary n-dimensional cubic new interconnected network can be regarded as one super node, a large-scale computer system can be formed from a plurality of super nodes, and a corresponding node among the super nodes can be processed at high speed. Connected using a bus, Node of the serial new mutual articulation network comprising a plurality of terminals, if there are three terminals, two terminals therein and connected to the network channel, the third
A terminal is connected to the crossbar switch or the high-speed bus, and when there are four terminals, a fourth terminal is connected to a high-speed bus connecting the super nodes. A new type of interconnected network method.
【請求項2】 前記新型相互連接ネットワークのノード
の3個端子は4端子高速キャッシュメモリからなり、前
記4端子高速キャッシュメモリの2個の端子がノードを
ネットワークチャンネルに連接し、1個の端子がノード
の内部と連接し、他の1個端子が前記クロスバースイッ
チ或は前記高速バスと連接することを特徴とする請求項
1記載の大規模並行処理計算機システムの新型相互連接
ネットワーク方法。
2. The three terminals of the node of the new interconnection network comprise a four-terminal high-speed cache memory. Two terminals of the four-terminal high-speed cache memory connect the node to a network channel, and one terminal has 2. The new interconnection network method for a large-scale parallel processing computer system according to claim 1, wherein the other one terminal is connected to the inside of the node, and another terminal is connected to the crossbar switch or the high-speed bus.
JP10298003A 1998-01-21 1998-10-20 Interconnection net work method of large scale parallel processing computer system Pending JPH11212942A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 97116994 CN1085361C (en) 1998-01-21 1998-01-21 Interconnection network technology for large scale parallel processing computer system
CN97116994-2 1998-01-21

Publications (1)

Publication Number Publication Date
JPH11212942A true JPH11212942A (en) 1999-08-06

Family

ID=5174267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10298003A Pending JPH11212942A (en) 1998-01-21 1998-10-20 Interconnection net work method of large scale parallel processing computer system

Country Status (2)

Country Link
JP (1) JPH11212942A (en)
CN (1) CN1085361C (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117807017A (en) * 2024-03-01 2024-04-02 中国人民解放军国防科技大学 High-performance computer with cube supernode multi-plane interconnection and communication method thereof
CN117807017B (en) * 2024-03-01 2024-05-14 中国人民解放军国防科技大学 High-performance computer with cube supernode multi-plane interconnection and communication method thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1921437B (en) * 2006-08-04 2010-05-12 上海红神信息技术有限公司 Inside and outside connecting network topology framework and parallel computing system for self-consistent expanding the same
CN1921428B (en) * 2006-08-25 2010-04-07 上海红神信息技术有限公司 Self-consistent multiple factorial tensor expanding method and multiple MPU parallel computing system
JP5368687B2 (en) * 2007-09-26 2013-12-18 キヤノン株式会社 Arithmetic processing apparatus and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117807017A (en) * 2024-03-01 2024-04-02 中国人民解放军国防科技大学 High-performance computer with cube supernode multi-plane interconnection and communication method thereof
CN117807017B (en) * 2024-03-01 2024-05-14 中国人民解放军国防科技大学 High-performance computer with cube supernode multi-plane interconnection and communication method thereof

Also Published As

Publication number Publication date
CN1085361C (en) 2002-05-22
CN1224196A (en) 1999-07-28

Similar Documents

Publication Publication Date Title
KR101956855B1 (en) Fabric interconnection for memory banks based on network-on-chip methodology
US4731878A (en) Self-routing switch node combining electronic and photonic switching
US5715391A (en) Modular and infinitely extendable three dimensional torus packaging scheme for parallel processing
JPH0151108B2 (en)
US7426214B2 (en) Multiple level minimum logic network
EP1016980A2 (en) Distributed multi-fabric interconnect
KR100259276B1 (en) Interconnection network having extendable bandwidth
JPS6340383B2 (en)
JP2001356847A (en) Electronic system
JPH07101876B2 (en) Network communication system having N inlets and M outlets
JPS6360579B2 (en)
JPH0732392B2 (en) Exchange method
CN102780936B (en) Optical on-chip network system of non-blocking communication and communication method thereof
US20080101395A1 (en) System and Method for Networking Computer Clusters
US8160061B2 (en) Redundant network shared switch
JPH0635874A (en) Parallel processor
KR0175499B1 (en) Broadcast transmission method in multi-tag hierarchical interconnection network
JPH11212942A (en) Interconnection net work method of large scale parallel processing computer system
CN109271338B (en) Reconfigurable on-chip optical interconnection structure and communication method for storage system
Satish et al. RiCoBiT-A topology for the future multi core processor: A concept analysis and review of literature
KR0170493B1 (en) Non-blocking fault tolerance gamma network for multi-processor system
CN110568552B (en) Large-scale array crossed waveguide recombination and separation structure and design method thereof
JPH08167909A (en) Output buffer type atm switch
CN212846786U (en) Accelerating unit and electronic equipment
CN113709604B (en) Rapid reconfigurable non-blocking full-connection router based on annular turntable bus architecture

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20031211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070522