JPS63316254A - Parallel processor - Google Patents

Parallel processor

Info

Publication number
JPS63316254A
JPS63316254A JP62151381A JP15138187A JPS63316254A JP S63316254 A JPS63316254 A JP S63316254A JP 62151381 A JP62151381 A JP 62151381A JP 15138187 A JP15138187 A JP 15138187A JP S63316254 A JPS63316254 A JP S63316254A
Authority
JP
Japan
Prior art keywords
transfer path
transfer
switch
processor
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62151381A
Other languages
Japanese (ja)
Other versions
JP2967928B2 (en
Inventor
Takashi Kimura
隆 木村
Tomoo Fukazawa
深沢 友雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62151381A priority Critical patent/JP2967928B2/en
Publication of JPS63316254A publication Critical patent/JPS63316254A/en
Application granted granted Critical
Publication of JP2967928B2 publication Critical patent/JP2967928B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PURPOSE:To increase efficiency to use a transfer channel by providing in a one-dimensional transfer channel plural switch circuits with a means to electri cally disconnect or connect a one-dimensional transfer channel. CONSTITUTION:One data transfer channel commonly used by plural processor elements PE1-PE3 is divided into the transfer channels P1-P3 of an arbitrary number and an arbitrary length by distributed and inserted switch circuits SW1-SW4. Switch circuits SW1-SW3 are constituted of a circuit regarding the transfer channel of right and left directions. A transfer circuit changing-over circuit SC electrically connects and disconnects a transfer channel DRi of an input side and a transfer channel D'Ri of an output side, based on a change-over controlling signal S from a transfer channel deciding circuit PD, a transfer channel is formed without depending on far and near transfer distances, in accordance with the transfer request of the processor elements PE1-PE3 asynchronously generated.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ハード量が少なく、小形にして転送路の使用
効率が高く、任意の演算プロセッサ間で転送路の競合が
無く、効率的にデータの授受を行なう並列プロセッサに
関するものである。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention has a small amount of hardware, is compact, has high efficiency in the use of transfer paths, and has no contention for transfer paths between arbitrary arithmetic processors. It relates to parallel processors that exchange data.

〔従来の技術〕[Conventional technology]

複数のプロセッサ間の相互のデータ転送を行なう装置と
しては、各プロセッサが共通に転送路を使用する第12
図に示すようなハス構造が最もハード量が少なく並列プ
ロセッサとして小形化が可能な構成である。しかし、こ
のバスを用いた並列プロセッサでは、1度に2つのプロ
セッサしか転送路を使用できず、他の多くのプロセッサ
は転送路が空くまで処理を中断して待たねばならない。
As a device for mutually transferring data between a plurality of processors, a twelfth processor in which each processor uses a common transfer path is used.
The helical structure shown in the figure has the smallest amount of hardware and is a configuration that can be miniaturized as a parallel processor. However, in parallel processors using this bus, only two processors can use the transfer path at a time, and many other processors must suspend processing and wait until the transfer path becomes free.

このため、並列プロセッサの数が増大するとともに、演
算処理と転送とを合わせた全体の処理実効時間は大幅に
増大し、処理速度が低下するという欠点があった。なお
、第12図において、PEI〜PE6はプロセッサ要素
、BSはバス、ABはバス調定(アービタ)である。
Therefore, as the number of parallel processors increases, the total effective processing time including arithmetic processing and transfer increases significantly, resulting in a decrease in processing speed. In FIG. 12, PEI to PE6 are processor elements, BS is a bus, and AB is a bus arbiter.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

一方、転送路のデータ競合を無くすため 、第13図に
示すようなりロスバスイッチC8や多段スイッチなどの
専用の転送装置を負荷した並列プロセッサでは、1度に
すべてのプロセッサがそれぞれ他の1つのプロセッサと
の転送路を実現し、・転送の効率化・高速化を図ること
ができる。しかし、このような高速転送装置の問題は、
すべてのプロセッサから独立に転送装置に信号線が集中
し、接続ケーブルの本数が膨大になり、並列プロセッサ
のプロセッサ数の増大とともに実現不可能な規模になる
という欠点があった。
On the other hand, in order to eliminate data conflicts on the transfer path, in a parallel processor loaded with a dedicated transfer device such as a loss bar switch C8 or a multi-stage switch as shown in Fig. It is possible to realize a transfer path with the processor and improve the efficiency and speed of transfer. However, the problem with such high-speed transfer devices is that
Signal lines are concentrated in the transfer device independently from all the processors, the number of connection cables becomes enormous, and the scale becomes unrealizable as the number of parallel processors increases.

本発明はこのような点に鑑みてなされたものであり、そ
の目的とするところは、同時に多数の転送経路を実現し
、個々の転送路の使用効率を高め、並列プロセッサの処
理実効速度を向上させ、転送装置の小形化と高速性を両
立させた並列プロセッサを提供することにある。
The present invention has been made in view of these points, and its purpose is to simultaneously realize a large number of transfer paths, increase the efficiency of using each transfer path, and improve the effective processing speed of parallel processors. The object of the present invention is to provide a parallel processor that achieves both compactness and high speed of a transfer device.

〔問題点を解決するための手段〕[Means for solving problems]

このような目的を達成するために本発明は、複数のプロ
セッサ要素と、この複数のプロセッサ要素の任意の2つ
のプロセッサ要素間で転送経路を構成しデータの転送・
情報の授受を行なう転送装置とからなる並列プロセッサ
において、一次元状の転送路と、この転送路中に電気的
に一次元の転送路を切断もしくは接続する手段を有する
複数のスイッチ回路とを備え、スイッチ回路によって分
断された各転送路にプロセッサ要素を接続するようにし
たものである。
In order to achieve such an object, the present invention configures a transfer path between a plurality of processor elements and any two processor elements of the plurality of processor elements, and transfers and transfers data.
A parallel processor comprising a transfer device that sends and receives information, which includes a one-dimensional transfer path and a plurality of switch circuits in the transfer path that have means for electrically disconnecting or connecting the one-dimensional transfer path. , a processor element is connected to each transfer path separated by a switch circuit.

〔作用〕[Effect]

本発明による並列プロセッサは、ハード規模が小さいバ
ス構造を基本としながら、1本の信号転送路を、分散的
に挿入したスイッチ回路によって、任意の数と任意の長
さの転送路に分割することを可能にする。また、転送路
分割と使用のための転送路の空き管理制御を簡単な方法
で転送路自身が行なうことができ、プロセッサからの要
求発生に応じて転送経路をダイナミックに変えられ、1
度に多数の2つのプロセッサ間転送路を確保できる。
The parallel processor according to the present invention is based on a bus structure with a small hardware scale, and can divide one signal transfer path into transfer paths of an arbitrary number and arbitrary length using switch circuits inserted in a distributed manner. enable. In addition, the transfer path itself can perform transfer path division and free space management control for use in a simple manner, and the transfer path can be dynamically changed in response to requests from the processor.
A large number of transfer paths between two processors can be secured at a time.

〔実施例〕〔Example〕

本発明の第1の特徴は、第2図に示すように、1本のデ
ータ転送線路を複数のプロセッサ要素PE1〜PE3が
共用する構成でありながら、1本の転送線路に分散して
スイッチ回路5wt−5w4を挿入し、このスイッチ回
路で挾まれた転送路PI、P2.P3をバスとしてプロ
セッサ要素PEl、PE2.PE3を接続した構成であ
る。
The first feature of the present invention is that, as shown in FIG. 2, although one data transfer line is shared by a plurality of processor elements PE1 to PE3, switch circuits are distributed over one data transfer line. 5wt-5w4 are inserted, and the transfer paths PI, P2 . Processor elements PEl, PE2 . This is a configuration in which PE3 is connected.

本発明の第2の特徴は、1本の転送路を任意に分割して
、それぞれ独立した転送路として使用でき、また、各プ
ロセッサ要素が転送路使用のスケジュール表に基づいて
競合のない転送装置として、転用予約手続きを自動的に
できる手段を有している点にある。
The second feature of the present invention is that one transfer path can be arbitrarily divided and used as independent transfer paths, and that each processor element is configured as a transfer device without contention based on a transfer path use schedule. The point is that it has a means to automatically perform the diversion reservation procedure.

本発明の第3の特徴は、転送路の空きで使用可能な経路
と、各プロセッサ要素の使用要求の発生とデータ授受を
必要とするプロセッサとの転送距離とが判明した時点で
、ダイナミックに転送経路設定が可能な制御手段を有し
ている点にある。
The third feature of the present invention is that the transfer is performed dynamically at the time when it is determined which available transfer paths are available, the occurrence of a request to use each processor element, and the transfer distance between the processor and the processor that requires data exchange. The point is that it has a control means that allows route setting.

この特徴は、簡単な信号の授受により効率的に自動的に
転送路は右と左の独立した方向を持った転送線路で構成
され、−次元上に配置されたスイッチ回路が、転送方向
に対し、前段からの要求信号と個々に管理するプロセッ
サ要素からの要求信号とから転送経路の始点を判断し、
これにより、全く非同期に発生するプロセッサ要素の転
送要求に応じて、しかも必要なプロセッサ要素間の転送
距離の遠近に依存しないで転送経路が形成されることを
特徴としている。
This feature is that the transfer path is configured with transfer lines with independent directions of right and left, and the switch circuit arranged on the - dimension is configured to efficiently and automatically transfer signals by simply sending and receiving signals. , determines the starting point of the transfer path from the request signal from the previous stage and the request signal from the individually managed processor element,
As a result, a transfer path is formed in response to transfer requests of processor elements that occur completely asynchronously, and without depending on the required transfer distance between processor elements.

本発明の第4の特徴は、転送路を複数の信号線路で構成
し、この信号線路をスイッチ回路間で乗り換えられるよ
うに、次段の転送路の信号線の空き情報に基づいて前段
の転送路の信号線と後段の転送路の信号線とを独立に接
続する回路を設けたスイッチ回路を構成している点にあ
る。
The fourth feature of the present invention is that the transfer path is configured with a plurality of signal lines, and the transfer of the previous stage is based on the information on the availability of the signal line of the next stage transfer path so that the signal line can be transferred between switch circuits. The switch circuit is configured with a circuit that independently connects the signal line of the transfer path and the signal line of the subsequent transfer path.

特許請求の範囲第1項、第2項記載の発明の実施例とし
ての並列プロセッサの構成を第1図に示し、スイッチ回
路を第3図に、そのスイッチ回路の処理フローを第4図
に、並列プロセッサのスイッチ回路の動作状態の変化を
第5図に、プロセンサ要素の転送路インタフェースを第
6図に示す。
The configuration of a parallel processor as an embodiment of the invention described in claims 1 and 2 is shown in FIG. 1, a switch circuit is shown in FIG. 3, and a processing flow of the switch circuit is shown in FIG. FIG. 5 shows changes in the operating state of the switch circuit of the parallel processor, and FIG. 6 shows the transfer path interface of the processor element.

第1図で、スイッチSW1〜SW3は転送路中に挿入さ
れたスイッチ回路で、PEI〜PE3はスイッチ回路で
挟まれた転送路に接続されたプロセッサ要素である。第
1図において、DRおよびDLはそれぞれ左から右およ
び右から左方向のデータの転送路であり、QDR,AD
RおよびQDL、ADLはそれぞれ左から右へおよび右
から左への転送経路予約情報QD (Query Di
stance)とその転送経路確認情報A D (Ac
quired Distance)の情報である。LR
eqR,LReqLはDR,DLの転送路それぞれに対
するプロセッサ要素からの転送要求信号(Local 
ReqR,L)である。
In FIG. 1, switches SW1 to SW3 are switch circuits inserted into a transfer path, and PEI to PE3 are processor elements connected to the transfer path sandwiched between the switch circuits. In FIG. 1, DR and DL are data transfer paths from left to right and from right to left, respectively, and QDR, AD
R, QDL, and ADL are left-to-right and right-to-left transfer route reservation information QD (Query Di
stance) and its transfer route confirmation information A D (Ac
required Distance). LR
eqR and LReqL are transfer request signals (Local
ReqR,L).

第1図において、スイッチ回路SW1〜SW3は、右方
向、左方向の転送路に関する回路で構成される。
In FIG. 1, switch circuits SW1 to SW3 are constructed of circuits related to rightward and leftward transfer paths.

第3図はスイッチ回路SWj (j=1.2.  ・・
・)の右方向の転送路に関する回路を示したもので、S
Cは転送路切替回路で、その他に転送要求処理回路RP
と転送経路判定回路PDとから構成されている。右方向
の転送路も同様である。転送路切替回路SCは、ここで
は、ハイインピーダンスを含む3値をとるバッファBU
Fでの組合せで構成され、転送経路判定回路PDからの
切替制御信号Sに基づいて、入力側の転送路DRi (
i=0. 1.  ・・・、m)と出力側の転送路D’
Ri  (i=0.1.  ・・・、m)とを電気的に
接続したり、切断したりする。以下、右、左の添字R1
Lを省略する。
Figure 3 shows the switch circuit SWj (j=1.2.
・) This shows the circuit related to the rightward transfer path of S.
C is a transfer path switching circuit, and a transfer request processing circuit RP is also included.
and a transfer route determination circuit PD. The same applies to the rightward transfer path. Here, the transfer path switching circuit SC is a buffer BU that takes three values including high impedance.
Based on the switching control signal S from the transfer route determination circuit PD, the input side transfer route DRi (
i=0. 1. ..., m) and the output side transfer path D'
It electrically connects and disconnects Ri (i=0.1. . . . , m). Below, right and left subscripts R1
Omit L.

次に、第3図の回路の動作について説明する。Next, the operation of the circuit shown in FIG. 3 will be explained.

1.1)  転送要求処理回路RPに前段スイッチから
RReqin、接続されたプロセッサ要素からLReq
inが入力される。
1.1) Transfer request processing circuit RP receives RReqin from the previous switch and LReq from the connected processor element.
in is input.

1.2)  RReqinはフリップフロップFFIに
リモート・バス・ステート(Remote Path 
5tate、  RPS)として記憶され、LReqi
nはフリップフロップFF2にローカル・バス・ステー
ト(LocalPath 5tate、  L P S
)として記憶される。前段スイッチに接続されたプロセ
ッサ要素から要求があれば、RPS、LPSが1になる
1.2) RReqin inputs the remote bus state (Remote Path) to the flip-flop FFI.
5tate, RPS) and LReqi
n is the local bus state (LocalPath 5tate, L P S
). If there is a request from the processor element connected to the front-stage switch, RPS and LPS become 1.

1.3)制御論理手段PCON (プライオリティコン
トローラ)はRPS、LPSを監視する。RPSの方が
プライオリティが高い。RPS=1のときは、LPSの
いかんにかかわらずオリジン(ORG)=Oとし、接続
プロセッサ要素からの要求を無視する。RReqout
にRReqinを出力する。
1.3) Control logic means PCON (priority controller) monitors RPS, LPS. RPS has higher priority. When RPS=1, the origin (ORG) is set to O regardless of the LPS, and requests from connected processor elements are ignored. RReqout
Output RReqin to .

RP、S = OのときはLPSをみる。LPS=1の
ときは接続プロセッサ要素から要求があるので、0RG
=1とする(第4図のステップ1.2)。
When RP, S = O, look at LPS. When LPS = 1, there is a request from the connected processor element, so 0RG
=1 (step 1.2 in FIG. 4).

LPS=0のときは要求がないので、0RG=0とする
(第4図のステップ1. 3) o RReqout=
0が出力される。
When LPS=0, there is no request, so set 0RG=0 (step 1.3 in Figure 4) o RReqout=
0 is output.

次に、第3図の回路の動作を第4図を用いて説明する。Next, the operation of the circuit shown in FIG. 3 will be explained using FIG. 4.

第4図はスイッチ回路の基本処理を示したもので、プロ
セッサ要素と前段のスイッチからの転送路使用要求の有
無、転送経路予約情報と転送経路確認情報の入力情報と
の一致によって前段のスイッチあるいはプロセッサ要素
への転送経路予約情報QDoutと転送経路確認情報A
Doutを出力する。
Figure 4 shows the basic processing of the switch circuit, and depending on whether there is a request to use the transfer path from the processor element and the previous switch, and whether there is a match between the input information of the transfer route reservation information and the transfer route confirmation information, Transfer route reservation information QDout and transfer route confirmation information A to the processor element
Output Dout.

2.1)転送経路判定回路PDに、前段スイッチからQ
 D in %後段スイッチからADinが入力される
。後段スイッチにQDoutが出力され、前段スイッチ
にADoutとACKR(一致信号)が出力される。
2.1) Q from the previous stage switch to the transfer path determination circuit PD
D in % ADin is input from the subsequent switch. QDout is output to the rear switch, and ADout and ACKR (coincidence signal) are output to the front switch.

2.2)制御論理手段SD(ステータスディテクタ)は
ORGとRReqoutを監視する。RPS。
2.2) Control logic means SD (Status Detector) monitors ORG and RReqout. RPS.

LPS共にOのとき(ステップ4からステップ5、へ移
行するとき)、後段からのADinに1を加え、前段に
A Dout= A Din+ 1を前段のスイッチ回
路に出力する(ステップ5)。自らの要求はないので、
後段の空き区間数に自らの区間を加えて前段に伝えるの
である。第3図のINCは1を加算するインクリメンタ
である。
When both LPS are O (when moving from step 4 to step 5), 1 is added to ADin from the subsequent stage, and A Dout=A Din+ 1 is output to the previous stage switch circuit (step 5). Since there are no demands of their own,
It adds its own section to the number of empty sections in the subsequent section and transmits the result to the previous section. INC in FIG. 3 is an incrementer that adds 1.

2.3)  RPS、LPSのいずれかが1のときはス
テップ6へ移行しくステップ1〜4) 、0RG=0で
あれば前段からのQD□ヵに1を滅じ(ステップ7)、
後段にQ Dout= Q D in  1を出力する
(ステップ6〜10)。QDoutは要求区間数を示し
、自らを区間として設定するのでこれを減じて後段に伝
えるのである。DECは1を減算するデクリメンタであ
る。0RG= 1であれば、接tEPBが要求するQD
inを後段に出力する(ステップ9.10)。
2.3) If either RPS or LPS is 1, proceed to step 6. Steps 1 to 4) If 0RG = 0, destroy 1 in QD□ka from the previous stage (step 7),
Q Dout=Q D in 1 is output to the subsequent stage (steps 6 to 10). QDout indicates the number of requested sections and sets itself as the section, so this is subtracted and transmitted to the subsequent stage. DEC is a decrementer that subtracts 1. If 0RG = 1, the QD required by the contact EPB
in is output to the subsequent stage (step 9.10).

2.4)  また、ADinとQDoutを比較し、一
致しない間はORGにかかわらず、転送径路要求がある
場合は、A Dout−0、ACK=0を前段に出力す
る(ステップ12.13)。一致すれば、スイッチを接
続(オン)し、A Dout= A Din+L AC
K=1を前段に出力する(ステップ14)。
2.4) Also, ADin and QDout are compared, and as long as they do not match, regardless of ORG, if there is a transfer route request, A Dout-0 and ACK=0 are output to the previous stage (step 12.13). If they match, connect (turn on) the switch and A Dout=A Din+L AC
Output K=1 to the previous stage (step 14).

2.5)L P S、 RP Sのいずれかが1の場合
にQDout=0になれば、要求転送径路の終端と判断
し、この時、スイッチを切断(オフ) L、ADout
=0、ACK= 1を前段に、QDout=Q、RRe
q=oを後段に出力する(ステップ15)。
2.5) When either LPS or RPS is 1, if QDout=0, it is determined that the request transfer path is at the end, and at this time, the switch is disconnected (off) L, ADout
=0, ACK=1 in front, QDout=Q, RRe
Output q=o to the subsequent stage (step 15).

3.1)第5図は、第4図の基本処理に基づいて実行さ
れる8つのスイッチ回路のQDoutとADoutの出
力の時間的推移を示している。第5図において、最初は
すべてのスイッチSWiでADout=FF (最大値
)であり、これは後段のすべての区間を使用できること
を意味する。QDout=0となっているのは転送路の
要求がないためである。
3.1) FIG. 5 shows the temporal transition of the outputs of QDout and ADout of eight switch circuits executed based on the basic processing shown in FIG. 4. In FIG. 5, initially ADout=FF (maximum value) for all switches SWi, which means that all sections in the subsequent stage can be used. QDout=0 because there is no request for a transfer path.

3.2)今、クロック、lでスイッチSWIにオリジン
が発生し、転送路区間数−3が要求されたとする。すな
わち、スイッチSWIに接続されるプロセッサ要素PE
OからスイッチSW4に接続されるプロセッサ要素PE
3に転送要求がなされた場合を例として説明する。この
場合、スイッチSW1からQDout=3.ADout
=Oが出力される。
3.2) Now, assume that an origin occurs in the switch SWI at clock l and that the number of transfer path sections - 3 is requested. That is, the processor element PE connected to the switch SWI
Processor element PE connected from O to switch SW4
The case where a transfer request is made in 3 will be explained as an example. In this case, QDout=3. from switch SW1. ADout
=O is output.

ここで、ADout−0はスイッチSWIから右側へは
転送路を形成できないことを示す。転送路予約手続が開
始される。
Here, ADout-0 indicates that a transfer path cannot be formed from the switch SWI to the right side. Transfer route reservation procedure is started.

3.3)  クロック2でスイッチSW2はスイッチS
WIの要求をうけ、Q Dout= 2 、’ A D
out= 0を出力する(ステップ9,10,12.1
3)。
3.3) At clock 2, switch SW2 becomes switch S
At the request of WI, Q Dout= 2,' A D
Output out=0 (steps 9, 10, 12.1
3).

クロック3でスイッチSW3はQDout=1゜A D
out= Oを出力する(ステップ9,10,12.1
3)。
At clock 3, switch SW3 is QDout=1°A D
Output out=O (steps 9, 10, 12.1
3).

クロ・7り4でスイッチS W 4はRReq=1が入
力され、かつQDout=0となるため、ADout−
〇、ACK=1を出力する。A CK = 1は前段に
伝えられる(ステップ8.15)。
In Kuro-7ri4, RReq=1 is input to switch SW4, and QDout=0, so ADout-
〇, outputs ACK=1. ACK = 1 is passed to the previous stage (step 8.15).

3.4)  クロック5でACK=1となり、スイッチ
SW3はスイッチSW4のADout=0に1を加え、
Q Dout= A Dout= 1となり、スイッチ
をオンし、ACK= 1となる(ステップ6.7,9゜
10.12.14)。
3.4) At clock 5, ACK=1, switch SW3 adds 1 to ADout=0 of switch SW4,
Q Dout = A Dout = 1, the switch is turned on, and ACK = 1 (steps 6.7, 9, 10.12.14).

クロック6で、スイッチSW2でQDout=ADou
t−2を出力するとともに、スイッチをオンし、ACK
= 1を前段に出力する(ステップ6゜7.9,10,
12.14)。
At clock 6, QDout=ADou at switch SW2
Outputs t-2, turns on the switch, and receives ACK.
= 1 is output to the previous stage (step 6゜7.9,10,
12.14).

クロック7で、スイッチSWIでQDout=ADou
t=3を出力するとともに、スイッチをオンし、ACK
= 1を前段に出力する(ステップ6゜7.9,11,
12.14)。
At clock 7, QDout=ADou with switch SWI
Outputs t=3, turns on the switch, and ACKs
Output = 1 to the previous stage (step 6゜7.9, 11,
12.14).

ここにおいて、スイッチSWIからSW4、プロセッサ
要素PEIからPE4への転送路が確保される。
Here, a transfer path from switch SWI to SW4 and from processor element PEI to PE4 is secured.

4.1)  プロセッサ要素PEIからPE4へLRe
qを1に保つことにより、スイッチSWI〜SW4のQ
 DouL、 A Doutおよびスイッチオンの状態
を不変に保ち(ステップ6.16)、この間データ転送
が行なわれる。
4.1) LRe from processor element PEI to PE4
By keeping q at 1, the Q of switches SWI to SW4
The states of DouL, A Dout and the switch on are kept unchanged (step 6.16), during which data transfer takes place.

5.1)  データ転送が終了すると、プロセッサ要素
PEIでLReqをOに、すなわちクロック101でス
イッチSWIはLPS=O1ORG=0、RReqou
t= Oとなる(ステップ4.5)、第3図の制御論理
手段SDはこれを検出してステッチを直ちにオフし、Q
Dout=0とする(ステップ4.5)。転送予約解除
が開始される。
5.1) When the data transfer is finished, processor element PEI sets LReq to O, that is, at clock 101, switch SWI sets LPS=O1ORG=0, RReqou
t=O (step 4.5), the control logic means SD of FIG. 3 detects this and immediately turns off the stitching, Q
Set Dout=0 (step 4.5). Transfer reservation cancellation is started.

5.2)  RReqがスイッチSW1〜SW4へ伝わ
ることによって、 クロック102で、スイッチSW2にSWIからのRR
eqout−0が入力され、QDout=O1ADou
t=2、スイッチオフとなり、 クロック103で、スイッチSW3のQDout=0、
A Dout= 1、スイッチオフとなり、クロック1
04で、スイッチSW4のQDout=O,ADout
=FFとなる(ステップ4,5)。
5.2) By transmitting RReq to switches SW1 to SW4, at clock 102, RR from SWI is sent to switch SW2.
eqout-0 is input, QDout=O1ADou
At t=2, the switch turns off, and at clock 103, QDout of switch SW3=0,
A Dout = 1, switch off, clock 1
04, QDout=O, ADout of switch SW4
=FF (steps 4 and 5).

5.3)スイッチSW3で0RG=0であれば、クロッ
ク105でRReqin= 0より、後段のスイッチに
ついて使用可能な転送路区間数にセットされる。すなわ
ち、ADout=F F + 1 =F F (最大使
用可能な区間FF)が出力される(ステップ4.5)。
5.3) If 0RG=0 in switch SW3, RReqin=0 is set at clock 105 to the number of usable transfer path sections for the subsequent switch. That is, ADout=F F + 1 = F F (maximum usable section FF) is output (step 4.5).

クロック106で、スイッチSW3でSW4のADou
tに1を加え、ADoutが出力される。
At clock 106, switch SW3 switches to ADou of SW4.
Add 1 to t and output ADout.

クロック107で、スイッチSW2でSW3のADou
tに1を加え、ADoutが出力される。
At clock 107, switch SW2 switches to ADou of SW3.
Add 1 to t and output ADout.

クロック108で、スイッチSWIが順次1を加算され
たADoutを出力し、ここで転送路の解除が完了する
(ステップ4,5)。
At the clock 108, the switch SWI sequentially outputs ADout to which 1 has been added, and the release of the transfer path is completed here (steps 4 and 5).

第6図はプロセッサ要素の転送路インタフェース回路を
示したもので、転送路としてDRにトライステートのI
10バッファB1で接続され、転送路検査信号QDはト
ライステートの入力バッファB2で、転送路確認信号A
Dは同じくトライステートの出カバソファB3で接続さ
れている。転送要求信号LReqおよびACK信号は直
接スイッチ回路と接続されている。第6図で、シリアル
パラレルシフトレジスタSPRはビット長の変換が必要
な場合に用いられる。同図において、IDEは内部デー
タバス、CDBは制御データバス、20はインタフェー
ス制御回路である。
Figure 6 shows the transfer path interface circuit of the processor element, in which a tri-state I/O is connected to the DR as the transfer path.
The transfer path check signal QD is connected to the 10 buffer B1, and the transfer path check signal QD is connected to the tristate input buffer B2.
D is connected to the output sofa B3, which is also tri-state. Transfer request signal LReq and ACK signal are directly connected to the switch circuit. In FIG. 6, a serial-parallel shift register SPR is used when bit length conversion is required. In the figure, IDE is an internal data bus, CDB is a control data bus, and 20 is an interface control circuit.

次に本実施例の具体的な効果について説明する。Next, specific effects of this embodiment will be explained.

この場合、第9図に示すように、9つのスイッチ回路と
8つの演算プロセッサ(プロセッサ要素)PEO−PE
7から構成される並列プロセッサを例として、従来のバ
スで構成されたもの、クロスバスイッチで構成されたも
のと比較する。
In this case, as shown in FIG. 9, there are nine switch circuits and eight arithmetic processors (processor elements) PEO-PE.
Taking as an example a parallel processor consisting of 7 processors, we will compare it with a conventional bus configuration and a crossbar switch configuration.

デバイスシミュレーションなどで特に高速化が困難とさ
れているモンテカルロシミュレーションの並列演算にお
いては、すべてのプロセッサが殆ど一斉に他のすべての
プロセッサにデータを送る問題がある。この問題につい
て本実施例の効果を説明する。今、8台の各プロセッサ
からほぼ一斉に他の7台のプロセッサに1つのデータを
送る場合、バス構造の並列プロセッサでは、第7図に示
すように、28回の転送回数が必要となる。最も理想的
な転送装置としてクロスバスイッチを有する並列プロセ
ッサでは第8図に示すように4回の転送で済む。これに
対し、右方向と左方向の1組の転送路で構成されている
本実施例の並列プロセッサでは、第9図に示すように2
0回、さらに、これにもう1組の転送路構成を持つ並列
プロセッサ構成をとると、10回となる。第9図の点線
は他の回に転送路となっているが、当該図に変更可能な
場合を示す。
In parallel calculations in Monte Carlo simulations, which are particularly difficult to speed up in device simulations, there is a problem in which all processors send data almost simultaneously to all other processors. Regarding this problem, the effects of this embodiment will be explained. Now, if one data is sent almost simultaneously from each of the eight processors to the other seven processors, in a parallel processor with a bus structure, as shown in FIG. 7, 28 transfers are required. In a parallel processor having a crossbar switch as the most ideal transfer device, only four transfers are required as shown in FIG. On the other hand, in the parallel processor of this embodiment, which is composed of one set of right-direction and left-direction transfer paths, as shown in FIG.
0 times, and if a parallel processor configuration with another set of transfer path configurations is adopted, the number becomes 10 times. The dotted line in FIG. 9 indicates the transfer path in other times, but this figure shows a case where it can be changed.

一般的にプロセッサ要素数nと転送路の本数2″の場合
の本実施例の転送回数とケーブル本数の関係式を表に示
す。表において、2″はプロセンサ要素数、bは1本の
転送路のビット幅である。本実施例の転送路の本数を関
数としてプロセッサ要素数を変化した時の転送回数とケ
ーブル本数を第10図、第11図に示す。転送路本数の
極限はクロスバスイッチで必要な本数の1/4で、この
時の転送速度もほぼクロスバスイッチのそれに匹敵する
。第10図および第11図より、転送路の本数は、装置
の規模と転送速度の要求に応じて、任意に変えられるの
が本実施例の大きな効果である。
In general, the relational expression between the number of transfers and the number of cables in this embodiment when the number of processor elements is n and the number of transfer paths is 2'' is shown in the table. In the table, 2'' is the number of processor elements, and b is one transfer. is the bit width of the path. FIGS. 10 and 11 show the number of transfers and the number of cables when the number of processor elements is changed as a function of the number of transfer paths in this embodiment. The maximum number of transfer paths is 1/4 of the number required for a crossbar switch, and the transfer speed at this time is almost comparable to that of a crossbar switch. As can be seen from FIGS. 10 and 11, a great advantage of this embodiment is that the number of transfer paths can be changed arbitrarily depending on the scale of the device and the transfer speed requirements.

この場合、転送回数とケーブル本数との関係は表に示す
ようにいくつかの組合せを選択できる。第10図、第1
1図において、St、S3はクロスバスイッチの特性線
、S2.S4は通常バスの特性線、40.50は本実施
例における選択の範囲を示す。
In this case, several combinations can be selected for the relationship between the number of transfers and the number of cables as shown in the table. Figure 10, 1st
In Figure 1, St, S3 are the characteristic lines of the crossbar switch, S2. S4 indicates the characteristic line of the normal bus, and 40.50 indicates the selection range in this embodiment.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、1本の転送路に分散して
スイッチ回路を配置したことにより、1本の転送路上に
一度に複数の任意の区間長の転送路を実現でき、転送路
の使用効率を増大することができる。また、転送路に接
続されたプロセッサ要素はスイッチ回路から出力される
転送路の空き情報として区間長情報を見て、転送要求信
号とともに必要な転送区間長の情報を送り、転送路が確
保されればACKを受は転送路を使用できる。このよう
な簡単な制御で2つのプロセッサ間の転送路を個々のプ
ロセッサ要素が処理途中で必要な経路をダイナミックに
変えられ、使用効率とともに高速性を実現できる。
As explained above, by arranging switch circuits distributed over one transfer path, the present invention can realize multiple transfer paths with arbitrary section lengths on one transfer path at the same time. Usage efficiency can be increased. In addition, the processor element connected to the transfer path looks at the section length information as the available transfer path information output from the switch circuit, and sends the necessary transfer section length information along with the transfer request signal, so that the transfer path is secured. If an ACK is received, the transfer path can be used. With such simple control, the necessary transfer paths between two processors can be dynamically changed by individual processor elements in the middle of processing, making it possible to achieve both high efficiency and high speed.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明に係わる並列プロセッサの一実施例を示
すブロック系統図、第2図は本発明の詳細な説明するた
めの並列プロセッサを示すブロック系統図、第3図はス
イッチ回路を示すブロック系統図、第4図はそのスイッ
チ回路の処理フローを示すフローチャート、第5図は第
4図の基本処理に基づいて実行される8つのスイッチ回
路のQDoutとADoutの出力の時間的推移を示す
説明図、第6図はプロセッサ要素の転送路インタフェー
ス回路を示すブロック系統図、第7図はバス構成の並列
プロセッサでの転送回数の説明図、第8図は両方向転送
路をもつクロスバスイッチ構成の並列プロセッサでの転
送回数を示す説明図、第9図は本発明による並列プロセ
ッサでの転送回数を示す説明図、第10図、第11図は
装置の規模と転送速度の要求に対する転送路の本数を示
すグラフ、第12図は従来のバス構成の並列プロセッサ
を示すブロック系統図、第13図は従来のクロスバスイ
ッチ構成の並列プロセッサを示すブロック系統図である
。 PEI〜PE3・・・プロセッサ要素、SWI〜SW4
・・・スイッチ回路、DR,DL・・・信号線、Pl〜
P3・・・転送路、SC・・・転送路切替回路、P、D
・・・転送径路判定回路、RP・・・転送要求処理回路
、BUF・・・バッファ回路、SD、PCON・・・制
御論理手段、INC・・・インクリメンタ、DEC・・
・ディクリメンタ、FFI、FF2・・・フリップフロ
ップ。
FIG. 1 is a block system diagram showing an embodiment of a parallel processor according to the present invention, FIG. 2 is a block system diagram showing a parallel processor for explaining the invention in detail, and FIG. 3 is a block system diagram showing a switch circuit. System diagram, Fig. 4 is a flowchart showing the processing flow of the switch circuit, and Fig. 5 is an explanation showing the temporal transition of the outputs of QDout and ADout of the eight switch circuits executed based on the basic processing of Fig. 4. Figure 6 is a block system diagram showing the transfer path interface circuit of the processor element, Figure 7 is an explanatory diagram of the number of transfers in a parallel processor with a bus configuration, and Figure 8 is a parallel diagram of a crossbar switch configuration with bidirectional transfer paths. FIG. 9 is an explanatory diagram showing the number of transfers in a processor. FIG. 9 is an explanatory diagram showing the number of transfers in a parallel processor according to the present invention. FIGS. 12 is a block diagram showing a parallel processor with a conventional bus configuration, and FIG. 13 is a block diagram showing a parallel processor with a conventional crossbar switch configuration. PEI~PE3...processor element, SWI~SW4
...Switch circuit, DR, DL...Signal line, Pl~
P3... Transfer path, SC... Transfer path switching circuit, P, D
...Transfer route determination circuit, RP...Transfer request processing circuit, BUF...Buffer circuit, SD, PCON...Control logic means, INC...Incrementer, DEC...
・Decrementer, FFI, FF2...Flip-flop.

Claims (3)

【特許請求の範囲】[Claims] (1)複数のプロセッサ要素と、この複数のプロセッサ
要素の任意の2つのプロセッサ要素間で転送経路を構成
しデータの転送・情報の授受を行なう転送装置とからな
る並列プロセッサにおいて、一次元状の転送路と、この
転送路中に電気的に一次元の転送路を切断もしくは接続
する手段を有する複数のスイッチ回路とを備え、前記ス
イッチ回路によって分断された各転送路にプロセッサ要
素を接続したことを特徴とする並列プロセッサ。
(1) In a parallel processor consisting of a plurality of processor elements and a transfer device that configures a transfer path between any two processor elements of the plurality of processor elements and transfers data and exchanges information, one-dimensional A transfer path and a plurality of switch circuits having means for electrically disconnecting or connecting the one-dimensional transfer path in the transfer path, and a processor element is connected to each transfer path separated by the switch circuit. A parallel processor featuring
(2)複数のスイッチ回路によって分断された転送路は
、データの転送方向を左から右および右から左の単方向
とし、これを右方向と左方向の2組備え、前記スイッチ
回路の左もしくは右から入力する転送路と前記スイッチ
回路の右もしくは左に出力する転送路間を任意に電気的
に接続もしくは切断する手段を有するスイッチ回路で構
成したことを特徴とする特許請求の範囲第1項記載の並
列プロセッサ。
(2) A transfer path divided by a plurality of switch circuits has two sets of unidirectional data transfer directions, from left to right and from right to left, and a right direction and a left direction. Claim 1, characterized in that the switch circuit is constructed of a switch circuit having means for arbitrarily electrically connecting or disconnecting between a transfer path that inputs from the right and a transfer path that outputs to the right or left of the switch circuit. Parallel processors as described.
(3)第i、第i+1のスイッチ回路で挟まれた転送路
Piに接続されたプロセッサ要素PEiは、右方向ある
いは左方向の転送路の第i+pあるいは第i−pのスイ
ッチ回路までのp区間の転送路の転送経路予約情報を出
力する手段を有し、、スイッチ回路SWiは、右方向の
転送路に対し、前段のスイッチ回路からの転送路Pi+
1の転送路使用要求信号および転送路Piに接続された
演算プロセッサPEiからの転送路Pi+1の転送路要
求信号を入力し、転送路Piから転送路要求が発生して
いるか否かを示す要求発生元確認信号を生成する手段を
有し、転送路Pi+1の転送路使用要求信号を次段の第
i+1のスイッチ回路SWi+1に出力し、 左方向の転送路に対し、第i+1のスイッチ回路からの
転送路Pi−1の転送路使用要求信号および転送路Pi
に接続されたプロセッサ要素PEiからの転送路要求信
号を右から入力し、転送路Pi−1の転送路使用要求信
号を出力する転送要求処理回路と、 プロセッサ要素からの転送経路予約情報と、次段のスイ
ッチ回路からその時点の転送経路に関する転送経路確認
情報とを入力し、これを用いて次のスイッチ回路に前段
から要求のあった転送路が確保されたか否かを判定し、
前段の輸送路に接続されるプロセッサ要素に転送路使用
許可信号(右方向)を出力し、左方向についても同様に
転送路使用許可信号(左方向)を出力する転送路判定回
路と、 前記転送要求処理回路において生成される転送路要求発
生元確認信号(右方向および左方向)と転送路判定回路
において生成される転送路使用許可信号(右方向および
左方向)とから前段要求転送路と後段の空き転送路とを
電気的に接続もしくはその接続を絶つ転送路切り換え回
路とから構成されたことを特徴とする特許請求の範囲第
1項記載の並列プロセッサ。
(3) The processor element PEi connected to the transfer path Pi sandwiched between the i-th and i+1-th switch circuits is connected to the p section of the rightward or leftward transfer path up to the i+p or i-pth switch circuit. The switch circuit SWi has means for outputting transfer route reservation information for the transfer route in the right direction, and the switch circuit SWi outputs the transfer route reservation information for the transfer route in the right direction.
A request signal indicating whether or not a transfer path request is generated from the transfer path Pi is generated by inputting the transfer path use request signal of transfer path 1 and the transfer path request signal of transfer path Pi+1 from the arithmetic processor PEi connected to the transfer path Pi. It has a means for generating an original confirmation signal, outputs a transfer path use request signal of the transfer path Pi+1 to the i+1th switch circuit SWi+1 in the next stage, and transfers from the i+1th switch circuit to the leftward transfer path. Transfer path use request signal of path Pi-1 and transfer path Pi
A transfer request processing circuit inputs a transfer path request signal from the processor element PEi connected to the processor element PEi from the right and outputs a transfer path use request signal for the transfer path Pi-1; inputting transfer route confirmation information regarding the transfer route at that point from the switch circuit of the next stage, and using this to determine whether the transfer route requested from the previous stage has been secured to the next switch circuit;
a transfer route determination circuit that outputs a transfer route use permission signal (rightward) to a processor element connected to the previous transport route, and similarly outputs a transfer route use permission signal (leftward) for the leftward direction; Based on the transfer path request generation confirmation signal (right direction and left direction) generated in the request processing circuit and the transfer path usage permission signal (right direction and left direction) generated in the transfer path determination circuit, the previous stage request transfer path and the subsequent stage are determined. 2. The parallel processor according to claim 1, further comprising a transfer path switching circuit that electrically connects or disconnects the free transfer path.
JP62151381A 1987-06-19 1987-06-19 Parallel processor Expired - Lifetime JP2967928B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62151381A JP2967928B2 (en) 1987-06-19 1987-06-19 Parallel processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62151381A JP2967928B2 (en) 1987-06-19 1987-06-19 Parallel processor

Publications (2)

Publication Number Publication Date
JPS63316254A true JPS63316254A (en) 1988-12-23
JP2967928B2 JP2967928B2 (en) 1999-10-25

Family

ID=15517329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62151381A Expired - Lifetime JP2967928B2 (en) 1987-06-19 1987-06-19 Parallel processor

Country Status (1)

Country Link
JP (1) JP2967928B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001022229A1 (en) * 1999-09-17 2001-03-29 Turbo Data Laboratories Inc. Parallel computer architecture, and information processing unit using the architecture

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5456743A (en) * 1977-09-19 1979-05-08 Siemens Ag Computer system
JPS55155357U (en) * 1979-04-25 1980-11-08

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5456743A (en) * 1977-09-19 1979-05-08 Siemens Ag Computer system
JPS55155357U (en) * 1979-04-25 1980-11-08

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001022229A1 (en) * 1999-09-17 2001-03-29 Turbo Data Laboratories Inc. Parallel computer architecture, and information processing unit using the architecture
US7185179B1 (en) 1999-09-17 2007-02-27 Turbo Data Laboratories, Inc. Architecture of a parallel computer and an information processing unit using the same
CN100401270C (en) * 1999-09-17 2008-07-09 特博数据实验室公司 Parallel computer architecture, and information processing unit using architecture

Also Published As

Publication number Publication date
JP2967928B2 (en) 1999-10-25

Similar Documents

Publication Publication Date Title
US7577781B2 (en) Bus system for use with information processing apparatus
US5175733A (en) Adaptive message routing for multi-dimensional networks
JPH08506198A (en) Multi-pipeline multi-processor system
ITNA960032A1 (en) ELECTRONIC NUMERICAL MULTIPROCESSOR PARALLEL MULTIPROCESSOR WITH REDUNDANCY OF COUPLED PROCESSORS
KR100569750B1 (en) A method and an apparatus for a re-configurable processor
JP5212543B2 (en) Information processing apparatus and information processing apparatus control method
US6597692B1 (en) Scalable, re-configurable crossbar switch architecture for multi-processor system interconnection networks
US6567909B2 (en) Parallel processor system
JPS63116261A (en) Daisy chain type input/output control system
JPS63316254A (en) Parallel processor
WO2012127619A1 (en) Parallel computing system and control method of parallel computing system
JP7373579B2 (en) Sorting ring network interconnected computing architecture
JP4108371B2 (en) Multiprocessor system
US8150949B2 (en) Computing apparatus
KR100367084B1 (en) DMA controller for the high speed image processor at real time
JP3481445B2 (en) Competition mediation method
JP3119130B2 (en) Network configuration
RU2115162C1 (en) Message routing network
US11093436B2 (en) Arithmetic processing device, information processing apparatus, and control method of the arithmetic processing device
JPH04153864A (en) Parallel processing computer
JP2944111B2 (en) Request control method and storage control device
TWI616754B (en) Pcie data-exchange device and transmission system with the same
US20020018460A1 (en) Network apparatus
JPH1166024A (en) Crossbar switch changeover system
Hill Design and Applications for the IMS C004

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term