JPS63316254A - Parallel processor - Google Patents
Parallel processorInfo
- Publication number
- JPS63316254A JPS63316254A JP62151381A JP15138187A JPS63316254A JP S63316254 A JPS63316254 A JP S63316254A JP 62151381 A JP62151381 A JP 62151381A JP 15138187 A JP15138187 A JP 15138187A JP S63316254 A JPS63316254 A JP S63316254A
- Authority
- JP
- Japan
- Prior art keywords
- transfer path
- transfer
- switch
- processor
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012790 confirmation Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 4
- PBGKNXWGYQPUJK-UHFFFAOYSA-N 4-chloro-2-nitroaniline Chemical compound NC1=CC=C(Cl)C=C1[N+]([O-])=O PBGKNXWGYQPUJK-UHFFFAOYSA-N 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 102000017917 Atypical chemokine receptor Human genes 0.000 description 1
- 108060003357 Atypical chemokine receptor Proteins 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、ハード量が少なく、小形にして転送路の使用
効率が高く、任意の演算プロセッサ間で転送路の競合が
無く、効率的にデータの授受を行なう並列プロセッサに
関するものである。[Detailed Description of the Invention] [Field of Industrial Application] The present invention has a small amount of hardware, is compact, has high efficiency in the use of transfer paths, and has no contention for transfer paths between arbitrary arithmetic processors. It relates to parallel processors that exchange data.
複数のプロセッサ間の相互のデータ転送を行なう装置と
しては、各プロセッサが共通に転送路を使用する第12
図に示すようなハス構造が最もハード量が少なく並列プ
ロセッサとして小形化が可能な構成である。しかし、こ
のバスを用いた並列プロセッサでは、1度に2つのプロ
セッサしか転送路を使用できず、他の多くのプロセッサ
は転送路が空くまで処理を中断して待たねばならない。As a device for mutually transferring data between a plurality of processors, a twelfth processor in which each processor uses a common transfer path is used.
The helical structure shown in the figure has the smallest amount of hardware and is a configuration that can be miniaturized as a parallel processor. However, in parallel processors using this bus, only two processors can use the transfer path at a time, and many other processors must suspend processing and wait until the transfer path becomes free.
このため、並列プロセッサの数が増大するとともに、演
算処理と転送とを合わせた全体の処理実効時間は大幅に
増大し、処理速度が低下するという欠点があった。なお
、第12図において、PEI〜PE6はプロセッサ要素
、BSはバス、ABはバス調定(アービタ)である。Therefore, as the number of parallel processors increases, the total effective processing time including arithmetic processing and transfer increases significantly, resulting in a decrease in processing speed. In FIG. 12, PEI to PE6 are processor elements, BS is a bus, and AB is a bus arbiter.
一方、転送路のデータ競合を無くすため 、第13図に
示すようなりロスバスイッチC8や多段スイッチなどの
専用の転送装置を負荷した並列プロセッサでは、1度に
すべてのプロセッサがそれぞれ他の1つのプロセッサと
の転送路を実現し、・転送の効率化・高速化を図ること
ができる。しかし、このような高速転送装置の問題は、
すべてのプロセッサから独立に転送装置に信号線が集中
し、接続ケーブルの本数が膨大になり、並列プロセッサ
のプロセッサ数の増大とともに実現不可能な規模になる
という欠点があった。On the other hand, in order to eliminate data conflicts on the transfer path, in a parallel processor loaded with a dedicated transfer device such as a loss bar switch C8 or a multi-stage switch as shown in Fig. It is possible to realize a transfer path with the processor and improve the efficiency and speed of transfer. However, the problem with such high-speed transfer devices is that
Signal lines are concentrated in the transfer device independently from all the processors, the number of connection cables becomes enormous, and the scale becomes unrealizable as the number of parallel processors increases.
本発明はこのような点に鑑みてなされたものであり、そ
の目的とするところは、同時に多数の転送経路を実現し
、個々の転送路の使用効率を高め、並列プロセッサの処
理実効速度を向上させ、転送装置の小形化と高速性を両
立させた並列プロセッサを提供することにある。The present invention has been made in view of these points, and its purpose is to simultaneously realize a large number of transfer paths, increase the efficiency of using each transfer path, and improve the effective processing speed of parallel processors. The object of the present invention is to provide a parallel processor that achieves both compactness and high speed of a transfer device.
このような目的を達成するために本発明は、複数のプロ
セッサ要素と、この複数のプロセッサ要素の任意の2つ
のプロセッサ要素間で転送経路を構成しデータの転送・
情報の授受を行なう転送装置とからなる並列プロセッサ
において、一次元状の転送路と、この転送路中に電気的
に一次元の転送路を切断もしくは接続する手段を有する
複数のスイッチ回路とを備え、スイッチ回路によって分
断された各転送路にプロセッサ要素を接続するようにし
たものである。In order to achieve such an object, the present invention configures a transfer path between a plurality of processor elements and any two processor elements of the plurality of processor elements, and transfers and transfers data.
A parallel processor comprising a transfer device that sends and receives information, which includes a one-dimensional transfer path and a plurality of switch circuits in the transfer path that have means for electrically disconnecting or connecting the one-dimensional transfer path. , a processor element is connected to each transfer path separated by a switch circuit.
本発明による並列プロセッサは、ハード規模が小さいバ
ス構造を基本としながら、1本の信号転送路を、分散的
に挿入したスイッチ回路によって、任意の数と任意の長
さの転送路に分割することを可能にする。また、転送路
分割と使用のための転送路の空き管理制御を簡単な方法
で転送路自身が行なうことができ、プロセッサからの要
求発生に応じて転送経路をダイナミックに変えられ、1
度に多数の2つのプロセッサ間転送路を確保できる。The parallel processor according to the present invention is based on a bus structure with a small hardware scale, and can divide one signal transfer path into transfer paths of an arbitrary number and arbitrary length using switch circuits inserted in a distributed manner. enable. In addition, the transfer path itself can perform transfer path division and free space management control for use in a simple manner, and the transfer path can be dynamically changed in response to requests from the processor.
A large number of transfer paths between two processors can be secured at a time.
本発明の第1の特徴は、第2図に示すように、1本のデ
ータ転送線路を複数のプロセッサ要素PE1〜PE3が
共用する構成でありながら、1本の転送線路に分散して
スイッチ回路5wt−5w4を挿入し、このスイッチ回
路で挾まれた転送路PI、P2.P3をバスとしてプロ
セッサ要素PEl、PE2.PE3を接続した構成であ
る。The first feature of the present invention is that, as shown in FIG. 2, although one data transfer line is shared by a plurality of processor elements PE1 to PE3, switch circuits are distributed over one data transfer line. 5wt-5w4 are inserted, and the transfer paths PI, P2 . Processor elements PEl, PE2 . This is a configuration in which PE3 is connected.
本発明の第2の特徴は、1本の転送路を任意に分割して
、それぞれ独立した転送路として使用でき、また、各プ
ロセッサ要素が転送路使用のスケジュール表に基づいて
競合のない転送装置として、転用予約手続きを自動的に
できる手段を有している点にある。The second feature of the present invention is that one transfer path can be arbitrarily divided and used as independent transfer paths, and that each processor element is configured as a transfer device without contention based on a transfer path use schedule. The point is that it has a means to automatically perform the diversion reservation procedure.
本発明の第3の特徴は、転送路の空きで使用可能な経路
と、各プロセッサ要素の使用要求の発生とデータ授受を
必要とするプロセッサとの転送距離とが判明した時点で
、ダイナミックに転送経路設定が可能な制御手段を有し
ている点にある。The third feature of the present invention is that the transfer is performed dynamically at the time when it is determined which available transfer paths are available, the occurrence of a request to use each processor element, and the transfer distance between the processor and the processor that requires data exchange. The point is that it has a control means that allows route setting.
この特徴は、簡単な信号の授受により効率的に自動的に
転送路は右と左の独立した方向を持った転送線路で構成
され、−次元上に配置されたスイッチ回路が、転送方向
に対し、前段からの要求信号と個々に管理するプロセッ
サ要素からの要求信号とから転送経路の始点を判断し、
これにより、全く非同期に発生するプロセッサ要素の転
送要求に応じて、しかも必要なプロセッサ要素間の転送
距離の遠近に依存しないで転送経路が形成されることを
特徴としている。This feature is that the transfer path is configured with transfer lines with independent directions of right and left, and the switch circuit arranged on the - dimension is configured to efficiently and automatically transfer signals by simply sending and receiving signals. , determines the starting point of the transfer path from the request signal from the previous stage and the request signal from the individually managed processor element,
As a result, a transfer path is formed in response to transfer requests of processor elements that occur completely asynchronously, and without depending on the required transfer distance between processor elements.
本発明の第4の特徴は、転送路を複数の信号線路で構成
し、この信号線路をスイッチ回路間で乗り換えられるよ
うに、次段の転送路の信号線の空き情報に基づいて前段
の転送路の信号線と後段の転送路の信号線とを独立に接
続する回路を設けたスイッチ回路を構成している点にあ
る。The fourth feature of the present invention is that the transfer path is configured with a plurality of signal lines, and the transfer of the previous stage is based on the information on the availability of the signal line of the next stage transfer path so that the signal line can be transferred between switch circuits. The switch circuit is configured with a circuit that independently connects the signal line of the transfer path and the signal line of the subsequent transfer path.
特許請求の範囲第1項、第2項記載の発明の実施例とし
ての並列プロセッサの構成を第1図に示し、スイッチ回
路を第3図に、そのスイッチ回路の処理フローを第4図
に、並列プロセッサのスイッチ回路の動作状態の変化を
第5図に、プロセンサ要素の転送路インタフェースを第
6図に示す。The configuration of a parallel processor as an embodiment of the invention described in claims 1 and 2 is shown in FIG. 1, a switch circuit is shown in FIG. 3, and a processing flow of the switch circuit is shown in FIG. FIG. 5 shows changes in the operating state of the switch circuit of the parallel processor, and FIG. 6 shows the transfer path interface of the processor element.
第1図で、スイッチSW1〜SW3は転送路中に挿入さ
れたスイッチ回路で、PEI〜PE3はスイッチ回路で
挟まれた転送路に接続されたプロセッサ要素である。第
1図において、DRおよびDLはそれぞれ左から右およ
び右から左方向のデータの転送路であり、QDR,AD
RおよびQDL、ADLはそれぞれ左から右へおよび右
から左への転送経路予約情報QD (Query Di
stance)とその転送経路確認情報A D (Ac
quired Distance)の情報である。LR
eqR,LReqLはDR,DLの転送路それぞれに対
するプロセッサ要素からの転送要求信号(Local
ReqR,L)である。In FIG. 1, switches SW1 to SW3 are switch circuits inserted into a transfer path, and PEI to PE3 are processor elements connected to the transfer path sandwiched between the switch circuits. In FIG. 1, DR and DL are data transfer paths from left to right and from right to left, respectively, and QDR, AD
R, QDL, and ADL are left-to-right and right-to-left transfer route reservation information QD (Query Di
stance) and its transfer route confirmation information A D (Ac
required Distance). LR
eqR and LReqL are transfer request signals (Local
ReqR,L).
第1図において、スイッチ回路SW1〜SW3は、右方
向、左方向の転送路に関する回路で構成される。In FIG. 1, switch circuits SW1 to SW3 are constructed of circuits related to rightward and leftward transfer paths.
第3図はスイッチ回路SWj (j=1.2. ・・
・)の右方向の転送路に関する回路を示したもので、S
Cは転送路切替回路で、その他に転送要求処理回路RP
と転送経路判定回路PDとから構成されている。右方向
の転送路も同様である。転送路切替回路SCは、ここで
は、ハイインピーダンスを含む3値をとるバッファBU
Fでの組合せで構成され、転送経路判定回路PDからの
切替制御信号Sに基づいて、入力側の転送路DRi (
i=0. 1. ・・・、m)と出力側の転送路D’
Ri (i=0.1. ・・・、m)とを電気的に
接続したり、切断したりする。以下、右、左の添字R1
Lを省略する。Figure 3 shows the switch circuit SWj (j=1.2.
・) This shows the circuit related to the rightward transfer path of S.
C is a transfer path switching circuit, and a transfer request processing circuit RP is also included.
and a transfer route determination circuit PD. The same applies to the rightward transfer path. Here, the transfer path switching circuit SC is a buffer BU that takes three values including high impedance.
Based on the switching control signal S from the transfer route determination circuit PD, the input side transfer route DRi (
i=0. 1. ..., m) and the output side transfer path D'
It electrically connects and disconnects Ri (i=0.1. . . . , m). Below, right and left subscripts R1
Omit L.
次に、第3図の回路の動作について説明する。Next, the operation of the circuit shown in FIG. 3 will be explained.
1.1) 転送要求処理回路RPに前段スイッチから
RReqin、接続されたプロセッサ要素からLReq
inが入力される。1.1) Transfer request processing circuit RP receives RReqin from the previous switch and LReq from the connected processor element.
in is input.
1.2) RReqinはフリップフロップFFIに
リモート・バス・ステート(Remote Path
5tate、 RPS)として記憶され、LReqi
nはフリップフロップFF2にローカル・バス・ステー
ト(LocalPath 5tate、 L P S
)として記憶される。前段スイッチに接続されたプロセ
ッサ要素から要求があれば、RPS、LPSが1になる
。1.2) RReqin inputs the remote bus state (Remote Path) to the flip-flop FFI.
5tate, RPS) and LReqi
n is the local bus state (LocalPath 5tate, L P S
). If there is a request from the processor element connected to the front-stage switch, RPS and LPS become 1.
1.3)制御論理手段PCON (プライオリティコン
トローラ)はRPS、LPSを監視する。RPSの方が
プライオリティが高い。RPS=1のときは、LPSの
いかんにかかわらずオリジン(ORG)=Oとし、接続
プロセッサ要素からの要求を無視する。RReqout
にRReqinを出力する。1.3) Control logic means PCON (priority controller) monitors RPS, LPS. RPS has higher priority. When RPS=1, the origin (ORG) is set to O regardless of the LPS, and requests from connected processor elements are ignored. RReqout
Output RReqin to .
RP、S = OのときはLPSをみる。LPS=1の
ときは接続プロセッサ要素から要求があるので、0RG
=1とする(第4図のステップ1.2)。When RP, S = O, look at LPS. When LPS = 1, there is a request from the connected processor element, so 0RG
=1 (step 1.2 in FIG. 4).
LPS=0のときは要求がないので、0RG=0とする
(第4図のステップ1. 3) o RReqout=
0が出力される。When LPS=0, there is no request, so set 0RG=0 (step 1.3 in Figure 4) o RReqout=
0 is output.
次に、第3図の回路の動作を第4図を用いて説明する。Next, the operation of the circuit shown in FIG. 3 will be explained using FIG. 4.
第4図はスイッチ回路の基本処理を示したもので、プロ
セッサ要素と前段のスイッチからの転送路使用要求の有
無、転送経路予約情報と転送経路確認情報の入力情報と
の一致によって前段のスイッチあるいはプロセッサ要素
への転送経路予約情報QDoutと転送経路確認情報A
Doutを出力する。Figure 4 shows the basic processing of the switch circuit, and depending on whether there is a request to use the transfer path from the processor element and the previous switch, and whether there is a match between the input information of the transfer route reservation information and the transfer route confirmation information, Transfer route reservation information QDout and transfer route confirmation information A to the processor element
Output Dout.
2.1)転送経路判定回路PDに、前段スイッチからQ
D in %後段スイッチからADinが入力される
。後段スイッチにQDoutが出力され、前段スイッチ
にADoutとACKR(一致信号)が出力される。2.1) Q from the previous stage switch to the transfer path determination circuit PD
D in % ADin is input from the subsequent switch. QDout is output to the rear switch, and ADout and ACKR (coincidence signal) are output to the front switch.
2.2)制御論理手段SD(ステータスディテクタ)は
ORGとRReqoutを監視する。RPS。2.2) Control logic means SD (Status Detector) monitors ORG and RReqout. RPS.
LPS共にOのとき(ステップ4からステップ5、へ移
行するとき)、後段からのADinに1を加え、前段に
A Dout= A Din+ 1を前段のスイッチ回
路に出力する(ステップ5)。自らの要求はないので、
後段の空き区間数に自らの区間を加えて前段に伝えるの
である。第3図のINCは1を加算するインクリメンタ
である。When both LPS are O (when moving from step 4 to step 5), 1 is added to ADin from the subsequent stage, and A Dout=A Din+ 1 is output to the previous stage switch circuit (step 5). Since there are no demands of their own,
It adds its own section to the number of empty sections in the subsequent section and transmits the result to the previous section. INC in FIG. 3 is an incrementer that adds 1.
2.3) RPS、LPSのいずれかが1のときはス
テップ6へ移行しくステップ1〜4) 、0RG=0で
あれば前段からのQD□ヵに1を滅じ(ステップ7)、
後段にQ Dout= Q D in 1を出力する
(ステップ6〜10)。QDoutは要求区間数を示し
、自らを区間として設定するのでこれを減じて後段に伝
えるのである。DECは1を減算するデクリメンタであ
る。0RG= 1であれば、接tEPBが要求するQD
inを後段に出力する(ステップ9.10)。2.3) If either RPS or LPS is 1, proceed to step 6. Steps 1 to 4) If 0RG = 0, destroy 1 in QD□ka from the previous stage (step 7),
Q Dout=Q D in 1 is output to the subsequent stage (steps 6 to 10). QDout indicates the number of requested sections and sets itself as the section, so this is subtracted and transmitted to the subsequent stage. DEC is a decrementer that subtracts 1. If 0RG = 1, the QD required by the contact EPB
in is output to the subsequent stage (step 9.10).
2.4) また、ADinとQDoutを比較し、一
致しない間はORGにかかわらず、転送径路要求がある
場合は、A Dout−0、ACK=0を前段に出力す
る(ステップ12.13)。一致すれば、スイッチを接
続(オン)し、A Dout= A Din+L AC
K=1を前段に出力する(ステップ14)。2.4) Also, ADin and QDout are compared, and as long as they do not match, regardless of ORG, if there is a transfer route request, A Dout-0 and ACK=0 are output to the previous stage (step 12.13). If they match, connect (turn on) the switch and A Dout=A Din+L AC
Output K=1 to the previous stage (step 14).
2.5)L P S、 RP Sのいずれかが1の場合
にQDout=0になれば、要求転送径路の終端と判断
し、この時、スイッチを切断(オフ) L、ADout
=0、ACK= 1を前段に、QDout=Q、RRe
q=oを後段に出力する(ステップ15)。2.5) When either LPS or RPS is 1, if QDout=0, it is determined that the request transfer path is at the end, and at this time, the switch is disconnected (off) L, ADout
=0, ACK=1 in front, QDout=Q, RRe
Output q=o to the subsequent stage (step 15).
3.1)第5図は、第4図の基本処理に基づいて実行さ
れる8つのスイッチ回路のQDoutとADoutの出
力の時間的推移を示している。第5図において、最初は
すべてのスイッチSWiでADout=FF (最大値
)であり、これは後段のすべての区間を使用できること
を意味する。QDout=0となっているのは転送路の
要求がないためである。3.1) FIG. 5 shows the temporal transition of the outputs of QDout and ADout of eight switch circuits executed based on the basic processing shown in FIG. 4. In FIG. 5, initially ADout=FF (maximum value) for all switches SWi, which means that all sections in the subsequent stage can be used. QDout=0 because there is no request for a transfer path.
3.2)今、クロック、lでスイッチSWIにオリジン
が発生し、転送路区間数−3が要求されたとする。すな
わち、スイッチSWIに接続されるプロセッサ要素PE
OからスイッチSW4に接続されるプロセッサ要素PE
3に転送要求がなされた場合を例として説明する。この
場合、スイッチSW1からQDout=3.ADout
=Oが出力される。3.2) Now, assume that an origin occurs in the switch SWI at clock l and that the number of transfer path sections - 3 is requested. That is, the processor element PE connected to the switch SWI
Processor element PE connected from O to switch SW4
The case where a transfer request is made in 3 will be explained as an example. In this case, QDout=3. from switch SW1. ADout
=O is output.
ここで、ADout−0はスイッチSWIから右側へは
転送路を形成できないことを示す。転送路予約手続が開
始される。Here, ADout-0 indicates that a transfer path cannot be formed from the switch SWI to the right side. Transfer route reservation procedure is started.
3.3) クロック2でスイッチSW2はスイッチS
WIの要求をうけ、Q Dout= 2 、’ A D
out= 0を出力する(ステップ9,10,12.1
3)。3.3) At clock 2, switch SW2 becomes switch S
At the request of WI, Q Dout= 2,' A D
Output out=0 (steps 9, 10, 12.1
3).
クロック3でスイッチSW3はQDout=1゜A D
out= Oを出力する(ステップ9,10,12.1
3)。At clock 3, switch SW3 is QDout=1°A D
Output out=O (steps 9, 10, 12.1
3).
クロ・7り4でスイッチS W 4はRReq=1が入
力され、かつQDout=0となるため、ADout−
〇、ACK=1を出力する。A CK = 1は前段に
伝えられる(ステップ8.15)。In Kuro-7ri4, RReq=1 is input to switch SW4, and QDout=0, so ADout-
〇, outputs ACK=1. ACK = 1 is passed to the previous stage (step 8.15).
3.4) クロック5でACK=1となり、スイッチ
SW3はスイッチSW4のADout=0に1を加え、
Q Dout= A Dout= 1となり、スイッチ
をオンし、ACK= 1となる(ステップ6.7,9゜
10.12.14)。3.4) At clock 5, ACK=1, switch SW3 adds 1 to ADout=0 of switch SW4,
Q Dout = A Dout = 1, the switch is turned on, and ACK = 1 (steps 6.7, 9, 10.12.14).
クロック6で、スイッチSW2でQDout=ADou
t−2を出力するとともに、スイッチをオンし、ACK
= 1を前段に出力する(ステップ6゜7.9,10,
12.14)。At clock 6, QDout=ADou at switch SW2
Outputs t-2, turns on the switch, and receives ACK.
= 1 is output to the previous stage (step 6゜7.9,10,
12.14).
クロック7で、スイッチSWIでQDout=ADou
t=3を出力するとともに、スイッチをオンし、ACK
= 1を前段に出力する(ステップ6゜7.9,11,
12.14)。At clock 7, QDout=ADou with switch SWI
Outputs t=3, turns on the switch, and ACKs
Output = 1 to the previous stage (step 6゜7.9, 11,
12.14).
ここにおいて、スイッチSWIからSW4、プロセッサ
要素PEIからPE4への転送路が確保される。Here, a transfer path from switch SWI to SW4 and from processor element PEI to PE4 is secured.
4.1) プロセッサ要素PEIからPE4へLRe
qを1に保つことにより、スイッチSWI〜SW4のQ
DouL、 A Doutおよびスイッチオンの状態
を不変に保ち(ステップ6.16)、この間データ転送
が行なわれる。4.1) LRe from processor element PEI to PE4
By keeping q at 1, the Q of switches SWI to SW4
The states of DouL, A Dout and the switch on are kept unchanged (step 6.16), during which data transfer takes place.
5.1) データ転送が終了すると、プロセッサ要素
PEIでLReqをOに、すなわちクロック101でス
イッチSWIはLPS=O1ORG=0、RReqou
t= Oとなる(ステップ4.5)、第3図の制御論理
手段SDはこれを検出してステッチを直ちにオフし、Q
Dout=0とする(ステップ4.5)。転送予約解除
が開始される。5.1) When the data transfer is finished, processor element PEI sets LReq to O, that is, at clock 101, switch SWI sets LPS=O1ORG=0, RReqou
t=O (step 4.5), the control logic means SD of FIG. 3 detects this and immediately turns off the stitching, Q
Set Dout=0 (step 4.5). Transfer reservation cancellation is started.
5.2) RReqがスイッチSW1〜SW4へ伝わ
ることによって、
クロック102で、スイッチSW2にSWIからのRR
eqout−0が入力され、QDout=O1ADou
t=2、スイッチオフとなり、
クロック103で、スイッチSW3のQDout=0、
A Dout= 1、スイッチオフとなり、クロック1
04で、スイッチSW4のQDout=O,ADout
=FFとなる(ステップ4,5)。5.2) By transmitting RReq to switches SW1 to SW4, at clock 102, RR from SWI is sent to switch SW2.
eqout-0 is input, QDout=O1ADou
At t=2, the switch turns off, and at clock 103, QDout of switch SW3=0,
A Dout = 1, switch off, clock 1
04, QDout=O, ADout of switch SW4
=FF (steps 4 and 5).
5.3)スイッチSW3で0RG=0であれば、クロッ
ク105でRReqin= 0より、後段のスイッチに
ついて使用可能な転送路区間数にセットされる。すなわ
ち、ADout=F F + 1 =F F (最大使
用可能な区間FF)が出力される(ステップ4.5)。5.3) If 0RG=0 in switch SW3, RReqin=0 is set at clock 105 to the number of usable transfer path sections for the subsequent switch. That is, ADout=F F + 1 = F F (maximum usable section FF) is output (step 4.5).
クロック106で、スイッチSW3でSW4のADou
tに1を加え、ADoutが出力される。At clock 106, switch SW3 switches to ADou of SW4.
Add 1 to t and output ADout.
クロック107で、スイッチSW2でSW3のADou
tに1を加え、ADoutが出力される。At clock 107, switch SW2 switches to ADou of SW3.
Add 1 to t and output ADout.
クロック108で、スイッチSWIが順次1を加算され
たADoutを出力し、ここで転送路の解除が完了する
(ステップ4,5)。At the clock 108, the switch SWI sequentially outputs ADout to which 1 has been added, and the release of the transfer path is completed here (steps 4 and 5).
第6図はプロセッサ要素の転送路インタフェース回路を
示したもので、転送路としてDRにトライステートのI
10バッファB1で接続され、転送路検査信号QDはト
ライステートの入力バッファB2で、転送路確認信号A
Dは同じくトライステートの出カバソファB3で接続さ
れている。転送要求信号LReqおよびACK信号は直
接スイッチ回路と接続されている。第6図で、シリアル
パラレルシフトレジスタSPRはビット長の変換が必要
な場合に用いられる。同図において、IDEは内部デー
タバス、CDBは制御データバス、20はインタフェー
ス制御回路である。Figure 6 shows the transfer path interface circuit of the processor element, in which a tri-state I/O is connected to the DR as the transfer path.
The transfer path check signal QD is connected to the 10 buffer B1, and the transfer path check signal QD is connected to the tristate input buffer B2.
D is connected to the output sofa B3, which is also tri-state. Transfer request signal LReq and ACK signal are directly connected to the switch circuit. In FIG. 6, a serial-parallel shift register SPR is used when bit length conversion is required. In the figure, IDE is an internal data bus, CDB is a control data bus, and 20 is an interface control circuit.
次に本実施例の具体的な効果について説明する。Next, specific effects of this embodiment will be explained.
この場合、第9図に示すように、9つのスイッチ回路と
8つの演算プロセッサ(プロセッサ要素)PEO−PE
7から構成される並列プロセッサを例として、従来のバ
スで構成されたもの、クロスバスイッチで構成されたも
のと比較する。In this case, as shown in FIG. 9, there are nine switch circuits and eight arithmetic processors (processor elements) PEO-PE.
Taking as an example a parallel processor consisting of 7 processors, we will compare it with a conventional bus configuration and a crossbar switch configuration.
デバイスシミュレーションなどで特に高速化が困難とさ
れているモンテカルロシミュレーションの並列演算にお
いては、すべてのプロセッサが殆ど一斉に他のすべての
プロセッサにデータを送る問題がある。この問題につい
て本実施例の効果を説明する。今、8台の各プロセッサ
からほぼ一斉に他の7台のプロセッサに1つのデータを
送る場合、バス構造の並列プロセッサでは、第7図に示
すように、28回の転送回数が必要となる。最も理想的
な転送装置としてクロスバスイッチを有する並列プロセ
ッサでは第8図に示すように4回の転送で済む。これに
対し、右方向と左方向の1組の転送路で構成されている
本実施例の並列プロセッサでは、第9図に示すように2
0回、さらに、これにもう1組の転送路構成を持つ並列
プロセッサ構成をとると、10回となる。第9図の点線
は他の回に転送路となっているが、当該図に変更可能な
場合を示す。In parallel calculations in Monte Carlo simulations, which are particularly difficult to speed up in device simulations, there is a problem in which all processors send data almost simultaneously to all other processors. Regarding this problem, the effects of this embodiment will be explained. Now, if one data is sent almost simultaneously from each of the eight processors to the other seven processors, in a parallel processor with a bus structure, as shown in FIG. 7, 28 transfers are required. In a parallel processor having a crossbar switch as the most ideal transfer device, only four transfers are required as shown in FIG. On the other hand, in the parallel processor of this embodiment, which is composed of one set of right-direction and left-direction transfer paths, as shown in FIG.
0 times, and if a parallel processor configuration with another set of transfer path configurations is adopted, the number becomes 10 times. The dotted line in FIG. 9 indicates the transfer path in other times, but this figure shows a case where it can be changed.
一般的にプロセッサ要素数nと転送路の本数2″の場合
の本実施例の転送回数とケーブル本数の関係式を表に示
す。表において、2″はプロセンサ要素数、bは1本の
転送路のビット幅である。本実施例の転送路の本数を関
数としてプロセッサ要素数を変化した時の転送回数とケ
ーブル本数を第10図、第11図に示す。転送路本数の
極限はクロスバスイッチで必要な本数の1/4で、この
時の転送速度もほぼクロスバスイッチのそれに匹敵する
。第10図および第11図より、転送路の本数は、装置
の規模と転送速度の要求に応じて、任意に変えられるの
が本実施例の大きな効果である。In general, the relational expression between the number of transfers and the number of cables in this embodiment when the number of processor elements is n and the number of transfer paths is 2'' is shown in the table. In the table, 2'' is the number of processor elements, and b is one transfer. is the bit width of the path. FIGS. 10 and 11 show the number of transfers and the number of cables when the number of processor elements is changed as a function of the number of transfer paths in this embodiment. The maximum number of transfer paths is 1/4 of the number required for a crossbar switch, and the transfer speed at this time is almost comparable to that of a crossbar switch. As can be seen from FIGS. 10 and 11, a great advantage of this embodiment is that the number of transfer paths can be changed arbitrarily depending on the scale of the device and the transfer speed requirements.
この場合、転送回数とケーブル本数との関係は表に示す
ようにいくつかの組合せを選択できる。第10図、第1
1図において、St、S3はクロスバスイッチの特性線
、S2.S4は通常バスの特性線、40.50は本実施
例における選択の範囲を示す。In this case, several combinations can be selected for the relationship between the number of transfers and the number of cables as shown in the table. Figure 10, 1st
In Figure 1, St, S3 are the characteristic lines of the crossbar switch, S2. S4 indicates the characteristic line of the normal bus, and 40.50 indicates the selection range in this embodiment.
以上説明したように本発明は、1本の転送路に分散して
スイッチ回路を配置したことにより、1本の転送路上に
一度に複数の任意の区間長の転送路を実現でき、転送路
の使用効率を増大することができる。また、転送路に接
続されたプロセッサ要素はスイッチ回路から出力される
転送路の空き情報として区間長情報を見て、転送要求信
号とともに必要な転送区間長の情報を送り、転送路が確
保されればACKを受は転送路を使用できる。このよう
な簡単な制御で2つのプロセッサ間の転送路を個々のプ
ロセッサ要素が処理途中で必要な経路をダイナミックに
変えられ、使用効率とともに高速性を実現できる。As explained above, by arranging switch circuits distributed over one transfer path, the present invention can realize multiple transfer paths with arbitrary section lengths on one transfer path at the same time. Usage efficiency can be increased. In addition, the processor element connected to the transfer path looks at the section length information as the available transfer path information output from the switch circuit, and sends the necessary transfer section length information along with the transfer request signal, so that the transfer path is secured. If an ACK is received, the transfer path can be used. With such simple control, the necessary transfer paths between two processors can be dynamically changed by individual processor elements in the middle of processing, making it possible to achieve both high efficiency and high speed.
第1図は本発明に係わる並列プロセッサの一実施例を示
すブロック系統図、第2図は本発明の詳細な説明するた
めの並列プロセッサを示すブロック系統図、第3図はス
イッチ回路を示すブロック系統図、第4図はそのスイッ
チ回路の処理フローを示すフローチャート、第5図は第
4図の基本処理に基づいて実行される8つのスイッチ回
路のQDoutとADoutの出力の時間的推移を示す
説明図、第6図はプロセッサ要素の転送路インタフェー
ス回路を示すブロック系統図、第7図はバス構成の並列
プロセッサでの転送回数の説明図、第8図は両方向転送
路をもつクロスバスイッチ構成の並列プロセッサでの転
送回数を示す説明図、第9図は本発明による並列プロセ
ッサでの転送回数を示す説明図、第10図、第11図は
装置の規模と転送速度の要求に対する転送路の本数を示
すグラフ、第12図は従来のバス構成の並列プロセッサ
を示すブロック系統図、第13図は従来のクロスバスイ
ッチ構成の並列プロセッサを示すブロック系統図である
。
PEI〜PE3・・・プロセッサ要素、SWI〜SW4
・・・スイッチ回路、DR,DL・・・信号線、Pl〜
P3・・・転送路、SC・・・転送路切替回路、P、D
・・・転送径路判定回路、RP・・・転送要求処理回路
、BUF・・・バッファ回路、SD、PCON・・・制
御論理手段、INC・・・インクリメンタ、DEC・・
・ディクリメンタ、FFI、FF2・・・フリップフロ
ップ。FIG. 1 is a block system diagram showing an embodiment of a parallel processor according to the present invention, FIG. 2 is a block system diagram showing a parallel processor for explaining the invention in detail, and FIG. 3 is a block system diagram showing a switch circuit. System diagram, Fig. 4 is a flowchart showing the processing flow of the switch circuit, and Fig. 5 is an explanation showing the temporal transition of the outputs of QDout and ADout of the eight switch circuits executed based on the basic processing of Fig. 4. Figure 6 is a block system diagram showing the transfer path interface circuit of the processor element, Figure 7 is an explanatory diagram of the number of transfers in a parallel processor with a bus configuration, and Figure 8 is a parallel diagram of a crossbar switch configuration with bidirectional transfer paths. FIG. 9 is an explanatory diagram showing the number of transfers in a processor. FIG. 9 is an explanatory diagram showing the number of transfers in a parallel processor according to the present invention. FIGS. 12 is a block diagram showing a parallel processor with a conventional bus configuration, and FIG. 13 is a block diagram showing a parallel processor with a conventional crossbar switch configuration. PEI~PE3...processor element, SWI~SW4
...Switch circuit, DR, DL...Signal line, Pl~
P3... Transfer path, SC... Transfer path switching circuit, P, D
...Transfer route determination circuit, RP...Transfer request processing circuit, BUF...Buffer circuit, SD, PCON...Control logic means, INC...Incrementer, DEC...
・Decrementer, FFI, FF2...Flip-flop.
Claims (3)
要素の任意の2つのプロセッサ要素間で転送経路を構成
しデータの転送・情報の授受を行なう転送装置とからな
る並列プロセッサにおいて、一次元状の転送路と、この
転送路中に電気的に一次元の転送路を切断もしくは接続
する手段を有する複数のスイッチ回路とを備え、前記ス
イッチ回路によって分断された各転送路にプロセッサ要
素を接続したことを特徴とする並列プロセッサ。(1) In a parallel processor consisting of a plurality of processor elements and a transfer device that configures a transfer path between any two processor elements of the plurality of processor elements and transfers data and exchanges information, one-dimensional A transfer path and a plurality of switch circuits having means for electrically disconnecting or connecting the one-dimensional transfer path in the transfer path, and a processor element is connected to each transfer path separated by the switch circuit. A parallel processor featuring
、データの転送方向を左から右および右から左の単方向
とし、これを右方向と左方向の2組備え、前記スイッチ
回路の左もしくは右から入力する転送路と前記スイッチ
回路の右もしくは左に出力する転送路間を任意に電気的
に接続もしくは切断する手段を有するスイッチ回路で構
成したことを特徴とする特許請求の範囲第1項記載の並
列プロセッサ。(2) A transfer path divided by a plurality of switch circuits has two sets of unidirectional data transfer directions, from left to right and from right to left, and a right direction and a left direction. Claim 1, characterized in that the switch circuit is constructed of a switch circuit having means for arbitrarily electrically connecting or disconnecting between a transfer path that inputs from the right and a transfer path that outputs to the right or left of the switch circuit. Parallel processors as described.
Piに接続されたプロセッサ要素PEiは、右方向ある
いは左方向の転送路の第i+pあるいは第i−pのスイ
ッチ回路までのp区間の転送路の転送経路予約情報を出
力する手段を有し、、スイッチ回路SWiは、右方向の
転送路に対し、前段のスイッチ回路からの転送路Pi+
1の転送路使用要求信号および転送路Piに接続された
演算プロセッサPEiからの転送路Pi+1の転送路要
求信号を入力し、転送路Piから転送路要求が発生して
いるか否かを示す要求発生元確認信号を生成する手段を
有し、転送路Pi+1の転送路使用要求信号を次段の第
i+1のスイッチ回路SWi+1に出力し、 左方向の転送路に対し、第i+1のスイッチ回路からの
転送路Pi−1の転送路使用要求信号および転送路Pi
に接続されたプロセッサ要素PEiからの転送路要求信
号を右から入力し、転送路Pi−1の転送路使用要求信
号を出力する転送要求処理回路と、 プロセッサ要素からの転送経路予約情報と、次段のスイ
ッチ回路からその時点の転送経路に関する転送経路確認
情報とを入力し、これを用いて次のスイッチ回路に前段
から要求のあった転送路が確保されたか否かを判定し、
前段の輸送路に接続されるプロセッサ要素に転送路使用
許可信号(右方向)を出力し、左方向についても同様に
転送路使用許可信号(左方向)を出力する転送路判定回
路と、 前記転送要求処理回路において生成される転送路要求発
生元確認信号(右方向および左方向)と転送路判定回路
において生成される転送路使用許可信号(右方向および
左方向)とから前段要求転送路と後段の空き転送路とを
電気的に接続もしくはその接続を絶つ転送路切り換え回
路とから構成されたことを特徴とする特許請求の範囲第
1項記載の並列プロセッサ。(3) The processor element PEi connected to the transfer path Pi sandwiched between the i-th and i+1-th switch circuits is connected to the p section of the rightward or leftward transfer path up to the i+p or i-pth switch circuit. The switch circuit SWi has means for outputting transfer route reservation information for the transfer route in the right direction, and the switch circuit SWi outputs the transfer route reservation information for the transfer route in the right direction.
A request signal indicating whether or not a transfer path request is generated from the transfer path Pi is generated by inputting the transfer path use request signal of transfer path 1 and the transfer path request signal of transfer path Pi+1 from the arithmetic processor PEi connected to the transfer path Pi. It has a means for generating an original confirmation signal, outputs a transfer path use request signal of the transfer path Pi+1 to the i+1th switch circuit SWi+1 in the next stage, and transfers from the i+1th switch circuit to the leftward transfer path. Transfer path use request signal of path Pi-1 and transfer path Pi
A transfer request processing circuit inputs a transfer path request signal from the processor element PEi connected to the processor element PEi from the right and outputs a transfer path use request signal for the transfer path Pi-1; inputting transfer route confirmation information regarding the transfer route at that point from the switch circuit of the next stage, and using this to determine whether the transfer route requested from the previous stage has been secured to the next switch circuit;
a transfer route determination circuit that outputs a transfer route use permission signal (rightward) to a processor element connected to the previous transport route, and similarly outputs a transfer route use permission signal (leftward) for the leftward direction; Based on the transfer path request generation confirmation signal (right direction and left direction) generated in the request processing circuit and the transfer path usage permission signal (right direction and left direction) generated in the transfer path determination circuit, the previous stage request transfer path and the subsequent stage are determined. 2. The parallel processor according to claim 1, further comprising a transfer path switching circuit that electrically connects or disconnects the free transfer path.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62151381A JP2967928B2 (en) | 1987-06-19 | 1987-06-19 | Parallel processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62151381A JP2967928B2 (en) | 1987-06-19 | 1987-06-19 | Parallel processor |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63316254A true JPS63316254A (en) | 1988-12-23 |
JP2967928B2 JP2967928B2 (en) | 1999-10-25 |
Family
ID=15517329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62151381A Expired - Lifetime JP2967928B2 (en) | 1987-06-19 | 1987-06-19 | Parallel processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2967928B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001022229A1 (en) * | 1999-09-17 | 2001-03-29 | Turbo Data Laboratories Inc. | Parallel computer architecture, and information processing unit using the architecture |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5456743A (en) * | 1977-09-19 | 1979-05-08 | Siemens Ag | Computer system |
JPS55155357U (en) * | 1979-04-25 | 1980-11-08 |
-
1987
- 1987-06-19 JP JP62151381A patent/JP2967928B2/en not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5456743A (en) * | 1977-09-19 | 1979-05-08 | Siemens Ag | Computer system |
JPS55155357U (en) * | 1979-04-25 | 1980-11-08 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001022229A1 (en) * | 1999-09-17 | 2001-03-29 | Turbo Data Laboratories Inc. | Parallel computer architecture, and information processing unit using the architecture |
US7185179B1 (en) | 1999-09-17 | 2007-02-27 | Turbo Data Laboratories, Inc. | Architecture of a parallel computer and an information processing unit using the same |
CN100401270C (en) * | 1999-09-17 | 2008-07-09 | 特博数据实验室公司 | Parallel computer architecture, and information processing unit using architecture |
Also Published As
Publication number | Publication date |
---|---|
JP2967928B2 (en) | 1999-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7577781B2 (en) | Bus system for use with information processing apparatus | |
US5175733A (en) | Adaptive message routing for multi-dimensional networks | |
JPH08506198A (en) | Multi-pipeline multi-processor system | |
ITNA960032A1 (en) | ELECTRONIC NUMERICAL MULTIPROCESSOR PARALLEL MULTIPROCESSOR WITH REDUNDANCY OF COUPLED PROCESSORS | |
KR100569750B1 (en) | A method and an apparatus for a re-configurable processor | |
JP5212543B2 (en) | Information processing apparatus and information processing apparatus control method | |
US6597692B1 (en) | Scalable, re-configurable crossbar switch architecture for multi-processor system interconnection networks | |
US6567909B2 (en) | Parallel processor system | |
JPS63116261A (en) | Daisy chain type input/output control system | |
JPS63316254A (en) | Parallel processor | |
WO2012127619A1 (en) | Parallel computing system and control method of parallel computing system | |
JP7373579B2 (en) | Sorting ring network interconnected computing architecture | |
JP4108371B2 (en) | Multiprocessor system | |
US8150949B2 (en) | Computing apparatus | |
KR100367084B1 (en) | DMA controller for the high speed image processor at real time | |
JP3481445B2 (en) | Competition mediation method | |
JP3119130B2 (en) | Network configuration | |
RU2115162C1 (en) | Message routing network | |
US11093436B2 (en) | Arithmetic processing device, information processing apparatus, and control method of the arithmetic processing device | |
JPH04153864A (en) | Parallel processing computer | |
JP2944111B2 (en) | Request control method and storage control device | |
TWI616754B (en) | Pcie data-exchange device and transmission system with the same | |
US20020018460A1 (en) | Network apparatus | |
JPH1166024A (en) | Crossbar switch changeover system | |
Hill | Design and Applications for the IMS C004 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |