JP3283319B2 - Processor element and parallel processing system - Google Patents

Processor element and parallel processing system

Info

Publication number
JP3283319B2
JP3283319B2 JP04078993A JP4078993A JP3283319B2 JP 3283319 B2 JP3283319 B2 JP 3283319B2 JP 04078993 A JP04078993 A JP 04078993A JP 4078993 A JP4078993 A JP 4078993A JP 3283319 B2 JP3283319 B2 JP 3283319B2
Authority
JP
Japan
Prior art keywords
data
transmission
memory
signal
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04078993A
Other languages
Japanese (ja)
Other versions
JPH06259396A (en
Inventor
一郎 岡林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP04078993A priority Critical patent/JP3283319B2/en
Publication of JPH06259396A publication Critical patent/JPH06259396A/en
Application granted granted Critical
Publication of JP3283319B2 publication Critical patent/JP3283319B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/60Superconducting electric elements or equipment; Power systems integrating superconducting elements or equipment

Landscapes

  • Multi Processors (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、数値解析、コンピュー
タグラフィックス、データベース等において用いられる
並列処理システム及び並列処理システムに用いられるプ
ロセサエレメントに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel processing system used in numerical analysis, computer graphics, a database, and the like, and a processor element used in the parallel processing system.

【0002】[0002]

【従来の技術】近年、並列処理システムは、逐次型シス
テムの性能限界が見えてきたこともあり、その高速性、
将来性から産業界において注目を集め、各種の研究が行
なわれている。並列処理システムでは、複数のプロセサ
間の通信が必要となり、該通信を高速に且つ矛盾なく行
なうことがシステム全体の性能向上に大きく影響する。
2. Description of the Related Art In recent years, the parallel processing system has been able to see the performance limit of a serial type system,
Various researches are being conducted in the industry due to its future potential. In a parallel processing system, communication between a plurality of processors is required, and performing this communication at high speed and without contradiction greatly affects the performance of the entire system.

【0003】以下図面を参照しながら、従来の並列処理
システムの一例を説明する。
An example of a conventional parallel processing system will be described below with reference to the drawings.

【0004】まず、第1の従来例としてデッドロックが
発生する並列処理システムを説明する。複数のプロセサ
間でランダムに通信を行なった場合にデッドロックによ
り処理が先に進まなくなることがある。
First, a parallel processing system in which deadlock occurs will be described as a first conventional example. When communication is performed randomly between a plurality of processors, processing may not proceed first due to deadlock.

【0005】図13は第1の従来例に係る並列処理シス
テムの構成図である。図13において、51x,51
y,51zはデータの転送制御を行なう通信装置、54
x,54y,54zはデータを一時的に保持するバッフ
ァ、60x,60y,60zはメモリ、66x,66
y,66zは通信装置51x,51y,51zとメモリ
60x,60y,60zとをそれぞれ有するプロセサエ
レメント(以下PEと呼ぶ)である。通信装置51x〜
51zのそれぞれは3つのポートを持っており、該3つ
のポートのうちの1つは当該通信装置の属するPE内の
メモリと接続され他の2つはPEの外部へ通じている。
バッファ54x〜54zは2段の先入れ先出し(FIF
O)装置である。また、説明を簡単にするため、PE数
は3つ、PE間のデータの流れは単方向とする。
FIG. 13 is a configuration diagram of a parallel processing system according to a first conventional example. In FIG. 13, 51x, 51
y, 51z are communication devices for controlling data transfer, 54
x, 54y, 54z are buffers for temporarily holding data, 60x, 60y, 60z are memories, 66x, 66
y and 66z are processor elements (hereinafter referred to as PEs) each having communication devices 51x, 51y and 51z and memories 60x, 60y and 60z. Communication device 51x ~
Each of the 51z has three ports, one of the three ports is connected to the memory in the PE to which the communication device belongs, and the other two are connected to the outside of the PE.
Buffers 54x to 54z have a two-stage first-in first-out (FIF
O) The device. For simplicity of description, the number of PEs is three, and the flow of data between PEs is unidirectional.

【0006】PEの基本動作は3種類あり、メモリから
データを読み出し該データを外部へ送出する“送信”
と、外部から入力されたデータを通信装置内のバッファ
に一時的に格納しその後該データを再び外部へ送出する
“中継”と、外部から入力されたデータをメモリに書き
込む“受信”とに分類される。
[0006] There are three types of basic operations of the PE, and "send" which reads data from a memory and sends the data to the outside.
And "relay", in which data input from the outside is temporarily stored in a buffer in the communication device, and then the data is transmitted to the outside again, and "reception", in which the data input from the outside is written in the memory. Is done.

【0007】バッファ54x,54y,54z内にはデ
ータx2及びy1,データy2及びz1,データz2及
びx1がそれぞれ格納されており、データの符号のアル
ファベットは転送先を示しており、例えば、バッファ5
4x内のデータy1は最終的にはメモリ60yに、バッ
ファ54y内のデータz1はメモリ60zに書き込まれ
るべきデータである。図13のような接続形態では、P
E66xからPE66zにデータを送る場合にはPE6
6yを経由する必要がある。
Data x2 and y1, data y2 and z1, data z2 and x1 are stored in buffers 54x, 54y and 54z, respectively. The alphabet of the code of the data indicates the transfer destination.
The data y1 in 4x is finally data to be written to the memory 60y, and the data z1 in the buffer 54y is data to be written to the memory 60z. In the connection form as shown in FIG.
When sending data from E66x to PE66z, use PE6
6y.

【0008】ここで、バッファ54x〜54zのそれぞ
れが図13に示すようにフル状態になったとする。バッ
ファ54x内のデータy1をバッファ54y経由でメモ
リ60yに送りたいがバッファ54yがフル状態である
ので送れない。バッファ54yのフル状態を解除するた
めにはデータz1をバッファ54z経由でメモリ60z
に送る必要があるがバッファ54zはフル状態である。
同様に、バッファ54zのフル状態を解除するためには
データx1をバッファ54x経由でメモリ60xに送る
必要があるがバッファ54xはフル状態である。バッフ
ァ54xのフル状態を解除するためにはデータy1をバ
ッファ54y経由でメモリ60yに送る必要があること
になる。従って、何れのPEもデータを送出できない状
態に陥り動作はこの状態で永久に停止する。このような
状態がデッドロックである。
Here, it is assumed that each of the buffers 54x to 54z has reached a full state as shown in FIG. The data y1 in the buffer 54x is to be sent to the memory 60y via the buffer 54y, but cannot be sent because the buffer 54y is full. To release the full state of the buffer 54y, the data z1 is stored in the memory 60z via the buffer 54z.
, But the buffer 54z is full.
Similarly, in order to release the full state of the buffer 54z, it is necessary to send the data x1 to the memory 60x via the buffer 54x, but the buffer 54x is in the full state. In order to release the full state of the buffer 54x, it is necessary to send the data y1 to the memory 60y via the buffer 54y. Accordingly, none of the PEs can send data, and the operation stops forever in this state. Such a state is a deadlock.

【0009】次に、第2の従来例として以上のようなデ
ッドロックを回避するためのデッドロック回避手法が適
用された並列処理システムを説明する。図14は第2の
従来例に係る並列処理システムを示し、(a)は並列処
理システムのPEの構成図、(b)は並列処理システム
の構成図である。なお、本例については、「1990 Proce
eding of the International Symposium on Computer A
rchtecture P70-P81」に詳しく開示されている。
Next, as a second conventional example, a parallel processing system to which the above-described deadlock avoiding method for avoiding deadlock is applied will be described. FIG. 14 shows a parallel processing system according to a second conventional example, in which (a) is a configuration diagram of a PE of the parallel processing system, and (b) is a configuration diagram of the parallel processing system. For this example, see "1990 Proce
eding of the International Symposium on Computer A
rchtecture P70-P81 ".

【0010】図14(a)において、71はデータの転
送制御を行なう通信装置( 原文ではCommunication Agen
t)、80はメモリ(原文ではMemory Agent:外部メモリ
とのインターフェースの役割を持ちCommunication Agen
t からはメモリに見えるので、ここではメモリとす
る)、85はプロセサ(原文ではComputation Agent
)、86は通信装置71とメモリ80とプロセサ85
とを有するPEである。通信装置71は図14(a)に
示すようにPE86の外部へ通じる4つのポートとPE
86内のメモリ80またはプロセサ85に接続された3
つのポートとを持ち、さらに、並列に並べられた20個
のバッファ(図示省略)を持っている。
In FIG. 14A, reference numeral 71 denotes a communication device for performing data transfer control (original communication Agen).
t), 80 are memory (original Memory Agent: Communication Agen which has the role of interface with external memory)
Since it looks like a memory from t, it is a memory here), and 85 is a processor (Computation Agent
) And 86 are a communication device 71, a memory 80, and a processor 85.
It is PE which has these. As shown in FIG. 14A, the communication device 71 has four ports communicating with the outside of the PE 86 and a PE.
3 connected to memory 80 or processor 85 in
And 20 buffers (not shown) arranged in parallel.

【0011】以上のようなPEを用いた並列処理システ
ムにおいてはデータの流れる経路(以下パスウェイと呼
ぶ)が獲得されてからデータの転送が行なわれる。図1
4(b)に示すように、16個のPEには2進4ビット
で[0000]〜[1111]の番号がそれぞれ付加さ
れており、Net1〜Net6の6つのパスウェイが獲
得されている。
In the above-described parallel processing system using PEs, data transfer is performed after a path through which data flows (hereinafter, referred to as a pathway) is obtained. FIG.
As shown in FIG. 4 (b), 16 PEs are respectively assigned numbers of [0000] to [1111] in binary 4 bits, and six pathways Net1 to Net6 are obtained.

【0012】例えば、パスウェイNet1はPE[00
00](送信)−PE[0100](中継)−PE[1
000](送信、受信、中継)−PE[1100](受
信)と繋がる。ここで、( )内はPEの動作を示して
おり、パスウェイNet1を用いてデータの転送が行わ
れる場合に、例えば、PE[0000]は送信のみを行
ない、PE[1000]は送信、受信、中継を行なう。
For example, the pathway Net1 is PE [00
00] (transmission)-PE [0100] (relay)-PE [1
000] (transmit, receive, relay)-Connect to PE [1100] (receive). Here, () shows the operation of the PE. When data is transferred using the pathway Net1, for example, the PE [0000] performs only transmission, and the PE [1000] performs transmission, reception, Perform the relay.

【0013】第2の従来例に係る並列処理システムにお
いては、PEの内部で複数のバッファが並列に並べられ
ているため、図14(b)に示すように、例えば、PE
[0100]においてNet1、Net2の2つのパス
ウェイを同時に獲得することが可能であり、各パスウェ
イを時分割で独立に扱うことができるため各パスウェイ
を用いて行なわれるデータ転送も独立に実行することが
できるのでデッドロックの発生を回避することができ
る。
In the parallel processing system according to the second conventional example, since a plurality of buffers are arranged in parallel inside the PE, for example, as shown in FIG.
In [0100], two pathways, Net1 and Net2, can be acquired simultaneously, and each pathway can be handled independently in a time-division manner, so that data transfer performed using each pathway can also be executed independently. This can avoid the occurrence of deadlock.

【0014】[0014]

【発明が解決しようとする課題】上記のように第1の従
来例に係る並列処理システムにおいては、何れのPEも
データを送出できなくなる状態即ちデッドロックに陥る
という問題がある。
As described above, in the parallel processing system according to the first conventional example, there is a problem that any PE cannot send data, that is, a deadlock occurs.

【0015】そこで、デッドロックを回避するための方
法としては、第2の従来例に係る並列処理システムのよ
うに、各PEの内部に複数のバッファを並列に並べるこ
とにより、複数のパスウェイを時分割でそれぞれ独立に
扱えるようにし、複数のデータ転送をそれぞれ独立に実
行するものがある。ここでは、各PEは20個の並列に
並んだバッファを持っているため、パスウェイを20チ
ャンネル獲得することが可能である。
Therefore, as a method for avoiding a deadlock, a plurality of buffers are arranged in parallel in each PE to parallelize a plurality of pathways as in the parallel processing system according to the second conventional example. In some cases, data can be handled independently by division, and a plurality of data transfers are executed independently. Here, since each PE has 20 buffers arranged in parallel, it is possible to acquire 20 channels for the pathway.

【0016】しかしながら、第2の従来例に係る並列処
理システムにおいては、ハードウェアの制限によりパス
ウェイ数の上限が決定するため、PE数あるいは通信量
が増えるとパスウェイを獲得できないプロセスが発生
し、パスウェイを獲得できないプロセスはパスウェイが
あくまで待状態となるという問題がある。このため、シ
ステム全体のスループットが低下し、該スループットを
上げるためにはハードウェア投資が必要となる。
However, in the parallel processing system according to the second conventional example, since the upper limit of the number of pathways is determined by the limitation of hardware, when the number of PEs or the amount of communication increases, a process that cannot acquire the pathway occurs. There is a problem in that a process that cannot acquire the information is kept waiting until the pathway is completed. For this reason, the throughput of the entire system decreases, and hardware investment is required to increase the throughput.

【0017】本発明は上記に鑑みなされたものであっ
て、デッドロックに陥ることなく、少ないハードウェア
量で、ランダムな通信を効率よく実行することができる
プロセサエレメント及び並列処理システムを提供するこ
とを目的とするものである。
The present invention has been made in view of the above, and provides a processor element and a parallel processing system capable of efficiently executing random communication with a small amount of hardware without falling into a deadlock. It is intended for.

【0018】[0018]

【課題を解決するための手段】上記の目的を達成するた
め、請求項1の発明は、他の何れかのプロセサエレメン
トにおいてメモリの中間データ待避領域に格納されたデ
ータの格納量が第1の所定量を越えたときに、メモリの
通常領域からのデータの送出を停止するものである。
In order to achieve the above object, the invention of claim 1 is directed to any one of other processor elements.
Data stored in the intermediate data save area of the memory
When the data storage amount exceeds the first predetermined amount,
The transmission of data from the normal area is stopped.

【0019】ここで、上記データの送出の停止は、他の
プロセサエレメントを含む各プロセサエレメントから出
力される送出停止信号に応じた全体送出停止信号により
行われる。
Here, the stop of the transmission of the data is performed by another
From each processor element including the processor element
By the overall transmission stop signal corresponding to the input transmission stop signal
Done.

【0020】具体的に請求項1の発明が講じた解決手段
は、メモリと通信装置とを有するプロセサエレメントに
おいて、上記メモリは通常領域と中間データ待避領域と
を持ち、上記通信装置は上記メモリと接続された第1の
ポートと上記プロセサエレメントの外部へ通じる第2の
ポートとデータを一時的に保持するバッファとを持ち、
上記通信装置は、上記バッファに保持されたデータを上
記第1のポートを通じて上記メモリの中間データ待避領
域に送出するように構成されている。
[0020] Means for solving the problems specifically taken by the invention of claim 1
Is a processor element having a memory and a communication device.
The above memory has a normal area and an intermediate data save area.
And the communication device has a first memory connected to the memory.
Port and a second communicating with the outside of the processor element.
It has a port and a buffer that temporarily holds data,
The communication device updates the data held in the buffer.
Saving intermediate data in the memory through the first port
To be sent to the area.

【0021】また、上記通信装置は、さらに、上記メモ
リの中間データ待避領域に格納されたデータの格納量が
第1の所定量を越えると送出停止信号をセットしアサー
トされた送出停止信号を上記プロセサエレメントの外部
へ出力する送出停止信号出力手段と、 上記メモリの中間
データ待避領域に格納されたデータの格納量が上記第1
の所定量よりも小さな第2の所定量を下回ると送出再開
信号をセットしアサートされた送出再開信号を上記プロ
セサエレメントの外部へ出力する送出再開信号出力手段
と、上記プロセサエレメントまたは他の何れかのプロセ
サエレメントからアサートされた送出停止信号が出力さ
れたときにアサートされる全体送出停止信号と、全ての
プロセサエレメントからアサートされた送出再開信号が
出力されたきにアサートされる全体送出再開信号とをそ
れぞれ受け取り上記アサートされた全体送出停止信号
によりセットされ上記アサートされた全体送出再開信号
によりリセットされる送出不可信号を発生する送出不可
信号発生手段とを持ち、上記プロセサエレメントは、上
記送出不可信号発生手段から発生される上記送出不可信
号がアサートされている間中、上記バッファまたは上記
メモリの中間データ待避領域からのデータの送出と、上
記メモリの通常領域からのデータの送出とのうち、上記
メモリの通常領域からのデータの送出を停止するように
構成されている。
[0021]Further, the communication device further includes:Note above
The amount of data stored in the intermediate data save area
When the first predetermined amount is exceeded, a transmission stop signal is set and an assertion is made.
The transmitted transmission stop signal is sent to the outside of the processor element.
Transmission stop signal output means for outputting to Middle of the above memory
The storage amount of data stored in the data save area is equal to the first storage amount.
Transmission resumes when the value falls below a second predetermined amount smaller than the predetermined amount.
Set the signal and send the output resume signal asserted
Transmission restart signal output means for outputting to the outside of the sensor element
When,The processor element described above or any other processor
The transmission stop signal asserted by the
Asserted whenThe whole transmission stop signal and,All of
The transmission restart signal asserted from the processor element
Asserted when outputThe entire transmission restart signal
Receiving each,Asserted overall transmission stop signal
Is set and the above-mentioned asserted overall transmission restart signal is asserted.
Send disable signal that generates reset disable signal
Signal generating means, and the processor element
The above-mentioned transmission failure signal generated by the transmission failure signal generation means.
While the issue is asserted,Above buffer or above
Sending data from the intermediate data save area of the memory
Of sending data from the normal area of the memorythe above
Stop sending data from the normal area of memorylike
It is configured.

【0022】請求項2の発明は、複数のバッファのうち
の少なくとも2つのバッファから同一のポートを通じて
プロセサエレメントの外部へデータをそれぞれ送出する
場合に、通信形態の違いに応じて適宜何れのバッファか
らのデータの送出を優先するかを選択することができる
ようにするものである。
According to a second aspect of the present invention , when data is transmitted from at least two buffers out of a plurality of buffers to the outside of the processor element through the same port, any one of the buffers may be appropriately used depending on the communication mode. It is possible to select whether to give priority to the data transmission.

【0023】具体的には、請求項1の発明の構成に、上
記通信装置はデータを一時的に保持する複数のバッファ
を持ち、上記通信装置は、上記複数のバッファのうちの
少なくとも2つのバッファから上記第2のポートを通じ
て上記プロセサエレメントの外部へデータをそれぞれ送
出する場合に、データの格納量が相対的に多いバッファ
のデータより優先的に送出するモードと、上記プロセサ
エレメントから最終到着先のプロセサエレメントまでの
距離が相対的に遠いデータが格納されているバッファの
データより優先的に送出するモードと、上記プロセサエ
レメントから最終到着先のプロセサエレメントまでの距
離が相対的に近いデータが格納されているバッファのデ
ータより優先的に送出するモードと、所定のバッファの
データより優先的に送出するモードとを選択可能に持っ
ている構成を付加するものである。
Specifically, in the configuration of the first aspect of the present invention , the communication device has a plurality of buffers for temporarily storing data, and the communication device has at least two buffers among the plurality of buffers. When sending data to the outside of the processor element via the second port from the buffer element, a mode in which data is sent in preference to data in a buffer having a relatively large data storage amount, A mode in which data with a relatively long distance to the processor element is transmitted in preference to data stored in the buffer, and data in which the distance from the processor element to the last destination processor element is relatively short are stored. A mode that sends data with priority over the data in the buffer that is It is intended to add a structure to have a delivery mode-selectable.

【0024】請求項3の発明は、複数のバッファのうち
の少なくとも2つのバッファから同一のポートを通じて
プロセサエレメントの外部へデータをそれぞれ送出する
場合に、メモリの中間データ待避領域から受け取ったデ
ータが格納されているバッファのデータを最優先に送出
するものであり、具体的には、請求項2の発明の構成
に、上記通信装置は、上記複数のバッファのうちの少な
くとも2つのバッファから上記第2のポートを通じて上
記プロセサエレメントの外部へデータをそれぞれ送出す
る場合に、上記メモリの中間データ待避領域から上記第
1のポートを通じて受け取ったデータが格納されている
バッファのデータを最優先に送出する構成を付加するも
のである。
According to a third aspect of the present invention , when data is transmitted from at least two buffers of a plurality of buffers to the outside of the processor element through the same port, the data received from the intermediate data save area of the memory is stored. The data of the buffer being transmitted is transmitted with the highest priority. Specifically, in the configuration of the invention according to claim 2 , the communication device includes the second buffer from at least two buffers of the plurality of buffers. When sending data to the outside of the processor element through the ports of the above, the buffer data storing the data received through the first port from the intermediate data save area of the memory is sent with the highest priority. It is to be added.

【0025】また、請求項4の発明は、メモリの中間デ
ータ待避領域に格納されたデータの格納量が第1の所定
量を越えたプロセサエレメントが1つでも存在すればす
べてのプロセサエレメントがメモリの通常領域からのデ
ータの送出を停止し、すべてのプロセサエレメントのメ
モリの中間データ待避領域に格納されたデータの格納量
が第2の所定量を下回ったときにすべてのプロセサエレ
メントがメモリの通常領域からのデータの送出を再開す
るものである。
According to a fourth aspect of the present invention , when at least one processor element has a storage amount of data stored in the intermediate data save area of the memory exceeding the first predetermined amount, all the processor elements are stored in the memory. Of the data stored in the intermediate data saving area of the memory of all the processor elements is stopped when all the processor elements are in the normal memory area. The transmission of data from the area is restarted.

【0026】具体的に請求項4の発明が講じた解決手段
は、請求項1から請求項3の何れかに記載の複数のプロ
セサエレメントと該複数のプロセサエレメント同士を相
互通信可能に接続するネットワークとを備える並列処理
システムを対象とし、上記並列処理システムは、上記複
数のプロセサエレメントの通信装置から出力されるすべ
ての送出停止信号の論理和を演算しその演算結果を全体
送出停止信号として上記複数のプロセサエレメントのす
べての通信装置に供給する全体送出停止信号供給手段
と、上記複数のプロセサエレメントの通信装置から出力
されるすべての送出再開信号の論理積を演算しその演算
結果を全体送出再開信号として上記複数のプロセサエレ
メントのすべての通信装置に供給する全体送出再開信号
供給手段とを備えている構成とするものである。
A fourth aspect of the present invention is a network for connecting a plurality of processor elements according to any one of the first to third aspects and the plurality of processor elements so as to communicate with each other. The above-mentioned parallel processing system calculates a logical sum of all transmission stop signals output from the communication devices of the plurality of processor elements, and uses the calculation result as an overall transmission stop signal. And a logical sum of all the transmission restart signals output from the communication devices of the plurality of processor elements, and outputs the operation result to the entire transmission restart signal. As a whole transmission restart signal supply means for supplying to all communication devices of the plurality of processor elements as It is an configuration that.

【0027】請求項5の発明は、上記全体送出停止信号
供給手段及び全体送出再開信号供給手段をワイアード結
合により実現することによりハードウェアを削減するも
のであり、具体的には、請求項4の発明の構成に、上記
全体送出停止信号供給手段は、上記複数のプロセサエレ
メントのすべての通信装置にそれぞれ設けられそれぞれ
が送出停止信号を負論理でオープンドレイン出力する複
数の第1のMOSトランジスタまたはオープンコレクタ
出力する複数の第1のバイポーラトランジスタと、上記
複数の第1のMOSトランジスタのすべてのドレイン同
士または上記複数の第1のバイポーラトランジスタのす
べてのコレクタ同士を接続し抵抗を介して電源と接続さ
れた第1の共通接続線とを有し、上記全体送出停止信号
供給手段は上記第1の共通接続線の電位の反転電位を全
体送出停止信号として上記複数のプロセサエレメントの
すべての通信装置に供給し、上記全体送出再開信号供給
手段は、上記複数のプロセサエレメントのすべての通信
装置にそれぞれ設けられそれぞれが送出停止信号を正論
理でオープンドレイン出力する複数の第2のMOSトラ
ンジスタまたはオープンコレクタ出力する複数の第2の
バイポーラトランジスタと、上記複数の第2のMOSト
ランジスタのすべてのドレイン同士または上記複数の第
2のバイポーラトランジスタのすべてのコレクタ同士を
接続し抵抗を介して電源と接続された第2の共通接続線
とを有し、上記全体送出再開信号供給手段は上記第2の
共通接続線の電位を全体送出再開信号として上記複数の
プロセサエレメントのすべての通信装置に供給する構成
を付加したものである。
According to a fifth aspect of the present invention , the hardware is reduced by realizing the whole transmission stop signal supply means and the whole transmission restart signal supply means by wired connection . In the configuration of the present invention, the whole transmission stop signal supply means is provided in each of all the communication devices of the plurality of processor elements, and each of the plurality of first MOS transistors or open MOS transistors respectively outputting the transmission stop signal in a negative logic with an open drain. A plurality of first bipolar transistors for outputting a collector and all drains of the plurality of first MOS transistors or all collectors of the plurality of first bipolar transistors are connected to each other and connected to a power supply via a resistor. A first common connection line, and the overall transmission stop signal supply means includes Supply the inverted potential of the potential of the common connection line to all the communication devices of the plurality of processor elements as a whole transmission stop signal, and the whole transmission restart signal supply means supplies all the communication devices of the plurality of processor elements to the communication devices. A plurality of second MOS transistors or a plurality of second bipolar transistors each of which outputs a transmission stop signal in open logic with positive logic or a plurality of second bipolar transistors each of which outputs an open collector, and all drains of the plurality of second MOS transistors or A second common connection line that connects all the collectors of the plurality of second bipolar transistors to each other and is connected to a power supply via a resistor; All communication of the above-mentioned plurality of processor elements is performed using the line potential as the whole transmission restart signal. It is obtained by adding the configuration supplied to the location.

【0028】[0028]

【作用】請求項1の発明の構成により、通信装置は、
ッファに保持されたデータを上記バッファから第1のポ
ートを通じてメモリの中間データ待避領域に送出するた
め、バッファ内に空き領域を作ることができる。これに
より、バッファ内の他のデータの送出が可能となり、デ
ータが長時間特定箇所に停滞することがなくなり通信効
率が向上するとともに、他のプロセサエレメントから送
出されるデータを確実に受信できるようになる。
The structure of the action] of claim 1 the invention, communication device, Ba
Since the data held in the buffer is sent from the buffer to the intermediate data saving area of the memory through the first port, an empty area can be created in the buffer. As a result, other data in the buffer can be transmitted, the data does not stay at a specific location for a long time, communication efficiency is improved , and transmission from another processor element is performed.
The output data can be received reliably.

【0029】また、送出停止信号出力手段は、メモリの
中間データ待避領域に格納されたデータの格納量が第1
の所定量を越えると送出停止信号ををプロセサエレメン
トの外部へ出力する。このような送出停止信号を何れか
のプロセサエレメントが出力したときに生成される全体
送出停止信号を送出不可信号発生手段がプロセサエレメ
ントの外部から受け取ると、該全体送出停止信号により
送出不可信号がセットされる。プロセサエレメントは、
上記送出不可信号がアサートされている間中、メモリの
通常領域からのデータの送出を停止する。これにより、
プロセサエレメントはバッファ及びメモリの中間データ
待避領域のデータの処理に専念することができ、メモリ
の中間データ待避領域のデータの格納量を減少させるこ
とができる。すなわち、メモリの通常領域からのデータ
の送出は停止される一方、バッファ及びメモリの中間デ
ータ待避領域のデータは、前記のようにバッファに空き
領域ができることによって確実に転送や演算処理が行わ
れ、有限時間内にバッファから必ずなくなり、または減
少するので、デッドロックも防止することができる。
Further , the transmission stop signal output means determines that the storage amount of the data stored in the intermediate data save area of the memory is the first.
, A transmission stop signal is output outside the processor element. Any such transmission stop signal
Generated when the processor elements output
The transmission stop signal is generated by the processor
When received from outside the client, the transmission disable signal is set by the entire transmission stop signal. The processor element is
While the transmission disable signal is asserted, the transmission of data from the normal area of the memory is stopped. This allows
The processor element can concentrate on the processing of the data in the buffer and the intermediate data save area of the memory, and can reduce the amount of data stored in the intermediate data save area of the memory. That is, data from the normal area of memory
Of the buffer and memory,
The data in the data save area is free in the buffer as described above.
Transfers and arithmetic processing are performed reliably by creating an area
Is always lost or depleted from the buffer within a finite time.
Since the number is reduced, deadlock can be prevented.

【0030】そして、送出再開信号出力手段は、メモリ
の中間データ待避領域に格納されたデータの格納量が上
記第1の所定量よりも小さな第2の所定量を下回ると送
出再開信号をプロセサエレメントの外部へ出力する。こ
のような送出再開信号が全てのプロセサエレメントが出
力したときに生成される全体送出再開信号を送出不可信
号発生手段がプロセサエレメントの外部から受け取る
と、該全体送出再開信号により送出不可信号がリセット
され、メモリの通常領域からのデータの送出が再開され
る。 ここで、上記第1及び第2の所定量はデータの格
納量がメモリの中間データ待避領域の容量をオーバーす
る可能性が生じないように設定される。
When the storage amount of the data stored in the intermediate data save area of the memory falls below a second predetermined amount smaller than the first predetermined amount, the transmission restart signal output means outputs a processor restart signal to the processor element. Output to the outside of. Such a transmission restart signal is output by all processor elements.
Unreachable transmission of the whole transmission restart signal generated when input
Signal generation means receives from outside the processor element
Then, the transmission disable signal is reset by the whole transmission restart signal, and the transmission of data from the normal area of the memory is restarted. Here, the first and second predetermined amounts are set such that there is no possibility that the data storage amount exceeds the capacity of the intermediate data save area of the memory.

【0031】以上のように請求項1の発明の構成による
と、メモリの中間データ待避領域に余裕がなくなった場
合にメモリの通常領域からの新たなデータの送出を停止
することによって、メモリの中間データ待避領域のデー
タの格納量を減少させることができるため、メモリの中
間データ待避領域の容量を有限な量に抑えることができ
る。これにより、確実にデッドロックを防止することが
できるとともに、メモリの中間データ待避領域をむやみ
に大きくすることによるコストアップを抑えることがで
きる。
As described above, according to the configuration of the first aspect of the present invention , when there is no more room in the intermediate data save area of the memory, the transmission of new data from the normal area of the memory is stopped, so that the intermediate Since the data storage amount of the data save area can be reduced, the capacity of the intermediate data save area of the memory can be suppressed to a finite amount. As a result, the deadlock can be reliably prevented, and the cost increase due to the needlessly large intermediate data saving area of the memory can be suppressed.

【0032】請求項2の発明の構成により、複数のバッ
ファのうちの少なくとも2つのバッファから第2のポー
トを通じてプロセサエレメントの外部へデータをそれぞ
れ送出する場合において、通信がランダムに発生しデッ
ドロックが発生する可能性が高い際または近傍通信が多
い際には、通信装置は当該通信装置が属するプロセサエ
レメントから最終到着先のプロセサエレメントまでの距
離が相対的に近いデータが格納されているバッファのデ
ータより優先的に送出し、通信がランダムに発生するが
デッドロックが発生する可能性が低い際には、通信装置
は当該通信装置が属するプロセサエレメントから最終到
着先のプロセサエレメントまでの距離が相対的に遠いデ
ータが格納されているバッファのデータより優先的に送
出し、通信方向が静的に決定する際には、通信装置は所
定のバッファのデータより優先的に送出し、その他また
は予測がつきにくい際には、通信装置はデータの格納量
が相対的に多いバッファのデータより優先的に送出する
ことが可能である。
According to the second aspect of the present invention , when data is transmitted from at least two buffers of the plurality of buffers to the outside of the processor element through the second port, communication occurs randomly and deadlock occurs. When there is a high possibility of occurrence or near-field communication, the communication device stores data in a buffer in which data whose distance from the processor element to which the communication device belongs to the last destination processor element is relatively short is stored. When the communication is performed at a higher priority and communication is randomly generated but the possibility of deadlock is low, the communication device determines the relative distance from the processor element to which the communication device belongs to the final destination processor element. Out of the buffer that stores data far from the The communication device sends data with a higher priority than the data in a predetermined buffer when making a decision, and when it is difficult or difficult to predict the data, the communication device gives priority to the data in a buffer with a relatively large data storage amount. It is possible to send it out.

【0033】このように、通信形態の違いに応じて適宜
何れのバッファからのデータの送出を優先するかを選択
することができるため、通信効率を大きく向上させるこ
とができる。
As described above, it is possible to appropriately select from which buffer the transmission of data is prioritized in accordance with the difference in the communication mode, so that the communication efficiency can be greatly improved.

【0034】さらに、請求項3の発明の構成により、複
数のバッファのうちの少なくとも2つのバッファから第
2のポートを通じてプロセサエレメントの外部へデータ
をそれぞれ送出する場合に、通信装置はメモリの中間デ
ータ待避領域から第1のポートを通じて受け取ったデー
タが格納されているバッファのデータを最優先に送出す
るので、時間的に古いデータから効率よく送出すること
ができる。
Further, according to the third aspect of the present invention , when transmitting data from at least two of the plurality of buffers to the outside of the processor element through the second port, the communication device can store the intermediate data in the memory. Since the data in the buffer storing the data received from the save area through the first port is transmitted with the highest priority, it is possible to efficiently transmit data that is older in time.

【0035】また、請求項4の発明の構成により、全体
送出停止信号供給手段は、複数のプロセサエレメントの
通信装置から出力されるすべての送出停止信号の論理和
を演算しその演算結果を全体送出停止信号として上記複
数のプロセサエレメントのすべての通信装置に供給する
と共に、全体送出再開信号供給手段は、複数のプロセサ
エレメントの通信装置から出力されるすべての送出再開
信号の論理積を演算しその演算結果を全体送出再開信号
として上記複数のプロセサエレメントのすべての通信装
置に供給する。
Further, according to the configuration of the fourth aspect of the present invention , the entire transmission stop signal supply means calculates the logical sum of all the transmission stop signals output from the communication devices of the plurality of processor elements, and transmits the operation result as a whole. The supply signal is supplied to all the communication devices of the plurality of processor elements as a stop signal, and the overall transmission resumption signal supply means calculates the logical product of all the transmission resumption signals output from the communication devices of the plurality of processor elements, and performs the operation. The result is supplied to all communication devices of the plurality of processor elements as an entire transmission restart signal.

【0036】即ち、メモリの中間データ待避領域に格納
されたデータの格納量が第1の所定量を越えたプロセサ
エレメントが1つでも存在すればすべてのプロセサエレ
メントがメモリの通常領域からのデータの送出を停止
し、すべてのプロセサエレメントのメモリの中間データ
待避領域に格納されたデータの格納量が第2の所定量を
下回ったときにすべてのプロセサエレメントがメモリの
通常領域からのデータの送出を再開することができる。
That is, if there is at least one processor element in which the storage amount of data stored in the intermediate data save area of the memory exceeds the first predetermined amount, all the processor elements can store data from the normal area of the memory. The transmission is stopped, and when the storage amount of the data stored in the intermediate data save area of the memory of all the processor elements falls below the second predetermined amount, all the processor elements stop transmitting the data from the normal area of the memory. Can be resumed.

【0037】従って、請求項4の発明の構成によると、
メモリの中間データ待避領域に余裕がなくなった場合に
メモリの通常領域からの新たなデータの送出を停止し、
メモリの中間データ待避領域に余裕が生じた時点でメモ
リの通常領域からの新たなデータの送出を再開すること
ができる。
Therefore, according to the structure of the invention of claim 4 ,
If there is no more room in the intermediate data save area of the memory, stop sending new data from the normal area of the memory,
When there is room in the intermediate data saving area of the memory, transmission of new data from the normal area of the memory can be resumed.

【0038】請求項5の発明の構成により、1つのプロ
セサエレメントに対して、全体送出停止信号供給手段の
第1の共通接続線と全体送出再開信号供給手段の第2の
共通接続線との2本の信号線を設けるだけでよく、1つ
のプロセサエレメントに対して、送出停止信号、送出再
開信号、全体送出停止信号及び全体送出再開信号のため
に4本の信号線を設ける必要がなく、ハードウェアを削
減することができる。
According to the structure of the fifth aspect of the present invention , one processor element is provided with a first common connection line of the whole transmission stop signal supply unit and a second common connection line of the whole transmission restart signal supply unit. It is only necessary to provide four signal lines, and it is not necessary to provide four signal lines for a transmission stop signal, a transmission restart signal, an overall transmission stop signal, and an overall transmission restart signal for one processor element. Wear can be reduced.

【0039】[0039]

【実施例】【Example】

(プロセサエレメント)以下、本発明の第1の実施例に
係るプロセサエレメント(以下PEと呼ぶ)を図1,図
2,図3及び図4に基づいて説明する。
(Processor Element) Hereinafter, a processor element (hereinafter referred to as PE) according to the first embodiment of the present invention will be described with reference to FIGS. 1, 2, 3 and 4. FIG.

【0040】図1は第1の実施例に係るPE16Aを示
しており、図1において、PE16Aは通信装置1Aと
メモリ10とプロセサ(図示省略)とを有しており、メ
モリ10は通常領域12と中間データ待避領域11とを
持っている。
FIG. 1 shows a PE 16A according to the first embodiment. In FIG. 1, the PE 16A has a communication device 1A, a memory 10, and a processor (not shown). And an intermediate data save area 11.

【0041】図2はPE16Aの形態を示しており、図
2において、1Aは通信装置、10はメモリ、15はプ
ロセサであり、PE16Aの形態としては(a),
(b),(c)の3種類が考えられる。何れの場合にも
通信装置1A側のインターフェースとしてはポート2e
が使用される。
FIG. 2 shows the form of the PE 16A. In FIG. 2, 1A is a communication device, 10 is a memory, and 15 is a processor.
There are three types (b) and (c). In any case, the interface on the communication device 1A side is port 2e.
Is used.

【0042】(a)の形態は、通信装置1Aとメモリ1
0とプロセサ15とをバス17で共通に接続したもので
ある。通信装置1Aとプロセサ15とは互いにバス17
を獲得し合ってメモリ10にアクセスする。
In the form (a), the communication device 1A and the memory 1
0 and the processor 15 are commonly connected by a bus 17. The communication device 1A and the processor 15 communicate with each other via a bus 17
And the memory 10 is accessed.

【0043】(b)の形態は、通信装置1A、メモリ1
0、プロセサ15の順に接続したものである。メモリ1
0は2つのポートを持ち、通信装置1A及びプロセサ1
5は互いに独立にメモリ10にアクセスする。
In the form (b), the communication device 1A, the memory 1
0 and the processor 15 are connected in this order. Memory 1
0 has two ports, the communication device 1A and the processor 1
5 access the memory 10 independently of each other.

【0044】(c)の形態は、通信装置1A、プロセサ
15、メモリ10の順に接続したものである。メモリ1
0はプロセサ15の監視下にあり、通信装置1Aはプロ
セサ15を介して間接的にメモリ10にアクセスする。
In the form (c), the communication device 1A, the processor 15, and the memory 10 are connected in this order. Memory 1
0 is under the monitoring of the processor 15, and the communication device 1 </ b> A indirectly accesses the memory 10 via the processor 15.

【0045】何れのPEの形態にも長短はあるが本実施
例の効果とは直接的には関係しないので以下の説明では
PE16Aは(a)の形態であるとする。
Although any of the PEs has some advantages and disadvantages, it is not directly related to the effects of the present embodiment. Therefore, in the following description, it is assumed that the PE 16A has the form (a).

【0046】図3はPE16Aの通信装置1Aの構成を
示しており、図3において、2a,2b,2c,2dは
PE16Aの外部へ通じる第2のポートとしてのポー
ト、2eは第1のポートとしてのポート、3a,3b,
3c,3d,3eは出力するデータを選択するセレク
タ、4a,4b,4c,4d,4eはデータを一時的に
格納し先入れ先出し(FIFO)に構成されたバッフ
ァ、5a,5b,5c,5d,5eはバッファの状態を
監視しバッファがフル状態になるとフル信号FULを発
生する判定手段、6a,6b,6c,6d,6eは判定
手段が発生するフル信号FULをPE16Aの外部へ送
るフル信号線、7a,7b,7c,7d,7eはデータ
線、8は送出停止信号出力手段、送出再開信号出力手段
及び送出不可信号発生手段としての機能を合せ持つ制御
手段である。また、20は制御手段8がセットする送出
停止信号SSをPE16Aの外部へ出力するための送出
停止信号線、21は制御手段8が全体送出停止信号AS
Sを受け取るための全体送出停止信号線、22は制御手
段8がセットする送出再開信号SRをPE16Aの外部
へ出力するための送出再開信号線、23は制御手段8が
全体送出再開信号ASRを受け取るための全体送出再開
信号線、24はアサートされた全体送出停止信号により
セットされアサートされた全体送出再開信号によりリセ
ットされる送出不可信号SIを制御手段8が出力するた
めの送出不可信号線である。
FIG. 3 shows the configuration of the communication device 1A of the PE 16A. In FIG. 3, 2a, 2b, 2c, and 2d denote ports serving as second ports leading to the outside of the PE 16A, and 2e denotes a first port. Ports 3a, 3b,
Reference numerals 3c, 3d, and 3e denote selectors for selecting data to be output. Reference numerals 4a, 4b, 4c, 4d, and 4e temporarily store data and buffers 5a, 5b, 5c, 5d, and 5e configured as first-in first-out (FIFO). Is a judging means for monitoring the state of the buffer and generating a full signal FUL when the buffer is full, 6a, 6b, 6c, 6d and 6e are full signal lines for sending the full signal FUL generated by the judging means to the outside of the PE 16A; 7a, 7b, 7c, 7d, 7e are data lines, and 8 is a control means having functions as a transmission stop signal output means, a transmission restart signal output means, and a transmission disable signal generation means. Reference numeral 20 denotes a transmission stop signal line for outputting a transmission stop signal SS set by the control means 8 to the outside of the PE 16A.
S is an entire transmission stop signal line for receiving S, 22 is a transmission restart signal line for outputting a transmission restart signal SR set by the control means 8 to the outside of the PE 16A, and 23 is a control means 8 which receives the entire transmission restart signal ASR. 24 is a transmission disable signal line for the control means 8 to output a transmission disable signal SI set by the asserted overall transmission stop signal and reset by the asserted overall transmission restart signal. .

【0047】通信装置1Aは、各入力ごとにバッファを
有し各出力ごとに5入力1出力のセレクタを有してお
り、図3に示すように、5つのポート2a〜2eを有し
ポート2a〜2e間でデータを転送するように構成され
ている。例えば、データはポート2aからポート2dに
次のように流れる。
The communication device 1A has a buffer for each input and a selector of 5 inputs and 1 output for each output. As shown in FIG. 3, the communication device 1A has five ports 2a to 2e and two ports 2a to 2e. To 2e. For example, data flows from port 2a to port 2d as follows.

【0048】ポート2a→バッファ4a→セレクタ3d
→ポート2dまた、通信装置1Aは、バッファ4a〜4
eのうちの一のバッファからポート2a〜2dを通じて
PE16Aの外部へデータを送出できない状態が所定時
間以上続いた場合に、当該データを上記一のバッファか
らポート2eを通じてメモリ10の中間データ待避領域
11に送出する。
Port 2a → buffer 4a → selector 3d
→ Port 2d The communication device 1A has buffers 4a to 4d.
e, when data cannot be sent from one buffer to the outside of the PE 16A through the ports 2a to 2d for a predetermined time or longer, the data is transferred from the one buffer to the intermediate data save area 11 of the memory 10 through the port 2e. To send to.

【0049】さらに、通信装置1Aは、バッファ4a〜
4eのうちの少なくとも2つのバッファから同一のポー
トを通じてPE16Aの外部へデータをそれぞれ送出す
る場合のモードとして次の4つのモードを選択可能に持
っており、第1のモードとしてデータの格納量が相対的
に多いバッファのデータより優先的に送出するモード
を、第2のモードとしてPE16Aから最終到着先のP
Eまでの距離が相対的に遠いデータが格納されているバ
ッファのデータより優先的に送出するモードを、第3の
モードとしてPE16Aから最終到着先のプロセサエレ
メントまでの距離が相対的に近いデータが格納されてい
るバッファのデータより優先的に送出するモードを、第
4のモードとして所定のバッファのデータより優先的に
送出するモードを持っている。
Further, the communication device 1A includes buffers 4a to 4a.
4e, the following four modes are selectable as modes for sending data from the at least two buffers to the outside of the PE 16A through the same port. The first mode is that the data storage amount is relatively small. The mode in which data is sent with a higher priority than the data in the buffer with the largest number is set as the second mode from the PE 16A to the P of the final destination.
A mode in which data with a relatively long distance to E is transmitted in preference to data in a buffer in which data is stored is a third mode in which data with a relatively short distance from the PE 16A to the processor element at the final destination. A mode in which data is transmitted with higher priority than data stored in the buffer is a fourth mode in which data is transmitted with higher priority than data in a predetermined buffer.

【0050】さらに、通信装置1Aの制御手段8は、ポ
ート2eからメモリ10の中間データ待避領域11への
アクセス回数をカウントし、メモリ10の中間データ待
避領域11に格納されたデータの格納量が第1の所定量
を越えると送出停止信号SSをセットしアサートされた
送出停止信号SSを送出停止信号線20を通じてPEの
外部へ出力し、メモリ10の中間データ待避領域11に
格納されたデータの格納量が第2の所定量を下回ると送
出再開信号SRをセットしアサートされた送出再開信号
SRを送出再開信号線22を通じてPEの外部へ出力す
る。ここで、第1及び第2の所定量は第1の所定量>第
2の所定量を満たすように設定されている。
Further, the control means 8 of the communication device 1A counts the number of accesses from the port 2e to the intermediate data saving area 11 of the memory 10, and the storage amount of the data stored in the intermediate data saving area 11 of the memory 10 becomes When the transmission stop signal SS exceeds the first predetermined amount, the transmission stop signal SS is set, the asserted transmission stop signal SS is output to the outside of the PE through the transmission stop signal line 20, and the data stored in the intermediate data save area 11 of the memory 10 is output. When the storage amount falls below the second predetermined amount, the transmission restart signal SR is set and the asserted transmission restart signal SR is output to the outside of the PE through the transmission restart signal line 22. Here, the first and second predetermined amounts are set so as to satisfy the first predetermined amount> the second predetermined amount.

【0051】図4は制御手段8の一部であるフリップフ
ロップ9を示しており、図4に示すように、フリップフ
ロップ9はアサートされた全体送出停止信号ASSによ
りセットされアサートされた全体送出再開信号ASRに
よりリセットされる送出不可信号SIを発生する。送出
不可信号SIがアサートされている間中、メモリ10の
通常領域12からのデータの送出は行われない。
FIG. 4 shows a flip-flop 9 which is a part of the control means 8. As shown in FIG. 4, the flip-flop 9 is set by the asserted general transmission stop signal ASS, and is asserted to restart the general transmission. A transmission disable signal SI reset by the signal ASR is generated. While the transmission disable signal SI is asserted, data transmission from the normal area 12 of the memory 10 is not performed.

【0052】以上のように構成された第1の実施例に係
るPE16Aにおいては、通信装置1Aは、バッファ4
a〜4eのうちの一のバッファからポート2a〜2dを
通じてPE16Aの外部へデータを送出できない状態が
所定時間以上続いた場合に、当該データを上記一のバッ
ファからポート2eを通じてメモリ10の中間データ待
避領域11に送出するため、上記一のバッファ内に空き
領域を作ることができる。これにより、上記一のバッフ
ァ内の他のデータの送出が可能となり、データが長時間
特定箇所に停滞することがなくなり通信効率が向上す
る。さらに、データは有限時間内にバッファから必ずな
くなるのでデッドロックも防止することができる。
In the PE 16A according to the first embodiment configured as described above, the communication device 1A
If a state in which data cannot be sent from one of the buffers a to 4e to the outside of the PE 16A through the ports 2a to 2d continues for a predetermined time or more, the data is saved from the one buffer to the intermediate data in the memory 10 through the port 2e. Since the data is sent to the area 11, a free area can be created in the one buffer. As a result, other data in the one buffer can be transmitted, and data does not stay at a specific location for a long time, thereby improving communication efficiency. Further, since data always disappears from the buffer within a finite time, deadlock can be prevented.

【0053】また、第1の実施例に係るPE16Aにお
いては、バッファ4a〜4eのうちの少なくとも2つの
バッファから同一のポートを通じてPE16Aの外部へ
データをそれぞれ送出する場合において、通信がランダ
ムに発生しデッドロックが発生する可能性が高い際また
は近傍通信が多い際には、通信装置1AはPE16Aか
ら最終到着先のPEまでの距離が相対的に近いデータが
格納されているバッファのデータより優先的に送出し、
通信がランダムに発生するがデッドロックが発生する可
能性が低い際には、通信装置1AはPE16Aから最終
到着先のPEまでの距離が相対的に遠いデータが格納さ
れているバッファのデータより優先的に送出し、通信方
向が静的に決定する際には、通信装置1Aは所定のバッ
ファのデータより優先的に送出し、その他または予測が
つきにくい際には、通信装置1Aはデータの格納量が相
対的に多いバッファのデータより優先的に送出すること
が可能である。
In the PE 16A according to the first embodiment, when data is transmitted from at least two of the buffers 4a to 4e to the outside of the PE 16A through the same port, communication occurs randomly. When there is a high possibility that a deadlock will occur or when there are many nearby communications, the communication device 1A gives priority to data in a buffer in which data whose distance from the PE 16A to the final destination PE is relatively short is stored. Sent to
When the communication occurs randomly but the possibility of deadlock is low, the communication device 1A has a higher priority than the data in the buffer in which the data from the PE 16A to the final destination PE is relatively long. When the communication direction is determined statically, the communication device 1A sends out the data in a predetermined buffer with a higher priority than the data in a predetermined buffer. It is possible to send out data in a buffer having a relatively large amount in preference to data in the buffer.

【0054】このように、通信形態の違いに応じて適宜
何れのバッファからのデータの送出を優先するかを選択
することができるため、通信効率を大きく向上させるこ
とができる。
As described above, since it is possible to appropriately select from which buffer the transmission of data is prioritized according to the difference in the communication mode, the communication efficiency can be greatly improved.

【0055】さらに、第1の実施例に係るPE16Aに
おいては、通信手段1Aの制御手段8は、メモリ10の
中間データ待避領域11に格納されたデータの格納量が
第1の所定量を越えると送出停止信号SSをPE16A
の外部へ出力する。このような送出停止信号SSにより
全体送出停止信号ASSが生成される。制御手段8がP
E16Aの外部から全体送出停止信号ASSを受け取る
と該全体送出停止信号ASSにより送出不可信号SIが
セットされる。PE16Aは、上記送出不可信号SIが
アサートされている間中、メモリ10の通常領域12か
らのデータの送出を停止する。これにより、PE16A
はバッファ4a〜4e及びメモリ10の中間データ待避
領域11のデータの処理に専念することができ、メモリ
10の中間データ待避領域11のデータの格納量を減少
させることができる。
Further, in the PE 16A according to the first embodiment, the control means 8 of the communication means 1A determines that the storage amount of the data stored in the intermediate data save area 11 of the memory 10 exceeds the first predetermined amount. Send stop signal SS to PE16A
Output to the outside of. The overall transmission stop signal ASS is generated by such a transmission stop signal SS. If the control means 8 is P
When the whole transmission stop signal ASS is received from outside the E16A, the transmission disable signal SI is set by the whole transmission stop signal ASS. The PE 16A stops transmitting data from the normal area 12 of the memory 10 while the transmission disable signal SI is asserted. Thereby, PE16A
Can concentrate on the processing of data in the buffers 4a to 4e and the intermediate data saving area 11 of the memory 10, and can reduce the amount of data stored in the intermediate data saving area 11 of the memory 10.

【0056】そして、制御手段8は、メモリ10の中間
データ待避領域11に格納されたデータの格納量が上記
第1の所定量よりも小さな第2の所定量を下回ると送出
再開信号SRをPE16Aの外部へ出力する。このよう
な送出再開信号SRにより全体送出再開信号ASRが生
成される。制御手段8がPE16Aの外部から全体送出
再開信号ASRを受け取ると該全体送出再開信号ASR
により送出不可信号SIがリセットされ、メモリ10の
通常領域12からのデータの送出が再開される。 この
ように、メモリの中間データ待避領域に余裕がなくなっ
た場合にメモリの通常領域からの新たなデータの送出を
停止することによって、メモリの中間データ待避領域の
データの格納量を減少させることができるため、メモリ
の中間データ待避領域の容量を有限な量に抑えることが
できる。これにより、メモリの中間データ待避領域をむ
やみに大きくすることによるコストアップを抑えること
ができる。
When the storage amount of the data stored in the intermediate data save area 11 of the memory 10 falls below a second predetermined amount smaller than the first predetermined amount, the control means 8 sends the transmission restart signal SR to the PE 16A. Output to the outside of. The overall transmission restart signal ASR is generated by such a transmission restart signal SR. When the control means 8 receives the whole transmission restart signal ASR from outside the PE 16A, the whole transmission restart signal ASR
As a result, the transmission disable signal SI is reset, and transmission of data from the normal area 12 of the memory 10 is restarted. In this way, by stopping the transmission of new data from the normal area of the memory when the intermediate data saving area of the memory becomes full, it is possible to reduce the data storage amount of the intermediate data saving area of the memory. Therefore, the capacity of the intermediate data save area of the memory can be suppressed to a finite amount. As a result, it is possible to suppress an increase in cost due to an unnecessarily large intermediate data saving area of the memory.

【0057】以下、本発明の第2及び第3の実施例に係
るPEを第1の実施例に係るPE16Aと比較しながら
図1,図5及び図6に基づいて説明する。ここでは、図
面の簡略化のためにポートが3つの場合について説明す
る。なお、プロセサは省略されている。
Hereinafter, the PE according to the second and third embodiments of the present invention will be described with reference to FIGS. 1, 5 and 6 while comparing with the PE 16A according to the first embodiment. Here, a case of three ports will be described for simplification of the drawing. Note that the processor is omitted.

【0058】図1に示す第1の実施例に係るPE16A
においては、メモリ10から読み出されたデータはまず
バッファ4eに格納される。そして、当該データは、ポ
ート2aにはセレクタ3aを経由して送出され、ポート
2dにはセレクタ3dを経由して送出される。
The PE 16A according to the first embodiment shown in FIG.
In, the data read from the memory 10 is first stored in the buffer 4e. The data is sent to the port 2a via the selector 3a, and sent to the port 2d via the selector 3d.

【0059】ここで、バッファ4eは先入れ先出し(F
IFO)装置であるため、バッファ4eへの格納順でし
かデータを送出できない。メモリ10の中間データ待避
領域11のデータを既に存在するバッファ4e内のデー
タを飛び越して優先的に送出した方が好都合である。な
ぜなら、メモリ10の中間データ待避領域11内のデー
タの格納量が多ければメモリ10の通常領域12からの
データの送出が停止されたままであるし、また、メモリ
10の中間データ待避領域11のデータは時間的に古い
からである。
Here, the buffer 4e has a first-in first-out (F
Since the device is an IFO device, data can be transmitted only in the order of storage in the buffer 4e. It is more convenient to send the data in the intermediate data save area 11 of the memory 10 with priority over the data in the buffer 4e that already exists. This is because if the amount of data stored in the intermediate data save area 11 of the memory 10 is large, the transmission of data from the normal area 12 of the memory 10 is stopped, and the data in the intermediate data save area 11 of the memory 10 is stopped. Is old in time.

【0060】第2及び第3の実施例に係るPEはこのよ
うな点を考慮したものである。
The PEs according to the second and third embodiments take such points into consideration.

【0061】図5は第2の実施例に係るPE16Bを示
しており、第1の実施例に係るPE16Aと同様のもの
には同一の符号が付されている。図5に示すように、通
信装置1B内にはバッファ4a,4dの各入力側に入力
セレクタ13a,13bがそれぞれ設けられており、メ
モリ10からのデータの送出は次のように行われる。メ
モリ10の通常領域12からデータが送出される場合に
は、一旦、データがバッファ4eに格納され、その後、
当該データは、ポート2aにはセレクタ3aを経由して
送出され、ポート2dにはセレクタ3dを経由して送出
される。メモリ10の中間データ待避領域11からデー
タが送出される場合には、当該データが元来ポート2a
から来たものであれば入力セレクタ13aを経由してバ
ッファ4aに格納され、当該データが元来ポート2dか
ら来たものであれば入力セレクタ13bを経由してバッ
ファ4dに格納される。その後、当該データは、ポート
2aにはセレクタ3aを経由して送出され、ポート2d
にはセレクタ3dを経由して送出される。
FIG. 5 shows a PE 16B according to the second embodiment, and the same components as those of the PE 16A according to the first embodiment are denoted by the same reference numerals. As shown in FIG. 5, in the communication device 1B, input selectors 13a and 13b are provided on each input side of the buffers 4a and 4d, respectively, and data transmission from the memory 10 is performed as follows. When data is sent from the normal area 12 of the memory 10, the data is temporarily stored in the buffer 4e, and thereafter,
The data is transmitted to the port 2a via the selector 3a, and transmitted to the port 2d via the selector 3d. When data is sent from the intermediate data save area 11 of the memory 10, the data is originally stored in the port 2a.
If the data comes from the port 2d, it is stored in the buffer 4d via the input selector 13b if the data originally came from the port 2d. Thereafter, the data is transmitted to the port 2a via the selector 3a, and is transmitted to the port 2d.
Are transmitted via the selector 3d.

【0062】図6は第3の実施例に係るPE16Cを示
しており、第1の実施例に係るPE16Aと同様のもの
には同一の符号が付されている。図6に示すように、通
信装置1C内にはバッファ14が設けられており、メモ
リ10からのデータの送出は次のように行われる。メモ
リ10の通常領域12からデータが送出される場合に
は、一旦、データがバッファ4eに格納され、その後、
当該データは、ポート2aにはセレクタ3aを経由して
送出され、ポート2dにはセレクタ3dを経由して送出
される。メモリ10の中間データ待避領域11からデー
タが送出される場合には、一旦、データはバッファ14
に格納され、その後、当該データは、ポート2aにはセ
レクタ3aを経由して送出され、ポート2dにはセレク
タ3dを経由して送出される。
FIG. 6 shows a PE 16C according to the third embodiment, and the same components as those of the PE 16A according to the first embodiment are denoted by the same reference numerals. As shown in FIG. 6, a buffer 14 is provided in the communication device 1C, and data transmission from the memory 10 is performed as follows. When data is sent from the normal area 12 of the memory 10, the data is temporarily stored in the buffer 4e, and thereafter,
The data is transmitted to the port 2a via the selector 3a, and transmitted to the port 2d via the selector 3d. When data is sent from the intermediate data save area 11 of the memory 10, the data is temporarily stored in the buffer 14.
Then, the data is transmitted to the port 2a via the selector 3a, and transmitted to the port 2d via the selector 3d.

【0063】以上のように、第2及び第3の実施例に係
るPE16B,16Cにおいては、メモリ10の中間デ
ータ待避領域11からのデータをバッファ4e以外のバ
ッファに格納することができるため、メモリ10の中間
データ待避領域11からのデータの送出をバッファ4e
内のデータの送出に優先して実行することができる。
As described above, in the PEs 16B and 16C according to the second and third embodiments, the data from the intermediate data save area 11 of the memory 10 can be stored in a buffer other than the buffer 4e. The transmission of data from the intermediate data save area 11 of the buffer 10 is performed by the buffer 4e.
Can be executed prior to the transmission of the data in the data.

【0064】(並列処理システム)以下、ここまでに説
明したPEを用いた本発明の第4の実施例に係る並列処
理システムを図7,図8,図9,図10及び図11に基
づいて説明する。以下の説明において、PEは第1,第
2及び第3の実施例に係る何れのPEでもよいが、特に
断らない限り第1の実施例に係るPE16Aを用いるも
のとし、PEの形態は図2における(a)の形態とす
る。
(Parallel Processing System) A parallel processing system according to the fourth embodiment of the present invention using the PEs described above will be described with reference to FIGS. 7, 8, 9, 10, and 11. explain. In the following description, the PE may be any of the PEs according to the first, second, and third embodiments. However, unless otherwise specified, the PE 16A according to the first embodiment is used. (A).

【0065】初めに、第4の実施例に係る並列処理シス
テムの概略を図7,図8及び図9に基づいて説明する。
First, an outline of a parallel processing system according to the fourth embodiment will be described with reference to FIGS. 7, 8, and 9.

【0066】図7は第4の実施例に係る並列処理システ
ムを示しており、(a)は4×4のクロスバー結合の例
を示し、(b)は当該並列処理システムのPEを示して
いる。図7に示すように、PEは外部に対して4つのポ
ート2a,2b,2c,2dを有しており、各PEには
番号[0000]〜[1111]が付加されている。例
えば、PE[0101]のポート2dとPE[100
1]のポート2aとが接続されている。また、端に位置
するPEは2つまたは3つのポートを有することにな
る。例えば、PE[0000]はポート2c、2dの2
つのポートを有している。
FIG. 7 shows a parallel processing system according to the fourth embodiment. FIG. 7A shows an example of a 4 × 4 crossbar connection, and FIG. 7B shows the PE of the parallel processing system. I have. As shown in FIG. 7, the PE has four ports 2a, 2b, 2c, and 2d to the outside, and numbers [0000] to [1111] are added to each PE. For example, port 2d of PE [0101] and PE [100
1] is connected to port 2a. Also, the PE located at the end will have two or three ports. For example, PE [0000] is the port 2c, 2d of port 2d.
Has two ports.

【0067】第4の実施例に係る並列処理システムにお
けるPE間の通信は次のように行なわれる。ここで、P
E間の通信に使用されるデータは、図8に示すように、
横方向部D1と縦方向部D2とデータ部D3とにより構
成され、図8(a)は図7に示すパスP1で転送される
データのデータ形式を示し、図8(b)は図7に示すパ
スP2で転送されるデータのデータ形式を示している。
このようなデータ形式は、例えば、「特開昭63−12
4162号」公報に詳しく開示されている。要は、デー
タの横方向部D1が送出先のPEの番号の上位2ビット
に対応し、データの縦方向部D2が送出先のPEの番号
の下位2ビットに対応している。
Communication between PEs in the parallel processing system according to the fourth embodiment is performed as follows. Where P
The data used for communication between Es is as shown in FIG.
FIG. 8A shows a data format of data transferred by the path P1 shown in FIG. 7, and FIG. 8B shows a data format of the data transferred from the horizontal direction part D1, the vertical direction part D2, and the data part D3. The data format of the data transferred by the indicated path P2 is shown.
Such a data format is described in, for example,
No. 4162 ". In short, the horizontal part D1 of the data corresponds to the upper two bits of the number of the destination PE, and the vertical part D2 of the data corresponds to the lower two bits of the number of the destination PE.

【0068】図7に示すパスP1におけるデータの転送
においては、まず、PE[0110]は図8(a)に示
すようにデータの横方向部D1に[10]を縦方向部D
2に[01]を付加しデータを縦方向に送出する。そし
て、データの縦方向部D2が[01]であるので、PE
[0110]は当該PE[0110]と同一縦ラインの
PEのうちPEの番号の下位2ビットが[01]である
PE[0101]に対してデータを送出する。PE[0
101]において、データの横方向部D1とPEの番号
の上位2ビットとが一致しないのでPE[0101]は
中継動作に入る。ここで、データの縦方向部D2とPE
の番号の下位2ビットとが一致しているので今度は横方
向の通信を行なう。データの横方向部D1が[10]で
あるので、PE[0101]は当該PE[0101]と
同一横ラインのPEのうちPEの番号の上位2ビットが
[10]であるPE[1001]に対してデータを送出
する。PE[1001]においては、データの横方向部
D1とPEの番号の上位2ビットとが一致し且つデータ
の縦方向部D2とPEの番号の下位2ビットとが一致す
ることで、PE[1001]自身が送出先であることが
分かりPE[1001]が当該データを取り込み(メモ
リの通常領域に書き込み)データの転送は終了する。
In the data transfer on the path P1 shown in FIG. 7, first, the PE [0110] adds [10] to the horizontal part D1 of the data and the vertical part D as shown in FIG.
[01] is added to 2 and the data is transmitted in the vertical direction. Then, since the vertical portion D2 of the data is [01], PE
[0110] sends data to the PE [0101] in which the lower two bits of the PE number are [01] among the PEs on the same vertical line as the PE [0110]. PE [0
101], the horizontal part D1 of the data does not match the upper two bits of the PE number, so that PE [0101] enters the relay operation. Here, the vertical portion D2 of data and PE
Since the lower 2 bits of the number match, communication in the horizontal direction is performed. Since the horizontal portion D1 of the data is [10], the PE [0101] is assigned to the PE [1001] whose upper two bits of the PE number are [10] among the PEs on the same horizontal line as the PE [0101]. Sends data to it. In the PE [1001], the horizontal part D1 of the data matches the upper two bits of the PE number, and the vertical part D2 of the data matches the lower two bits of the PE number. ], The PE [1001] finds itself as the destination, and the PE [1001] captures the data (writes it to the normal area of the memory), and the data transfer ends.

【0069】図7に示すパスP2におけるデータの転送
においては、まず、PE[0110]は図8(b)に示
すようにデータの横方向部D1に[11]を縦方向部D
2に[01]を付加しデータを縦方向に送出する。そし
て、データの縦方向部D2が[01]であるので、PE
[0110]は当該PE[0110]と同一縦ラインの
PEのうちPEの番号の下位2ビットが[01]である
PE[0101]に対してデータを送出する。PE[0
101]において、データの横方向部D1とPEの番号
の上位2ビットとが一致しないのでPE[0101]は
中継動作に入る。ここで、データの縦方向部D2とPE
の番号の下位2ビットとが一致しているので今度は横方
向の通信を行なう。データの横方向部D1が[11]で
あるので、最終的にはPE[0101]と同一横ライン
のPEのうちPEの番号の上位2ビットが[11]であ
るPE[1101]に対して送りたいが、PE[010
1]とPE[1101]とは直接繋がっていないので、
PE[0101]は同一横ライン右隣りのPE[100
1]にデータを送出する。PE[1001]において
は、データの横方向部D1とPEの番号の上位2ビット
とが不一致であるので、さらに、PE[1001]はデ
ータをPE[1101]に中継し、PE[1101]に
おいては、データの横方向部D1とPEの番号の上位2
ビットとが一致し且つデータの縦方向部D2とPEの番
号の下位2ビットとが一致することで、PE[110
1]自身が送出先であることが分かりPE[1101]
が当該データを取り込みデータの転送は終了する。
In the data transfer on the path P2 shown in FIG. 7, first, the PE [0110] adds [11] to the horizontal part D1 of the data and the vertical part D as shown in FIG.
[01] is added to 2 and the data is transmitted in the vertical direction. Then, since the vertical portion D2 of the data is [01], PE
[0110] sends data to the PE [0101] in which the lower two bits of the PE number are [01] among the PEs on the same vertical line as the PE [0110]. PE [0
101], the horizontal part D1 of the data does not match the upper two bits of the PE number, so that PE [0101] enters the relay operation. Here, the vertical portion D2 of data and PE
Since the lower 2 bits of the number match, communication in the horizontal direction is performed. Since the horizontal portion D1 of the data is [11], the PE [1101] whose upper two bits of the PE number are [11] among the PEs on the same horizontal line as the PE [0101] is finally obtained. I want to send, but PE [010
1] and PE [1101] are not directly connected,
PE [0101] is the PE [100 on the right side of the same horizontal line.
1]. In PE [1001], since the horizontal portion D1 of the data does not match the upper two bits of the PE number, PE [1001] further relays the data to PE [1101], and PE [1101] Is the horizontal part D1 of the data and the upper two
When the bit matches and the vertical portion D2 of the data matches the lower two bits of the PE number, the PE [110]
1] PE [1101] is found to be the transmission destination
Captures the data, and the data transfer ends.

【0070】図9は第4の実施例に係る並列処理システ
ムの全体送出停止信号供給手段及び全体送出再開信号供
給手段を示す回路図であり、図7(a)に示す並列処理
システムの一部を抜粋したものである。
FIG. 9 is a circuit diagram showing the whole transmission stop signal supply means and the whole transmission restart signal supply means of the parallel processing system according to the fourth embodiment, and is a part of the parallel processing system shown in FIG. This is an excerpt of

【0071】図9において、16AはPEであり、PE
16Aは通信装置1Aと通常領域及び中間データ待避領
域を持つメモリ(図示省略)とを有し、通信装置1Aは
制御手段8を持っている。また、20は送出停止信号S
Sのための送出停止信号線、21は全体送出停止信号A
SSのための全体送出停止信号線、22は送出再開信号
SRのための送出再開信号線、23は全体送出再開信号
ASRのための全体送出再開信号線、28はオアゲー
ト、29はアンドゲートであり、オアゲート28と送出
停止信号線20と全体送出停止信号線21とにより全体
送出停止信号供給手段が構成され、アンドゲート29と
送出再開信号線22と全体送出再開信号線23とにより
全体送出再開信号供給手段が構成されている。
In FIG. 9, reference numeral 16A denotes PE, and PE
16A includes a communication device 1A and a memory (not shown) having a normal area and an intermediate data saving area, and the communication device 1A has a control unit 8. 20 is a transmission stop signal S
A transmission stop signal line for S, 21 is an overall transmission stop signal A
Reference numeral 22 denotes a transmission restart signal line for the transmission restart signal SR, reference numeral 22 denotes an entire transmission restart signal line for the transmission restart signal ASR, reference numeral 28 denotes an OR gate, and reference numeral 29 denotes an AND gate. , An OR gate 28, a transmission stop signal line 20, and an entire transmission stop signal line 21 constitute an entire transmission stop signal supply means, and an AND gate 29, a transmission restart signal line 22, and an entire transmission restart signal line 23 constitute an entire transmission restart signal. Supply means is configured.

【0072】図9に示すように、PE16Aの送出停止
信号SSのそれぞれは送出停止信号線20を通じてオア
ゲート28に入力され、PE16Aのすべての送出停止
信号SSの論理和がオアゲート28により演算されその
演算結果が全体送出停止信号ASSとして全体送出停止
信号線21を通じてすべてのPE16Aに供給される。
さらに、PE16Aの送出再開信号SRのそれぞれは送
出再開信号線22を通じてアンドゲート29に入力さ
れ、PE16Aのすべての送出再開信号SRの論理積が
アンドゲート29により演算されその演算結果が全体送
出再開信号ASRとして全体送出再開信号線23を通じ
てすべてのPE16Aに供給される。
As shown in FIG. 9, each of the transmission stop signals SS of the PE 16A is input to the OR gate 28 through the transmission stop signal line 20, and the logical sum of all the transmission stop signals SS of the PE 16A is calculated by the OR gate 28. The result is supplied to all PEs 16A through the entire transmission stop signal line 21 as the entire transmission stop signal ASS.
Further, each of the transmission resumption signals SR of the PE 16A is input to the AND gate 29 through the transmission resumption signal line 22, and the logical product of all the transmission resumption signals SR of the PE 16A is calculated by the AND gate 29, and the calculation result is output as the whole transmission resumption signal. The ASR is supplied to all PEs 16A through the entire transmission restart signal line 23.

【0073】次に、第4の実施例に係る並列処理システ
ムのデータ待避動作を図10及び図11に基づいて説明
する。
Next, a data saving operation of the parallel processing system according to the fourth embodiment will be described with reference to FIGS.

【0074】図10及び図11において、16x,16
y,16zは第1の実施例に係るPE16Aと同様のP
Eであり、PE16x,16y,16zはメモリ10
x,10y,10zと通信装置1x,1y,1zとをそ
れぞれ有し、メモリ10x,10y,10zは通常領域
12x,12y,12zと中間データ待避領域11x,
11y,11zとをそれぞれ持ち、通信装置1x,1
y,1zはFIFOに構成されたバッファ4x,4y,
4zをそれぞれ持っており、通信装置1xは、バッファ
4xからPE16xの外部へデータを送出できない状態
が所定時間以上続いた場合に、当該データをバッファ4
xからメモリ10xの中間データ待避領域11xに送出
する。通信装置1y,1zも同様である。
In FIGS. 10 and 11, 16x, 16
y and 16z are P similar to those of the PE 16A according to the first embodiment.
E, and the PEs 16x, 16y, and 16z
x, 10y, and 10z and communication devices 1x, 1y, and 1z, respectively, and the memories 10x, 10y, and 10z have normal areas 12x, 12y, and 12z and intermediate data saving areas 11x,
11y, 11z, respectively, and the communication devices 1x, 1
y, 1z are buffers 4x, 4y,
4z, the communication device 1x transmits the data to the buffer 4x when the state in which data cannot be transmitted from the buffer 4x to the outside of the PE 16x continues for a predetermined time or more.
x to the intermediate data save area 11x of the memory 10x. The same applies to the communication devices 1y and 1z.

【0075】ここで、図10に示すように、バッファ4
x,4y,4z内にデータx2,y1、データy2,z
1、データz2,x1がそれぞれ格納されており、PE
16x〜16zのそれぞれにおいてバッファからPEの
外部へデータを送出できない状態であるとする。このよ
うな状態が所定時間以上続いた場合に、バッファ4x,
4y,4zのそれぞれのボトムのデータy1,z1,x
1がメモリ10x,10y,10zの中間データ退避領
域11x,11y,11zにそれぞれ待避される。デー
タがメモリの中間データ待避領域に待避された様子を図
11に示す。これにより、例えば、バッファ4x内のデ
ータx2はメモリ10xに送ることができ通常領域12
xに格納される。同様に、バッファ4y,4z内のデー
タy2,z2はメモリ10y,10zの通常領域12
y,12zにそれぞれ送ることができる。従って、メモ
リ10xの中間データ待避領域11xに待避されていた
データy1をバッファ4yを経由してメモリ10yの通
常領域12yに送ることが可能となり、データy1はメ
モリ10yの通常領域12yに格納される。同様にし
て、メモリ10yの中間データ待避領域11yに待避さ
れていたデータz1はメモリ10zの通常領域12zに
格納され、メモリ10zの中間データ待避領域11zに
待避されていたデータx1はメモリ10xの通常領域1
2xに格納され、データの転送はデッドロックを起こす
ことなく無事完了する。
Here, as shown in FIG.
Data x2, y1, data y2, z in x, 4y, 4z
1, data z2 and x1 are stored, respectively, and PE
It is assumed that data cannot be sent from the buffer to the outside of the PE in each of 16x to 16z. When such a state continues for a predetermined time or more, the buffer 4x,
4y, 4z bottom data y1, z1, x
1 are saved in the intermediate data save areas 11x, 11y, 11z of the memories 10x, 10y, 10z, respectively. FIG. 11 shows a state where the data is saved in the intermediate data saving area of the memory. Thereby, for example, the data x2 in the buffer 4x can be sent to the memory 10x,
x. Similarly, data y2 and z2 in buffers 4y and 4z are stored in normal areas 12 of memories 10y and 10z.
y, 12z. Therefore, the data y1 saved in the intermediate data saving area 11x of the memory 10x can be sent to the normal area 12y of the memory 10y via the buffer 4y, and the data y1 is stored in the normal area 12y of the memory 10y. . Similarly, the data z1 saved in the intermediate data saving area 11y of the memory 10y is stored in the normal area 12z of the memory 10z, and the data x1 saved in the intermediate data saving area 11z of the memory 10z is stored in the normal area of the memory 10x. Area 1
2x, and the data transfer is completed successfully without deadlock.

【0076】以上のように、第4の実施例に係る並列処
理システムによると、データが長時間特定箇所に停滞す
ることがなくなり、PEの外部に特別なハードウェアを
設けることなくPE間のランダムな通信を効率よく実行
できる。さらに、データは有限時間内にバッファから必
ずなくなるのでデッドロックを防止することもできる。
次に、第4の実施例に係る並列処理システムのデータ
送出停止動作及びデータ送出再開動作を図9を参照しな
がら説明する。図9に示すように、各PE16Aでは、
メモリの中間データ待避領域に格納されたデータの格納
量が第1の所定量を越えると通信装置1Aの制御手段8
から送出停止信号SSが出力され、メモリの中間データ
待避領域に格納されたデータの格納量が第2の所定量を
下回ると通信装置1Aの制御手段8から送出再開信号S
Rが出力される。従って、図9に示す接続により、メモ
リの中間データ待避領域に格納されたデータの格納量が
第1の所定量を越えたPE16Aが1つでも存在すれば
全体送出停止信号ASSがアサートされ、また、すべて
のPE16Aでメモリの中間データ待避領域に格納され
たデータの格納量が第2の所定量を下回ったときに全体
送出再開信号ASRがアサートされる。
As described above, according to the parallel processing system according to the fourth embodiment, data does not stay at a specific location for a long time, and random data between PEs is not provided outside the PEs. Communication can be performed efficiently. In addition, deadlock can be prevented because data always disappears from the buffer within a finite time.
Next, a data transmission stop operation and a data transmission restart operation of the parallel processing system according to the fourth embodiment will be described with reference to FIG. As shown in FIG. 9, in each PE 16A,
When the storage amount of the data stored in the intermediate data save area of the memory exceeds the first predetermined amount, the control unit 8 of the communication device 1A
Outputs a transmission stop signal SS from the control means 8 of the communication device 1A when the storage amount of the data stored in the intermediate data save area of the memory falls below the second predetermined amount.
R is output. Therefore, by the connection shown in FIG. 9, if there is at least one PE 16A in which the amount of data stored in the intermediate data save area of the memory exceeds the first predetermined amount, the entire transmission stop signal ASS is asserted. When the storage amount of the data stored in the intermediate data save area of the memory in all PEs 16A falls below the second predetermined amount, the entire transmission restart signal ASR is asserted.

【0077】各PE16Aでは、オアゲート28からの
アサートされた全体送出停止信号ASSによりセットさ
れアンドゲート29からのアサートされた全体送出再開
信号ASRによりリセットされる送出不可信号SIが制
御手段8により発生され、送出不可信号SIがアサート
されている間中、データの新規送出(メモリの通常領域
からのデータの送出)が停止される。送出不可信号SI
がアサートされている間に、バッファ内及びメモリの中
間データ待避領域内のデータの送出に専念することがで
き、データの新規送出がないので並列処理システム内の
データの総量は減少する。
In each PE 16A, the control means 8 generates a transmission disable signal SI which is set by the asserted general transmission stop signal ASS from the OR gate 28 and reset by the asserted general transmission restart signal ASR from the AND gate 29. While the transmission disable signal SI is asserted, new transmission of data (transmission of data from the normal area of the memory) is stopped. Transmission disable signal SI
Is asserted, it is possible to concentrate on sending data in the buffer and in the intermediate data save area of the memory, and since there is no new sending of data, the total amount of data in the parallel processing system is reduced.

【0078】ここで、第1及び第2の所定量は並列処理
システムの規模に応じて安全性をも考慮したうえで設定
される。即ち、第1及び第2の所定量はメモリの中間デ
ータ待避領域の容量をオーバーする可能性が生じないよ
うに設定される。各PE16Aにおいて、並列処理シス
テム内に残存するデータのうち当該PEが中継する可能
性のあるデータの量とメモリの中間データ待避領域の残
りの容量とが等しくなる点がボーダーラインであるの
で、このようなボーダーラインを予め予測し第1及び第
2の所定量が設定される。なお、第1及び第2の所定量
は第1の所定量>第2の所定量を満たすように設定され
る。
Here, the first and second predetermined amounts are set according to the scale of the parallel processing system in consideration of security. That is, the first and second predetermined amounts are set so that there is no possibility that the capacity of the intermediate data save area of the memory will be exceeded. In each of the PEs 16A, the point at which the amount of data that may be relayed by the PE among the data remaining in the parallel processing system is equal to the remaining capacity of the intermediate data saving area of the memory is the border line. Such border lines are predicted in advance, and first and second predetermined amounts are set. The first and second predetermined amounts are set so as to satisfy a first predetermined amount> a second predetermined amount.

【0079】以上のように、第4の実施例に係る並列処
理システムにおいては、メモリの中間データ待避領域に
余裕がなくなった場合にメモリの通常領域からの新たな
データの送出を停止し、メモリの中間データ待避領域に
余裕が生じた時点でメモリの通常領域からの新たなデー
タの送出を再開することができる。メモリの通常領域か
らのデータの送出の停止時に、メモリの中間データ待避
領域のデータの格納量を減少させることができるため、
メモリの中間データ待避領域の容量を有限な量に抑える
ことができる。これにより、メモリの中間データ待避領
域をむやみに大きくすることによるコストアップを抑え
ることができる。
As described above, in the parallel processing system according to the fourth embodiment, the transmission of new data from the normal area of the memory is stopped when the intermediate data save area of the memory becomes full, The transmission of new data from the normal area of the memory can be restarted when the intermediate data save area has a margin. When the transmission of data from the normal area of the memory is stopped, the amount of data stored in the intermediate data save area of the memory can be reduced.
The capacity of the intermediate data save area of the memory can be suppressed to a finite amount. As a result, it is possible to suppress an increase in cost due to an unnecessarily large intermediate data saving area of the memory.

【0080】次に、第4の実施例に係る並列処理システ
ムのデータ送出の優先度について図5を参照しながら説
明する。ここでは、並列処理システムのPEとしてメモ
リの中間データ待避領域からのデータの送出を優先して
実行することが可能な第2の実施例に係るPE16Bが
用いられているものとする。並列処理システムのPEと
して第3の実施例に係るPE16Cが用いられる場合も
同様である。
Next, the priority of data transmission of the parallel processing system according to the fourth embodiment will be described with reference to FIG. Here, it is assumed that the PE 16B according to the second embodiment is used as the PE of the parallel processing system, which is capable of executing the transmission of the data from the intermediate data save area of the memory with priority. The same applies when the PE 16C according to the third embodiment is used as the PE of the parallel processing system.

【0081】図5に示すように、PE16Bは3つのバ
ッファ4a,4d,4eを有している。そのため、複数
のバッファから同一のポートを通じてPE16Bの外部
へデータを送出したい場合が生じる。このとき、何れの
バッファのデータより優先的に読み出すかを決める必要
がある。PE16Bの通信装置1Bはデータの送出時の
優先度の付け方として以下の4つのモードを持ってい
る。なお、以下の4つのモードの何れのモードにおいて
も、メモリ10の中間データ待避領域11からポート2
eを通じて受け取ったデータが格納されているバッファ
のデータが最優先に送出され、その次に優先的に送出さ
れるバッファのデータが以下の4つのモードの何れかに
従って決定される。
As shown in FIG. 5, the PE 16B has three buffers 4a, 4d and 4e. Therefore, there is a case where it is desired to transmit data from a plurality of buffers to the outside of the PE 16B through the same port. At this time, it is necessary to determine which buffer data should be read with priority. The communication device 1B of the PE 16B has the following four modes as a method of assigning a priority when transmitting data. Note that, in any of the following four modes, the port 2
The data in the buffer storing the data received through e is transmitted with the highest priority, and the data in the buffer to be transmitted next with the highest priority is determined according to any of the following four modes.

【0082】(1)データの格納量が相対的に多いバッ
ファのデータより優先的に送出する。
(1) Data is sent with priority over data in a buffer having a relatively large data storage amount.

【0083】(2)当該PE16Bから最終到着先のP
Eまでの距離が相対的に遠いデータが格納されているバ
ッファのデータより優先的に送出する。
(2) P of the final destination from the PE 16B
The data is transmitted with higher priority than the data in the buffer in which data having a relatively long distance to E is stored.

【0084】(3)当該PE16Bから最終到着先のP
Eまでの距離が相対的に近いデータが格納されているバ
ッファのデータより優先的に送出する。
(3) P of the final destination from the PE 16B
The data is transmitted with higher priority than the data in the buffer in which the data whose distance to E is relatively short is stored.

【0085】(4)所定のバッファのデータより優先的
に送出する。
(4) Data is sent out prior to data in a predetermined buffer.

【0086】以上の4つのモード(1)〜(4)の中か
ら何れのモードが選択されるかは、並列処理システムで
解きたいアプリケーションの性質による。通信がランダ
ムに発生しデッドロックが発生する可能性が高い場合ま
たは近傍通信が多い場合には第3のモード(3)が選択
され、通信はランダムに発生するがデッドロックが発生
する可能性が低い場合には第2のモード(2)が選択さ
れ、アプリケーションで通信方向が静的に決まる場合に
は第4のモード(4)が選択され、それ以外または予測
がつきにくい場合には第1のモード(1)が選択され
る。
Which of the four modes (1) to (4) is selected depends on the nature of the application to be solved by the parallel processing system. The third mode (3) is selected when communication is randomly generated and the possibility of deadlock is high or when there are many nearby communication, and the communication occurs randomly but the possibility of deadlock is generated. If it is low, the second mode (2) is selected. If the communication direction is statically determined by the application, the fourth mode (4) is selected. Mode (1) is selected.

【0087】以上のように、第4の実施例に係る並列処
理システムによると、通信形態の違いに応じて適宜何れ
のバッファからのデータの送出を優先するかを選択する
ことができるため通信効率を大きく向上させることがで
きる。さらに、メモリの中間データ待避領域から受け取
ったデータが格納されているバッファのデータを最優先
に送出するので時間的に古いデータから効率よく送出す
ることができる。
As described above, according to the parallel processing system of the fourth embodiment, it is possible to appropriately select from which buffer data transmission is prioritized in accordance with the difference in the communication mode. Can be greatly improved. Further, since the data in the buffer storing the data received from the intermediate data save area of the memory is transmitted with the highest priority, the data can be efficiently transmitted from the oldest data.

【0088】以下、ハードウェアの削減化をワイアード
結合により図った本発明の第5の実施例に係る並列処理
システムを図12に基づいて説明する。
Hereinafter, a parallel processing system according to a fifth embodiment of the present invention in which hardware reduction is achieved by wired connection will be described with reference to FIG.

【0089】図12は第5の実施例に係る並列処理シス
テムの全体送出停止信号供給手段及び全体送出再開信号
供給手段を示す回路図であり、図12において、16A
はPEであり、PE16Aは通信装置1Aと通常領域及
び中間データ待避領域を持つメモリ(図示省略)とを有
し、通信装置1Aは制御手段8を持っている。また、2
0は送出停止信号SSのための送出停止信号線、21は
全体送出停止信号ASSのための全体送出停止信号線、
22は送出再開信号SRのための送出再開信号線、23
は全体送出再開信号ASRのための全体送出再開信号線
である。さらに、30a,30bはインバータ、31a
は第1のMOSトランジスタとしてのCMOSトランジ
スタ、31bは第2のMOSトランジスタとしてのCM
OSトランジスタ、32aはPE16AのCMOSトラ
ンジスタ31aのすべてのドレイン同士を接続する第1
の共通接続線、32bはPE16AのCMOSトランジ
スタ31bのすべてのドレイン同士を接続する第2の共
通接続線、33a,33bは第1及び第2の共通接続線
32a,32bをそれぞれプルアップする抵抗である。
送出停止信号線20と全体送出停止信号線21とインバ
ータ30aとCMOSトランジスタ31aと第1の共通
接続線32aと抵抗33aとにより全体送出停止信号供
給手段が構成され、送出再開信号線22と全体送出再開
信号線23とインバータ30bとCMOSトランジスタ
31bと第2の共通接続線32bと抵抗33bとにより
全体送出再開信号供給手段が構成されている。
FIG. 12 is a circuit diagram showing the whole transmission stop signal supply means and the whole transmission restart signal supply means of the parallel processing system according to the fifth embodiment. In FIG.
Is a PE, the PE 16A has a communication device 1A and a memory (not shown) having a normal area and an intermediate data save area, and the communication device 1A has a control means 8. Also, 2
0 is a transmission stop signal line for the transmission stop signal SS, 21 is an entire transmission stop signal line for the entire transmission stop signal ASS,
22 is a transmission restart signal line for a transmission restart signal SR;
Is a general transmission restart signal line for the general transmission restart signal ASR. Further, 30a and 30b are inverters, 31a
Is a CMOS transistor as a first MOS transistor, and 31b is a CM as a second MOS transistor.
The OS transistor 32a is a first transistor that connects all drains of the CMOS transistor 31a of the PE 16A.
32b is a second common connection line connecting all the drains of the CMOS transistor 31b of PE16A, and 33a and 33b are resistors for pulling up the first and second common connection lines 32a and 32b, respectively. is there.
The transmission stop signal line 20, the whole transmission stop signal line 21, the inverter 30a, the CMOS transistor 31a, the first common connection line 32a, and the resistor 33a constitute a whole transmission stop signal supply means, and the transmission restart signal line 22 and the whole transmission The restart signal line 23, the inverter 30b, the CMOS transistor 31b, the second common connection line 32b, and the resistor 33b constitute an entire transmission restart signal supply unit.

【0090】各PE16Aにおいて送出停止信号SSは
CMOSトランジスタ31aのゲートに入力され、CM
OSトランジスタ31aのドレインは第1の共通接続線
32aにより共通に接続され、第1の共通接続線32a
の電位は抵抗33aにより高電位に保持されている。第
1の共通接続線32aの電位が全体送出停止信号ASS
の反転信号である全体送出停止反転信号/ASSであ
る。各PE16Aにおいて全体送出停止反転信号/AS
Sがインバータ30aにより反転され全体送出停止信号
ASSとして使用される。
In each PE 16A, the transmission stop signal SS is input to the gate of the CMOS transistor 31a,
The drains of the OS transistors 31a are commonly connected by a first common connection line 32a, and the first common connection line 32a
Is held at a high potential by the resistor 33a. The potential of the first common connection line 32a is equal to the total transmission stop signal ASS.
ASS, which is the inverted signal of the entire transmission stop signal. In each PE 16A, the whole transmission stop inversion signal / AS
S is inverted by the inverter 30a and used as the whole transmission stop signal ASS.

【0091】また、各PE16Aにおいて送出再開信号
SRはインバータ30bにより反転され該反転信号がC
MOSトランジスタ31bのゲートに入力され、CMO
Sトランジスタ31bのドレインは第2の共通接続線3
2bにより共通に接続され、第2の共通接続線32bは
抵抗33bにより高電位に保持されている。各PE16
Aにおいて第2の共通接続線32bの電位が全体送出再
開信号ASRとして使用される。
In each PE 16A, the transmission restart signal SR is inverted by the inverter 30b, and the inverted signal is
Input to the gate of the MOS transistor 31b,
The drain of the S transistor 31b is connected to the second common connection line 3
2b, and the second common connection line 32b is held at a high potential by a resistor 33b. Each PE16
At A, the potential of the second common connection line 32b is used as the overall transmission restart signal ASR.

【0092】以上のように、第5の実施例に係る並列処
理システムによると、第4の実施例に係る並列処理シス
テムにおいて1つのPEに対して4本必要であった信号
線がワイアード結合を適用したことによって2本で済む
ことになる。
As described above, according to the parallel processing system according to the fifth embodiment, four signal lines required for one PE in the parallel processing system according to the fourth embodiment are connected by wire. With the application, only two are required.

【0093】なお、第5の実施例に係る並列処理システ
ムにおいては、各PEのトランジスタとしてCMOSト
ランジスタを用いたが、図12にも示すように、各PE
のトランジスタとしてバイポーラトランジスタを用いて
もよい。バイポーラトランジスタを用いた場合には、バ
イポーラトランジスタのベース,コレクタ,エミッタが
CMOSトランジスタのゲート,ドレイン,ソースにそ
れぞれ対応する。
In the parallel processing system according to the fifth embodiment, CMOS transistors are used as transistors of each PE. However, as shown in FIG.
A bipolar transistor may be used as the transistor. When a bipolar transistor is used, the base, collector and emitter of the bipolar transistor correspond to the gate, drain and source of the CMOS transistor, respectively.

【0094】以上述べてきたように、本実施例に係るP
E及び並列処理システムによると、デッドロックに陥る
ことなく、少ないハードウェア量で、PE間のランダム
な通信を高速に実行することができる。これにより、並
列処理システムがその効果を発揮できるアプリケーショ
ンの範囲の拡大が期待できる。
As described above, according to the present embodiment, P
According to E and the parallel processing system, random communication between PEs can be executed at high speed with a small amount of hardware without falling into a deadlock. As a result, it is expected that the range of applications in which the parallel processing system can exert its effects is expanded.

【0095】なお、本実施例に係る並列処理システムに
おいては、PEの結合形態はメッシュ状としたが該結合
形態はリング状、ツリー状、ハイパーキューブ状等の他
の結合形態でも同様の効果を得ることができる。
In the parallel processing system according to the present embodiment, the connection form of the PEs is a mesh, but the same effect can be obtained in other connection forms such as a ring, a tree, and a hypercube. Obtainable.

【0096】[0096]

【発明の効果】以上説明したように、請求項1の発明に
係るプロセサエレメントによると、バッファに保持され
たデータを上記バッファからメモリの中間データ待避領
域に送出するため、バッファ内の他のデータの送出が可
能となり、通信効率を向上させることができるととも
に、他のプロセサエレメントから送出されるデータを確
実に受信できるようになる。
As described above, according to the processor element of the first aspect of the present invention, the data stored in the buffer is stored.
Tomo was for sending data to the intermediate data save area of the memory from the buffer, enables transmission of other data in the buffer, if it is possible to improve the communication efficiency
The data sent from other processor elements.
You can actually receive it.

【0097】また、メモリの中間データ待避領域に格納
されたデータの格納量が第1の所定量を越えると送出停
止信号が出力されると共にメモリの中間データ待避領域
に格納されたデータの格納量が第2の所定量を下回ると
送出再開信号が出力される。そして、上記送出停止信号
が何れかのプロセサエレメントから出力されたときにア
サートされる全体送出停止信号によりセットされ、上記
送出再開信号が全てのプロセサエレメントから出力され
たときにアサートされる全体送出再開信号によりリセッ
トされる送出不可信号がアサートされている間中、メモ
リの通常領域からのデータの送出が停止される。これに
より、バッファ及びメモリの中間データ待避領域のデー
タの処理に専念することができるため、データは有限時
間内にバッファから必ずなくなるのでデッドロックを防
止することができる。また、メモリの中間データ待避領
域のデータの格納量を減少させることができるため、メ
モリの中間データ待避領域の容量を有限な量に抑えるこ
とができる。従って、メモリの中間データ待避領域をむ
やみに大きくすることによるコストアップを抑えること
ができる。
When the storage amount of the data stored in the intermediate data saving area of the memory exceeds the first predetermined amount, a transmission stop signal is output and the storage amount of the data stored in the intermediate data saving area of the memory is output. Is smaller than the second predetermined amount, a transmission restart signal is output. And the transmission stop signal
Is output from any of the processor elements.
Is set by the overall delivery stop signal asserted, the
Transmission restart signal is output from all processor elements.
Sending disable signal is reset by the overall delivery resume signal asserted is in while it is asserted, transmission of data from the normal area of the memory is stopped when the. Accordingly, because it is possible to concentrate on the processing of data in the buffer and the intermediate data save area of the memory, the data is time limited
Prevent deadlocks as they will always be out of the buffer in time
Can be stopped. Further, since the amount of data stored in the intermediate data save area of the memory can be reduced, the capacity of the intermediate data save area of the memory can be suppressed to a finite amount. Therefore, it is possible to suppress an increase in cost due to an unnecessarily large intermediate data saving area of the memory.

【0098】請求項2の発明に係るプロセサエレメント
によると、複数のバッファのうちの少なくとも2つのバ
ッファから第2のポートを通じてプロセサエレメントの
外部へデータをそれぞれ送出する場合において、通信形
態の違いに応じて適宜何れのバッファからのデータの送
出を優先するかを選択することができるため、通信効率
を大きく向上させることができる。さらに、請求項3の
発明に係るプロセサエレメントによると、メモリの中間
データ待避領域から受け取ったデータが格納されている
バッファのデータを最優先に送出するので、時間的に古
いデータから効率よく送出することができる。
According to the processor element of the second aspect of the present invention , when data is transmitted from at least two of the plurality of buffers to the outside of the processor element through the second port, depending on the difference in communication mode. Therefore, it is possible to appropriately select from which buffer the transmission of data is prioritized, so that the communication efficiency can be greatly improved. Further, in claim 3
According to the processor element according to the present invention , the data in the buffer storing the data received from the intermediate data save area of the memory is transmitted with the highest priority, so that the data that is older in time can be transmitted more efficiently.

【0099】また、請求項4の発明に係る並列処理シス
テムによると、メモリの中間データ待避領域に格納され
たデータの格納量が第1の所定量を越えたプロセサエレ
メントが1つでも存在すればすべてのプロセサエレメン
トがメモリの通常領域からのデータの送出を停止し、す
べてのプロセサエレメントのメモリの中間データ待避領
域に格納されたデータの格納量が第2の所定量を下回っ
たときにすべてのプロセサエレメントがメモリの通常領
域からのデータの送出を再開することができる。従っ
て、メモリの中間データ待避領域に余裕がなくなった場
合にメモリの通常領域からの新たなデータの送出を停止
し、メモリの中間データ待避領域に余裕が生じた時点で
メモリの通常領域からの新たなデータの送出を再開する
ことができる。
[0099] According to the parallel processing system according to the invention of claim 4, if present processor elements stored amount of data stored in the intermediate data save area of the memory has exceeded a first predetermined amount even one When all the processor elements stop sending data from the normal area of the memory, and when the storage amount of the data stored in the intermediate data save area of the memory of all the processor elements falls below the second predetermined amount, all the processor elements stop sending data. The processor element can resume sending data from the normal area of the memory. Therefore, when there is no more room in the intermediate data saving area of the memory, the transmission of new data from the normal area of the memory is stopped, and when there is room in the intermediate data saving area of the memory, new data from the normal area of the memory is stopped. It is possible to restart transmission of the appropriate data.

【0100】請求項5の発明に係る並列処理システムに
よると、第1及び第2の共通接続線の2本の信号線を設
けるだけでよく、ハードウェアを削減することができ
る。
According to the parallel processing system of the present invention , it is only necessary to provide two signal lines of the first and second common connection lines, and the hardware can be reduced.

【0101】以上のように、本発明によると、デッドロ
ックに陥ることなく、少ないハードウェア量で、ランダ
ムな通信を効率よく実行することができるプロセサエレ
メント及び並列処理システムを提供することができる。
As described above, according to the present invention, it is possible to provide a processor element and a parallel processing system capable of efficiently executing random communication with a small amount of hardware without falling into a deadlock.

【0102】逐次型システムの性能限界が見えてきてお
り、また、並列処理システムの幅広い分野での活用が期
待される現在、本発明は非常に有用なものである。
The present invention is very useful now that the performance limit of the sequential type system has been revealed and the utilization of the parallel processing system in a wide range of fields is expected.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例に係るプロセサエレメン
トを示すブロック図である。
FIG. 1 is a block diagram showing a processor element according to a first embodiment of the present invention.

【図2】上記第1の実施例に係るプロセサエレメントの
形態を示し、(a)は通信装置とメモリとプロセサとを
共通のバスで接続した形態を示すブロック図であり、
(b)は通信装置,メモリ,プロセサの順に接続した形
態を示すブロック図であり、(c)は通信装置,プロセ
サ,メモリの順に接続した形態を示すブロック図であ
る。
FIG. 2 is a block diagram showing a form of a processor element according to the first embodiment, and FIG. 2A is a block diagram showing a form in which a communication device, a memory, and a processor are connected by a common bus;
(B) is a block diagram showing a form in which a communication device, a memory, and a processor are connected in this order, and (c) is a block diagram showing a form in which a communication device, a processor, and a memory are connected in this order.

【図3】上記第1の実施例に係るプロセサエレメントの
通信装置を示すブロック図である。
FIG. 3 is a block diagram showing a communication device of a processor element according to the first embodiment.

【図4】上記第1の実施例に係るプロセサエレメントの
通信装置の制御手段の一部を示す回路図である。
FIG. 4 is a circuit diagram showing a part of control means of the communication device of the processor element according to the first embodiment.

【図5】本発明の第2の実施例に係るプロセサエレメン
トを示すブロック図である。
FIG. 5 is a block diagram showing a processor element according to a second embodiment of the present invention.

【図6】本発明に第3の実施例に係るプロセサエレメン
トを示すブロック図である。
FIG. 6 is a block diagram showing a processor element according to a third embodiment of the present invention.

【図7】本発明に係る第4の実施例に係る並列処理シス
テムを示し、(a)は当該並列処理システムの形態を示
すブロック図であり、(b)は当該並列処理システムの
プロセサエレメントを示すブロック図である。
FIGS. 7A and 7B show a parallel processing system according to a fourth embodiment of the present invention, wherein FIG. 7A is a block diagram showing a form of the parallel processing system, and FIG. 7B shows a processor element of the parallel processing system; FIG.

【図8】上記第4の実施例に係る並列処理システムのデ
ータを示し、(a)は当該並列処理システムのパスP1
で転送されるデータのデータ形式を示す図であり、
(b)は当該並列処理システムのパスP2で転送される
データのデータ形式を示す図である。
FIG. 8 shows data of the parallel processing system according to the fourth embodiment, and (a) shows the path P1 of the parallel processing system;
FIG. 4 is a diagram showing a data format of data transferred in
(B) is a diagram showing a data format of data transferred on a path P2 of the parallel processing system.

【図9】上記第4の実施例に係る並列処理システムの全
体送出停止信号供給手段及び全体送出再開信号供給手段
を示す回路図である。
FIG. 9 is a circuit diagram showing an entire transmission stop signal supply unit and an entire transmission restart signal supply unit of the parallel processing system according to the fourth embodiment.

【図10】上記第4の実施例に係る並列処理システムの
動作を示すブロック図である。
FIG. 10 is a block diagram showing the operation of the parallel processing system according to the fourth embodiment.

【図11】上記第4の実施例に係る並列処理システムの
動作を示すブロック図である。
FIG. 11 is a block diagram showing an operation of the parallel processing system according to the fourth embodiment.

【図12】本発明の第5の実施例に係る並列処理システ
ムを示す回路図である。
FIG. 12 is a circuit diagram showing a parallel processing system according to a fifth embodiment of the present invention.

【図13】第1の従来例に係る並列処理システムを示す
ブロック図である。
FIG. 13 is a block diagram showing a parallel processing system according to a first conventional example.

【図14】第2の従来例に係る並列処理システムを示す
ブロック図である。
FIG. 14 is a block diagram showing a parallel processing system according to a second conventional example.

【符号の説明】[Explanation of symbols]

1A,1B,1C,1x〜1z 通信装置 2a〜2d ポート(第2のポート) 2e ポート(第1のポート) 3a〜3e セレクタ 4a〜4e,4x〜4z バッファ 5a〜5e 判定手段 6a〜6e フル信号線 7a〜7e データ線 8 制御手段 9 フリップフロップ 10,10x〜10z メモリ 11,11x〜11z 中間データ待避領域 12,12x〜12z 通常領域 13a,13b 入力セレクタ 14 バッファ 15 プロセサ 16A,16B,16C,16x〜16z プロセサエ
レメント 17 バス 20 送出停止信号線 21 全体送出停止信号線 22 送出再開信号線 23 全体送出再開信号線 24 送出不可信号線 28 オアゲート 29 アンドゲート 30a,30b インバータ 31a CMOSトランジスタ(第1のMOSトランジ
スタ) 31b CMOSトランジスタ(第2のMOSトランジ
スタ) 32a 第1の共通接続線 32b 第2の共通接続線 33a,33b 抵抗 ASR 全体送出再開信号 ASS 全体送出停止信号 SI 送出不可信号 SR 送出再開信号 SS 送出停止信号
1A, 1B, 1C, 1x to 1z Communication device 2a to 2d Port (second port) 2e Port (first port) 3a to 3e Selector 4a to 4e, 4x to 4z Buffer 5a to 5e Judging means 6a to 6e Full Signal lines 7a to 7e data lines 8 control means 9 flip-flops 10, 10x to 10z memories 11, 11x to 11z intermediate data saving areas 12, 12x to 12z normal areas 13a, 13b input selectors 14 buffers 15 processors 16A, 16B, 16C, 16x-16z Processor element 17 Bus 20 Transmission stop signal line 21 Overall transmission stop signal line 22 Transmission restart signal line 23 Overall transmission restart signal line 24 Non-transmission signal line 28 OR gate 29 AND gate 30a, 30b Inverter 31a CMOS transistor (first MOS transformer Star) 31b CMOS transistor (second MOS transistor) 32a First common connection line 32b Second common connection line 33a, 33b Resistance ASR whole transmission restart signal ASS whole transmission stop signal SI transmission disable signal SR transmission restart signal SS transmission Stop signal

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 メモリと通信装置とを有するプロセサエ
レメントにおいて、 上記メモリは通常領域と中間データ待避領域とを持ち、 上記通信装置は上記メモリと接続された第1のポートと
上記プロセサエレメントの外部へ通じる第2のポートと
データを一時的に保持するバッファとを持ち、 上記通信装置は、上記バッファに保持されたデータを上
記第1のポートを通じて上記メモリの中間データ待避領
域に送出するように構成されるとともに、 上記通信装置は、さらに、 上記メモリの中間データ待避領域に格納されたデータの
格納量が第1の所定量を越えると送出停止信号をセット
しアサートされた送出停止信号を上記プロセサエレメン
トの外部へ出力する送出停止信号出力手段と、 上記メモリの中間データ待避領域に格納されたデータの
格納量が上記第1の所定量よりも小さな第2の所定量を
下回ると送出再開信号をセットしアサートされた送出再
開信号を上記プロセサエレメントの外部へ出力する送出
再開信号出力手段と、上記プロセサエレメントまたは他の何れかのプロセサエ
レメントからアサートされた送出停止信号が出力された
ときにアサートされる 全体送出停止信号と、全てのプロ
セサエレメントからアサートされた送出再開信号が出力
されたきにアサートされる全体送出再開信号とをそれぞ
れ受け取り上記アサートされた全体送出停止信号によ
りセットされ上記アサートされた全体送出再開信号によ
りリセットされる送出不可信号を発生する送出不可信号
発生手段とを持ち、 上記プロセサエレメントは、上記送出不可信号発生手段
から発生される上記送出不可信号がアサートされている
間中、上記バッファまたは上記メモリの中間データ待避
領域からのデータの送出と、上記メモリの通常領域から
のデータの送出とのうち、上記メモリの通常領域からの
データの送出を停止することを特徴とするプロセサエレ
メント。
(1)Processor having a memory and a communication device
In Rement, The memory has a normal area and an intermediate data save area, The communication device has a first port connected to the memory.
A second port leading to the outside of the processor element;
It has a buffer that temporarily holds data, The communication device updates the data held in the buffer.
Saving intermediate data in the memory through the first port
To be sent to The communication device,further,  Of the data stored in the intermediate data save area of the above memory
Set the transmission stop signal when the storage amount exceeds the first predetermined amount
The asserted transmission stop signal is sent to the processor element.
Transmission stop signal output means for outputting to the outside of the  Of the data stored in the intermediate data save area of the above memory
A second predetermined amount whose storage amount is smaller than the first predetermined amount
If it falls below, the transmission restart signal is set and the transmission restart signal
Sending an open signal to output outside the processor element
Restart signal output means;Any of the above processor elements or any other processor
Output stop signal asserted from the element was output
Sometimes asserted The whole transmission stop signal and, All professionals
Transmission restart signal asserted from Sesa element is output
Asserted when you areThe whole transmission restart signal
Receiving,The asserted general transmission stop signal
Reset and the asserted general transmission restart signal
Disable signal that generates reset disable signal
Generating means, wherein the processor element includes the sending disable signal generating means.
The above-mentioned transmission disable signal generated from is asserted
During,Saving intermediate data in the buffer or memory
Sending data from the area and from the normal area of the above memory
Out of the dataFrom the normal area of the above memory
Processor element characterized by stopping data transmission
Ment.
【請求項2】 請求項1記載のプロセサエレメントにお
いて、 上記通信装置はデータを一時的に保持する複数のバッフ
ァを持ち、 上記通信装置は、上記複数のバッファのうちの少なくと
も2つのバッファから上記第2のポートを通じて上記プ
ロセサエレメントの外部へデータをそれぞれ送出する場
合に、データの格納量が相対的に多いバッファのデータ
より優先的に送出するモードと、上記プロセサエレメン
トから最終到着先のプロセサエレメントまでの距離が相
対的に遠いデータが格納されているバッファのデータよ
り優先的に送出するモードと、上記プロセサエレメント
から最終到着先のプロセサエレメントまでの距離が相対
的に近いデータが格納されているバッファのデータより
優先的に送出するモードと、所定のバッファのデータよ
り優先的に送出するモードとを選択可能に持っているこ
とを特徴とするプロセサエレメント。
2. The processor element according to claim 1 , wherein said communication device has a plurality of buffers for temporarily holding data, and said communication device transmits said data from at least two buffers of said plurality of buffers. A mode in which, when data is transmitted to the outside of the processor element through the second port, the data is transmitted with a higher priority than data in a buffer having a relatively large data storage amount, and from the processor element to the final destination processor element. A mode in which data is transmitted with higher priority than data in a buffer in which data of a relatively long distance is stored, and a buffer in which data of a relatively short distance from the processor element to the final destination processor element are stored. Mode to send data with priority over the data in Processor elements, characterized in that it has a mode that preferentially delivered selectable.
【請求項3】 請求項2記載のプロセサエレメントにお
いて、 上記通信装置は、上記複数のバッファのうちの少なくと
も2つのバッファから上記第2のポートを通じて上記プ
ロセサエレメントの外部へデータをそれぞれ送出する場
合に、上記メモリの中間データ待避領域から上記第1の
ポートを通じて受け取ったデータが格納されているバッ
ファのデータを最優先に送出することを特徴とするプロ
セサエレメント。
3. The processor element according to claim 2 , wherein said communication device transmits data from at least two buffers of said plurality of buffers to outside of said processor element through said second port. A processor element for sending data in a buffer storing data received through the first port from an intermediate data saving area of the memory, with the highest priority.
【請求項4】 請求項1から請求項3の何れかに記載の
複数のプロセサエレメントと該複数のプロセサエレメン
ト同士を相互通信可能に接続するネットワークとを備え
る並列処理システムであって、 上記並列処理システムは、上記複数のプロセサエレメン
トの通信装置から出力されるすべての送出停止信号の論
理和を演算しその演算結果を全体送出停止信号として上
記複数のプロセサエレメントのすべての通信装置に供給
する全体送出停止信号供給手段と、上記複数のプロセサ
エレメントの通信装置から出力されるすべての送出再開
信号の論理積を演算しその演算結果を全体送出再開信号
として上記複数のプロセサエレメントのすべての通信装
置に供給する全体送出再開信号供給手段とを備えている
ことを特徴とする並列処理システム。
4. A parallel processing system comprising: a plurality of processor elements according to claim 1; and a network connecting the plurality of processor elements so as to be able to communicate with each other. The parallel processing system calculates a logical sum of all transmission stop signals output from the communication devices of the plurality of processor elements, and uses the calculation result as an entire transmission stop signal to all communication devices of the plurality of processor elements. A logical AND of all the supply stop signal supply means to be supplied and all the transmission restart signals output from the communication devices of the plurality of processor elements, and the operation result is used as an entire transmission restart signal for all of the plurality of processor elements. A parallel processing system comprising: an overall transmission restart signal supply unit that supplies the communication device with a transmission restart signal.
【請求項5】 請求項4記載の並列処理システムにおい
て、 上記全体送出停止信号供給手段は、上記複数のプロセサ
エレメントのすべての通信装置にそれぞれ設けられそれ
ぞれが送出停止信号を負論理でオープンドレイン出力す
る複数の第1のMOSトランジスタまたはオープンコレ
クタ出力する複数の第1のバイポーラトランジスタと、
上記複数の第1のMOSトランジスタのすべてのドレイ
ン同士または上記複数の第1のバイポーラトランジスタ
のすべてのコレクタ同士を接続し抵抗を介して電源と接
続された第1の共通接続線とを有し、 上記全体送出停止信号供給手段は上記第1の共通接続線
の電位の反転電位を全体送出停止信号として上記複数の
プロセサエレメントのすべての通信装置に供給し、 上記全体送出再開信号供給手段は、上記複数のプロセサ
エレメントのすべての通信装置にそれぞれ設けられそれ
ぞれが送出停止信号を正論理でオープンドレイン出力す
る複数の第2のMOSトランジスタまたはオープンコレ
クタ出力する複数の第2のバイポーラトランジスタと、
上記複数の第2のMOSトランジスタのすべてのドレイ
ン同士または上記複数の第2のバイポーラトランジスタ
のすべてのコレクタ同士を接続し抵抗を介して電源と接
続された第2の共通接続線とを有し、 上記全体送出再開信号供給手段は上記第2の共通接続線
の電位を全体送出再開信号として上記複数のプロセサエ
レメントのすべての通信装置に供給することを特徴とす
る並列処理システム。
5. The parallel processing system according to claim 4 , wherein said overall transmission stop signal supply means is provided in each of all communication devices of said plurality of processor elements, and outputs a transmission stop signal in a negative logic with an open drain output. A plurality of first MOS transistors or a plurality of first bipolar transistors that output an open collector;
A first common connection line that connects all drains of the plurality of first MOS transistors or all collectors of the plurality of first bipolar transistors and is connected to a power supply via a resistor; The overall transmission stop signal supply means supplies an inversion potential of the potential of the first common connection line as an overall transmission stop signal to all communication devices of the plurality of processor elements. A plurality of second MOS transistors or a plurality of second bipolar transistors which are respectively provided in all the communication devices of the plurality of processor elements and output the transmission stop signal in positive logic and open drain output,
A second common connection line that connects all drains of the plurality of second MOS transistors or all collectors of the plurality of second bipolar transistors and is connected to a power supply via a resistor; The parallel processing system according to claim 1, wherein said whole transmission restart signal supply means supplies the potential of said second common connection line as a whole transmission restart signal to all communication devices of said plurality of processor elements.
JP04078993A 1993-03-02 1993-03-02 Processor element and parallel processing system Expired - Fee Related JP3283319B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04078993A JP3283319B2 (en) 1993-03-02 1993-03-02 Processor element and parallel processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04078993A JP3283319B2 (en) 1993-03-02 1993-03-02 Processor element and parallel processing system

Publications (2)

Publication Number Publication Date
JPH06259396A JPH06259396A (en) 1994-09-16
JP3283319B2 true JP3283319B2 (en) 2002-05-20

Family

ID=12590393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04078993A Expired - Fee Related JP3283319B2 (en) 1993-03-02 1993-03-02 Processor element and parallel processing system

Country Status (1)

Country Link
JP (1) JP3283319B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7962717B2 (en) * 2007-03-14 2011-06-14 Xmos Limited Message routing scheme

Also Published As

Publication number Publication date
JPH06259396A (en) 1994-09-16

Similar Documents

Publication Publication Date Title
CN102823214B (en) Know the heterogeneity internet of performance and traffic
JP4255457B2 (en) Error handling method
CN107454003B (en) It is a kind of can dynamic switching working mode network-on-chip router and method
US7957381B2 (en) Globally asynchronous communication architecture for system on chip
US5546543A (en) Method for assigning priority to receive and transmit requests in response to occupancy of receive and transmit buffers when transmission and reception are in progress
US20090323708A1 (en) Subscriber and Communication Controller of a communication System and Method for Implementing a Gateway Functionality in a Subscriber of a Communication System
US7889725B2 (en) Computer cluster
US20020174316A1 (en) Dynamic resource management and allocation in a distributed processing device
US20050273633A1 (en) Hardware coordination of power management activities
KR20070010152A (en) Integrated circuit and method for issuing transactions
JPH06261052A (en) Flow control device of shared bus
US5293377A (en) Network control information without reserved bandwidth
US20020178306A1 (en) Method and system for over-run protection in amessage passing multi-processor computer system using a credit-based protocol
CN101841471A (en) System and control method and equipment with the node that connects into multi-dimensional matrix
CN110505168B (en) NI interface controller and data transmission method
JP3283319B2 (en) Processor element and parallel processing system
US20090235048A1 (en) Information processing apparatus, signal transmission method, and bridge
US8412867B2 (en) Semiconductor integrated circuit and filter and informational delivery method using same
CN100520748C (en) Data processing system
CN103412849A (en) NoC (network on chip) resource network interface of ARM processing unit and drive method of NoC resource network interface
CN115580572A (en) Routing method, routing node, routing device and computer readable storage medium
US7254667B2 (en) Data transfer between an external data source and a memory associated with a data processor
EP1358565B1 (en) Method and apparatus for preventing starvation in a multi-node architecture
CN113852574B (en) Network-on-chip router
JP7283191B2 (en) Information processing system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020212

LAPS Cancellation because of no payment of annual fees