JP3115801B2 - Parallel computer system - Google Patents

Parallel computer system

Info

Publication number
JP3115801B2
JP3115801B2 JP07205804A JP20580495A JP3115801B2 JP 3115801 B2 JP3115801 B2 JP 3115801B2 JP 07205804 A JP07205804 A JP 07205804A JP 20580495 A JP20580495 A JP 20580495A JP 3115801 B2 JP3115801 B2 JP 3115801B2
Authority
JP
Japan
Prior art keywords
packet
network
control circuit
signal line
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07205804A
Other languages
Japanese (ja)
Other versions
JPH08110894A (en
Inventor
貴之 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP07205804A priority Critical patent/JP3115801B2/en
Publication of JPH08110894A publication Critical patent/JPH08110894A/en
Application granted granted Critical
Publication of JP3115801B2 publication Critical patent/JP3115801B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、並列計算機システ
ムに関し、特に、プログラムの実行の高速化を目指した
マルチプロセッサ計算機システムにおけるプロセッサ間
ネットワークのコストパフォーマンスの良い構成に関す
るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system, and more particularly, to a configuration of a multiprocessor computer system with high cost performance in a multiprocessor computer system aiming at high-speed execution of a program.

【0002】[0002]

【従来の技術】従来、マルチプロセッサ計算機システム
におけるネットワーク多機能化に関しては、電子通信学
会技術研究報告CPSY91-26,Vol.91,No.130,「高並
列計算機AP1000のアーキテクチャと性能評価」(以
下、文献1)に開示されている。この並列計算機システ
ムは、図7に示す構成になっている。
2. Description of the Related Art Conventionally, regarding multifunctional networks in a multiprocessor computer system, IEICE Technical Report CPSY91-26, Vol.91, No.130, "Architecture and Performance Evaluation of Highly Parallel Computer AP1000" Reference 1). This parallel computer system has the configuration shown in FIG.

【0003】図7は、バリア同期プロトコルと汎用のS
ENDプロトコルの2つのプロトコルを備える従来技術
によるシステム構成図であり、A,B,C,Dは夫々プ
ロセッサ、107はバリア(barrier)同期ネットワー
ク、108はネットワーク、1は命令プロセッサ、2メ
モリ制御回路、3はメモリ、48はネットワークインタ
フェース回路、49はバリア同期制御回路である。
FIG. 7 shows a barrier synchronization protocol and a general-purpose S
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a system configuration diagram according to the related art including two protocols of an END protocol, wherein A, B, C, and D are processors, 107 is a barrier synchronization network, 108 is a network, 1 is an instruction processor, and 2 a memory control circuit. Reference numeral 3 denotes a memory, 48 denotes a network interface circuit, and 49 denotes a barrier synchronization control circuit.

【0004】マルチプロセッサにおいては、複数のプロ
セッサで処理を分担して実行している。バリア同期と
は、あるプロセッサだけが処理を進み過ぎないようにす
るために、ある特定の命令の実行に達した段階で処理を
停止し、他のプロセッサが同じ段階に達するのを待ち、
複数のプロセッサが同じ段階に達した時点で、一斉に処
理を再開するものである。これにより、複数のプロセッ
サ間において処理の同期をとるものである。
In a multiprocessor, a plurality of processors share and execute processing. Barrier synchronization means that when one processor reaches the execution of a particular instruction, it stops processing and waits for another processor to reach the same stage, so that only one processor does not go too far.
When a plurality of processors reach the same stage, the processing is restarted all at once. Thus, the processing is synchronized between the plurality of processors.

【0005】前記文献1の技術では、並列計算機システ
ム内に用途別の複数系統のネットワークを備えることに
より、高速なネットワーク処理を実現することを述べて
いるが、ネットワークの高速性のみを重視して、大規模
並列システムのコストパフォーマンスについて配慮して
いない。
[0005] The technique of the above-mentioned Document 1 describes that high-speed network processing is realized by providing a plurality of networks for each application in a parallel computer system, but emphasizing only the high-speed performance of the network. No consideration is given to the cost performance of massively parallel systems.

【0006】その結果、ネットワーク機能を飛躍的に改
善しているが、ネットワークのコストパフォーマンスに
ついて配慮していないために、データ転送スループット
の等しく大きな3系統のネットワークを設け、信号線数
の増加によりプロセッササイズの増大をもたらし、結
局、使用するケーブル本数およびLSI(大規模集積回
路)搭載カード数が2倍になり、2倍コストがかかる。
As a result, the network function has been dramatically improved. However, since the cost performance of the network has not been considered, three networks having the same data transfer throughput are provided. As a result, the number of cables to be used and the number of LSI (Large Scale Integrated Circuit) mounted cards are doubled, resulting in twice the cost.

【0007】また、複数のパケット混在時にネットワー
クのスループットを向上するためのバーチャルチャンネ
ル制御については、IEEE,Transactions on Parallel a
nd Distributed Systems 1992 Vol.3,No.2,「Virtual-Ch
annel Flow Control」(Dally)(以下、文献2)に開示され
ている。
[0007] Further, regarding virtual channel control for improving network throughput when a plurality of packets coexist, IEEE, Transactions on Parallel A
nd Distributed Systems 1992 Vol.3, No.2, `` Virtual-Ch
annel Flow Control "(Dally) (hereinafter referred to as Reference 2).

【0008】[0008]

【発明が解決しようとする課題】前記文献2の技術で
は、1系統の物理ネットワークに同程度の規模を有する
複数のバッファを接続し、論理的には複数のネットワー
クを効率的に構成することが記述されている。文献2の
技術は、同程度の緊急性とパケット長を有するパケット
の複数を、処理可能なものから転送することによるシス
テムスループットの向上を目的としている。多数のプロ
セッサ間の同期をとるバリア同期の緊急性についての配
慮がない。さらに、バリア同期などの緊急性も高く、パ
ケット長も短いパケットが混在している時の転送制御ハ
ードウェアのコストパフォーマンスについての配慮もな
い。このため、多数のパケットの競合を比較的に低いコ
ストで軽減できるという効果があるものの、バッファの
切り替え時間や、レジスタファイルに書き込む処理によ
りバリア同期処理時間が長くなり、処理も複雑化すると
いう問題があった。
According to the technique disclosed in Document 2, it is possible to connect a plurality of buffers having substantially the same scale to one physical network, and to logically configure a plurality of networks efficiently. It has been described. The technique of Literature 2 aims at improving the system throughput by transferring a plurality of packets having the same urgency and packet length from those that can be processed. No consideration is given to the urgency of barrier synchronization for synchronization between multiple processors. Furthermore, there is no urgency such as barrier synchronization, and there is no consideration on the cost performance of transfer control hardware when packets with a short packet length are mixed. Although this has the effect of reducing contention for a large number of packets at a relatively low cost, the barrier switching time and the processing for writing to the register file increase the barrier synchronization processing time and complicate the processing. was there.

【0009】本発明の目的は、ネットワーク接続マルチ
プロセッサ計算機システムにおいて、コストパフォーマ
ンスが良く多機能なネットワーク制御を実現することが
可能な技術を提供することにある。
An object of the present invention is to provide a technique capable of realizing multifunctional network control with good cost performance in a network-connected multiprocessor computer system.

【0010】[0010]

【課題を解決するための手段】本願において開示される
発明のうち代表的なもの概要を簡単に説明すれば、以下
のとおりである。
SUMMARY OF THE INVENTION A typical one of the inventions disclosed in the present application will be briefly described as follows.

【0011】複数のプロセッサをネットワークで接続し
た並列計算機システムにおいて、パケットを伝送する伝
送線に、パケット間の到着順を変えるバーチャルチャン
ネルを実現する割り込み信号線を別途設ける。この割り
込み信号線は、優先すべきパケットの先頭が伝送線上に
存在することを示す割り込み信号を伝送する。この割り
込み信号で指示されたパケットの先頭の複数ビットを使
用して、そのパケットの用途の識別を行う。例えば、4
種の優先度のパケットを扱う場合においては、この複数
ビットで識別を行うため、割り込み信号線自体は、少な
くとも1本あればよい。従って、ネットワーク制御回路
の多機能化によりネットワークの伝送線数を削減し、シ
ステム内のプロセッサボード間を接続するケーブル本数
を削減することによりコストパフォーマンスが達成され
る。
In a parallel computer system in which a plurality of processors are connected by a network, a transmission line for transmitting packets is provided with an interrupt signal line for realizing a virtual channel for changing the arrival order between packets. The interrupt signal line transmits an interrupt signal indicating that the top of the packet to be prioritized exists on the transmission line. Using the leading bits of the packet specified by the interrupt signal, the purpose of the packet is identified. For example, 4
When handling packets of various priorities, at least one interrupt signal line is required since identification is performed using the plurality of bits. Therefore, cost performance is achieved by reducing the number of transmission lines in the network by increasing the number of functions of the network control circuit and reducing the number of cables connecting processor boards in the system.

【0012】また、バリア同期パケットを最高優先度と
した優先度制御回路は、数千バイトの可変長のパケット
長を有する通常の通信パケット処理を、直ちに、バリア
同期パケット長に対応して固定サイクル数だけ止め、バ
リア同期処理を優先して転送する。従って、多数のプロ
セッサの間の1番遅いプロセッサの処理時間で全体処理
時間が決まるバリア同期処理が数千倍高速化され、従っ
て、バリア同期を含むユーザプログラムの処理時間が短
縮される。
Further, the priority control circuit which sets the barrier synchronization packet to the highest priority performs a normal communication packet process having a variable packet length of several thousand bytes immediately in a fixed cycle corresponding to the barrier synchronization packet length. Stop by the number, and transfer with priority given to barrier synchronization processing. Accordingly, the barrier synchronization processing, in which the overall processing time is determined by the processing time of the slowest processor among many processors, is speeded up by several thousand times, and the processing time of the user program including the barrier synchronization is reduced.

【0013】また、バリア同期パケットのように、最優
先で固定長のパケットを、バッファに書き込まずに通す
専用優先路を設けることにより、転送時間の短縮と、回
路の簡略化を行う。
Further, by providing a dedicated priority path for passing a fixed-length packet with the highest priority, such as a barrier synchronization packet, without writing it into a buffer, the transfer time is shortened and the circuit is simplified.

【0014】[0014]

【発明の実施の形態】実施例を説明するための全図にお
いて、同一機能を有するものは同一符号を付け、その繰
り返しの説明は省略する。尚、以下の説明に引用される
メモリ、フリップフロップ、レジスタの各手段は、本発
明の趣旨を逸脱しない限りにおいて、当業者であれば変
更し得る種々の記憶手段を用いることができる。
BEST MODE FOR CARRYING OUT THE INVENTION In all the drawings for explaining the embodiments, parts having the same functions are denoted by the same reference numerals, and their repeated explanation will be omitted. In addition, various storage units that can be changed by those skilled in the art can be used for each unit of a memory, a flip-flop, and a register referred to in the following description without departing from the gist of the present invention.

【0015】本実施例の並列計算機システムは、図1に
示すように、複数のプロセッサA,B,C,Dがネット
ワーク105を介して接続されている。プロセッサA,
B,C,Dは、それぞれ同じ構成を有する。図1では、
プロセッサAのみの内部構成を示し、他のプロセッサ構
成の表示は省略する。
In the parallel computer system of this embodiment, a plurality of processors A, B, C and D are connected via a network 105 as shown in FIG. Processor A,
B, C, and D have the same configuration. In FIG.
The internal configuration of only the processor A is shown, and the display of other processor configurations is omitted.

【0016】図1において、プロセッサA,B,C,D
は、命令制御回路1A,1B,1C,1D、メモリ制御
回路2A,2B,2C,2D、メモリ3A,3B,3
C,3D、ネットワークインタフェース回路4A,4
B,4C,4Dを有する。なお、1B,1C,1D,2
B,2C,2D,3B,3C,3D,及び4B,4C,
4Dは図1には図示していない。
In FIG. 1, processors A, B, C, D
Are instruction control circuits 1A, 1B, 1C, 1D, memory control circuits 2A, 2B, 2C, 2D, memories 3A, 3B, 3
C, 3D, network interface circuits 4A, 4
B, 4C and 4D. Note that 1B, 1C, 1D, 2
B, 2C, 2D, 3B, 3C, 3D, and 4B, 4C,
4D is not shown in FIG.

【0017】さらに、プロセッサA内のネットワークイ
ンタフェース回路4Aは、送信制御回路401A及び受
信制御回路402Aを有する。同様に、プロセッサB内
のネットワークインタフェース回路4Bは、送信制御回
路401B及び受信制御回路402Bを有する。同様
に、プロセッサC内のネットワークインタフェース回路
4Cは、送信制御回路401C及び受信制御回路402
Cを有する。同様に、プロセッサD内のネットワークイ
ンタフェース回路4Dは、送信制御回路401D及び受
信制御回路402Dを有する。プロセッサB,C,D
は、プロセッサAと同一構成なので、送信制御回路40
1B,C,D及び受信制御回路402B,C,Dについ
ては、図1には示していない。
Further, the network interface circuit 4A in the processor A has a transmission control circuit 401A and a reception control circuit 402A. Similarly, the network interface circuit 4B in the processor B has a transmission control circuit 401B and a reception control circuit 402B. Similarly, the network interface circuit 4C in the processor C includes a transmission control circuit 401C and a reception control circuit 402
C. Similarly, the network interface circuit 4D in the processor D has a transmission control circuit 401D and a reception control circuit 402D. Processors B, C, D
Has the same configuration as the processor A, so the transmission control circuit 40
1B, C and D and the reception control circuits 402B, C and D are not shown in FIG.

【0018】また、ネットワーク105は、プロセッサ
A内の受信制御回路402Aに対応して、送信制御回路
411Aを有する。また、ネットワーク105は、プロ
セッサA内の送信制御回路401Aに対応して、受信制
御回路412Aを有する。受信制御回路402Aは、受
信制御回路412Aと同一の構造をもつものである。ま
た、送信制御回路401Aは送信制御回路411Aと同
一構造をもつものである。
The network 105 has a transmission control circuit 411A corresponding to the reception control circuit 402A in the processor A. Further, the network 105 has a reception control circuit 412A corresponding to the transmission control circuit 401A in the processor A. The reception control circuit 402A has the same structure as the reception control circuit 412A. The transmission control circuit 401A has the same structure as the transmission control circuit 411A.

【0019】そして、プロセッサAの送信制御回路40
1Aから送信されたデータは、ネットワーク105内の
受信制御回路412Aによって受信される。逆に、ネッ
トワーク105内の送信制御回路411Aから送信され
たデータは、プロセッサA内の受信制御回路402Aに
よって受信される。
The transmission control circuit 40 of the processor A
The data transmitted from 1A is received by the reception control circuit 412A in the network 105. Conversely, data transmitted from the transmission control circuit 411A in the network 105 is received by the reception control circuit 402A in the processor A.

【0020】また、プロセッサB,C,D内の送信制御
回路401B,401C,401D及び受信制御回路4
02B,402C,402Dに対しても、送信制御回路
401Aと受信制御回路402Aと同様に、受信制御回
路412B,412C,412Dおよび送信制御回路4
11B,411C,411Dがネットワーク内に対応し
て設けられる。尚、受信制御回路412B(412C,
412D)および送信制御回路411B(411C,4
11D)は、受信制御回路402Aおよび送信制御回路
401Aと夫々同一構成である。
The transmission control circuits 401B, 401C, and 401D in the processors B, C, and D and the reception control circuit 4
02B, 402C, and 402D, similarly to the transmission control circuit 401A and the reception control circuit 402A, the reception control circuits 412B, 412C, 412D, and the transmission control circuit 4
11B, 411C and 411D are provided correspondingly in the network. The reception control circuit 412B (412C,
412D) and the transmission control circuit 411B (411C, 4C).
11D) has the same configuration as the reception control circuit 402A and the transmission control circuit 401A, respectively.

【0021】ここで、ネットワーク105内の送信制御
回路411A,411B,411C,411Dは、スイ
ッチ550を介して、ネットワーク105内の任意の受
信制御回路412A,412B,412C,412Dへ
データを送信する。
Here, the transmission control circuits 411A, 411B, 411C, and 411D in the network 105 transmit data to arbitrary reception control circuits 412A, 412B, 412C, and 412D in the network 105 via the switch 550.

【0022】さらに、受信制御回路402Aは、通常受
信バッファキュー50Aとバリア同期受信制御回路60
Aが備えられている。また、図示していないが、受信制
御回路402B,402C,402D,412A,41
2B,412C,412Dも、受信制御回路402Aと
同様に通常受信バッファキューとバリア同期受信制御回
路が備えられている。
Further, the reception control circuit 402A includes a normal reception buffer queue 50A and a barrier synchronous reception control circuit 60A.
A is provided. Although not shown, the reception control circuits 402B, 402C, 402D, 412A, 41
2B, 412C, and 412D also include a normal reception buffer queue and a barrier synchronization reception control circuit, similarly to the reception control circuit 402A.

【0023】図2、図3は、この2つの図面で、本実施
例によるバリア同期と通常プロトコルを扱うネットワー
ク制御回路の構成を示しており、その信号線の接続関係
を丸で囲まれたアルファベットで示している。
FIGS. 2 and 3 show the configuration of a network control circuit which handles the barrier synchronization and the normal protocol according to the present embodiment in these two drawings. Indicated by.

【0024】図1及び図2、図3において、10〜13
はバッファID切り替え信号線(割り込み信号線)であ
る。この信号線のバッファID切り替え信号(割り込み
信号)により、受信制御回路402Bでは通常受信バッ
ファキュー50Bとバリア同期受信制御回路60Bの切
り替え制御が行なわれ、送信制御回路401Aにおいて
はスルーで伝えられる。
In FIGS. 1, 2 and 3, 10-13
Denotes a buffer ID switching signal line (interrupt signal line). In response to the buffer ID switching signal (interrupt signal) of this signal line, the reception control circuit 402B controls the switching between the normal reception buffer queue 50B and the barrier synchronous reception control circuit 60B, and the transmission control circuit 401A transmits through.

【0025】また、ネットワーク105内では受信制御
回路412Aから送信制御回路411Bへスイッチ55
0を介して伝えられる。(図2、図3ではスイッチ55
0を簡略化して示してある。)命令制御回路はバリア同
期制御が必要なとき、このバッファID切り替え信号を
制御することで通常受信バッファキューからバリア同期
受信制御回路へ切り替え、これにより、通常データの伝
送がストップし、バリア同期パケット優先パケットとし
てバリア同期受信制御回路を通すことによって通常デー
タを追い越して伝送可能とする。
In the network 105, a switch 55 is connected from the reception control circuit 412A to the transmission control circuit 411B.
Conveyed via 0. (In FIGS. 2 and 3, the switch 55 is used.
0 is simplified. When the barrier control is necessary, the instruction control circuit switches from the normal reception buffer queue to the barrier synchronization reception control circuit by controlling the buffer ID switching signal, thereby stopping the transmission of the normal data and the barrier synchronization packet. By passing through a barrier synchronous reception control circuit as a priority packet, normal data can be overtaken and transmitted.

【0026】この動作が送信側から受信側までの伝送路
上にある全ての受信制御回路で行なわれるので、通常デ
ータの伝送が一度中断され、バリア同期パケットが転送
できる。バリア同期信号転送後は、再びバッファ切り替
え信号を元に戻すことにより、通常データの送信が再開
される。
Since this operation is performed in all the reception control circuits on the transmission path from the transmission side to the reception side, the normal data transmission is interrupted once and the barrier synchronization packet can be transferred. After the transfer of the barrier synchronization signal, the transmission of the normal data is resumed by returning the buffer switching signal again.

【0027】19はメモリストア(レジスタストア)制
御信号線、20〜23はデータおよびバッファID信号
線、24はレジスタロード信号線である。28はバリア
同期開始レジスタ、29はバリア同期完了報告レジスタ
である。
19 is a memory store (register store) control signal line, 20 to 23 are data and buffer ID signal lines, and 24 is a register load signal line. 28 is a barrier synchronization start register and 29 is a barrier synchronization completion report register.

【0028】30〜33はデータ送出信号線、40〜4
2はバッファエントリ解放信号線(リリース信号線)、5
1は読み出しアドレスポインタ、52は書き込みアドレ
スポインタ、53は受信バッファ、58は読み出し制御
用比較器である。
Numerals 30 to 33 denote data transmission signal lines;
2 is a buffer entry release signal line (release signal line), 5
1 is a read address pointer, 52 is a write address pointer, 53 is a receive buffer, and 58 is a read control comparator.

【0029】61はバリア同期パケット転送フリップフ
ロップ、62は制御信号作成フリップフロップ、70は
優先度制御回路(ORゲート)、97は受信バッファ空
きエントリ数アップダウンカウンタである。
Reference numeral 61 denotes a barrier synchronization packet transfer flip-flop, 62 denotes a control signal generation flip-flop, 70 denotes a priority control circuit (OR gate), and 97 denotes a reception buffer empty entry number up / down counter.

【0030】500はプロセッサ間同期報告生成回路、
501A,501Bはプロセッサ間同期フリップフロッ
プ、502はプロセッサ間同期用AND回路、511は
読み出しアドレス加算器、521は書き込みアドレス加
算器である。
500 is an inter-processor synchronization report generation circuit,
501A and 501B are inter-processor synchronization flip-flops, 502 is an inter-processor synchronization AND circuit, 511 is a read address adder, and 521 is a write address adder.

【0031】本実施例は、1系統の物理ネットワークに
バリア同期プロトコルと汎用のSENDプロトコルの2
つのプロトコルを備えるシステムで説明するが、例え
ば、両者の中間の優先度のリモートメモリアクセスプロ
トコルを加え、固定長のパケットでシステム内の他のプ
ロセッサのメモリを読み出し、書き込み可能とする場合
は、一層高い信号数削減効果が得られる。
In this embodiment, two systems of a barrier synchronization protocol and a general-purpose SEND protocol are provided in one physical network.
For example, when a remote memory access protocol having an intermediate priority between the two is added, and the memory of another processor in the system can be read and written with a fixed-length packet, the further description will be given. A high signal number reduction effect can be obtained.

【0032】本実施例においては、図2、図3に示すよ
うに、プロセッサAの送信制御回路401Aから送信し
たメッセージパケットは、ネットワーク105の受信制
御回路412Aに転送され、パケット中に記述された送
信先プロセッサ番号に従って選択したネットワークの送
信制御回路411Bにスイッチされ、第2のプロセッサ
の受信制御回路402Bに到達される。プロセッサに到
着したメッセージパケットは、従来技術と同様の手順で
プロセッサメモリ上の受信領域中のアドレスに書き込ま
れるものとする。
In this embodiment, as shown in FIGS. 2 and 3, a message packet transmitted from the transmission control circuit 401A of the processor A is transferred to the reception control circuit 412A of the network 105 and described in the packet. The transmission control circuit 411B of the network selected according to the transmission destination processor number is switched to the reception control circuit 402B of the second processor. It is assumed that a message packet arriving at the processor is written to an address in the reception area on the processor memory in the same procedure as in the related art.

【0033】送信制御回路401Aの中には、送信先の
受信バッファの空きエントリ数を計算するアップダウン
カウンタ97が備えられている。
The transmission control circuit 401A is provided with an up / down counter 97 for calculating the number of empty entries in the destination receiving buffer.

【0034】バリア同期開始レジスタ28から、信号線
10にバリア同期パケット先頭の送出時に値1とする信
号を出力する。アップダウンカウンタ97は、メモリ3
Aからの読み出しデータ信号線20にデータを送る度に
値1となるセンド信号(データ送出信号)を信号線31
を受けて、これに応答してレジスタ98の値をデクリメ
ント(−1)する。一方、送信先の受信バッファから1
エントリが送出され、バッファが空く度に返送されるリ
リース信号(バッファエントリ解放信号)を信号線41
を介して受け取ると、カウンタ97はレジスタ98の値
をインクリメント(+1)する。
From the barrier synchronization start register 28, a signal having a value of 1 is output to the signal line 10 when the head of the barrier synchronization packet is transmitted. The up / down counter 97 has a memory 3
A send signal (data transmission signal) having a value of 1 every time data is sent to the read data signal line 20 from A
In response, the value of the register 98 is decremented (−1). On the other hand, 1
An entry is sent out, and a release signal (buffer entry release signal) which is returned each time the buffer becomes empty is signal line 41.
, The counter 97 increments (+1) the value of the register 98.

【0035】受信制御回路402B及び412Aの中に
は、通常のメッセージパケットデータを一時格納する受
信バッファキュー50A、50B、バリア同期受信制御
回路60A、60Bおよび、本実施例でデータ線を3サ
イクル占有するバリア同期パケットを優先的に転送する
セレクタの制御信号を作成する制御信号作成フリップフ
ロップ62および優先度制御回路(ORゲート)70か
らなる優先順位制御回路が備えられている。
The reception control circuits 402B and 412A include reception buffer queues 50A and 50B for temporarily storing normal message packet data, barrier synchronization reception control circuits 60A and 60B, and occupy three data lines in this embodiment. And a priority control circuit including a control signal generation flip-flop 62 and a priority control circuit (OR gate) 70 for generating a control signal for a selector that transfers a barrier synchronization packet with priority.

【0036】受信バッファキュー50A、50Bは、受
信バッファ53、書き込みアドレスポインタ52と、ポ
インタを更新するアドレス加算器521、読み出しアド
レスポインタ51と、読み出しアドレスポインタ51を
更新するアドレス加算器511、および読み出しポイン
タ51と書き込みポインタ52の値を比較し、空でない
場合に読み出し制御信号線(データ送出信号)33を発
信する比較器58とで構成されている。
The reception buffer queues 50A and 50B include a reception buffer 53, a write address pointer 52, an address adder 521 for updating the pointer, a read address pointer 51, an address adder 511 for updating the read address pointer 51, and a read operation. A comparator 58 compares the value of the pointer 51 with the value of the write pointer 52 and sends a read control signal line (data transmission signal) 33 when it is not empty.

【0037】バリア同期受信制御回路60A、60Bに
は、バリア同期パケットデータを転送するフリップフロ
ップ61が備えられる。
The barrier synchronization reception control circuits 60A and 60B include a flip-flop 61 for transferring barrier synchronization packet data.

【0038】送信制御回路412Aからのデータおよび
バッファID信号は、デコード回路510Aに与えられ
る。デコード回路は、転送されてきたパケットの先頭の
複数ビットをデコードし、用途の識別を行う。デコード
回路510Aでは、送られてきたパケットがバリア同期
パケットかそれ以外かを判定し、バリア同期パケットな
らプロセッサ間同期フリップフロップ501Aに転送す
る。バリア同期パケットでなければ、信号線504Aを
介してマルチプレクサ503へ送る。デコード回路51
0Aと同じものが、他の送信制御回路にも設けられてい
る(送信制御回路412Bにはデコード回路510Bが
接続される)。
The data and buffer ID signal from transmission control circuit 412A are applied to decode circuit 510A. The decoding circuit decodes a plurality of leading bits of the transferred packet, and identifies a use. The decoding circuit 510A determines whether the transmitted packet is a barrier synchronization packet or not, and transfers the packet to the inter-processor synchronization flip-flop 501A if the packet is a barrier synchronization packet. If it is not a barrier synchronization packet, the packet is sent to the multiplexer 503 via the signal line 504A. Decode circuit 51
The same thing as 0A is also provided in another transmission control circuit (the decoding circuit 510B is connected to the transmission control circuit 412B).

【0039】送信制御回路412Aからの信号線560
は、図示しない回路を経て信号線570に接続される。
Signal line 560 from transmission control circuit 412A
Are connected to a signal line 570 via a circuit (not shown).

【0040】命令制御回路1Aは、処理がある特定の段
階に達したら、バリア同期処理を開始するために、バリ
ア同期開始レジスタ28に値1をセットし、バリア同期
パケットを信号線20を介して転送する。このパケット
を同期報告パケットと称することにする。同期報告パケ
ットは、送信制御装置401A、信号線21を介し、ネ
ットワーク105中にあっては受信制御回路412Aを
介して、プロセッサ間同期フリップフロップ501Aに
蓄積される。
When the process reaches a certain stage, the instruction control circuit 1A sets the value 1 to the barrier synchronization start register 28 to start the barrier synchronization process, and transmits the barrier synchronization packet via the signal line 20. Forward. This packet will be referred to as a synchronization report packet. The synchronization report packet is stored in the inter-processor synchronization flip-flop 501A via the transmission control device 401A, the signal line 21, and in the network 105 via the reception control circuit 412A.

【0041】同期報告パケットは、命令制御回路からバ
ッファID切り替え信号(レジスタ28の値)と共に特
定の周期をもってして繰り返し転送される。同期が成立
し、後述する同期成立パケットを命令制御回路が受け取
るまで繰り返し発生される。バッファID切り替え信号
は、同期報告パケットと共に信号線10、11を介して
転送される。
The synchronization report packet is repeatedly transferred from the instruction control circuit at a specific cycle together with the buffer ID switching signal (the value of the register 28). Synchronization is established, and is repeatedly generated until the instruction control circuit receives a synchronization establishment packet described later. The buffer ID switching signal is transferred via the signal lines 10 and 11 together with the synchronization report packet.

【0042】他の命令制御回路からも、処理がある特定
の段階に達したら、命令制御回路1Aと同様にバリア同
期処理を開始する。例えば、命令制御回路1Bにおいて
も、処理がある段階に達すると受信制御回路412Bを
介して同期報告パケットがプロセッサ間同期フリップフ
ロップ501Bに蓄積される。他の命令制御回路に対し
ても同様にプロセッサ間同期フリップフロップが設けら
れており(図示せず)、全てのプロセッサからの報告が蓄
積されると、プロセッサ間同期報告生成回路500によ
り、新たなバリア同期パケットを生成すると共に、蓄積
情報をクリアする。この新たなバリア同期パケットを同
期成立パケットと称することにする。マルチプレクサ5
03は、AND回路502における条件成立により同期
成立パケットを信号線504A及び504B他の送信制
御回路からの通常パケットに替えて転送する。バリア同
期パケットは、後述するように3サイクルの長さを持つ
が、先頭サイクルのデータは用途を表わしているが、残
りの2サイクルのデータが同期報告パケットか同期成立
パケットかの識別情報を含んでいる。
When the processing reaches a specific stage from another instruction control circuit, the barrier synchronization processing is started in the same manner as the instruction control circuit 1A. For example, also in the instruction control circuit 1B, when the processing reaches a certain stage, the synchronization report packet is accumulated in the inter-processor synchronization flip-flop 501B via the reception control circuit 412B. Inter-processor synchronization flip-flops are similarly provided for other instruction control circuits (not shown), and when reports from all processors are accumulated, a new inter-processor synchronization report generation circuit 500 A barrier synchronization packet is generated, and the accumulated information is cleared. This new barrier synchronization packet will be referred to as a synchronization establishment packet. Multiplexer 5
Reference numeral 03 indicates that the synchronization established packet is transferred instead of the normal packet from the signal lines 504A and 504B and other transmission control circuits due to the satisfaction of the condition in the AND circuit 502. The barrier synchronization packet has a length of three cycles as described later. The data of the first cycle indicates the purpose, but the data of the remaining two cycles includes identification information indicating whether the packet is a synchronization report packet or a synchronization establishment packet. In.

【0043】この同期成立パケットは、バリア同期処理
を開始している全てのプロセッサに同報される。例え
ば、プロセッサBの受信制御回路402Bにあっては、
通常パケットをバイパスしてプロセッサに同期成立パケ
ットをメモリ制御部に渡し、プロセッサが繰り返し値を
読み出しているバリア同期完了報告レジスタ29の値を
更新することでプロセッサに同期成立を報告する。他の
プロセッサについても同様に同期成立が報告される。
This synchronization establishment packet is broadcast to all processors that have started barrier synchronization processing. For example, in the reception control circuit 402B of the processor B,
The normalization packet is bypassed and the synchronization establishment packet is passed to the processor to the memory control unit, and the processor updates the value of the barrier synchronization completion report register 29 from which the processor repeatedly reads out the synchronization establishment report. The establishment of synchronization is similarly reported for other processors.

【0044】送信制御回路401Aと受信制御回路41
2Aを接続する配線、及び送信制御回路411Bと受信
制御回路402Bを接続する配線には、バッファID切
り替え信号線10〜13とデータ及びバッファID信号
線20〜23が追加されている。つまり、従来使用され
てきたデータ転送路を形成する信号線に加えて、パケッ
ト優先度の変更を指示する信号線10〜13が備えられ
ている。
Transmission control circuit 401A and reception control circuit 41
Buffer ID switching signal lines 10 to 13 and data and buffer ID signal lines 20 to 23 are added to the wiring connecting 2A and the wiring connecting the transmission control circuit 411B and the reception control circuit 402B. That is, signal lines 10 to 13 for instructing a change in the packet priority are provided in addition to the signal lines forming the data transfer path conventionally used.

【0045】次に、本実施例のネットワーク制御回路の
動作について説明する。
Next, the operation of the network control circuit of this embodiment will be described.

【0046】今、図2、図3において、データを命令制
御回路1A側から命令制御回路1B側へ送信することを
考える。
Now, in FIGS. 2 and 3, it is assumed that data is transmitted from the instruction control circuit 1A to the instruction control circuit 1B.

【0047】(1)送信側の記憶制御回路2Aは、命令
制御回路1Aからのメモリストア(レジスタストア)制
御信号線19により、予めメモリ3A上の指定されたア
ドレスに格納された通常のメッセージパッケットの送信
を開始する。送信制御回路401Aは、送信先バッファ
の空きエントリ数カウンタ97の値が“+”であって、
送信データがメモリから送られてきた場合に許される。
メッセージパケットデータは、信号線20から信号線2
1に渡され、カウンタ97の値をデクリメントする。
(1) The storage control circuit 2A on the transmission side uses a memory store (register store) control signal line 19 from the instruction control circuit 1A to transmit a normal message packet stored in advance at a specified address on the memory 3A. Start sending. The transmission control circuit 401A determines that the value of the empty entry number counter 97 of the destination buffer is "+"
Permitted when transmission data is sent from memory.
The message packet data is transmitted from the signal line 20 to the signal line 2
It is passed to 1 and the value of the counter 97 is decremented.

【0048】(2)ネットワーク105内の受信制御回
路412Aは、データを信号線21により受信バッファ
53に送って0番地に書き込むと共に、センド信号線
(データ送出信号)31により書き込みポインタをイン
クリメントし、値を“1”にする。以下、信号線31と
データ信号線21により受信処理を行う。そして、受信
制御回路412Aの次段の送信制御回路411Bが空き
次第、受信バッファ0番地から読み出したデータを送信
制御回路411Bに送出すると共に、読み出しポインタ
51の値をインクリメントし、同時に送信元(送信回路
411A)にバッファエントリのリリース信号線(バッ
ファエントリ解放信号)41を返送する。
(2) The reception control circuit 412A in the network 105 sends the data to the reception buffer 53 via the signal line 21 and writes it to the address 0, and increments the write pointer by the send signal line (data transmission signal) 31. Set the value to “1”. Hereinafter, reception processing is performed by the signal line 31 and the data signal line 21. As soon as the transmission control circuit 411B at the next stage of the reception control circuit 412A becomes empty, the data read from the reception buffer address 0 is sent to the transmission control circuit 411B, the value of the read pointer 51 is incremented, and the transmission source (transmission The release signal line (buffer entry release signal) 41 of the buffer entry is returned to the circuit 411A).

【0049】(3)受信制御回路412Aからデータを
受けた送信制御回路411Bは、データ転送を前記
(1)の項と同一の手順で行う。以下、同様に回路から
の送受信データを、次段の回路へ転送することにより、
ネットワーク105上のメッセージ転送を行う。
(3) The transmission control circuit 411B, which has received the data from the reception control circuit 412A, performs data transfer in the same procedure as in the above item (1). Hereinafter, similarly, by transmitting and receiving data from the circuit to the next circuit,
The message transfer on the network 105 is performed.

【0050】(4)ネットワーク105からデータを受
信した受信側の受信制御回路402Bは、データ転送を
前記(2)の項と同一の手順で行う。
(4) The reception control circuit 402B on the receiving side receiving the data from the network 105 performs the data transfer in the same procedure as in the above item (2).

【0051】(5)命令制御回路1Bは、メモリ3Bへ
のメッセージ転送の完了をレジスタロード制御24によ
り検出する。
(5) The instruction control circuit 1B detects the completion of the message transfer to the memory 3B by the register load control 24.

【0052】以上(1)〜(5)で説明したデータ伝送
中にバリア同期パケットを送付することを考える。バリ
ア同期パケットを転送する際には、新たに設けられたバ
ッファIDの切り替え信号線10〜13が使用される。
プロセッサAでは記憶制御回路2Aからの通常データ転
送中にバリア同期が開始されると、通常データ転送を中
断し、バッファID切り替え信号をレジスタ28にセッ
トと信号線10を介して転送すると共に、データ線から
バリア同期用のデータ(同期報告パケット)を送信する。
It is assumed that a barrier synchronization packet is sent during data transmission described in (1) to (5) above. When transferring the barrier synchronization packet, the newly provided buffer ID switching signal lines 10 to 13 are used.
In the processor A, when the barrier synchronization is started during the normal data transfer from the storage control circuit 2A, the normal data transfer is interrupted, the buffer ID switching signal is set to the register 28 and transferred via the signal line 10, and the data is transferred. Data for barrier synchronization (synchronization report packet) is transmitted from the line.

【0053】このバッファID切り替え信号線10にバ
ッファID切り替え信号がセットされている最中は、通
常データは転送されず、また、この間にデータ線上を送
られるデータは、バリア同期用のデータ(パケット)と
して解釈される。なお、データ線は複数ビット幅から構
成されているので、データ線から送られる値に意味を持
たせることによって、例えば、バリア同期の優先順位を
変えたり、また、バリア同期以外の意味を持たせること
も可能である。
While the buffer ID switching signal is set on the buffer ID switching signal line 10, normal data is not transferred, and data transmitted on the data line during this time is data for barrier synchronization (packet synchronization). ). Since the data line is configured with a plurality of bit widths, by giving a meaning to the value sent from the data line, for example, changing the priority of barrier synchronization or giving a meaning other than barrier synchronization It is also possible.

【0054】受信制御回路412Aでは、このバッファ
ID切り替え信号から内部の3つのフリップフロップ6
2と回路70とにより、3サイクルだけデータ線上を同
期報告パケットを優先的に転送できるようにセレクタを
制御する信号線71が作られる。
In the reception control circuit 412A, the internal three flip-flops 6
2 and the circuit 70 form a signal line 71 for controlling the selector so that the synchronization report packet can be preferentially transferred on the data line for three cycles.

【0055】このセレクタを制御する信号71により、
3サイクルの期間だけ受信バッファ53からの通常デー
タの送信が中断され、替わって、バリア同期受信制御回
路60Bからの同期報告パケットが出力される。デコー
ダ回路510Aは、送られてきたパケットがバリア同期
パケットかそれ以外かを判定し、バリア同期パケットな
らプロセッサ間同期フリップフロップ501Aに転送が
なされる。
The signal 71 for controlling this selector gives
Transmission of normal data from the reception buffer 53 is interrupted for a period of three cycles, and a synchronization report packet is output from the barrier synchronization reception control circuit 60B instead. The decoder circuit 510A determines whether the transmitted packet is a barrier synchronization packet or not, and if the packet is a barrier synchronization packet, the packet is transferred to the inter-processor synchronization flip-flop 501A.

【0056】一方、全てのプロセッサからの報告が蓄積
されると、ANDゲート502でAND条件が成立し、
プロセッサ間同期報告生成回路500により、新たなバ
リア同期パケットを生成すると共に、蓄積情報をクリア
する。同期成立パケットは、バリア同期処理を開始して
いる全てのプロセッサに同報される。このとき、バリア
同期処理を行っているプロセッサからバッファID切り
替え信号が、同期成立パケットと共に各プロセッサに転
送されていることに注意されたい。バッファID切り替
え信号は、通常は、ゲート508の作用により、送信制
御回路411Bに転送されることはない。
On the other hand, when the reports from all the processors are accumulated, the AND condition is satisfied at the AND gate 502,
The inter-processor synchronization report generation circuit 500 generates a new barrier synchronization packet and clears the accumulated information. The synchronization establishment packet is broadcast to all processors that have started barrier synchronization processing. At this time, it should be noted that the buffer ID switching signal is transferred to each processor together with the synchronization establishment packet from the processor performing the barrier synchronization processing. Normally, the buffer ID switching signal is not transferred to the transmission control circuit 411B by the operation of the gate 508.

【0057】送信制御回路411Bは、同期成立パケッ
トをバイパスして受信制御回路402Bに転送する。こ
のとき、バッファID切り替え信号もANDゲートを通
過し、同期成立パケットと共に同期成立パケットを受信
すべきプロセッサに転送される。
The transmission control circuit 411B bypasses the synchronization establishment packet and transfers it to the reception control circuit 402B. At this time, the buffer ID switching signal also passes through the AND gate, and is transferred together with the synchronization establishment packet to the processor that should receive the synchronization establishment packet.

【0058】受信制御回路402Bでは、バッファID
切り替え信号を信号線12を介して受け取り、受信制御
回路402B内の3つのフリップフロップ62と回路7
0とにより、3サイクルだけデータ線上を同期報告パケ
ットを優先的に転送できるようにセレクタを制御する信
号線71を作る。
In the reception control circuit 402B, the buffer ID
The switching signal is received via the signal line 12, and the three flip-flops 62 and the circuit 7 in the reception control circuit 402B are received.
With 0, a signal line 71 for controlling the selector is created so that the synchronization report packet can be preferentially transferred on the data line for three cycles.

【0059】このセレクタを制御する信号71により、
3サイクルの期間だけ受信バッファ53からの通常デー
タの送信が中断され、替わって、バリア同期受信制御回
路60Bからの同期成立パケットの送信がなされる。
The signal 71 for controlling the selector gives
The transmission of normal data from the reception buffer 53 is interrupted for a period of three cycles, and instead, the transmission of a synchronization establishment packet from the barrier synchronization reception control circuit 60B is performed.

【0060】図4は、本実施例による通常パケット転送
中におけるバリア同期パケット転送のタイムチャートで
ある。特に、複数のプロセッサのうち、ブロセッサAが
最後にバリア同期処理を開始し、同期報告パケット転送
した場合を示している。命令制御回路1Aが、通常パケ
ットのn番目のデータを転送した後に、3サイクルのバ
リア同期パケット(同期報告パケット)を転送したとす
ると、この同期報告パケットは、送信制御回路401
A、受信制御回路412Aを介して同期開始フリップフ
ロップ501Aに蓄積される。他のプロセッサはすでに
バリア同期処理を開始しているとの前提であるから、他
のプロセッサに対応する同期開始フリップフロップには
すでに同期報告パケットが蓄積されている。このため、
ANDゲート502の条件が整うので、プロセッサ間同
期フリップフロップをリセットすると共に、同期報告パ
ケットを同期報告生成回路500から生成する。
FIG. 4 is a time chart of the barrier synchronization packet transfer during the normal packet transfer according to the present embodiment. In particular, the case where the processor A of the plurality of processors finally starts the barrier synchronization processing and transfers the synchronization report packet is shown. Assuming that the instruction control circuit 1A transfers a 3-cycle barrier synchronization packet (synchronization report packet) after transferring the nth data of the normal packet, the synchronization report packet is transmitted by the transmission control circuit 401.
A, it is stored in the synchronization start flip-flop 501A via the reception control circuit 412A. Since it is assumed that the other processor has already started the barrier synchronization processing, the synchronization report packet has already been accumulated in the synchronization start flip-flop corresponding to the other processor. For this reason,
Since the condition of the AND gate 502 is satisfied, the inter-processor synchronization flip-flop is reset and a synchronization report packet is generated from the synchronization report generation circuit 500.

【0061】同期報告は、ネットワーク中の送信制御回
路411A及び411Bに出されるが、例えば、ネット
ワーク中の送信制御回路411Bで処理中のパケットは
k番目の要素で中断され、プロセッサ中の受信制御回路
402Bにおいては、j番目で中断される(j≦k)。
このようにバリア同期パケット(同期報告パケット、同
期成立パケット)が通常のパケットに優先して処理され
るため、バリア同期処理を短時間に行うことができる。
各受信、送信制御回路で2サイクルずつ要するとするな
ら、バリア同期処理を10サイクルで終了させることが
できる。
The synchronization report is sent to the transmission control circuits 411A and 411B in the network. For example, the packet being processed by the transmission control circuit 411B in the network is interrupted at the k-th element, and the reception control circuit in the processor is transmitted. At 402B, the processing is interrupted at the j-th position (j ≦ k).
As described above, the barrier synchronization packet (synchronization report packet, synchronization establishment packet) is processed prior to the normal packet, so that the barrier synchronization processing can be performed in a short time.
If each reception and transmission control circuit requires two cycles, the barrier synchronization processing can be completed in ten cycles.

【0062】401A及び412A間のデータ線は、9
ビット程度であり、64キロバイトのデータ転送に64
キロサイクルを要求する。これらのパケット2つを越す
ことで100キロサイクル以上を節約し、10サイクル
で処理を終ることは、10キロ倍の高速化にあたる。
The data line between 401A and 412A is 9
Bits or 64 kilobytes of data transfer.
Request a kilocycle. Exceeding these two packets saves more than 100 kilocycles and ending the processing in 10 cycles is equivalent to a 10 kilofold speedup.

【0063】本実施例の構成により、プロセッサAの中
の記憶制御回路2Aの出力が、例えば、DMA転送中の
送信パケット処理は、n番目の要素で中断され、割り込
み信号線10が値“1”に設定されると共に、この例で
はパケット先頭データ20に値“4”を送ることで、3
サイクル分のバリア同期パケットが直ちに送れる。
According to the configuration of this embodiment, the output of the storage control circuit 2A in the processor A, for example, the transmission packet processing during the DMA transfer is interrupted at the n-th element, and the interrupt signal line 10 is set to the value "1". In this example, by sending a value “4” to the packet head data 20,
The barrier synchronization packet for the cycle can be sent immediately.

【0064】この追越し制御がプロセッサの送信制御回
路401Aの出力部でも繰り返され、同じパケットのm
(m≦n)番目の要素で中断される。中断処理は、従来
からパス競合回路調停として一般に使われるもので実現
でき、受信制御回路402Bにおける信号線330を出
力すると、SEND信号線33を抑止するように接続す
る。
This overtaking control is also repeated at the output of the transmission control circuit 401A of the processor, and the same packet m
It is interrupted at the (m ≦ n) th element. The interruption processing can be realized by a method generally used as a path contention circuit arbitration, and when the signal line 330 in the reception control circuit 402B is output, the SEND signal line 33 is connected so as to be suppressed.

【0065】受信制御回路412Aからの同期報告パケ
ットは同期開始フリップフロップ501Aに伝えられ
る。ANDゲート502の条件が整うと、プロセッサ間
同期フリップフロップ501A,501Bをリセットす
ると共に、同期成立パケットを同期報告生成回路500
から生成する。
The synchronization report packet from the reception control circuit 412A is transmitted to the synchronization start flip-flop 501A. When the condition of the AND gate 502 is satisfied, the inter-processor synchronization flip-flops 501A and 501B are reset, and the synchronization establishment packet is transmitted to the synchronization report generation circuit 500.
Generate from

【0066】同期成立は、ネットワーク中の送信制御回
路411A及び411Bに出されるが、例えば、ネット
ワーク中の送信制御回路411Bで処理中のパケットは
k番目の要素で中断され、プロセッサ中の受信制御回路
402Bにおいては、j番目で中断される(j≦k)。
The establishment of synchronization is output to the transmission control circuits 411A and 411B in the network. For example, a packet being processed by the transmission control circuit 411B in the network is interrupted at the k-th element, and the reception control circuit in the processor is stopped. At 402B, the processing is interrupted at the j-th position (j ≦ k).

【0067】以上の説明のように、本実施例では、前述
の文献1の従来技術のようにケーブル本数およびネット
ワーク基板数を倍増することなく、信号線数を1本追加
することで、バリア同期ネットワークを実現している。
As described above, in this embodiment, the barrier synchronization is achieved by adding one signal line without doubling the number of cables and the number of network boards as in the prior art of the above-mentioned Document 1. A network is realized.

【0068】また、本実施例では、前述の文献2の技術
と同様に、バリア同期パケットが通常パケットの転送が
終わるのを待たないようにパケット到着を変更すること
で、バリア同期処理時間を数千分の1に削減した。
In the present embodiment, similarly to the technique of the above-mentioned document 2, the barrier synchronization processing time is reduced by changing the packet arrival so that the barrier synchronization packet does not wait for the transfer of the normal packet to end. Reduced to one thousandth.

【0069】さらに、本実施例では、バリア同期パケッ
トを固定長としフリップフロップに書き込んでレジスタ
ファイル等の高集積だが低速な格納手段をバイパスする
ので、ネットワーク転送時間を更に短縮すると共にその
ための大規模なバッファを不要化した。
Further, in this embodiment, the barrier synchronization packet is fixed length and written into the flip-flop to bypass the high-density but low-speed storage means of the register file and the like, so that the network transfer time can be further reduced and a large-scale network for that purpose can be obtained. Unnecessary buffer.

【0070】以上、本発明を、前記実施例に基づき具体
的に説明したが、本発明は、前記実施例に限定されるも
のではなく、その要旨を逸脱しない範囲において種々変
更可能であることは勿論である。
Although the present invention has been specifically described based on the above embodiments, the present invention is not limited to the above embodiments, but may be variously modified without departing from the gist thereof. Of course.

【0071】本実施例においては、各プロセッサからの
同期報告パケットが同期フリップフロップに揃った段階
で新たに同期成立パケットを発生しているが、バリア同
期パケット以外の優先度の高いパケットにプロセッサ間
で通信する際にあるプロセッサからそのような優先パケ
ット(以下、一般優先パケットと称する。)をそのまま
他のプロセッサへ転送するように改変してもよい。
In this embodiment, a new synchronization establishment packet is generated when the synchronization report packet from each processor is aligned with the synchronization flip-flop. It may be modified so that such a priority packet (hereinafter, referred to as a general priority packet) is transferred from one processor to another processor as it is at the time of communication.

【0072】図5、図6は、そのような改変を施した他
の実施例である。図5、図6は、この2つの図面で、本
実施例によるバリア同期と通常プロトコルを扱うネット
ワーク制御回路の構成を示しており、その信号線の接続
関係を丸で囲まれたアルファベットで示している。
FIGS. 5 and 6 show another embodiment in which such a modification is made. FIGS. 5 and 6 show the configuration of the network control circuit that handles the barrier synchronization and the normal protocol according to the present embodiment in these two drawings, and shows the connection relationship of the signal lines with alphabets surrounded by circles. I have.

【0073】パケットの先頭の複数ビットが、バリア同
期パケットか、通常パケットかの用途かを示すだけでは
なく、バリア同期パケットではないが他のパケット通信
に優先する優先パケットかを識別できるように設定され
る。命令制御回路は優先パケットを転送する際には併せ
て、バッファID切り替え信号を信号線10に転送す
る。図2、図3の構成との相違は、デコード回路(51
0A、510B)が、さらに優先パケットをデコードで
きるものであり、優先パケットをデコードしたときに信
号線(506A、506B)に値1を転送する点が機能
として追加される。但し、優先パケットは通常パケット
と同様信号線504A(または504B)を介してマル
チプレクサ503に送られる。また、OR回路507が
設けられてAND回路502と信号線506A、506
B(信号線506BとOR回路507の接続は図の簡素
化のために示していない。)の信号を論理ORする。こ
の結果、優先パケットはバッファID切り替え信号と共
に、転送すべきプロセッサに転送される。優先パケット
が、受信制御回路、送信制御回路を通常パケットより優
先して通過し、命令制御回路間で授受されるのはバリア
同期パケットと同様である。
Not only does the first bit of the packet indicate whether it is a barrier synchronization packet or a normal packet, but it is set so that it is not a barrier synchronization packet but a priority packet that has priority over other packet communications. Is done. The instruction control circuit transfers the buffer ID switching signal to the signal line 10 when transferring the priority packet. The difference from the configurations of FIGS. 2 and 3 is that the decoding circuit (51
0A, 510B) can further decode the priority packet, and the function of transferring the value 1 to the signal lines (506A, 506B) when the priority packet is decoded is added as a function. However, the priority packet is sent to the multiplexer 503 via the signal line 504A (or 504B) like the normal packet. Further, an OR circuit 507 is provided, and the AND circuit 502 and the signal lines 506A and 506 are provided.
The signal of B (the connection between the signal line 506B and the OR circuit 507 is not shown for simplification of the drawing) is logically ORed. As a result, the priority packet is transferred to the processor to be transferred together with the buffer ID switching signal. The priority packet passes through the reception control circuit and the transmission control circuit in preference to the normal packet, and is exchanged between the instruction control circuits in the same manner as the barrier synchronization packet.

【0074】[0074]

【発明の効果】伝送線として追加した割り込み信号線
は、1本の追加でパケット先頭を送ることを知らせ、用
途の識別には通常のデータ転送線から送るパケット先頭
の複数ビットを用いるので、信号線数を1本追加するだ
けで、バリア同期ネットワークを実現することができ
る。
The interrupt signal line added as a transmission line informs that one additional packet head is to be sent, and a plurality of bits at the head of a packet sent from a normal data transfer line are used for identification of use. A barrier synchronization network can be realized only by adding one line.

【0075】また、バリア同期パケットを最高優先度と
した優先度制御回路は、通常の通信パケットよりもバリ
ア同期処理を優先して転送することにより、多数のプロ
セッサの間の1番遅いプロセッサの処理時間で全体処理
時間が決まるバリア同期処理が高速化されるので、バリ
ア同期を含むユーザプログラムの処理時間を短縮するこ
とができる。
Further, the priority control circuit which sets the barrier synchronization packet as the highest priority transfers the barrier synchronization processing in preference to the normal communication packet, so that the processing of the slowest processor among a large number of processors can be performed. Since the barrier synchronization processing in which the overall processing time is determined by the time is accelerated, the processing time of the user program including the barrier synchronization can be reduced.

【0076】さらに、バリア同期パケットを固定長とし
てフリップフロップに書き込んでレジスタファイル等の
高集積だが低速な格納手段をバイパスするので、ネット
ワーク転送時間を更に短縮すると共にそのためのバッフ
ァを受信回路当り数十バイト不要にすることができる。
Furthermore, since the barrier synchronization packet is written to the flip-flop as a fixed length and bypasses a highly integrated but low speed storage means such as a register file, the network transfer time is further shortened, and a buffer for the network transfer is reduced to several tens per receiver circuit. Bytes can be made unnecessary.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明によるネットワークを備えた並列計算機
システムの一実施例の概略構成を示すブロック図である
FIG. 1 is a block diagram showing a schematic configuration of an embodiment of a parallel computer system provided with a network according to the present invention.

【図2】図3と結合して、本実施例によるバリア同期と
通常プロトコルを扱うネットワーク制御回路の一実施例
の概略構成を示すブロック図である
FIG. 2 is a block diagram, combined with FIG. 3, showing a schematic configuration of an embodiment of a network control circuit that handles a barrier synchronization and a normal protocol according to the present embodiment;

【図3】図2と結合して、本実施例によるバリア同期と
通常プロトコルを扱うネットワーク制御回路の一実施例
の概略構成を示すブロック図である。
FIG. 3 is a block diagram showing a schematic configuration of an embodiment of a network control circuit for handling barrier synchronization and a normal protocol according to the embodiment, which is combined with FIG. 2;

【図4】本実施例による通常パケット転送中におけるバ
リア同期パケット転送のタイムチャートである。
FIG. 4 is a time chart of barrier synchronization packet transfer during normal packet transfer according to the embodiment.

【図5】図6と結合して、他の実施例によるバリア同期
パケットと通常パケットに加えて優先パケットを扱うネ
ットワーク制御回路の一実施例の概略構成を示すブロッ
ク図である。
FIG. 5 is a block diagram, combined with FIG. 6, illustrating a schematic configuration of an embodiment of a network control circuit that handles a priority packet in addition to a barrier synchronization packet and a normal packet according to another embodiment.

【図6】図5と結合して、他の実施例によるバリア同期
パケットと通常パケットに加えて優先パケットを扱うネ
ットワーク制御回路の一実施例の概略構成を示すブロッ
ク図である。
FIG. 6 is a block diagram, combined with FIG. 5, showing a schematic configuration of an embodiment of a network control circuit for handling a priority packet in addition to a barrier synchronization packet and a normal packet according to another embodiment.

【図7】バリア同期プロトコルと汎用のSENDプロト
コル2つのプロトコルの専用ネットワークを備える従来
の並列計算機システムの概略構成を示すブロック図であ
る。
FIG. 7 is a block diagram showing a schematic configuration of a conventional parallel computer system including a dedicated network for a barrier synchronization protocol and a general-purpose SEND protocol;

【符号の説明】[Explanation of symbols]

1A,1B,1C,1D…命令制御回路 2A,2B,2C,2D…メモリ制御回路 3A,3B,3C,3D…メモリ 4A,4B,4C,4D…ネットワークインタフェース
回路 401A,401B,401C,401D…送信制御回
路 402A,402B,402C,402D…受信制御回
路 105…ネットワーク 411A,411B,411C,411D…送信制御回
路 412A,412B,412C,412D…受信制御回
路 50A,50B…通常受信バッファキュー 60A,60B…バリア同期受信制御回路 19…メモリストア制御信号線 20〜23…データおよびバッファID信号線 24…レジスタロード信号線 28…バリア同期開始レジスタ 29…バリア同期完了報告レジスタ 30〜33…データ送出信号線 40〜42…バッファエントリ解放信号線(リリース信
号線) 51…読み出しアドレスポインタ 52…書き込みアドレスポインタ 53…受信バッファ 58…読み出し制御用比較器 61…バリア同期パケット転送フリップフロップ 62…制御信号作成フリップフロップ 70…優先度制御回路(ORゲート) 97…受信バッファ空きエントリ数アップダウンカウン
タ 500…プロセッサ間同期報告生成回路 501A,501B…プロセッサ間同期フリップフロッ
プ 502…プロセッサ間同期用AND回路 511…読み出しアドレス加算器 521…書き込みアドレス加算器
1A, 1B, 1C, 1D: Instruction control circuit 2A, 2B, 2C, 2D: Memory control circuit 3A, 3B, 3C, 3D: Memory 4A, 4B, 4C, 4D: Network interface circuit 401A, 401B, 401C, 401D ... Transmission control circuits 402A, 402B, 402C, 402D ... reception control circuits 105 ... networks 411A, 411B, 411C, 411D ... transmission control circuits 412A, 412B, 412C, 412D ... reception control circuits 50A, 50B ... normal reception buffer queues 60A, 60B ... Barrier synchronization reception control circuit 19 ... Memory store control signal line 20-23 ... Data and buffer ID signal line 24 ... Register load signal line 28 ... Barrier synchronization start register 29 ... Barrier synchronization completion report register 30-33 ... Data transmission signal line 40-4 ... buffer entry release signal line (release signal line) 51 ... read address pointer 52 ... write address pointer 53 ... receive buffer 58 ... read control comparator 61 ... barrier synchronization packet transfer flip-flop 62 ... control signal creation flip-flop 70 ... priority Degree control circuit (OR gate) 97... Up / down counter of the number of empty entries in reception buffer 500... Inter-processor synchronization report generation circuit 501 A, 501 B... Inter-processor synchronization flip-flop 502. Write address adder

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 15/177 676 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06F 15/177 676

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数のプロセッサをネットワークで接続
した並列計算機システムであって、複数のパケットバッ
ファを有するパケットの伝送線と、前記パケットバッフ
ァをバイパスするパスと、前記伝送線とは別に設けら
れ、パケットに付随した割り込み信号の信号線と、前記
信号線の割り込み信号に応答して、対応するパケットを
前記バイパスに切り替えるセレクタとを設け、各プロセ
ッサは優先パケットを前記伝送線に発すると共に、割り
込み信号を前記信号線に転送する手段を有し、前記複数
のプロセッサは夫々が予め定められた程度まで処理を進
めると、同期報告パケットを優先パケットとして前記伝
送線に発し、前記ネットワークは、該複数のプロセッサ
から同期報告パケットを受け取ることを条件として、同
期成立パケットを割り込み信号と共に、夫々前記伝送線
と前記信号線に転送することを特徴とする並列計算機シ
ステム。
1. A plurality of processors connected by a network
Parallel computer system,
A packet transmission line having a
A path that bypasses the
A signal line of an interrupt signal attached to the packet;
In response to the signal line interrupt signal, the corresponding packet is
A selector for switching to the bypass is provided.
The transmitter issues a priority packet to the transmission line and
Means for transferring an embedded signal to the signal line,
Processors advance their processing to a predetermined extent.
In other words, the synchronization report packet is transmitted as a priority packet as described above.
Originating on a transmission line, the network comprising the plurality of processors;
Provided that it receives a synchronization report packet from
And a transmission packet for each of the transmission lines
And a transfer to the signal line.
Stem.
【請求項2】 複数のプロセッサと、前記複数のプロセ
ッサからのパケットを伝送するネットワークとからなる
並列計算機システムであって、各プロセッサは、前記ネ
ットワークへパケットを転送する送信回路と、前記ネッ
トワークからのパケットを受信する受信回路を有し、前
記各受信回路は前記パケットを蓄積する複数段のバッフ
ァと、前記パケットバッファをバイパスするパスと、前
記バッファを選択するか前記バイパスを選択するかを決
定する手段とを有し、前記各送信回路と前記各受信回路
と前記ネットワークはさらにパケットに付随した割り込
み信号を伝送する信号線を有し、前記送信回路は他のパ
ケットに優先して伝送すべき優先パケットに対して前記
信号線に割り込み信号を転送する手段を有し、前記受信
回路は前記信号線の割り込み信号に応答して、対応する
パケットを前記バイパスに切り替えるセレクタを有し、
前記複数のプロセッサは、夫々が予め定められた程度ま
で処理を進めると対応する前記送信回路に対して同期報
告パケットを優先パケットとして前記伝送線に発するよ
う指示し、前記ネットワークは、さらに同期成立パケッ
ト発生手段を有し、複数のプロセッサから同期報告パケ
ットを受け取ることを条件として同期成立パケットを割
り込み信号と共に、夫々前記伝送線と前記信号線に転送
することを特徴とする並列計算機システム。
2. A plurality of processors, said plurality of processors.
Network for transmitting packets from the server
A parallel computer system, wherein each processor has the network
A transmission circuit for transferring a packet to a network,
A receiving circuit for receiving packets from the network.
Each receiving circuit has a multi-stage buffer for storing the packet.
And a path that bypasses the packet buffer,
To select the buffer or the bypass
Each transmitting circuit and each receiving circuit
And the network further interrupts the packet
And a signal line for transmitting only the signal, and the transmitting circuit has another signal line.
For priority packets to be transmitted prior to
Means for transferring an interrupt signal to a signal line;
The circuit responds to the interrupt signal of the signal line and responds
A selector for switching a packet to the bypass,
The plurality of processors each have a predetermined degree.
When the process proceeds, the corresponding transmission circuit
Notification packet as a priority packet to the transmission line.
The network further instructs the synchronization establishment packet.
A synchronous report packet from a plurality of processors.
The synchronization establishment packet on condition that the
Transfer to the transmission line and the signal line respectively
A parallel computer system characterized by:
【請求項3】 複数のプロセッサと、前記複数のプロセ
ッサからのパケット を伝送するネットワークとからなる
並列計算機システムであって、各プロセッサは、前記ネ
ットワークへパケットを転送する送信回路と、前記ネッ
トワークからのパケットを受信する受信回路を有し、前
記各受信回路は前記パケットを蓄積する複数段のバッフ
ァと、前記バッファがパケットにより満杯でなければ、
ネットワークに対してパケットの転送要求を出す手段
と、前記パケットバッファをバイパスするパスと、前記
バッファを選択するか前記バイパスを選択するかを決定
する手段とを有し、前記各送信手段は前記ネットワーク
を介して、パケットの送信先の受信回路から伝えられる
転送要求を受けるとパケットを送信する手段を有し、前
記各送信回路と前記各受信回路と前記ネットワークはさ
らにパケットに付随した割り込み信号を伝送する信号線
を有し、前記送信回路は他のパケットに優先して伝送す
べき優先パケットに対して前記信号線に割り込み信号を
転送する手段を有し、前記受信回路は前記信号線の割り
込み信号に応答して、対応するパケットを前記バイパス
に切り替えるセレクタを有することを特徴とする並列計
算機システム。
3. The plurality of processors and the plurality of processors.
Network for transmitting packets from the server
A parallel computer system, wherein each processor has the network
A transmission circuit for transferring a packet to a network,
A receiving circuit for receiving packets from the network.
Each receiving circuit has a multi-stage buffer for storing the packet.
And if the buffer is not full with packets,
A means for issuing a packet transfer request to the network
A path bypassing the packet buffer;
Decide whether to select the buffer or the bypass
Means for transmitting, wherein each of the transmitting means is the network
Via the receiving circuit of the packet destination
It has a means to send a packet when it receives a transfer request,
Each transmitting circuit, each receiving circuit, and the network are connected to each other.
Signal line that transmits the interrupt signal attached to the packet
And the transmitting circuit transmits the packet in preference to other packets.
Interrupt signal on the signal line for the priority packet
Transferring means, wherein the receiving circuit is configured to divide the signal lines.
The corresponding packet in response to the
Parallel selector having selector for switching to
Computer system.
JP07205804A 1994-08-15 1995-08-11 Parallel computer system Expired - Fee Related JP3115801B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07205804A JP3115801B2 (en) 1994-08-15 1995-08-11 Parallel computer system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP19147594 1994-08-15
JP6-191475 1994-08-15
JP07205804A JP3115801B2 (en) 1994-08-15 1995-08-11 Parallel computer system

Publications (2)

Publication Number Publication Date
JPH08110894A JPH08110894A (en) 1996-04-30
JP3115801B2 true JP3115801B2 (en) 2000-12-11

Family

ID=26506711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07205804A Expired - Fee Related JP3115801B2 (en) 1994-08-15 1995-08-11 Parallel computer system

Country Status (1)

Country Link
JP (1) JP3115801B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5423685B2 (en) * 2008-12-22 2014-02-19 トヨタ自動車株式会社 Vehicle electronic control system, vehicle electronic control unit, and vehicle control synchronization method
US8244423B2 (en) 2008-12-22 2012-08-14 Toyota Jidosha Kabushiki Kaisha Vehicle electronic control system, vehicle electronic control unit, and vehicle control synchronization method
JP7207133B2 (en) * 2019-04-23 2023-01-18 富士通株式会社 Information processing device, synchronization device, and control method for information processing device

Also Published As

Publication number Publication date
JPH08110894A (en) 1996-04-30

Similar Documents

Publication Publication Date Title
JP2539614B2 (en) Apparatus and method for generating pointer address
US5940612A (en) System and method for queuing of tasks in a multiprocessing system
US5434976A (en) Communications controller utilizing an external buffer memory with plural channels between a host and network interface operating independently for transferring packets between protocol layers
US5634015A (en) Generic high bandwidth adapter providing data communications between diverse communication networks and computer system
US5931915A (en) Method for processing early arrival messages within a multinode asynchronous data communications system
US5768530A (en) High speed integrated circuit interface for fibre channel communications
JPH0934818A (en) Method and apparatus for shortened waiting time data reception at inside of data-processing system using packet- based architecture
JPH06309252A (en) Interconnection interface
US5682480A (en) Parallel computer system for performing barrier synchronization by transferring the synchronization packet through a path which bypasses the packet buffer in response to an interrupt
US6691178B1 (en) Fencepost descriptor caching mechanism and method therefor
US20020178306A1 (en) Method and system for over-run protection in amessage passing multi-processor computer system using a credit-based protocol
JPH0816540A (en) Message communication system for parallel computer
US5901328A (en) System for transferring data between main computer multiport memory and external device in parallel system utilizing memory protection scheme and changing memory protection area
JPH076107A (en) Apparatus and method for interfacing as well as communication adaptor
JPH07210519A (en) Data transfer control method and transmission/reception controller
US5878226A (en) System for processing early arrival messages within a multinode asynchronous data communications system
JP3115801B2 (en) Parallel computer system
JPH10228445A (en) Ring bus input-output controller
US20080189719A1 (en) Operation processor apparatus
KR20020067752A (en) The one chip asynchronous microprocessor Inter Processor Communication circuit
US6098105A (en) Source and destination initiated interrupt method for message arrival notification
JPH03127154A (en) Transfer control system
JPH09269936A (en) Remote reading processing method and device therefor
JP3982077B2 (en) Multiprocessor system
JP2984594B2 (en) Multi-cluster information processing system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees