JP2001175618A - Parallel computer system - Google Patents

Parallel computer system

Info

Publication number
JP2001175618A
JP2001175618A JP35827599A JP35827599A JP2001175618A JP 2001175618 A JP2001175618 A JP 2001175618A JP 35827599 A JP35827599 A JP 35827599A JP 35827599 A JP35827599 A JP 35827599A JP 2001175618 A JP2001175618 A JP 2001175618A
Authority
JP
Japan
Prior art keywords
cluster
inter
barrier synchronization
counter
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP35827599A
Other languages
Japanese (ja)
Inventor
Noriyuki Ando
憲行 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP35827599A priority Critical patent/JP2001175618A/en
Publication of JP2001175618A publication Critical patent/JP2001175618A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To stop barrier-synchronous process TAT of a parallel computer system from increasing. SOLUTION: In each of clusters coupled by an inter-cluster coupling network, a remote access controller which is connected to arithmetic processors is provided with an in-cluster synchronism controller 310. The number of object arithmetic processors of in-cluster barrier synchronism is previously written to a counter 305. With an instruction from an arithmetic processor having reached a barrier synchronism point, the counter 305 is made to count down and its value is sent out to the arithmetic processor through a data input transfer device 303. Consequently, it can be recognized that all the arithmetic processors in the cluster have reached the barrier synchronism point. The inter-cluster coupling network is also provided with an inter-cluster barrier synchronism controller of nearly the same constitution and the counter to which the number of object clusters of inter-cluster barrier synchronism is previously written is made to count down with an instruction from a cluster having achieved in-cluster barrier synchronization.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は並列計算機システム
に関し、特に、クラスタ間相互結合網を介して結合され
たクラスタ結合並列計算機システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system, and more particularly to a cluster-connected parallel computer system connected via an inter-cluster interconnection network.

【0002】[0002]

【従来の技術】従来のクラスタ構成の並列計算機システ
ムは、複数個のクラスタと、それらを結合するクラスタ
間相互結合網より構成されている。クラスタとは、複数
個の演算プロセッサ,主記憶装置およびクラスタ間相互
結合網間を接続するクラスタ内相互結合網より構成され
る並列計算機ノードのことを言う。
2. Description of the Related Art A conventional parallel computer system having a cluster configuration includes a plurality of clusters and an inter-cluster interconnection network connecting the clusters. The cluster is a parallel computer node composed of a plurality of arithmetic processors, a main storage device, and an intra-cluster interconnection network that connects the inter-cluster interconnection networks.

【0003】クラスタ間相互結合網は、そのタイプとし
て例えばフルクロスバー(スロスバースイッチ)を選択
することができるが、この結合網はクラスタ間の通信
(アクセス)のルーティングしか行わない。従って、異
なるクラスタに属する複数個の演算プロセッサ間におい
て、同期制御を行う為には、例えば、富田眞治・末吉敏
則共著「並列処理マシン」(電子情報通信学会編,オー
ム社発行)P.117〜120にも記載されている技術
を使用して、クラスタ間相互結合網にバリア同期装置を
設ける必要がある。
[0003] As a type of the inter-cluster interconnection network, for example, a full crossbar (sloss bar switch) can be selected, but this interconnection network only routes communication (access) between clusters. Therefore, in order to perform synchronous control between a plurality of arithmetic processors belonging to different clusters, for example, a parallel processing machine written by Shinji Tomita and Toshinori Sueyoshi (edited by the Institute of Electronics, Information and Communication Engineers, published by Ohmsha), p. It is necessary to provide a barrier synchronizer in the interconnection network between clusters using the technique described in 117-120.

【0004】このバリア同期装置には、カウンタを設
け、各ノードのプロセッサは各々、このカウンタにアク
セスできる。バリア同期開始前に、ある1つのプロセッ
サがカウンタに初期値を設定する。初期値はバリア同期
を行うプロセッサ数である。バリア同期が開始され、各
プロセッサは同期ポイントに到達したならば、カウンタ
をデクリメントをする。そして、すべてのプロセッサが
同期ポイントに達し、カウンタの値が0となったならば
バリア同期完了となる。各プロセッサは同期ポイントに
達し、カウンタのデクリメントを行った後には、カウン
タの値が0か否かをスピンロックにてリードを行う。リ
ード値が0ならばバリア同期が完了したことを認識する
ことができる。
[0004] The barrier synchronizer is provided with a counter, and the processor of each node can access the counter. Before the start of barrier synchronization, one processor sets an initial value to a counter. The initial value is the number of processors that perform barrier synchronization. Barrier synchronization is initiated and each processor decrements the counter when the synchronization point is reached. When all processors reach the synchronization point and the value of the counter becomes 0, the barrier synchronization is completed. After reaching the synchronization point and decrementing the counter, each processor performs a spin lock to read whether the value of the counter is 0 or not. If the read value is 0, it can be recognized that the barrier synchronization has been completed.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上述し
た従来の並列計算機システムでは、全ノードの全プロセ
ッサがバリア同期を行う場合、全プロセッサが発行した
カウンタに対するデクリメント要求、およびカウンタの
リード要求が一斉に発行される。この場合、カウンタへ
のアクセスが集中するため、競合調停によるアクセスの
逐次化が行われ、アクセスのTAT(Turn Around Time)
の低下が発生してしまう。このTATの低下により、バ
リア同期全体の処理時間の増大を引き起こしてしまうと
いう問題がある。このカウンタへのアクセス集中に伴う
バリア同期の性能劣化はプロセッサ個数が増大するにつ
れて顕著化する傾向にある。
However, in the above-described conventional parallel computer system, when all processors in all nodes perform barrier synchronization, a decrement request for a counter issued by all processors and a read request for the counter are simultaneously performed. publish. In this case, since access to the counter is concentrated, access is serialized by contention arbitration, and TAT (Turn Around Time) of access is performed.
Is reduced. There is a problem that the reduction of the TAT causes an increase in the processing time of the entire barrier synchronization. The performance degradation of the barrier synchronization accompanying the concentration of accesses to the counter tends to become more remarkable as the number of processors increases.

【0006】そこで、本発明の目的は、バリア同期の高
速化、特に並列処理を行うプロセッサの個数が増大して
もバリア同期の処理TATが増大しない並列計算機シス
テムを提供することを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a parallel computer system in which barrier synchronization is speeded up, and in particular, even if the number of processors performing parallel processing increases, the barrier synchronization processing TAT does not increase.

【0007】[0007]

【課題を解決するための手段】本発明の第1の並列計算
機システムは、クラスタ間相互結合網で接続されたクラ
スタ内に、当該クラスタ内の各演算プロセッサについて
クラスタ内バリア同期の制御を行うクラスタ内バリア同
期制御手段を設け、また、前記クラスタ間相互結合網内
に、前記各クラスタについてクラスタ間バリア同期の制
御を行うクラスタ間バリア同期制御手段を設けたことを
特徴とする。
According to a first aspect of the present invention, there is provided a cluster system for controlling, within a cluster connected by an inter-cluster interconnection network, barrier synchronization within a cluster for each processor in the cluster. An internal barrier synchronization control means is provided, and an inter-cluster barrier synchronization control means for controlling inter-cluster barrier synchronization for each of the clusters is provided in the inter-cluster interconnection network.

【0008】本発明の第2の並列計算機システムは、そ
れぞれが、複数の演算プロセッサ,主記憶装置,これら
演算プロセッサ,クラスタ間データ転送を制御するリモ
ートアクセス制御装置および前記演算プロセッサ,主記
憶装置,リモートアクセス制御装置を接続するクラスタ
内相互結合網とから構成される複数のクラスタと、該複
数のクラスタを接続するクラスタ間相互結合網とで構成
されるクラスタ構成の並列計算機システムにおいて、前
記リモートアクセス制御装置に、当該クラスタ内の各演
算プロセッサについてクラスタ内バリア同期の制御を行
うクラスタ内バリア同期制御装置を設け、また、前記ク
ラスタ間相互結合網に、前記クラスタ内バリア同期を完
了したクラスタについてクラスタ間バリア同の制御を行
うクラスタ間バリア同期制御装置を設けたことを特徴と
する。
A second parallel computer system according to the present invention includes a plurality of arithmetic processors, a main storage device, these arithmetic processors, a remote access control device for controlling inter-cluster data transfer, and the arithmetic processor, the main storage device, In a parallel computer system having a cluster configuration including a plurality of clusters each including an intra-cluster interconnection network connecting remote access control devices and an inter-cluster interconnection network connecting the plurality of clusters, The control device is provided with an intra-cluster barrier synchronization control device that controls intra-cluster barrier synchronization for each processor in the cluster, and the inter-cluster interconnection network includes a cluster for the cluster that has completed the intra-cluster barrier synchronization. Barrier between clusters that performs the same control between barriers Characterized in that a synchronization control device.

【0009】具体的には、本発明の並列計算機システム
における前記リモートアクセス制御装置は、前記クラス
タ内相互結合網に接続され、前記演算プロセッサからの
クラスタ間データ転送要求命令またはクラスタ内バリア
同期カウンタアクセス命令を入力する入力回路と、該入
力回路から前記クラスタ間データ転送要求命令を受け、
それがライト転送命令なら前記主記憶装置からロードし
たデータを前記クラスタ相互結合網に送出し、また、リ
ード転送命令ならそれを前記クラスタ間相互結合網に送
出するデータ出力転送装置と、前記クラスタ間相互結合
網から入力したデータを前記主記憶装置にストアし、ま
た、前記リード転送命令を受け付けると前記データ出力
装置に転送して前記ライト転送命令時と同様な動作を行
わせるデータ入力転送装置と、前記入力回路から前記ク
ラスタ内バリア同期カウンタアクセス命令を受けると前
記クラスタ内バリア同期の制御を行うクラスタ内バリア
同期制御装置とから構成される。
Specifically, in the parallel computer system according to the present invention, the remote access control device is connected to the intra-cluster interconnection network, and issues an inter-cluster data transfer request command or an intra-cluster barrier synchronization counter access from the arithmetic processor. An input circuit for inputting an instruction, and receiving the inter-cluster data transfer request instruction from the input circuit;
If it is a write transfer command, sends data loaded from the main storage device to the cluster interconnection network; if it is a read transfer instruction, sends the data to the inter-cluster interconnection network; A data input / transfer device for storing data input from the interconnection network in the main storage device, and transferring the data to the data output device upon receiving the read transfer command to perform the same operation as at the time of the write transfer command; And an intra-cluster barrier synchronization control device that controls the intra-cluster barrier synchronization when receiving the intra-cluster barrier synchronization counter access command from the input circuit.

【0010】さらに、前記クラスタ内バリア同期制御装
置は、当該クラスタ内の所定の演算プロセッサから前記
クラスタ内バリア同期を行う演算プロセッサ数が予め書
き込まれ、演算プロセッサがバリア同期ポイントに到達
するごとにデクリメントされるカウンタと、前記カウン
タのカウント値を1だけ減じて前記デクリメントを実行
するデクリメンタと、前記入力回路から前記クラスタ内
バリア同期カウンタアクセス命令を受けると、その内容
によって、前記カウンタに対する書込み,読出し要求ま
たはデクリメント要求を行うライト制御回路と、前記読
出し要求によって前記カウンタから送出されたカウント
値を前記デクリメンタに送出するとともに、前記データ
入力転送装置に転送して当該演算プロセッサへ送出させ
るリード制御回路とから構成される。
Further, the intra-cluster barrier synchronization control device writes in advance the number of arithmetic processors performing the intra-cluster barrier synchronization from a predetermined arithmetic processor in the cluster, and decrements each time the arithmetic processor reaches a barrier synchronization point. Counter, a decrementer for executing the decrement by decrementing the count value of the counter by 1, and a write / read request for the counter according to the content of the instruction when the intra-cluster barrier synchronization counter access instruction is received from the input circuit. Alternatively, a write control circuit for making a decrement request, and a read control circuit for sending the count value sent from the counter by the read request to the decrementer and transferring the count value to the data input / transfer device and sending it to the arithmetic processor It consists of.

【0011】なお、前記クラスタ内バリア同期制御装置
に、前記リード制御回路からの通知によってクラスタ内
バリア同期完了を判断して前記クラスタ間バリア同期装
置に対しバリア同期完了を通知するバリア完了通知回路
を付加してもよい。
A barrier completion notifying circuit for judging the completion of intra-cluster barrier synchronization based on the notification from the read control circuit and notifying the inter-cluster barrier synchronizing device of the completion of barrier synchronization is provided to the intra-cluster barrier synchronization control device. It may be added.

【0012】また、前記クラスタ間相互結合網は、前記
各クラスタに接続され、当該演算プロセッサからのデー
タまたはクラスタ間バリア同期カウンタアクセス命令を
入力する入力回路と、該入力回路からデータを受けと命
令の内容によって所定のクラスタに転送するクラスタ間
結合網と、前記入力回路から前記クラスタ間バリア同期
カウンタアクセス命令を受けると前記クラスタ内バリア
同期の制御を行うクラスタ間バリア同期制御装置とから
構成される。
Further, the inter-cluster interconnection network is connected to each of the clusters and receives an input of data or an inter-cluster barrier synchronization counter access instruction from the arithmetic processor, and an instruction to receive data from the input circuit. And an inter-cluster barrier synchronization control device for controlling the intra-cluster barrier synchronization when receiving the inter-cluster barrier synchronization counter access command from the input circuit. .

【0013】さらに、前記クラスタ間バリア同期制御装
置は、異なるクラスタから発行された複数のクラスタ間
バリア同期カウンタアクセス命令の調停を行うリクエス
ト競合調停回路と、クラスタ内の所定の演算プロセッサ
から前記クラスタ間バリア同期を行うクラスタ数が予め
書き込まれ、クラスタがバリア同期ポイントに到達する
ごとにデクリメントされるカウンタと、前記カウンタの
カウント値を1だけ減じて前記デクリメントを実行する
デクリメンタと、前記リクエスト競合調停回路で調停さ
れた前記クラスタ間バリア同期カウンタアクセス命令を
受けると、その内容によって、前記カウンタに対する書
込み,読出し要求またはデクリメント要求を行うライト
制御回路と、前記読出し要求によって前記カウンタから
送出されたカウント値を前記デクリメンタに送出すると
ともに、前記クラスタ間結合網に転送して当該クラスタ
へ転送させるリード制御回路とから構成される。
Further, the inter-cluster barrier synchronization control device includes a request contention arbitration circuit for arbitrating a plurality of inter-cluster barrier synchronization counter access instructions issued from different clusters, A counter in which the number of clusters for performing barrier synchronization is written in advance and decremented each time the cluster reaches a barrier synchronization point; a decrementer for reducing the count value of the counter by 1 to perform the decrement; and a request contention arbitration circuit. Upon receiving the inter-cluster barrier synchronization counter access instruction arbitrated in step (1), a write control circuit for issuing a write, read request or decrement request to the counter according to the contents thereof, and a counter transmitted from the counter in response to the read request. Sends out a value to the decrementer composed of a read control circuit for transferring to the clusters are transferred to the inter-cluster connection network.

【0014】本発明では、バリア同期カウンタをクラス
タ間バリア同期カウンタとクラスタ内バリア同期カウン
タに分割配置したため、クラスタ内プロセッサ間のバリ
ア同期は各クラスタで並列して行うことができ、また、
クラスタ間のバリア同期のカウンタデクリメントは各ク
ラスタからクラスタ代表の1アクセスで済むようになる
ので、バリア同期処理時間の短縮が可能になる。
In the present invention, the barrier synchronization counter is divided into the inter-cluster barrier synchronization counter and the intra-cluster barrier synchronization counter, so that the barrier synchronization between the processors in the cluster can be performed in each cluster in parallel.
Since the counter decrement of the barrier synchronization between clusters can be performed by one access of the cluster representative from each cluster, the barrier synchronization processing time can be reduced.

【0015】[0015]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0016】図1は本発明が適用される一般的なクラス
タ構成の並列計算機のシステム構成例を示している。1
1,12…1nは各々クラスタを示し、これらのクラス
タ11〜1nは単独で、図2に示すように1つの並列計
算機を構成している。2はn個のクラスタ11〜1nを
結合するクラスタ間相互結合網を示している。各クラス
タ10〜1nはクラスタ間相互結合網2に対し1ポート
分用意され、このポートとクラスタ間相互結合網2はリ
ンクで結合される。従って、クラスタ間相互結合網2は
クラスタの個数をnとするならば、n入力、n出力のネ
ットワーク構成になる。
FIG. 1 shows a system configuration example of a parallel computer having a general cluster configuration to which the present invention is applied. 1
1, 1... 1n indicate clusters, respectively, and these clusters 11 to 1n independently constitute one parallel computer as shown in FIG. Reference numeral 2 denotes an inter-cluster interconnection network that connects n clusters 11 to 1n. Each of the clusters 10 to 1n is prepared for one port for the inter-cluster interconnection network 2, and this port and the inter-cluster interconnection network 2 are connected by a link. Therefore, if the number of clusters is n, the inter-cluster interconnection network 2 has an n-input, n-output network configuration.

【0017】クラスタ11〜1n間のリクエストの通信
は全て、クラスタ間相互結合網2を経由することにな
る。クラスタ間相互結合網2は、同一のクラスタへリク
エスト要求をする複数個のリクエストが同時に到着した
場合に対し、これを競合調停し、リクエストのルーティ
ングを行う機能を有している。
All communication of requests between the clusters 11 to 1n is performed via the inter-cluster interconnection network 2. The inter-cluster interconnected network 2 has a function of, when a plurality of requests for requesting the same cluster arrive at the same time, competing for these requests and routing the request.

【0018】図2は同一構成のクラスタ11〜1nの一
般的な構成例を示している。211,212…21mは
演算プロセッサを示しているので、n個のクラスタそれ
ぞれがm個の演算プロセッサを有するならば、並列計算
機システムとしてn×m個の演算プロセッサを持ってい
ることになる。230はクラスタ内の主記憶装置を示
す。この主記憶装置230は、自クラスタ内の演算プロ
セッサと、他クラスタの演算プロセッサの両方がアクセ
ス可能であるとする。自クラスタ内の演算プロセッサが
自クラスタ内の主記憶装置をアクセスすることをローカ
ルアクセス、他クラスタの主記憶装置をアクセスするこ
とをリモートアクセスと言う。
FIG. 2 shows a general configuration example of clusters 11 to 1n having the same configuration. Since 211, 212... 21m indicate arithmetic processors, if each of the n clusters has m arithmetic processors, it means that the parallel computer system has n × m arithmetic processors. 230 indicates a main storage device in the cluster. It is assumed that the main storage device 230 can be accessed by both an arithmetic processor in its own cluster and an arithmetic processor in another cluster. Accessing a main storage device in the own cluster by an arithmetic processor in the own cluster is called local access, and accessing a main storage device in another cluster is called remote access.

【0019】220はクラスタ内相互結合網を示す。ク
ラスタ内相互結合網220は自クラスタ内の各演算プロ
セッサ211〜21mと主記憶装置230を結合する。
また、1ポート分が、後述するリモートアクセス制御装
置240経由でクラスタ間相互結合網2へのアクセスパ
スとして用意されている。従って、クラスタ間相互結合
網2は、自クラスタ内の複数個の演算プロセッサから送
られるローカルアクセスと、クラスタ間相互結合網2よ
り送られるリモートアクセスに対して、リクエストの競
合調停を行い、各リクエストを所望の主記憶装置,演算
プロセッサ,クラスタ間相互結合網2にルーティングす
る機能を有している。
Reference numeral 220 denotes an intra-cluster interconnection network. The intra-cluster interconnection network 220 connects the arithmetic processors 211 to 21m in the own cluster and the main storage device 230.
One port is provided as an access path to the inter-cluster interconnection network 2 via the remote access control device 240 described later. Accordingly, the inter-cluster interconnection network 2 arbitrates requests for local access sent from a plurality of arithmetic processors in its own cluster and remote access sent from the inter-cluster interconnection network 2 and arbitrates each request. Is routed to a desired main memory, arithmetic processor, and interconnection network 2 between clusters.

【0020】他クラスタの主記憶装置230へリモート
アクセスを行う場合には、リクエストの経路は、自演算
プロセッサを起点として、自クラスタ内のクラスタ内相
互結合網220,クラスタ間相互結合網2および他クラ
スタのクラスタ内相互結合網220を経て、他クラスタ
の主記憶装置230へ至り、アクセス後のリプライは、
上記パスの逆向きにアクセスが経由されることになる。
When remote access is made to the main storage device 230 of another cluster, the path of the request starts from the self-processor and starts from the intra-cluster interconnection network 220, the inter-cluster interconnection network 2 and the other networks. Through the intra-cluster interconnection network 220 of the cluster, it reaches the main storage device 230 of the other cluster.
Access is performed in the reverse direction of the above path.

【0021】240はリモートアクセス制御装置を示
す。リモートアクセス制御装置240はクラスタ内相互
結合網220とクラスタ間相互結合網2に接続される。
リモートアクセス制御装置220はプロセッサ211〜
21mが発行したクラスタ間データ転送要求命令を受け
付ける。このクラスタ間データ転送要求命令はリードデ
ータ転送命令とライトデータ転送命令の2種類がある。
ライト転送命令は自クラスタ内の主記憶装置から、他ク
ラスタの主記憶装置へデータを転送する命令であり、リ
ード転送命令は他クラスタ内の主記憶装置から自クラス
タ内の主記憶装置へデータを転送する命令である。
Reference numeral 240 denotes a remote access control device. The remote access control device 240 is connected to the intra-cluster interconnection network 220 and the inter-cluster interconnection network 2.
The remote access control device 220 includes processors 211 to
An inter-cluster data transfer request command issued by 21m is accepted. There are two types of the inter-cluster data transfer request command: a read data transfer command and a write data transfer command.
The write transfer instruction is an instruction for transferring data from the main storage device in the own cluster to the main storage device in another cluster, and the read transfer instruction is for transferring data from the main storage device in the other cluster to the main storage device in the own cluster. Instruction to transfer.

【0022】図3は本発明が適用されたリモートアクセ
ス制御装置240の構成例を示しており、入力回路30
1,データ出力転送装置302,データ入力転送装置3
03およびクラスタ内バリア同期制御装置310から成
る。さらに、クラスタ内バリア同期制御装置310は、
ライト制御回路304,カウンタ305,リード制御回
路306およびデクリメンタ307で構成される。
FIG. 3 shows an example of the configuration of a remote access control device 240 to which the present invention is applied.
1, data output transfer device 302, data input transfer device 3
03 and an intra-cluster barrier synchronization control device 310. Furthermore, the intra-cluster barrier synchronization control device 310
It comprises a write control circuit 304, a counter 305, a read control circuit 306, and a decrementer 307.

【0023】入力回路301は、プロセッサ211〜2
1mが発行したクラスタ間データ転送要求命令をデータ
出力転送装置302へ転送する。また、バリア同期カウ
ンタアクセス命令ならば、これをクラスタ内バリア同期
制御装置310に転送する。
The input circuit 301 includes processors 211 and 2
1m is transferred to the data output transfer device 302. If the command is a barrier synchronization counter access command, it is transferred to the intra-cluster barrier synchronization control device 310.

【0024】クラスタ間データ転送命令のうちのライト
転送命令は入力回路301よりデータ出力転送装置30
2に転送される。データ出力転送装置302はライト転
送命令を受け付けると、入力回路301経由で主記憶装
置230よりデータをロードし、ロードしたデータをク
ラスタ間相互結合網2に送出する。データ転送先クラス
タのデータ入力転送装置303は、クラスタ間相互結合
網2より転送されてきたデータを入力したならば、クラ
スタ内相互結合網220経由でこれを主記憶装置230
にストアする。
The write transfer command among the inter-cluster data transfer commands is transmitted from the input circuit 301 to the data output transfer device 30.
2 When receiving the write transfer command, the data output transfer device 302 loads data from the main storage device 230 via the input circuit 301, and sends the loaded data to the inter-cluster interconnection network 2. When the data input / transfer device 303 of the data transfer destination cluster receives the data transferred from the inter-cluster interconnection network 2, the data is transferred to the main storage device 230 via the intra-cluster interconnection network 220.
Store in

【0025】一方、クラスタ間データ転送命令のうちの
リード転送命令も入力回路301よりデータ出力転送回
路302に転送される。データ出力転送装置302はリ
ード転送命令を受け付けると、これをクラスタ間相互結
合網2に転送する。命令転送先クラスタのデータ入力装
置303は、クラスタ間相互結合網2よりリード転送命
令を入力したならば、これをデータ出力転送装置302
に転送する。データ出力転送装置302はリード転送命
令を入力したならば、クラスタ内相互結合網220およ
び入力回路301経由で主記憶装置230よりデータを
ロードし、ロードしたデータをクラスタ間相互結合網2
に送出する。送出先クラスタ(リード転送命令送出元ク
ラスタ)のデータ入力転送装置303は、クラスタ間相
互結合網2より転送されてきたデータを入力したなら
ば、クラスタ内相互結合網220経由でこれを主記憶装
置230にストアする。
On the other hand, a read transfer command among the inter-cluster data transfer commands is also transferred from the input circuit 301 to the data output transfer circuit 302. When receiving the read transfer command, the data output transfer device 302 transfers this to the inter-cluster interconnection network 2. When a read transfer command is input from the inter-cluster interconnection network 2, the data input device 303 of the command transfer destination cluster transmits the read transfer command to the data output transfer device 302.
Transfer to Upon receiving the read transfer command, the data output transfer device 302 loads data from the main storage device 230 via the intra-cluster interconnection network 220 and the input circuit 301, and transfers the loaded data to the inter-cluster interconnection network 2.
To send to. If the data input / transfer device 303 of the destination cluster (read transfer command source cluster) receives the data transferred from the inter-cluster interconnection network 2, the data is transferred to the main storage device via the intra-cluster interconnection network 220. Store at 230.

【0026】また、バリア同期カウンタアクセス命令
は、入力回路301よりクラスタ内バリア同期制御装置
310に転送される。バリア同期カウンタアクセス命令
には、カウンタリード命令,カウンタライト命令および
カウンタデクリメント命令の3種の命令がある。カウン
タライト命令は、プロセッサ211〜21mよりライト
データを伴って発行され、カウンタ305にデータをス
トアする命令である。カウンタリード命令はプロセッサ
211〜21mより発行され、カウンタ305をリード
し、そのリードデータをプロセッサ211〜21mに返
却する命令である。カウンタデクリメント命令は、プロ
セッサ211〜21mより発行され、カウンタ値305
のカウント値をデクリメントする命令である。デクリメ
ント前のカウント値はプロセッサに返却される。
The barrier synchronization counter access instruction is transferred from the input circuit 301 to the intra-cluster barrier synchronization control device 310. The barrier synchronization counter access instruction includes three types of instructions: a counter read instruction, a counter write instruction, and a counter decrement instruction. The counter write instruction is issued together with write data from the processors 211 to 21m and is an instruction to store data in the counter 305. The counter read command is issued from the processors 211 to 21m, reads the counter 305, and returns the read data to the processors 211 to 21m. The counter decrement instruction is issued from the processors 211 to 21m and has a counter value 305.
Is an instruction to decrement the count value. The count value before decrement is returned to the processor.

【0027】カウンタライト命令は入力回路301より
クラスタ内バリア同期制御装置310に転送される。ラ
イト制御回路304はカウンタライト命令を入力する
と、カウンタ305に対してライトアクセス要求とライ
トデータを送出する。カウンタ305はライトアクセス
要求を受理したならば、カウンタ305のカウント値を
受理したライトデータに更新する。
The counter write command is transferred from the input circuit 301 to the intra-cluster barrier synchronization control device 310. When receiving the counter write command, the write control circuit 304 sends a write access request and write data to the counter 305. When the counter 305 receives the write access request, it updates the count value of the counter 305 to the received write data.

【0028】一方、カウンタリード命令は入力回路30
1よりクラスタ内バリア同期制御装置310に転送され
る。ライト制御回路301はカウンタリード命令を入力
すると、カウンタ305に対してリードアクセス要求を
送出する。カウンタ305はリードアクセス要求を受理
したならば、カウンタ305のカウント値をリード制御
回路306に送出する。リード制御回路306はリード
データをデータ入力転送装置303に転送する。データ
入力転送装置303はリードデータをクラスタ内相互結
合網220および主記憶装置230経由でプロセッサ2
11〜21mに返却する。
On the other hand, the counter read command is input to the input circuit 30.
1 to the intra-cluster barrier synchronization control device 310. Upon input of the counter read command, the write control circuit 301 sends a read access request to the counter 305. Upon receiving the read access request, the counter 305 sends the count value of the counter 305 to the read control circuit 306. The read control circuit 306 transfers the read data to the data input transfer device 303. The data input / transfer device 303 transfers the read data to the processor 2 via the intra-cluster interconnection network 220 and the main storage device 230.
Return to 11-21m.

【0029】また、カウンタデクリメント命令は入力回
路301よりバリア制御装置310に転送される。ライ
ト制御回路301はカウンタデクリメント命令を入力す
ると、カウンタ305に対してデクリメントアクセス要
求を送出する。カウンタ305はデクリメントアクセス
要求を受理したならば、カウンタ305のカウント値を
リード制御回路306に送出する。リード制御回路30
6はリードデータをデクリメンタ307に送出する。ま
た、リードデータはデータ入力転送装置303に転送さ
れ、このリードデータはプロセッサ211〜21mに返
却される。デクリメンタ307はリードデータをマイナ
ス1する操作を行い、操作後のデータをライト制御回路
304に転送する。ライト制御回路304はデクリメン
ト操作後のデータをライトアクセス要求と共にカウンタ
305に送出する。カウンタ305は受理したデータを
ライトする。
The counter decrement command is transferred from the input circuit 301 to the barrier control device 310. Upon input of the counter decrement command, the write control circuit 301 sends a decrement access request to the counter 305. Upon receiving the decrement access request, the counter 305 sends the count value of the counter 305 to the read control circuit 306. Read control circuit 30
6 sends the read data to the decrementer 307. The read data is transferred to the data input transfer device 303, and the read data is returned to the processors 211 to 21m. The decrementer 307 performs an operation of subtracting -1 from the read data, and transfers the operated data to the write control circuit 304. The write control circuit 304 sends the data after the decrement operation to the counter 305 together with the write access request. The counter 305 writes the received data.

【0030】図4はクラスタ間相互結合網2の構成例を
示しており、クラスタ間結合網401,クラスタ11〜
1n対応の入力回路411〜41nおよびクラスタ間バ
リア同期制御装置410から成る。さらに、クラスタ間
バリア同期制御装置410は、リクエスト競合調停回路
402,ライト制御回路404,カウンタ405,リー
ド制御回路406およびデクリメンタ407で構成され
る。入力回路411〜41nはクラスタ11〜1nより
受理したデータならば、これをクラスタ間結合網401
に送出する。また、クラスタ間バリア同期カウンタアク
セス命令ならば、これをクラスタ間バリア同期制御装置
410に送出する。
FIG. 4 shows an example of the configuration of the inter-cluster interconnection network 2, in which the inter-cluster interconnection network 401 and the clusters 11 to 11 are arranged.
It comprises input circuits 411 to 41n corresponding to 1n and an inter-cluster barrier synchronization control device 410. Further, the inter-cluster barrier synchronization control device 410 includes a request contention arbitration circuit 402, a write control circuit 404, a counter 405, a read control circuit 406, and a decrementer 407. If the input circuits 411 to 41n receive the data from the clusters 11 to 1n, the input circuits 411 to 41n transmit the data to the inter-cluster connection network
To send to. If it is an inter-cluster barrier synchronization counter access command, it is sent to the inter-cluster barrier synchronization control device 410.

【0031】クラスタ間バリア同期カウンタアクセス命
令は入力回路411〜41nよりクラスタ間バリア同期
制御装置410に転送される。クラスタ間バリア同期カ
ウンタアクセス命令には、クラスタ間カウンタリード命
令、クラスタ間カウンタライト命令およびクラスタ間カ
ウンタデクリメント命令の3種の命令がある。クラスタ
間カウンタライト命令は、プロセッサ211〜21mよ
りライトデータを伴って発行され、カウンタ405にデ
ータをストアする命令である。クラスタ間カウンタリー
ド命令はプロセッサ211〜21mより発行され、カウ
ンタ405をリードし、リードデータをプロセッサ21
1〜21mに返却する命令である。クラスタ間カウンタ
デクリメント命令は、プロセッサ211〜21mより発
行され、カウンタ405のカウント値をデクリメントす
る命令である。デクリメント前のカウント値はプロセッ
サに返却される。
The inter-cluster barrier synchronization counter access instruction is transferred from the input circuits 411 to 41n to the inter-cluster barrier synchronization control device 410. The inter-cluster barrier synchronization counter access instruction includes three types of instructions: an inter-cluster counter read instruction, an inter-cluster counter write instruction, and an inter-cluster counter decrement instruction. The inter-cluster counter write instruction is an instruction issued with the write data from the processors 211 to 21m and storing the data in the counter 405. The inter-cluster counter read instruction is issued from the processors 211 to 21m, reads the counter 405, and reads the read data from the processor 21.
It is an instruction to return to 1 to 21 m. The inter-cluster counter decrement instruction is an instruction issued by the processors 211 to 21m to decrement the count value of the counter 405. The count value before decrement is returned to the processor.

【0032】クラスタ間カウンタライト命令は入力回路
411〜41nよりクラスタ間バリア同期制御装置31
0に転送される。リクエスト競合調停回路402は異な
るクラスタより発行された複数個のクラスタ間カウンタ
ライト命令が同時に入力された場合、1つの命令を調停
選択し、これをライト制御回路404に送出する。その
他の命令も順次調停選択され、ライト制御回路404に
送出される。ライト制御回路404はクラスタ間カウン
タライト命令を入力すると、カウンタ405に対してラ
イトアクセス要求とライトデータを送出する。カウンタ
405はライトアクセス要求を受理したならば、カウン
タ405のカウント値を受理したライトデータに更新す
る。
The inter-cluster counter write command is sent from the input circuits 411 to 41n through the inter-cluster barrier synchronization control device 31.
0 is transferred. When a plurality of inter-cluster counter write instructions issued from different clusters are simultaneously input, the request contention arbitration circuit 402 arbitrates and selects one instruction and sends it to the write control circuit 404. Other instructions are also sequentially selected for arbitration and sent to the write control circuit 404. Upon receiving the inter-cluster counter write command, the write control circuit 404 sends a write access request and write data to the counter 405. Upon receiving the write access request, the counter 405 updates the count value of the counter 405 to the received write data.

【0033】クラスタ間カウンタリード命令は入力回路
411〜41nよりクラスタ間バリア同期制御装置41
0に転送される。ライト制御回路404はクラスタ間カ
ウンタリード命令を入力すると、カウンタ405に対し
てリードアクセス要求を送出する。カウンタ405はリ
ードアクセス要求を受理したならば、カウンタ405の
カウント値をリード制御回路406に送出する。リード
制御回路406はリードデータをクラスタ間結合網40
1に転送する。クラスタ間結合網401はリードデータ
をプロセッサ211〜21mに返却する。
The inter-cluster counter read command is sent from the input circuits 411 to 41n through the inter-cluster barrier synchronization control device 41.
0 is transferred. When receiving the inter-cluster counter read command, the write control circuit 404 sends a read access request to the counter 405. Upon receiving the read access request, the counter 405 sends the count value of the counter 405 to the read control circuit 406. The read control circuit 406 transfers the read data to the inter-cluster connection network 40.
Transfer to 1. The inter-cluster connection network 401 returns the read data to the processors 211 to 21m.

【0034】クラスタ間カウンタデクリメント命令は入
力回路411〜41nよりバリア制御装置410に転送
される。ライト制御回路404はクラスタ間カウンタデ
クリメント命令を入力すると、カウンタ405に対して
デクリメントアクセス要求を送出する。カウンタ405
はデクリメントアクセス要求を受理したならば、カウン
タ405のカウント値をリード制御回路406に送出す
る。リード制御回路406はリードデータをデクリメン
タ407に送出する。また、リードデータはクラスタ間
結合網401に転送され、このリードデータはプロセッ
サ211〜21mに返却される。デクリメンタ407は
データをマイナス1する操作を行い、操作後のデータを
ライト制御回路404に転送する。ライト制御回路40
4はデクリメント操作後のデータをライトアクセス要求
と共にカウンタ405に送出する。カウンタ405は受
理したデータをライトする。
The inter-cluster counter decrement instruction is transferred from the input circuits 411 to 41n to the barrier control device 410. When receiving the inter-cluster counter decrement command, the write control circuit 404 sends a decrement access request to the counter 405. Counter 405
Sends a count value of the counter 405 to the read control circuit 406 upon receipt of the decrement access request. The read control circuit 406 sends the read data to the decrementer 407. The read data is transferred to the inter-cluster connection network 401, and the read data is returned to the processors 211 to 21m. The decrementer 407 performs an operation of decreasing the data by one, and transfers the operated data to the write control circuit 404. Light control circuit 40
4 sends the data after the decrement operation to the counter 405 together with the write access request. The counter 405 writes the received data.

【0035】次に、クラスタ内のプロセッサ211〜2
1m間でバリア同期を行う動作の説明をする。このバリ
ア同期開始前に、プロセッサ211はカウンタ305に
カウンタライト命令を用いて、バリア同期を行うプロセ
ッサの個数をライトする。この実施の形態ではm値をラ
イトする。バリア同期が開始されたならば、バリア同期
ポイントに到達したプロセッサはカウンタ305に対
し、カウンタデクリメント命令を発行する。カウンタデ
クリメント命令の返却値が1値のプロセッサは、全プロ
セッサがバリア同期ポイントに到達したことを認識する
ことができる。このプロセッサは、クラスタ間カウンタ
デクリメント命令をクラスタ間相互結合網2に発行す
る。
Next, the processors 211 to 2 in the cluster
An operation of performing barrier synchronization for 1 m will be described. Prior to the start of the barrier synchronization, the processor 211 writes the number of processors performing the barrier synchronization to the counter 305 using a counter write instruction. In this embodiment, the m value is written. When the barrier synchronization is started, the processor that has reached the barrier synchronization point issues a counter decrement instruction to the counter 305. A processor whose return value of the counter decrement instruction is 1 can recognize that all processors have reached the barrier synchronization point. This processor issues an inter-cluster counter decrement instruction to the inter-cluster interconnection network 2.

【0036】さらに、クラスタ間で全クラスタ内のプロ
セッサ211〜21m間でバリア同期を行う動作の説明
をする。バリア同期開始前に、クラスタ11のプロセッ
サ211はカウンタ405にカウンタライト命令を用い
て、バリア同期を行うクラスタの個数をライトする。こ
の実施の形態ではn値をライトする。バリア同期が開始
されたならば、前述のクラスタ間カウンタデクリメント
命令を発行したプロセッサのクラスタ間カウンタデクリ
メント命令の返却値が1値ならば、全クラスタがバリア
同期ポイントに到達したことを認識することができる。
The operation of performing barrier synchronization between processors 211 to 21m in all clusters will be described. Before the start of barrier synchronization, the processor 211 of the cluster 11 writes the number of clusters for which barrier synchronization is to be performed to the counter 405 using a counter write instruction. In this embodiment, the n value is written. If the barrier synchronization is started, if the return value of the inter-cluster counter decrement instruction of the processor that has issued the above-described inter-cluster counter decrement instruction is 1, it can be recognized that all clusters have reached the barrier synchronization point. it can.

【0037】次に、本発明が適用されたリモートアクセ
ス制御装置240の他の例を図5を用いて説明する。図
5を図3と対比すれば明らかなように、この実施の形態
におけるクラスタ内バリア同期制御装置510にはバリ
ア完了通知回路508を設けている。
Next, another example of the remote access control device 240 to which the present invention is applied will be described with reference to FIG. As is apparent from a comparison of FIG. 5 with FIG. 3, a barrier completion notification circuit 508 is provided in the intra-cluster barrier synchronization control device 510 in this embodiment.

【0038】バリア完了通知回路508は、カウンタ3
05のカウント値が0値に変化したことをリード制御回
路306からの通知により認識することをできる。カウ
ンタ305のカウント値が0に変化したということは、
クラスタ内のバリア同期が完了したことを示す。このと
き、バリア完了通知回路508は、データ出力転送装置
502にクラスタ間カウンタデクリメント命令を送出す
る。この実施の形態においても図4に示したクラスタ間
相互結合網2はそのまま使用できる。したがって、デー
タ出力転送装置502は、このクラスタ間カウンタデク
リメント命令をクラスタ間相互結合網2に転送し、クラ
スタ間バリア同期制御装置410のカウンタ405はマ
イナス1されることになる。
The barrier completion notifying circuit 508 includes a counter 3
It can be recognized from the notification from the read control circuit 306 that the count value of 05 has changed to 0 value. The fact that the count value of the counter 305 has changed to 0 means that
Indicates that barrier synchronization within the cluster has been completed. At this time, the barrier completion notification circuit 508 sends an inter-cluster counter decrement instruction to the data output transfer device 502. Also in this embodiment, the inter-cluster interconnection network 2 shown in FIG. 4 can be used as it is. Therefore, the data output transfer device 502 transfers this inter-cluster counter decrement instruction to the inter-cluster interconnection network 2, and the counter 405 of the inter-cluster barrier synchronization control device 410 is decremented by one.

【0039】先に説明した第1の実施の形態では、クラ
スタ内のバリア同期ポイントに到達したことを認識した
演算プロセッサがクラスタ間カウンタデクリメント命令
をクラスタ間相互結合網2に発行していたが、第2の実
施の形態では、クラスタ間カウンタデクリメント命令を
バリア完了通知回路508から直接に発行するため、バ
リア同期のいっそうの高速化が可能となる。
In the first embodiment described above, the arithmetic processor that has recognized that the barrier synchronization point in the cluster has been reached issues an inter-cluster counter decrement instruction to the inter-cluster interconnection network 2. In the second embodiment, since the inter-cluster counter decrement instruction is issued directly from the barrier completion notifying circuit 508, the barrier synchronization can be further speeded up.

【0040】[0040]

【発明の効果】以上に説明した本発明の構成とすること
により、クラスタ内プロセッサ間のバリア同期は、各ク
ラスタで並列して行うことができる。また、クラスタ間
のバリア同期のカウンタデクリメントは、各クラスタか
らクラスタ代表の1アクセスで済む。従って、クラスタ
間バリア同期制御装置へのアクセスの低減が可能とな
り、バリア同期の高速化を図ることができる。
According to the configuration of the present invention described above, barrier synchronization between processors in a cluster can be performed in each cluster in parallel. Further, the counter decrement of the barrier synchronization between the clusters requires only one access of the cluster representative from each cluster. Therefore, access to the inter-cluster barrier synchronization control device can be reduced, and barrier synchronization can be speeded up.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明が適用される一般的な並列計算機システ
ムの構成例を示すブロック図
FIG. 1 is a block diagram showing a configuration example of a general parallel computer system to which the present invention is applied;

【図2】図1に示した並列計算機システムにおける一般
的なクラスタの構成例を示すブロック図
FIG. 2 is a block diagram showing a configuration example of a general cluster in the parallel computer system shown in FIG. 1;

【図3】本発明の第1の実施の形態におけるリモートア
クセス制御装置を示すブロック図
FIG. 3 is a block diagram showing a remote access control device according to the first embodiment of the present invention.

【図4】本発明におけるクラスタ間相互結合網を示すブ
ロック図
FIG. 4 is a block diagram showing an interconnection network between clusters according to the present invention;

【図5】本発明の第2の実施の形態におけるリモートア
クセス制御装置を示すブロック図
FIG. 5 is a block diagram showing a remote access control device according to a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

2 クラスタ間相互結合網 11 クラスタ 12 クラスタ 1n クラスタ 210 演算プロセッサ 211 演算プロセッサ 21m 演算プロセッサ 220 クラスタ間相互結合網 230 主記憶装置 240 リモートアクセス制御装置 301 入力回路 302 データ出力転送装置 303 データ入力転送装置 304 ライト制御装置 305 カウンタ 306 リード制御装置 307 デクリメンタ 310 クラスタ内バリア同期制御装置 401 クラスタ間結合網 404 ライト制御装置 405 カウンタ 406 リード制御装置 407 デクリメンタ 410 クラスタ間バリア同期制御装置 411 入力回路 412 入力回路 41n 入力回路 502 データ出力転送装置 508 バリア完了通知装置 510 バリア同期制御装置 2 Inter-Cluster Interconnection Network 11 Cluster 12 Cluster 1n Cluster 210 Arithmetic Processor 211 Arithmetic Processor 21m Arithmetic Processor 220 Inter-Cluster Interconnection Network 230 Main Storage Device 240 Remote Access Controller 301 Input Circuit 302 Data Output Transfer Device 303 Data Input Transfer Device 304 Write control device 305 Counter 306 Read control device 307 Decrementer 310 Intra-cluster barrier synchronization control device 401 Inter-cluster interconnection network 404 Write control device 405 Counter 406 Read control device 407 Decrementer 410 Inter-cluster barrier synchronization control device 411 Input circuit 412 Input circuit 41n input Circuit 502 Data output transfer device 508 Barrier completion notification device 510 Barrier synchronization control device

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 クラスタ間相互結合網で接続されたクラ
スタ内に、当該クラスタ内の各演算プロセッサについて
クラスタ内バリア同期の制御を行うクラスタ内バリア同
期制御手段を設け、 また、前記クラスタ間相互結合網内に、前記各クラスタ
についてクラスタ間バリア同期の制御を行うクラスタ間
バリア同期制御手段を設けたことを特徴とする並列計算
機システム。
1. An intra-cluster barrier synchronization control means for controlling intra-cluster barrier synchronization for each processor in the cluster in a cluster connected by an inter-cluster interconnection network; A parallel computer system, wherein inter-cluster barrier synchronization control means for controlling inter-cluster barrier synchronization for each cluster is provided in a network.
【請求項2】 それぞれが、複数の演算プロセッサ,主
記憶装置,これら演算プロセッサ,クラスタ間データ転
送を制御するリモートアクセス制御装置および前記演算
プロセッサ,主記憶装置,リモートアクセス制御装置を
接続するクラスタ内相互結合網とから構成される複数の
クラスタと、該複数のクラスタを接続するクラスタ間相
互結合網とで構成されるクラスタ構成の並列計算機シス
テムにおいて、 前記リモートアクセス制御装置に、当該クラスタ内の各
演算プロセッサについてクラスタ内バリア同期の制御を
行うクラスタ内バリア同期制御装置を設け、 また、前記クラスタ間相互結合網に、前記クラスタ内バ
リア同期を完了したクラスタについてクラスタ間バリア
同の制御を行うクラスタ間バリア同期制御装置を設けた
ことを特徴とする並列計算機システム。
2. A plurality of arithmetic processors, a main storage device, a remote access control device for controlling these arithmetic processors, data transfer between clusters, and a cluster for connecting the arithmetic processor, the main storage device, and the remote access control device. In a parallel computer system having a cluster configuration including a plurality of clusters each including an interconnection network and an inter-cluster interconnection network connecting the plurality of clusters, the remote access control device includes: An intra-cluster barrier synchronization control device for controlling intra-cluster barrier synchronization for the arithmetic processor is provided. The inter-cluster interconnection network further includes inter-cluster barriers for controlling the same inter-cluster barrier for the cluster that has completed the intra-cluster barrier synchronization. A barrier synchronization control device is provided. Parallel computer system that.
【請求項3】 前記リモートアクセス制御装置は、 前記クラスタ内相互結合網に接続され、前記演算プロセ
ッサからのクラスタ間データ転送要求命令またはクラス
タ内バリア同期カウンタアクセス命令を入力する入力回
路と、 該入力回路から前記クラスタ間データ転送要求命令を受
け、それがライト転送命令なら前記主記憶装置からロー
ドしたデータを前記クラスタ相互結合網に送出し、ま
た、リード転送命令ならそれを前記クラスタ間相互結合
網に送出するデータ出力転送装置と、 前記クラスタ間相互結合網から入力したデータを前記主
記憶装置にストアし、また、前記リード転送命令を受け
付けると前記データ出力装置に転送して前記ライト転送
命令時と同様な動作を行わせるデータ入力転送装置と、 前記入力回路から前記クラスタ内バリア同期カウンタア
クセス命令を受けると前記クラスタ内バリア同期の制御
を行うクラスタ内バリア同期制御装置とから構成される
ことを特徴とする請求項2に記載の並列計算機システ
ム。
3. An input circuit which is connected to the intra-cluster interconnection network and receives an inter-cluster data transfer request instruction or an intra-cluster barrier synchronization counter access instruction from the arithmetic processor, and Receiving the inter-cluster data transfer request command from the circuit; if the command is a write transfer command, sends the data loaded from the main memory to the cluster interconnection network; A data output transfer device for transmitting the data input from the inter-cluster interconnection network to the main storage device, and, when the read transfer command is received, transferring the data to the data output device to perform the write transfer command. A data input transfer device for performing the same operation as the above, and Parallel computer system according to claim 2, characterized in that they are composed of a rear synchronous counter access instruction to receive a cluster barrier synchronization control unit for controlling said cluster barrier synchronization.
【請求項4】 前記クラスタ内バリア同期制御装置は、 当該クラスタ内の所定の演算プロセッサから前記クラス
タ内バリア同期を行う演算プロセッサ数が予め書き込ま
れ、演算プロセッサがバリア同期ポイントに到達するご
とにデクリメントされるカウンタと、 前記カウンタのカウント値を1だけ減じて前記デクリメ
ントを実行するデクリメンタと、 前記入力回路から前記クラスタ内バリア同期カウンタア
クセス命令を受けると、その内容によって、前記カウン
タに対する書込み,読出し要求またはデクリメント要求
を行うライト制御回路と、 前記読出し要求によって前記カウンタから送出されたカ
ウント値を前記デクリメンタに送出するとともに、前記
データ入力転送装置に転送して当該演算プロセッサへ送
出させるリード制御回路とから構成されることを特徴と
する請求項2または請求項3に記載の並列計算機システ
ム。
4. The intra-cluster barrier synchronization control device, wherein the number of arithmetic processors performing the intra-cluster barrier synchronization is written in advance from a predetermined arithmetic processor in the cluster, and is decremented each time the arithmetic processor reaches a barrier synchronization point. A decrementer for reducing the count value of the counter by 1 to execute the decrement, and receiving a write / read request for the counter according to the content of the instruction when the intra-cluster barrier synchronous counter access instruction is received from the input circuit. A write control circuit for making a decrement request; a read control circuit for sending the count value sent from the counter in response to the read request to the decrementer, transferring the count value to the data input transfer device, and sending it to the arithmetic processor. Parallel computer system according to claim 2 or claim 3, characterized in that it is configured.
【請求項5】 前記クラスタ内バリア同期制御装置に、
前記リード制御回路からの通知によってクラスタ内バリ
ア同期完了を判断して前記クラスタ間バリア同期装置に
対しバリア同期完了を通知するバリア完了通知回路を付
加したことを特徴とする請求項2ないし請求項4のいず
れかに記載の並列計算機システム。
5. The in-cluster barrier synchronization control device,
5. A barrier completion notifying circuit for judging completion of barrier synchronization within a cluster based on a notification from the read control circuit and notifying the inter-cluster barrier synchronizer of the completion of barrier synchronization is provided. A parallel computer system according to any one of the above.
【請求項6】 前記クラスタ間相互結合網は、 前記各クラスタに接続され、当該演算プロセッサからの
データまたはクラスタ間バリア同期カウンタアクセス命
令を入力する入力回路と、 該入力回路からデータを受けと命令の内容によって所定
のクラスタに転送するクラスタ間結合網と、 前記入力回路から前記クラスタ間バリア同期カウンタア
クセス命令を受けると前記クラスタ内バリア同期の制御
を行うクラスタ間バリア同期制御装置とから構成される
ことを特徴とする請求項2ないし請求項5に記載の並列
計算機システム。
6. The inter-cluster interconnection network is connected to each of the clusters and receives an input of data or an inter-cluster barrier synchronization counter access instruction from the arithmetic processor, and an instruction to receive data from the input circuit. And an inter-cluster barrier synchronization control device for controlling the intra-cluster barrier synchronization when receiving the inter-cluster barrier synchronization counter access command from the input circuit. 6. The parallel computer system according to claim 2, wherein:
【請求項7】 前記クラスタ間バリア同期制御装置は、 異なるクラスタから発行された複数のクラスタ間バリア
同期カウンタアクセス命令の調停を行うリクエスト競合
調停回路と、 クラスタ内の所定の演算プロセッサから前記クラスタ間
バリア同期を行うクラスタ数が予め書き込まれ、クラス
タがバリア同期ポイントに到達するごとにデクリメント
されるカウンタと、前記カウンタのカウント値を1だけ
減じて前記デクリメントを実行するデクリメンタと、 前記リクエスト競合調停回路で調停された前記クラスタ
間バリア同期カウンタアクセス命令を受けると、その内
容によって、前記カウンタに対する書込み,読出し要求
またはデクリメント要求を行うライト制御回路と、 前記読出し要求によって前記カウンタから送出されたカ
ウント値を前記デクリメンタに送出するとともに、前記
クラスタ間結合網に転送して当該クラスタへ転送させる
リード制御回路とから構成されることを特徴とする請求
項2または請求項6のいずれかに記載の並列計算機シス
テム。
7. An inter-cluster barrier synchronization control device, comprising: a request contention arbitration circuit for arbitrating a plurality of inter-cluster barrier synchronization counter access instructions issued from different clusters; A counter in which the number of clusters for performing barrier synchronization is written in advance and decremented each time the cluster reaches a barrier synchronization point; a decrementer for reducing the count value of the counter by 1 to execute the decrement; and a request contention arbitration circuit. Upon receiving the inter-cluster barrier synchronization counter access instruction arbitrated in step (a), a write control circuit for issuing a write, read request or decrement request to the counter according to the content thereof, and a count value transmitted from the counter in response to the read request 7. The parallel computer system according to claim 2, further comprising: a read control circuit that sends the data to the decrementer and transfers the data to the inter-cluster connection network to transfer the data to the cluster. .
JP35827599A 1999-12-17 1999-12-17 Parallel computer system Pending JP2001175618A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35827599A JP2001175618A (en) 1999-12-17 1999-12-17 Parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35827599A JP2001175618A (en) 1999-12-17 1999-12-17 Parallel computer system

Publications (1)

Publication Number Publication Date
JP2001175618A true JP2001175618A (en) 2001-06-29

Family

ID=18458454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35827599A Pending JP2001175618A (en) 1999-12-17 1999-12-17 Parallel computer system

Country Status (1)

Country Link
JP (1) JP2001175618A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100456230C (en) * 2007-03-19 2009-01-28 中国人民解放军国防科学技术大学 Computing group structure for superlong instruction word and instruction flow multidata stream fusion
WO2011087076A1 (en) * 2010-01-14 2011-07-21 日本電気株式会社 Parallel calculator system, synchronization method, and program
JP2019079528A (en) * 2017-10-20 2019-05-23 グラフコアー リミテッドGraphcore Limited Synchronization in multi-tile processing arrangement

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100456230C (en) * 2007-03-19 2009-01-28 中国人民解放军国防科学技术大学 Computing group structure for superlong instruction word and instruction flow multidata stream fusion
WO2011087076A1 (en) * 2010-01-14 2011-07-21 日本電気株式会社 Parallel calculator system, synchronization method, and program
JPWO2011087076A1 (en) * 2010-01-14 2013-05-20 日本電気株式会社 Computer, parallel computer system, synchronization method, and computer program
JP5780157B2 (en) * 2010-01-14 2015-09-16 日本電気株式会社 Computer, parallel computer system, synchronization method, and computer program
JP2019079528A (en) * 2017-10-20 2019-05-23 グラフコアー リミテッドGraphcore Limited Synchronization in multi-tile processing arrangement

Similar Documents

Publication Publication Date Title
JPH1049507A (en) Parallel computer
EP0721164A2 (en) Crossbar switch apparatus and protocol
US20060179182A1 (en) Data communication method and apparatus utilizing programmable channels for allocation of buffer space and transaction control
JPH08185380A (en) Parallel computer
JP2002342299A (en) Cluster system, computer and program
JPH0679305B2 (en) Device and method for responding to an interrupt using a hold bus
JPH10222458A (en) Connector
JP3641834B2 (en) Parallel processor system and packet discard method suitable therefor
JP2001175618A (en) Parallel computer system
RU175049U1 (en) COMMUNICATION INTERFACE DEVICE SpaceWire
JPH10320365A (en) Data exchange device and method therefor
CN112506824A (en) Chip and data interaction method
JPH04260962A (en) Synchronization control system in parallel computers
JPS5852264B2 (en) Multi-unit system
US7356669B2 (en) Processing system and method for transmitting data
JP2003046526A (en) Inter-node data transfer method and data transfer device
JP3481445B2 (en) Competition mediation method
JP3512164B2 (en) Communication node, network system, and control method for network system
JPH064401A (en) Memory access circuit
JP3791463B2 (en) Arithmetic unit and data transfer system
JP2000347712A (en) Programmable controller
JP2984594B2 (en) Multi-cluster information processing system
JP2003150540A (en) Bus system and signal transmission method
JP3309212B2 (en) Network switch device
JPH06110831A (en) Data transfer device