JPH07114515A - Decentralized memory computer with network for synchronous communication - Google Patents

Decentralized memory computer with network for synchronous communication

Info

Publication number
JPH07114515A
JPH07114515A JP5260952A JP26095293A JPH07114515A JP H07114515 A JPH07114515 A JP H07114515A JP 5260952 A JP5260952 A JP 5260952A JP 26095293 A JP26095293 A JP 26095293A JP H07114515 A JPH07114515 A JP H07114515A
Authority
JP
Japan
Prior art keywords
node
communication
data
synchronous
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5260952A
Other languages
Japanese (ja)
Inventor
Mitsuru Ikei
満 池井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Showa Denko Materials Co Ltd
Original Assignee
Hitachi Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Chemical Co Ltd filed Critical Hitachi Chemical Co Ltd
Priority to JP5260952A priority Critical patent/JPH07114515A/en
Publication of JPH07114515A publication Critical patent/JPH07114515A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide the decentralized memory computer with the network for synchronous communication which is superior in communication efficiency. CONSTITUTION:This computer is provided with plural node computers N11 and N12 which have processors, communication means, and local memories for communication, a node connection network which connects those and interchanges data among them. Further, synchronous memories for variables and synchronous communication means that should be synchronized among all the processors are provided. Further, the respective synchronous communication means are connected to a network different from this node connection network.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、分散記憶メモリ並列計
算機に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a distributed storage memory parallel computer.

【0002】[0002]

【従来の技術】フォートラン等の言語で書かれた科学技
術計算のプログラムを実行するには、従来、スーパーコ
ンピュータ等のベクトル計算機が用いられてきたが、近
年では、並列計算機が用いられるようになってきた。
2. Description of the Related Art A vector computer such as a super computer has been conventionally used to execute a scientific and technological program written in a language such as Fortran. In recent years, however, a parallel computer has come to be used. Came.

【0003】この並列計算機には、プログラムの取り扱
うデータ量に応じてノード計算機の数を増かすることの
できる分散メモリ並列計算機があり、特に、科学技術計
算に適している。この分散メモリ並列計算機の構成は、
図2に示すように、プロセッサと通信手段及び通信のた
めに用いる局所メモリを有する複数のノード計算機と、
これらを接続し相互にデータを交換するためのノード接
続ネットワークを有するものである。このノード計算機
は、通信手段を除けば、普通の小型計算機とほぼ同じも
のである。また、ノード接続ネットワークは、数個〜数
千個のノード計算機を接続するためのネットワークであ
り、ハイパーキューブ、メッシュ、トーラス、トリー等
様々なトポロジィのネットワークが開発され、使用され
ている。
This parallel computer includes a distributed memory parallel computer capable of increasing the number of node computers according to the amount of data handled by a program, and is particularly suitable for scientific and technological computation. The configuration of this distributed memory parallel computer is
As shown in FIG. 2, a plurality of node computers having a processor, a communication unit, and a local memory used for communication,
It has a node connection network for connecting these and exchanging data mutually. This node computer is almost the same as an ordinary small computer except for communication means. The node connection network is a network for connecting several to several thousand node computers, and various topological networks such as hypercubes, meshes, tori, and trees have been developed and used.

【0004】[0004]

【発明が解決しようとする課題】このようなノード接続
ネットワークを用いて、複数のノード計算機で、並列計
算する手法として、シングルプログラムマルチプルデー
タ(以下、SPMDという。)法と呼ばれるものが知ら
れている。
A so-called single program multiple data (hereinafter referred to as SPMD) method is known as a method for performing parallel calculation by a plurality of node computers using such a node connection network. There is.

【0005】例を挙げて説明すると、図3に示すよう
に、このプログラムでは、データとして、実数s、2つ
の1000個の要素を持った実数配列a(i),b
(i)であり、S1のdoループではb(i)を参照し
てa(i)を計算し、S2のdoループでは、S1のd
oループで計算した配列a(i)の総和を求めるように
している。この計算を並列して高速に行うために、配列
a(i)及びb(i)を500づつの配列に分け、SP
MD法によってノード計算機N11とN12に実行させ
るプログラム例を、(後に説明するように、細かい点で
完全ではないが、説明のために)模擬的に図4(a)及
び(b)に示す。このようにプログラムを作成すると、
図3に示すプログラムでは、それぞれ1000個あった
配列が、共に、各ノード計算機において半分づつにな
り、同時に計算を行えば、高速に実行できるであろうこ
とが期待できる。
As an example, as shown in FIG. 3, in this program, as data, a real number s and a real number array a (i), b having 1000 elements of two are provided.
(I), a (i) is calculated by referring to b (i) in the do loop of S1, and d of S1 is calculated in the do loop of S2.
The sum of the array a (i) calculated in the o loop is calculated. In order to perform this calculation in parallel and at high speed, the arrays a (i) and b (i) are divided into 500 arrays each, and SP
An example of a program executed by the node computers N11 and N12 by the MD method is schematically shown in FIGS. 4A and 4B (for the sake of explanation, although not perfect in details as described later). If you create a program like this,
In the program shown in FIG. 3, it can be expected that the arrays, each of which has 1,000 arrays, are halved in each node computer, and that if they are simultaneously calculated, they can be executed at high speed.

【0006】ところで、ここに挙げた例に用いたa
(i),b(i)のように、複数のノード計算機に分散
して格納される変数は複値(ポリ)と呼ばれ、プログラ
ム中でこのような複値を参照する場合には、注意を要す
る。というのも、図4のそれぞれのプログラムを同時に
実行すると、ノード計算機N11上にはノード計算機N
12上におけるb(1)に相当するb(501)が存在
しないので、i=500のときに期待した計算結果が得
られないかもしくはエラーとなってしまい、ノード計算
機N12上にはノード計算機N11上におけるa(50
0)に相当するa(0)が存在せず、同様に期待した計
算結果が得られないかもしくはエラーとなってしまうは
ずである。したがって、ノード計算機N11からノード
計算機N12に、ノード計算機N11上のa(500)
を送り、ノード計算機N12からノード計算機N11
に、ノード計算機N12上のb(1)を送らなければな
らない。
By the way, a used in the examples given here
Variables such as (i) and b (i) that are distributed and stored in a plurality of node computers are called multivalues (poly), and be careful when referencing such multivalues in a program. Requires. This is because if the programs of FIG. 4 are executed at the same time, the node computer N11 will run on the node computer N11.
Since b (501) corresponding to b (1) on 12 does not exist, the expected calculation result cannot be obtained or an error occurs when i = 500, and the node computer N12 is on the node computer N11. A above (50
Since a (0) corresponding to 0) does not exist, similarly, the expected calculation result cannot be obtained or an error should occur. Therefore, from the node computer N11 to the node computer N12, a (500) on the node computer N11
From the node computer N12 to the node computer N11
, B (1) on the node computer N12 must be sent.

【0007】このように複値を各ノード計算機上で参照
する場合は、配列を分けた境界等のデータを、隣接する
ノード計算機間で通信する必要がある。図4の例では、
1次元の配列を分けているので、ノード間で通信するデ
ータはそれぞれ1つで済むが、一般的に使用される科学
計算は、配列が2次元以上のことが多く、その場合に
は、複数のデータを通信して交換しなければならない。
When referencing the multiple values on each node computer in this way, it is necessary to communicate the data such as the boundary dividing the array between the adjacent node computers. In the example of FIG.
Since the one-dimensional array is divided, only one piece of data needs to be communicated between the nodes, but in general scientific calculation, the array is often two-dimensional or more. Must communicate and exchange data.

【0008】この複値を参照するプログラムに起因する
データ通信Aは、一般的に次のような特徴を有する。 A1.配列要素等の複数のデータを含むブロックを通信
する。 A2.基本的には、ノード間の1対1の通信であり、ノ
ード計算機群全体でみると、境界でのデータの通信であ
って、通信するノードは隣接している場合が多く、局所
的な通信である。
The data communication A caused by the program that refers to the multiple values generally has the following features. A1. Communicate blocks containing multiple data such as array elements. A2. Basically, it is one-to-one communication between nodes, and when viewed as a whole node computer group, it is data communication at the boundary, and the nodes that communicate are often adjacent to each other, and local communication Is.

【0009】一方、図4(a)におけるプログラムのd
oループ文S12や、図4(b)におけるプログラムの
doループ文S22は、sが単なる変数であり、計算を
行う毎に値を代入しているため、実行する毎に、通信す
る必要がある。このような変数は、単値(モノ)と呼ば
れ、ノード計算機上では、一般にコピーして使用されて
おり、単値のデータは、接続された全てのノード計算機
上に、そのコピーが存在している。したがって、単値を
参照して計算する場合は、そのコピーを参照すればよい
ので、通信する必要はないが、単値に新たな値を代入し
た場合には、全てのノード計算機にコピーしなければな
らない。
On the other hand, the program d in FIG.
In the o-loop statement S12 and the do-loop statement S22 of the program in FIG. 4B, s is a simple variable, and a value is assigned each time calculation is performed, so it is necessary to communicate each time it is executed. . Such a variable is called a single value (mono), and is generally used by copying it on the node computer, and the single value data exists in the copy on all connected node computers. ing. Therefore, when calculating by referring to a single value, it is possible to refer to the copy, so it is not necessary to communicate, but when a new value is assigned to a single value, it must be copied to all node computers. I have to.

【0010】この単値に新たに値を代入することに起因
するデータ通信Bは、一般的に次のような特徴を有す
る。 B1.通信するデータは、比較的少ない。 B2.接続されたノード計算機全てが、同期的に参加す
る、広域的な通信である。
The data communication B resulting from substituting a new value for this single value generally has the following features. B1. There is relatively little data to communicate. B2. This is wide area communication in which all connected node computers participate synchronously.

【0011】図4に示すような単純なプログラムであれ
ば、データ通信Aとデータ通信Bは、複値参照のプログ
ラムであるdoループ文S11及びS21と、単値に新
たに代入されるプログラムであるdoループ文S12及
びS22とが、別のループとなっているので問題は発生
しないが、一般に行われるプログラムでは、このデータ
通信Aとデータ通信Bが、同一のループ内に存在する
等、同時に発生する場合が多く、一つのノード接続ネッ
トワーク上に、全く性質の異なる通信が混在するため、
通信効率の低下をまねいていた。
In the case of a simple program as shown in FIG. 4, data communication A and data communication B are do loop statements S11 and S21, which are programs for multivalued reference, and programs newly assigned to single values. Since the certain do loop statements S12 and S22 are separate loops, no problem occurs. However, in a generally executed program, this data communication A and data communication B are present in the same loop, and so on. This often occurs, and since communication with completely different properties is mixed on one node connection network,
It was causing a drop in communication efficiency.

【0012】本発明は、通信効率に優れた同期通信用ネ
ットワークを有する分散メモリ計算機を提供することを
目的とするものである。
An object of the present invention is to provide a distributed memory computer having a synchronous communication network with excellent communication efficiency.

【0013】[0013]

【課題を解決するための手段】本発明の同期通信用ネッ
トワークを有する分散メモリ計算機は、図1に示すよう
に、プロセッサと通信手段及び通信のために用いる局所
メモリを有する複数のノード計算機と、これらを接続し
相互にデータを交換するためのノード接続ネットワーク
を有する分散メモリ計算機において、全プロセッサ間で
同期をとる必要のある変数用の同期メモリと、同期通信
手段112とをそれぞれに有し、かつそれぞれの同期通
信手段が前記ノード接続ネットワークとは別のネットワ
ークによって接続されていることを特徴とする。
As shown in FIG. 1, a distributed memory computer having a synchronous communication network according to the present invention includes a processor, a plurality of node computers having communication means and a local memory used for communication, and In a distributed memory computer having a node connection network for connecting these and exchanging data with each other, each has a synchronous memory for variables that need to be synchronized among all processors, and a synchronous communication means 112, Further, each synchronous communication means is connected by a network different from the node connection network.

【0014】ノード接続ネットワークの接続トポロジィ
としては、前述のように、通信するデータは、比較的少
なく、接続されたノード計算機全てが、同期的に参加す
る、広域的な通信であるため、メッシュを用いることが
好ましい。
As the connection topology of the node connection network, as described above, there is relatively little data to be communicated, and all connected node computers are in wide area communication in a synchronous manner. It is preferable to use.

【0015】同期通信ネットワークの接続トポロジィと
しては、前述のように、配列要素等の複数のデータを含
むブロックを通信するものであり、かつ基本的には、ノ
ード間の1対1の通信であり、局所的な通信であること
から、トリーを用いることが好ましい。
As described above, the connection topology of the synchronous communication network is one for communicating blocks including a plurality of data such as array elements, and basically, one-to-one communication between nodes. It is preferable to use a tree because it is a local communication.

【0016】本発明において、同期メモリは、データメ
モリと最終書換時刻を示すタイムスタンプメモリとを含
むことが好ましく、さらにはデータメモリとデータに対
する同期処理の内容を格納するメモリを含むことが好ま
しい。
In the present invention, the synchronous memory preferably includes a data memory and a time stamp memory indicating the last rewriting time, and further preferably includes a data memory and a memory for storing the contents of synchronization processing for the data.

【0017】[0017]

【作用】本発明では、2つのネットワークを用いたの
で、性質の異なる局所的な通信と広域的な通信とを、同
時に行うことができる。
In the present invention, since two networks are used, it is possible to simultaneously perform local communication and wide area communication having different properties.

【0018】[0018]

【実施例】【Example】

《ノード接続ネットワーク》図6に、本発明の実施例に
使用したノード接続ネットワークを示す。このネットワ
ークは、ノード計算機N1,N2,N3,N4と、ノー
ド計算機と同数のノードC1,C2,C3,C4と、ノ
ード間の通信路L1,L2,L3,L4と、ノードと計
算機との通信路NL1,NL2,NL3,NL4から構
成され、メッシュ接続してある。この構成では、例えば
C1とC2、あるいはC1とC4のように、通信ノード
が直接接続されているノード計算機同志は、直接通信を
行い、例えばC1とC4、あるいはC2とC3のよう
に、通信ノードが直接接続されていないノード計算機同
志は、介在する通信ノードが別の通信ノードへデータを
渡すことによって、通信が行われる。このネットワーク
の特徴は、以下のとおりである。 隣接するノード計算機同志の通信が最も速く通信で
きる。 1辺がN個の正方メッシュにノード計算機が接続さ
れた場合、最長の通信距離(時間)は、2つのノード計
算機間の通信距離の約2(N−1)倍である。
<< Node Connection Network >> FIG. 6 shows a node connection network used in the embodiment of the present invention. This network includes node computers N1, N2, N3, N4, the same number of nodes C1, C2, C3, C4 as the node computers, communication paths L1, L2, L3, L4 between the nodes, and communication between the nodes and the computers. It is composed of paths NL1, NL2, NL3, NL4 and is mesh-connected. In this configuration, the node computers directly connected to the communication nodes, such as C1 and C2 or C1 and C4, directly communicate with each other and communicate with each other, for example, C1 and C4 or C2 and C3. Node computers that are not directly connected to each other communicate with each other by the intervening communication node passing data to another communication node. The characteristics of this network are as follows. Communication between adjacent node computers is the fastest. When a node computer is connected to a square mesh with N sides, the longest communication distance (time) is about 2 (N-1) times the communication distance between two node computers.

【0019】《同期通信ネットワーク》図7に、本発明
の実施例に用いた同期通信ネットワークを示す。このネ
ットワークは、ルート同志が接続された2つのトリーネ
ットワークから構成され、入力側のトリーは、同期通信
マージノードM1,M2,M3,M4から構成され、出
力側のトリーは、同期通信フォークノードF1,F2,
F3,F4から構成されている。4つのノード計算機
は、それぞれのマージノードと、入力用通信路I1,I
2,I3,I4、及び、それぞれのフォークノードと、
出力通信用路O1,O2,O3,O4で接続され、全ノ
ード計算機が参加する同期通信を行うものである。例え
ば、このネットワークによって構成された全ノード計算
機が、各ノード計算機の持つデータの加算を行うとき
は、 (1) 各ノード計算機は、それぞれ、同期メモリを介して
接続されたマージノードに加算したいデータを出力す
る。 (2) 同期通信ネットワーク内では、ノード計算機N1と
N2のデータの加算をマージノードM1で行い、同時
に、ノード計算機N3とN4のデータの加算を、マージ
ノードM2で行う。 (3) 次にマージノードM1とマージノードM2の結果
を、マージノードM3で加算する。 (4) 結果を、フォークノードF1にコピーする。 (5) フォークノードF1からフォークノードF2,F3
にデータを送る。 (6) フォークノードF2からノード計算機N1とN2に
データを送るり、フォークノードF3からノード計算機
N3,N4にデータを送る。 この結果、一定時間後に、それぞれのノード計算機は、
全ての加算結果を得ることができる。
<< Synchronous Communication Network >> FIG. 7 shows a synchronous communication network used in the embodiment of the present invention. This network is composed of two tree networks to which roots are connected, the input side tree is composed of synchronous communication merge nodes M1, M2, M3 and M4, and the output side tree is a synchronous communication fork node F1. , F2
It is composed of F3 and F4. The four node computers have respective merge nodes and input communication paths I1, I
2, I3, I4, and each fork node,
The output communication paths O1, O2, O3, and O4 are connected to perform synchronous communication in which all node computers participate. For example, when all node computers configured by this network add the data of each node computer, (1) Each node computer wants to add data to the merge node connected via the synchronous memory. Is output. (2) In the synchronous communication network, the merge node M1 adds the data of the node computers N1 and N2, and at the same time, the merge node M2 adds the data of the node computers N3 and N4. (3) Next, the merge node M3 adds the results of the merge node M1 and the merge node M2. (4) Copy the result to the fork node F1. (5) Fork node F1 to fork nodes F2, F3
Send data to. (6) The fork node F2 sends data to the node computers N1 and N2, and the fork node F3 sends data to the node computers N3 and N4. As a result, after a certain time, each node computer
All addition results can be obtained.

【0020】(マージノード)図8に、本発明に用いた
マージノードの構成を示す。この同期マージノードは、
2つの入力MI1、MI2に接続されたキューQ1、Q
2と、データの種類を比較する比較機COMPと、デー
タの演算を行う演算器Pから構成され、演算結果はMO
から出力される。本発明に用いた同期通信データは、そ
の構成を図9に示すように、データの書換時間を示すタ
イムスタンプTMと、全ノード計算機で行う処理の内容
である演算指示OPと、それぞれのノード計算機の持つ
データDATAとで構成している。ここで、本発明に使
用したマージノードの動作を以下に説明する。まず、各
ノード計算機から出力されたデータは、それぞれ、マー
ジノード内のキューQ1またはQ2に入力され、比較機
COMPでは、Q1とQ2のタイムスタンプTMと演算
指示OPが一致するのを待ち、一致すれば、演算指示を
演算器Pに送り、演算器Pは、その指示にしたがって演
算を行い、その結果をMOから出力する。
(Merge Node) FIG. 8 shows the structure of the merge node used in the present invention. This sync merge node
Queues Q1, Q connected to two inputs MI1, MI2
2, a comparator COMP for comparing data types, and a calculator P for calculating data, and the calculation result is MO.
Is output from. As shown in FIG. 9, the synchronous communication data used in the present invention has a time stamp TM indicating the rewriting time of the data, an operation instruction OP which is the content of the processing performed by all the node computers, and each node computer. It is composed of the data DATA of the. The operation of the merge node used in the present invention will be described below. First, the data output from each node computer is input to the queue Q1 or Q2 in the merge node, and the comparator COMP waits for the time stamp TM of Q1 and Q2 and the operation instruction OP to match, and then to match. Then, the arithmetic instruction is sent to the arithmetic unit P, the arithmetic unit P performs arithmetic according to the instruction, and the result is output from the MO.

【0021】(フォークノード)図10に、本発明に用
いたフォークノードの構成を示す。このフォークノード
は、ノード内のコピー器Dが、入力されたデータを複写
して、2つの出力FO1及びFO2から出力する。
(Fork Node) FIG. 10 shows the structure of a fork node used in the present invention. In this fork node, the copy device D in the node copies the input data and outputs it from two outputs FO1 and FO2.

【0022】(特徴)このようなトリー形の同期通信ネ
ットワークは、以下のような特徴を有する。 通信は同期しており、すべてのノード計算機が、通
信に同じ時間を要する。 1辺がN個の正方メッシュを有するノード計算機の
場合、この同期通信ネットワークの最長通信時間は、2
つのノード計算機間の通信の約 2*LOG2N 倍である。
(Characteristics) Such a tree-type synchronous communication network has the following characteristics. The communication is synchronized, and all node computers require the same time for communication. In the case of a node computer having N square meshes on one side, the maximum communication time of this synchronous communication network is 2
It is about 2 * LOG 2 N times the communication between two node computers.

【0023】[0023]

【発明の効果】以上に説明したように、本発明によっ
て、複値のデータの参照に対しては、 隣接するノード計算機同志の通信が最も速く通信で
きる。 1辺がN個の正方メッシュにノード計算機が接続さ
れた場合でも、最長の通信距離(時間)は、たかだか2
つのノード計算機間の通信距離の約2(N−1)倍であ
り、単値に新たに値を代入することに対しては、 通信は同期しており、すべてのノード計算機が、通
信に同じ時間を要する。 1辺がN個の正方メッシュを有するノード計算機の
場合、この同期通信ネットワークの最長通信時間は、2
つのノード計算機間の通信の約2*LOG2N倍である
ことを同時に満足することができ、このことから (1)配列要素等の複数のデータを、比較的大きなパケ
ットが必要なブロックデータ用に設計・最適化を行うこ
とができる。 (2)隣接するノード計算機間での通信が高速であり、
局所的な通信を効率的に行うことが可能である。 (3)接続されたノード計算機全てが、同期的に参加す
る、広域的な通信が可能であり、全体通信やレダクショ
ンを高速に実行できる。 (4)通信するデータが比較的少ない通信に適してお
り、通信パケットも小さいものに最適化できる。 という2つの効果を同時に有する同期通信用ネットワー
クを有する分散メモリ計算機を提供することができる。
As described above, according to the present invention, when referring to multivalued data, the communication between adjacent node computers can be the fastest. Even if a node computer is connected to a square mesh with N sides, the maximum communication distance (time) is at most 2
It is about 2 (N-1) times the communication distance between two node computers, and when a new value is assigned to a single value, the communication is synchronized and all node computers have the same communication. It takes time. In the case of a node computer having N square meshes on one side, the maximum communication time of this synchronous communication network is 2
It can be satisfied that the communication between two node computers is about 2 * LOG 2 N times at the same time. From this fact, (1) For multiple block data, such as array elements, which requires a relatively large packet Can be designed and optimized. (2) Communication between adjacent node computers is fast,
It is possible to efficiently perform local communication. (3) All connected node computers can participate in a wide area communication in which they participate in a synchronous manner, and overall communication and reduction can be executed at high speed. (4) It is suitable for communication with relatively small amount of data to be communicated and can be optimized for small communication packets. It is possible to provide a distributed memory computer having a synchronous communication network having the two effects described above.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理を説明するためのブロック図であ
る。
FIG. 1 is a block diagram for explaining the principle of the present invention.

【図2】従来例を説明するためのブロック図である。FIG. 2 is a block diagram for explaining a conventional example.

【図3】本発明の課題を説明するためのプログラム例で
ある。
FIG. 3 is an example of a program for explaining the problems of the present invention.

【図4】(a)及び(b)は、それぞれ本発明の課題を
説明するためのプログラム例である。
4A and 4B are examples of programs for explaining the problems of the present invention.

【図5】本発明の課題を説明するための表である。FIG. 5 is a table for explaining the problems of the present invention.

【図6】本発明の一実施例の一部を示す構成概略図であ
る。
FIG. 6 is a schematic configuration diagram showing a part of an embodiment of the present invention.

【図7】本発明の一実施例を示す他の一部の構成概略図
である。
FIG. 7 is a schematic diagram of another part of the configuration showing an embodiment of the present invention.

【図8】図7の同期通信マージノードの構成を示すブロ
ック図である。
8 is a block diagram showing the configuration of the synchronous communication merge node of FIG. 7. FIG.

【図9】本発明の同期通信に用いたデータの構成を示す
表である。
FIG. 9 is a table showing a structure of data used in the synchronous communication of the present invention.

【図10】図7の同期通信フォークノードの構成を示す
ブロック図である。
10 is a block diagram showing a configuration of the synchronous communication fork node of FIG. 7. FIG.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】プロセッサと通信手段及び通信のために用
いる局所メモリを有する複数のノード計算機と、これら
を接続し相互にデータを交換するためのノード接続ネッ
トワークを有する分散メモリ計算機において、 全プロセッサ間で同期をとる必要のある変数用の同期メ
モリと、同期通信手段112とをそれぞれに有し、かつ
それぞれの同期通信手段が前記ノード接続ネットワーク
とは別のネットワークによって接続されていることを特
徴とする同期通信用ネットワークを有する分散メモリ計
算機。
1. A distributed memory computer having a processor, a communication means, and a plurality of node computers having a local memory used for communication, and a node connection network for connecting these and exchanging data with each other. A synchronization memory for variables that need to be synchronized with each other and a synchronization communication means 112, and each synchronization communication means is connected by a network different from the node connection network. A distributed memory computer having a synchronous communication network.
【請求項2】ノード接続ネットワークの接続トポロジィ
として、メッシュを用いたことを特徴とする請求項1に
記載の同期通信用ネットワークを有する分散メモリ計算
機。
2. A distributed memory computer having a synchronous communication network according to claim 1, wherein a mesh is used as a connection topology of the node connection network.
【請求項3】同期通信ネットワークの接続トポロジィと
して、トリーを用いたことを特徴とする請求項1または
2に記載の同期通信用ネットワークを有する分散メモリ
計算機。
3. A distributed memory computer having a synchronous communication network according to claim 1, wherein a tree is used as a connection topology of the synchronous communication network.
【請求項4】同期メモリが、データメモリと最終書換時
刻を示すタイムスタンプメモリとを含むことを特徴とす
る請求項1〜3のうちいずれかに記載の同期通信用ネッ
トワークを有する分散メモリ計算機。
4. A distributed memory computer having a synchronous communication network according to claim 1, wherein the synchronous memory includes a data memory and a time stamp memory indicating a last rewriting time.
【請求項5】同期メモリが、データメモリとデータに対
する同期処理の内容を格納するメモリを含むことを特徴
とする請求項1〜4のうちいずれかに記載の同期通信用
ネットワークを有する分散メモリ計算機。
5. A distributed memory computer having a synchronous communication network according to claim 1, wherein the synchronous memory includes a data memory and a memory for storing contents of synchronous processing for the data. .
JP5260952A 1993-10-19 1993-10-19 Decentralized memory computer with network for synchronous communication Pending JPH07114515A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5260952A JPH07114515A (en) 1993-10-19 1993-10-19 Decentralized memory computer with network for synchronous communication

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5260952A JPH07114515A (en) 1993-10-19 1993-10-19 Decentralized memory computer with network for synchronous communication

Publications (1)

Publication Number Publication Date
JPH07114515A true JPH07114515A (en) 1995-05-02

Family

ID=17355056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5260952A Pending JPH07114515A (en) 1993-10-19 1993-10-19 Decentralized memory computer with network for synchronous communication

Country Status (1)

Country Link
JP (1) JPH07114515A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187534A (en) * 1996-09-27 1998-07-21 Hewlett Packard Co <Hp> Method and system for maintaining strong order in coherent memory system
JP2007509439A (en) * 2003-10-22 2007-04-12 インテル コーポレイション Method and apparatus for efficient sequence preservation in interconnected networks
JP2012058958A (en) * 2010-09-08 2012-03-22 Fujitsu Ltd Reduction operation device, processor, and computer system
JP2013246584A (en) * 2012-05-24 2013-12-09 Mitsubishi Electric Corp Control device, data output control unit, data input control unit, and control unit

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187534A (en) * 1996-09-27 1998-07-21 Hewlett Packard Co <Hp> Method and system for maintaining strong order in coherent memory system
JP2007509439A (en) * 2003-10-22 2007-04-12 インテル コーポレイション Method and apparatus for efficient sequence preservation in interconnected networks
JP2012058958A (en) * 2010-09-08 2012-03-22 Fujitsu Ltd Reduction operation device, processor, and computer system
JP2013246584A (en) * 2012-05-24 2013-12-09 Mitsubishi Electric Corp Control device, data output control unit, data input control unit, and control unit

Similar Documents

Publication Publication Date Title
US5170482A (en) Improved hypercube topology for multiprocessor computer systems
Puente et al. The adaptive bubble router
US7418470B2 (en) Parallel processing systems and method
US5944779A (en) Cluster of workstations for solving compute-intensive applications by exchanging interim computation results using a two phase communication protocol
JP2512661B2 (en) Non-binary hypercube type computer system and network connection method for multiple nodes
US5583990A (en) System for allocating messages between virtual channels to avoid deadlock and to optimize the amount of message traffic on each type of virtual channel
Li et al. Efficient collective communications in dual-cube
JP2009020797A (en) Parallel computer system
US11531637B2 (en) Embedding rings on a toroid computer network
EP1502203A2 (en) Parallel processing systems and method
Hoefler et al. HammingMesh: a network topology for large-scale deep learning
Kobus et al. Gossip: Efficient communication primitives for multi-gpu systems
Abali et al. Routing algorithms for IBM SP1
Kalnis et al. Mizan: Optimizing graph mining in large parallel systems
JPH07114515A (en) Decentralized memory computer with network for synchronous communication
Petrini et al. Performance analysis of wormhole routed k-ary n-trees
US11748287B2 (en) Networked computer with multiple embedded rings
Pritchard et al. Cube connected Mobius ladders: An inherently deadlock-free fixed degree network
Kumar et al. Hierarchical Communication Optimization for FFT
Schomberg A transputer-based shuffle-shift machine for image processing and reconstruction
Gomez-Lopez et al. Implementation and Evaluation of a Hybrid Network Topology in an Infiniband-based HPC cluster
WO1989001665A1 (en) Hypercube topology for multiprocessor systems with added communication paths between nodes or substituted corner topologies
Yang et al. Adaptive wormhole routing in k-ary n-cubes
Xu et al. ComPaSS: a communication package for scalable software design
Oral et al. Multicast performance analysis for high-speed torus networks