JP2000112912A - Processing system for test and copy against remote memory in distributed memory-type parallel computer - Google Patents

Processing system for test and copy against remote memory in distributed memory-type parallel computer

Info

Publication number
JP2000112912A
JP2000112912A JP10281112A JP28111298A JP2000112912A JP 2000112912 A JP2000112912 A JP 2000112912A JP 10281112 A JP10281112 A JP 10281112A JP 28111298 A JP28111298 A JP 28111298A JP 2000112912 A JP2000112912 A JP 2000112912A
Authority
JP
Japan
Prior art keywords
test
copy
instruction
node
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10281112A
Other languages
Japanese (ja)
Inventor
Masanobu Inaba
政信 稲葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP10281112A priority Critical patent/JP2000112912A/en
Publication of JP2000112912A publication Critical patent/JP2000112912A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To speed up a test and copy processing in a distributed memory-type parallel computer. SOLUTION: A node 1 continuously transmits a test instruction, a copy instruction and copy data. When a node 2 receives the test instruction, the copy instruction and copy data, it repetitively executes the test instruction against a remote memory in the self-node until it is succeeded. Copy data are copied to the remote memory with the copy instruction after the success of the test instruction.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、分散メモリ型並列
計算機におけるリモートメモリに対するテストアンドコ
ピーの処理方式に関し、特に、テストアンドコピーの高
速処理方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a test and copy processing method for a remote memory in a distributed memory type parallel computer, and more particularly to a high speed test and copy processing method.

【0002】[0002]

【従来の技術】分散メモリ型並列計算機で計算をする場
合は、ノード間データ転送の発生頻度を小さくするよう
(計算ノード内に閉じた)プログラミングをするのが望
ましい。なぜらば、計算ノード間はネットワークで接続
されており、計算ノード内の距離に比べ計算ノード間の
距離は大きいからである。しかし、大規模な科学技術問
題では、各計算ノード内に閉じたプログラミングは不可
能に等しく、各計算ノードが協調して動くプログラミン
グとなる。例えば、大規模問題配列が複数ノードに跨っ
てマッピングされている場合(グローバルメモリ空間と
してマッピング)がこれに相当する。
2. Description of the Related Art When performing calculations using a distributed memory type parallel computer, it is desirable to perform programming (closed within the calculation nodes) so as to reduce the frequency of data transfer between nodes. This is because the calculation nodes are connected by a network, and the distance between the calculation nodes is larger than the distance within the calculation nodes. However, in large-scale science and technology problems, closed programming within each computation node is unequally possible, resulting in programming in which each computation node works in concert. For example, a case where a large-scale problem array is mapped across a plurality of nodes (mapping as a global memory space) corresponds to this.

【0003】図1は、分散メモリ型並列計算機のブロッ
ク図である。
FIG. 1 is a block diagram of a distributed memory type parallel computer.

【0004】図1を参照すると、分散メモリ型並列計算
機は、複数の計算ノード1/2(一例として、2つのノ
ードで説明するが、ノード数は、2に限定されるもので
はない)と、それらを結ぶNetwork3を有してい
る。計算ノード1は、CPU(中央演算装置:Cent
ral Processing Unit)11、MM
U(主記憶装置:Main Memory Unit)
12、RCU(遠隔制御装置:Remote Cont
rol Unit)13で構成される。計算ノード2も
同様にCPU21、MMU22、RCU23で構成され
る。
Referring to FIG. 1, a distributed memory type parallel computer includes a plurality of calculation nodes 1/2 (for example, two nodes will be described, but the number of nodes is not limited to two). It has Network 3 connecting them. The calculation node 1 is a CPU (Central Processing Unit: Cent)
ral Processing Unit) 11, MM
U (Main storage unit: Main Memory Unit)
12. RCU (Remote control device: Remote Cont)
(Roll Unit) 13. Similarly, the calculation node 2 includes a CPU 21, an MMU 22, and an RCU 23.

【0005】計算ノード1において、CPU11はMM
U12に対するデータのロードとストアが可能であり、
CPU11ではロードしてきたデータを使って演算を
し、結果をMMU12にストアする。RCU13は、C
PU11からの計算ノードを跨ぐ他ノードMMU間のデ
ータ転送命令を受け付け、他ノードのRCUと協調して
ノード間データ転送を実現する。例えば、CPU11が
RCU13にMMU12のデータをMMU22に転送す
るよう指示した場合、RCU13はMMU12のデータ
をロードしてNetwork3経由でRCU23に転送
し、RCU23は転送データをMMU22にライトす
る。これをノード間ライト転送と呼ぶ。また、CPU1
1がRCU13にMMU22のデータをMMU12に転
送するよう指示した場合、RCU13はRCU23にデ
ータ転送リクエストを送り付け、RCU23はMMU2
2のデータをロードしてNetwork3経由でRCU
13に転送し、RCU13は転送データをMMU12に
ライトする。これをノード間ロード転送と呼ぶ。このと
き、命令起動を発した計算ノード1をローカルノードと
呼び、それに準ずる計算ノード2をリモートノードと呼
ぶ。
In the calculation node 1, the CPU 11
Load and store data to U12,
The CPU 11 performs an operation using the loaded data, and stores the result in the MMU 12. RCU 13 uses C
It receives a data transfer instruction between the MMUs of other nodes across the calculation nodes from the PU 11, and realizes inter-node data transfer in cooperation with the RCU of the other node. For example, when the CPU 11 instructs the RCU 13 to transfer the data of the MMU 12 to the MMU 22, the RCU 13 loads the data of the MMU 12, transfers the data to the RCU 23 via the network 3, and the RCU 23 writes the transfer data to the MMU 22. This is called an inter-node write transfer. CPU1
1 instructs the RCU 13 to transfer the data of the MMU 22 to the MMU 12, the RCU 13 sends a data transfer request to the RCU 23, and the RCU 23
2 and load RCU via Network3
13 and the RCU 13 writes the transfer data to the MMU 12. This is called inter-node load transfer. At this time, the computing node 1 that has issued the instruction activation is called a local node, and the corresponding computing node 2 is called a remote node.

【0006】図1において、プログラム例として条件付
きコピー演算がノード間に跨るケースを考えてみる。下
記プログラムは、フラグNODE2_FLAGをテスト
して、値が”1”ならば、配列NODE1(I)を配列
NODE2(I+J)にコピーするものである。ここ
で、配列NODE1(I)を計算ノード1にマッピン
グ、配列NODE2(I+J)とフラグNODE2_F
LAGを計算ノード2にマッピングする。また、親プロ
セスは、計算ノード1のCPUであるとする。
In FIG. 1, consider a case where a conditional copy operation extends between nodes as an example of a program. The following program tests the flag NODE2_FLAG, and if the value is "1", copies the array NODE1 (I) to the array NODE2 (I + J). Here, array NODE1 (I) is mapped to computation node 1, array NODE2 (I + J) and flag NODE2_F
Map LAG to Compute Node 2. The parent process is assumed to be the CPU of the computation node 1.

【0007】 DO I=M,N IF NODE2_FLAG THEN NODE2(I+J)=NODE1(I) END DO この場合、計算ノード1のCPUは計算ノード1のRC
Uに対し、テスト命令とコピー命令の2命令を発行する
ことになる。最初のテスト命令では計算ノード2のメモ
リに対するテストが成功するまで、計算ノード1と計算
ノード2の間をテスト命令は行き来することになる。ま
た、コピー命令の発行は、テストが成功して計算ノード
1のCPUがテスト完了を認識してから(計算ノード2
からテスト終了リプライを受け取ってから)となるの
で、コピー命令が発行されて計算ノード2のメモリにコ
ピーデータが到着するまでのオーバヘッドが大きくな
る。
DOI = M, N IF NODE2_FLAG THEN NODE2 (I + J) = NODE1 (I) END DO In this case, the CPU of the computation node 1
For U, two instructions, a test instruction and a copy instruction, are issued. In the first test instruction, the test instruction moves between the computation nodes 1 and 2 until the test on the memory of the computation node 2 succeeds. The issuance of the copy instruction is performed after the test is successful and the CPU of the computation node 1 recognizes that the test is completed (computation node 2).
From when the test end reply is received), so that the overhead until the copy instruction is issued and the copy data arrives at the memory of the computation node 2 increases.

【0008】、図6は、従来技術のRCU部23(及び
13)の構成例を示すブロック図、図7は、従来技術の
動作を説明するためのタイムチャートである。
FIG. 6 is a block diagram showing a configuration example of a conventional RCU unit 23 (and 13), and FIG. 7 is a time chart for explaining the operation of the conventional technology.

【0009】図1、図6及び図7を元に、従来技術の分
散メモリ型並列計算機におけるテストアンドコピー動作
について説明する。
A test and copy operation in a conventional distributed memory type parallel computer will be described with reference to FIGS. 1, 6 and 7.

【0010】まず、ローカルノード1において、CPU
11からRCU13に対して、リモートメモリ(MMU
22)に対するテスト命令が発行される。RCU13で
は、テスト命令をリクエスト受付部1301で受け付
け、競合調停部1303でNetwork3からのリク
エストとの競合調停後、アドレス変換部1304におい
て、物理ノード番号変換/リモートJOB番号変換をし
て、リクエスト/データ送出部1305からRCU23
(Network3経由)に送出する。
First, in the local node 1, the CPU
11 to the RCU 13 using the remote memory (MMU
A test instruction for 22) is issued. In the RCU 13, the request instruction is received by the request receiving unit 1301, and after the contention arbitration with the request from the Network 3 by the contention arbitration unit 1303, the address conversion unit 1304 performs physical node number conversion / remote JOB number conversion, and performs request / data From the sending unit 1305 to the RCU 23
(Via Network 3).

【0011】次に、リモートノード2において、RCU
23はRCU13(Network3経由)よりテスト
命令をリクエスト受付部2301で受け付け、競合調停
部2303において競合調停後、アドレス変換部230
4において物理アドレス変換した後、MMU22にテス
ト命令を発行する。MMU22からのテスト終了リプラ
イはリクエスト/データ送出部2305よりNetwo
rk3経由でRCU13に返却される。
Next, in the remote node 2, the RCU
23 receives a test instruction from the RCU 13 (via Network 3) in the request receiving unit 2301, and after the contention arbitration in the contention arbitration unit 2303, the address conversion unit 230.
After the physical address conversion in step 4, a test instruction is issued to the MMU 22. The test end reply from the MMU 22 is sent from the request / data sending unit 2305 to the network.
Returned to RCU 13 via rk3.

【0012】RCU13では結果判定を行い、失敗して
いたら同テストシーケンスを繰り返す。図7では、3回
目のテスト終了リプライにてテストシーケンスは成功す
るので、3回目のテスト終了リプライをCPU11に返
却しテスト命令が完了する。
The RCU 13 determines the result, and if it fails, repeats the same test sequence. In FIG. 7, since the test sequence is successful at the third test end reply, the third test end reply is returned to the CPU 11 and the test instruction is completed.

【0013】次に、ローカルノード1において、CPU
11からRCU13に対して、リモートメモリ(MMU
22)に対するコピー命令が発行される。RCU13で
は、コピー命令をリクエスト受付部1301で受け付
け、競合調停部1303で競合調停後、アドレス変換部
1304において、物理ノード番号変換/リモートJO
B番号変換/物理アドレス変換をして、MMU12をア
クセスする。そして、コピー命令とMMU12からのロ
ード(コピー)データを一緒にしてリクエスト/データ
送出部1305からRCU23(Network3経
由)に送出する。
Next, in the local node 1, the CPU
11 to the RCU 13 using the remote memory (MMU
A copy instruction for 22) is issued. In the RCU 13, the request receiving unit 1301 receives a copy command, and after the contention arbitration in the contention arbitration unit 1303, the address conversion unit 1304 converts the physical node number conversion /
The MMU 12 is accessed by performing B number conversion / physical address conversion. Then, the request / data sending unit 1305 sends the copy instruction and the load (copy) data from the MMU 12 together to the RCU 23 (via Network 3).

【0014】次に、RCU23では、コピー命令とコピ
ーデータをリクエスト受付部2301とデータ受付部2
302で受け付け、コピー命令の競合調停とアドレス変
換を競合調停部2303とアドレス変換部2304で実
行した後、コピー命令(コマンドとアドレス)とコピー
データをMMU22に送出しライト(コピー)を行う。
RCU23は、RCU13からのデータ転送とMMU2
2へのライト動作が正常終了したことの通知(コピー終
了リプライ)をリクエスト/データ送出部2305から
Network3経由でRCU13に送り付け、RCU
13は本リプライをCPU11に返却して一連の動作が
完了する。
Next, the RCU 23 sends a copy command and copy data to the request receiving unit 2301 and the data receiving unit 2.
At 302, contention arbitration and address conversion of a copy instruction are executed by a contention arbitration unit 2303 and address conversion unit 2304, and then a copy instruction (command and address) and copy data are sent to the MMU 22 to perform write (copy).
The RCU 23 transfers the data from the RCU 13 and the MMU 2
2 is notified from the request / data sending unit 2305 to the RCU 13 via the network 3 that the write operation to the RCU 2 has been completed normally (copy end reply).
13 returns this reply to the CPU 11 to complete a series of operations.

【0015】図6における構成例では、テストアンドコ
ピー処理(CPU11がリクエストを発行からリプライ
を受け取るまで)は80Tで完了となる。
In the configuration example shown in FIG. 6, the test and copy process (from when the CPU 11 issues a request to when it receives a reply) is completed in 80T.

【0016】[0016]

【発明が解決しようとする課題】上述した従来の分散メ
モリ型並列計算機におけるテストアンドコピー処理は,
計算ノード1のCPUは計算ノード1のRCUに対し、
テスト命令とコピー命令の2命令を発行することにな
り、最初のテスト命令では計算ノード2のメモリに対す
るテストが成功するまで、計算ノード1と計算ノード2
の間をテスト命令は行き来することになり、また、コピ
ー命令の発行は、テストが成功して計算ノード1のCP
Uがテスト完了を認識してから(計算ノード2からテス
ト終了リプライを受け取ってから)となるので、計算ノ
ード1でテスト命令が発行されてから計算ノード2でコ
ピー命令の実行が終了するまでのオーバーヘッドが大き
くなる問題があった。
The test and copy processing in the conventional distributed memory type parallel computer described above involves
The CPU of the calculation node 1 sends the RCU of the calculation node 1
Two instructions, a test instruction and a copy instruction, are issued. In the first test instruction, the computation nodes 1 and 2 are executed until the test on the memory of the computation node 2 succeeds.
The test instruction is exchanged between the two. The issuance of the copy instruction indicates that the test succeeds and the CP
Since U recognizes the completion of the test (after receiving the test end reply from the calculation node 2), the period from when the test instruction is issued at the calculation node 1 to when the execution of the copy instruction is completed at the calculation node 2 is completed. There was a problem that overhead increased.

【0017】本発明の目的は、分散メモリ型並列計算機
におけるリモートメモリに対するテストアンドコピー処
理の高速化方式を提供することにある。
An object of the present invention is to provide a method for speeding up test and copy processing on a remote memory in a distributed memory type parallel computer.

【0018】[0018]

【課題を解決するための手段】本願の第1の発明は、ネ
ットワークにおける複数のノードを構成する分散メモリ
型並列計算機におけるリモートメモリに対するテストア
ンドコピーの処理方式において、テスト命令とコピー命
令及びコピーデータを続けて送出する第一のノードと、
前記テスト命令と前記コピー命令及びコピーデータを受
信すると自ノード内の前記リモートメモリに対する該テ
スト命令を実行し、該テスト命令の実行後に前記コピー
命令により前記コピーデータを前記リモートメモリにコ
ピーする第二のノードを具備することを特徴とする。
According to a first aspect of the present invention, there is provided a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network. A first node that sends
Upon receiving the test command, the copy command, and the copy data, execute the test command for the remote memory in the own node, and copy the copy data to the remote memory by the copy command after the execution of the test command. Characterized by having the following nodes:

【0019】本願の第2の発明は、第1の発明における
前記第二のノードは、前記リモートメモリに対する該テ
スト命令を自ノード内で該命令が成功するまで繰り返し
実行することを特徴とする。
According to a second aspect of the present invention, in the first aspect, the second node repeatedly executes the test instruction for the remote memory in its own node until the instruction is successful.

【0020】本願の第3の発明は、ネットワークにおけ
る複数のノードを構成する分散メモリ型並列計算機にお
けるリモートメモリに対するテストアンドコピーの処理
方式において、前記各ノードはCPU(中央演算装
置)、MMU(主記憶装置)、RCU(遠隔制御装置)
を含んで構成され、第一のノードにおける第一のRCU
は、第一のCPUからテストアンドコピー命令を受ける
と該命令をテスト命令とコピー命令に分解し該テスト命
令を第二のノードにおける第二のRCUに送出し続いて
前記コピー命令と第一のMMUからのコピーデータを一
緒にして前記第二のRCUに送出する送出手段を具備
し、前記第二のノードにおける前記第二のRCUは、受
信した前記テスト命令及び前記コピー命令を格納するコ
マンド・アドレス退避バッファと、受信した前記コピー
データを格納するデータ退避バッファと、前記テスト命
令が成功するまで該テスト命令を前記コマンド・アドレ
ス退避バッファから取り出して第二のMMUに発行する
ことを繰り返し該テスト命令が成功すると該コマンド・
アドレス退避バッファから前記コピー命令を取り出すと
ともに前記データ退避バッファから前記コピーデータを
取り出し前記第二のMMUに発行する繰り返し制御部と
を具備することを特徴とする。
According to a third aspect of the present invention, there is provided a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, wherein each of the nodes includes a CPU (Central Processing Unit) and an MMU (Main Unit). Storage device), RCU (remote control device)
And a first RCU at the first node
Receives a test and copy instruction from the first CPU, decomposes the instruction into a test instruction and a copy instruction, sends the test instruction to a second RCU in a second node, and subsequently transmits the test instruction and the first Sending means for sending together the copy data from the MMU to the second RCU, wherein the second RCU in the second node includes a command for storing the received test command and the received copy command. An address saving buffer, a data saving buffer for storing the received copy data, and repeatedly executing the test instruction from the command / address saving buffer and issuing to the second MMU until the test instruction succeeds. If the command succeeds, the command
A repetition control unit that fetches the copy instruction from the address save buffer and fetches the copy data from the data save buffer and issues the copy data to the second MMU.

【0021】本願の第4の発明は、ネットワークにおけ
る複数のノードを構成する分散メモリ型並列計算機にお
けるリモートメモリに対するテストアンドコピーの処理
方式において、テスト命令を送出するとともにテスト終
了リプライを受信後にコピー命令及びコピーデータを続
けて送出する第一のノードと、前記テスト命令を受信す
ると自ノード内の前記リモートメモリに対する該テスト
命令を実行し該テスト命令の実行後に前記テスト終了リ
プライを送出し該テスト終了リプライ送出に応じて前記
コピー命令及びコピーデータを受信し記コピー命令によ
り前記コピーデータを前記リモートメモリにコピーする
第二のノードを具備することを特徴とする。
According to a fourth aspect of the present invention, in a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, a copy instruction is transmitted after transmitting a test instruction and receiving a test end reply. And a first node for continuously transmitting copy data, and upon receiving the test instruction, executing the test instruction for the remote memory in the own node, transmitting the test end reply after executing the test instruction, and terminating the test. A second node that receives the copy command and the copy data in response to the reply transmission and copies the copy data to the remote memory according to the copy command.

【0022】本願の第5の発明は、第4の発明における
前記第二のノードは、前記リモートメモリに対する該テ
スト命令を自ノード内で該命令が成功するまで繰り返し
実行することを特徴とする。
According to a fifth aspect of the present invention, in the fourth aspect, the second node repeatedly executes the test instruction for the remote memory in its own node until the instruction is successful.

【0023】本願の第6の発明は、ネットワークにおけ
る複数のノードを構成する分散メモリ型並列計算機にお
けるリモートメモリに対するテストアンドコピーの処理
方式において、前記各ノードはCPU(中央演算装
置)、MMU(主記憶装置)、RCU(遠隔制御装置)
を含んで構成され、第一のノードにおける第一のRCU
は、第一のCPUからテストアンドコピー命令を受ける
と該命令をテスト命令とコピー命令に分解し該テスト命
令を第二のノードにおける第二のRCUに送出しテスト
終了リプライを受信後に前記コピー命令と第一のMMU
からのコピーデータを一緒にして前記第二のRCUに送
出する送出手段を具備し、前記第二のノードにおける前
記第二のRCUは、受信した前記テスト命令を格納する
コマンド・アドレス退避バッファと、前記テスト命令が
成功するまで該テスト命令を前記コマンド・アドレス退
避バッファから取り出して第二のMMUに発行すること
を繰り返し該テスト命令が成功すると前記テスト終了リ
プライを送出する繰り返し制御部と、該テスト終了リプ
ライ送出に応じて前記コピー命令及びコピーデータを受
信し該コピー命令及びコピーデータを前記第二のMMU
に発行する制御手段を具備することを特徴とする。
According to a sixth aspect of the present invention, there is provided a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, wherein each of the nodes includes a CPU (Central Processing Unit), an MMU (Main Unit). Storage device), RCU (remote control device)
And a first RCU at the first node
Receives a test and copy instruction from the first CPU, decomposes the instruction into a test instruction and a copy instruction, sends the test instruction to the second RCU in the second node, and receives the test end reply, And the first MMU
And sending means for sending the copy data from the second RCU together to the second RCU, wherein the second RCU in the second node comprises a command / address saving buffer for storing the received test instruction; A repetition control unit for repeatedly taking out the test instruction from the command / address save buffer and issuing the test instruction to the second MMU until the test instruction succeeds, and sending out the test end reply when the test instruction succeeds; Receiving the copy command and the copy data in response to sending the end reply and transmitting the copy command and the copy data to the second MMU
Is provided with control means for issuing the control information.

【0024】[作用]分散メモリ型並列計算機における
リモートメモリに対するテストアンドコピー処理を高速
化するために、次の2つの対策を取り入れる。
[Operation] In order to speed up the test and copy process for the remote memory in the distributed memory type parallel computer, the following two measures are taken.

【0025】1.新設のテストアンドコピー命令により
テスト命令とコピー命令を計算ノード1のCPUから同
時に発行し、テスト命令とコピー命令及びコピーデータ
を計算ノード2へ同時に(連続しての意味、以降も同
様)転送し、計算ノード2においてテスト命令実行終了
後直ちにコピー命令の実行を可能にする。
1. The test instruction and the copy instruction are simultaneously issued from the CPU of the calculation node 1 by the newly installed test and copy instruction, and the test instruction, the copy instruction, and the copy data are simultaneously transferred to the calculation node 2 (sequential meaning, and so on). , Enables the execution of the copy instruction immediately after the execution of the test instruction in the computation node 2.

【0026】2.テスト命令のリトライシーケンスを計
算ノード2の中に閉じて実行させる(成功するまでテス
ト終了リプライを計算ノード1に返さない)。
2. The retry sequence of the test instruction is closed in the calculation node 2 and executed (the test end reply is not returned to the calculation node 1 until the test node succeeds).

【0027】上記1の対策により、コピー命令及びコピ
ーデータの転送時間がテスト命令のレイテンシに隠蔽さ
れ、上記2の対策により、テスト命令における計算ノー
ド間のリトライの行き来によるターンアラウンドタイム
が大幅に短縮され、その結果、分散メモリ型並列計算機
におけるテストアンドコピー処理は高速化される。
According to the first measure, the transfer time of the copy command and the copy data is hidden by the latency of the test command, and the second measure significantly reduces the turnaround time due to the retry between the calculation nodes in the test command. As a result, the speed of the test and copy processing in the distributed memory type parallel computer is increased.

【0028】[0028]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
Next, embodiments of the present invention will be described in detail with reference to the drawings.

【0029】図1は、分散メモリ型並列計算機のブロッ
ク図、図2は、本発明の一実施の形態におけるRCU部
23(及び13)の構成例を示すブロック図、図3は、
本発明の一実施の形態の動作を説明するためのタイムチ
ャートである。
FIG. 1 is a block diagram of a distributed memory type parallel computer, FIG. 2 is a block diagram showing an example of the configuration of an RCU 23 (and 13) according to an embodiment of the present invention, and FIG.
5 is a time chart for explaining the operation of the embodiment of the present invention.

【0030】まず、本実施の形態の構成につて説明す
る。ここでは、リモートノード2のRCU23を中心に
説明をする。また、配列の計算ノードへのマッピング
は、“従来の技術”で述べた場合と同じとする。
First, the configuration of the present embodiment will be described. Here, the description will focus on the RCU 23 of the remote node 2. The mapping of the array to the computation nodes is the same as the case described in the “prior art”.

【0031】図2を参照すると、リクエスト受付部23
01は、CPU21からの命令または、RCU13(N
etwork3)からの命令を受け付け保持をする。デ
ータ受付部2302は、RCU13(Network
3)から転送されてくるデータ部分を受け付け保持をす
る。競合調停部2303は、リクエスト受付部2301
中のリクエストを1つずつ選択(競合調停)する。アド
レス変換部2304は、論理ノード番号を物理ノード番
号に変換、ローカルJOB番号をリモートJOB番号に
変換、ノード内論理アドレスをノード内物理アドレスに
変換する。特に、物理ノード番号変換とリモートJOB
番号変換はNetwork3経由で他ノードをアクセス
する命令に対し必要となり、ノード内物理アドレス変換
はノード内メモリ(ここではMMU22)をアクセスす
る命令に対し必要となる。リクエスト/データ送出部2
305は、アドレス変換後の命令(コマンド・アドレ
ス)とMMU22からのロードデータを他ノード(Ne
twork3経由でRCU13)に送出する部分であ
る。また、データ受付部2302に保持されているデー
タは、他ノード(Network3経由のRCU13)
からMMU22にライトする場合に必要となる。
Referring to FIG. 2, the request receiving unit 23
01 is a command from the CPU 21 or the RCU 13 (N
network 3), and holds the instruction. The data receiving unit 2302 is configured to execute the RCU 13 (Network
The data part transferred from 3) is received and held. The contention arbitration unit 2303 includes a request reception unit 2301
The requests inside are selected one by one (contention arbitration). The address conversion unit 2304 converts a logical node number into a physical node number, converts a local JOB number into a remote JOB number, and converts a logical address in a node into a physical address in a node. In particular, physical node number conversion and remote job
The number conversion is required for an instruction for accessing another node via Network 3, and the intra-node physical address conversion is required for an instruction for accessing the intra-node memory (here, MMU 22). Request / data sending unit 2
Reference numeral 305 denotes an instruction (command / address) after the address conversion and the load data from the MMU 22 to another node (Ne).
This is a part to be sent to the RCU 13) via the work3. The data held in the data receiving unit 2302 is stored in another node (the RCU 13 via the Network 3).
This is necessary when writing to the MMU 22 from.

【0032】次に、本発明の特徴である、コマンド・ア
ドレス退避バッファ2311、データ退避バッファ23
14、セレクタ2312/2315、繰り返し制御部2
313について説明する。コマンド・アドレス退避バッ
ファ2311は、テストアンドコピー命令におけるMM
U22へのアクセス時のコマンドとアドレスを退避して
おくためにバッファであり、これによりMMU22に対
するテストリトライ処理(NODE2_FLAGのチェ
ック)の繰り返し発行が可能となる。データ退避バッフ
ァ2314は、テストが成功(NODE2_FLAG=
1)するまで、ローカルノード1からのコピーデータを
退避させておくためのバッファであり、テスト成功時に
初めてMMU22にコピーデータが送出される。セレク
タ2312は、通常、アドレス変換部2304を選択し
ているが、テストアンドコピー命令における、テストリ
トライ処理時とデータコピー時のみコマンド・アドレス
退避バッファ2311を選択する。セレクタ2315
は、通常は、データ受付部2302を選択しているが、
テストアンドコピー命令におけるデータコピー処理時の
みデータ退避バッファ2314を選択する。繰り返し制
御部2313は、テストアンドコピー命令のテストリト
ライ処理において、MMU22から返却される結果をチ
ェックしセレクタ2312と2315の選択方向を切り
替えるものである。セレクタ切り替え論理は、上記セレ
クタ2312と2315の説明に従う。
Next, a command / address saving buffer 2311 and a data saving buffer 23 which are features of the present invention are described.
14, selector 2312/2315, repetition control unit 2
313 will be described. The command / address save buffer 2311 stores the MM in the test and copy instruction.
This buffer is used to save a command and an address at the time of accessing the U22, thereby enabling a test retry process (NODE2_FLAG check) to be repeatedly issued to the MMU22. The data save buffer 2314 indicates that the test was successful (NODE2_FLAG =
This buffer is for saving copy data from the local node 1 until 1), and the copy data is sent to the MMU 22 only when the test is successful. The selector 2312 normally selects the address conversion unit 2304. However, the selector 2312 selects the command / address saving buffer 2311 only at the time of test retry processing and data copy in a test and copy instruction. Selector 2315
Usually selects the data receiving unit 2302,
The data save buffer 2314 is selected only at the time of data copy processing in the test and copy instruction. The repetition control unit 2313 checks the result returned from the MMU 22 in the test retry processing of the test and copy instruction, and switches the selection direction of the selectors 2312 and 2315. The selector switching logic follows the description of the selectors 2312 and 2315.

【0033】次に、図1、図2及び図3を元に、本実施
の形態の分散メモリ型並列計算機におけるテストアンド
コピー動作について説明する。
Next, a test and copy operation in the distributed memory type parallel computer according to the present embodiment will be described with reference to FIGS. 1, 2 and 3.

【0034】まず、ローカルノード1において、CPU
11からRCU13に対して、リモートメモリ(MMU
22)に対するテストアンドコピー命令が発行される。
RCU13では、テストアンドコピー命令をリクエスト
受付部1301で受け付け、テスト命令とコピー命令と
に分解する。テスト命令は、競合調停部1303で競合
調停後、アドレス変換部1304において、物理ノード
番号変換/リモートJOB番号変換され、リクエスト/
データ送出部1305からRCU23(Network
3経由)に送出される。続いてコピー命令は、競合調停
部1303で競合調停後、アドレス変換部1304にお
いて物理アドレス変換されてMMU12をアクセスす
る。そして、コピー命令とMMU12からのロード(コ
ピー)データを一緒にしてリクエスト/データ送出部1
305より、RCU23(Network3経由)に送
出される。
First, in the local node 1, the CPU
11 to the RCU 13 using the remote memory (MMU
A test and copy instruction for 22) is issued.
In the RCU 13, the test and copy command is received by the request receiving unit 1301, and is decomposed into a test command and a copy command. The test instruction is subjected to contention arbitration in the contention arbitration unit 1303, and then to physical address number conversion / remote JOB number conversion in the address conversion unit 1304.
From the data transmission unit 1305 to the RCU 23 (Network
3). Subsequently, the copy instruction is subjected to physical arbitration in the address conversion unit 1304 after contention arbitration in the contention arbitration unit 1303, and accesses the MMU 12. Then, the request / data sending unit 1 combines the copy instruction and the load (copy) data from the MMU 12 together.
From 305, it is sent to the RCU 23 (via Network 3).

【0035】次に、リモートノード2において、RCU
23はRCU13(Network3経由)よりテスト
命令をリクエスト受付部2301で受け付け、競合調停
部2303において競合調停後、アドレス変換部230
4において物理アドレス変換し、コマンド・アドレス退
避バッファ2311に格納するのと同時に、MMU22
に発行する。MMU22では結果を繰り返し制御部23
13に返却し、テスト失敗(NODE2_FLAG=
0)ならば、コマンド・アドレス退避バッファ2311
に格納してあるテスト命令をMMU22に繰り返し発行
する。図3では、24T目にNODE2_FLAG=1
となるので、8回失敗した後9回目で成功となる。一
方、テスト繰り返し処理中に、コピー命令がRCU13
(Network3)より到着するので、コマンドとア
ドレスはリクエスト受付部2301で受け付け、競合調
停部2303で競合調停して、アドレス変換部2304
で物理アドレス変換した後、コマンド・アドレス退避バ
ッファ2311に格納する。一方、データはデータ受付
部2302で受け付け、データ退避バッファ2314に
格納する。コピー命令はテスト成功まで、各退避バッフ
ァ(2311/2314)において退避される。そし
て、テストは9回目で成功となり、そのタイミングでコ
マンド・アドレス退避バッファ2311中のコマンドと
アドレス、データ退避バッファ2314中のデータをM
MU22に送出しライト(コピー)を行う。RCU23
は、RCU13からのデータ転送とMMU22へのライ
ト動作が正常終了したことの通知(テストアンドコピー
終了リプライ)をリクエスト/データ送出部2305か
らNetwork3経由でRCU13に送り付け、RC
U13は本リプライをCPU11に返却して一連の動作
が完了する。
Next, in the remote node 2, the RCU
23 receives a test instruction from the RCU 13 (via Network 3) in the request receiving unit 2301, and after the contention arbitration in the contention arbitration unit 2303, the address conversion unit 230.
4, the MMU 22 converts the physical address and stores it in the command / address saving buffer 2311.
Issue to The MMU 22 repeatedly repeats the result.
13 and the test failed (NODE2_FLAG =
0), the command / address saving buffer 2311
Are repeatedly issued to the MMU 22. In FIG. 3, NODE2_FLAG = 1 at 24T.
Therefore, after failing eight times, ninth succeeds. On the other hand, during the test repetition processing, the copy instruction
(Network 3), the command and the address are received by the request receiving unit 2301, the contention is arbitrated by the contention arbitration unit 2303, and the address conversion unit 2304 is received.
After converting the physical address, the data is stored in the command / address saving buffer 2311. On the other hand, the data is received by the data receiving unit 2302 and stored in the data save buffer 2314. The copy instruction is saved in each save buffer (2311/2314) until the test is successful. Then, the test succeeds at the ninth time, and at that timing, the command and address in the command / address save buffer 2311 and the data in the data save buffer 2314 are stored in M.
The data is sent to the MU 22 for writing (copying). RCU23
Sends a notification (test and copy end reply) that the data transfer from the RCU 13 and the write operation to the MMU 22 have been normally completed from the request / data sending unit 2305 to the RCU 13 via the Network 3,
U13 returns this reply to the CPU 11, and a series of operations is completed.

【0036】ここでは便宜上、各ユニット間/ユニット
内のレイテンシを下記のように定めることにする。ま
た、NODE2_FLAGは24T目に”0”から”
1”に変わるものとする。但し、Tとは本分散メモリ型
並列計算機システムの1マシンクロックに相当するもの
とする。
Here, for convenience, the latency between / within each unit is determined as follows. NODE2_FLAG changes from “0” at 24T.
1 ", where T corresponds to one machine clock of the distributed memory type parallel computer system.

【0037】1.CPU(11,21)/MMU(1
2,22)間のレイテンシ:1T 2.MMU(12,22)/RCU(13,23)間の
レイテンシ:1T 3.Network(RCU13/RCU23間)レイ
テンシ:6T 4.各ユニット内通過レイテンシ:0T このとき、本発明における構成例では、テストアンドコ
ピー処理(CPU11がリクエストを発行からリプライ
を受け取るまで)は50Tで完了となる。尚、以上の本
実施の形態の説明において、 1.配列NODE1(I)を計算ノード1にマッピン
グ、配列NODE2(I+J)とフラグNODE2_F
LAGを計算ノード2にマッピングして説明したが、マ
ッピングする計算ノードに制限はない。
1. CPU (11, 21) / MMU (1
1. Latency between 2, 22): 1T 2. Latency between MMU (12, 22) / RCU (13, 23): 1T 3. Network (between RCU13 / RCU23) Latency: 6T At this time, in the configuration example of the present invention, the test-and-copy processing (from when the CPU 11 issues a request to when it receives a reply) is completed in 50T. In the above description of the present embodiment, Array NODE1 (I) is mapped to computation node 1, array NODE2 (I + J) and flag NODE2_F
Although the LAG is mapped to the calculation node 2, the calculation node to be mapped is not limited.

【0038】2.親プロセスは計算ノード1のCPUで
あるとして説明したが、この親プロセスの割り当てに制
限はない。
2. Although the parent process has been described as being the CPU of the computing node 1, there is no limitation on the allocation of the parent process.

【0039】3.ネットワークに接続される計算ノード
は2つとして説明したが、これらの数に制限はない。
3. Although the number of computing nodes connected to the network has been described as two, these numbers are not limited.

【0040】4.1つの計算ノード内は1つのCPUで
構成されるとして説明したが、これらの数に制限はな
い。つまり、ノード内はマルチCPUによる共有メモリ
型でもよい。
4. Although the description has been made assuming that one computation node is constituted by one CPU, the number is not limited. That is, the inside of the node may be a shared memory type using multiple CPUs.

【0041】5.各ユニット間のレイテンシ、ユニット
内のレイテンシを固定値を用いて説明したが、これらの
値に制限はない。
5. Although the latencies between the units and the latencies within the units have been described using fixed values, these values are not limited.

【0042】6.コマンド・アドレス退避バッファの容
量に制限はない。
6. There is no limit on the capacity of the command / address saving buffer.

【0043】7.データ退避バッファの容量に制限はな
い。
7. There is no limit on the capacity of the data save buffer.

【0044】図4は、本発明の他の実施の形態における
RCU部23(及び13)の構成例を示す図、図5は、
他の実施の形態の動作を説明するためにタイムチャート
である。
FIG. 4 is a diagram showing a configuration example of the RCU unit 23 (and 13) according to another embodiment of the present invention, and FIG.
9 is a time chart for explaining the operation of another embodiment.

【0045】本発明の第一の実施の形態との差分は、こ
のRCU部23(及び13)のみである。また、RCU
部としての基本構成は変わらないので、発明の特徴であ
る、コマンド・アドレス退避バッファ2311、セレク
タ2312、繰り返し制御部2313のみについて説明
する。
The difference from the first embodiment of the present invention is only the RCU 23 (and 13). Also, RCU
Since the basic configuration as a unit does not change, only the command / address saving buffer 2311, selector 2312, and repetition control unit 2313, which are features of the present invention, will be described.

【0046】コマンド・アドレス退避バッファ2311
は、テスト命令におけるMMU22アクセス時のコマン
ドとアドレスを退避しておくためにバッファであり、こ
れによりMMU22に対するテストリトライ処理(NO
DE2_FLAGのチェック)の繰り返し発行が可能と
なる。セレクタ2312は、通常、アドレス変換部23
04を選択しているが、テスト命令における、テストリ
トライ処理時のみコマンド・アドレス退避バッファ23
11を選択する。繰り返し制御部2313は、テスト命
令のテストリトライ処理において、MMU22から返却
される結果をチェックしセレクタ2312の選択方向を
切り替えるものである。セレクタ2312の切り替え論
理は、上記セレクタ2312の説明に従う。
Command / address saving buffer 2311
Is a buffer for saving a command and an address at the time of access to the MMU 22 in a test instruction.
DE2_FLAG) can be repeatedly issued. The selector 2312 is usually
04 is selected, but the command / address saving buffer 23 is used only during the test retry processing in the test instruction.
Select 11. The repetition control unit 2313 checks the result returned from the MMU 22 and switches the selection direction of the selector 2312 in the test retry processing of the test instruction. The switching logic of the selector 2312 follows the description of the selector 2312.

【0047】次に、図5を元に(図1と図4も参照)、
発明の他の実施の形態における分散メモリ型並列計算機
のテストアンドコピー動作について説明する。
Next, based on FIG. 5 (see also FIGS. 1 and 4),
A test and copy operation of the distributed memory type parallel computer according to another embodiment of the present invention will be described.

【0048】まず、ローカルノード1において、CPU
11からRCU13に対して、リモートメモリ(MMU
22)に対するテストアンドコピー命令が発行される。
RCU13では、テストアンドコピー命令をリクエスト
受付部1301で受け付け、テスト命令とコピー命令と
に分解する。テスト命令は競合調停部1303で競合調
停後、アドレス変換部1304において、物理ノード番
号変換/リモートJOB番号変換され、リクエスト/デ
ータ送出部1305からRCU23(Network
3)に送出される。コピー命令はRCU23からテスト
終了リプライが返却されるまでリクエスト受付部130
1において保持しておく。
First, in the local node 1, the CPU
11 to the RCU 13 using the remote memory (MMU
A test and copy instruction for 22) is issued.
In the RCU 13, the test and copy command is received by the request receiving unit 1301, and is decomposed into a test command and a copy command. The test instruction is subjected to contention arbitration in the contention arbitration unit 1303, and is then subjected to physical node number conversion / remote JOB number conversion in the address conversion unit 1304.
Sent to 3). The copy instruction is sent to the request receiving unit 130 until the RCU 23 returns a test end reply.
It is kept at 1.

【0049】次に、リモートノード2において、RCU
23はRCU13(Network3経由)よりテスト
命令をリクエスト受付部2301で受け付け、競合調停
部2303において競合調停後、アドレス変換部230
4において物理アドレス変換し、コマンド・アドレス退
避バッファ2311に格納するのと同時に、MMU22
に発行する。MMU22では結果を繰り返し制御部23
13に返し、テスト失敗(NODE2_FLAG=0)
ならば、コマンド・アドレス退避バッファ2311に格
納してあるテスト命令をMMU22に繰り返し発行す
る。図5では、24T目にNODE2_FLAG=1と
なるので、8回失敗した後9回目で成功となる。このタ
イミングでリクエスト/データ送出部2305より、テ
スト終了リプライをNetwork3経由でRCU13
に返却する。
Next, in the remote node 2, the RCU
23 receives a test instruction from the RCU 13 (via Network 3) in the request receiving unit 2301, and after the contention arbitration in the contention arbitration unit 2303, the address conversion unit 230.
4, the MMU 22 converts the physical address and stores it in the command / address saving buffer 2311.
Issue to The MMU 22 repeatedly repeats the result.
13 and the test failed (NODE2_FLAG = 0)
If so, the test instruction stored in the command / address saving buffer 2311 is repeatedly issued to the MMU 22. In FIG. 5, since NODE2_FLAG = 1 at 24T, success is achieved at the ninth time after eight failures. At this timing, the request / data transmission unit 2305 sends a test end reply to the RCU 13 via the network 3.
Return to.

【0050】次に、RCU13ではテスト終了リプライ
をリクエスト受付部1301で受理し、保持しておいた
コピー命令を、競合調停部1303において競合調停
後、アドレス変換部1304において物理アドレスに変
換しMMU12に送出する。そして、コピー命令とMM
U12からのロード(コピー)データを一緒にしてリク
エスト/データ送出部1305より、RCU23(Ne
twork3)に送出する。
Next, in the RCU 13, the test end reply is received by the request receiving unit 1301, the held copy instruction is subjected to contention arbitration in the contention arbitration unit 1303, and then converted to a physical address in the address conversion unit 1304 and sent to the MMU 12 Send out. And the copy instruction and MM
The request / data sending unit 1305 combines the load (copy) data from the U12 and the RCU23 (Ne)
send to Twork3).

【0051】RCU23では、コピー命令とコピーデー
タをリクエスト受付部2301とデータ受付部2302
で受け付け、コピー命令の競合調停と物理アドレス変換
を競合調停部2303とアドレス変換部2304で実行
した後、コピー命令(コマンドとアドレス)とコピーデ
ータをMMU22に送出しライト(コピー)を行う。R
CU23は、RCU13からのデータ転送とMMU22
へのライト動作が正常終了したことの通知(コピー終了
リプライ)をリクエスト/データ送出部2305からN
etwork3経由でRCU13に送り付け、RCU1
3は本リプライをCPU11に返却して一連の動作が完
了する。
The RCU 23 transmits a copy command and copy data to the request receiving unit 2301 and the data receiving unit 2302.
After the contention arbitration and physical address conversion of the copy instruction are executed by the contention arbitration unit 2303 and the address conversion unit 2304, the copy instruction (command and address) and the copy data are sent to the MMU 22 to perform write (copy). R
The CU 23 transfers data from the RCU 13 and the MMU 22
The request / data sending unit 2305 sends a notification (copy end reply) that the write operation to the
Send to RCU13 via network3, RCU1
3 returns this reply to the CPU 11 to complete a series of operations.

【0052】図4における構成例では、テストアンドコ
ピー処理(CPU11がリクエストを発行からリプライ
を受け取るまで)は64Tで完了となる。
In the configuration example shown in FIG. 4, the test and copy process (from when the CPU 11 issues a request to when it receives a reply) is completed in 64T.

【0053】本他の実施の形態では、第一の実施の形態
に比べてテストアンドコピー処理は遅くなるが、その分
データ退避バッファ2314(データ退避バッファ13
14)が不要になり、どちらを選択するかは、システム
の運用条件による。
In the other embodiment, the test and copy processing is slower than in the first embodiment, but the data save buffer 2314 (data save buffer 13
14) becomes unnecessary, and which one to select depends on the operating conditions of the system.

【0054】また、本願発明は、分散メモリ型並列計算
機のテストアンドコピー動作だけではなく、排他制御の
一般論理にも応用できることはいうまでもない。例え
ば、ディスクに対する書き込み動作の高速化にも応用可
能である。
Further, it goes without saying that the present invention can be applied not only to the test and copy operation of the distributed memory type parallel computer, but also to general logic of exclusive control. For example, the present invention can be applied to speeding up a write operation on a disk.

【0055】[0055]

【発明の効果】以上説明したように、本発明は、 1.新設のテストアンドコピー命令によりテスト命令と
コピー命令を計算ノード1のCPUから同時に発行し、
テスト命令とコピー命令及びコピーデータを計算ノード
2へ同時に転送し、計算ノード2においてテスト命令実
行終了後にすぐにコピー命令を実行させる。
As described above, the present invention provides: A test instruction and a copy instruction are simultaneously issued from the CPU of the computation node 1 by a newly established test and copy instruction,
The test instruction, the copy instruction, and the copy data are transferred to the calculation node 2 at the same time.

【0056】2.テスト命令のリトライシーケンスを計
算ノード2の中に閉じて実行させる(成功するまでテス
ト終了リプライを計算ノード1に返さない)。
2. The retry sequence of the test instruction is closed in the calculation node 2 and executed (the test end reply is not returned to the calculation node 1 until the test node succeeds).

【0057】ようにしたことにより、コピー命令及びコ
ピーデータの転送時間が、テスト命令のレイテンシに隠
蔽され、また、テスト命令における計算ノード間のリト
ライによるターンアラウンドタイムが大幅に短縮され、
その結果、分散メモリ型並列計算機におけるテストアン
ドコピー処理が大幅に高速化される効果がある。
By doing so, the transfer time of the copy instruction and the copy data is hidden by the latency of the test instruction, and the turnaround time due to the retry between the calculation nodes in the test instruction is greatly reduced.
As a result, there is an effect that the test and copy processing in the distributed memory type parallel computer is greatly speeded up.

【図面の簡単な説明】[Brief description of the drawings]

【図1】分散メモリ型並列計算機のブロック図である。FIG. 1 is a block diagram of a distributed memory parallel computer.

【図2】本発明の一実施の形態におけるRCU部23
(及び13)の構成例を示すブロック図である。
FIG. 2 shows an RCU 23 according to an embodiment of the present invention.
It is a block diagram showing an example of composition of (and 13).

【図3】本発明の一実施の形態の動作を説明するための
タイムチャートである。
FIG. 3 is a time chart for explaining the operation of the embodiment of the present invention.

【図4】本発明の他の実施の形態におけるRCU部23
(及び13)の構成例を示す図である。
FIG. 4 shows an RCU unit 23 according to another embodiment of the present invention.
It is a figure showing the example of composition of (and 13).

【図5】他の実施の形態の動作を説明するためにタイム
チャートである。
FIG. 5 is a time chart for explaining an operation of another embodiment.

【図6】従来技術のRCU部23(及び13)の構成例
を示すブロック図である。
FIG. 6 is a block diagram showing a configuration example of a conventional RCU unit 23 (and 13).

【図7】従来技術の動作を説明するためのタイムチャー
トである。
FIG. 7 is a time chart for explaining the operation of the conventional technique.

【符号の説明】[Explanation of symbols]

1,2 ノード 3 Network 11,21 CPU 12,22 MMU 13,23 RCU 1301,2301 リクエスト受付部 1302,2302 データ受付部 1303,2303 競合調停部 1304,2304 アドレス変換部 1305,2305 リクエスト/データ送出部 1311,2311 コマンド・アドレス退避バッフ
ァ 1312,2312 セレクタ 1313,2313 繰り返し制御部 1314,2314 データ退避バッファ 1315,2315 セレクタ
1, 2 node 3 Network 11, 21 CPU 12, 22, MMU 13, 23 RCU 1301, 301 Request reception unit 1302, 2302 Data reception unit 1303, 2303 Competition arbitration unit 1304, 2304 Address conversion unit 1305, 2305 Request / data transmission unit 1311, 2311 Command / address saving buffer 1312, 2312 selector 1313, 2313 Repetition control unit 1314, 2314 Data saving buffer 1315, 2315 selector

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 ネットワークにおける複数のノードを構
成する分散メモリ型並列計算機におけるリモートメモリ
に対するテストアンドコピーの処理方式において、テス
ト命令とコピー命令及びコピーデータを続けて送出する
第一のノードと、前記テスト命令と前記コピー命令及び
コピーデータを受信すると自ノード内の前記リモートメ
モリに対する該テスト命令を実行し、該テスト命令の実
行後に前記コピー命令により前記コピーデータを前記リ
モートメモリにコピーする第二のノードを具備すること
を特徴とする分散メモリ型並列計算機におけるリモート
メモリに対するテストアンドコピーの処理方式。
In a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, a first node for continuously transmitting a test instruction, a copy instruction, and copy data; When receiving the test command, the copy command and the copy data, the test command for the remote memory in the own node is executed, and after the execution of the test command, the copy command copies the copy data to the remote memory. A test and copy processing method for a remote memory in a distributed memory type parallel computer, comprising a node.
【請求項2】 前記第二のノードは、前記リモートメモ
リに対する該テスト命令を自ノード内で該命令が成功す
るまで繰り返し実行することを特徴とする請求項1記載
の分散メモリ型並列計算機におけるリモートメモリに対
するテストアンドコピーの処理方式。
2. The remote memory-type parallel computer according to claim 1, wherein the second node repeatedly executes the test instruction for the remote memory in the own node until the instruction succeeds. Test and copy processing method for memory.
【請求項3】 ネットワークにおける複数のノードを構
成する分散メモリ型並列計算機におけるリモートメモリ
に対するテストアンドコピーの処理方式において、前記
各ノードはCPU(中央演算装置)、MMU(主記憶装
置)、RCU(遠隔制御装置)を含んで構成され、第一
のノードにおける第一のRCUは、第一のCPUからテ
ストアンドコピー命令を受けると該命令をテスト命令と
コピー命令に分解し該テスト命令を第二のノードにおけ
る第二のRCUに送出し続いて前記コピー命令と第一の
MMUからのコピーデータを一緒にして前記第二のRC
Uに送出する送出手段を具備し、前記第二のノードにお
ける前記第二のRCUは、受信した前記テスト命令及び
前記コピー命令を格納するコマンド・アドレス退避バッ
ファと、受信した前記コピーデータを格納するデータ退
避バッファと、前記テスト命令が成功するまで該テスト
命令を前記コマンド・アドレス退避バッファから取り出
して第二のMMUに発行することを繰り返し該テスト命
令が成功すると該コマンド・アドレス退避バッファから
前記コピー命令を取り出すとともに前記データ退避バッ
ファから前記コピーデータを取り出し前記第二のMMU
に発行する繰り返し制御部とを具備することを特徴とす
る分散メモリ型並列計算機におけるリモートメモリに対
するテストアンドコピーの処理方式。
3. In a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, each of the nodes includes a CPU (Central Processing Unit), an MMU (Main Storage Unit), an RCU ( The first RCU in the first node receives a test and copy instruction from the first CPU, decomposes the instruction into a test instruction and a copy instruction, and divides the test instruction into a second instruction. The copy command and the copy data from the first MMU together to send the second RC
U, and the second RCU in the second node stores a command / address saving buffer for storing the received test command and the copy command, and stores the received copy data. The data save buffer and the step of repeatedly taking out the test instruction from the command address save buffer and issuing it to the second MMU until the test instruction succeeds are repeated, and when the test instruction succeeds, the copy is executed from the command address save buffer. Fetching an instruction and fetching the copy data from the data saving buffer;
And a repetition control unit for issuing a test and copy to a remote memory in a distributed memory type parallel computer.
【請求項4】 ネットワークにおける複数のノードを構
成する分散メモリ型並列計算機におけるリモートメモリ
に対するテストアンドコピーの処理方式において、テス
ト命令を送出するとともにテスト終了リプライを受信後
にコピー命令及びコピーデータを続けて送出する第一の
ノードと、前記テスト命令を受信すると自ノード内の前
記リモートメモリに対する該テスト命令を実行し該テス
ト命令の実行後に前記テスト終了リプライを送出し該テ
スト終了リプライ送出に応じて前記コピー命令及びコピ
ーデータを受信し前記コピー命令により前記コピーデー
タを前記リモートメモリにコピーする第二のノードを具
備することを特徴とする分散メモリ型並列計算機におけ
るリモートメモリに対するテストアンドコピーの処理方
式。
4. In a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, a test instruction is transmitted, and a copy instruction and copy data are continuously transmitted after receiving a test end reply. A first node to transmit, upon receiving the test instruction, executing the test instruction for the remote memory in the own node, transmitting the test end reply after executing the test instruction, and responding to the test end reply according to the transmission of the test end reply. A test and copy processing method for a remote memory in a distributed memory type parallel computer, comprising: a second node that receives a copy instruction and copy data and copies the copy data to the remote memory according to the copy instruction.
【請求項5】 前記第二のノードは、前記リモートメモ
リに対する該テスト命令を自ノード内で該命令が成功す
るまで繰り返し実行することを特徴とする請求項4記載
の分散メモリ型並列計算機におけるリモートメモリに対
するテストアンドコピーの処理方式。
5. The remote memory type parallel computer according to claim 4, wherein the second node repeatedly executes the test instruction for the remote memory in the own node until the instruction succeeds. Test and copy processing method for memory.
【請求項6】 ネットワークにおける複数のノードを構
成する分散メモリ型並列計算機におけるリモートメモリ
に対するテストアンドコピーの処理方式において、前記
各ノードはCPU(中央演算装置)、MMU(主記憶装
置)、RCU(遠隔制御装置)を含んで構成され、第一
のノードにおける第一のRCUは、第一のCPUからテ
ストアンドコピー命令を受けると該命令をテスト命令と
コピー命令に分解し該テスト命令を第二のノードにおけ
る第二のRCUに送出しテスト終了リプライを受信後に
前記コピー命令と第一のMMUからのコピーデータを一
緒にして前記第二のRCUに送出する送出手段を具備
し、前記第二のノードにおける前記第二のRCUは、受
信した前記テスト命令を格納するコマンド・アドレス退
避バッファと、前記テスト命令が成功するまで該テスト
命令を前記コマンド・アドレス退避バッファから取り出
して第二のMMUに発行することを繰り返し該テスト命
令が成功すると前記テスト終了リプライを送出する繰り
返し制御部と、該テスト終了リプライ送出に応じて前記
コピー命令及びコピーデータを受信し該コピー命令及び
コピーデータを前記第二のMMUに発行する制御手段を
具備することを特徴とする分散メモリ型並列計算機にお
けるリモートメモリに対するテストアンドコピーの処理
方式。
6. In a test and copy processing method for a remote memory in a distributed memory type parallel computer constituting a plurality of nodes in a network, each of the nodes includes a CPU (Central Processing Unit), an MMU (Main Storage Unit), an RCU ( The first RCU in the first node receives a test and copy instruction from the first CPU, decomposes the instruction into a test instruction and a copy instruction, and divides the test instruction into a second instruction. Sending means for sending to the second RCU together with the copy command and copy data from the first MMU after receiving the test end reply to the second RCU in the second node; The second RCU in the node includes a command address save buffer for storing the received test instruction, A repetition control unit that sends out the test end reply when the test instruction succeeds by repeatedly taking out the test instruction from the command / address save buffer and issuing the test instruction to the second MMU until the test instruction succeeds; And a control means for receiving the copy command and the copy data in response to the reply transmission and issuing the copy command and the copy data to the second MMU. Copy processing method.
JP10281112A 1998-10-02 1998-10-02 Processing system for test and copy against remote memory in distributed memory-type parallel computer Pending JP2000112912A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10281112A JP2000112912A (en) 1998-10-02 1998-10-02 Processing system for test and copy against remote memory in distributed memory-type parallel computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10281112A JP2000112912A (en) 1998-10-02 1998-10-02 Processing system for test and copy against remote memory in distributed memory-type parallel computer

Publications (1)

Publication Number Publication Date
JP2000112912A true JP2000112912A (en) 2000-04-21

Family

ID=17634529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10281112A Pending JP2000112912A (en) 1998-10-02 1998-10-02 Processing system for test and copy against remote memory in distributed memory-type parallel computer

Country Status (1)

Country Link
JP (1) JP2000112912A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970911B2 (en) 2000-02-23 2005-11-29 Nec Corporation Distributed memory type parallel computer and write data transfer end confirming method thereof
US7336657B2 (en) 2001-07-31 2008-02-26 Nec Corporation Inter-nodal data transfer system and data transfer apparatus
TWI421874B (en) * 2009-07-08 2014-01-01 Inventec Corp Method of remotely assisting memory test
CN105116244A (en) * 2015-07-20 2015-12-02 柳州好顺科技有限公司 Electronic product testing device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970911B2 (en) 2000-02-23 2005-11-29 Nec Corporation Distributed memory type parallel computer and write data transfer end confirming method thereof
US7336657B2 (en) 2001-07-31 2008-02-26 Nec Corporation Inter-nodal data transfer system and data transfer apparatus
TWI421874B (en) * 2009-07-08 2014-01-01 Inventec Corp Method of remotely assisting memory test
CN105116244A (en) * 2015-07-20 2015-12-02 柳州好顺科技有限公司 Electronic product testing device

Similar Documents

Publication Publication Date Title
US3940743A (en) Interconnecting unit for independently operable data processing systems
US5434970A (en) System for distributed multiprocessor communication
JP3645281B2 (en) Multiprocessor system having shared memory
KR100286962B1 (en) Cache controller
US4586133A (en) Multilevel controller for a cache memory interface in a multiprocessing system
JPH04308956A (en) Receiving buffer
JPS6327738B2 (en)
JP5360061B2 (en) Multiprocessor system and control method thereof
US6035376A (en) System and method for changing the states of directory-based caches and memories from read/write to read-only
CN109992539B (en) Double-host cooperative working device
JP2003271574A (en) Data communication method for shared memory type multiprocessor system
JP2000112912A (en) Processing system for test and copy against remote memory in distributed memory-type parallel computer
JP3789937B2 (en) Chunk chain for vector processors
US20080295120A1 (en) Asynchronous remote procedure calling method and computer product in shared-memory multiprocessor
US5638538A (en) Turbotable: apparatus for directing address and commands between multiple consumers on a node coupled to a pipelined system bus
JP3667585B2 (en) Distributed memory type parallel computer and its data transfer completion confirmation method
JPH08212178A (en) Parallel computer
JPH0689247A (en) Data communication, processing system and data communication processing method
JP2004013868A (en) Information processing unit and cache flash control method used in the same
JPH1185673A (en) Method and device for controlling shared bus
JPS598845B2 (en) Channel control method
JPH11167546A (en) Bus control system and multi processor system having the control system
WO2011030498A1 (en) Data processing device and data processing method
KR920004404B1 (en) Stack system
JP2785738B2 (en) Distributed memory multiprocessor information processing system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030708