JPH08329020A - 並列計算機 - Google Patents
並列計算機Info
- Publication number
- JPH08329020A JPH08329020A JP13221495A JP13221495A JPH08329020A JP H08329020 A JPH08329020 A JP H08329020A JP 13221495 A JP13221495 A JP 13221495A JP 13221495 A JP13221495 A JP 13221495A JP H08329020 A JPH08329020 A JP H08329020A
- Authority
- JP
- Japan
- Prior art keywords
- register
- arithmetic
- lock
- control
- parallel computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】各プロセッサに閉じた同期待ちを行なわせるこ
とにより通信レジスタアクセス競合を低減させて同期制
御、排他制御を高速化できる並列計算機の提供。 【構成】同期制御に入ったプロセッサから送出され通信
レジスタ装置に供給されたリクエストパケットはリクエ
ストパケット制御部301でロックビット部302のロ
ックビットを1にし、その後、自演算プロセッサ内の演
算レジスタによりサスペンド処理を行ない、ロック解除
の際にはロックビットが1から0になることを検出して
ロック解除を示す割り込みリプライパケットをロックビ
ット部302で生成してリプライパケット制御部304
より各演算プロセッサに供給され、各演算プロセッサは
それによりロック解除処理を行なう。
とにより通信レジスタアクセス競合を低減させて同期制
御、排他制御を高速化できる並列計算機の提供。 【構成】同期制御に入ったプロセッサから送出され通信
レジスタ装置に供給されたリクエストパケットはリクエ
ストパケット制御部301でロックビット部302のロ
ックビットを1にし、その後、自演算プロセッサ内の演
算レジスタによりサスペンド処理を行ない、ロック解除
の際にはロックビットが1から0になることを検出して
ロック解除を示す割り込みリプライパケットをロックビ
ット部302で生成してリプライパケット制御部304
より各演算プロセッサに供給され、各演算プロセッサは
それによりロック解除処理を行なう。
Description
【0001】
【産業上の利用分野】本発明は並列計算機に関し、特に
複数個の演算プロセッサからなる演算処理装置、通信レ
ジスタおよびそれらを結合する相互結合網より構成され
るマルチプロセッサ構成の並列計算機に関する。
複数個の演算プロセッサからなる演算処理装置、通信レ
ジスタおよびそれらを結合する相互結合網より構成され
るマルチプロセッサ構成の並列計算機に関する。
【0002】
【従来の技術】複数個の演算プロセッサより構成される
並列計算機においては、主記憶装置と比較してアクセス
タイムが高速である記憶装置、または主記憶装置と比較
してアクセススループットが大きい記憶装置、または双
方の利点を兼ねそなえた記憶装置を持たせることによ
り、各プロセッサはこの記憶装置にアクセスすることに
より、各種制御の処理時間を低減させることができる。
並列計算機においては、主記憶装置と比較してアクセス
タイムが高速である記憶装置、または主記憶装置と比較
してアクセススループットが大きい記憶装置、または双
方の利点を兼ねそなえた記憶装置を持たせることによ
り、各プロセッサはこの記憶装置にアクセスすることに
より、各種制御の処理時間を低減させることができる。
【0003】例えば、2個の演算プロセッサ間で、共有
変数へのリード/ライト処理を介して通信を行なう場
合、アクセスタイムの速い記憶装置(この記憶装置を以
下通信レジスタと呼ぶことにする)を介するほうが、主
記憶装置を介するより、通信処理は高速に実行できる。
例えば、特開平2−116949号公報、特開平2−1
16952号公報および特開平4−107669号公報
にこれらの技術が開示されている。
変数へのリード/ライト処理を介して通信を行なう場
合、アクセスタイムの速い記憶装置(この記憶装置を以
下通信レジスタと呼ぶことにする)を介するほうが、主
記憶装置を介するより、通信処理は高速に実行できる。
例えば、特開平2−116949号公報、特開平2−1
16952号公報および特開平4−107669号公報
にこれらの技術が開示されている。
【0004】同期制御、排他制御、通信制御は、並列計
算機で実行する並列処理において、並列実行が十分にな
されない所であり、高並列になるにしたがい、これら制
御の全体の性能に及ぼす影響は非常に大きくなる。
算機で実行する並列処理において、並列実行が十分にな
されない所であり、高並列になるにしたがい、これら制
御の全体の性能に及ぼす影響は非常に大きくなる。
【0005】従って、これら制御の処理時間を低減する
ことを目的とする通信レジスタ構成が、並列計算機の性
能向上に及ぼす効果は非常に大きいものである。
ことを目的とする通信レジスタ構成が、並列計算機の性
能向上に及ぼす効果は非常に大きいものである。
【0006】ここで同期制御の制御例としてバリア同期
について述べる。バリア同期とは、全プロセッサがバリ
ア同期ルーチンを実行するまで、各プロセッサがこのル
ーチンで待ち合わせをする処理のことであり、以下にそ
のルーチンを示す。但し、初期値としてワード#0の通
信レジスタにはバリア同期を行なう演算プロセッサ数を
nとすれば(n−1)が格納され、ワード#1の通信レ
ジスタには非零値、また、各演算プロセッサ内にある演
算レジスタであるスカラレジスタS0、S1、S2のう
ちスカラレジスタS1には0値が格納されているものと
する。
について述べる。バリア同期とは、全プロセッサがバリ
ア同期ルーチンを実行するまで、各プロセッサがこのル
ーチンで待ち合わせをする処理のことであり、以下にそ
のルーチンを示す。但し、初期値としてワード#0の通
信レジスタにはバリア同期を行なう演算プロセッサ数を
nとすれば(n−1)が格納され、ワード#1の通信レ
ジスタには非零値、また、各演算プロセッサ内にある演
算レジスタであるスカラレジスタS0、S1、S2のう
ちスカラレジスタS1には0値が格納されているものと
する。
【0007】 各命令の意味は以下の通りである。
【0008】FDCR S0,CR#0:#0ワードの
通信レジスタの値をスカラレジスタS0に格納すると共
に、#0ワードの通信レジスタの値を1減ずる BL S0,loop1:スカラレジスタS0の値が0
値を越えるならばloop1に分岐する LCR S2,CR#1:#1ワードの通信レジスタの
値をスカラレジスタS2に格納する BNE S2,loop1:スカラレジスタS2の値が
0値以外ならばloop1に分岐する SCR S1,CR#1:スカラレジスタS1の値を#
1ワードの通信レジスタに格納する B loopend:無条件にloopendにジャン
プする。
通信レジスタの値をスカラレジスタS0に格納すると共
に、#0ワードの通信レジスタの値を1減ずる BL S0,loop1:スカラレジスタS0の値が0
値を越えるならばloop1に分岐する LCR S2,CR#1:#1ワードの通信レジスタの
値をスカラレジスタS2に格納する BNE S2,loop1:スカラレジスタS2の値が
0値以外ならばloop1に分岐する SCR S1,CR#1:スカラレジスタS1の値を#
1ワードの通信レジスタに格納する B loopend:無条件にloopendにジャン
プする。
【0009】各プロセッサがバリア同期ルーチンに入る
とまず、通信レジスタワード#0の値をデクリメントす
る。#0ワードには(n−1)が初期値として入ってい
るので、(n−1)個のプロセッサがこのルーチンに入
れば#0ワードの値は0値になる。最後にこのルーチン
に入ったプロセッサ以外はloop1に飛び、最後のプ
ロセッサがルーチンに入るまで、ここのループで待つこ
とになる。最後のプロセッサか否かはFDCR命令が読
んできた#0ワードの値を見れば判別でき、最後ならば
#1ワードは零値であるので、これを通知することによ
りバリア同期制御が完了する。
とまず、通信レジスタワード#0の値をデクリメントす
る。#0ワードには(n−1)が初期値として入ってい
るので、(n−1)個のプロセッサがこのルーチンに入
れば#0ワードの値は0値になる。最後にこのルーチン
に入ったプロセッサ以外はloop1に飛び、最後のプ
ロセッサがルーチンに入るまで、ここのループで待つこ
とになる。最後のプロセッサか否かはFDCR命令が読
んできた#0ワードの値を見れば判別でき、最後ならば
#1ワードは零値であるので、これを通知することによ
りバリア同期制御が完了する。
【0010】
【発明が解決しようとする課題】上述した従来の通信レ
ジスタ装置付きの並列計算機においては、複数個の演算
プロセッサが発行する複数個の通信レジスタアクセスリ
クエストのうち、通信レジスタ装置にアクセスできるリ
クエストの個数は同時には1つに限られる。このこと
が、通信レジスタを用いた同期、排他、通信制御におい
て大きなオーバヘッドを生む要因になりうることがあ
る。
ジスタ装置付きの並列計算機においては、複数個の演算
プロセッサが発行する複数個の通信レジスタアクセスリ
クエストのうち、通信レジスタ装置にアクセスできるリ
クエストの個数は同時には1つに限られる。このこと
が、通信レジスタを用いた同期、排他、通信制御におい
て大きなオーバヘッドを生む要因になりうることがあ
る。
【0011】このような例として、上記のバリア同期ル
ーチンがある。
ーチンがある。
【0012】この場合、最後のプロセッサを除くプロセ
ッサは、FDCR命令アクセスした後、loop1内の
LCR命令アクセスを、最後のプロセッサが#1ワード
の値が零値であることを読み取るまで繰り返し実行する
ことになる。この繰り返し実行のことをスピンロックと
言う。
ッサは、FDCR命令アクセスした後、loop1内の
LCR命令アクセスを、最後のプロセッサが#1ワード
の値が零値であることを読み取るまで繰り返し実行する
ことになる。この繰り返し実行のことをスピンロックと
言う。
【0013】スピンロックはルーチンに入った各演算プ
ロセッサ全てが実行するので、通信レジスタアクセスが
集中することになり、大きなアクセス競合が発生する。
このアクセス競合により、新たにバリア同期ルーチンに
入った演算プロセッサが実行するFDCR命令アクセス
が、最悪のケースではスピンロックしている既にバリア
同期待ちをしている演算プロセッサ分待たされてしまう
ことになる。
ロセッサ全てが実行するので、通信レジスタアクセスが
集中することになり、大きなアクセス競合が発生する。
このアクセス競合により、新たにバリア同期ルーチンに
入った演算プロセッサが実行するFDCR命令アクセス
が、最悪のケースではスピンロックしている既にバリア
同期待ちをしている演算プロセッサ分待たされてしまう
ことになる。
【0014】簡単にこのバリア同期の処理時間を求める
と、最初にルーチンに入ったプロセッサの待ちは0T、
次に入ったプロセッサの待ちは1T、その次のプロセッ
サの待ちは2Tとなる等差数列的に待ち時間は増えてい
くことになるため、これらの総和となるバリア同期ルー
チンの処理時間はnの2乗オーダになってしまう。
と、最初にルーチンに入ったプロセッサの待ちは0T、
次に入ったプロセッサの待ちは1T、その次のプロセッ
サの待ちは2Tとなる等差数列的に待ち時間は増えてい
くことになるため、これらの総和となるバリア同期ルー
チンの処理時間はnの2乗オーダになってしまう。
【0015】この性能低下の最大の要因は、各演算プロ
セッサが実行するスピンロックによるものであり、高並
列になるに従い、よりクリテイカルになるバリア同期処
理が、このように並列度か増す毎にオーバヘッドが大き
く増加すようでは、並列計算機の性能として致命的にな
るという欠点がある。
セッサが実行するスピンロックによるものであり、高並
列になるに従い、よりクリテイカルになるバリア同期処
理が、このように並列度か増す毎にオーバヘッドが大き
く増加すようでは、並列計算機の性能として致命的にな
るという欠点がある。
【0016】本発明の目的は、各プロセッサに閉じた同
期待ちを行なわせることにより通信レジスタアクセス競
合を格段に低減させて同期制御、排他制御を高速化でき
る並列計算機を提供することにある。
期待ちを行なわせることにより通信レジスタアクセス競
合を格段に低減させて同期制御、排他制御を高速化でき
る並列計算機を提供することにある。
【0017】
【課題を解決するための手段】第1の発明の並列計算機
は、複数の演算プロセッサと主記憶装置と通信レジスタ
装置とこれら各装置の相互接続を行なう相互結合網とを
有するマルチプロセッサ構成の並列計算機において、前
記通信レジスタ装置は供給されるリクエストパケットに
より読み出し書き込みが行なわれ同期制御処理中や排他
制御処理中であるときには2値信号中の1方の特定値を
とるロックビットを格納しその値が2値信号中の1方の
特定値から他方の特定値に変化したときにはロック解除
を示す割り込みリプライパケットを生成するロックビッ
ト制御手段と、複数のワードから構成され供給されるリ
クエストパケットにより読み出し書き込みが行なわれる
通信レジスタ手段と、前記相互結合網を介して前記演算
プロセッサから供給されるリクエストパケットを受信し
そのリクエストパケットの指示に応じてこれを前記ロッ
クビット格納手段または前記通信レジスタ手段に供給す
るリクエストパケット制御手段と、前記ロックビット制
御手段からの割り込みリプライパケットと前記通信レジ
スタ手段からの応答リプライパケットとの供給を受け前
記相互結合網に供給するリプライパケット制御手段とを
含んで構成され、同期制御や排他制御に関連する前記演
算プロセッサは前記ロックビットが2値信号中の1方の
特定値のときには自演算プロセッサ内の演算レジスタに
よりサスペンド処理を行ない前記割り込みリプライパケ
ットの受信に応答してロック解除の割り込み処理を行な
うことを特徴としている。
は、複数の演算プロセッサと主記憶装置と通信レジスタ
装置とこれら各装置の相互接続を行なう相互結合網とを
有するマルチプロセッサ構成の並列計算機において、前
記通信レジスタ装置は供給されるリクエストパケットに
より読み出し書き込みが行なわれ同期制御処理中や排他
制御処理中であるときには2値信号中の1方の特定値を
とるロックビットを格納しその値が2値信号中の1方の
特定値から他方の特定値に変化したときにはロック解除
を示す割り込みリプライパケットを生成するロックビッ
ト制御手段と、複数のワードから構成され供給されるリ
クエストパケットにより読み出し書き込みが行なわれる
通信レジスタ手段と、前記相互結合網を介して前記演算
プロセッサから供給されるリクエストパケットを受信し
そのリクエストパケットの指示に応じてこれを前記ロッ
クビット格納手段または前記通信レジスタ手段に供給す
るリクエストパケット制御手段と、前記ロックビット制
御手段からの割り込みリプライパケットと前記通信レジ
スタ手段からの応答リプライパケットとの供給を受け前
記相互結合網に供給するリプライパケット制御手段とを
含んで構成され、同期制御や排他制御に関連する前記演
算プロセッサは前記ロックビットが2値信号中の1方の
特定値のときには自演算プロセッサ内の演算レジスタに
よりサスペンド処理を行ない前記割り込みリプライパケ
ットの受信に応答してロック解除の割り込み処理を行な
うことを特徴としている。
【0018】第2の発明の並列計算機は、第1の発明の
並列計算機において、各演算プロセッサにそれぞれ専用
のロックインレジスタを設け自演算プロセッサ内の演算
レジスタに代えて前記ロックインレジスタによりサスペ
ンド処理を行なうことを特徴としている。
並列計算機において、各演算プロセッサにそれぞれ専用
のロックインレジスタを設け自演算プロセッサ内の演算
レジスタに代えて前記ロックインレジスタによりサスペ
ンド処理を行なうことを特徴としている。
【0019】第3の発明の並列計算機は、第1または第
2の発明の並列計算機において、ロックビット制御手段
には前記演算プロセッサの個数分のビット数を有する制
御レジスタを設け、サスペンド処理中の演算プロセッサ
を前記制御レジスタの対応するビットに登録しロック解
除に際しては前記制御レジスタを参照し登録された演算
プロセッサに対して選択的に割り込みリプライパケット
を送出することを特徴としている。
2の発明の並列計算機において、ロックビット制御手段
には前記演算プロセッサの個数分のビット数を有する制
御レジスタを設け、サスペンド処理中の演算プロセッサ
を前記制御レジスタの対応するビットに登録しロック解
除に際しては前記制御レジスタを参照し登録された演算
プロセッサに対して選択的に割り込みリプライパケット
を送出することを特徴としている。
【0020】第4の発明の並列計算機は、第1または第
2または第3の並列計算機において、同期制御や排他制
御に関連する演算プロセッサはロックビットが2値信号
中の1方の特定値のときには自演算プロセッサ内の演算
レジスタにより行なうサスペンド処理に代えて他プロセ
スにデイスパッチしてこれを実行し割り込みリプライパ
ケットの受信に応答してロック解除の割り込み処理を行
なうことを特徴としている。
2または第3の並列計算機において、同期制御や排他制
御に関連する演算プロセッサはロックビットが2値信号
中の1方の特定値のときには自演算プロセッサ内の演算
レジスタにより行なうサスペンド処理に代えて他プロセ
スにデイスパッチしてこれを実行し割り込みリプライパ
ケットの受信に応答してロック解除の割り込み処理を行
なうことを特徴としている。
【0021】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
て説明する。
【0022】図1は本発明の並列計算機の第1の実施例
を示すブロック図である。
を示すブロック図である。
【0023】第1の実施例の並列計算機は演算プロセッ
サ1−1〜1−nと、主記憶装置2と、通信レジスタ装
置3と、複数個の演算プロセッサ1−1〜1−n、通信
レジスタ装置3、主記憶装置2を結合する相互結合網4
とから構成されている。
サ1−1〜1−nと、主記憶装置2と、通信レジスタ装
置3と、複数個の演算プロセッサ1−1〜1−n、通信
レジスタ装置3、主記憶装置2を結合する相互結合網4
とから構成されている。
【0024】各演算プロセッサ1−1〜1−nはそれぞ
れ相互結合網4に対し1ポートのアクセスポートを持
ち、また、通信レジスタ装置3も相互結合網4に対し1
ポートのアクセスポートを持つ。相互結合網4は各演算
プロセッサに対し合計nポート、通信レジスタ装置3に
対して1ポート、主記憶装置2に対して1ポートのアク
セスパスを持っている。
れ相互結合網4に対し1ポートのアクセスポートを持
ち、また、通信レジスタ装置3も相互結合網4に対し1
ポートのアクセスポートを持つ。相互結合網4は各演算
プロセッサに対し合計nポート、通信レジスタ装置3に
対して1ポート、主記憶装置2に対して1ポートのアク
セスパスを持っている。
【0025】アクセスポートと一方のアクセスポート間
にはアクセスパスが張られる。このパス上をアクセスリ
クエストが流れる。
にはアクセスパスが張られる。このパス上をアクセスリ
クエストが流れる。
【0026】また他の構成として、アクセススループッ
ト向上を目的にアクセスポート、アクセスパスを多重に
持つ構成も考えられる。例えば、主記憶装置2を多バン
ク構成とし、相互結合網4間において、n本のアクセス
パスを張る構成等がある(図1はこの構成を示す)。
ト向上を目的にアクセスポート、アクセスパスを多重に
持つ構成も考えられる。例えば、主記憶装置2を多バン
ク構成とし、相互結合網4間において、n本のアクセス
パスを張る構成等がある(図1はこの構成を示す)。
【0027】各演算プロセッサが主記憶アクセス、もし
くは通信レジスタアクセスを行なう場合、リクエストを
構成し、これをアクセスパスを通じて相互結合網4に送
出する。
くは通信レジスタアクセスを行なう場合、リクエストを
構成し、これをアクセスパスを通じて相互結合網4に送
出する。
【0028】相互結合網4は複数個の演算プロセッサか
ら送られてくる複数個のリクエストを競合調停し、各リ
クエストが行きたい主記憶装置2、通信レジスタ装置3
にルーテイングを行ない、各々にアクセスパスを通じリ
クエストを送出する。
ら送られてくる複数個のリクエストを競合調停し、各リ
クエストが行きたい主記憶装置2、通信レジスタ装置3
にルーテイングを行ない、各々にアクセスパスを通じリ
クエストを送出する。
【0029】主記憶装置2、通信レジスタ装置3に到着
したリクエストは、各装置内でリードアクセス処理、も
しくはライトアクセス処理が実行される。リードアクセ
スの場合は、再度、相互結合網4を介して演算プロセッ
サにリードデータが返却される。
したリクエストは、各装置内でリードアクセス処理、も
しくはライトアクセス処理が実行される。リードアクセ
スの場合は、再度、相互結合網4を介して演算プロセッ
サにリードデータが返却される。
【0030】図2(a)および(b)は、相互結合網4
を流れるリクエストのフオーマットを示している。
を流れるリクエストのフオーマットを示している。
【0031】演算プロセッサから通信レジスタ装置3に
至る行き方向のリクエストは、図2(a)に示すよう
に、アスセス先が主記憶装置2なのか通信レジスタ装置
3なのかを示すアクセス種別フイールド200と、アク
セスがロードなのかストアなのか等を示すコードフイー
ルド201と、アクセスする通信レジスタ装置3内の通
信レジスタワードのアドレス番地を示すアドレスフイー
ルド202と、書き込みデータフイールド203とより
構成される。
至る行き方向のリクエストは、図2(a)に示すよう
に、アスセス先が主記憶装置2なのか通信レジスタ装置
3なのかを示すアクセス種別フイールド200と、アク
セスがロードなのかストアなのか等を示すコードフイー
ルド201と、アクセスする通信レジスタ装置3内の通
信レジスタワードのアドレス番地を示すアドレスフイー
ルド202と、書き込みデータフイールド203とより
構成される。
【0032】通信レジスタ装置3から演算プロセッサへ
至る帰り方向リプライは、図2(b)に示すように、ロ
ードアクセス時の読み出しデータ用のデータフイールド
205と、ロック解除割り込み発生を通知する割り込み
フイールド204とより構成される。
至る帰り方向リプライは、図2(b)に示すように、ロ
ードアクセス時の読み出しデータ用のデータフイールド
205と、ロック解除割り込み発生を通知する割り込み
フイールド204とより構成される。
【0033】図3は、通信レジスタ装置3の構成を示
す。通信レジスタ装置3は、リクエストパケット制御部
301と、ロックビット部302と、通信レジスタ部3
03と、リプライパケット制御部304とより構成され
る。
す。通信レジスタ装置3は、リクエストパケット制御部
301と、ロックビット部302と、通信レジスタ部3
03と、リプライパケット制御部304とより構成され
る。
【0034】リクエストパケット制御部301は、相互
結合網4より到着するリクエストに対する処理を行な
う。相互結合網4よりリクエストを受け取ったならば、
コードフイールド201をデコードし、ロックビットア
クセスなのか、通信レジスタアクセスなのかを判断す
る。ロックビットアクセスならばパケットをロックビッ
ト部302へ送出し、通信レジスタアクセスならば通信
レジスタ部303へパケットを送出する。
結合網4より到着するリクエストに対する処理を行な
う。相互結合網4よりリクエストを受け取ったならば、
コードフイールド201をデコードし、ロックビットア
クセスなのか、通信レジスタアクセスなのかを判断す
る。ロックビットアクセスならばパケットをロックビッ
ト部302へ送出し、通信レジスタアクセスならば通信
レジスタ部303へパケットを送出する。
【0035】リプライパケット制御部304は、ロック
ビット部302と通信レジスタ部303より送出された
リプライパケットを競合調停すると共に、そのリプライ
を相互結合網4へ送出する。
ビット部302と通信レジスタ部303より送出された
リプライパケットを競合調停すると共に、そのリプライ
を相互結合網4へ送出する。
【0036】図4は、通信レジスタ部303を示してい
る。通信レジスタ部303は、通信レジスタを構成する
複数個のワードよりなるRAM405と、ライトレジス
タ402と、アドレスレジスタ401と、リードレジス
タ406と、ライトイネーブル403と、リードイネー
ブル404と、通信レジスタアクセスを制御する通信レ
ジスタ制御部407とより構成される。
る。通信レジスタ部303は、通信レジスタを構成する
複数個のワードよりなるRAM405と、ライトレジス
タ402と、アドレスレジスタ401と、リードレジス
タ406と、ライトイネーブル403と、リードイネー
ブル404と、通信レジスタアクセスを制御する通信レ
ジスタ制御部407とより構成される。
【0037】RAM405で構成される通信レジスタは
0番地(#0)から連続的にアドレス番号が付されてい
る。演算プロセッサからの通信レジスタアクセスでは、
この通信レジスタアドレスを指定することにより、アク
セスする通信レジスタのワードを決めることができる。
RAM405にアクセスしない場合は、ライトイネーブ
ル403、リードイネーブル404を共に0値にする。
0番地(#0)から連続的にアドレス番号が付されてい
る。演算プロセッサからの通信レジスタアクセスでは、
この通信レジスタアドレスを指定することにより、アク
セスする通信レジスタのワードを決めることができる。
RAM405にアクセスしない場合は、ライトイネーブ
ル403、リードイネーブル404を共に0値にする。
【0038】RAM405に対してライトを行なう場
合、ライトイネーブル403を1値にし、ライトをする
ワードのアドレスをアドレスレジスタ401に入れ、ラ
イトをするデータをライトレジスタ402に入れる。次
のタイミングでライトレジスタ402の値はアドレスレ
ジスタ401で指定されたワードに対しライトされる。
合、ライトイネーブル403を1値にし、ライトをする
ワードのアドレスをアドレスレジスタ401に入れ、ラ
イトをするデータをライトレジスタ402に入れる。次
のタイミングでライトレジスタ402の値はアドレスレ
ジスタ401で指定されたワードに対しライトされる。
【0039】RAM405に対してリードを行なう場
合、リードイネーブル404を1値にし、リードするワ
ードのアドレスをアドレスレジスタ401に入れる。次
のタイミングでアドレスレジスタ401で指定されたワ
ードの値は、リードレジスタ406へ入れられる。
合、リードイネーブル404を1値にし、リードするワ
ードのアドレスをアドレスレジスタ401に入れる。次
のタイミングでアドレスレジスタ401で指定されたワ
ードの値は、リードレジスタ406へ入れられる。
【0040】これら、RAM405の周辺部分のレジス
タの制御は、通信レジスタ制御部407で制御する。
タの制御は、通信レジスタ制御部407で制御する。
【0041】図5はロックビット部302の構成を示
す。ロックビット部302は、ロックビットレジスタ5
04を含むロックレジスタ部501と、割り込みリプラ
イ生成部502と、ロックビット制御部503とより構
成される。
す。ロックビット部302は、ロックビットレジスタ5
04を含むロックレジスタ部501と、割り込みリプラ
イ生成部502と、ロックビット制御部503とより構
成される。
【0042】ロックビットレジスタ504はロックビッ
トであり、演算プロセッサからのリードアクセス、もし
くはライトアクセスができる。
トであり、演算プロセッサからのリードアクセス、もし
くはライトアクセスができる。
【0043】このロックビットに対するアクセス制御は
ロックビット制御部503において制御される。
ロックビット制御部503において制御される。
【0044】割り込みリプライ生成部502は、ロック
ビットの値の変化を常に監視している。ここでロックビ
ットが非零値から零値になったならば、割り込みリプラ
イを生成し、これをリプライパケット制御部304に送
出する。
ビットの値の変化を常に監視している。ここでロックビ
ットが非零値から零値になったならば、割り込みリプラ
イを生成し、これをリプライパケット制御部304に送
出する。
【0045】ここで割り込みリプライとは、リプライパ
ケットの割り込みフイールド204が割り込み発生を示
しているリプライパケットを言う。割り込みリプライ
は、リプライパケット制御部304から相互結合網4を
経て、各演算プロセッサに通知される。
ケットの割り込みフイールド204が割り込み発生を示
しているリプライパケットを言う。割り込みリプライ
は、リプライパケット制御部304から相互結合網4を
経て、各演算プロセッサに通知される。
【0046】本構成における、前述のバリア同期制御に
おける処理動作について述べる。
おける処理動作について述べる。
【0047】バリア同期処理ルーチンに初めに入った演
算プロセッサは、読み出したカウンタ(通信レジスタ部
303にあるRAM405のワード#0の通信レジス
タ)の値0でなく、かつロックビット値が0であること
により、バリア同期処理ルーチンに最初に入ったことを
知ることができる。
算プロセッサは、読み出したカウンタ(通信レジスタ部
303にあるRAM405のワード#0の通信レジス
タ)の値0でなく、かつロックビット値が0であること
により、バリア同期処理ルーチンに最初に入ったことを
知ることができる。
【0048】ワード#0の通信レジスタの値が0でない
ならば、この演算プロセッサはロックビットの値を1値
にするライトアクセスを発行し、その後サスペンドす
る。これによりロックビットは1になる。
ならば、この演算プロセッサはロックビットの値を1値
にするライトアクセスを発行し、その後サスペンドす
る。これによりロックビットは1になる。
【0049】ここでサスペンドするとは、相互結合網4
を介しての通信レジスタ装置3へのアクセスをすること
なく、演算プロセッサ内のレジスタを用いて、プログラ
ム上のループ構成のルーチンにより、前述の自演算プロ
セッサ内のレジスタをアクセスすることによって待ち合
せをすることである。また、バリア同期に入った2番目
以降の演算プロセッサは、カウンタの値をデクリメント
した後ロックビット値を見て、ライトアクセスパケット
を発することなくサスペンドする。
を介しての通信レジスタ装置3へのアクセスをすること
なく、演算プロセッサ内のレジスタを用いて、プログラ
ム上のループ構成のルーチンにより、前述の自演算プロ
セッサ内のレジスタをアクセスすることによって待ち合
せをすることである。また、バリア同期に入った2番目
以降の演算プロセッサは、カウンタの値をデクリメント
した後ロックビット値を見て、ライトアクセスパケット
を発することなくサスペンドする。
【0050】バリア同期に最後に入った演算プロセッサ
は、カウンタの値が0値になっているので、最後である
ことを知ることができ、ロックビットレジスタ504の
値を0値にするライトアクセスを発行する。
は、カウンタの値が0値になっているので、最後である
ことを知ることができ、ロックビットレジスタ504の
値を0値にするライトアクセスを発行する。
【0051】ロックレジスタ部501はこの0値のライ
トアクセスを受け取ったならば、ロックビットレジスタ
504を0値にすると同時に、各演算プロセッサにロッ
ク解除割り込みを、割り込みリプライ生成部502より
送出する。
トアクセスを受け取ったならば、ロックビットレジスタ
504を0値にすると同時に、各演算プロセッサにロッ
ク解除割り込みを、割り込みリプライ生成部502より
送出する。
【0052】サスペンドしている各演算プロセッサはこ
の割り込みを受理することにより、バリア同期の完了を
知ることができる。
の割り込みを受理することにより、バリア同期の完了を
知ることができる。
【0053】以上のバリア同期制御動作によれば、同期
完了チェックのための相互結合網4を介してのスピンロ
ックが不要となり、スピンロックで生じるオーバヘッド
をなくすことができる。
完了チェックのための相互結合網4を介してのスピンロ
ックが不要となり、スピンロックで生じるオーバヘッド
をなくすことができる。
【0054】次に第2の実施例について説明する。
【0055】第2の実施例の並列計算機は図6に示すよ
うに、各演算プロセッサに対しそれぞれ専用のロックイ
ンレジスタ65−1〜65−nを設ける。他の構成は第
1の実施例と同じである。演算プロセッサはロックイン
レジスタへのライトアクセス命令、およびリードアクセ
ス命令を持つ。演算プロセッサはデクリメント後のサス
ペンド状態を、このロックインレジスタに対する処理で
実現する。すなわち、デクリメント後はロックインレジ
スタアクセスのループ構成ルーチンを実行する。ロック
解除は割り込みという形で演算プロセッサに通信される
ため、割り込み後はこのループを抜け同期制御を完了す
ることができる。
うに、各演算プロセッサに対しそれぞれ専用のロックイ
ンレジスタ65−1〜65−nを設ける。他の構成は第
1の実施例と同じである。演算プロセッサはロックイン
レジスタへのライトアクセス命令、およびリードアクセ
ス命令を持つ。演算プロセッサはデクリメント後のサス
ペンド状態を、このロックインレジスタに対する処理で
実現する。すなわち、デクリメント後はロックインレジ
スタアクセスのループ構成ルーチンを実行する。ロック
解除は割り込みという形で演算プロセッサに通信される
ため、割り込み後はこのループを抜け同期制御を完了す
ることができる。
【0056】この構成により、第1の実施例で述べた自
演算プロセッサの演算レジスタをサスペンド処理に使用
することがないので、レジスタ値の退避処理等のプログ
ラム変更が不要となり、プログラムのフレキシビリテイ
を高めることができる。
演算プロセッサの演算レジスタをサスペンド処理に使用
することがないので、レジスタ値の退避処理等のプログ
ラム変更が不要となり、プログラムのフレキシビリテイ
を高めることができる。
【0057】次に第3の実施例について説明する。
【0058】第3の実施例の並列計算機は図7に示すよ
うに、ロックレジスタ部701にロックビットレジスタ
704に加え演算プロセッサ個数分のビット長をもつ制
御レジスタ705を持たせる。この制御レジスタ705
の各ビットは各演算プロセッサに対応しており、各演算
プロセッサよりリードアクセス/ライトアクセス可能な
レジスタである。バリア同期ルーチンに入ったプロセッ
サに対応するビットは0から1に書き変られる。最後の
プロセッサがバリア同期ルーチンに入り、ロックビット
が非零値から零値になったならば、割り込みリプライを
生成し、各演算プロセッサに割り込みリプライを送出す
るが、演算プロセッサに対応する制御レジスタのビット
が1値ならば、その演算プロセッサに割り込みを送出
し、ビットが0値ならば割り込みは送出しない。
うに、ロックレジスタ部701にロックビットレジスタ
704に加え演算プロセッサ個数分のビット長をもつ制
御レジスタ705を持たせる。この制御レジスタ705
の各ビットは各演算プロセッサに対応しており、各演算
プロセッサよりリードアクセス/ライトアクセス可能な
レジスタである。バリア同期ルーチンに入ったプロセッ
サに対応するビットは0から1に書き変られる。最後の
プロセッサがバリア同期ルーチンに入り、ロックビット
が非零値から零値になったならば、割り込みリプライを
生成し、各演算プロセッサに割り込みリプライを送出す
るが、演算プロセッサに対応する制御レジスタのビット
が1値ならば、その演算プロセッサに割り込みを送出
し、ビットが0値ならば割り込みは送出しない。
【0059】この構成により第3の実施例の並列計算機
では選択的な割り込み送出が可能となり、同期/排他制
御に参加していない演算プロセッサに対する無駄な割り
込みを抑止できる。
では選択的な割り込み送出が可能となり、同期/排他制
御に参加していない演算プロセッサに対する無駄な割り
込みを抑止できる。
【0060】次に第4の実施例の並列計算機について説
明する。
明する。
【0061】第4の実施例の並列計算機は、第1、第2
および第3の実施例の並列計算機において、カウンタデ
クリメント後、各演算プロセッサは自演算プロセッサ内
でのウエイトルーチンによるサスペンドを必ずしも行な
う必要はなく、他プロセスにデイスパッチする。このバ
リア同期待ちの時間に他プロセスを実行することによ
り、プロセス実行効率(スループット)を高めることが
できる。他プロセスにデイスパッチ後は割り込みという
形で、各演算プロセッサはバリア同期完了を知ることが
できることになる。
および第3の実施例の並列計算機において、カウンタデ
クリメント後、各演算プロセッサは自演算プロセッサ内
でのウエイトルーチンによるサスペンドを必ずしも行な
う必要はなく、他プロセスにデイスパッチする。このバ
リア同期待ちの時間に他プロセスを実行することによ
り、プロセス実行効率(スループット)を高めることが
できる。他プロセスにデイスパッチ後は割り込みという
形で、各演算プロセッサはバリア同期完了を知ることが
できることになる。
【0062】以上の各実施例での説明は、バリア同期制
御動作を例に説明したが、本発明はこれに限定されるも
のではなく、共有資源の使用に際しての排他制御動作に
つても適用できる。
御動作を例に説明したが、本発明はこれに限定されるも
のではなく、共有資源の使用に際しての排他制御動作に
つても適用できる。
【0063】すなわち、共有資源を排他的に使用するプ
ロセッサは、使用に際してロックビットを1にし、使用
後にこれを0に書き換え、ロック解除の割り込みリプラ
イパケットを送出させる。共有資源を排他的に使用中で
あるときに、その共有資源を使用せんとするプロセッサ
はロックビットが1であることでその共有資源が排他的
に使用中であることを知り自プロセッサ内で閉じたサス
ペンド処理を行ない、ロック解除の割り込みリプライパ
ケットを受信して、割り込み処理を行なって後、再度共
有資源の使用を問い合せる。
ロセッサは、使用に際してロックビットを1にし、使用
後にこれを0に書き換え、ロック解除の割り込みリプラ
イパケットを送出させる。共有資源を排他的に使用中で
あるときに、その共有資源を使用せんとするプロセッサ
はロックビットが1であることでその共有資源が排他的
に使用中であることを知り自プロセッサ内で閉じたサス
ペンド処理を行ない、ロック解除の割り込みリプライパ
ケットを受信して、割り込み処理を行なって後、再度共
有資源の使用を問い合せる。
【0064】このように、排他御制御動作においても、
通信レジスタアクセス競合を低減でき高速化ができると
いう効果を有する。
通信レジスタアクセス競合を低減でき高速化ができると
いう効果を有する。
【0065】
【発明の効果】以上説明したように、本発明の並列計算
機は、複数個の演算プロセッサからの通信レジスタアク
セス競合を低減できることである。すなわち、各プロセ
ッサは相互結合網を介するスピンロック式の同期待ちを
行なうことなく各プロセッサに閉じた同期待ちにするこ
とができ、このアクセス競合低減の効果により、通信レ
ジスタを用いた同期制御、排他制御の高速化ができると
いう効果を有する。
機は、複数個の演算プロセッサからの通信レジスタアク
セス競合を低減できることである。すなわち、各プロセ
ッサは相互結合網を介するスピンロック式の同期待ちを
行なうことなく各プロセッサに閉じた同期待ちにするこ
とができ、このアクセス競合低減の効果により、通信レ
ジスタを用いた同期制御、排他制御の高速化ができると
いう効果を有する。
【0066】さらに、各プロセッサのプロセススループ
ットを高める効果がある。すなわち、同期待ちに入った
プロセッサは、プロセス切り換えを行なうことにより他
プロセスの実行を行なうことが可能となり、スピンロッ
クで生じる無駄なCPUタイムの消費をなくすことがで
きる。
ットを高める効果がある。すなわち、同期待ちに入った
プロセッサは、プロセス切り換えを行なうことにより他
プロセスの実行を行なうことが可能となり、スピンロッ
クで生じる無駄なCPUタイムの消費をなくすことがで
きる。
【図1】本発明の並列計算機の第1の実施例を示すブロ
ック図である。
ック図である。
【図2】(a)は行き方向リクエストパケットのフオー
マット図、(b)は帰り方向リクエストパケットのフオ
ーマット図である。
マット図、(b)は帰り方向リクエストパケットのフオ
ーマット図である。
【図3】通信レジスタ装置の構成を示すブロック図であ
る。
る。
【図4】通信レジスタ部の構成を示すブロック図であ
る。
る。
【図5】ロックビット部の構成を示すブロック図であ
る。
る。
【図6】本発明の並列計算機の第2の実施例を示すブロ
ック図である。
ック図である。
【図7】本発明の並列計算機の第3の実施例のロックビ
ット部の構成を示すブロック図である。
ット部の構成を示すブロック図である。
1−1〜1−n、61−1〜61−n 演算プロセッ
サ 2、62 主記憶装置 3、63 通信レジスタ装置 4、64 相互結合網 65−1〜65−n ロックインレジスタ 71−1〜71−n 演算プロセッサ対応ビット 200 アスセス種別フイールド 201 コードフイールド 202 アドレスフイールド 203、205 データフイールド 204 割り込みフイールド 301 リクエストパケット制御部 302 ロックビット部 303 通信レジスタ部 304 リプライパケット制御部 401 アドレスレジスタ 402 ライトレジスタ 403 ライトイネーブル 404 リードイネーブル 405 RAM 406 リードレジスタ 407 通信レジスタ制御部 501、701 ロックレジスタ部 502、702 割り込みリプライ生成部 503、703 ロックビット制御部 504、704 ロックビットレジスタ 705 制御レジスタ
サ 2、62 主記憶装置 3、63 通信レジスタ装置 4、64 相互結合網 65−1〜65−n ロックインレジスタ 71−1〜71−n 演算プロセッサ対応ビット 200 アスセス種別フイールド 201 コードフイールド 202 アドレスフイールド 203、205 データフイールド 204 割り込みフイールド 301 リクエストパケット制御部 302 ロックビット部 303 通信レジスタ部 304 リプライパケット制御部 401 アドレスレジスタ 402 ライトレジスタ 403 ライトイネーブル 404 リードイネーブル 405 RAM 406 リードレジスタ 407 通信レジスタ制御部 501、701 ロックレジスタ部 502、702 割り込みリプライ生成部 503、703 ロックビット制御部 504、704 ロックビットレジスタ 705 制御レジスタ
Claims (4)
- 【請求項1】 複数の演算プロセッサと主記憶装置と通
信レジスタ装置とこれら各装置の相互接続を行なう相互
結合網とを有するマルチプロセッサ構成の並列計算機に
おいて、前記通信レジスタ装置は供給されるリクエスト
パケットにより読み出し書き込みが行なわれ同期制御処
理中や排他制御処理中であるときには2値信号中の1方
の特定値をとるロックビットを格納しその値が2値信号
中の1方の特定値から他方の特定値に変化したときには
ロック解除を示す割り込みリプライパケットを生成する
ロックビット制御手段と、複数のワードから構成され供
給されるリクエストパケットにより読み出し書き込みが
行なわれる通信レジスタ手段と、前記相互結合網を介し
て前記演算プロセッサから供給されるリクエストパケッ
トを受信しそのリクエストパケットの指示に応じてこれ
を前記ロックビット格納手段または前記通信レジスタ手
段に供給するリクエストパケット制御手段と、前記ロッ
クビット制御手段からの割り込みリプライパケットと前
記通信レジスタ手段からの応答リプライパケットとの供
給を受け前記相互結合網に供給するリプライパケット制
御手段とを含んで構成され、同期制御や排他制御に関連
する前記演算プロセッサは前記ロックビットが2値信号
中の1方の特定値のときには自演算プロセッサ内の演算
レジスタによりサスペンド処理を行ない前記割り込みリ
プライパケットの受信に応答してロック解除の割り込み
処理を行なうことを特徴とする並列計算機。 - 【請求項2】 各演算プロセッサにそれぞれ専用のロッ
クインレジスタを設け自演算プロセッサ内の演算レジス
タに代えて前記ロックインレジスタによりサスペンド処
理を行なうことを特徴とする請求項1記載の並列計算
機。 - 【請求項3】 ロックビット制御手段には前記演算プロ
セッサの個数分のビット数を有する制御レジスタを設
け、サスペンド処理中の演算プロセッサを前記制御レジ
スタの対応するビットに登録しロック解除に際しては前
記制御レジスタを参照し登録された演算プロセッサに対
して選択的に割り込みリプライパケットを送出すること
を特徴とする請求項1または2記載の並列計算機。 - 【請求項4】 同期制御や排他制御に関連する演算プロ
セッサはロックビットが2値信号中の1方の特定値のと
きには自演算プロセッサ内の演算レジスタにより行なう
サスペンド処理に代えて他プロセスにデイスパッチして
これを実行し割り込みリプライパケットの受信に応答し
てロック解除の割り込み処理を行なうことを特徴とする
請求項1または2または3記載の並列計算機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7132214A JP2781742B2 (ja) | 1995-05-30 | 1995-05-30 | 並列計算機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7132214A JP2781742B2 (ja) | 1995-05-30 | 1995-05-30 | 並列計算機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08329020A true JPH08329020A (ja) | 1996-12-13 |
JP2781742B2 JP2781742B2 (ja) | 1998-07-30 |
Family
ID=15076064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7132214A Expired - Fee Related JP2781742B2 (ja) | 1995-05-30 | 1995-05-30 | 並列計算機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2781742B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256209A (ja) * | 2000-03-13 | 2001-09-21 | Yoko Tomoyasu | 非同期共有オブジェクトシステムの耐故障合意手法およびその実現機構 |
JP2007226807A (ja) * | 2006-02-24 | 2007-09-06 | Samsung Electronics Co Ltd | インタラプト可能なスレッド同期化方法および装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01297761A (ja) * | 1988-05-26 | 1989-11-30 | Fujitsu Ltd | ロック時限付ロック機構 |
JPH0381859A (ja) * | 1989-08-25 | 1991-04-08 | Nec Corp | マルチプロセッサシステム |
JPH07129526A (ja) * | 1993-11-05 | 1995-05-19 | Fujitsu Ltd | バリア同期における非同期通信完了保証方法 |
-
1995
- 1995-05-30 JP JP7132214A patent/JP2781742B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01297761A (ja) * | 1988-05-26 | 1989-11-30 | Fujitsu Ltd | ロック時限付ロック機構 |
JPH0381859A (ja) * | 1989-08-25 | 1991-04-08 | Nec Corp | マルチプロセッサシステム |
JPH07129526A (ja) * | 1993-11-05 | 1995-05-19 | Fujitsu Ltd | バリア同期における非同期通信完了保証方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256209A (ja) * | 2000-03-13 | 2001-09-21 | Yoko Tomoyasu | 非同期共有オブジェクトシステムの耐故障合意手法およびその実現機構 |
JP2007226807A (ja) * | 2006-02-24 | 2007-09-06 | Samsung Electronics Co Ltd | インタラプト可能なスレッド同期化方法および装置 |
JP4685044B2 (ja) * | 2006-02-24 | 2011-05-18 | 三星電子株式会社 | インタラプト可能なスレッド同期化方法および記録媒体 |
US8286166B2 (en) | 2006-02-24 | 2012-10-09 | Samsung Electronics Co., Ltd. | Interruptible thread synchronization method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP2781742B2 (ja) | 1998-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7895260B2 (en) | Processing data access requests among a plurality of compute nodes | |
US8161268B2 (en) | Performing an allreduce operation on a plurality of compute nodes of a parallel computer | |
CN109697185B (zh) | 多瓦片处理阵列中的同步 | |
US8375197B2 (en) | Performing an allreduce operation on a plurality of compute nodes of a parallel computer | |
US8122228B2 (en) | Broadcasting collective operation contributions throughout a parallel computer | |
US6829697B1 (en) | Multiple logical interfaces to a shared coprocessor resource | |
US7653716B2 (en) | Determining a bisection bandwidth for a multi-node data communications network | |
US7673011B2 (en) | Configuring compute nodes of a parallel computer in an operational group into a plurality of independent non-overlapping collective networks | |
US8775698B2 (en) | Performing an all-to-all data exchange on a plurality of data buffers by performing swap operations | |
US8422402B2 (en) | Broadcasting a message in a parallel computer | |
US7802025B2 (en) | DMA engine for repeating communication patterns | |
US9882801B2 (en) | Providing full point-to-point communications among compute nodes of an operational group in a global combining network of a parallel computer | |
US20090040946A1 (en) | Executing an Allgather Operation on a Parallel Computer | |
US8484440B2 (en) | Performing an allreduce operation on a plurality of compute nodes of a parallel computer | |
US5469549A (en) | Computer system having multiple asynchronous processors interconnected by shared memories and providing fully asynchronous communication therebetween | |
US7434016B2 (en) | Memory fence with background lock release | |
JPH0241553A (ja) | データ処理システム及び同期方法 | |
US20130179620A1 (en) | Administering Connection Identifiers For Collective Operations In A Parallel Computer | |
US20090046585A1 (en) | Determining Communications Latency for Transmissions Between Nodes in a Data Communications Network | |
US20170147345A1 (en) | Multiple operation interface to shared coprocessor | |
KR100895536B1 (ko) | 데이터 전송 방법, 시스템 및 컴퓨터 판독가능 매체 | |
US20080178177A1 (en) | Method and Apparatus for Operating a Massively Parallel Computer System to Utilize Idle Processor Capability at Process Synchronization Points | |
JP2010134698A (ja) | 情報処理システム | |
JP2781742B2 (ja) | 並列計算機 | |
US20090043540A1 (en) | Performance Testing of Message Passing Operations in a Parallel Computer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980414 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |