JP3384601B2 - 並列処理計算機 - Google Patents

並列処理計算機

Info

Publication number
JP3384601B2
JP3384601B2 JP02514394A JP2514394A JP3384601B2 JP 3384601 B2 JP3384601 B2 JP 3384601B2 JP 02514394 A JP02514394 A JP 02514394A JP 2514394 A JP2514394 A JP 2514394A JP 3384601 B2 JP3384601 B2 JP 3384601B2
Authority
JP
Japan
Prior art keywords
message
phase
processor
barrier
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02514394A
Other languages
English (en)
Other versions
JPH07234841A (ja
Inventor
康人 甲村
宏喜 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP02514394A priority Critical patent/JP3384601B2/ja
Publication of JPH07234841A publication Critical patent/JPH07234841A/ja
Application granted granted Critical
Publication of JP3384601B2 publication Critical patent/JP3384601B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は並列処理計算機に関
し、特にたとえば、各々が関連の局所メモリを有する複
数のデータ処理装置ないし要素プロセサが通信リンクに
よって相互に結合されて構成される並列処理計算機に関
する。
【0002】
【従来の技術】近年、並列処理計算機の実用化に向けて
並列処理向きのプロセサの研究開発が盛んである。特
に、並列処理計算機を構成する各要素プロセサ(以下、
単に「プロセサ」とよばれることもある。)に局所メモ
リ(ローカルメモリ)が接続された分散メモリ型の並列
処理計算機は、処理すべきデータを各局所メモリに分割
配置し、演算およびメモリアクセスを要素プロセサ毎に
独立かつ並列に行うことができるため、逐次計算機に比
べて処理の大幅な高速化が可能になる。
【0003】しかし、科学技術計算などの大規模かつ複
雑な計算を行うためには、要素プロセサどうしが互いに
局所メモリ内のデータを送受しながら並列処理を行うこ
とが不可欠である。このための機構として、プロセサ間
通信機構が効率良く実装されていることが並列処理計算
機の1つの要件といえる。さらに、複数の要素プロセサ
どうしが一定の処理を終えたことを互いに確認し合いな
がら共同して処理を進めてゆくことが、正しい計算結果
を得るために不可欠である。このための機構として、プ
ロセサ間の同期機構が効率良く実装されている必要があ
る。
【0004】まず、分散メモリ型の並列処理計算機にお
けるプロセサ間の通信機構として、自分と異なる(リモ
ート)プロセサの局所メモリ、すなわちリモートメモリ
に直接データを書き込むような機構が提案されている。
特に、リモートメモリへのデータの書き込みを発行した
プロセサが、その終了を待たずに次の処理を行える、す
なわちリモートメモリへの非同期書き込みをサポートす
る機構は、効率的な並列処理プログラムを実装する上で
非常に有効であることが知られている。
【0005】また、プロセサ間同期の方法の1つとし
て、一般にバリア同期と呼ばれる手法が広く用いられて
いる。バリア同期は、並列処理計算機システム中で、同
期をとるべき全てのプロセサが、プログラムのバリアと
呼ばれる一定の段階に到達したことが保証されてはじめ
て、各々次の段階に進めるような同期の手法である。つ
まり、先にバリアに到達したプロセサは他の全てのプロ
セサがバリアに到達するまで次の段階に進めないことに
なる。
【0006】
【発明が解決しようとする課題】ここで、上述のリモー
トメモリへの非同期書き込みを可能にする機構を、バリ
ア同期機構と併用することを考える。リモートメモリへ
の書き込みは非同期的に行われるため、或るプロセサA
から他のプロセサBに対してリモートメモリ非同期書き
込みが発行された後、この処理が終了する前に両方のプ
ロセサがバリアに到達することは容易に起こり得る状況
である。特に大規模な並列処理計算機システムにおいて
は、プロセサ間の通信経路(リンク)上にリモートメモ
リ非同期書き込み要求が存在する時間を事前に見積もる
ことは困難である。ここで、非同期書き込みの処理が実
際に実行される以前にバリア同期が成立してしまうと、
プロセサBはプロセサAからのデータが到着する前のメ
モリの内容を用いて次の段階の計算を始めてしまうこと
になり、正しい計算結果を得られないことになる。した
がって、バリア同期の成立は、全てのプロセサがバリア
に到達したことだけではなく、プロセサ間での非同期書
き込み処理が終了したことも保証しなければならない。
【0007】それゆえに、この発明の主たる目的は、確
実にリモートメモリ非同期書き込みの処理が終了した後
にバリア同期を成立させることができる、並列処理計算
機を提供することである。
【0008】
【課題を解決するための手段】この発明は、複数の要素
プロセサと、複数の要素プロセサの各々に接続された複
数の局所メモリとを備え、複数の要素プロセサが複数の
通信リンクによって相互に結合され、さらに複数の要素
プロセサとバリア同期の制御を行うためのバリア同期制
御装置とがバリア同期制御信号線によって結合された並
列処理計算機であって、バリア同期制御装置は、グルー
プフェーズを保持し、バリア同期が成立する毎にそのグ
ループフェーズを異なる状態に更新する第1の手段を備
え、各要素プロセサは、プロセサフェーズを保持し、当
該要素プロセサがバリアに到達する毎にそのプロセサフ
ェーズを当該要素プロセサの属するプロセサグループの
グループフェーズと同じ状態に更新する第2の手段、他
の要素プロセサに対してメッセージを通信リンクを経由
して送信する際に、メッセージを発行する要素プロセサ
のプロセサフェーズがメッセージフェーズとして付加さ
れたメッセージとして発行する第3の手段、およびプロ
セサフェーズが当該要素プロセサの属するプロセサグル
ープのグループフェーズと一致しており、かつ当該要素
プロセサ内に存在する全てのリモートメモリ書き込み要
求メッセージが保持しているメッセージフェーズがグル
ープフェーズと一致するときに限りバリア成立を承認す
る信号を生成する第4の手段を備え、バリア同期制御装
置は全ての要素プロセサの第4の手段がバリア成立を承
認したときに限り、バリア成立を全ての要素プロセサに
通知する第5の手段をさらに備える、並列処理計算機で
ある。
【0009】
【作用】バリア同期制御装置の第1の手段は、バリア同
期をとるべきプロセサのグループに対して付加されるも
ので、そのプロセサグループの実行フェーズ(以下、
「グループフェーズ」と呼ぶ。)を保持し、バリア同期
が成立する毎にグループフェーズを異なる状態に更新す
るグループフェーズ管理機能である。
【0010】第2の手段は、各要素プロセサに対して付
加されるもので、要素プロセサの実行フェーズ(以下、
「プロセサフェーズ」と呼ぶ。)を保持し、当該要素プ
ロセサがバリアに到達する毎にプロセサフェーズを当該
要素プロセサの属するプロセサグループのグループフェ
ーズと同じ状態に更新するプロセサフェーズ管理機能で
ある。
【0011】第3の手段は、各要素プロセサに対して付
加されるもので、或る要素プロセサから他の要素プロセ
サに対するデータ通信を、通信リンクを経由するメッセ
ージとして発行するメッセージ送出機能である。このと
き、各メッセージにはそのメッセージを発行する要素プ
ロセサのプロセサフェーズが付加されて送出される。以
下、このメッセージに付加されるフェーズ情報をメッセ
ージフェーズと呼ぶ。
【0012】第4の手段は、各要素プロセサに対して付
加されるもので、要素プロセサのプロセサフェーズが当
該要素プロセサの属するプロセサグループのグループフ
ェーズと一致しており、かつ、バリア成立以前に処理さ
れるべきリモートメモリ非同期書き込み要求メッセージ
のうち、そのメッセージフェーズがグループフェーズと
異なるものを送出中、転送中、受信中のいずれの状態に
もないときに限り、バリア成立を承認する信号を生成す
るバリア承認機能である。
【0013】バリア同期制御装置の第5の手段は、バリ
ア同期をとるべきプロセサグループに対して付加される
もので、そのプロセサグループに属する全ての要素プロ
セサの第4の手段がバリア成立を承認するとき、バリア
成立をその全ての要素プロセサ、および第1の手段に通
知するバリア成立通知機能である。第3の手段のメッセ
ージ送出機能によって、バリア同期成立以前に完了が保
証されなければならないリモートメモリ非同期書き込み
要求には、要求発行時の要求発行プロセサにおけるプロ
セサフェーズが付加されて送出される。未処理のリモー
トメモリ非同期書き込み要求メッセージのうち、そのメ
ッセージフェーズとグループフェーズが異なるものがプ
ロセサグループ内のプロセサ、あるいは通信リンク上に
存在すれば、第4の手段、すなわちバリア承認機能によ
っていずれかの要素プロセサによってバリア承認がなさ
れないことが保証される。要素プロセサがバリアに到達
すると第2の手段、すなわちプロセサフェーズ管理機能
によってその要素プロセサのプロセサフェーズがグルー
プフェーズと同一のものに更新される。したがって、バ
リア成立以前に処理されなければならないリモートメモ
リ非同期書き込み要求が存在せず、全ての要素プロセサ
がバリアに到達した状態においてはじめて第5の手段で
あるバリア成立通知機能がプロセサグループに属する全
ての要素プロセサに対してバリア同期の成立を通知し、
要素プロセサのプログラムが次の段階に進めることを許
可する。
【0014】第1の手段、すなわちグループフェーズ管
理機能は第5の手段からバリア同期の成立を通知される
と、グループフェーズを異なったものに更新する。この
ことにより要素プロセサの第4の手段はバリア承認を停
止し、次回のバリア同期の実行に備える。このように、
この発明では、バリア同期の成立は、バリア同期成立以
前に完了が保証されなければならないリモートメモリ非
同期書き込み要求の全てが完了した後に行われることが
保証される。
【0015】
【発明の効果】この発明によれば、バリア成立以前に完
了が保証されなければならないリモートメモリ非同期書
き込みメッセージにはそのメッセージを生成した要素プ
ロセサのプロセサフェーズが付加され、このメッセージ
を送信、転送、受信するための経路上の全ての要素が、
このメッセージの存在を監視している。そして、バリア
成立以前に完了が保証されなければならないリモートメ
モリ非同期書き込みメッセージがシステム中に存在する
期間は、いずれかの要素プロセサがバリア承認信号とし
て偽を出力するため、バリア同期が成立することはな
い。したがって、この発明によれば、バリア同期の成立
時には、全てのプロセサがバリアに到達したことだけで
はなく、プロセサ間での非同期書き込み処理が終了した
ことを保証することができる。
【0016】この発明の上述の目的,その他の目的,特
徴および利点は、図面を参照して行う以下の実施例の詳
細な説明から一層明らかとなろう。
【0017】
【実施例】図1に示す実施例の並列処理計算機10は、
n×m台のデータ処理装置(以下、単に「プロセサ」と
呼ぶこともある。)P00〜Pnmを含む、たとえばトーラ
ス結合網のような結合網12を有する。トーラス結合網
12とは、複数のプロセサを行列配置し、各列方向、す
なわち南北方向のプロセサ列を循環的に結合する複数の
列通信線C10 〜C1m およびC20 〜C2m と、各行
方向、すなわち東西方向のプロセサ行を循環的に結合す
る複数の行通信線R10 〜R1n およびR2 0 〜R2n
とで、任意のプロセサ間のメッセージ通信を可能とした
ものである。
【0018】なお、この発明は、トーラス結合網以外
の、任意の形態の、複数のデータ処理装置を結合した結
合網に適用されてもよい。さらに、結合網12、すなわ
ち結合網12を構成する各データ処理装置P00〜P
nmと、バリア同期を制御するためのバリア同期制御装置
14とが、バス信号線であるバリア同期制御網16によ
って接続される。
【0019】図1実施例の各データ処理装置Pは、図2
に示すように、要素プロセサPEに局所メモリLMが接
続された構成となっている。図1に示す各通信線C1,
C2,R1およびR2ならびにバリア同期制御網16が
要素プロセサPEに接続される。すなわち、結合網制御
機構18は、図1の各通信線C1,C2,R1およびR
2に結合された東西南北4系統の通信ポート20n,2
0s,20eおよび20wを保持し、トーラス結合網1
2(図1)に基づく経路制御を行う。また、結合網制御
機構18は、通信ポート20n,20s,20eおよび
20wを経由して自身に向けて到着したメッセージをメ
ッセージ受信制御機構22に対して出力するとともに、
メッセージ送信制御機構24によって生成されたメッセ
ージを受けて、4系統のうちの適切な通信ポートを経由
してそれを出力する。
【0020】命令フェッチ機構26は局所メモリLMに
格納されたプログラム命令を局所メモリバス28を通じ
て順次フェッチし、解釈を行う。命令実行機構30は命
令フェッチ機構26によって解釈された命令の実行を行
う。なお、要素プロセサPEの一部の命令には他のプロ
セサへのメッセージ送出を指示する命令が存在するが、
命令実行機構30は、このような命令を実行するとき、
メッセージ送信制御機構24に対して、メッセージの宛
先要素プロセサのアドレス,およびメッセージのタイ
プ,データ内容等の情報を送出する。
【0021】そして、メッセージ送信制御機構24は、
命令実行機構30から受け取った情報に従って、メッセ
ージ通信を実行する。メッセージタイプとしては、他の
データ処理装置ないしプロセサに対して特定のプログラ
ム実行を要求するプログラム実行要求(Remote Procedu
re Call :RPC),他のデータ処理装置ないしプロセ
サの局所メモリにデータを書き込むためのリモートメモ
リ非同期書き込み要求(Remote Asynchronous Write :
RAW),他のデータ処理装置ないしプロセサの局所メ
モリにデータを書き込むとともにその終了を発行側に通
知して戻すためのリモートメモリ書き込み要求(Remote
Synchronous Write:RSW),および他のデータ処理
装置ないしプロセサの局所メモリのデータを読み出すた
めのリモートメモリ読み出し要求(Remote Read :P
R)などがある。ただし、この実施例においては、メッ
セージ送信制御機構24から出力されるメッセージに
は、メッセージ出力時点におけるプロセサフェーズの情
報が付加される。このプロセサフェーズ情報は後述の同
期制御機構32からのプロセサフェーズ信号34によっ
て与えられる。
【0022】なお、図3にメッセージ送信制御機構によ
って生成されるメッセージの構造の一例を示す。メッセ
ージ受信制御機構22は他のプロセサから自身のプロセ
サ宛に送られてきたメッセージの処理を行う機構であ
る。メッセージ受信制御機構22はRAW(リモートメ
モリ非同期書き込み要求)メッセージに対しては、その
メッセージの指示内容に従って要求された局所メモリの
アドレスに、要求されたデータの書き込みを局所メモリ
バス28を通じて直接行う。また、RPC(プログラム
実行要求)メッセージに対しては、そのメッセージによ
って指示されたプログラムアドレスを用いたプログラム
の実行開始を命令フェッチ機構26に通知する。また、
PR(リモートメモリ読み出し要求)メッセージに対し
ては、そのメッセージによって指示されたアドレスの局
所メモリの内容をそのメッセージを発行した要素プロセ
サに戻すためのメッセージの生成をメッセージ送信機構
24に指示する。
【0023】同期制御機構32は、バリア同期制御網1
6を介してバリア同期制御装置14(図1)と信号の授
受を行いながら、プロセサのバリア同期の承認および成
立の制御管理を行う。同期制御機構32にはメッセージ
受信制御機構22からのバリア承認信号36,結合網制
御機構からのバリア承認信号38,およびメッセージ送
信制御機構24からのバリア承認信号40が入力され、
これら全ての承認信号が真となり、なおかつプログラム
が既にバリアに到着しているときに限り、バリア同期制
御装置14に対して、バリア同期制御網16を通して、
自己の要素プロセサPEがバリアを承認していることを
通知する。バリア承認信号とは、バリアを成立させるこ
とを承認する信号である。
【0024】そして、バリア同期制御網16を通してバ
リア同期制御装置14からバリアが成立した通知を受け
取ると、この同期制御機構32は、命令実行機構30に
対するバリア成立信号42を生成する。また、同期制御
機構32は、バリア同期制御網16を介してバリア同期
制御装置14からのプロセサグループフェーズを入力
し、これを結合網制御機構18,メッセージ受信制御機
構22およびメッセージ送信制御機構24の各々に対し
て、グループフェーズ信号44,46および48を用い
て通知する。さらに、同期制御機構32は命令実行機構
30から、プログラムがバリアに到達したときに真とな
るバリア到達信号50を受ける。
【0025】したがって、バリア同期制御網16は、図
4に示すように、各要素プロセサから出力されるバリア
承認信号52,およびバリア同期制御装置14から出力
されるバリア成立信号54およびグループフェーズ信号
56を含むバス信号線として構成されている。図5に詳
細に示すバリア同期制御装置14は、各要素プロセサの
同期制御機構32(図2)との間でバリア同期制御網1
6を介して通信を行い、プロセサグループ全体のバリア
同期の制御を行う。第1の手段を構成するグループフェ
ーズレジスタ58は、たとえば1ビットのデータレジス
タであり、「0」または「1」のグループフェーズない
しフラグを保持しており、この値をグループフェーズ信
号56として出力し、全ての要素プロセサにグループフ
ェーズを通知する。全ての要素プロセサがバリア承認信
号52として真を発生すると、バリア同期制御装置14
は、第5の手段を構成するANDゲート60からバリア
成立信号54に真を発生し、全てのプロセサにバリア同
期の成立を通知する。したがって、このANDゲート6
0が第5の手段として作用する。さらに、このバリア成
立時には、グループフェーズレジスタ58はその内容を
反転(「0」から「1」に、あるいは「1」から「0」
に)する。
【0026】次に、図6に詳細に示す各要素プロセサの
同期制御機構32は、バリア同期制御装置14との間で
バリア同期制御網16を介して通信を行い、要素プロセ
サのバリア同期の制御を行う。同期制御機構32は、バ
リア同期制御網16を通してバリア同期制御装置14か
ら入力されるグループフェーズ信号56を受け、この値
「1」または「0」を要素プロセサ内の結合網制御機構
18,メッセージ受信制御機構22およびメッセージ送
信制御機構24に、信号44,46および48としてそ
れぞれ伝達する。また、第2の手段として機能するプロ
セサフェーズ保持機構60は、たとえば1ビットのデー
タレジスタを含み、「1」または「0」のプロセサフェ
ーズないしフラグを保持しておき、命令実行機構30
(図2)から出力されたバリア到達信号50を受け取る
と、このプロセサフェーズの値を反転(「1」から
「0」に、または「0」から「1」に)させる。上述の
グループフェーズ信号56とプロセサフェーズ信号34
とが第4の手段の一部を構成する一致判定機構62に与
えられる。したがって、この2つの信号の一致判定によ
り、プログラムがバリアに到達したかどうかを判定する
ことができる。このことは次のように説明できる。
【0027】まず、初期状態ではグループフェーズを
「1」、各要素プロセサのプロセサフェーズを「0」と
しておく。プログラムがバリアに到達した要素プロセサ
のプロセサフェーズは上述のように反転して「1」とな
る。応じて、一致判定機構62は真を生成し、さらに要
素プロセサ内の各部よりのバリア承認信号38,36お
よび50が真となると、第4の手段の一部を構成するA
NDゲート64によって生成される要素プロセサのバリ
ア承認信号52も真となる。
【0028】さらに、全ての要素プロセサがバリア承認
信号52を真とするとき、バリア同期制御装置14は前
述のようにバリア成立信号54を生成すると同時に、グ
ループフェーズ信号を反転させる。このとき、グループ
フェーズ信号は「0」、また各要素プロセサのプロセサ
フェーズは全て「1」となっている。この時点で一致判
定機構62は偽を生成することになり、次のバリア同期
に対する準備が整ったことになる。
【0029】次に、プログラムが2度目にバリアに到達
すると、今度はプロセサがフェーズが「0」となり、一
致判定機構62は真を生成する。さらに、全ての要素プ
ロセサのバリア承認信号52が真となると、バリア同期
制御装置14はバリア成立信号54を生成すると同時
に、グループフェーズ信号を反転させる。この時点での
グループフェーズは「1」、各要素プロセサのプロセサ
フェーズは全て「0」であり、これは初期状態と同じと
なる。以下、この繰り返しによってバリア同期が制御さ
れる。
【0030】そして、図7に詳細に示す結合網制御機構
18は、要素プロセサの東西南北4系統の通信ポート2
0n,20s,20eおよび20wから入力されたメッ
セージ、およびメッセージ送信制御機構24から信号線
65を通して入力されたメッセージを、その宛先に従っ
て適切な通信ポート20n,20s,20eまたは20
wあるいはメッセージ受信制御機構22(信号線66)
に転送する。入力されたメッセージの先頭は、まずメッ
セージバッファ68に格納され、宛先アドレスの判別が
行われる。5つの出力ポートのいずれが選択されるべき
かに従って、クロスバスイッチ70がメッセージを適切
な経路に導く。ここで、前述のように各メッセージに
は、図3に示すメッセージタイプと、メッセージフェー
ズとが付加されている。メッセージフェーズは、メッセ
ージ生成時の、メッセージを生成した要素プロセサのプ
ロセサフェーズに等しい。
【0031】ここで、注目すべきは、第4の手段の一部
を構成する結合網制御機構18のメッセージバッファ6
8のうちのいずれかがグループフェーズと異なるメッセ
ージフェーズを持つRAWメッセージを転送中であるな
らば、結合網制御機構18からのバリア承認信号38に
偽を出力することである。結合網制御機構18が転送中
のメッセージを持たないか、あるいは全ての転送中のメ
ッセージが、グループフェーズと等しいフェーズを持つ
のであれば、そのバリア承認信号38として真が出力さ
れる。
【0032】この機能を実現するため、各メッセージバ
ッファ68にはバリア同期制御装置14からグループフ
ェーズ信号56が入力されている。そして、メッセージ
バッファ68は、RAWメッセージを転送中であり、か
つそのRAWメッセージのメッセージフェーズがグルー
プフェーズと異なるものであるとき、メッセージバッフ
ァからのバリア承認信号72に偽を出力する。メッセー
ジバッファ68がメッセージを転送中ではないか、ある
いは転送中のメッセージのメッセージフェーズがグルー
プフェーズに等しい場合には、メッセージバッファから
のバリア承認信号72に真を出力する。全てのメッセー
ジバッファ68のバリア承認信号72がANDゲート7
4に与えられ、このANDゲート74の出力が結合網制
御機構18のバリア承認信号38として出力される。
【0033】次に、図8にメッセージ送信制御機構24
の一例を詳細に示す。メッセージ送信制御機構24は、
命令実行機構30およびメッセージ受信制御機構22か
らのメッセージ送信要求76に従って、メッセージの生
成を行い、結合網制御機構18に対する出力を行う。メ
ッセージ送信要求には、メッセージタイプ,宛先プロセ
サアドレス,宛先メモリアドレス,データ長,および送
信すべきデータが格納されている局所メモリのアドレス
(ソースアドレス)の情報が含まれている。これを図3
のようなメッセージとして構成するために、メッセージ
送信制御機構24では、これらの情報を対応するレジス
タ78,80,82,84および86に保持し、さらに
同期制御機構32から入力されるプロセサフェーズ信号
34をメッセージフェーズレジスタ88に保持する。そ
して、図3のメッセージの構成に従って、順次結合網制
御機構18に各ワードを出力する。特に、局所メモリL
M(図2)の内容をメッセージのデータ内容として出力
するために、局所メモリを読み出すアドレスを生成する
ためのソースアドレスカウンタ86,および読み出した
局所メモリの内容を一時的に保持するためのデータレジ
スタ90を備える。
【0034】ここで、注目すべきは、メッセージ送信制
御機構24が、第3の手段すなわち生成するメッセージ
にプロセサフェーズ情報を付加する機能を備えている点
である。そして、メッセージフェーズレジスタ88に
は、同期制御機構32からのグループフェーズ信号48
が入力されており、送信中のRAWメッセージのフェー
ズの値がグループフェーズと異なる場合には、メッセー
ジ送信制御機構24のバリア承認信号40に偽を出力す
る。メッセージを送信中でないか、送信中のメッセージ
のフェーズがグループフェーズと同じである場合には、
メッセージ送信制御機構24からのバリア承認信号40
として真が出力される。
【0035】図9に詳細に示すメッセージ受信制御機構
22は、結合網制御機構18からの自己の要素プロセサ
宛のメッセージを入力し、そのメッセージタイプに応じ
て種々の操作を行う。まず、結合網制御機構18から信
号線91を通して入力されたメッセージのフェーズ情
報,メッセージタイプ,宛先メモリアドレスおよびデー
タ長の情報が、それぞれ、対応するレジスタ92,9
4,96および98に格納される。ここで、データ長が
「0」以外のメッセージに対しては、メッセージのデー
タ内容をデータレジスタ100に一時的に格納し、この
内容を局所メモリバス28を経由して直接局所メモリL
M(図2)の宛先メモリアドレスカウンタ96が示すア
ドレスに書き込む操作を行う。この操作は、宛先メモリ
アドレスカウンタ96をインクリメントしながらメッセ
ージの全てのデータ内容がメモリに書き込まれるまで続
けられる。その後、メッセージタイプ判別機構94はメ
ッセージタイプに応じて、信号線102あるいは104
を通して、命令フェッチ機構26(図2)あるいはメッ
セージ送信制御機構24(図2)に後続すべき操作の指
示を行う。たとえば、RPCメッセージに対しては、格
納されたメッセージデータのアドレスを命令フェッチ機
構26に通知し、そこに格納されたパラメータ情報を用
いてプログラム実行を指示する。また、PRメッセージ
に対しては、要求されたメモリ内容をリターンメッセー
ジとして送信するための指示がメッセージ送信制御機構
24に対してなされる。RAWメッセージに対しては上
で述べた局所メモリへの書き込み以外の操作は必要な
い。
【0036】ここで、注目すべきは、メッセージフェー
ズレジスタ92に同期制御機構32からのグループフェ
ーズ信号46が入力されており、受信中のRAWメッセ
ージのフェーズの値が、グループフェーズの値と異なる
場合には、メッセージ受信制御機構22からのバリア承
認信号36に偽を出力することである。メッセージを受
信中でないか、受信中のメッセージのフェーズがグルー
プフェーズと等しい場合には、メッセージ受信制御機構
22のバリア承認信号36としては真が出力される。
【図面の簡単な説明】
【図1】この発明の一実施例を示す概略ブロック図であ
る。
【図2】図1実施例のデータ処理装置の一例を示す機能
ブロック図である。
【図3】データ処理装置間のデータ通信に用いられるメ
ッセージの構造を示す説明図である。
【図4】図1実施例のバリア同期制御網の一例を示す図
解図である。
【図5】図1実施例のバリア同期制御装置の一例を示す
機能ブロック図である。
【図6】データ処理装置の要素プロセサの同期制御機構
の一例を示す機能ブロック図である。
【図7】データ処理装置の要素プロセサの結合網制御機
構の一例を示す機能ブロック図である。
【図8】データ処理装置の要素プロセサのメッセージ送
信制御機構の一例を示す機能ブロック図である。
【図9】データ処理装置の要素プロセサのメッセージ受
信制御機構の一例を示す機能ブロック図である。
【符号の説明】
10 …並列処理計算機 12 …結合網 P00〜Pnm …データ処理装置 C10 〜C1m ,C20 〜C2m …列方向通信線 R10 〜R1n ,R20 〜R2n …行方向通信線 14 …バリア同期制御装置 16 …バリア同期制御網 PE …要素プロセサ LM …局所メモリ 18 …結合網制御機構 22 …メッセージ受信制御機構 24 …メッセージ送信制御機構 32 …同期制御機構
フロントページの続き (56)参考文献 特開 平4−260962(JP,A) 特開 平6−332689(JP,A) 特開 平6−266678(JP,A) 特開 平6−187303(JP,A) 特開 平5−127899(JP,A) 特開 平4−199257(JP,A) 特開 平1−241662(JP,A) 特開 昭51−32147(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 15/16 - 15/177 G06F 9/46

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の要素プロセサと、前記複数の要素プ
    ロセサの各々に接続された複数の局所メモリとを備え、
    前記複数の要素プロセサが複数の通信リンクによって相
    互に結合され、さらに前記複数の要素プロセサとバリア
    同期の制御を行うためのバリア同期制御装置とがバリア
    同期制御信号線によって結合された並列処理計算機であ
    って、 前記バリア同期制御装置は、グループフェーズを保持
    し、バリア同期が成立する毎にそのグループフェーズを
    異なる状態に更新する第1の手段を備え、 各要素プロセサは、 プロセサフェーズを保持し、当該要素プロセサがバリア
    に到達する毎にそのプロセサフェーズを当該要素プロセ
    サの属するプロセサグループのグループフェーズと同じ
    状態に更新する第2の手段、 他の要素プロセサに対してメッセージを通信リンクを経
    由して送信する際に、メッセージを発行する要素プロセ
    サのプロセサフェーズがメッセージフェーズとして付加
    されたメッセージとして発行する第3の手段、および前
    記プロセサフェーズが当該要素プロセサの属するプロセ
    サグループのグループフェーズと一致しており、かつ当
    該要素プロセサ内に存在する全てのリモートメモリ書き
    込み要求メッセージが保持しているメッセージフェーズ
    がグループフェーズと一致するときに限りバリア成立を
    承認する信号を生成する第4の手段を備え、 前記バリア同期制御装置は全ての要素プロセサの前記第
    4の手段がバリア成立を承認したときに限り、バリア成
    立を前記全ての要素プロセサに通知する第5の手段をさ
    らに備える、並列処理計算機。
  2. 【請求項2】前記複数の要素プロセサは各々バリア承認
    信号を前記バリア同期制御信号線を通して前記バリア同
    期制御装置に送り、 前記第1の手段は、前記グループフェーズを保持するグ
    ループフェーズレジスタ、および前記複数の要素プロセ
    サからの前記バリア承認信号が全て真のとき真の信号を
    出力して前記グループフェーズレジスタに与えるAND
    手段を含む、請求項1記載の並列処理計算機。
  3. 【請求項3】前記第5の手段は前記AND手段を含む、
    請求項2記載の並列処理計算機。
  4. 【請求項4】前記複数の要素プロセサの各々は当該要素
    プロセサがバリアに到達したときバリア到達信号を出力
    する手段を含み、 前記第2の手段は前記バリア到達信号に応じた前記プロ
    セサフェーズを保持するプロセサフェーズレジスタを含
    む、請求項1ないし3のいずれかに記載の並列処理計算
    機。
  5. 【請求項5】前記複数の要素プロセサの各々は他の要素
    プロセサに対して送信すべきメッセージを出力する手段
    を含み、 前記第3の手段は、前記プロセサフェーズに応じた信号
    をメッセージフェーズとして保持するメッセージフェー
    ズレジスタ、および前記メッセージに前記メッセージフ
    ェーズレジスタに保持されたメッセージフェーズを付加
    して出力する信号線を含む、請求項1ないし4のいずれ
    かに記載の並列処理計算機。
  6. 【請求項6】前記第4の手段は、他の要素プロセサから
    送信されてきたメッセージフェーズを有するメッセージ
    を保持する第1のメッセージバッファ、自己の要素プロ
    セサから他の要素プロセサに送信すべきメッセージフェ
    ーズを有するメッセージを保持する第2のメッセージバ
    ッファ、前記第1および第2のメッセージバッファに前
    記グループフェーズを入力する手段、前記第1および第
    2のメッセージバッファのメッセージフェーズと前記グ
    ループフェーズとが一致しているとき真の第1の承認信
    号を出力する手段、前記プロセサフェーズに応じた信号
    をメッセージフェーズとして保持するとともに前記メッ
    セージフェーズが前記グループフェーズと一致している
    とき真の第2の承認信号を出力するメッセージフェーズ
    レジスタ、および前記第1および第2の承認信号がとも
    に真のときにのみ前記バリアの成立を承認する信号を生
    成する手段を含む、請求項1ないし4のいずれかに記載
    の並列処理計算機。
JP02514394A 1994-02-23 1994-02-23 並列処理計算機 Expired - Fee Related JP3384601B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02514394A JP3384601B2 (ja) 1994-02-23 1994-02-23 並列処理計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02514394A JP3384601B2 (ja) 1994-02-23 1994-02-23 並列処理計算機

Publications (2)

Publication Number Publication Date
JPH07234841A JPH07234841A (ja) 1995-09-05
JP3384601B2 true JP3384601B2 (ja) 2003-03-10

Family

ID=12157772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02514394A Expired - Fee Related JP3384601B2 (ja) 1994-02-23 1994-02-23 並列処理計算機

Country Status (1)

Country Link
JP (1) JP3384601B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201001621D0 (en) * 2010-02-01 2010-03-17 Univ Catholique Louvain A tile-based processor architecture model for high efficiency embedded homogenous multicore platforms
WO2013102970A1 (ja) * 2012-01-04 2013-07-11 日本電気株式会社 データ処理装置、及びデータ処理方法
JP6176166B2 (ja) 2014-03-25 2017-08-09 株式会社デンソー データ処理装置
CA3051990C (en) 2017-02-23 2021-03-23 Cerebras Systems Inc. Accelerated deep learning
US11488004B2 (en) 2017-04-17 2022-11-01 Cerebras Systems Inc. Neuron smearing for accelerated deep learning
JP6854473B2 (ja) * 2017-04-17 2021-04-07 セレブラス システムズ インク. 加速化ディープラーニングのデータフロー・トリガー・タスク

Also Published As

Publication number Publication date
JPH07234841A (ja) 1995-09-05

Similar Documents

Publication Publication Date Title
JPH114279A (ja) 先進的システム間送信方法および機構
US7318120B2 (en) Hardware assisted communication between processors
JP3384601B2 (ja) 並列処理計算機
JPH0670787B2 (ja) 処理装置間指令転送制御システム
JPS5833970B2 (ja) プロセッサ間通信方式
EP0376003A2 (en) Multiprocessing system with interprocessor communications facility
JP2826490B2 (ja) ベクトルデータ処理装置
EP0380105A2 (en) Computer interface
JPH11238042A (ja) 分散シミュレーション制御装置
JPS61100845A (ja) メモリアクセス同期制御方式
JP3704367B2 (ja) スイッチ回路
JP2900581B2 (ja) 命令制御パイプライン構造
JPS6320555A (ja) 計算機間通信方式
JP2023084904A (ja) プロセッサ、情報処理装置及び情報処理方法
JPH01283664A (ja) 並列計算機におけるデータ転送方式
JPH04104355A (ja) マルチプロセッシング方式
WO1992005489A1 (en) Method of nonsynchronous access to shared memory
JPH056333A (ja) マルチプロセサシステム
JPH01169565A (ja) マルチプロセッサ制御方式
JPH01156856A (ja) データ転送制御方式
JPS63204456A (ja) バス制御装置
JPH06208524A (ja) 情報処理装置
JPH0325539A (ja) 記憶装置
JPS5957322A (ja) チヤネル装置の同期方式
JPH10254853A (ja) ベクトルデータ処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees