JP2001142852A - 高速並列計算用同期及び通信制御装置 - Google Patents

高速並列計算用同期及び通信制御装置

Info

Publication number
JP2001142852A
JP2001142852A JP32189699A JP32189699A JP2001142852A JP 2001142852 A JP2001142852 A JP 2001142852A JP 32189699 A JP32189699 A JP 32189699A JP 32189699 A JP32189699 A JP 32189699A JP 2001142852 A JP2001142852 A JP 2001142852A
Authority
JP
Japan
Prior art keywords
synchronization
node
communication
network
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP32189699A
Other languages
English (en)
Inventor
Tomotsugu Sekiguchi
智嗣 関口
Kiyoshi Hayakawa
潔 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP32189699A priority Critical patent/JP2001142852A/ja
Publication of JP2001142852A publication Critical patent/JP2001142852A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 スケーラビリティの向上、低レイテンシな同
期及び通信処理を行うことが可能になる高速並列計算機
用同期及び通信制御装置の提供。 【解決手段】 同期・通信ネットワークを容易に増設可
能にする構造にし、新たな同期機構の実装、同期信号と
通信信号の融合及び同期処理と通信処理のハードウェア
化により、低レイテンシな同期及び通信処理を行う。同
期処理をハードウェア化し、同期信号を直接ネットワー
クに送出するため、同期処理とデータ処理とで、ネット
ワークを切り替える。同期処理では、同期コード数を少
なくし、かつ、同期コードの種類を少なくして、デバッ
グ効率を高める同期機構を実装する。データ転送をデー
タ量が小さいパケットに限定し、パケットサイズを固定
し、各トランザクションをハードウェアで処理する。同
期及び通信処理の全ての機能を1チップに納まるように
し、伝送ケーブルの長さを短くする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、高速並列計算処理
において、同期及び通信処理の高速化を表現し、効率よ
い並列計算を可能にする高速並列計算用同期及び通信制
御装置に関する。
【0002】
【従来の技術】高速並列計算処理において、同期及び通
信処理の高速化する方法として、任意参加バリア同期と
呼ばれる同期をハードウェアで行うことが考えられてい
る。任意参加バリア同期とは、「同期参加するプロセッ
サを決め、同期に参加しているプロセッサ全てが、プロ
グラムのある地点(同期ポイントと呼ぶ)を実行するま
で、同期に参加しているプロセッサが同期ポイントの次
の実行を待つこと」をいう。
【0003】任意参加バリア同期をハードウェアで行う
方法として、図9に示す同期機構が知られている。図9
の901,902で示す複数n個(n=1,2,…)の
トランジスタを1個づつ各プロセッサに実装し、そのエ
ミッタ側をバリアライン(Barrier line)903で結合
し、バリアライン903と電源Vcc間に抵抗904を
接続することでプルアップする。しかし、このように結
合にした場合は、データ通信が行えない。また、プロセ
ッサを増設する際には、新たな装置を組み込まなければ
ならない。
【0004】905、906で示すXn(n=1,2,
…)と907、908で示すYn(n=1,2,…)
は、同期の参加及び成立状況を示すフラグである。例え
ば、k番目のプロセッサが同期に参加する場合は、Xk
を1にし、参加しない場合は、0にする。k番目のプロ
セッサが同期ポイントに到達したら、Xkを0にする。
全てのXが0になると、各プロセッサのYの値が1にな
る。k番目のプロセッサは、Ykが1になるまで、Yk
をチェックしつづける。Ykが1になったら、Xkを1
にし、Ykを0にする。この場合、Xk,Ykを再設定
する手間がかかる。
【0005】
【発明が解決しようとする課題】上述のような従来技術
には次のような解決すべき課題あり、その課題に対する
本発明の目的は次の通りである。
【0006】 同期および通信処理のレイテンシ:メ
ッセージパッシングインターフェース(MPI)の普及
により、高速並列計算処理が比較的容易に実現できるよ
うになる。しかし、それは、一般的にTCP/IP(Tr
ansmission Control Protocol/Internet Protocol)と
よばれるネットワーク技術を使うので、データ転送処理
に時間がかかる。TCP/IPは、不特定多数のコンピ
ュータでの通信を可能にするプロトコルであるため、あ
る特定のコンピュータで構成される計算機クラスタでの
並列処理には不必要な処理を行っている。そして、その
処理がレイテンシを増大させている。その不必要な処理
を取り除いた通信インターフェースを用いて処理する方
法も考えられているが、バリア処理などの低レイテンシ
を要求される処理でも、ある程度の同期データをパケッ
ト(データの塊)として転送することにより処理してい
るため、同期処理の中にデータ通信処理が必要になる。
パケットデータ転送でかかる同期処理のレイテンシは、
数百μsである。
【0007】そこで、本発明の第1の目的は、同期のレ
イテンシを200nsと、従来の1000分の1程度に
抑えることにある。
【0008】 同期及び通信装置のコスト:一般的に
知られている同期及び通信装置は、最大数百メートルの
通信ケーブルでも通信できるように設計されているた
め、安定した通信を保証するために、様々な装置が必要
となる。さらに、高速及び高機能通信を実現するため
に、ある程度大規模な処理装置を必要とし、それらのコ
ストが高い。
【0009】そこで、本発明の第2の目的は、同期及び
通信処理の制御回路ゲート数を30000ゲート程度に
し、制御チップ1個で構成できるようにすることにあ
る。
【0010】 スケーラビリティ:バリア同期処理を
電気的信号で処理する装置が考えられているが、ノード
台数を増やすために、その装置の他に、新たな装置を追
加する必要がある。
【0011】そこで、本発明の第3の目的は、新たな装
置を追加する必要なく、本発明の装置を追加することの
みで、ノード台数を増加させることができるようにする
ことにある。
【0012】 同期及び通信処理の分離:一般的に知
られている同期及び通信装置は、データ転送は可能で
も、同期処理は電気信号で処理することはできない。ま
た、同期処理を電気信号で処理できる装置では、データ
転送を処理することはできない。
【0013】そこで、本発明の第4の目的は、同期処理
を電気信号で処理可能にし、且つ、データ転送も可能に
するネットワークを用いることができるようにすること
にある。
【0014】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の発明は、マイクロプロセッサを複数用い
た高速並列計算処理において、同期・通信ネットワーク
をデータ通信で使用するか、同期処理で使用するかを制
御するため、該同期・通信ネットワークを各処理に応じ
て切換え、同期信号を該同期・通信ネットワークに直接
送出するネットワーク制御部を含む同期・通信処理制御
プロセッサと、前記ネットワーク制御部を前記同期・通
信ネットワークに結合するネットワークコネクタと、前
記同期・通信処理制御プロセッサをノード内プロセッサ
に接続するノード内プロセッサ接続用コネクタとを具備
し、前記同期・通信処理制御プロセッサにより前記同期
・通信ネットワークを容易に増設可能にしたことを特徴
とする。
【0015】ここで、前記ネットワークコネクタをLi
nk_A とLink_B 205−2にわけ、前ノー
ド(並列計算機を構成している1計算機)のLink_
Bと自ノードのLink_A、自ノードのLink_B
と次ノードのLink_Aとをパラレルケーブルで結合
したことを特徴とすることができる。
【0016】また、同期及び通信処理の全ての機能を1
チップに納まるようにし、これにより前記パラレルケー
ブルの長さを短くしたことを特徴とすることができる。
【0017】また、前記同期・通信処理プロセッサのレ
ジスタ・バッファ・フラグ等を前記ノード内プロセッサ
の特定メモリに割り当てることにより、該ノード内プロ
セッサを前記同期・通信処理プロセッサのレジスタ・バ
ッファ・フラグ等の情報にアクセス可能にしたことを特
徴とすることができる。
【0018】また、前記同期・通信処理制御プロセッサ
は前記ネットワーク制御部の他に、前記ノード内プロセ
ッサと当該同期・通信処理制御プロセッサとの間でデー
タのやり取りを行うための信号の処理を行うノード内プ
ロセッサ信号制御部と、拡張バリア同期方式で同期制御
を行う同期制御部と、コレクティブ通信(各ノードに格
納されているデータをあるノードに集めてそれらのデー
タ同士を演算したり、自ノードのデータを他の全てのノ
ードに転送したりする通信)のデータ転送時に隣接ノー
ドから送られてくるデータパケットの送受信を行うデー
タ転送制御部と、を更に有することを特徴とすることが
できる。
【0019】また、前記ネットワーク制御部は、同期処
理時のネットワーク結合を行う同期ネットワーク結合部
とトライステートバッファとを含む同期ネットワーク制
御部と、データ通信処理時のネットワーク結合を行う通
信ネットワーク結合部とトライステートバッファとを含
む通信ネットワーク制御部と、ネットワーク選択部とを
有し、前記同期ネットワーク制御部および前記通信ネッ
トワーク制御部は、前記ネットワークコネクタのLin
k_A,Link_Bのそれぞれの信号線に、前記トラ
イステートバッファを接続し、それらトライステートバ
ッファの入出力を各々の前記同期ネットワーク結合部ま
たは前記通信ネットワーク結合部へ送り、前記同期ネッ
トワーク結合部および前記通信ネットワーク結合部は、
前記Link_A,Link_Bを同期・通信処理に対
応できるように結合し、前記Link_A,Link_
Bからの信号を前記同期制御部と前記データ転送制御部
へ送り、前記ネットワーク選択部にはネットワークフラ
グが設けられ、該ネットワーク選択部は該ネットワーク
フラグが1ならば前記同期ネットワーク制御部の前記ト
ライステートバッファを有効にし、該ネットワークフラ
グが0ならば前記通信ネットワーク制御部の前記トライ
ステートバッファを有効にすることを特徴とすることが
できる。
【0020】また、データ転送を前記データパケットに
限定し、該データパケットのサイズを固定し、該データ
パケットの転送プロトコルに、スプリットトランザクシ
ョン(各トランザクションを数種類のサブアクション
(要求サブアクションや受領サブアクション)にわけ、
サブアクション単位でトランザクションを処理する通信
プロトコル)を採用し、該トランザクションの種類とし
て、Send,Receive,Reduce(あるノードに他のノード
のデータを集め、それらの値を演算するためのトランザ
クション),Broadcast(自ノードのデータを他の全て
のノードに転送するためのトランザクション),scan
(あるノードK(Kはノード番号)では、ノード番号が
K以下のノードからデータを集め、それらの値を演算す
るためのトランザクション)を用意し、各該トランザク
ションをハードウエアで処理することを特徴とすること
ができる。
【0021】また、前記同期ネットワーク結合部では、
各ノードに1本ずつ同期ポイント到着信号線を用意し、
バリア同期ポイント到着時に、前記ノード内プロセッサ
は自プロセッサ信号線をアクティブにし、同期ネットワ
ーク分割信号、部分同期成立信号および全同期成立信号
を使用して、複数N+1台以上のプロセッサ(例えば、
N=32)の並列計算機で同期を行うことを特徴とする
ことができる。
【0022】また、前記通信ネットワーク結合部は、隣
接ノード間をN/2ビット送受信データ線で結合できる
ように構成されていることを特徴とすることができる。
【0023】また、前記同期制御部は、同期成立を検出
する同期成立検出回路を有し、該同期成立検出回路内
に、それぞれ前記ノード内プロセッサから読み書き可能
な、任意参加同期を可能にするための複数Nビット(例
えば、N=32)の同期グループレジスタと、同期成立
の状態を表す2値のフラグである同期フラグとが用意さ
れ、前記同期グループレジスタの各ビットが同期グルー
プ内のノード番号x(x=0,1,2,...,N−
1)に対応し、0が同期に参加しないことを表し、1が
同期に参加することを表し、前記同期フラグの値は同期
ポイント到達信号(Sync_x:xは同期グループ内
のノード番号)として他のノードに送出されることを特
徴とすることができる。
【0024】また、前記同期成立検出回路は、各ノード
の前記同期ポイント到達信号(Sync_x:xは同期
グループ内のノード番号)を調べ、ノード数が所定の複
数N(例えば、N=32)台以下の場合、前記同期グル
ープレジスタのビットが1であるノードのSync_x
信号全てがハイならば、同期フラグを0にし、ノード数
がN+1台以上の場合、前記同期グループレジスタのビ
ットが1であるノードのSync_x信号全てがハイ
(High)で、かつ全同期成立信号がハイならば、前記同
期フラグを0にすることを特徴とすることができる。
【0025】また、前記ノード内プロセッサが同期ポイ
ントに到達した時、前記同期フラグをセットし、前記同
期成立検出回路で任意参加バリア同期の成立を検出し、
該同期成立の検出後、前記同期フラグを0にし、前記ノ
ード内プロセッサが前記同期フラグが0になることをチ
ェックすることにより、同期を行うという手順で任意参
加バリア同期およびファジーバリア同期を遂行すること
を特徴とすることができる。
【0026】また、前記同期制御部に、あるノードのあ
る同期ポイントの実行順番をkとすると、そのk番目の
同期ポイントを通過するには、その直前のk−1番目の
同期ポイントと他ノード(同期参加しているノードの
み)のk−1番目の同期ポイント全てが通過されていな
ければならないという同期方式による同期処理を行うハ
ードウエア化したRBC同期回路が組込まれていること
を特徴とすることができる。
【0027】また、前記RBC同期回路が前記同期フラ
グをチェックし、その値が1だったら、その値の1を前
記ノード内プロセッサに返し、前記同期フラグが0だっ
たら、該同期フラグを1にして、0を前記ノード内プロ
セッサに返し、かつ前記ノード内プロセッサは前記RB
C回路からの返り値が0になるまで、前記ノード内プロ
セッサが同期ポイントに到達後、前記RBC回路を動作
させる動作を繰り返すことを特徴とすることができる。
【0028】また、ノード数が所定の複数N(例えば、
N=32)を超えている場合、ノード番号が一番大きい
ノードが前記同期ネットワーク分割信号をアクティブに
し、全てのノードに、N+1台以上で同期を行うことを
知らせ、全ノードをN台ずつの同期グループに分け、グ
ループ内では、前記Sync_xを使用した同期回路で
同期を検出し、グループ間では、前記同期ネットワーク
分割信号、前記全同期信号および前記部分同期信号を使
用して同期を行い、グループ内部の同期結果を他のグル
ープに知らせるのは、同期グループ内のノード番号x
(x=0,1,2,...,N−1)がN−1のノード
(内部のノード数がNより少ないグループは、その内部
での最大ノード番号)が行い、最初のグループから順々
にグループ内同期が成立していることを知らせ、最終グ
ループ内のノード番号が最大のノードが、前記全同期成
立信号をアクティブにし、該全同期成立信号を各ノード
が検出することにより、N台を超える同期を行うことが
可能とすることを特徴とすることができる。
【0029】(作用)本発明では、同期を低レイテンシ
で行うために、同期処理をハードウェア化している。ま
た、パケットデータを転送して同期処理する方式では、
パケットデータ転送自体のレイテンシが大きいので、同
期信号を直接ネットワークに送出している。これを可能
にするため、同期処理とデータ処理とで、ネットワーク
を切り替えている。同期処理では、バリア同期の他に、
同期コード数を少なくでき、かつ、同期コードの種類を
少なくし、デバッグ効率を高めることの可能な新たな同
期機構を実装するようにしたので、効率よい並列処理を
実現することができる。
【0030】さらに、本発明では、データ転送を、低レ
イテンシが要求されるデータ量が小さいパケットに限定
し、そのパケットサイズを固定している。そして、Send
(送信),Receive(受信)の他に、Broadcast(同報通
信;自ノードのデータを他の全てのノードに転送するた
めのトランザクション), Reduce(換算;あるノードに
他のノードのデータを集め、それらの値を演算するため
のトランザクション), Scan(探査;あるノードK(K
はノード番号)では、ノード番号がK以下のノードから
データを集め、それらの値を演算するためのトランザク
ション)のトランザクションを用意する。各トランザク
ションをハードウェアで処理する。
【0031】さらに、本発明では、コストを抑えるた
め、処理する機能を少なくすることにより、同期及び通
信処理の全ての機能を1チップに納まるようにしてい
る。また、伝送ケーブルの長さを短くすることにより、
ノイズカットなどの装置を簡単に構成できるようにして
いる。
【0032】本発明の装置は、上記構成により、一般的
なコンピュータに搭載されているPCI(peripheral c
omponent interconnect)バス等に接続することがで
き、容易に同期処理の高速化を実現できるので、一般的
なコンピュータで構成された並列計算機の需要を促進す
るとともに、並列アプリケーションの発展を促進し、さ
らには、廉価な同期・通信装置のために並列計算機の低
コスト化を促進すると期待される。
【0033】
【発明の実施の形態】以下、図面を参照して、本発明の
実施の形態における装置の構成、同期信号と通信信号の
融合方式、本装置で処理する同期方式について詳細に説
明する。
【0034】[装置の構成]本発明の一実施形態におけ
る高速並列計算用同期及び通信制御装置を搭載した並列
計算機の構成例を図1に示す。
【0035】複数N個の各ノード(Node)101(ここ
でいうノードとは、並列計算機を構成している1計算機
をいう)間は、イーサネット・スイッチ(Ethernet Swi
tch)などのネットワーク103と同期・コレクティブ
(Collective)データ通信専用ネットワークである同期
・通信ネットワーク107の2種類のネットワークで結
合する。各ノード101のネットワーク・インターフェ
ース(NIC:Network Interface)105は、それぞ
れのノード101とネットワーク103を接続する。各
ノード101の同期・通信制御装置(高速並列計算用同
期及び通信制御装置)109は、それぞれのノード10
1と同期・通信ネットワーク107とを接続する。この
構成により、高スループットを要求する処理は、従来あ
る例えばイーサネット(Ethernet)を利用し、低レイテ
ンシを要求し、且つ、同期・通信制御装置109がサポ
ートしている処理は、同期・通信制御装置109を使用
して処理する。
【0036】上記同期・通信制御装置109の実装例を
図2に示す。同期・通信制御装置109は、ノード内プ
ロセッサに接続できるコネクタ201をもつ同期・通信
コントロール電気回路基板である。
【0037】同期・通信制御装置109には、同期・通
信処理制御用プロセッサ203、ネットワークコネクタ
(Link_A,Link_B)205、信号表示装置
207及び状態表示装置209が実装されている。
【0038】上記各ノード109と上記同期・通信ネッ
トワーク107の結合例を図3に示す。ネットワークコ
ネクタ205をLink_A 205−1とLink_
B205−2にわけ、前ノードのLink_B 205
−2と自ノードのLink_A 205−1、自ノード
のLink_B 205−2と次ノードのLink_A
205−1とを信号線M本のパラレルケーブル301
で結合する。
【0039】パラレルケーブル301の信号線は、ショ
ットキーバリアダイオード(図示しない)でノイズをカ
ットして、同期・通信処理制御用プロセッサ203の入
出力ピンに接続されている。ケーブル301の長さは、
75cm以下とする。
【0040】[同期・通信処理制御プロセッサ]同期・
通信制御装置109の同期・通信処理の機能は、同期・
通信処理制御プロセッサ203に実装する。図4に示す
ように、同期・通信処理制御プロセッサ203に実装す
る機能は、ネットワーク制御部401、ノード内プロセ
ッサ信号制御部(プロセッサ接続信号制御部ともいう)
403、同期制御部405、およびデータ転送制御部
(データ通信制御部ともいう)407である。
【0041】ネットワーク制御部401は同期・通信ネ
ットワーク107側と接続し、同期制御部405および
データ転送制御部407はそれぞれネットワーク制御部
401と内部バス(Bus)409間に並列に接続し、ノ
ード内プロセッサ信号制御部403は内部バス409と
ノード内プロセッサ接続バス(Bus)411間に接続す
る。
【0042】[ネットワーク制御部]上記ネットワーク
制御部401は、通信・同期ネットワーク107をデー
タ通信で使用するか、同期処理で使用するかを制御す
る。[計算機プロセッサ信号制御部]上記ノード内プロ
セッサ信号制御部403では、ノード内プロセッサ(図
示しない)と同期・通信処理制御プロセッサ203との
間でデータをやり取りを行うための信号処理を行う。
【0043】また、ノード内プロセッサ(図示しない)
がアクセスできる特定のメモリに、上記同期・通信処理
制御プロセッサ203のレジスタ・バッファ・フラグな
どを割り当てることにより、ノード内プロセッサを同期
・通信処理制御プロセッサ203のレジスタ・バッファ
・フラグなどの情報にアクセス可能にしている。
【0044】[同期制御部]上記同期制御部405は、
拡張バリア同期方式の制御を行う。同期・通信制御装置
109で処理される同期方式は、任意参加バリア同期方
式、ファジーバリア(Fuzzy Barrier)同期方式、RB
C(Reduced Barrier Code)同期方式の3種類である。
【0045】[データ転送制御部]上記データ転送制御
部407は、コレクティブ(Collective)通信のデータ
転送時に使用される。
【0046】データ転送制御部407では、隣接ノード
101から送られてくるデータパケットの送受信を行
う。そのデータ転送路は、N/2ビット双方向パラレル
リンクである。データ転送制御部407はN/2ビット
単位でハンドシェイクを行いながら、データの送受信を
行う。
【0047】上記データパケットの容量は、例えば、パ
ケットヘッダ8バイト(Byte)、ペイロード56バイト
の合計64バイトにする。
【0048】データパケットの転送プロトコルは、スプ
リットトランザクションを採用する。トランザクション
の種類は、Send,Receive,Reduce,Broadcast,Scanを
用意する。
【0049】[同期信号と通信信号の融合方式]同期信
号と通信信号の融合は、上記ネットワーク制御部401
で行われる。ネットワーク制御部401を、例えば図5
に示す構成にし、各処理に応じて同期・通信ネットワー
クを切替える。同期と通信のネットワークを切り替える
ため、同期ネットワーク制御部501および通信ネット
ワーク制御部505では、図3で説明したLink_
A,Link_Bのそれぞれの信号線に、トライステー
トバッファ503、504、507、508を接続し、
それらトライステートバッファの入出力を各ネットワー
ク結合部(同期ネットワーク結合部、通信ネットワーク
結合部)502、506へ送る。
【0050】各ネットワーク結合部502、506で
は、Link_A,Link_Bを同期・通信処理に対
応できるように結合し、Link_A,Link_Bか
らの信号を同期制御部405・データ転送制御部407
へ送る。
【0051】ネットワーク選択部509にはネットワー
クフラグが設けられており、ネットワーク選択部509
はそのネットワークフラグが1ならば同期ネットワーク
制御部501のトライステートバッファ503、504
を有効にし、そのネットワークフラグが0ならば通信ネ
ットワーク制御部505のトライステートバッファ50
7、508を有効にする。
【0052】[同期処理時のネットワーク結合]同期処
理時のネットワーク結合を行う上記同期ネットワーク結
合部502は、図6に示す構成(N=32の場合)にし
て、Link_AとLink_Bを結合する。ここで、
405−0は同期グループ内のノード番号が0の同期制
御部、405−1は同期グループ内のノード番号が1の
同期制御部、405−31は同期グループ内のノード番
号が31の同期制御部である。
【0053】同期ネットワーク結合部502では、各ノ
ードに1本ずつ同期ポイント到着信号線600〜631
を用意し、バリア同期ポイント到着時に、プロッセサN
台を超えるノード内プロセッサ(図示しない)は自プロ
セッサ信号線(Sync_k:kは自ノードの同期グル
ープ内でのノード番号)をアクティブ(High)にする。
本同期・通信制御装置109の例では、基本的に所定の
複数N台のプロセッサまでの並列計算機に対応している
が、同期ネットワーク分割信号640、部分同期成立信
号650および全同期成立信号660を使用して、プロ
セッサN台以上の並列計算機で同期を行うことが可能で
ある。具体例としては、N=32である。以下、Nが3
2の場合について述べる。 [データ通信処理時のネットワーク結合]データ通信処
理時のネットワーク結合を行う上記通信ネットワーク結
合部506は、隣接ノード間をN/2ビット送受信デー
タ線で結合できるように構成される。実装例として、図
7に示すように、隣接ノードに接続されている36ピン
を送信データ線16本、受信データ線16本、送信制御
線2本、受信制御線2本に分ける。ここで、505−0
はノード0のネットワーク制御部、505−1はノード
1のネットワーク制御部、505−30はノード30の
ネットワーク制御部、505−31はノード31のネッ
トワーク制御部である。
【0054】[同期制御部内の同期検出方式]図8に示
すように、同期制御部405は、任意参加同期を可能に
するため、同期成立検出回路801内に複数Nビット
(具体例としては、N=32)の同期グループレジスタ
803を用意する。同期グループレジスタ803の各ビ
ットが各ノードに対応し、0が同期に参加しないことを
表し、1が同期に参加することを表す。同期グループレ
ジスタは803、ノード内プロセッサ(図示しない)か
ら読み書き可能である。
【0055】また、同期成立検出回路801内の同期フ
ラグ805は、同期成立の状態を表す2値(0:ローレ
ベル(Low)と1:ハイレベル(High))フラグであ
る。この同期フラグ805も、ノード内プロセッサから
読み書き可能である。同期フラグ805の値は、Syn
c_k(kは自ノードの同期グループ内でのノード番
号)として、他のノードに送出する。
【0056】ノード数が所定の複数Nを超えている場合
(以下、具体例として、N=32の場合で説明する)、
ノード番号Jが一番大きいノードが同期ネットワーク分
割信号640をアクティブ(High)にし、全てのノード
に、32台以上で同期を行うことを知らせる。全ノード
を32台ずつのグループに分け、グループ内では、Sy
nc_xを使用した同期回路で同期を検出し、グループ
間では、同期ネットワーク分割信号640、全同期信号
660および部分同期信号650を使用して同期を行
う。グループ内部の同期結果を他のグループに知らせる
のは、同期グループ内のノード番号が31のノード(内
部のノード数が32より少ないグループは、その内部で
の最大ノード番号)が行う。最初のグループから順々に
グループ内同期が成立していることを知らせ、最終グル
ープ内のノード番号が最大のノードが、全同期成立信号
660をアクティブ(High)にする。この全同期成立信
号660を各ノードが検出することにより、32台を超
える同期を行うことが可能である。
【0057】同期成立検出回路801は、各ノードの同
期ポイント到達信号(Sync_x:xは同期グループ
内のノード番号)を調べる。ノード数が32台以下の場
合、同期グループレジスタ803のビットが1であるノ
ードのSync_x信号全てがハイ(High)ならば、同
期フラグを0にする。ノード数が32台以上の場合、同
期グループレジストタ803のビットが1であるノード
のSync_x信号全てがハイ(High)で、かつ全同期
成立信号660がハイ(High)ならば、同期フラグ80
5を0にする。
【0058】さらに、後述の新たな同期方式(RBC同
期方式)を行うため、RBC同期回路807を同期制御
部405に組み込む。 [任意参加バリア同期方式およびファジーバリア同期方
式]従来技術の任意参加バリア同期方式及びファジーバ
リア同期方式では、同期到達フラグ及び同期成立フラグ
の2種類の2値フラグを用意し、同期到達フラグにセッ
トすることで同期ポイント到達信号を出しつづけ、同期
が成立した後、同期成立フラグをセットして、同期の成
立を知らせている。この場合、同期到達フラグおよび同
期成立後フラグをリセットする必要が生じる。
【0059】そこで、本発明では、任意参加バリア同期
方式及びファジーバリア同期方式では、同期フラグを1
つにし、以下の手順で任意参加バリア同期方式及びファ
ジーバリア同期方式を行う。
【0060】 ノード内プロセッサが同期ポイントに
到達した時、同期フラグ805をセットする。
【0061】 同期成立検出回路801で任意参加バ
リア同期の成立を検出する。その同期成立の検出後、同
期フラグ805を0にする。
【0062】 ノード内プロセッサ(図示しない)は
同期フラグ805が0になることをチェックすることに
より、同期を行う。
【0063】上記の手順と上記の手順が不可分に行
われれば、任意参加バリア同期方式になり、可分に行え
ば、ファジーバリア同期方式になる。
【0064】[RBC同期方式]RBC同期方式では、
「あるノードのある同期ポイントの実行順番をkとする
と、そのk番目の同期ポイントを通過するには、その直
前のk−1番目の同期ポイントと他ノード(同期参加し
ているノードのみ)のk−1番目の同期ポイント全てが
通過されていなければならない」という同期を行う。
【0065】この動作を行うため、RBC回路807で
は、RBC回路807が同期フラグ805をチェック
し、その値が1だったら、その値の1をノード内プロセ
ッサ(図示しない)に返す。RBC回路807は同期フ
ラグ805が0だったら、その同期フラグ805を1に
して、0をノード内プロセッサに返す。
【0066】ノード内プロセッサは以下の手順を行うこ
とにより、RBC同期方式を行う。
【0067】 ノード内プロセッサが同期ポイントに
到達後、RBC回路807を動作させる。
【0068】 ノード内プロセッサはRBC回路80
7からの返り値が0になるまで、の手順を繰り返す。
【0069】このRBC同期方式は、以下の利点があ
る。
【0070】(a)RBC同期方式では、同期命令が1
種類で、バリア領域を形成できる。一方、ファジーバリ
ア方式では、同期命令が2種類必要である。
【0071】(b)同期コードが1種類になったので、
同期コードの挿入がしやすくなり、デバッグ効率もよく
なる。
【0072】(c)ファジーバリア同期方式の出口同期
命令の直後に入口同期命令が連続して挿入されている場
合、RBC同期命令1つで置き換えることが可能なた
め、同期命令を削減できる。
【0073】(d)ノード内プロセッサが実行する同期
手順が簡単なため、高速な動作が可能である。
【0074】
【発明の効果】以上説明したように、本発明によれば、
同期・通信ネットワークを容易に増設可能にする構造に
したので、スケーラビリティの向上が可能となる。
【0075】更に、本発明の具体例によれば、同期のレ
イテンシを200nsと、従来の1000分の1程度に
抑えることができ、また同期及び通信処理の制御回路ゲ
ート数を30000ゲート程度にし、制御チップ1個で
構成でき、また新たな装置を追加する必要なく、本発明
の装置を追加することのみで、ノード台数を増加させる
ことができ、また同期処理を電気信号で処理可能にし、
且つ、データ転送も可能にするネットワークを用いるこ
とができる等の効果を有する。
【0076】このように、本発明によれば、新たな同期
機構の実装、同期信号と通信信号の融合及び同期処理と
通信処理のハードウェア化により、低レイテンシな同期
及び通信処理を行うことが可能になり、高速な並列計算
が実現される顕著な効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施形態における高速並列計算用同
期及び通信制御装置を搭載した並列計算機の構成例を示
すブロック図である。
【図2】図1の同期・通信制御装置109の実装例を示
す配置構成図である。
【図3】図1の各ノードの同期・通信制御装置109と
同期・通信ネットワーク107の結合例を示すブロック
図である。
【図4】図2、図3の同期・通信処理制御プロセッサ2
03に実装する機能を示すブロック図である。
【図5】図4のネットワーク制御部401の構成を示す
ブロック図である。
【図6】図5のネットワーク結合部502の構成を示す
ブロック図である。
【図7】図5の通信ネットワーク結合部506の信号線
の構成を示すブロック図である。
【図8】図4の同期制御部405の内部構成を示すブロ
ック図である。
【図9】従来例の任意参加バリア同期をハードウェアで
行う同期機構の構成を示すブロック図である。
【符号の説明】
101 ノード 103 ネットワーク 105 ネットワーク・インタフェース 107 同期・通信ネットワーク 109 同期・通信制御装置 201 ノード内プロセッサ接続用コネクタ 203 同期・通信処理制御プロセッサ 205 ネットワークコネクタ 207 信号表示装置 209 状態表示装置 301 パラレルケーブル 401 ネットワーク制御部 403 ノード内プロセッサ信号制御部 405 同期制御部 407 データ転送制御部 409 内部バス 411 ノード内プロセッサ接続バス 501 同期ネットワーク制御部 502 同期ネットワーク結合部 503、504、507、508 トライステートバッ
ファ 505 通信ネットワーク制御部 506 通信ネットワーク結合部 509 ネットワーク選択部 640 同期ネットワーク分割信号 650 部分同期成立信号 660 全同期成立信号 801 同期成立検出回路 803 同期グループレジスタ 805 同期フラグ 807 RBC回路 901、902 トランジスタ 903 バリアライン 904 抵抗 905〜908 フラグ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/78 510 G06F 15/78 510A 510G // H04L 12/28 H04L 11/00 310Z

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 マイクロプロセッサを複数用いた高速並
    列計算処理において、 同期・通信ネットワークをデータ通信で使用するか、同
    期処理で使用するかを制御するため、該同期・通信ネッ
    トワークを各処理に応じて切換え、同期信号を該同期・
    通信ネットワークに直接送出するネットワーク制御部を
    含む同期・通信処理制御プロセッサと、 前記ネットワーク制御部を前記同期・通信ネットワーク
    に結合するネットワークコネクタと、 前記同期・通信処理制御プロセッサをノード内プロセッ
    サに接続するノード内プロセッサ接続用コネクタとを具
    備し、 前記同期・通信処理制御プロセッサにより前記同期・通
    信ネットワークを容易に増設可能にしたことを特徴とす
    る高速並列計算用同期及び通信制御装置。
  2. 【請求項2】 前記ネットワークコネクタをLink_
    A とLink_B205−2にわけ、前ノード(並列
    計算機を構成している1計算機)のLink_Bと自ノ
    ードのLink_A、自ノードのLink_Bと次ノー
    ドのLink_Aとをパラレルケーブルで結合したこと
    を特徴とする請求項1に記載の高速並列計算用同期及び
    通信制御装置。
  3. 【請求項3】 同期及び通信処理の全ての機能を1チッ
    プに納まるようにし、これにより前記パラレルケーブル
    の長さを短くしたことを特徴とする請求項2に記載の高
    速並列計算用同期及び通信制御装置。
  4. 【請求項4】 前記同期・通信処理プロセッサのレジス
    タ・バッファ・フラグ等を前記ノード内プロセッサの特
    定メモリに割り当てることにより、該ノード内プロセッ
    サを前記同期・通信処理プロセッサのレジスタ・バッフ
    ァ・フラグ等の情報にアクセス可能にしたことを特徴と
    する請求項1ないし3のいずれかに記載の高速並列計算
    用同期及び通信制御装置。
  5. 【請求項5】 前記同期・通信処理制御プロセッサは前
    記ネットワーク制御部の他に、 前記ノード内プロセッサと当該同期・通信処理制御プロ
    セッサとの間でデータのやり取りを行うための信号の処
    理を行うノード内プロセッサ信号制御部と、 拡張バリア同期方式で同期制御を行う同期制御部と、 コレクティブ通信(各ノードに格納されているデータを
    あるノードに集めてそれらのデータ同士を演算したり、
    自ノードのデータを他の全てのノードに転送したりする
    通信)のデータ転送時に隣接ノードから送られてくるデ
    ータパケットの送受信を行うデータ転送制御部と、を更
    に有することを特徴とする請求項1ないし4のいずれか
    に記載の高速並列計算用同期及び通信制御装置。
  6. 【請求項6】 前記ネットワーク制御部は、 同期処理時のネットワーク結合を行う同期ネットワーク
    結合部とトライステートバッファとを含む同期ネットワ
    ーク制御部と、 データ通信処理時のネットワーク結合を行う通信ネット
    ワーク結合部とトライステートバッファとを含む通信ネ
    ットワーク制御部と、 ネットワーク選択部とを有し、 前記同期ネットワーク制御部および前記通信ネットワー
    ク制御部は、前記ネットワークコネクタのLink_
    A,Link_Bのそれぞれの信号線に、前記トライス
    テートバッファを接続し、それらトライステートバッフ
    ァの入出力を各々の前記同期ネットワーク結合部または
    前記通信ネットワーク結合部へ送り、 前記同期ネットワーク結合部および前記通信ネットワー
    ク結合部は、前記Link_A,Link_Bを同期・
    通信処理に対応できるように結合し、前記Link_
    A,Link_Bからの信号を前記同期制御部と前記デ
    ータ転送制御部へ送り、 前記ネットワーク選択部にはネットワークフラグが設け
    られ、該ネットワーク選択部は該ネットワークフラグが
    1ならば前記同期ネットワーク制御部の前記トライステ
    ートバッファを有効にし、該ネットワークフラグが0な
    らば前記通信ネットワーク制御部の前記トライステート
    バッファを有効にすることを特徴とする請求項5に記載
    の高速並列計算用同期及び通信制御装置。
  7. 【請求項7】 データ転送を前記データパケットに限定
    し、該データパケットのサイズを固定し、該データパケ
    ットの転送プロトコルに、スプリットトランザクション
    (各トランザクションを数種類のサブアクション(要求
    サブアクションや受領サブアクション)にわけ、サブア
    クション単位でトランザクションを処理する通信プロト
    コル)を採用し、該トランザクションの種類として、Se
    nd,Receive,Reduce(あるノードに他のノードのデー
    タを集め、それらの値を演算するためのトランザクショ
    ン),Broadcast(自ノードのデータを他の全てのノー
    ドに転送するためのトランザクション),scan(あるノ
    ードK(Kはノード番号)では、ノード番号がK以下の
    ノードからデータを集め、それらの値を演算するための
    トランザクション)を用意し、各該トランザクションを
    ハードウエアで処理することを特徴とする請求項5に記
    載の高速並列計算用同期及び通信制御装置。
  8. 【請求項8】 前記同期ネットワーク結合部では、各ノ
    ードに1本ずつ同期ポイント到着信号線を用意し、バリ
    ア同期ポイント到着時に、前記ノード内プロセッサは自
    プロセッサ信号線をアクティブにし、同期ネットワーク
    分割信号、部分同期成立信号および全同期成立信号を使
    用して、複数N+1台(N=パラレルケーブルの信号数
    M−8)以上のプロセッサの並列計算機で同期を行うこ
    とを特徴とする請求項6に記載の高速並列計算用同期及
    び通信制御装置。
  9. 【請求項9】 前記通信ネットワーク結合部は、隣接ノ
    ード間をN/2ビット送受信データ線で結合できるよう
    に構成されていることを特徴とする請求項6または8に
    記載の高速並列計算用同期及び通信制御装置。
  10. 【請求項10】 前記同期制御部は、同期成立を検出す
    る同期成立検出回路を有し、 該同期成立検出回路内に、それぞれ前記ノード内プロセ
    ッサから読み書き可能な、任意参加同期を可能にするた
    めの複数Nビットの同期グループレジスタと、同期成立
    の状態を表す2値のフラグである同期フラグとが用意さ
    れ、 前記同期グループレジスタの各ビットが同期グループ内
    のノード番号x(ノード番号J(J=0,1,
    2,...,n−1)とすると、x=MOD(J/N)
    (J÷Nの余り))に対応し、0が同期に参加しないこ
    とを表し、1が同期に参加することを表し、前記同期フ
    ラグの値は同期ポイント到達信号(Sync_x:xは
    同期グループ内のノード番号(x=0,1,
    2,...,N−1)として同期グループ内の他のノー
    ドに送出されることを特徴とする請求項6または8に記
    載の高速並列計算用同期及び通信制御装置。
  11. 【請求項11】 前記同期成立検出回路は、各ノードの
    前記同期ポイント到達信号(Sync_x:xは同期グ
    ループ内のノード番号)を調べ、ノード数が所定の複数
    N台以下の場合、前記同期グループレジスタのビットが
    1であるノードのSync_x信号全てがハイならば、
    同期フラグを0にし、ノード数がN台を超える場合、前
    記同期グループレジスタのビットが1であるノードのS
    ync_x信号全てがハイ(High)で、かつ全同期成立
    信号がハイならば、前記同期フラグを0にすることを特
    徴とする請求項10に記載の高速並列計算用同期及び通
    信制御装置。
  12. 【請求項12】 前記ノード内プロセッサが同期ポイン
    トに到達した時、前記同期フラグをセットし、前記同期
    成立検出回路で任意参加バリア同期の成立を検出し、該
    同期成立の検出後、前記同期フラグを0にし、前記ノー
    ド内プロセッサが前記同期フラグが0になることをチェ
    ックすることにより、同期を行うという手順で任意参加
    バリア同期およびファジーバリア同期を遂行することを
    特徴とする請求項10または11に記載の高速並列計算
    用同期及び通信制御装置。
  13. 【請求項13】 前記同期制御部に、あるノードのある
    同期ポイントの実行順番をkとすると、そのk番目の同
    期ポイントを通過するには、その直前のk−1番目の同
    期ポイントと他ノード(同期参加しているノードのみ)
    のk−1番目の同期ポイント全てが通過されていなけれ
    ばならないという同期方式による同期処理を行うハード
    ウエア化したRBC同期回路が組込まれていることを特
    徴とする請求項10または11に記載の高速並列計算用
    同期及び通信制御装置。
  14. 【請求項14】 前記RBC同期回路が前記同期フラグ
    をチェックし、その値が1だったら、その値の1を前記
    ノード内プロセッサに返し、前記同期フラグが0だった
    ら、該同期フラグを1にして、0を前記ノード内プロセ
    ッサに返し、かつ前記ノード内プロセッサは前記RBC
    回路からの返り値が0になるまで、前記ノード内プロセ
    ッサが同期ポイントに到達後、前記RBC回路を動作さ
    せる動作を繰り返すことを特徴とする請求項13に記載
    の高速並列計算用同期及び通信制御装置。
  15. 【請求項15】 ノード数が所定の複数Nを超えている
    場合、ノード番号が一番大きいノードが前記同期ネット
    ワーク分割信号をアクティブにし、全てのノードに、N
    台+1以上で同期を行うことを知らせ、全ノードをN台
    ずつの同期グループに分け、グループ内では、前記Sy
    nc_xを使用した同期回路で同期を検出し、グループ
    間では、前記同期ネットワーク分割信号、前記全同期信
    号および前記部分同期信号を使用して同期を行い、グル
    ープ内部の同期結果を他のグループに知らせるのは、同
    期グループ内のノード番号x(x=0,1,
    2,...,N−1のノード)(内部のノード数がNよ
    り少ないグループは、その内部での最大ノード番号)が
    行い、最初のグループから順々にグループ内同期が成立
    していることを知らせ、最終グループ内のノード番号が
    最大のノードが、前記全同期成立信号をアクティブに
    し、該全同期成立信号を各ノードが検出することによ
    り、N台を超える同期を行うことが可能とすることを特
    徴とする請求項8に記載の高速並列計算用同期及び通信
    制御装置。
JP32189699A 1999-11-12 1999-11-12 高速並列計算用同期及び通信制御装置 Pending JP2001142852A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32189699A JP2001142852A (ja) 1999-11-12 1999-11-12 高速並列計算用同期及び通信制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32189699A JP2001142852A (ja) 1999-11-12 1999-11-12 高速並列計算用同期及び通信制御装置

Publications (1)

Publication Number Publication Date
JP2001142852A true JP2001142852A (ja) 2001-05-25

Family

ID=18137620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32189699A Pending JP2001142852A (ja) 1999-11-12 1999-11-12 高速並列計算用同期及び通信制御装置

Country Status (1)

Country Link
JP (1) JP2001142852A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011001519A1 (ja) 2009-06-30 2011-01-06 富士通株式会社 計算装置、並列計算機システムおよび同期プログラム
CN106655975A (zh) * 2015-10-28 2017-05-10 发那科株式会社 兼顾低延时和高吞吐量的数据通信的电动机控制装置
JP7406539B2 (ja) 2018-07-04 2023-12-27 グラフコアー リミテッド ストリーミングエンジン

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011001519A1 (ja) 2009-06-30 2011-01-06 富士通株式会社 計算装置、並列計算機システムおよび同期プログラム
CN106655975A (zh) * 2015-10-28 2017-05-10 发那科株式会社 兼顾低延时和高吞吐量的数据通信的电动机控制装置
JP2017085786A (ja) * 2015-10-28 2017-05-18 ファナック株式会社 低レイテンシと高スループットのデータ通信を両立するモータ制御装置
CN106655975B (zh) * 2015-10-28 2019-04-26 发那科株式会社 兼顾低延时和高吞吐量的数据通信的电动机控制装置
JP7406539B2 (ja) 2018-07-04 2023-12-27 グラフコアー リミテッド ストリーミングエンジン

Similar Documents

Publication Publication Date Title
Dally et al. The reliable router: A reliable and high-performance communication substrate for parallel computers
US5617547A (en) Switch network extension of bus architecture
US4929939A (en) High-speed switching system with flexible protocol capability
US7941569B2 (en) Input/output tracing in a protocol offload system
US6260092B1 (en) Point to point or ring connectable bus bridge and an interface with method for enhancing link performance in a point to point connectable bus bridge system using the fiber channel
EP1779609B1 (en) Integrated circuit and method for packet switching control
JPS60148249A (ja) メツセ−ジ除去方法
Ahuja S/Net: A high-speed interconnect for multiple computers
US20220114132A1 (en) Data Switch Chip and Server
US6208645B1 (en) Time multiplexing of cyclic redundancy functions in point-to-point ringlet-based computer systems
JP2003050788A (ja) 高レベル・データ・リンク・コントローラから多数個のディジタル信号プロセッサ・コアに信号を分配するための装置と方法
JP2782521B2 (ja) マルチプロセッサ構造体のための相互接続システム
CA2105054C (en) Master microchannel apparatus for converting to switch architecture
JP2001142852A (ja) 高速並列計算用同期及び通信制御装置
Scott The SCX channel: A new, supercomputer-class system interconnect
US6378017B1 (en) Processor interconnection
RU2642383C2 (ru) Способ передачи информации
JP2004526223A (ja) バスを介したデータの同報通信
Ibbett et al. Centrenet–A High Performance Local Area Network
KR100391712B1 (ko) 교환기의 아이피시 정합 장치
KR100250465B1 (ko) 고속병렬컴퓨터의 메시지 전송 방법
EP0588021A2 (en) Switch-based personal computer interconnection apparatus
CN116680224A (zh) 不对称PCIe总线设计方法、装置、总线装置及系统
EP0651336A1 (en) Switch network extension of bus architecture
Lee et al. A phase-based approach for on-chip bus architecture optimization

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A02 Decision of refusal

Effective date: 20060214

Free format text: JAPANESE INTERMEDIATE CODE: A02