JP2001051966A - ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体 - Google Patents

ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体

Info

Publication number
JP2001051966A
JP2001051966A JP11229754A JP22975499A JP2001051966A JP 2001051966 A JP2001051966 A JP 2001051966A JP 11229754 A JP11229754 A JP 11229754A JP 22975499 A JP22975499 A JP 22975499A JP 2001051966 A JP2001051966 A JP 2001051966A
Authority
JP
Japan
Prior art keywords
node
parallel processing
node device
barrier synchronization
establishment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11229754A
Other languages
English (en)
Inventor
Takashi Hagiwara
孝 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP11229754A priority Critical patent/JP2001051966A/ja
Publication of JP2001051966A publication Critical patent/JP2001051966A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】同期機構の複雑化を招かずしかも特別な通信機
構を不要として、1つのジョブを複数のプロセスに分割
しこれらを複数のノード装置で並列処理する。 【解決手段】ノード内バリア同期機構210aが、自装
置内に設けたCPUからの同期リクエストに基づいて自
装置内でのバリア同期が成立したことを検出すると共
に、この自装置内でのバリア同期成立の情報を、並列処
理を実行する全ノード装置に通知する。一方、ノード間
バリア同期機構220aは、この並列処理を実行する他
のノード装置から通知される他装置内でのバリア同期成
立の情報に基づいて、並列処理が完了したことを検出す
る。したがって、バリア同期機構の複雑化を招かずしか
も特別な通信機構を設けずに、自装置内でのバリア同期
成立の情報を送受信することによって並列処理の完了が
検出される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、1つのジョブを複
数のプロセスに分割し複数のノード装置で並列処理する
ノード装置、並列処理システム、並列処理方法および並
列処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】複雑な科学計算等の各種のジョブを実行
するために、近年、1つのジョブを複数のプロセスに分
割しそれらを並列処理することが提案されており、この
並列処理によれば複雑な科学計算等も高速に実行され
る。
【0003】このような並列処理を行う並列計算システ
ムとして、1つのプロセッサとメモリと通信制御等を行
う通信制御ユニットを基本構成とし、この基本構成を持
つ装置を特別な通信機構を設けた専用通信網で接続した
完全分散メモリ型並列計算機がある。しかし、近年で
は、専用通信網を介して送受信される情報転送等による
並列処理オーバーヘッドの少なさから、複数のプロセッ
サがメモリを共有するSMP(Symmetric Multiple P
rocessor)部と通信制御ユニットを基本構成とし、この
基本構成を持つ装置を特別な通信機構を設けた専用通信
網で接続した分散共有メモリ型並列計算機システムが注
目を浴びている。
【0004】これらの並列計算機システムにおいては、
複数のプロセッサが同期をとりながら夫々に割り付けら
れたプロセスを実行することによって、1つのジョブを
並列処理していく必要があるため、同期処理の高速化や
同期機構の簡素化は重要な事項である。例えば、特許番
号第2783192号公報によれば、そのための同期装
置が開示されており、1つのCPUを同期単位として各
CPUとバリア同期機構との間に論理ゲートや多数の信
号線からなる通信路を設けたものであった。
【0005】
【発明が解決しようとする課題】しかしながら、分散共
有メモリ型並列計算機にあっては、複数のプロセッサを
備える各ノード装置内での同期をとりながら、さらに、
特別な通信機構を用いてノード装置間で各装置内での同
期情報をやりとりすることによって1つのジョブを並列
処理していく、いわば2階層(ノード装置内とノード装
置間)での同期を行うものである。
【0006】したがって、特許番号第2783192号
公報に記載のもののように、各CPUを同期単位とし
た、いわば1階層(ノード装置間は考慮せず)の同期技
術をそのまま適用することはできず、しかも実際には数
百〜数千個となるCPUの夫々とバリア同期機構との間
にこの公報に記載されているような通信路を設けると同
期機構が複雑になるといった問題もあった。
【0007】また、特開平10−83379号公報に記
載の技術によれば、複数のプロセッサを備える計算機間
で情報を送受信しながら1つのジョブを実行させる技術
が開示されているものの、送受信される情報が複雑であ
ったり、同期を行うための特別な通信機構も必要になる
といった問題があった。
【0008】本発明は、かかる従来の課題を解決するた
めになされたもので、同期機構の複雑化を招かずしかも
特別な通信機構を不要として、1つのジョブを複数のプ
ロセスに分割しこれらを複数のノード装置で並列処理す
るための手段を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に係る発明は、1つのジョブを複数のプロ
セスに分割しこれらを1以上の他ノード装置と共同で並
列処理するためのノード装置であって、自ノード装置内
でのバリア同期の対象となる複数のプロセッサと、前記
複数のプロセッサからの同期リクエストに基づいて自ノ
ード装置内でのバリア同期が成立したことを検出し、こ
の自ノード装置内でのバリア同期成立の情報を、前記並
列処理を実行する全ノード装置に通知するノード内バリ
ア同期機構と、前記並列処理を実行する他の全ノード装
置から通知される他ノード装置内でのバリア同期成立の
情報に基づいて、前記並列処理が完了したことを検出す
るノード間バリア同期機構と、を備えることを特徴とす
るノード装置である。
【0010】この発明によれば、ノード内バリア同期機
構が、複数のプロセッサからの同期リクエストに基づい
て自ノード装置内でのバリア同期が成立したことを検出
し、この自ノード装置内でのバリア同期成立の情報を、
並列処理を実行する全ノード装置に通知する。
【0011】一方、ノード間バリア同期機構は、この並
列処理を実行する他の全ノード装置から通知される他ノ
ード装置内でのバリア同期成立の情報に基づいて、並列
処理が完了したことを検出する。したがって、バリア同
期機構の複雑化を招かずしかも特別な通信機構を設けず
に、自ノード装置内でのバリア同期成立の情報を送受信
することによって並列処理の完了が検出される。
【0012】また、請求項2に係る発明は、上記請求項
1に記載のノード装置において、前記ノード内バリア同
期機構は、 第1の制御信号が与えられる毎に計数する
第1のカウンタと、 この第1のカウンタが、自ノード
装置内でのバリア同期の対象となるプロセッサ数に相当
する数を計数したことを検出する第1の検出部と、 前
記複数のプロセッサの夫々からの同期リクエストを受け
付ける毎に前記第1のカウンタに第1の制御信号を与え
る動作や、前記第1の検出部の検出結果に基づいて自ノ
ード装置内でのバリア同期成立の情報を前記並列処理を
実行する全ノード装置に通知する動作を行なうノード内
制御部と、を含んで成ることを特徴とする。
【0013】この発明によれば、ノード内制御部が、各
プロセッサからの同期リクエストを受け付ける毎に第1
の制御信号を第1のカウンタに与えるので、第1のカウ
ンタの計数値が変化していく。この時、第1の検出部
が、第1のカウンタが自ノード装置内でのバリア同期の
対象となるプロセッサ数に相当する数を計数したことを
検出すると、ノード内制御部は、自ノード装置内でのバ
リア同期成立の情報を、並列処理を実行する全ノード装
置に通知する。したがって、ノード内バリア同期機構
は、ノード内制御部、第1のカウンタ、第1の検出部を
用いた簡易な構成で実現できる。
【0014】また、請求項3に係る発明は、上記請求項
1および2のいずれかに記載のノード装置において、前
記ノード間バリア同期機構は、第2の制御信号が与えら
れる毎に計数する第2のカウンタと、この第2のカウン
タが、バリア同期の対象となる全ノード装置数に相当す
る数を計数したことを検出する第2の検出部と、前記並
列処理を実行する他の全ノード装置から通知される他ノ
ード装置内でのバリア同期成立の情報を受け付けると前
記第2の制御信号を与える動作や、前記第2の検出部の
検出結果に基づいて前記並列処理が完了したことを検出
する動作を行うノード間制御部と、を含んで成ることを
特徴とする。
【0015】この発明によれば、ノード間制御部は、並
列処理を実行する他の全ノード装置から通知される他ノ
ード装置内でのバリア同期成立の情報を受け付けると第
2の制御信号を第2のカウンタに与えるので、第2のカ
ウンタの計数値が変化していく。この時、第2の検出部
が、第2のカウンタがバリア同期の対象となる全ノード
装置数に相当する数を計数したことを検出すると、ノー
ド間制御部は並列処理の完了を把握する。したがって、
ノード間バリア同期機構は、ノード間制御部、第2のカ
ウンタ、第2の検出部を用いた簡易な構成で実現でき
る。
【0016】また、請求項4に係る発明は、上記請求項
2および3のいずれかに記載のノード装置において、前
記第1のカウンタの計数値、および/または、第2のカ
ウンタの計数値を出力する出力手段をさらに備えたこと
を特徴とする。
【0017】この発明によれば、出力手段が、第1のカ
ウンタの計数値、および/または、第2のカウンタの計
数値を出力するので、並列処理の実行状態を把握でき
る。
【0018】また、請求項5に係る発明は、上記請求項
1、2、3および4のいずれかに記載のノード装置にお
いて、前記並列処理を実行する全ノード装置に通知す
る、自ノード装置内でのバリア同期成立の情報は、自ノ
ード装置の識別子であることを特徴とする。
【0019】この発明によれば、ノード装置は、自ノー
ド装置の識別子を自ノード装置内でのバリア同期成立の
情報として、並列処理を実行する全ノード装置に通知す
るので、並列処理に関するトラフィック量が低減され
る。
【0020】さらに、請求項6に係る発明は、請求項
1、2、3、4および5のいずれかに記載のノード装置
を複数備え、複数備えられたノード装置の夫々が、ノー
ド装置内でのバリア同期成立の情報を相互に送受信可能
に構成された並列処理システムである。
【0021】この発明によれば、以上のようなノード装
置を複数備えてそれらのノード装置間において自ノード
装置内でのバリア同期成立の情報が送受信されるので、
以上のようなノード装置を複数備えた並列処理システム
を構築できる。
【0022】さらに、請求項7に係る発明は、1つのジ
ョブを複数のプロセスに分割しこれらを1以上の他ノー
ド装置と共同で並列処理するための方法であって、自ノ
ード装置内に設けた複数のプロセッサからの同期リクエ
ストに基づいて自ノード装置内でのバリア同期が成立し
たことを検出し、この自ノード装置内でのバリア同期成
立の情報を、前記並列処理を実行する全ノード装置に通
知し、前記並列処理を実行する他の全ノード装置から通
知される他ノード装置内でのバリア同期成立の情報に基
づいて、前記並列処理が完了したことを検出することを
特徴とする並列処理方法である。
【0023】この発明によれば、自ノード装置内に設け
たプロセッサからの同期リクエストに基づいて自ノード
装置内でのバリア同期が成立したことを検出し、この自
ノード装置内でのバリア同期成立の情報を、並列処理を
実行する全ノード装置に通知する。一方、並列処理を実
行する他のノード装置から通知される他ノード装置内で
のバリア同期成立の情報に基づいて、並列処理が完了し
たことを検出する。したがって、この並列処理方法によ
れば、バリア同期機構の複雑化を招かずしかも特別な通
信機構を設けずに、自ノード装置内でのバリア同期成立
の情報を送受信することによって並列処理の完了が検出
される。
【0024】そして、請求項8に係る発明は、1つのジ
ョブを複数のプロセスに分割しこれらを1以上の他ノー
ド装置と共同で並列処理するための並列処理プログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
て、自ノード装置内に設けた複数のプロセッサからの同
期リクエストに基づいて自ノード装置内でのバリア同期
が成立したことを検出し、この自ノード装置内でのバリ
ア同期成立の情報を、前記並列処理を実行する全ノード
装置に通知する処理と、前記並列処理を実行する他の全
ノード装置から通知される他ノード装置内でのバリア同
期成立の情報に基づいて、前記並列処理が完了したこと
を検出する処理とを、コンピュータに実行させる並列処
理プログラムを記録したことを特徴とする並列処理プロ
グラムを記録した記録媒体である。
【0025】この記録媒体に記録される並列処理プログ
ラムをコンピュータが実行することによって、自ノード
装置内に設けたプロセッサからの同期リクエストに基づ
いて自ノード装置内でのバリア同期が成立したことを検
出し、この自ノード装置内でのバリア同期成立の情報
を、並列処理を実行する全ノード装置に通知する処理
と、並列処理を実行する他の全ノード装置から通知され
る他ノード装置内でのバリア同期成立の情報に基づい
て、並列処理が完了したことを検出する処理とが実行さ
れる。したがって、バリア同期機構の複雑化を招かずし
かも特別な通信機構を設けずに、自ノード装置内でのバ
リア同期成立の情報を送受信することによって並列処理
の完了が検出される。
【0026】なお、このような記録媒体としては、RO
M、半導体IC等の半導体記録媒体、DVDROM、C
DROM等の光記録媒体、HD、フレキシブルディスク
等の磁気記録媒体、MO等の光磁気記録媒体が挙げられ
る。
【0027】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しつつ説明する。
【0028】図1は、本発明の実施の形態である並列処
理システムのブロック構成図、図2はそれを構成するノ
ード装置のブロック構成図である。図1に示すように、
この並列処理システムは、複数のノード装置100a、
100nの夫々を光ファイバ、同軸ケーブル等の通信ケ
ーブル500によって相互に所要の情報を送受信可能に
構成されている。なお、図示の容易さ等のため図1にお
いては2台のノード装置しか図示していないがノード装
置の接続台数には特に制限が無く、また夫々のノード装
置の構成は同一である。
【0029】図2に示すように、このノード装置100
aは、通信制御ユニット200aと、複数台のプロセッ
サであるCPU300a、300b、300nと、これ
らのCPUが共用する共用メモリとしての主記憶400
aとを有している。通信制御ユニット200aは、CP
U300a、300b、300nからの同期リクエスト
に基づいて自ノード装置内でのバリア同期が成立したこ
とを検出し、この自ノード装置内でのバリア同期成立の
情報を、並列処理を実行する全ノード装置に通信ケーブ
ル500を介して通知するノード内バリア同期機構21
0aと、並列処理を実行する他の全ノード装置から通信
ケーブル500を介して通知される他ノード装置内での
バリア同期成立の情報に基づいて並列処理が完了したこ
とを検出するノード間バリア同期機構220aとを有し
ている。
【0030】ノード内バリア同期機構210aは、自ノ
ード装置内でのバリア同期の対象となるCPU数を初期
値とし、制御信号が与えられる毎にその初期値を1ずつ
減じていくカウンタ214aと、カウンタ214aのカ
ウント値(計数値)がゼロになったことを検出するゼロ
検出部216aと、CPU300a、300b、300
nからの同期リクエストを受け付けるとカウンタ214
aに制御信号を与える動作やゼロ検出部216aがカウ
ンタ214aのカウント値がゼロになったことを検出し
た旨の信号を送るとこれを受け付けて、自ノード装置内
でのバリア同期が検出されたとして、その旨の情報を通
信ケーブル500を介して並列処理を実行する全ノード
装置に通知する動作等を行うノード内制御部212aと
を含んで構成されている。
【0031】一方、ノード間バリア同期機構220a
は、バリア同期の対象となる全ノード装置数を初期値と
し、制御信号が与えられる毎にその初期値を1ずつ減じ
ていくカウンタ224aと、カウンタ224aのカウン
ト値(計数値)がゼロになったことを検出するゼロ検出
部226aと、並列処理を実行する他のノード装置から
通知される他ノード装置内でのバリア同期成立の情報を
受け付けるとカウンタ224aに制御信号を与える動作
やゼロ検出部216aがカウンタ224aのカウント値
がゼロになったことを検出してその旨の信号を送るとこ
れを受けとって、並列処理が完了したことを検出して各
CPU300a、300b、300nに並列処理の終了
通知を行う等の動作を行うノード間制御部222aとを
含んで構成されている。
【0032】図3は、ノード内制御部210aが、並列
処理を実行する全ノード装置に通知する自ノード装置内
でのバリア同期が検出された旨の情報(ノード間制御部
222aが受け付ける、並列処理を実行する他のノード
装置から通知される他ノード装置内でのバリア同期成立
の情報でもある)のデータフォーマットの模式的説明図
であり、図3に示すように、この情報は予めノード装置
毎に付与されたノード装置の識別子であるノード番号か
らなっている。この例では、ノード番号が「」である
場合を示しており、このような単純なデータフォーマッ
トを有するデータが通信ケーブル500上を転送される
だけなので、並列処理に関するトラフィック量が低減さ
れる。
【0033】次に動作を説明する。なお、1つのノード
装置におけるいずれかのCPUは、親プロセスが割り当
てられる親CPUの役割を担っていて、この親CPU
は、主記憶400aの所定領域に予め記憶されている、
並列処理を実行する全ノード装置数や各ノード装置内で
の同期対象となるプロセッサ数等の並列処理に必要な情
報をアクセスして、並列処理の実行準備を行なうように
なっている。
【0034】まず、各CPU300a、300b、30
0nのうち親プロセスが割り付けられた親CPUが、ノ
ード内制御部212aに対して、同期対象となるCPU
数を通知すると、ノード内制御部212aはこれを受け
取ってカウンタ214aに初期値として記憶させる。ま
た、親CPUは、ノード間制御部222aに対して、ノ
ード装置間での同期対象となるノード装置数を通知する
と、ノード間制御部222aはこれを受け取ってカウン
タ224aに初期値を記憶させる。なお、カウンタ22
4aの初期値の設定にあっては、並列処理システムを構
成する或るノード装置内の親CPUが、自ノード装置内
のみならず他のノード装置内のノード間制御部に初期値
を通知して初期値を設定させるようにしても良い。
【0035】次に、各CPU300a、300b、30
0nが主記憶400aを使用して夫々に割り付けられた
プロセスを実行していく。この際、プロセスの実行を終
了してバリア同期の同期点に到達したCPUは、同期リ
クエストをノード内制御部212aに対して送る。ノー
ド内制御部212aは、同期リクエストを受けとる毎に
制御信号をカウンタ214aに与え、カウンタ214a
はこの制御信号を受け取る毎にカウント値を1だけ減じ
る。そして、ゼロ検出部216aが、カウンタ214a
のカウント値がゼロになったことを検出するとこの旨の
信号をノード内制御部212aに送る。これを受け取っ
たノード内制御部212aは、自ノード装置内でのバリ
ア同期が成立したとして、図3に示すような、自ノード
装置内でのバリア同期の成立を示す情報を並列処理を実
行する全ノード装置(自ノード装置を含む)に通知す
る。
【0036】一方、ノード間制御部222aは、このよ
うな通知を受け取る毎に制御信号をカウンタ224aに
与え、カウンタ224aはこの制御信号を受け取る毎に
カウント値を1だけ減じる。そして、ゼロ検出部226
aが、カウンタ224aのカウント値がゼロになったこ
とを検出するとその旨の信号をノード間制御部222a
に送るので、ノード間制御部222aは、複数のノード
装置で実行される並列処理が完了したことを検出して、
各CPU300a、300b、300nに対して並列処
理の終了通知を行う。この通知を受け取った各CPU3
00a、300b、300nは次の段階の処理を行う。
【0037】したがって、この実施の形態によれば、ノ
ード内バリア同期機構210aが、自ノード装置内に設
けた複数のCPUからの同期リクエストに基づいて自装
置内でのバリア同期が成立したことを検出し、この自ノ
ード装置内でのバリア同期成立の情報を、並列処理を実
行する全ノード装置に通知する。
【0038】一方、ノード間バリア同期機構220a
は、この並列処理を実行する他の全ノード装置から通知
される他ノード装置内でのバリア同期成立の情報に基づ
いて、並列処理が完了したことを検出する。したがっ
て、バリア同期機構の複雑化を招かずしかも特別な通信
機構を設けずに、自ノード装置内でのバリア同期成立の
情報を送受信することによって並列処理の完了が検出さ
れる。しかも、ノード内バリア同期機構210aやノー
ド間バリア同期機構220aは、制御部(212a、2
22a)、カウンタ(214a、224a)、ゼロ検出
部(216a、226a)を用いた簡易な構成で実現で
きる。
【0039】また、ノード内制御部212a、ノード間
制御部222aに図示しないCRT、液晶ディスプレイ
等の表示装置を接続しておいて、両制御部がカウンタ2
14a、のカウント値(計数値)および224aのカウ
ント値(計数値)のうちの少なくとも一方を表示装置に
表示させるようにしておけば、並列処理の実行状態を把
握でき、実行対象となるプログラムのデバッグ等の便宜
にもなる。
【0040】なお、ノード内バリア同期機構210aお
よびノード間バリア同期機構220aを、同期機構用の
CPUと、このCPUの動作手順を記述したプログラム
を記録したROM、HDD等の記録媒体と、ワークエリ
アが形成されるRAMと、を備えた構成にしておき、C
PUがこのプログラムを実行するようにして、以上説明
したきたような動作を行わせることが可能である。
【0041】次に、図4、図5を参照して、より具体的
な動作説明を行う。図4、5は、具体的な動作を説明す
るためのブロック構成図、タイミングチャートである。
この動作説明においては、図4に示すように、1つのジ
ョブをプロセス1〜プロセス16までの16個のプロセ
スに分割し、プロセス1〜4はノード装置100aのC
PU300a〜300dに、プロセス5〜8はノード装
置100bのCPU300a〜300dに、プロセス9
〜12はノード装置100cのCPU300a〜300
dに、プロセス13〜16はノード装置100dのCP
U300a〜300dに夫々割り当てて、4台のノード
装置で1つのジョブを並列処理するシーンを想定してい
る。
【0042】まず、各CPU300a、300b、30
0c、300dのうちCPU300aが、ノード内制御
部212aに対して、同期対象となるCPU数「4」を
通知すると、ノード内制御部212aはこれを受け取っ
てカウンタ214aに初期値「4」を記憶させる。ま
た、ノード内制御部220aに対して、ノード装置間で
の同期対象となる装置数「4」を通知すると、ノード内
制御部220aはこれを受け取ってカウンタ224aに
初期値「4」を記憶させる。
【0043】次に、各CPU300a、300b、30
0nが主記憶400aを使用して夫々に割り付けられた
プロセスを実行していく。そして、図5(a)に示すよ
うに、第2サイクルでCPU300bからの同期リクエ
ストが送られると、ノード内制御部212aはカウンタ
214aに制御信号を与えるので、第3サイクルでカウ
ンタ214aのカウント値は「3」となる。
【0044】また、第4サイクルでは、CPU300
a、CPU300cからの同期リクエストが送られるの
で、ノード内制御部212aはカウンタ214aに制御
信号を2回与えて、第5サイクルでカウンタ214aの
カウント値は「1」となり、さらに、第5サイクルでC
PU300dからの同期リクエストが送られるので、ノ
ード内制御部212aはカウンタ214aに制御信号を
与えて、第6サイクルでカウンタ214aのカウント値
は「0」となる。
【0045】すると、ゼロ検出部216aはカウンタ2
14aのカウント値が「0」になった旨の信号をノード
内制御部212aに送るので、ノード内制御部212a
は自ノード装置内でバリア同期が成立したことを検出
し、第7サイクルで図3に示すようなノード内同期成立
信号を全ノード装置100a、100b、100c、1
00dに通知する。同様にして、各ノード装置100
b、100c、100dにおいても自ノード装置の同期
成立の情報が全ノード装置に通知される。
【0046】一方、ノード間制御部222aは、図5
(b)に示すように、このような通知(ノード内同期成
立信号)を受け取る毎に制御信号をカウンタ224aに
与え、カウンタ224aはこの制御信号を受け取る毎に
カウント値を1だけ減じる。そして、ゼロ検出部226
aがカウンタ224aのカウント値がゼロになったこと
を検出するとその旨の信号をノード間制御部222aに
送るので、ノード間制御部222aは、並列処理に参加
する全ノード装置で実行される並列処理が完了したこと
を検出して、各CPU300a、300b、300c、
300dに対して並列処理の終了通知を行う。この終了
通知を受け取った各CPU300a、300b、300
c、300dは次の段階の処理を行う。かくして、プロ
セス1〜16までの各プロセスが実行完了してそのジョ
ブの並列処理が完了する。
【0047】このように、この実施の形態によれば、1
つのジョブを16個のプロセスに分割し、各プロセス
を、4個のCPUを備える4台のノード装置の各CPU
に割り当てて1つのジョブを並列処理し、その際に、自
ノード装置内でのバリア同期成立の情報を送受信するこ
とによって並列処理の完了が検出される。したがって、
通信ケーブル500上のトラフィック量が小さくてデー
タ転送による処理オーバーヘッドが少ない並列処理シス
テムを、バリア同期機構の複雑化を招かずしかも特別な
通信機構を設けずに実現できる。
【0048】なお、本発明の要旨を逸脱しない範囲で、
以上説明してきた本発明の実施の形態を適宜変更しても
良いことは言うまでもなく、例えば、ノード内制御部2
12aが、自ノード装置内でのバリア同期成立を検出し
た場合にはその旨を直接、自ノード装置内のノード間制
御部222aに通知するようにしてカウンタ224aの
値を高速に減じるようにすること等種々の変更が考えら
れる。
【0049】
【発明の効果】以上説明してきたように、本発明によれ
ば、バリア同期機構の複雑化を招かずしかも特別な通信
機構を設けずに、自ノード装置内でのバリア同期成立の
情報を送受信することによって並列処理の完了が検出さ
れるという効果が得られる。
【図面の簡単な説明】
【図1】 本発明の実施の形態の並列処理システムのブ
ロック構成図である。
【図2】 並列処理システムを構成するノード装置10
0aのブロック構成図である。
【図3】 ノード内でのバリア同期が成立した旨を全ノ
ード装置に通知する情報のデータフォーマットの模式的
説明図である。
【図4】 本発明の実施の形態の並列処理システムの具
体的な動作を説明するためのブロック構成図である。
【図5】 本発明の実施の形態の並列処理システムの具
体的な動作を説明するためのタイミングチャートであ
る。
【符号の説明】
100、100a、100b、100c、100d、1
00n ノード装置 200、200a、200n 通信制御ユニット 210a ノード内バリア同期機構 212a ノード制御部 214a カウンタ 216a ゼロ検出部 220a ノード間バリア同期機構 222a ノード間制御部 224a カウンタ 226a ゼロ検出部 300、300a、300b、300c、300d、3
00n CPU 400、400a 主記憶

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 1つのジョブを複数のプロセスに分割し
    これらを1以上の他ノード装置と共同で並列処理するた
    めのノード装置であって、 自ノード装置内でのバリア同期の対象となる複数のプロ
    セッサと、 前記複数のプロセッサからの同期リクエストに基づいて
    自ノード装置内でのバリア同期が成立したことを検出
    し、この自ノード装置内でのバリア同期成立の情報を、
    前記並列処理を実行する全ノード装置に通知するノード
    内バリア同期機構と、 前記並列処理を実行する他の全ノード装置から通知され
    る他ノード装置内でのバリア同期成立の情報に基づい
    て、前記並列処理が完了したことを検出するノード間バ
    リア同期機構と、を備えることを特徴とするノード装
    置。
  2. 【請求項2】 前記ノード内バリア同期機構は、 第1の制御信号が与えられる毎に計数する第1のカウン
    タと、 この第1のカウンタが、自ノード装置内でのバリア同期
    の対象となるプロセッサ数に相当する数を計数したこと
    を検出する第1の検出部と、 前記複数のプロセッサの夫々からの同期リクエストを受
    け付ける毎に前記第1のカウンタに第1の制御信号を与
    える動作や、前記第1の検出部の検出結果に基づいて自
    ノード装置内でのバリア同期成立の情報を前記並列処理
    を実行する全ノード装置に通知する動作を行なうノード
    内制御部と、を含んで成ることを特徴とする請求項1に
    記載のノード装置。
  3. 【請求項3】 前記ノード間バリア同期機構は、 第2の制御信号が与えられる毎に計数する第2のカウン
    タと、 この第2のカウンタが、バリア同期の対象となる全ノー
    ド装置数に相当する数を計数したことを検出する第2の
    検出部と、 前記並列処理を実行する他の全ノード装置から通知され
    る他ノード装置内でのバリア同期成立の情報を受け付け
    ると前記第2の制御信号を与える動作や、前記第2の検
    出部の検出結果に基づいて前記並列処理が完了したこと
    を検出する動作を行うノード間制御部と、を含んで成る
    ことを特徴とする請求項1および2のいずれかに記載の
    ノード装置。
  4. 【請求項4】 前記第1のカウンタの計数値、および/
    または、第2のカウンタの計数値を出力する出力手段を
    さらに備えたことを特徴とする請求項2および3のいず
    れかに記載のノード装置。
  5. 【請求項5】 前記並列処理を実行する全ノード装置に
    通知する、自ノード装置内でのバリア同期成立の情報
    は、自ノード装置の識別子であることを特徴とする請求
    項1、2、3および4のいずれかに記載のノード装置。
  6. 【請求項6】 請求項1、2、3、4および5のいずれ
    かに記載のノード装置を複数備え、 複数備えられたノード装置の夫々が、ノード装置内での
    バリア同期成立の情報を相互に送受信可能に構成された
    並列処理システム。
  7. 【請求項7】 1つのジョブを複数のプロセスに分割し
    これらを1以上の他ノード装置と共同で並列処理するた
    めの方法であって、 自ノード装置内に設けた複数のプロセッサからの同期リ
    クエストに基づいて自ノード装置内でのバリア同期が成
    立したことを検出し、この自ノード装置内でのバリア同
    期成立の情報を、前記並列処理を実行する全ノード装置
    に通知し、 前記並列処理を実行する他の全ノード装置から通知され
    る他ノード装置内でのバリア同期成立の情報に基づい
    て、前記並列処理が完了したことを検出することを特徴
    とする並列処理方法。
  8. 【請求項8】 1つのジョブを複数のプロセスに分割し
    これらを1以上の他ノード装置と共同で並列処理するた
    めの並列処理プログラムを記録したコンピュータ読み取
    り可能な記録媒体であって、 自ノード装置内に設けた複数のプロセッサからの同期リ
    クエストに基づいて自ノード装置内でのバリア同期が成
    立したことを検出し、この自ノード装置内でのバリア同
    期成立の情報を、前記並列処理を実行する全ノード装置
    に通知する処理と、 前記並列処理を実行する他の全ノード装置から通知され
    る他ノード装置内でのバリア同期成立の情報に基づい
    て、前記並列処理が完了したことを検出する処理とを、 コンピュータに実行させる並列処理プログラムを記録し
    たことを特徴とする並列処理プログラムを記録した記録
    媒体。
JP11229754A 1999-08-16 1999-08-16 ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体 Pending JP2001051966A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11229754A JP2001051966A (ja) 1999-08-16 1999-08-16 ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11229754A JP2001051966A (ja) 1999-08-16 1999-08-16 ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001051966A true JP2001051966A (ja) 2001-02-23

Family

ID=16897168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11229754A Pending JP2001051966A (ja) 1999-08-16 1999-08-16 ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001051966A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7336657B2 (en) 2001-07-31 2008-02-26 Nec Corporation Inter-nodal data transfer system and data transfer apparatus
JP2012048515A (ja) * 2010-08-27 2012-03-08 Internatl Business Mach Corp <Ibm> マルチノードにわたるデータの送受信をバリア同期無しで行う並列計算処理
EP2466485A1 (en) 2010-12-17 2012-06-20 Fujitsu Limited Parallel computer system, synchronization apparatus, and control method for the parallel computer system
WO2012137238A1 (ja) * 2011-04-04 2012-10-11 株式会社日立製作所 計算機システム
JP2012221004A (ja) * 2011-04-04 2012-11-12 Hitachi Ltd 並列計算機システム、およびプログラム
US8397094B2 (en) 2008-10-31 2013-03-12 Fujitsu Limited Node-to-node synchronizing apparatus, node-to-node synchronizing method, and computer product
JP2014021820A (ja) * 2012-07-20 2014-02-03 Fujitsu Ltd 情報処理装置およびバリア同期方法
JP2014029266A (ja) * 2012-07-31 2014-02-13 Hitachi Automotive Systems Ltd 車載画像処理装置
JP2015036943A (ja) * 2013-08-15 2015-02-23 富士通株式会社 情報処理システム及び情報処理システムの制御方法
JP2017526045A (ja) * 2014-06-26 2017-09-07 インテル コーポレイション ドローコールにわたる共有リソースデータコヒーレンシを確実にするための効率的なハードウェアメカニズム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7336657B2 (en) 2001-07-31 2008-02-26 Nec Corporation Inter-nodal data transfer system and data transfer apparatus
US8397094B2 (en) 2008-10-31 2013-03-12 Fujitsu Limited Node-to-node synchronizing apparatus, node-to-node synchronizing method, and computer product
JP2012048515A (ja) * 2010-08-27 2012-03-08 Internatl Business Mach Corp <Ibm> マルチノードにわたるデータの送受信をバリア同期無しで行う並列計算処理
EP2466485A1 (en) 2010-12-17 2012-06-20 Fujitsu Limited Parallel computer system, synchronization apparatus, and control method for the parallel computer system
US9075767B2 (en) 2010-12-17 2015-07-07 Fujitsu Limited Parallel computer system, synchronization apparatus, and control method for the parallel computer system
WO2012137238A1 (ja) * 2011-04-04 2012-10-11 株式会社日立製作所 計算機システム
JP2012221004A (ja) * 2011-04-04 2012-11-12 Hitachi Ltd 並列計算機システム、およびプログラム
JP2014021820A (ja) * 2012-07-20 2014-02-03 Fujitsu Ltd 情報処理装置およびバリア同期方法
US9336064B2 (en) 2012-07-20 2016-05-10 Fujitsu Limited Information processing device and barrier synchronization method
US9436520B2 (en) 2012-07-20 2016-09-06 Fujitsu Limited Information processing device and barrier synchronization method
JP2014029266A (ja) * 2012-07-31 2014-02-13 Hitachi Automotive Systems Ltd 車載画像処理装置
US10589696B2 (en) 2012-07-31 2020-03-17 Hitachi Automotive Systems, Ltd. On-vehicle image processing device
US11225204B2 (en) 2012-07-31 2022-01-18 Hitachi Astemo, Ltd. On-vehicle image processing device
US10214155B2 (en) 2012-07-31 2019-02-26 Hitachi Automotive Systems, Ltd. On-vehicle image processing device
JP2015036943A (ja) * 2013-08-15 2015-02-23 富士通株式会社 情報処理システム及び情報処理システムの制御方法
JP2017526045A (ja) * 2014-06-26 2017-09-07 インテル コーポレイション ドローコールにわたる共有リソースデータコヒーレンシを確実にするための効率的なハードウェアメカニズム

Similar Documents

Publication Publication Date Title
US20060161720A1 (en) Image data transmission method and system with DMAC
JP2001051966A (ja) ノード装置、並列処理システム、並列処理方法、および、並列処理プログラムを記録した記録媒体
CN110825731B (zh) 数据存储方法、装置、电子设备及存储介质
JP7382298B2 (ja) 駐車処理のための方法、システム、装置及び車両コントローラ
CN103902244A (zh) 显示画面的方法及系统
US9733997B2 (en) Event management method and distributed system
WO2021073054A1 (zh) 数据处理的方法、装置、设备和存储介质
CN110955461B (zh) 计算任务的处理方法、装置、系统、服务器和存储介质
JP5780157B2 (ja) 計算機、並列計算機システム、同期方法、及びコンピュータプログラム
Zarezadeh et al. Hardware middleware for person tracking on embedded distributed smart cameras
US7120828B2 (en) System and method for in-order queue draining
JPH0520284A (ja) パラレルプロセツサシステム
JPH04260962A (ja) 並列計算機における同期制御方式
JP2708172B2 (ja) 並列処理方法
WO2024002194A1 (zh) 一种同步校验方法、装置、电子设备及存储介质
KR100978083B1 (ko) 공유 메모리형 멀티 프로세서에 있어서의 절차 호출 방법 및 절차 호출 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
JP3745597B2 (ja) 超並列コンピュータ及びその処理方法
WO2023138339A1 (zh) 时间同步方法、装置及系统
JP2003058515A (ja) プロセッサ間コマンド処理装置、疎結合マルチプロセッサ装置およびコマンド処理方法
WO2023226787A1 (zh) 通信方法、系统、装置和电子设备
WO2021218623A1 (zh) 一种数据处理装置、芯片和数据处理方法
JP3425885B2 (ja) メモリアクセス処理装置
WO2023177720A1 (en) Dynamic hashing framework for synchronization between network telemetry producers and consumers
CN116501589A (zh) 面向并行应用核间通信竞争的通信性能预测方法及装置
JPH0415739A (ja) 計算機システムに於ける遠隔データ入出力制御装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020702