JP2002288147A - 分散メモリ型並列計算機およびコンピュータ・プログラム - Google Patents

分散メモリ型並列計算機およびコンピュータ・プログラム

Info

Publication number
JP2002288147A
JP2002288147A JP2001091937A JP2001091937A JP2002288147A JP 2002288147 A JP2002288147 A JP 2002288147A JP 2001091937 A JP2001091937 A JP 2001091937A JP 2001091937 A JP2001091937 A JP 2001091937A JP 2002288147 A JP2002288147 A JP 2002288147A
Authority
JP
Japan
Prior art keywords
communication
cpus
node
program
distributed memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001091937A
Other languages
English (en)
Inventor
Kenichi Miura
健一 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001091937A priority Critical patent/JP2002288147A/ja
Publication of JP2002288147A publication Critical patent/JP2002288147A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 通信の合計時間を良好に短縮できる分散メモ
リ型並列計算機を提供する。 【解決手段】 4個以上のCPU1a〜1dを同一の筐
体あるいは各別の筐体に収容し、これら4個以上のCP
U1a〜1d相互間で同時に複数組が通信可能な分散メ
モリ型並列計算機であって、4個以上のCPU1a〜1
d相互間の通信順序を、通信のデータサイズに基づいて
決定する通信スケジュール決定手段を設けた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、4個以上のCPU
を同一の筐体あるいは各別の筐体に収容し、これら4個
以上のCPU相互間で同時に複数組が通信可能な分散メ
モリ型並列計算機、およびその分散メモリ型並列計算機
を動作させるためのコンピュータ・プログラムに関す
る。
【0002】
【従来の技術】現在、分散メモリ型並列計算機の通信ア
ーキテクチャとして、Ethernet(登録商標)、
クロスバー、トーラスリンクなど、様々な通信アーキテ
クチャが採用されている。そして、これら通信アーキテ
クチャ毎に最適なスケジューリング方法が異なるため、
これら各種の通信アーキテクチャを採用した全ての分散
メモリ型並列計算機上で効率よく動作する並列プログラ
ムを作成することは不可能である。
【0003】たとえば、図14のように、スイッチング
ハブ構造の通信路を有する分散メモリ型並列計算機の場
合、ノード0〜7から重複することなく任意に選択され
た2個1組で合計4組のノードが同時に通信を行なえ
る。ノード0〜7は、相互に並列動作する各CPUに対
応している。
【0004】このような分散メモリ型並列計算機におい
て、スケジューリングを施さずに、所定の順序で通信を
行なった場合、たとえば図15に示すような通信順序に
なる。これに対し、スケジューリングを施して、同時に
4組のノードで通信を行なわせた場合、たとえば図16
に示すような通信順序になる。すなわち、スケジューリ
ングを施すことにより、高速な通信を実現でき、並列に
通信を行わせない場合と比較して2倍程度の通信性能差
が生じる。なお、クロスバースイッチ構造の通信路を有
する分散メモリ型並列計算機についても、スイッチング
ハブ構造の通信路を有する分散メモリ型並列計算機と全
く同様である。
【0005】メッシュ構造の通信路を有する分散メモリ
型並列計算機では、図17に示すように、メッシュの各
交点にノードが位置する通信路構造になっており、この
ため複数のノード間で転送路が共有されてしまう。たと
えばノード0からノード15への通信の場合、ノード0
→ノード4→ノード8→ノード12→ノード13→ノー
ド14→ノード15で表される通信路が占有され、この
通信路上のノード間の通信ができなくなってしまう。ま
た、ノード15からノード0への通信の場合、ノード1
5→ノード11→ノード7→ノード3→ノード2→ノー
ド1→ノード0で表される通信路が占有され、往路と復
路とで通信路が異なるといった特徴がある。このためメ
ッシュ構造の通信路を有する分散メモリ型並列計算機で
は、これらの特徴を意識したスケジューリングが必要に
なる。
【0006】トーラス構造の通信路を有する分散メモリ
型並列計算機では、図18に示すように、メッシュ構造
に加え、各端点同士がつながった構造をとっている。こ
のような構造をとることで、メッシュ構造の通信路を有
する分散メモリ型並列計算機に比べ、通信時間の最大値
が半分に抑えられる。たとえばノード0からノード15
への通信の場合、ノード0→ノード12→ノード15で
表される通信路のみの占有で済むため、かなりの時間短
縮となる。トーラス構造の通信路を有する分散メモリ型
並列計算機における最適スケジューリングの考え方は、
メッシュ構造の通信路を有する分散メモリ型並列計算機
の場合と同様である。
【0007】このように、最適スケジューリングに際し
ては、各通信アーキテクチャ毎に考慮すべき事項が異な
っているので、従来の分散メモリ型並列計算機において
は、通信アーキテクチャ毎に並列プログラムを作成して
いた。しかも、スケジューリングに際して、通信のデー
タサイズを考慮しておらず、たとえば全ての通信のデー
タサイズが均等であるというような仮定の基にスケジュ
ーリングを行なっていた。
【0008】
【発明が解決しようとする課題】しかし、上記従来の分
散メモリ型並列計算機では、通信アーキテクチャの種類
毎に並列プログラムを作成する必要があり、プログラム
の作成に多くの時間と費用とを要するという課題があっ
た。しかも、スケジューリングに際して通信のデータサ
イズを考慮していないので、合計の通信時間を充分に短
縮できなかった。
【0009】
【発明の開示】本発明は、上記した事情のもとで考え出
されたものであって、通信の合計時間を良好に短縮でき
る分散メモリ型並列計算機、およびそれを動作させるた
めのコンピュータ・プログラムを提供することを、その
目的とする。
【0010】また本発明は、通信アーキテクチャの種類
毎に並列プログラムを作成する必要のない分散メモリ型
並列計算機、およびそれを動作させるためのコンピュー
タ・プログラムを提供することを、その目的とする。
【0011】上記課題を解決するため、本発明では、次
の技術的手段を講じている。
【0012】本発明の第1の側面によれば、4個以上の
CPUを同一の筐体あるいは各別の筐体に収容し、これ
ら4個以上のCPU相互間で同時に複数組が通信可能な
分散メモリ型並列計算機であって、4個以上のCPU相
互間の通信順序を、通信のデータサイズに基づいて決定
する通信スケジュール決定手段を設けたことを特徴とす
る、分散メモリ型並列計算機が提供される。
【0013】本発明の第2の側面によれば、4個以上の
CPUを同一の筐体あるいは各別の筐体に収容し、これ
ら4個以上のCPU相互間で同時に複数組が通信可能な
分散メモリ型並列計算機であって、4個以上のCPUに
よって各別に実現され、他の各CPUとの通信を行ない
ながら並列処理を実行する並列処理手段と、各並列処理
手段からの問い合わせに応じて、それら並列処理手段の
通信アーキテクチャに基づいて4個以上のCPU相互間
の通信順序を決定し、その決定結果に応じて各並列処理
手段を制御する通信スケジュール決定手段とを設けたこ
とを特徴とする、分散メモリ型並列計算機が提供され
る。
【0014】本発明の第3の側面によれば、4個以上の
CPUを同一の筐体あるいは各別の筐体に収容し、これ
ら4個以上のCPU相互間で同時に複数組が通信可能な
分散メモリ型並列計算機を動作させるためのコンピュー
タ・プログラムであって、4個以上のCPU相互間の通
信順序を、通信のデータサイズに基づいて決定するため
の通信スケジュール決定プログラムを含むことを特徴と
する、コンピュータ・プログラムが提供される。
【0015】本発明の第4の側面によれば、4個以上の
CPUを同一の筐体あるいは各別の筐体に収容し、これ
ら4個以上のCPU相互間で同時に複数組が通信可能な
分散メモリ型並列計算機を動作させるためのコンピュー
タ・プログラムであって、4個以上のCPUを各別に動
作させ、他の各CPUとの通信を行ないながら並列処理
を実行するための並列処理プログラムと、各並列処理プ
ログラムからの問い合わせに応じて、それら並列処理プ
ログラムの通信アーキテクチャに基づいて4個以上のC
PU相互間の通信順序を決定し、その決定結果に応じて
各並列処理プログラムを制御する通信スケジュール決定
プログラムとを含むことを特徴とする、コンピュータ・
プログラムが提供される。
【0016】本発明によれば、通信スケジュール決定手
段が、4個以上のCPU相互間の通信順序を、通信のデ
ータサイズに基づいて決定するので、通信の合計時間を
良好に短縮できる。
【0017】すなわち、通信のデータサイズを考慮して
最適スケジューリングを行なうことにより、各CPU相
互間の通信の並列性を極限まで高めることができ、通信
時間を最小限に抑えることができる。
【0018】また、本発明によれば、通信スケジュール
決定手段が、各並列処理手段からの問い合わせに応じ
て、それら並列処理手段の通信アーキテクチャに基づい
て4個以上のCPU相互間の通信順序を決定し、その決
定結果に応じて各並列処理手段を制御するので、並列処
理手段を動作させるための並列プログラムを通信アーキ
テクチャの種類毎に作成する必要がない。
【0019】すなわち、通信スケジュール決定手段を動
作させるための通信スケジュール決定プログラムを通信
アーキテクチャの種類毎に作成することにより、通信ス
ケジュール決定プログラムと比較して規模が大きくしか
も各CPU毎に必要な並列プログラムを通信アーキテク
チャの種類毎に作成する必要が無くなるので、プログラ
ムの作成に要する時間およびコストを良好に低減でき
る。
【0020】本発明のその他の特徴および利点について
は、以下に行う発明の実施の形態の説明から、より明ら
かになるであろう。
【0021】
【発明の実施の形態】以下、本発明の好ましい実施の形
態について、図面を参照して具体的に説明する。
【0022】図1は、本発明に係る分散メモリ型並列計
算機の概略構成図である。この分散メモリ型並列計算機
は、CPU1a〜1d、インターフェイス回路2、およ
びRAM3a〜3dを備えている。CPU1a〜1d
は、インターフェイス回路2を介して相互に接続されて
いる。CPU1aは、RAM3aにバス接続されてい
る。CPU1bは、RAM3bにバス接続されている。
CPU1cは、RAM3cにバス接続されている。CP
U1dは、RAM3dにバス接続されている。CPU1
a〜1dは、全てが1個の共通の筐体に内蔵されていて
もよいし、個々に各別の筐体に内蔵されていてもよい。
【0023】図2は、CPU1a〜1d相互の通信動作
の概念図である。並列プログラムは、RAM3a〜3d
に格納されて、CPU1a〜1dを動作させる。スケジ
ューリングプログラムは、RAM3a〜3dのうちのい
ずれか1つのRAM、たとえばRAM3aに格納され
て、CPU1aを動作させる。CPU1a〜1d相互間
で通信を行う場合、各並列プログラムが通信を行う際
に、スケジューリングプログラムに対し転送先ノードと
転送サイズとを報告し、最適なスケジューリング方法の
問い合わせを行う。これに対しスケジューリングプログ
ラムは、ノード間の転送サイズを考慮しつつ、最適スケ
ジューリングを作成し、その結果を各並列プログラムに
回答する。これにより各並列プログラムは、スケジュー
リングプログラムによって作成されたスケジューリング
に従って通信を実行する。
【0024】図3は、並列プログラムとスケジューリン
グプログラムとの連携動作の説明図である。
【0025】CPU1a〜1d相互間で通信を行なうに
際して、各並列プログラムは、スケジューリングリクエ
ストを作成し、そのスケジューリングリクエストをスケ
ジューリングプログラムに送信する。そして各並列プロ
グラムは、スケジューリングプログラムからスケジュー
リング結果を受信すると、それに基づいて他の並列プロ
グラムにデータを順次送信する。
【0026】一方、スケジューリングプログラムは、各
並列プログラムからの要求待ちの状態において、各並列
プログラムからスケジューリングリクエストを受信する
と、その内容に基づいて最適なスケジューリングを作成
し、そのスケジューリング結果を各並列プログラムに送
信する。
【0027】図4は、スケジューリングリクエストに用
いられるフォーマットの説明図である。図4において
は、CPU1aに相当するノード0の並列プログラムか
らスケジューリングプログラムに送信されたスケジュー
リングリクエストの一例を示している。この例では、ノ
ード0からノード1へのデータの転送サイズが100バ
イト、ノード0からノード2へのデータの転送サイズが
200バイト、ノード0からノード3へのデータの転送
サイズが300バイトである。なお、ノード1はCPU
1bに、ノード2はCPU1cに、ノード3はCPU1
dにそれぞれ相当する。
【0028】図5は、スケジューリング結果の説明図で
ある。図5においては、図4のようなスケジューリング
リクエストに対して、スケジューリングプログラムから
ノード0の並列プログラムに送信されたスケジューリン
グ結果の一例を示している。転送順番は、データの転送
サイズが大きいものほど先順位になっている。
【0029】図6は、スケジューリングプログラムによ
るスケジューリングのアルゴリズムの説明図である。ス
ケジューリングに際して、スケジューリングプログラム
は、先ず各ノード間のデータの転送サイズを求める。次
にスケジューリングプログラムは、データの転送サイズ
の大きい順にソートする。次にスケジューリングプログ
ラムは、空きのノードの組を対象に転送サイズの大きい
順にノードに割り当てる。すなわち、原則的にはデータ
の転送サイズの大きい順に通信順序を決定するのである
が、たとえばノード0からノード1へのデータの転送と
ノード0からノード2へのデータの転送とは同時には行
なえないので、その点を考慮しつつ、同時に転送可能な
ノードの組合せの範囲内で、なるべくデータの転送サイ
ズの大きい順に並列的に通信を行なわせるべく、スケジ
ューリングを作成するのである。このとき、同時通信制
限ノードに割り当ては行なわない。すなわち、スイッチ
ングハブ構造あるいはクロスバースイッチ構造の通信路
を有する分散メモリ型並列計算機では、同時通信制限ノ
ードは存在しないが、メッシュ構造やトーラス構造の通
信路を有する分散メモリ型並列計算機では、図17や図
18に基づいて説明したように同時通信制限ノードが存
在するので、それを考慮しつつスケジューリングを作成
するのである。
【0030】図7は、ノード間のデータの転送サイズの
説明図である。図7において、左端の列は送信ノードで
あり、上端の行は受信ノードである。この例では、デー
タの転送サイズが比較的小さい場合を示しているが、実
際にはkバイトあるいはMバイト単位の通信も頻繁に行
なわれる。
【0031】図8は、データの転送サイズの大きい順に
ソートした結果を説明する説明図である。図8におい
て、たとえばノード12は、ノード1からノード2への
データの転送を表しており、ノード21は、ノード2か
らノード1へのデータの転送を表している。図8の例で
は、データの転送サイズが最も大きいのはノード21、
ノード23であるが、これらはノード2が重複してお
り、同時には実行できないので、先ずノード21を選択
する。次にデータの転送サイズが大きいのは、ノード0
2、ノード12、ノード20、ノード31、ノード01
であるが、これらは全てノード21と同時に実行できな
い。その次にデータの転送サイズが大きいのは、ノード
03、ノード10、ノード13、ノード30、ノード3
2であるが、これらのうちノード21と同時に実行でき
るのはノード03およびノード30である。そして、ノ
ード21の転送サイズは300バイトであり、ノード0
3およびノード30の転送サイズはそれぞれ100バイ
トであるので、ノード21の実行中にノード03および
ノード30を実行できることがわかる。したがって、最
初にノード21の実行とノード03の実行とをスタート
させ、ノード03の実行が完了したときにノード30の
実行をスタートさせるように、スケジューリングを決定
する。以下同様に、データの転送サイズの大きいものか
ら順に、同時に実行可能な組合せを判断し、スケジュー
リングを順次決定していく。なお、本実施形態のように
ノードが4個の場合、ノード12、ノード21と同時に
実行できるのはノード03、ノード30に一義的に決定
されてしまうのであるが、ノードがもっと多数になった
場合、上記の手法により通信の優先順位を順次決定して
いくことの重要性が飛躍的に増大する。
【0032】図9は、各ノードの通信状況を説明する説
明図である。図9からも明らかなように、各ノード間の
データの転送サイズが図8に示すようなサイズである場
合、本実施形態における最適スケジューリングを施すこ
とにより、たとえばノード2の通信が全く途絶えること
なく連続的に行なわれている間に、全てのノード相互間
の通信が完了する。
【0033】図10は、メッシュ構造の通信路を有する
分散メモリ型並列計算機の場合におけるデータの転送サ
イズの大きい順にソートした結果を説明する説明図であ
る。このように、メッシュ構造の通信路を有する分散メ
モリ型並列計算機の場合、同時通信制限ノードが存在す
るので、最適スケジューリングに際して、それに対する
考慮が必要である。もちろん、トーラス構造の通信路を
有する分散メモリ型並列計算機の場合にも、同時通信制
限ノードが存在するので、最適スケジューリングに際し
て、それに対する考慮が必要である。なお、本実施形態
のように、ノードが4個の場合は、メッシュ構造におけ
る同時通信制限ノードとトーラス構造における同時通信
制限ノードとが同じになるが、もっと多数のノードが存
在する場合、メッシュ構造における同時通信制限ノード
とトーラス構造における同時通信制限ノードとが異なる
ので、通信路の構造に応じて、換言すれば通信アーキテ
クチャに応じて、同時通信制限ノードを考慮する。
【0034】図11は、メッシュ構造の通信路を有する
分散メモリ型並列計算機の場合における各ノードの通信
状況を説明する説明図である。図11からも明らかなよ
うに、上記のような最適スケジューリングを施すことに
より、同時通信制限ノードによる制約を受けつつも、ノ
ード相互間の通信時間を良好に短縮できる。
【0035】このように、各並列プログラムからのスケ
ジューリングリクエストに基づいて、スケジューリング
プログラムによりスケジューリングを行ない、スケジュ
ーリング結果を各並列プログラムに送信するので、通信
アーキテクチャの種類毎にスケジューリングプログラム
を作成すればよく、通信アーキテクチャの種類毎に並列
プログラムを作成する必要がない。したがって、スケジ
ューリングプログラムと比較して規模が大きくしかも各
CPU1a〜1d毎に必要な並列プログラムを通信アー
キテクチャの種類毎に作成する必要が無いことから、プ
ログラムの作成に要する時間およびコストを良好に削減
できる。
【0036】また、各ノード相互間のデータの転送サイ
ズを考慮して最適スケジューリングを行なうので、通信
の並列性を極限まで高めることが可能となり、通信の合
計時間を良好に短縮できる。
【0037】なお、上記実施形態においては、図8のよ
うに、ノード21とノード12とを区別してデータの転
送サイズ順にソートしたが、図12のように、ノード2
1とノード12とを区別しなくてもよい。図12は、別
の実施形態におけるデータの転送サイズの大きい順にソ
ートした結果を説明する説明図である。図12におい
て、たとえばノード12は、ノード1からノード2への
データの転送、およびノード2からノード1へのデータ
の転送を表している。すなわち、ノード12の転送サイ
ズ500バイトは、ノード1からノード2への転送サイ
ズ200バイトと、ノード2からノード1への転送サイ
ズ300バイトとの合計である。図12の例では、デー
タの転送サイズが最も大きいのはノード12であるの
で、ノード1とノード2との間の通信が最優先される。
次にデータの転送サイズが大きいのは、ノード02およ
びノード23であるが、これらはノード2が重複してい
るのでノード12と同時に実行できない。また、その次
にデータの転送サイズが大きいのは、ノード13である
が、これはノード1が重複しているのでノード12と同
時に実行できない。そこで、ノード03がノード12と
同時に優先順位1位として選択される。なお、本実施形
態のようにノードが4個の場合、ノード12と同時に実
行できるのはノード03に一義的に決定されてしまうの
であるが、ノードがもっと多数になった場合、上記の手
法により通信の優先順位を順次決定していくのである。
【0038】図13は、各ノードの通信状況を説明する
説明図である。図13からも明らかなように、各ノード
間のデータの転送サイズが図12に示すようなサイズで
ある場合、本実施形態における最適スケジューリングを
施すことにより、1300バイトのデータ転送に相当す
る時間で全てのノード相互間の通信を完了する。
【0039】(付記1) 4個以上のCPUを同一の筐
体あるいは各別の筐体に収容し、これら4個以上のCP
U相互間で同時に複数組が通信可能な分散メモリ型並列
計算機であって、上記4個以上のCPU相互間の通信順
序を、通信のデータサイズに基づいて決定する通信スケ
ジュール決定手段を設けたことを特徴とする、分散メモ
リ型並列計算機。
【0040】(付記2) 上記通信スケジュール決定手
段は、通信のデータサイズが大きい順に、同時に通信可
能なCPUの組を決定していく、付記1に記載の分散メ
モリ型並列計算機。
【0041】(付記3) 上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各CPU
の送信と受信とを区別して各別に取り扱う、付記1また
は2に記載の分散メモリ型並列計算機。
【0042】(付記4) 上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各CPU
の送信と受信とを区別せずに纏めて取り扱う、付記1ま
たは2に記載の分散メモリ型並列計算機。
【0043】(付記5) 4個以上のCPUを同一の筐
体あるいは各別の筐体に収容し、これら4個以上のCP
U相互間で同時に複数組が通信可能な分散メモリ型並列
計算機であって、上記4個以上のCPUによって各別に
実現され、他の各CPUとの通信を行ないながら並列処
理を実行する並列処理手段と、上記各並列処理手段から
の問い合わせに応じて、それら並列処理手段の通信アー
キテクチャに基づいて上記4個以上のCPU相互間の通
信順序を決定し、その決定結果に応じて上記各並列処理
手段を制御する通信スケジュール決定手段とを設けたこ
とを特徴とする、分散メモリ型並列計算機。
【0044】(付記6) 上記通信スケジュール決定手
段は、上記4個以上のCPU相互間の通信順序を、通信
のデータサイズに基づいて決定する、付記5に記載の分
散メモリ型並列計算機。
【0045】(付記7) 上記通信スケジュール決定手
段は、通信のデータサイズが大きい順に、同時に通信可
能なCPUの組を決定していく、付記5または6に記載
の分散メモリ型並列計算機。
【0046】(付記8) 上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各CPU
の送信と受信とを区別して各別に取り扱う、付記5ない
し7のいずれかに記載の分散メモリ型並列計算機。
【0047】(付記9) 上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各CPU
の送信と受信とを区別せずに纏めて取り扱う、付記5な
いし7のいずれかに記載の分散メモリ型並列計算機。
【0048】(付記10) 4個以上のCPUを同一の
筐体あるいは各別の筐体に収容し、これら4個以上のC
PU相互間で同時に複数組が通信可能な分散メモリ型並
列計算機を動作させるためのコンピュータ・プログラム
であって、上記4個以上のCPU相互間の通信順序を、
通信のデータサイズに基づいて決定するための通信スケ
ジュール決定プログラムを含むことを特徴とする、コン
ピュータ・プログラム。
【0049】(付記11) 4個以上のCPUを同一の
筐体あるいは各別の筐体に収容し、これら4個以上のC
PU相互間で同時に複数組が通信可能な分散メモリ型並
列計算機を動作させるためのコンピュータ・プログラム
であって、上記4個以上のCPUを各別に動作させ、他
の各CPUとの通信を行ないながら並列処理を実行する
ための並列処理プログラムと、上記各並列処理プログラ
ムからの問い合わせに応じて、それら並列処理プログラ
ムの通信アーキテクチャに基づいて上記4個以上のCP
U相互間の通信順序を決定し、その決定結果に応じて上
記各並列処理プログラムを制御する通信スケジュール決
定プログラムとを含むことを特徴とする、コンピュータ
・プログラム。
【0050】
【発明の効果】以上説明したように本発明によれば、通
信スケジュール決定手段が、4個以上のCPU相互間の
通信順序を、通信のデータサイズに基づいて決定するの
で、通信の合計時間を良好に短縮できる。
【0051】また、本発明によれば、通信スケジュール
決定手段が、各並列処理手段からの問い合わせに応じ
て、それら並列処理手段の通信アーキテクチャに基づい
て4個以上のCPU相互間の通信順序を決定し、その決
定結果に応じて各並列処理手段を制御するので、通信ア
ーキテクチャの種類毎に並列処理手段を動作させるため
の並列プログラムを作成する必要がない。
【図面の簡単な説明】
【図1】本発明に係る分散メモリ型並列計算機の概略構
成図である。
【図2】CPU相互の通信動作の概念図である。
【図3】並列プログラムとスケジューリングプログラム
との連携動作の説明図である。
【図4】スケジューリングリクエストに用いられるフォ
ーマットの説明図である。
【図5】スケジューリング結果の説明図である。
【図6】スケジューリングプログラムによるスケジュー
リングのアルゴリズムの説明図である。
【図7】ノード間のデータの転送サイズの説明図であ
る。
【図8】データの転送サイズの大きい順にソートした結
果を説明する説明図である。
【図9】各ノードの通信状況を説明する説明図である。
【図10】メッシュ構造の通信路を有する分散メモリ型
並列計算機の場合におけるデータの転送サイズの大きい
順にソートした結果を説明する説明図である。
【図11】メッシュ構造の通信路を有する分散メモリ型
並列計算機の場合における各ノードの通信状況を説明す
る説明図である。
【図12】別の実施形態におけるデータの転送サイズの
大きい順にソートした結果を説明する説明図である。
【図13】各ノードの通信状況を説明する説明図であ
る。
【図14】スイッチングハブ構造の通信路を有する分散
メモリ型並列計算機の概念説明図である。
【図15】図14に示す分散メモリ型並列計算機におい
てスケジューリングを施さない場合の転送順番の説明図
である。
【図16】図14に示す分散メモリ型並列計算機におい
てデータの転送サイズを考慮せずにスケジューリングを
施した場合の転送順番の説明図である。
【図17】メッシュ構造の通信路を有する分散メモリ型
並列計算機の概念説明図である。
【図18】トーラス構造の通信路を有する分散メモリ型
並列計算機の概念説明図である。
【符号の説明】
1a〜1d CPU 2 インターフェイス回路 3a〜3d RAM

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 4個以上のCPUを同一の筐体あるいは
    各別の筐体に収容し、これら4個以上のCPU相互間で
    同時に複数組が通信可能な分散メモリ型並列計算機であ
    って、 前記4個以上のCPU相互間の通信順序を、通信のデー
    タサイズに基づいて決定する通信スケジュール決定手段
    を設けたことを特徴とする、分散メモリ型並列計算機。
  2. 【請求項2】 4個以上のCPUを同一の筐体あるいは
    各別の筐体に収容し、これら4個以上のCPU相互間で
    同時に複数組が通信可能な分散メモリ型並列計算機であ
    って、 前記4個以上のCPUによって各別に実現され、他の各
    CPUとの通信を行ないながら並列処理を実行する並列
    処理手段と、 前記各並列処理手段からの問い合わせに応じて、それら
    並列処理手段の通信アーキテクチャに基づいて前記4個
    以上のCPU相互間の通信順序を決定し、その決定結果
    に応じて前記各並列処理手段を制御する通信スケジュー
    ル決定手段とを設けたことを特徴とする、分散メモリ型
    並列計算機。
  3. 【請求項3】 4個以上のCPUを同一の筐体あるいは
    各別の筐体に収容し、これら4個以上のCPU相互間で
    同時に複数組が通信可能な分散メモリ型並列計算機を動
    作させるためのコンピュータ・プログラムであって、 前記4個以上のCPU相互間の通信順序を、通信のデー
    タサイズに基づいて決定するための通信スケジュール決
    定プログラムを含むことを特徴とする、コンピュータ・
    プログラム。
  4. 【請求項4】 4個以上のCPUを同一の筐体あるいは
    各別の筐体に収容し、これら4個以上のCPU相互間で
    同時に複数組が通信可能な分散メモリ型並列計算機を動
    作させるためのコンピュータ・プログラムであって、 前記4個以上のCPUを各別に動作させ、他の各CPU
    との通信を行ないながら並列処理を実行するための並列
    処理プログラムと、 前記各並列処理プログラムからの問い合わせに応じて、
    それら並列処理プログラムの通信アーキテクチャに基づ
    いて前記4個以上のCPU相互間の通信順序を決定し、
    その決定結果に応じて前記各並列処理プログラムを制御
    する通信スケジュール決定プログラムとを含むことを特
    徴とする、コンピュータ・プログラム。
JP2001091937A 2001-03-28 2001-03-28 分散メモリ型並列計算機およびコンピュータ・プログラム Withdrawn JP2002288147A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001091937A JP2002288147A (ja) 2001-03-28 2001-03-28 分散メモリ型並列計算機およびコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001091937A JP2002288147A (ja) 2001-03-28 2001-03-28 分散メモリ型並列計算機およびコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2002288147A true JP2002288147A (ja) 2002-10-04

Family

ID=18946483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001091937A Withdrawn JP2002288147A (ja) 2001-03-28 2001-03-28 分散メモリ型並列計算機およびコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP2002288147A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009008086A1 (ja) 2007-07-12 2009-01-15 Fujitsu Limited 計算装置、計算方法および計算プログラム
WO2018150481A1 (ja) * 2017-02-15 2018-08-23 株式会社日立製作所 分散処理システムのデータ制御方法及び分散処理システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009008086A1 (ja) 2007-07-12 2009-01-15 Fujitsu Limited 計算装置、計算方法および計算プログラム
WO2018150481A1 (ja) * 2017-02-15 2018-08-23 株式会社日立製作所 分散処理システムのデータ制御方法及び分散処理システム

Similar Documents

Publication Publication Date Title
JP5543894B2 (ja) NoCシステム及び入力切替装置
US7386619B1 (en) System and method for allocating communications to processors in a multiprocessor system
US9477280B1 (en) Specification for automatic power management of network-on-chip and system-on-chip
WO2014113646A1 (en) Automatic deadlock detection and avoidance in a system interconnect by capturing internal dependencies of ip cores using high level specification
US10547514B2 (en) Automatic crossbar generation and router connections for network-on-chip (NOC) topology generation
KR102032895B1 (ko) 기능 유닛들 간의 기능 로직 공유 장치, 방법 및 재구성 가능 프로세서
JP4088611B2 (ja) シングル・チップ・プロトコル・コンバーター
JP2002288147A (ja) 分散メモリ型並列計算機およびコンピュータ・プログラム
EP4036730A1 (en) Application data flow graph execution using network-on-chip overlay
CN115580572A (zh) 路由方法、路由节点、路由装置和计算机可读存储介质
US20060277020A1 (en) A reconfigurable system for verification of electronic circuits using high-speed serial links to connect asymmetrical evaluation and canvassing instruction processors
JP2007251334A (ja) ネットワークシステムのブロードキャスト処理方法及びネットワークシステム
CN115204399A (zh) 一种量子计算任务计算方法、装置及量子计算机操作系统
US7251248B2 (en) Connection device
EP1476986B1 (en) Information communication controller interface apparatus and method
WO2017064833A1 (ja) 通信管理一覧生成装置、通信管理一覧生成方法、および通信管理一覧生成プログラムが記憶された記憶媒体
EP1700501B1 (en) Manifold in a radio base station and method of using such a radio base station
EP3229145A1 (en) Parallel processing apparatus and communication control method
US7624220B2 (en) Multisectional bus in radio base station and method of using such a radio base station
EP4202682A1 (en) Deadlock-free scheduling of a task graph on a multi-core processor
Kanduri et al. Predictable application mapping for manycore real-time and cyber-physical systems
WO2005062639A1 (en) Radio base station controlled by a monitor coordinating xml-defined tasks, method of operating such a radio base station, and corresponding computer program product
WO2023004801A1 (zh) 一种任务处理方法及装置
Hu et al. Job mapping and scheduling on free-space optical networks
WO2016041804A1 (en) Method, device and system for deciding on a distribution path of a task

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080603