JP2002288147A

JP2002288147A - 分散メモリ型並列計算機およびコンピュータ・プログラム

Info

Publication number: JP2002288147A
Application number: JP2001091937A
Authority: JP
Inventors: Kenichi Miura; 健一三浦
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-03-28
Filing date: 2001-03-28
Publication date: 2002-10-04

Abstract

(57)【要約】【課題】通信の合計時間を良好に短縮できる分散メモ
リ型並列計算機を提供する。【解決手段】４個以上のＣＰＵ１ａ〜１ｄを同一の筐
体あるいは各別の筐体に収容し、これら４個以上のＣＰ
Ｕ１ａ〜１ｄ相互間で同時に複数組が通信可能な分散メ
モリ型並列計算機であって、４個以上のＣＰＵ１ａ〜１
ｄ相互間の通信順序を、通信のデータサイズに基づいて
決定する通信スケジュール決定手段を設けた。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、４個以上のＣＰＵ
を同一の筐体あるいは各別の筐体に収容し、これら４個
以上のＣＰＵ相互間で同時に複数組が通信可能な分散メ
モリ型並列計算機、およびその分散メモリ型並列計算機
を動作させるためのコンピュータ・プログラムに関す
る。

【０００２】

【従来の技術】現在、分散メモリ型並列計算機の通信ア
ーキテクチャとして、Ｅｔｈｅｒｎｅｔ（登録商標）、
クロスバー、トーラスリンクなど、様々な通信アーキテ
クチャが採用されている。そして、これら通信アーキテ
クチャ毎に最適なスケジューリング方法が異なるため、
これら各種の通信アーキテクチャを採用した全ての分散
メモリ型並列計算機上で効率よく動作する並列プログラ
ムを作成することは不可能である。

【０００３】たとえば、図１４のように、スイッチング
ハブ構造の通信路を有する分散メモリ型並列計算機の場
合、ノード０〜７から重複することなく任意に選択され
た２個１組で合計４組のノードが同時に通信を行なえ
る。ノード０〜７は、相互に並列動作する各ＣＰＵに対
応している。

【０００４】このような分散メモリ型並列計算機におい
て、スケジューリングを施さずに、所定の順序で通信を
行なった場合、たとえば図１５に示すような通信順序に
なる。これに対し、スケジューリングを施して、同時に
４組のノードで通信を行なわせた場合、たとえば図１６
に示すような通信順序になる。すなわち、スケジューリ
ングを施すことにより、高速な通信を実現でき、並列に
通信を行わせない場合と比較して２倍程度の通信性能差
が生じる。なお、クロスバースイッチ構造の通信路を有
する分散メモリ型並列計算機についても、スイッチング
ハブ構造の通信路を有する分散メモリ型並列計算機と全
く同様である。

【０００５】メッシュ構造の通信路を有する分散メモリ
型並列計算機では、図１７に示すように、メッシュの各
交点にノードが位置する通信路構造になっており、この
ため複数のノード間で転送路が共有されてしまう。たと
えばノード０からノード１５への通信の場合、ノード０
→ノード４→ノード８→ノード１２→ノード１３→ノー
ド１４→ノード１５で表される通信路が占有され、この
通信路上のノード間の通信ができなくなってしまう。ま
た、ノード１５からノード０への通信の場合、ノード１
５→ノード１１→ノード７→ノード３→ノード２→ノー
ド１→ノード０で表される通信路が占有され、往路と復
路とで通信路が異なるといった特徴がある。このためメ
ッシュ構造の通信路を有する分散メモリ型並列計算機で
は、これらの特徴を意識したスケジューリングが必要に
なる。

【０００６】トーラス構造の通信路を有する分散メモリ
型並列計算機では、図１８に示すように、メッシュ構造
に加え、各端点同士がつながった構造をとっている。こ
のような構造をとることで、メッシュ構造の通信路を有
する分散メモリ型並列計算機に比べ、通信時間の最大値
が半分に抑えられる。たとえばノード０からノード１５
への通信の場合、ノード０→ノード１２→ノード１５で
表される通信路のみの占有で済むため、かなりの時間短
縮となる。トーラス構造の通信路を有する分散メモリ型
並列計算機における最適スケジューリングの考え方は、
メッシュ構造の通信路を有する分散メモリ型並列計算機
の場合と同様である。

【０００７】このように、最適スケジューリングに際し
ては、各通信アーキテクチャ毎に考慮すべき事項が異な
っているので、従来の分散メモリ型並列計算機において
は、通信アーキテクチャ毎に並列プログラムを作成して
いた。しかも、スケジューリングに際して、通信のデー
タサイズを考慮しておらず、たとえば全ての通信のデー
タサイズが均等であるというような仮定の基にスケジュ
ーリングを行なっていた。

【０００８】

【発明が解決しようとする課題】しかし、上記従来の分
散メモリ型並列計算機では、通信アーキテクチャの種類
毎に並列プログラムを作成する必要があり、プログラム
の作成に多くの時間と費用とを要するという課題があっ
た。しかも、スケジューリングに際して通信のデータサ
イズを考慮していないので、合計の通信時間を充分に短
縮できなかった。

【０００９】

【発明の開示】本発明は、上記した事情のもとで考え出
されたものであって、通信の合計時間を良好に短縮でき
る分散メモリ型並列計算機、およびそれを動作させるた
めのコンピュータ・プログラムを提供することを、その
目的とする。

【００１０】また本発明は、通信アーキテクチャの種類
毎に並列プログラムを作成する必要のない分散メモリ型
並列計算機、およびそれを動作させるためのコンピュー
タ・プログラムを提供することを、その目的とする。

【００１１】上記課題を解決するため、本発明では、次
の技術的手段を講じている。

【００１２】本発明の第１の側面によれば、４個以上の
ＣＰＵを同一の筐体あるいは各別の筐体に収容し、これ
ら４個以上のＣＰＵ相互間で同時に複数組が通信可能な
分散メモリ型並列計算機であって、４個以上のＣＰＵ相
互間の通信順序を、通信のデータサイズに基づいて決定
する通信スケジュール決定手段を設けたことを特徴とす
る、分散メモリ型並列計算機が提供される。

【００１３】本発明の第２の側面によれば、４個以上の
ＣＰＵを同一の筐体あるいは各別の筐体に収容し、これ
ら４個以上のＣＰＵ相互間で同時に複数組が通信可能な
分散メモリ型並列計算機であって、４個以上のＣＰＵに
よって各別に実現され、他の各ＣＰＵとの通信を行ない
ながら並列処理を実行する並列処理手段と、各並列処理
手段からの問い合わせに応じて、それら並列処理手段の
通信アーキテクチャに基づいて４個以上のＣＰＵ相互間
の通信順序を決定し、その決定結果に応じて各並列処理
手段を制御する通信スケジュール決定手段とを設けたこ
とを特徴とする、分散メモリ型並列計算機が提供され
る。

【００１４】本発明の第３の側面によれば、４個以上の
ＣＰＵを同一の筐体あるいは各別の筐体に収容し、これ
ら４個以上のＣＰＵ相互間で同時に複数組が通信可能な
分散メモリ型並列計算機を動作させるためのコンピュー
タ・プログラムであって、４個以上のＣＰＵ相互間の通
信順序を、通信のデータサイズに基づいて決定するため
の通信スケジュール決定プログラムを含むことを特徴と
する、コンピュータ・プログラムが提供される。

【００１５】本発明の第４の側面によれば、４個以上の
ＣＰＵを同一の筐体あるいは各別の筐体に収容し、これ
ら４個以上のＣＰＵ相互間で同時に複数組が通信可能な
分散メモリ型並列計算機を動作させるためのコンピュー
タ・プログラムであって、４個以上のＣＰＵを各別に動
作させ、他の各ＣＰＵとの通信を行ないながら並列処理
を実行するための並列処理プログラムと、各並列処理プ
ログラムからの問い合わせに応じて、それら並列処理プ
ログラムの通信アーキテクチャに基づいて４個以上のＣ
ＰＵ相互間の通信順序を決定し、その決定結果に応じて
各並列処理プログラムを制御する通信スケジュール決定
プログラムとを含むことを特徴とする、コンピュータ・
プログラムが提供される。

【００１６】本発明によれば、通信スケジュール決定手
段が、４個以上のＣＰＵ相互間の通信順序を、通信のデ
ータサイズに基づいて決定するので、通信の合計時間を
良好に短縮できる。

【００１７】すなわち、通信のデータサイズを考慮して
最適スケジューリングを行なうことにより、各ＣＰＵ相
互間の通信の並列性を極限まで高めることができ、通信
時間を最小限に抑えることができる。

【００１８】また、本発明によれば、通信スケジュール
決定手段が、各並列処理手段からの問い合わせに応じ
て、それら並列処理手段の通信アーキテクチャに基づい
て４個以上のＣＰＵ相互間の通信順序を決定し、その決
定結果に応じて各並列処理手段を制御するので、並列処
理手段を動作させるための並列プログラムを通信アーキ
テクチャの種類毎に作成する必要がない。

【００１９】すなわち、通信スケジュール決定手段を動
作させるための通信スケジュール決定プログラムを通信
アーキテクチャの種類毎に作成することにより、通信ス
ケジュール決定プログラムと比較して規模が大きくしか
も各ＣＰＵ毎に必要な並列プログラムを通信アーキテク
チャの種類毎に作成する必要が無くなるので、プログラ
ムの作成に要する時間およびコストを良好に低減でき
る。

【００２０】本発明のその他の特徴および利点について
は、以下に行う発明の実施の形態の説明から、より明ら
かになるであろう。

【００２１】

【発明の実施の形態】以下、本発明の好ましい実施の形
態について、図面を参照して具体的に説明する。

【００２２】図１は、本発明に係る分散メモリ型並列計
算機の概略構成図である。この分散メモリ型並列計算機
は、ＣＰＵ１ａ〜１ｄ、インターフェイス回路２、およ
びＲＡＭ３ａ〜３ｄを備えている。ＣＰＵ１ａ〜１ｄ
は、インターフェイス回路２を介して相互に接続されて
いる。ＣＰＵ１ａは、ＲＡＭ３ａにバス接続されてい
る。ＣＰＵ１ｂは、ＲＡＭ３ｂにバス接続されている。
ＣＰＵ１ｃは、ＲＡＭ３ｃにバス接続されている。ＣＰ
Ｕ１ｄは、ＲＡＭ３ｄにバス接続されている。ＣＰＵ１
ａ〜１ｄは、全てが１個の共通の筐体に内蔵されていて
もよいし、個々に各別の筐体に内蔵されていてもよい。

【００２３】図２は、ＣＰＵ１ａ〜１ｄ相互の通信動作
の概念図である。並列プログラムは、ＲＡＭ３ａ〜３ｄ
に格納されて、ＣＰＵ１ａ〜１ｄを動作させる。スケジ
ューリングプログラムは、ＲＡＭ３ａ〜３ｄのうちのい
ずれか１つのＲＡＭ、たとえばＲＡＭ３ａに格納され
て、ＣＰＵ１ａを動作させる。ＣＰＵ１ａ〜１ｄ相互間
で通信を行う場合、各並列プログラムが通信を行う際
に、スケジューリングプログラムに対し転送先ノードと
転送サイズとを報告し、最適なスケジューリング方法の
問い合わせを行う。これに対しスケジューリングプログ
ラムは、ノード間の転送サイズを考慮しつつ、最適スケ
ジューリングを作成し、その結果を各並列プログラムに
回答する。これにより各並列プログラムは、スケジュー
リングプログラムによって作成されたスケジューリング
に従って通信を実行する。

【００２４】図３は、並列プログラムとスケジューリン
グプログラムとの連携動作の説明図である。

【００２５】ＣＰＵ１ａ〜１ｄ相互間で通信を行なうに
際して、各並列プログラムは、スケジューリングリクエ
ストを作成し、そのスケジューリングリクエストをスケ
ジューリングプログラムに送信する。そして各並列プロ
グラムは、スケジューリングプログラムからスケジュー
リング結果を受信すると、それに基づいて他の並列プロ
グラムにデータを順次送信する。

【００２６】一方、スケジューリングプログラムは、各
並列プログラムからの要求待ちの状態において、各並列
プログラムからスケジューリングリクエストを受信する
と、その内容に基づいて最適なスケジューリングを作成
し、そのスケジューリング結果を各並列プログラムに送
信する。

【００２７】図４は、スケジューリングリクエストに用
いられるフォーマットの説明図である。図４において
は、ＣＰＵ１ａに相当するノード０の並列プログラムか
らスケジューリングプログラムに送信されたスケジュー
リングリクエストの一例を示している。この例では、ノ
ード０からノード１へのデータの転送サイズが１００バ
イト、ノード０からノード２へのデータの転送サイズが
２００バイト、ノード０からノード３へのデータの転送
サイズが３００バイトである。なお、ノード１はＣＰＵ
１ｂに、ノード２はＣＰＵ１ｃに、ノード３はＣＰＵ１
ｄにそれぞれ相当する。

【００２８】図５は、スケジューリング結果の説明図で
ある。図５においては、図４のようなスケジューリング
リクエストに対して、スケジューリングプログラムから
ノード０の並列プログラムに送信されたスケジューリン
グ結果の一例を示している。転送順番は、データの転送
サイズが大きいものほど先順位になっている。

【００２９】図６は、スケジューリングプログラムによ
るスケジューリングのアルゴリズムの説明図である。ス
ケジューリングに際して、スケジューリングプログラム
は、先ず各ノード間のデータの転送サイズを求める。次
にスケジューリングプログラムは、データの転送サイズ
の大きい順にソートする。次にスケジューリングプログ
ラムは、空きのノードの組を対象に転送サイズの大きい
順にノードに割り当てる。すなわち、原則的にはデータ
の転送サイズの大きい順に通信順序を決定するのである
が、たとえばノード０からノード１へのデータの転送と
ノード０からノード２へのデータの転送とは同時には行
なえないので、その点を考慮しつつ、同時に転送可能な
ノードの組合せの範囲内で、なるべくデータの転送サイ
ズの大きい順に並列的に通信を行なわせるべく、スケジ
ューリングを作成するのである。このとき、同時通信制
限ノードに割り当ては行なわない。すなわち、スイッチ
ングハブ構造あるいはクロスバースイッチ構造の通信路
を有する分散メモリ型並列計算機では、同時通信制限ノ
ードは存在しないが、メッシュ構造やトーラス構造の通
信路を有する分散メモリ型並列計算機では、図１７や図
１８に基づいて説明したように同時通信制限ノードが存
在するので、それを考慮しつつスケジューリングを作成
するのである。

【００３０】図７は、ノード間のデータの転送サイズの
説明図である。図７において、左端の列は送信ノードで
あり、上端の行は受信ノードである。この例では、デー
タの転送サイズが比較的小さい場合を示しているが、実
際にはｋバイトあるいはＭバイト単位の通信も頻繁に行
なわれる。

【００３１】図８は、データの転送サイズの大きい順に
ソートした結果を説明する説明図である。図８におい
て、たとえばノード１２は、ノード１からノード２への
データの転送を表しており、ノード２１は、ノード２か
らノード１へのデータの転送を表している。図８の例で
は、データの転送サイズが最も大きいのはノード２１、
ノード２３であるが、これらはノード２が重複してお
り、同時には実行できないので、先ずノード２１を選択
する。次にデータの転送サイズが大きいのは、ノード０
２、ノード１２、ノード２０、ノード３１、ノード０１
であるが、これらは全てノード２１と同時に実行できな
い。その次にデータの転送サイズが大きいのは、ノード
０３、ノード１０、ノード１３、ノード３０、ノード３
２であるが、これらのうちノード２１と同時に実行でき
るのはノード０３およびノード３０である。そして、ノ
ード２１の転送サイズは３００バイトであり、ノード０
３およびノード３０の転送サイズはそれぞれ１００バイ
トであるので、ノード２１の実行中にノード０３および
ノード３０を実行できることがわかる。したがって、最
初にノード２１の実行とノード０３の実行とをスタート
させ、ノード０３の実行が完了したときにノード３０の
実行をスタートさせるように、スケジューリングを決定
する。以下同様に、データの転送サイズの大きいものか
ら順に、同時に実行可能な組合せを判断し、スケジュー
リングを順次決定していく。なお、本実施形態のように
ノードが４個の場合、ノード１２、ノード２１と同時に
実行できるのはノード０３、ノード３０に一義的に決定
されてしまうのであるが、ノードがもっと多数になった
場合、上記の手法により通信の優先順位を順次決定して
いくことの重要性が飛躍的に増大する。

【００３２】図９は、各ノードの通信状況を説明する説
明図である。図９からも明らかなように、各ノード間の
データの転送サイズが図８に示すようなサイズである場
合、本実施形態における最適スケジューリングを施すこ
とにより、たとえばノード２の通信が全く途絶えること
なく連続的に行なわれている間に、全てのノード相互間
の通信が完了する。

【００３３】図１０は、メッシュ構造の通信路を有する
分散メモリ型並列計算機の場合におけるデータの転送サ
イズの大きい順にソートした結果を説明する説明図であ
る。このように、メッシュ構造の通信路を有する分散メ
モリ型並列計算機の場合、同時通信制限ノードが存在す
るので、最適スケジューリングに際して、それに対する
考慮が必要である。もちろん、トーラス構造の通信路を
有する分散メモリ型並列計算機の場合にも、同時通信制
限ノードが存在するので、最適スケジューリングに際し
て、それに対する考慮が必要である。なお、本実施形態
のように、ノードが４個の場合は、メッシュ構造におけ
る同時通信制限ノードとトーラス構造における同時通信
制限ノードとが同じになるが、もっと多数のノードが存
在する場合、メッシュ構造における同時通信制限ノード
とトーラス構造における同時通信制限ノードとが異なる
ので、通信路の構造に応じて、換言すれば通信アーキテ
クチャに応じて、同時通信制限ノードを考慮する。

【００３４】図１１は、メッシュ構造の通信路を有する
分散メモリ型並列計算機の場合における各ノードの通信
状況を説明する説明図である。図１１からも明らかなよ
うに、上記のような最適スケジューリングを施すことに
より、同時通信制限ノードによる制約を受けつつも、ノ
ード相互間の通信時間を良好に短縮できる。

【００３５】このように、各並列プログラムからのスケ
ジューリングリクエストに基づいて、スケジューリング
プログラムによりスケジューリングを行ない、スケジュ
ーリング結果を各並列プログラムに送信するので、通信
アーキテクチャの種類毎にスケジューリングプログラム
を作成すればよく、通信アーキテクチャの種類毎に並列
プログラムを作成する必要がない。したがって、スケジ
ューリングプログラムと比較して規模が大きくしかも各
ＣＰＵ１ａ〜１ｄ毎に必要な並列プログラムを通信アー
キテクチャの種類毎に作成する必要が無いことから、プ
ログラムの作成に要する時間およびコストを良好に削減
できる。

【００３６】また、各ノード相互間のデータの転送サイ
ズを考慮して最適スケジューリングを行なうので、通信
の並列性を極限まで高めることが可能となり、通信の合
計時間を良好に短縮できる。

【００３７】なお、上記実施形態においては、図８のよ
うに、ノード２１とノード１２とを区別してデータの転
送サイズ順にソートしたが、図１２のように、ノード２
１とノード１２とを区別しなくてもよい。図１２は、別
の実施形態におけるデータの転送サイズの大きい順にソ
ートした結果を説明する説明図である。図１２におい
て、たとえばノード１２は、ノード１からノード２への
データの転送、およびノード２からノード１へのデータ
の転送を表している。すなわち、ノード１２の転送サイ
ズ５００バイトは、ノード１からノード２への転送サイ
ズ２００バイトと、ノード２からノード１への転送サイ
ズ３００バイトとの合計である。図１２の例では、デー
タの転送サイズが最も大きいのはノード１２であるの
で、ノード１とノード２との間の通信が最優先される。
次にデータの転送サイズが大きいのは、ノード０２およ
びノード２３であるが、これらはノード２が重複してい
るのでノード１２と同時に実行できない。また、その次
にデータの転送サイズが大きいのは、ノード１３である
が、これはノード１が重複しているのでノード１２と同
時に実行できない。そこで、ノード０３がノード１２と
同時に優先順位１位として選択される。なお、本実施形
態のようにノードが４個の場合、ノード１２と同時に実
行できるのはノード０３に一義的に決定されてしまうの
であるが、ノードがもっと多数になった場合、上記の手
法により通信の優先順位を順次決定していくのである。

【００３８】図１３は、各ノードの通信状況を説明する
説明図である。図１３からも明らかなように、各ノード
間のデータの転送サイズが図１２に示すようなサイズで
ある場合、本実施形態における最適スケジューリングを
施すことにより、１３００バイトのデータ転送に相当す
る時間で全てのノード相互間の通信を完了する。

【００３９】（付記１）４個以上のＣＰＵを同一の筐
体あるいは各別の筐体に収容し、これら４個以上のＣＰ
Ｕ相互間で同時に複数組が通信可能な分散メモリ型並列
計算機であって、上記４個以上のＣＰＵ相互間の通信順
序を、通信のデータサイズに基づいて決定する通信スケ
ジュール決定手段を設けたことを特徴とする、分散メモ
リ型並列計算機。

【００４０】（付記２）上記通信スケジュール決定手
段は、通信のデータサイズが大きい順に、同時に通信可
能なＣＰＵの組を決定していく、付記１に記載の分散メ
モリ型並列計算機。

【００４１】（付記３）上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各ＣＰＵ
の送信と受信とを区別して各別に取り扱う、付記１また
は２に記載の分散メモリ型並列計算機。

【００４２】（付記４）上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各ＣＰＵ
の送信と受信とを区別せずに纏めて取り扱う、付記１ま
たは２に記載の分散メモリ型並列計算機。

【００４３】（付記５）４個以上のＣＰＵを同一の筐
体あるいは各別の筐体に収容し、これら４個以上のＣＰ
Ｕ相互間で同時に複数組が通信可能な分散メモリ型並列
計算機であって、上記４個以上のＣＰＵによって各別に
実現され、他の各ＣＰＵとの通信を行ないながら並列処
理を実行する並列処理手段と、上記各並列処理手段から
の問い合わせに応じて、それら並列処理手段の通信アー
キテクチャに基づいて上記４個以上のＣＰＵ相互間の通
信順序を決定し、その決定結果に応じて上記各並列処理
手段を制御する通信スケジュール決定手段とを設けたこ
とを特徴とする、分散メモリ型並列計算機。

【００４４】（付記６）上記通信スケジュール決定手
段は、上記４個以上のＣＰＵ相互間の通信順序を、通信
のデータサイズに基づいて決定する、付記５に記載の分
散メモリ型並列計算機。

【００４５】（付記７）上記通信スケジュール決定手
段は、通信のデータサイズが大きい順に、同時に通信可
能なＣＰＵの組を決定していく、付記５または６に記載
の分散メモリ型並列計算機。

【００４６】（付記８）上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各ＣＰＵ
の送信と受信とを区別して各別に取り扱う、付記５ない
し７のいずれかに記載の分散メモリ型並列計算機。

【００４７】（付記９）上記通信スケジュール決定手
段は、通信のデータサイズを求めるに際して、各ＣＰＵ
の送信と受信とを区別せずに纏めて取り扱う、付記５な
いし７のいずれかに記載の分散メモリ型並列計算機。

【００４８】（付記１０）４個以上のＣＰＵを同一の
筐体あるいは各別の筐体に収容し、これら４個以上のＣ
ＰＵ相互間で同時に複数組が通信可能な分散メモリ型並
列計算機を動作させるためのコンピュータ・プログラム
であって、上記４個以上のＣＰＵ相互間の通信順序を、
通信のデータサイズに基づいて決定するための通信スケ
ジュール決定プログラムを含むことを特徴とする、コン
ピュータ・プログラム。

【００４９】（付記１１）４個以上のＣＰＵを同一の
筐体あるいは各別の筐体に収容し、これら４個以上のＣ
ＰＵ相互間で同時に複数組が通信可能な分散メモリ型並
列計算機を動作させるためのコンピュータ・プログラム
であって、上記４個以上のＣＰＵを各別に動作させ、他
の各ＣＰＵとの通信を行ないながら並列処理を実行する
ための並列処理プログラムと、上記各並列処理プログラ
ムからの問い合わせに応じて、それら並列処理プログラ
ムの通信アーキテクチャに基づいて上記４個以上のＣＰ
Ｕ相互間の通信順序を決定し、その決定結果に応じて上
記各並列処理プログラムを制御する通信スケジュール決
定プログラムとを含むことを特徴とする、コンピュータ
・プログラム。

【００５０】

【発明の効果】以上説明したように本発明によれば、通
信スケジュール決定手段が、４個以上のＣＰＵ相互間の
通信順序を、通信のデータサイズに基づいて決定するの
で、通信の合計時間を良好に短縮できる。

【００５１】また、本発明によれば、通信スケジュール
決定手段が、各並列処理手段からの問い合わせに応じ
て、それら並列処理手段の通信アーキテクチャに基づい
て４個以上のＣＰＵ相互間の通信順序を決定し、その決
定結果に応じて各並列処理手段を制御するので、通信ア
ーキテクチャの種類毎に並列処理手段を動作させるため
の並列プログラムを作成する必要がない。

【図面の簡単な説明】

【図１】本発明に係る分散メモリ型並列計算機の概略構
成図である。

【図２】ＣＰＵ相互の通信動作の概念図である。

【図３】並列プログラムとスケジューリングプログラム
との連携動作の説明図である。

【図４】スケジューリングリクエストに用いられるフォ
ーマットの説明図である。

【図５】スケジューリング結果の説明図である。

【図６】スケジューリングプログラムによるスケジュー
リングのアルゴリズムの説明図である。

【図７】ノード間のデータの転送サイズの説明図であ
る。

【図８】データの転送サイズの大きい順にソートした結
果を説明する説明図である。

【図９】各ノードの通信状況を説明する説明図である。

【図１０】メッシュ構造の通信路を有する分散メモリ型
並列計算機の場合におけるデータの転送サイズの大きい
順にソートした結果を説明する説明図である。

【図１１】メッシュ構造の通信路を有する分散メモリ型
並列計算機の場合における各ノードの通信状況を説明す
る説明図である。

【図１２】別の実施形態におけるデータの転送サイズの
大きい順にソートした結果を説明する説明図である。

【図１３】各ノードの通信状況を説明する説明図であ
る。

【図１４】スイッチングハブ構造の通信路を有する分散
メモリ型並列計算機の概念説明図である。

【図１５】図１４に示す分散メモリ型並列計算機におい
てスケジューリングを施さない場合の転送順番の説明図
である。

【図１６】図１４に示す分散メモリ型並列計算機におい
てデータの転送サイズを考慮せずにスケジューリングを
施した場合の転送順番の説明図である。

【図１７】メッシュ構造の通信路を有する分散メモリ型
並列計算機の概念説明図である。

【図１８】トーラス構造の通信路を有する分散メモリ型
並列計算機の概念説明図である。

【符号の説明】

１ａ〜１ｄＣＰＵ２インターフェイス回路３ａ〜３ｄＲＡＭ

Claims

【特許請求の範囲】

【請求項１】４個以上のＣＰＵを同一の筐体あるいは
各別の筐体に収容し、これら４個以上のＣＰＵ相互間で
同時に複数組が通信可能な分散メモリ型並列計算機であ
って、前記４個以上のＣＰＵ相互間の通信順序を、通信のデー
タサイズに基づいて決定する通信スケジュール決定手段
を設けたことを特徴とする、分散メモリ型並列計算機。
【請求項２】４個以上のＣＰＵを同一の筐体あるいは
各別の筐体に収容し、これら４個以上のＣＰＵ相互間で
同時に複数組が通信可能な分散メモリ型並列計算機であ
って、前記４個以上のＣＰＵによって各別に実現され、他の各
ＣＰＵとの通信を行ないながら並列処理を実行する並列
処理手段と、前記各並列処理手段からの問い合わせに応じて、それら
並列処理手段の通信アーキテクチャに基づいて前記４個
以上のＣＰＵ相互間の通信順序を決定し、その決定結果
に応じて前記各並列処理手段を制御する通信スケジュー
ル決定手段とを設けたことを特徴とする、分散メモリ型
並列計算機。
【請求項３】４個以上のＣＰＵを同一の筐体あるいは
各別の筐体に収容し、これら４個以上のＣＰＵ相互間で
同時に複数組が通信可能な分散メモリ型並列計算機を動
作させるためのコンピュータ・プログラムであって、前記４個以上のＣＰＵ相互間の通信順序を、通信のデー
タサイズに基づいて決定するための通信スケジュール決
定プログラムを含むことを特徴とする、コンピュータ・
プログラム。
【請求項４】４個以上のＣＰＵを同一の筐体あるいは
各別の筐体に収容し、これら４個以上のＣＰＵ相互間で
同時に複数組が通信可能な分散メモリ型並列計算機を動
作させるためのコンピュータ・プログラムであって、前記４個以上のＣＰＵを各別に動作させ、他の各ＣＰＵ
との通信を行ないながら並列処理を実行するための並列
処理プログラムと、前記各並列処理プログラムからの問い合わせに応じて、
それら並列処理プログラムの通信アーキテクチャに基づ
いて前記４個以上のＣＰＵ相互間の通信順序を決定し、
その決定結果に応じて前記各並列処理プログラムを制御
する通信スケジュール決定プログラムとを含むことを特
徴とする、コンピュータ・プログラム。