JPS62233873A

JPS62233873A - 並列計算機システム

Info

Publication number: JPS62233873A
Application number: JP61076492A
Authority: JP
Inventors: Mamoru Sugie; 杉江　衛; Mitsugi Yoneyama; 米山　貢
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1986-04-04
Filing date: 1986-04-04
Publication date: 1987-10-14
Also published as: JPH0516066B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は複数のプロセッサ・エレメントからなる並列計
算機システムに係り、特に、知識処理に好適な並列計算
機システムに関する。

〔従来の技術〕

計算機性能の飛躍的向上に対して、１００〜１０．００
０台規模あるいはそれ以上のプロセッサ・エレメントを
並列動作させるアーキテクチャが有望視されている。特
に、知識処理向きの１１算機では、従来性能の飛騨的向
上が不可欠であること、実行するプログラム自身が並列
性を有することから、上記のアーキテクチャが一般に採
用されている。

並列計算機の構成に関しては、「イリノ、イ大学・コン
ピュータ・サイエンス・デパートメン１〜・レボ−１−
・Ｎｏ、８３−１１２３Ｊ　　（Ｕｎｉｖｅｒｓｊシｙ
ｏｆ　　Ｉ　１ｌｉｎｏｉｓ　ａｊ　Ｕｒｂａｎｄ　−
Ｃｈａｍｐａｉｇｎ、　Ｄ　Ｃ５Ｒｃｐｏｒｊ　Ｎｏ、
　８３−１１２３　（Ｃｅｄａｒ　Ｄｏｃ。

Ｎｏ、５））に示されているように、プロセッサ・エレ
メントをクラスタに分割し、クラスタの内外をネッＩ−
ワークで結合する方式が知られている。

また、数台規模の並列計算機システムでは、ｒＭＶＳ／
拡張アーキテクチャ・オーバービュー。

ＧＣ２８−１３４８０，Ｆｉｌｅ　Ｎｏ、５３７０−３
　４　　Ｊ　　　（Ｍ　Ｖ　　Ｓ　　／　Ｅ　ｘしｅｎ
ｄｅｄ　　Δｒｃｈｉ仁ｅｃｔｕｒｅ○ｖａｒｖｉｅｗ
、　ＧＣ２８１３４８０、ＦｉｌｅＮｏ、５３７０−３
４）に示されているように、プロセッサ・エレメントが
メモリを共有し、この共有メモリを介して結合するとい
う方式も知られている。

〔発明が解決しようとする問題点〕

上記従来技術には、高性能が得られないという問題があ
った。並列計算機の性能は、プロセッサ・エレメントの
単体性能と並列動作するプロセッサの台数との積で決定
さ九る。第１の従来技術では、各プロセッサ・エレメン
トがネットワークを介して結合されているので独立性が
高く、高い並列性が得られる。しかしながら、タスクを
分配するにあたって、親タスクの識別子、タスクの環境
データ等の情報をバケツ１〜の形態で転送しなければな
らず、タスク分配のオーバーヘッドが大きくなって、プ
ロセッサ・エレメント単体の性能が低下してしまう。一
方、第２の従来技術では、全てのプロセッサ・エレメン
トが同一のメモリをアクセスするためにメモリのアクセ
ス衝突が生じて高々数台程度しか結合できず、高い並列
性が得られない。

本発明の目的は、高いプロセッサ・エレメント単体性能
を保持しつつ、高い並列性を得ることのできるｉｌｅｌ
針列機システムを提供することにある。

〔問題点を解決するための手段〕

」二記目的は１階層を形成しているクラスタのうち最下
層のクラスタについて、ネットワークによるプロセッサ
・エレメントの結合の代りに、共有メモリによる結合を
導入することによって達成される。

〔作用〕

階層構造９α列計算機システムでは、プロセッサ・エレ
メントからなるクラスタを結合し、これを階層的に積み
上げて、システムを構成する。そして、各ｒＰ１層の結
合に対しては、上層から下層に向うほど、スループット
を大きくする、これは、下層のクラスタはどそれに属す
るプロセッサ・ニレメン１−の数が少ないので、スルー
プットを大きくすることができるためである。

こうした階層構造−）η列計算機システムでは、並列処
理の効率を上げるため、タスクのクラスタへの閉じ込め
を図る。即ち、クラスタ内のプロセッサ・エレメントが
実行するタスクから派生したタスクはその大部分を同一
クラスタ内のプロセッサ・ニレメン１−で実行し、何分
の１かを他のクラスタへ分配する。これは、クラスタ内
のプロセッサ・エレメント間のデータ交信に対して、異
なるクラスタに属するプロセッサ・ニレメン１−間のデ
ータ交信に対するよりも大きなスループットが得られる
からである。

本発明では、最下層のクラスタ内のプロセッサ・エレメ
ントが共有メモリを介して結合されている。タスクの分
配等に伴なうデータ転送に対して。

このクラスタ内のプロセッサ・ニレメン１へ間では。

そのデータが共有メモリに格納されているので、アドレ
ス・ポインタを転送するだけで、実際にデータをバケツ
１−として送る必要がない。そのためタスク分配のオー
バーヘッドが著しく軽減されこれによって、高いプロセ
ッサ・エレメント単体性能を得ることができる。また、
クラスタはネットワーク等によって階層的に結合されて
いるので。

１００台以上の高並列性も達成できる。

本発明では、最も交信の多い最下層クラスタ内のプロセ
ッサ・エレメント間のデータ転送に共有メモリを用いる
ので、その効果が最も大きい。

〔実施例〕

以下１本発明の一実施例を第１図により説明する。並列
計算機は、＃Ｏ〜＃ｎのレベル１クラスタ３０．メイン
メモリ１０．レベル１ネツトワーク２０から構成されて
いる。レベル１クラスタ３０はレベル１ネツトワーク２
０によって結合されており、レベル１クラスタコントロ
ーラ２００がレベル１クラスタ３０１？ｉｌの負荷分１
校を１１ノ御する。

各レベル１クラスタ３０は＃０〜＃ｎレベル２クラスタ
４０．レベル２ネットワーク１００．レベル１クラスタ
コントローラ２００からなる６各レベル２クラスタ４０
は、＃０〜＃Ｑのプロセッサ・エレメント７０．共有メ
モリ５０．レベル２クラスタコン１ヘローラ３００から
なり、レベル２クラスタコントローラ３００がレベル２
クラスタ間の負荷分散を制御する。

レベル１クラスタコントローラ２００は、まず、メイン
メモリ１０に置かれたタスクを取り込み、あるレベル２
クラスタ、例えば＃０の共有メモリ５０上のタスク・キ
ューにつなぐ。タスクの取り込みとは、親タスクの識別
子、タスクの環境データ、実行するプログラムへのポイ
ンタ等の転送を言う。

プロセッサ・エレメント７０は、共有メモリ５０上のタ
スク・キューからタスクを取り出して実行し、その結果
、子タスクを生成して、これを共有メモリ５０上のタス
ク・キューにつなぐ。共有メモリ５０上のタスク・キュ
ーからのタスクの取り込みは、タスクの実行の終了時又
は中断時に行なう。

レベル２クラスタコントローラ３００は、共有メモリ５
０上のタスク・キューに貯えられているタスクのうち、
同一レベル１クラスタに属する他のレベル２クラスタ又
は、他のレベル１クラスタに分配するタスクを選択して
、親タスクの識別子。

タスクの環境データ等を目的のクラスタへ送出する。他
のレベル１クラスタに送出する場合には。

一旦、同一レベル１クラスタに属するレベル１クラスタ
コントローラ２００にパケットを送出し、このレベル１
クラスタコントローラ２００が、送出先のレベル１クラ
スタ３０に属するレベル１クラスタコントローラ２００
にパケットを送出する。

送出先のレベル１クラスタコントローラ２００は、送ら
れたパケットを、あるレベル２クラスタ４０の共有メモ
リ５０へ書き込み、タスク・キューにつなぐ。

レベル１クラスタ数を１、レベル２クラスタ数を１０．
クラスタ内のプロセッサ・エレメント数をＩＯ、タスク
の実行時間をＴ、共有メモリへの子タスクの登録に要す
る時間を０．ＩＴ、ネットワークを介してのタスクの転
送に要する時間を１０×Ｔ、他へのクラスタへのタスク
の分配確率を０，１とすると、全体性能Ｐ９は次式で表
わされる。

Ｐ５＝−−二一−ｘ　１００Ｔ＋０．ＩＴ＋０．Ｉ　　Ｘ　１０ＸＴ一方、レベル２
クラスタ＃０〜＃ｍ内のプロセッサ・エレメントをネッ
トワークで結合した場合の牡能Ｐ　１１は次式のように
なる。

したがって、クラスタ内のプロセッサ・エレメントをも
ネットワークで結合した場合に比して、５−３　（Ｐ　
ｓ／　Ｐ　ｎ）の性能改善が得られる。

〔発明の効果〕

本発明によれば、最下層クラスタにおける並列動作のた
めのオーバーヘッドを軽減できるので５個々のプロセッ
サ・エレメントの性能を低下させることなく高い並列性
を達成するのに効果がある。

これによって、並列計算機システムの全体性能向上が図
れる。

【図面の簡単な説明】

第１図は本発明の一実施例の構成を示す図である。

Claims

【特許請求の範囲】

１、複数のプロセッサ・エレメントを結合してクラスタ
を構成し、該クラスタを結合して次階層のクラスタを構
成し、各プロセッサ・エレメントを並列に動作させる階
層構造並列計算機システムにおいて、最下層のクラスタ
内のプロセッサ・エレメント間のデータ交信に、該クラ
スタ内の全プロセッサ・エレメントがアクセス可能な共
有メモリを用いることを特徴とする並列計算機システム
。