JP2000315163A

JP2000315163A - プロセッサ資源の均衡のとれた分配を実行する方法及びそのシステム

Info

Publication number: JP2000315163A
Application number: JP2000026984A
Authority: JP
Inventors: Bradley Lewis; ルイスブラッドリー
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1999-02-04
Filing date: 2000-02-04
Publication date: 2000-11-14
Also published as: EP1031923A2

Abstract

(57)【要約】【課題】複数の反復を含むループ命令を最適に均衡させ
て多数のスレッドに分配し、次いで前記スレッドをネッ
トワークに接続された複数のコンピュータ或いは１つの
装置における複数のプロセッサに割り当てる改良された
分配システムを提供すること。【解決手段】タスクを均衡して即ち相対的に均一に複数
のプロセッサに分配することによりシステムの計算資源
をより効率的に使用することができる。本改良された分
配システムは先ず複数の反復を多数のプロセッサ間で分
配し、その後余剰の反復をプロセッサに均一に分配する
ことによって分散型の処理環境においてより効率的な資
源の割り当てをを実現する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、並列コンピューテ
ィングの分野に関し、更に詳しくは、多数のループ命令
の反復を分散型ネットワークのマルチプロセッサ、或い
は並列コンピューティング環境のマルチコンピューティ
ングスレッドに分配することに関するものである。

【０００２】

【従来の技術】「マルチスレッド化」という用語は、コ
ンピュータプログラムを論理的に独立した制御「スレッ
ド」に分割することを指し、かかるスレッドは並列実行
することが可能である。各スレッドは、一連の命令及び
前記命令が演算、入出力機能などのプログラムタスクを
実行する際に用いるデータを含んでいる。複数のプロセ
ッサを有するコンピュータシステムにおいては、少なく
とも２台のプロセッサが少なくとも１つのスレッドを実
行することによりプログラムのマルチプロセッシングま
たは並列化が実現される。マルチスレッド化されたプロ
グラムの全てのスレッドを１台のプロセッサで逐次処理
を行っても、プログラムの並列化は実現されない。

【０００３】１台のプロセッサでは一度に一つのスレッ
ドの命令しか実行することができないが、１台のプロセ
ッサでも複数のスレッドを並列に処理することは可能で
ある。このためには例えば、１つのスレッドに対応する
命令を選択した命令に到達するまで実行し選択した命令
に到達したらこれを停止して、次に別のスレッドに対応
する命令を実行し、これを全てのスレッドを完了するま
で行えばよい。この方法によれば、プロセッサが一旦複
数のスレッドの実行を開始すれば所与の時間中全ての実
行スレッドが「実行中」と言える状態になりマルチプロ
セッシングが実現される。つまり、マルチプロセッシン
グという用語には、複数のプロセッサを使ってプログラ
ムを実行することと１台のプロセッサを使って複数のス
レッドを実行することの両方が含まれる。マルチプロセ
ッシングコンピュータシステム（時には、並列コンピュ
ータシステムと称される）は、幾つかの動作を同時に行
うことにより、一度に１つの動作を行うプロセッサを１
台のみ有する逐次コンピュータシステムに比べ、概ねよ
り早くより効率的にプログラムを実行することができ
る。

【０００４】分散型コンピューティングネットワークで
は、ユーザはネットワークに接続された多数のコンピュ
ータの処理能力を享受することができる。分散型ネット
ワークは、別個のコンピュータに含まれる複数のプロセ
ッサの形態としても良いし或いは、プロセッサまたはス
レッドが大域メモリ資源を共有する並列システムの形態
としても良い。このような環境においては、多くの異な
る独立した演算を含むプログラムを迅速に並列処理する
ことができる。これは、前記演算を異なるスレッド間で
分割し該スレッドをネットワーク内の異なるプロセッサ
に割り当てることにより可能になる。

【０００５】１つのタスクをネットワーク内の複数のプ
ロセッサに割り当てる周知の分散システムに、各プロセ
ッサが実行する動作の数を計算するものがある。例え
ば、フォートランベースのコンパイラを備えるシステム
では、該システムはＤＯループのようなループ命令の反
復を分配するが、この反復を分配する際に、反復の数
（例えば、ループが実行されるべき回数）がプロセッサ
の数で均一に割り切れないと、システムは残りの反復を
常に第１のプロセッサに割り当てる傾向がある。従っ
て、例えば８台のプロセッサを有するシステムが１５回
の反復を行うループ命令を有する場合、各プロセッサが
１回ずつ反復を実行し残りの反復は第１のプロセッサが
実行することになる。結果として生じるこの様な不均衡
のため、１台のプロセッサに過度の負担をかけしかも他
のプロセッサを十分活用できないことになる。

【０００６】プロセッサの数（ＮＣＰＵ）と反復の合計
回数（Ｉ）が与えられれば、コンパイラは各プロセッサ
またはスレッドが実行する反復の最大回数を、Ｍ＝Ｉ／
ＮＣＰＵ＋ＭＯＤ（Ｉ，ＮＣＰＵ）を求めることによっ
て計算できる。プロセッサの数及び反復の回数はコンピ
ュータプログラマが手作業で入力しても良いし、コンパ
イラがシステム環境設定からこれらの値を求めるように
しても良い。この演算では、関数Ｍ（Ｉ，ＮＣＰＵ）
は、ＩをＮＣＰＵで割った数に最も近い整数のあとに残
る反復（即ち、余剰の反復）を返す。反復を割り当てる
この周知の方法は以下のフォートランコードで定義され
る。 Iterarions_Per = I/NCPU Extra_Iterations = M(I,NCPU) for i = 1 to NCPU do Mi = I/NCPU M1 = M1 + M(I,NCPU) C$PAR DOALL (parallelized operation) DO 10,I = 1,15 CALL DOWORK(I); where "DOWORK" represents some arbitrary calculation 10 CONTINUE このコードのC$PARプログラムはプログラマによって記
述された指令であり、コンパイラに、上述のDOALL命令
のループは並列化可能なことを示すものである。コンパ
イル中、コンパイラは、制御オペレーティングシステム
によって実行されると多数のスレッドを生じさせるコー
ドを各プロセッサに１つずつ生成して前記ループを並列
化する。しかしながら、この分配方法を用いると第１の
プロセッサ（Ｍ１）が残りの反復全てを受け取ることに
なり、分配が不均衡になってしまう。

【０００７】表１は、周知の分配方法を用いた例を示
す。表１には、各プロセッサが実行する反復の回数、各
反復の実行に一定時間Ｘを要す場合の実行時間、及び、
それぞれ１、２、４及び８台のプロセッサで設定された
分散型或いは並列処理環境で達成できるスケーラビリテ
ィが示される。

【０００８】

【表１】

【０００９】上記スケーラビリティ要素は、プロセッサ
の数にその設定プロセッサにおける実行時間を掛け、こ
の数で１台のプロセッサにおける実行時間を割ったもの
表す。このパラメータは効率を表す要素であり、追加の
プロセッサがシステムにおいてどの程度効率的に機能し
ているかを評価する。このスケーラビリティパラメータ
が１台のプロセッサの場合におけるスケーラビリティで
ある１に近ければ近いほど、その分散グループのプロセ
ッサの効率が良いことを表す。表１からわかるように、
結果として生じる不均衡な負荷のためループ命令の実行
速度が２台のプロセッサでの場合と８台のプロセッサで
の場合とが同じになってしまい、スケーラビリティも理
想的なレベルである１を大きく下回り無駄が多くなる。
このように、並列分配システムは改良が望まれる。

【発明が解決しようとする課題】

【００１０】以上説明したように、分散型或いは並列の
コンピューティング環境において多数のループ反復を有
するプログラムの並列処理を行うにあたり、周知の分配
方法はプロセッサの数で割りきれない余剰の反復を単に
第１のプロセッサに割り当てて反復の分配を行う。この
ため分配が不均衡になってしまい、結果として１台のプ
ロセッサに過大な負荷がかかる上他のプロセッサの処理
能力を十分活用できないことになる。本発明は周知の方
法を改良し、かかる余剰の反復についてもプロセッサに
均一に割り当てて反復を最適に均衡させて分配すること
ができる分配方法及びそのシステムを提供することを課
題とする。即ちシステムのコンピューティング資源を更
に効率よく利用することを課題とする。

【００１１】

【課題を解決するための手段】上記課題を解決するため
に、本発明によるシステム及び方法は、データ処理シス
テムにおいて複数のループ反復を複数のプロセッサ間で
均衡させるための、コンピュータにより実行される方法
を提供する。該方法は、プログラムを実行する複数のプ
ロセッサからプログラムを実行するプロセッサの数を決
定する工程と、少なくとも２つの反復を割り当てずに残
して全てのプロセッサに分配する反復の数を決定する工
程と、分配されていない少なくとも２つの前記反復を少
なくとも２つの前記プロセッサに分配する工程とを備え
ることを要旨とするものである。

【００１２】本発明による他の方法はまた、複数のプロ
セッサを有するデータ処理システムを提供する。該シス
テムは、複数の反復を含むプログラムを格納するメモリ
を有し、前記プログラムは、少なくとも２つの反復を割
り当てずに残して実行のために均等数の反復を各プロセ
ッサに割り当てて前記反復を分配するよう構成されたコ
ードを有し、前記コードは更に、前記割り当てられてい
ない反復を少なくとも２つのプロセッサに割り当てるよ
う構成されており、少なくとも１つのプロセッサが前記
プログラムを実行するよう構成されることを要旨とする
ものである。

【００１３】上記の課題を解決するための手段及び下記
の詳細な説明は発明の請求の範囲を限定するものではな
く、単に第三者が発明を実施するための例と説明を提供
するためのものである。

【発明の実施の形態】

【００１４】本明細書に組み込まれその一部を構成する
添付図面は発明の実施の形態を説明するものであり、以
下の説明と共に本発明の利益及び原理を説明するもので
ある。以下、本発明の一実施の形態を、添付図面に示し
た発明の説明より明らかな例を挙げて説明する。添付図
面では、異なる図面においても同一或いは類似の要素は
可能な限り同一の参照符号を用いて示した。

【００１５】本発明に係るシステム及び方法は改良され
た分配システムを提供し、これによりプログラムの命令
をプロセッサにより均一に分配して、分散型または並列
コンピューティング環境において資源をより効率的に使
用することを可能にする。処理資源をより適切に割り当
てるため、本発明によるシステム及び方法を実装すると
システムの各プロセッサにスレッドが作成され、ループ
の繰り返し回数をシステムのプロセッサの数で割って各
スレッドに割り当てる反復の初期値が決定される。この
後、除算の剰余は各スレッドに均一に分散されるので、
結果として既存のシステムよりも改善された分配が行え
る。係る機能性を実現するために、プログラマは、１か
らシステムに含まれるプロセッサ数まで繰り返す外側ル
ープの内側にプログラムループを挿入する。この外側ル
ープを使うと、コンパイラは内側ループをより均一にプ
ロセッサに分配するコードを生成するよう命令される。

【００１６】改良された分配システムは周知の方法を改
善せしめる。なぜなら、周知の分散システムは、ループ
反復を割り当てる際は先ず反復の回数をプロセッサの数
で割って各プロセッサに最小回数の反復を割り当て、剰
余の反復は第１のプロセッサに割り当てるからである。
これに対し前記改良されたシステムは剰余の反復回数を
全てのプロセッサに再び分配する。この第２の分配が完
了すると、プログラムは新たに均衡させた反復に従って
実行される。

【００１７】本発明に係るシステム及び方法によれば、
分散型環境、ネットワーク、またはシステムは（１）別
個のコンピュータに含まれる複数のプロセッサ、（２）
共通の大域メモリを共有する複数のプロセッサまたはス
レッド、（３）多数のスレッドを並列処理する１つのプ
ロセッサ、のいずれかを含むものである。よって、改良
された分配方法を用いて、複数のスレッド、複数のプロ
セッサ、または複数の装置にプログラムを分配させるこ
とが可能である。

【００１８】コンピュータネットワーク図１は、本発明に係る方法及びシステムに用いるのに適
した分散型コンピュータシステム１００を図示する。図
１のコンピュータシステム１００は、コンピュータ１２
０、１３０、１４０及び１５０を相互接続するネットワ
ーク１１０を含む。この構成では、ネットワーク１１０
は、ローカルエアリアネットワーク（ＬＡＮ）でも良い
し、広域ネットワーク（ＷＡＮ）でも良いし、或いはイ
ンターネットでも良い。

【００１９】ネットワーク１１０はコンピュータ１２
０、１３０、１４０及び１５０を連結するので、これに
より情報の共有、データの伝送、及び演算能力の共有が
できる。これらのコンピュータは、ネットワークの構成
に応じルーター、スイッチまたはハブのようなネットワ
ーク相互接続装置でネットワーク１１０に接続される。

【００２０】概して、本発明に従って設計された動的分
散型コンピューティングシステムは該システムに連結さ
れた各コンピュータシステムに置くことができる。従っ
て、各コンピュータは発生した要求及び提供されるサー
ビスに応じ、クライアント或いはサーバーのいずれとし
ても動作する。一般的には、クライアントがサーバーコ
ンピュータ上でタスクを行うよう要求し、サーバーコン
ピュータがこのタスクを処理する。

【００２１】コンピュータシステム図２は、コンピュータ１２０を更に詳細に図示する。
尚、図にはコンピュータ１２０を示すがコンピュータ１
３０、１４０及び１５０も同様な構成である。下記の説
明では、例えばＩＢＭＰＳ／２シリーズのパーソナル
コンピュータやＳＰＡＲＣ２．６ワークステーション
といった特定のコンピュータシステムの説明に共通して
用いられる用語に言及するが、下記の説明及びその概念
はネットワークコンピュータ或いは図１とは異なるアー
キテクチャを有するメインフレームコンピュータのよう
な他のコンピュータシステムにも等しく当てはまること
は、いわゆる当業者には当然認識されるものである。Ｓ
ｕｎ、ＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ、及びＳｕｎ
のマークは、米国及びその他の国におけるＳｕｎＭｉ
ｃｒｏｓｙｓｔｅｍｓ，Ｉｎｃ．の商標或いは登録商標
である。また、ＳＰＡＲＣの商標は、米国及びその他の
国におけるＳＰＡＲＣＩｎｔｅｒｎａｔｉｏｎａｌ，
Ｉｎｃ．の登録商標であり、その許可の下に使用され
る。ＳＰＡＲＣの商標を付した製品は、ＳｕｎＭｉｃ
ｒｏｓｙｓｔｅｍｓ，Ｉｎｃ．が開発したアーキテクチ
ャを基盤とする製品である。

【００２２】コンピュータ１２０は、メモリ２１０、二
次記憶装置２２０、中央処理装置（ＣＰＵ）２３０、入
力装置２４０、及びビデオディスプレイ２５０を有す
る。本開示の目的上、ＣＰＵという用語はプロセッサと
いう用語と交換可能とする。メモリ２１０は、該メモリ
内に格納されたプログラム２１２、前記プログラムをコ
ンパイルするコンパイラ２１４、コンパイル後のプログ
ラム２１２を実行するのに用いられるオペレーティング
システム２１６を含む。

【００２３】プログラム２１２は、命令を含む実行プロ
グラムである。コンパイラ２１４は、プログラム２１２
の実行コードを生成するのに用いられる標準的なプログ
ラムコンパイラである。ＳｕｎＦｏｒｔｒａｎ−７７
５．０はよく知られたコンパイラであり、本発明に係る
システム及び方法と共に用いることができるものの一例
である。オペレーティングシステム２１６は、コンパイ
ラ２１４が動作できる環境、及び、コンパイラ２１４が
プログラム２１２をコンパイルした後プログラム２１２
を実行するのに必要な命令を提供する。Ｓｐａｒｃ
２．０ワークステーションに実装されるＳｏｌａｒｉｓ
２．６はよく知られたオペレーティングシステムであ
り、本発明に係るシステム及び方法に用いることができ
るものの一例である。

【００２４】尚、コンピュータ１２０を様々な構成要素
と共に示したが、このコンピュータが他にも追加の構成
要素或いは異なる構成要素を含み得ることは、当業者に
は当然認識されるものである。更に、本発明の実施態様
例はメモリに格納されるものとして説明したが、これら
の実施態様例はハードディスク、フロッピー（登録商
標）ディスク或いはＣＤ−ＲＯＭのような二次記憶装
置、インターネットなどネットワークからの搬送波、或
いは他の形式のＲＡＭ或いはＲＯＭなど、いかなるタイ
プのコンピュータ可読媒体にも格納しそこから呼出すよ
うにしてもよいことは、当業者には当然認識されるもの
である。

【００２５】分配動作図３は、複数の反復を有するプログラムを複数のプロセ
ッサに分配するのに用いられる手続き３００の主なステ
ップを示すフローチャートである。最初に、プログラマ
はＤＯループなど、ループ命令の複数の反復を含むプロ
グラムを用意する。プログラマがマルチプロセッサ環境
で作業している場合、このプログラムコード及びループ
命令はシステムの多数のプロセッサで並列処理される。
システムの環境設定によりループ命令を実行するのに使
用可能なシステムプロセッサの数が提供される。C$PAR
DOALL指令は、プログラムをコンパイルするコンパイラ
にループ命令が並列で実行されるよう命令する。下記の
コードは上述の説明に合致するコードを示す。 C$PAR DOALL (parallelized operation) DO 10, I = 1, 15 CALL DOWORK (I); where "DOWORK" represents some arbitrary calculation 10 CONTINUE 本発明に係るシステム及び方法によれば、プログラマは
内側ＤＯループの周りに外側ループを挿入してシステム
のプロセッサに反復を分配する。以下に説明するよう
に、この外側ループは１からプロセッサの数に達するま
でカウントしてシステムのプロセッサまたはスレッドに
反復を均等に分配する。

【００２６】プログラムが記述されると、コンパイルで
きる状態になる（ステップ４２０）。以下に詳細に説明
するように、コンパイラ２１４はC$PAR DOALL命令を用
いてループ命令の分配先とするための多数のスレッドを
発生させる。コンパイルの際はコンパイラ２１４はプロ
セッサの数及び反復の回数を示す環境設定を用いてプロ
グラム２１２の実行コードを生成する。この結果生成さ
れたコードを用いて次にシステムの各スレッド或いはプ
ロセッサが実行する反復の回数が求められる。

【００２７】最後に、実行時にはオペレーティングシス
テム２１６はコンパイラ２１４が生成したコードを使っ
て前記スレッドをシステムのプロセッサに分配する（ス
テップ４３０）。オペレーティングシステム２１６は前
記スレッドをシステム内の１台のプロセッサに分散する
ことも、システム内の複数のプロセッサに分配すること
も選択できる。いずれの場合にも、一旦オペレーティン
グシステム２１６がスレッドを割り当てると、前記オペ
レーティングシステムがプログラム２１４及び割り当て
られた命令をスレッド間で並列に実行し、内側ループに
よって要求された結果を生成する。

【００２８】図４は、図３に示す方法においてコンパイ
ラ２１４が実行するステップ（ステップ３２０）のフロ
ーチャートである。コンパイラ２１４は先ず、プログラ
ム２１２に含まれるループ命令を実行するのに使用可能
なプロセッサの数（ＮＣＰＵ）を決定する（ステップ４
０５）。プロセッサの数はプログラム２１２のコンパイ
ル時に環境設定入力から求めても良いし、プログラマが
入力して行うシステムの予備設定から求めても良い。次
に、コンパイラ２１４はプログラム２１２に含まれるル
ープ命令を完了するのに必要なプログラム反復回数
（Ｉ）を求める（ステップ４１５）。これらの初期決定
によりコンパイラ２１２は各プロセッサまたはスレッド
が実行するよう割り当てられる反復の最小回数（ＮＰＥ
Ｒ）を算出できる。

【００２９】ＮＣＰＵの値が与えられたとして、反復の
回数がプロセッサの数で均一に割り切れないときは、コ
ンパイラ２１４は割り当てられずに残っている余剰反復
回数（ＮＥＸＴＲＡ）を求める（ステップ４２０）。こ
のステップを行うには、ＮＣＰＵに各プロセッサが実行
する反復の回数（ＮＰＥＲ）を掛け、得られた結果をル
ープ命令の反復の回数（Ｉ）から差し引けばよい。ＮＥ
ＸＴＲＡ＝Ｉ−（ＮＰＥＲ＊ＮＣＰＵ）割り当てられて
いない反復の回数が決定されると、コンパイラ２１４は
この残りの反復をプロセッサの数に割り当てる。

【００３０】この割り当てを行うには、先ずＮＣＰＵが
ＮＥＸＴＲＡ以下かどうかを求める（ステップ４２
５）。もしＮＣＰＵがＮＥＸＴＲＡ以下であれば、パラ
メータＩＳＴＡＲＴの計算から始まりパラメータＩＥＮ
Ｄの計算で終わるループ命令を開始する。このタイプの
ループ命令はフォートランのようなプログラム言語では
しばしば用いられるものであり、ＩＳＴＡＲＴ及びＩＥ
ＮＤの２つのパラメータがループ命令を完了するのに必
要なループの反復回数を表すことは、当業者には当然認
識されるものである。

【００３１】コンパイラ２１４は、ＮＰＥＲをＮＣＰＵ
の値に加え、この整数値に１からＮＣＰＵを差し引いた
値を掛けてＩＳＴＡＲＴを算出する（例えば、ＩＳＴＡ
ＲＴ＝（ＮＣＰＵ−１）＊（ＮＰＥＲ＋ＮＣＰＵ））
（ステップ４３０）。コンパイラ２１４はまた、ＩＳＴ
ＡＲＴをＮＰＥＲに加えてＩＥＮＤを算出する（例え
ば、ＩＥＮＤ＝ＩＳＴＡＲＴ＋ＮＰＥＲ）（ステップ４
３５）。

【００３２】これに対し、ＮＣＰＵがＮＥＸＴＲＡより
も大きいときは、コンパイラ２１４は、ＮＰＥＲをＮＣ
ＰＵの値に加え、この整数値に１からＮＣＰＵを差し引
いた値を掛け、次いでこの値に１を加えてＩＳＴＡＲＴ
を算出する（例えば、ＩＳＴＡＲＴ＝１＋（ＮＣＰＵ−
１）＊（ＮＰＥＲ＋ＮＣＰＵ））。そして、コンパイラ
２１４は、ＩＳＴＡＲＴをＮＰＥＲに加えてＩＥＮＤを
算出する（ステップ４４５）。ＮＣＰＵがＮＥＸＴＲＡ
以下であるか否かに関わらず、剰余の反復全てがプロセ
ッサに割り当てられるまでループ命令は繰り返される
（ステップ４５０）。

【００３３】全プロセスを更に詳細に下記のフォートラ
ンプログラムのループ命令コードで示すが、これはあく
までも例示の目的のためである。このループ命令コード
は１５回の反復を含むプロセスの割り当てを行うもので
ある。 NPER = 15 / NCPU NEXTRA = 15 - (NPER*NCPU) C$PAR DOALL DO 20, NCPU = 1, NCPU if(NCPU .LE.NEXTRA)then ISTART = (NCPU - 1)*(NPER + NCPU) IEND = ISTART + NPER else ISTART = 1 + (NCPU - 1) * (NPER + NEXTRA) IEND = ISTART + NPER - 1 end if Do 10, I = ISTART, IEND CALL DO WORK(I) [i.e., some function] 10 Continue 20 Continue

【００３４】図４に方法４００として示す上述のコード
は、既存の分配方法に比べより効率的なプロセッサ資源
の割り当てを行う手段を提供するものである。表２は、
本実施例に係る方法とシステムのスケーラビリティが前
述の例よりも大幅に向上していることを示す。この例は
１５回の反復を有するプログラムを１台乃至８台のプロ
セッサに割り当てた場合の分配、実行時間、及びスケー
ラビリティを示す。

【００３５】

【表２】

【００３６】結果として得られる分配によれば資源の割
り当てが更に効率的に行われ、スケーラビリティ要素が
１台のプロセッサシステムの場合に近くなり、既存の方
法に比べプログラムの実行時間が大幅に短縮される。

【００３７】本発明が、発明の範囲或いはその精神から
逸脱することなく開示した実施形態の様々な変容と変形
が可能なことは、当業者には当然認識されるものであ
る。例えばここではプログラム言語のフォートランの例
を挙げたが、本発明に係るシステム及び方法はいかなる
タイプの分散型或いは並列コンピューティング環境にお
いても同様に効率よく動作する。更に、本発明に係るシ
ステム及び方法における上述の分配アルゴリズムはネッ
トワークの各プロセッサに格納されるので、該ネットワ
ークのどの分散プロセッサを用いても動作させることが
できる。

【００３８】明細書の考察及びここに開示した発明の実
施形態の実施から、本発明の他の実施形態も当業者にと
っては当然とするところである。明細書及び実施例はあ
くまでも例であり、本発明の真の範囲及び精神は上述の
請求項及びその均等物によって定められるものである。

【００３９】

【発明の効果】以上説明したように、本発明によるシス
テム及び方法は改良された分配システムを提供する。係
るシステムは複数の反復を有するループ命令を多数のス
レッド間で最適に均衡させ、前記スレッドをネットワー
クに接続された複数のコンピュータ或いは１台の装置の
複数のプロセッサに割り当てることによって周知のシス
テムを改善せしめるものである。タスクを複数のプロセ
ッサに均衡させて或いは相対的に均一に分配することに
より、システムのコンピューティング資源を更に効率よ
く利用できるようになる。これを達成するため、最初に
反復の回数をプロセッサの数で割った後、剰余の反復を
単に第１のプロセッサに割り当てる既存の方法とは違
い、改良された本分配方法は残りの反復もプロセッサに
均一に分配する。この結果、分散型或いは並列のコンピ
ューティング環境においてより効率的な資源の分配が行
うことができ、本発明は産業上極めて有益なものであ
る。

【図面の簡単な説明】

【図１】本発明に係るシステム及び方法に用いるのに適
した分散型コンピューティングネットワークを示したブ
ロック図である。

【図２】図１のコンピュータを更に詳細に示した図であ
る。

【図３】本発明に係るシステム及び方法によって複数回
反復されるループを多数のプロセッサに分配する際に実
行される主な工程を示したフローチャートである。

【図４】図３の分配方法において実行される工程を更に
詳細に示したフローチャートである。

【符号の説明】

１００分散型コンピュータシステム１１０ネットワーク１２０コンピュータ１３０コンピュータ１４０コンピュータ１５０コンピュータ２１０メモリ２１２プログラム２１４コンパイラ２１６オペレーティングシステム２２０二次記憶装置２３０中央処理装置２４０入力装置２５０ビデオディスプレイ

Claims

【特許請求の範囲】

【請求項１】各プロセッサにスレッドを生成する工程
と、ループ反復を、少なくとも２つ割り当てずに残して前記
生成された各スレッドに均等数ずつ割り当てる工程と、前記割り当てられていないループ反復を少なくとも２つ
のスレッドに分配する工程と、を有することを特徴とする多数のプロセッサと多数のル
ープ反復を有するプログラムとで構成されるデータ処理
システムに用いられる方法。
【請求項２】前記プロセッサは複数の装置に含まれ、前記割り当て工程は、前記複数の装置に含まれるプロセ
ッサに前記均等数のループ反復を割り当てる副工程を含
むことを特徴とする請求項１に記載の方法。
【請求項３】前記割り当てられていないループ反復の
分配工程は、前記複数の装置に含まれるプロセッサに前
記割り当てられてないループ反復を分配する副工程を含
むことを特徴とする請求項２に記載の方法。
【請求項４】前記プログラムはフォートランコードで
記述されており、前記割り当て工程は、フォートランループ反復を、少な
くとも２つ割り当てずに残して前記生成された各スレッ
ドに割り当てる副工程を含むことを特徴とする請求項３
に記載の方法。
【請求項５】前記分配工程は、前記割り当てられてい
ないフォートランループ反復を少なくとも２つのスレッ
ドに分配する副工程を含むことを特徴とする請求項４に
記載の方法。
【請求項６】１からプロセッサ数まで繰り返す外側ル
ープと並列化のための分割された機能を実行する内側ル
ープとを含むコードをデータ処理システムに受信する工
程と、前記コードをコンパイルしてプログラムを生成する工程
と、前記プログラムを実行して内側ループの反復をプロセッ
サに分配させる工程と、を有することを特徴とする多数のプロセッサと多数のル
ープ反復を有するプログラムとで構成されるデータ処理
システムに用いられる方法。
【請求項７】前記プロセッサは複数の装置に含まれ、
更に、前記実行工程は、前記プロセッサの数を決定する副工程と、前記内側ループの反復を複数の装置に含まれる前記プロ
セッサに分配する副工程と、を含むことを特徴とする請求項６に記載の方法。
【請求項８】複数の反復を含むプログラムを格納する
メモリを有し、前記プログラムは、少なくとも２つの反
復を割り当てずに残して実行のために均等数の反復を各
プロセッサに割り当てて前記反復を分配するよう構成さ
れるとともに前記割り当てられていない反復を少なくと
も２つのプロセッサに割り当てるよう構成されたコード
を有するものであり、更に、前記プログラムを実行するよう構成されたプロセッサの
少なくとも１つを有することを特徴とする複数のプロセ
ッサから構成されるデータ処理システム。
【請求項９】少なくとも１つの前記プロセッサは並列
に動作し且つ多数のスレッドを含み、前記コードは更に複数の反復を前記多数のスレッドに割
り当てるよう構成されたものであることを特徴とする。
請求項８に記載のシステム。
【請求項１０】前記プログラムは内側ループと外側ル
ープとを含み、前記外側ループは１から前記複数のプロセッサ数まで実
行されるものであることを特徴とする請求項８に記載の
方法。
【請求項１１】前記複数のプロセッサは１つの装置に
位置することを特徴とする請求項１０に記載のシステ
ム。
【請求項１２】前記複数のプロセッサは複数の装置に
位置することを特徴とする請求項１０に記載の装置。
【請求項１３】データ処理システムにコードを受信す
る手段を有し、前記コードは１からプロセッサ数まで繰
り返す外側ループと並列化のための分割された機能を実
行する内側ループとを含むものであり、更に、前記コードをコンパイルしてプログラムを生成する手段
と、前記プログラムを実行して前記内側ループの反復をプロ
セッサに分配させる手段と、を有することを特徴とする多数のプロセッサと多数のル
ープ反復を含むプログラムとから構成されるデータ処理
システム。
【請求項１４】前記プロセッサは複数の装置に含まれ、
更に、前記実行手段は、前記プロセッサの数を決定する手段と、前記内側ループの反復を前記複数の装置に含まれるプロ
セッサに分配する手段と、を有することを特徴とする請求項１３に記載のシステ
ム。