JPH09305552A

JPH09305552A - 負荷均等化装置

Info

Publication number: JPH09305552A
Application number: JP8144929A
Authority: JP
Inventors: Shoichi Sakon; 彰一左近
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1996-05-15
Filing date: 1996-05-15
Publication date: 1997-11-28
Anticipated expiration: 2016-05-15
Also published as: JP2910676B2

Abstract

(57)【要約】【課題】複数のノードがネットワークを介して接続さ
れた分散並列処理システムに於いて、各ノードの性能が
異なる場合であっても、各ノードの負荷が均等になるよ
うにする。【解決手段】ソースプログラム３が入力されると、コ
ンパイラ11は、ソースプログラム３を翻訳して分散並列
処理システム２で並列処理可能な実行プログラム12を生
成すると共に、ソースプログラム３の最頻実行部分に使
用されている演算に基づいて、各ノード21-1〜21-Nの性
能を測定するための性能測定プログラム13を生成する。
実行プログラム12を実行させる場合、スケジューラ14
は、それに先立って各ノード21-1〜21-Nに性能測定プロ
グラム13を実行させ、各ノード21-1〜21-Nの性能を測定
する。その後、スケジューラ14は、各ノード21-1〜21-N
の性能比に応じて実行プログラム12の処理を各ノード21
-1〜21-Nに割り当てる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数のノードから
構成され、各ノードが１つのジョブを並行して実行する
分散並列処理システムに於いて、各ノードの負荷を均等
にする負荷均等化装置に関する。

【０００２】

【従来の技術】プロセッサ，メモリ等から構成されるノ
ードを複数備えたシステムに於いては、各ノードの負荷
を均等化するということが従来から行われている。例え
ば、特開平３−２６２０７４号公報では、疎結合並列計
算機に於ける負荷を動的に均等化するため、マスタプロ
セッサ以外のスレーブプロセッサに最低優先度のジョブ
を流しておき、このジョブからの応答に基づいて各スレ
ーブプロセッサの負荷を動的に監視し、空いたスレーブ
プロセッサにジョブを割り付けるようにしている。ま
た、特開平１−１５２５７１号公報では、ループの繰り
返し処理をプロセッサ総数で均等分割し、分割結果を各
プロセッサに割り付けることにより、負荷の均等化を図
っている。

【０００３】

【発明が解決しようとする課題】上述した従来の技術の
内、前者は、ジョブを割り付け単位としているため、複
数のノードで１つのジョブ（分散並列処理プログラム）
を並行して実行する分散並列処理システムには適用でき
ないという問題がある。これに対して、後者の技術によ
れば、分散並列処理システムに於いて、各ノードが行う
仕事量を均等にし、各ノードの負荷を均等にすることが
できる。しかし、後者の技術は、各ノードの性能が同じ
であることを前提としているため、各ノードの性能が異
なる場合は、各ノードが行う仕事量を均等にすることは
できても、各ノードの負荷を均等にすることはできな
い。従って、性能の異なるノードが混在すると、性能の
高いノードの遊び時間が多くなり、分散並列処理システ
ムの性能を十分に引き出せないという問題が生じる。つ
まり、プログラムの実行時間が長くなるという問題が生
じる。

【０００４】そこで、本発明の目的は、複数のノードか
ら構成される分散並列処理システムに於いて、各ノード
の性能が異なる場合であっても、各ノードの負荷を均等
化することにより、分散並列処理システムの性能を十分
に引き出すことができる負荷均等化装置を提供すること
にある。

【０００５】

【課題を解決するための手段】本発明は上記目的を達成
するため、複数のノードから構成された分散並列処理シ
ステムに於ける負荷均等化装置に於いて、ソースプログ
ラムを翻訳して並列処理可能な実行プログラムを生成す
るコンパイラと、前記各ノードに性能測定プログラムを
実行させて前記各ノードの性能を測定した後、前記各ノ
ードの性能比に応じて前記実行プログラムの処理を前記
各ノードに割り当てるスケジューラとを備えている。

【０００６】上記した構成によれば、コンパイラがソー
スプログラムを翻訳して並列処理可能な実行プログラム
を生成し、スケジューラが各ノードの性能比に応じて実
行プログラムの処理を各ノードに割り当てる。

【０００７】また、本発明は、実行するプログラムに合
った性能測定プログラムによって各ノードの性能を測定
できるようにするため、前記コンパイラは、前記ソース
プログラムの最も多く実行される最頻実行部分を抽出す
る最頻実行部分抽出部と、該最頻実行部分抽出部が抽出
した最頻実行部分に基づいて前記性能測定プログラムを
生成する性能測定プログラム生成部とを備えている。

【０００８】上記した構成によれば、最頻実行部分抽出
部がソースプログラムの最頻実行部分を抽出し、性能測
定プログラム生成部が最頻実行部分抽出部で抽出された
最頻実行部分に基づいて性能測定プログラムを生成す
る。

【０００９】

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。

【００１０】図１は本発明の実施の形態例を示すブロッ
ク図であり、コンパイラ１１及びスケジューラ１４を含
む負荷均等化装置１と、ノード２１−１〜２１−Ｎ及び
各ノードを接続するネットワーク２２を含む分散並列処
理システム２とから構成されている。ノード２１−１〜
２１−Ｎは、プロセッサ及びメモリから構成される。

【００１１】コンパイラ１１は、入力されたソースプロ
グラム３を翻訳して並列処理可能な実行プログラム１２
を生成する機能を有すると共に、ソースプログラム３の
最も多く実行される部分（最頻実行部分）に基づいて性
能測定プログラム１３を生成する機能を有する。

【００１２】スケジューラ１４は、各ノード２１−１〜
２１−Ｎに性能測定プログラム１３を実行させて各ノー
ド２１−１〜２１−Ｎの性能を測定する機能，各ノード
２１−１〜２１−Ｎの性能に応じて実行プログラム１２
の処理を各ノード２１−１〜２１−Ｎに割り当てる機能
を有する。

【００１３】次に動作について説明する。

【００１４】ソースプログラム３が入力されると、コン
パイラ１１は、先ず、字句構文解析を行い、その後、ソ
ースプログラム３の最頻実行部分を抽出する。尚、最頻
実行部分の抽出方法としては、例えば、プログラム構造
を静的に調べ、手続き呼び出しのネストに基づいてルー
プ構造の最内側ループ内の文を最頻実行部分として抽出
する方法、プログラムの実行プロフィールを採取し、そ
れに基づいて最頻実行部分を抽出する方法、ユーザの指
示行による指定により最頻実行部分を抽出する方法な
ど、種々の方法をとることができる。

【００１５】その後、コンパイラ１１は、抽出された最
頻実行部分で使用されている演算を基に各ノード２１−
１〜２１−Ｎの演算性能を測定するための性能測定プロ
グラム１３を生成する。更に、コンパイラ１１は、字句
構文解析結果に基づいて分散並列処理システム２で並列
処理可能な実行プログラム１２を生成する。

【００１６】スケジューラ１４は、コンパイラ１１によ
って生成された実行プログラム１２を分散並列処理シス
テム２で実行させる場合、それに先立って性能測定プロ
グラム１３を各ノード２１−１〜２１−Ｎで実行させ、
各ノード２１−１〜２１−Ｎの性能を測定する。その
後、スケジューラ１４は、各ノード２１−１〜２１−Ｎ
の性能比を求め、それに基づいて実行プログラム１２の
処理を各ノード２１−１〜２１−Ｎに割り当てる。この
ようにすることにより、性能の高いノードには多くの処
理が割り当てられ、性能の低いノードには少しの処理し
か割り当てられないので、各ノード２１−１〜２１−Ｎ
の負荷を均等にすることができる。その結果、各ノード
２１−１〜２１−Ｎの実行時間が均等化され、遊ぶノー
ドがなくなるため、プログラムの実行時間を短くするこ
とができる。

【００１７】図２は本発明の実施例のブロック図であ
り、コンパイラ１１及びスケジューラ１４を含む負荷均
等化装置１と、３台のノードＡ，Ｂ，Ｃ及び各ノードを
接続するネットワーク２２を含む分散並列処理システム
２とから構成されている。

【００１８】コンパイラ１１は、ソースプログラム３を
読み込み、その字句解析，構文解析を行う字句構文解析
部１１１と、ソースプログラム３の最頻実行部分を抽出
する最頻実行部分抽出部１１２と、最頻実行部分抽出部
１１２で抽出された最頻実行部分で使用されている演算
を基に各ノードＡ，Ｂ，Ｃの演算性能を測定するための
性能測定プログラム１３を生成する性能測定プログラム
生成部１１３と、字句構文解析部１１１の解析結果に基
づいて並列処理可能な複数のプロセスから構成される実
行プログラム１２を生成するコード生成部１１４とを備
えている。

【００１９】スケジューラ１４は、性能測定プログラム
１３を各ノードＡ，Ｂ，Ｃで実行させることにより各ノ
ードＡ，Ｂ，Ｃの性能を測定するノード性能測定部１４
１と、各ノードＡ，Ｂ，Ｃの性能を示す性能情報に基づ
いて各ノードＡ，Ｂ，Ｃの性能比を計算する性能比計算
部１４２と、実行プログラム１２を構成する並列処理可
能な複数のプロセスを各ノードＡ，Ｂ，Ｃにどのように
割り当てるかを性能比計算部１４２で計算された性能比
に応じて決定するプログラム割り当て部１４３と、プロ
グラム割り当て部１４３の決定に従ってプロセスを各ノ
ードＡ，Ｂ，Ｃに割り当てるプログラム実行部１４４と
を備えている。

【００２０】図３はソースプログラム３の一例を示した
図であり、この図３に示したＨＰＦ（ＨｉｇｈＰｅｒ
ｆｏｒｍａｎｃｅＦＯＲＴＲＡＮ）のソースプログラ
ムは、１００００個の数の和を６個のＭＰＩ（Ｍｅｓｓ
ａｇｅＰａｓｓｉｎｇＩｎｔｅｒｆａｃｅ）プロセ
スで分散並列処理することを指示するものである。その
第３行は、プロセッサ数を６にすることを指示する行で
あり、第４行〜第６行は配列ａ（ｎ），ｂ（ｎ），ｃ
（ｎ）を６個のプロセッサに割り当てることを指示する
行である。尚、第３行によって指示するプロセッサ数
は、分散並列処理システム２が備えているノード数より
も多くすることが必要である。

【００２１】図４はコンパイラ１１の処理例を示す流れ
図、図５はスケジューラ１４の処理例を示す流れ図であ
り、以下各図を参照して本実施例の動作を説明する。

【００２２】コンパイラ１１に図３のソースプログラム
３が入力されると、字句構文解析部１１１がソースプロ
グラム３の字句解析，構文解析を行い、解析結果を最頻
実行部分抽出部１１２及びコード生成部１１４に渡す
（図４，Ｓ１）。

【００２３】字句構文解析部１１１から解析結果が渡さ
れると、最頻実行部分抽出部１１２は、最内側ループの
ａ（ｉ）＝ｂ（ｉ）＋ｃ（ｉ）の部分を最頻実行部分と
して抽出する（Ｓ２）。尚、ソースプログラム３中に複
数ループがある場合は、実行時プロフィール情報を使用
して最頻実行部分を決定するか、ユーザの指定により最
頻実行部分を決定する。

【００２４】最頻実行部分が抽出されると、性能測定プ
ログラム生成部１１３が、抽出された最頻実行部分で使
用されている演算ａ（ｉ）＝ｂ（ｉ）＋ｃ（ｉ）を基
に、各ノードＡ，Ｂ，Ｃの演算性能を測定するための性
能測定プログラム１３を生成する（Ｓ３）。性能測定プ
ログラム１３は、例えば、図６に示すものとなる。性能
測定プログラム１３では、演算の実行時間を測定できれ
ば良いので、ループの回転数を多くする必要はなく、図
６の例では、ループの回転数を１０としている。

【００２５】コード生成部１１４は、字句構文解析部１
１１から解析結果が渡されると、ＨＰＦの実行プログラ
ム１２を生成する（Ｓ４）。

【００２６】スケジューラ１４は、実行プログラム１２
を分散並列処理システム２で実行させる場合、それに先
立って性能測定プログラム１３を入力する。ノード性能
測定部１４１は、性能測定プログラム１３が入力される
と、それを各ノードＡ，Ｂ，Ｃで実行させることによ
り、各ノードＡ，Ｂ，Ｃの性能を測定する（図５，Ｓ１
１）。

【００２７】各ノードＡ，Ｂ，Ｃの性能情報が得られる
と、性能比計算部１４２が各ノードＡ，Ｂ，Ｃの性能比
を計算する（Ｓ１２）。今、例えば、各ノードＡ，Ｂ，
Ｃの性能を示す性能情報として、それぞれ２０秒，３０
秒，６０秒が得られたとすると、性能比はＡ：Ｂ：Ｃ＝
１／２０：１／３０：１／６０＝３：２：１となる。

【００２８】各ノードＡ，Ｂ，Ｃの性能比が求められる
と、プログラム割り当て部１４３は、ノードＡ，Ｂ，Ｃ
の性能比がＡ：Ｂ：Ｃ＝３：２：１であり、実行プログ
ラム１２が６個のプロセスによって構成されていること
から、ノードＡ，Ｂ，Ｃにそれぞれ３プロセス，２プロ
セス，１プロセスを割り当てることを決定する（Ｓ１
３）。

【００２９】その後、プログラム実行部１４４が、プロ
グラム割り当て部１４３の決定に従って、ノードＡ，
Ｂ，Ｃにそれぞれ３プロセス，２プロセス，１プロセス
を割り当て、プログラムを実行させる（Ｓ１４）。尚、
上述した実施例に於いては、コンパイラ１１で性能測定
プログラム１３を作成し、それによってノードの性能を
測定するようにしたが、予め用意されている性能測定プ
ログラムによってノードの性能を測定するようにしても
良い。しかし、実施例のようにした方が、ノードの性能
を正確に測定することができる。

【００３０】

【発明の効果】以上説明したように、本発明は、各ノー
ドの性能に応じて実行プログラムの処理を各ノードに割
り当てるので、各ノードの性能が異なる場合であっても
各ノードの負荷を均等にすることができる。この結果、
各ノードのプログラム実行時間が均等化され、遊ぶノー
ドがなくなるので、プログラムの実行時間を短縮するこ
とができる。

【００３１】また、本発明は、ソースプログラムの最頻
実行部分に基づいて性能測定プログラムを生成し、この
性能測定プログラムによって各ノードの性能を測定する
ようにしたものであり、実行するプログラムに合った性
能測定プログラムによって各ノードの性能を測定できる
ので、実行されるプログラムにかかわらず、各ノードの
負荷を均一化することができる。

【図面の簡単な説明】

【図１】本発明の実施の形態例を示すブロック図であ
る。

【図２】本発明の実施例のブロック図である。

【図３】ソースプログラム３の一例を示す図である。

【図４】コンパイラ１１の処理例を示す流れ図である。

【図５】スケジューラ１４の処理例を示す流れ図であ
る。

【図６】性能測定プログラム１３の一例を示す図であ
る。

【符号の説明】

１…負荷均等化装置１１…コンパイラ１１１…字句構文解析部１１２…最頻実行部分抽出部１１３…性能測定プログラム生成部１１４…コード生成部１２…実行プログラム１３…性能測定プログラム１４…スケジューラ１４１…ノード性能測定部１４２…性能比計算部１４３…プログラム割り当て部１４４…プログラム実行部２…分散並列処理システム２１−１〜２１−Ｎ，Ａ，Ｂ，Ｃ…ノード２２…ネットワーク

Claims

【特許請求の範囲】

【請求項１】複数のノードから構成された分散並列処
理システムに於ける負荷均等化装置に於いて、ソースプログラムを翻訳して並列処理可能な実行プログ
ラムを生成するコンパイラと、前記各ノードに性能測定プログラムを実行させて前記各
ノードの性能を測定した後、前記各ノードの性能比に応
じて前記実行プログラムの処理を前記各ノードに割り当
てるスケジューラとを備えたことを特徴とする負荷均等
化装置。
【請求項２】前記コンパイラは、前記ソースプログラムの最も多く実行される最頻実行部
分を抽出する最頻実行部分抽出部と、該最頻実行部分抽出部が抽出した最頻実行部分に基づい
て前記性能測定プログラムを生成する性能測定プログラ
ム生成部とを備えたことを特徴とする請求項１記載の負
荷均等化装置。
【請求項３】前記最頻実行部分抽出部は、前記ソース
プログラムの最内側ループ部分を最頻実行部分として抽
出する構成を備えたことを特徴とする請求項２記載の負
荷均等化装置。