JPH08249294A

JPH08249294A - 並列計算機システム及びプロセッサ数制御方法

Info

Publication number: JPH08249294A
Application number: JP7050790A
Authority: JP
Inventors: Norinobu Nakao; 教伸中尾; Hiroshi Date; 博伊達
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1995-03-10
Filing date: 1995-03-10
Publication date: 1996-09-27

Abstract

(57)【要約】【目的】並列プログラムの処理時間を最小にするように
使用プロセッサ数を制御する。【構成】並列プログラム制御手段１０４によってプロセ
ッサ１０７〜１０９を用いて並列プログラムを起動す
る。実行状況監視手段１０５はその実行状況を監視し、
使用プロセッサ数決定手段１０６に入力する。使用プロ
セッサ数決定手段は実行状況から望ましい使用プロセッ
サ数を決定し、並列プログラム制御手段によって使用プ
ロセッサ数を変更後、並列プログラムを再開する。以上
の処理を繰り返すことにより、処理時間を最小にするプ
ロセッサ数に到達する。【効果】本発明によれば、並列プログラムの処理時間を
短縮するように使用プロセッサ数を制御する並列計算機
システムを提供することができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数のプロセッサとこ
れらのプロセッサ間の通信手段をもつ並列計算機システ
ムに関し、特に並列プログラムを実行する際の使用プロ
セッサ数制御機能をもつ並列計算機システムに関するも
のである。

【０００２】

【従来の技術】従来、並列プログラムを実行する際に使
用プロセッサ数を決定する方法としては、使用プロセッ
サ数と処理時間の関係を統計的に求める方法と、ユーザ
が入力データ規模や並列プログラムの並列度・プロセッ
サ間通信の頻度を考慮して経験的に決定する方法があ
る。また、並列プログラムの最適プロセッサ数を求める
理論式が与えられている場合には、個々の入力データに
対し、理論式に現われるパラメータを推定することによ
り最適プロセッサ数を決定している。

【０００３】

【発明が解決しようとする課題】上記の統計的に使用プ
ロセッサ数を決定する方法では、同じ入力データに対
し、幾通りかの使用プロセッサ数を用いて並列プログラ
ムを実行する必要があり、最適なプロセッサ数を決定す
るまでに時間を要するという問題があった。また、上記
の経験的に決定する方法では、決定されたプロセッサ数
が必ずしも望ましい使用プロセッサ数ではないという問
題がある。最適プロセッサ数の理論式が与えられている
場合でも、パラメータの推定が必要になるため、同様の
問題が生ずる。

【０００４】本発明は上記問題点に鑑み、入力データ情
報や実行状況から使用プロセッサ数を制御することによ
り、並列プログラムの処理時間を短縮する、並列計算機
システムを提供することを目的とする。

【０００５】

【課題を解決するための手段】前記目的達成のために本
発明は、任意個のプロセッサを使用可能な並列プログラ
ムを制御する並列プログラム制御手段と，並列プログラ
ム実行時の処理状況を監視する実行状況監視手段と，実
行状況監視手段から得られた情報より使用プロセッサ数
を決定する使用プロセッサ数決定手段を備える。

【０００６】

【作用】上記のように構成された並列計算機システムの
作用を説明する。入力装置より入力された情報に基づい
て、並列プログラム制御手段により並列プログラムを起
動する。実行状況監視手段によって実行状況を監視し、
その情報を使用プロセッサ数決定手段に伝達する。使用
プロセッサ数決定手段はその情報を利用して、並列処理
の処理時間が短縮されるように使用プロセッサ数を決定
し、その使用プロセッサ数を並列プログラム制御手段に
伝達する。並列プログラム制御手段は実行中の並列プロ
グラムを中断し、使用プロセッサ数を使用プロセッサ数
決定手段で決定された使用プロセッサ数に変更し、並列
プログラムを再実行する。以上の処理を繰り返すことに
より、処理時間を最小にするプロセッサ数に到達し、並
列プログラムの処理時間を短縮できる。

【０００７】

【実施例】以下、本発明に係わる並列計算機システムの
一実施例について説明する。

【０００８】図１に、本実施例に係わる並列計算機シス
テムの構成例を示す。

【０００９】図示するように、本実施例に係わる並列計
算機システムは、処理に必要な情報を入力する入力装置
１０１と，処理の結果を出力する出力装置１０２と，複
数のプロセッサ及び、これらのプロセッサ間を通信する
ための通信手段を用いて計算処理を行う計算装置１０３
から構成される。この計算装置１０３は、任意個のプロ
セッサを使用可能な並列プログラムを制御する並列プロ
グラム制御手段１０４と，並列プログラム実行時の処理
状況を監視する実行状況監視手段１０５と，実行状況監
視手段から得られた情報より使用プロセッサ数を決定す
る使用プロセッサ数決定手段１０６と，並列プログラム
の処理に使用される複数のプロセッサ１０７，１０８，
１０９から構成される。

【００１０】入力装置１０１では、使用プロセッサ数制
御機能のパラメータや実行する並列プログラム名，実行
パラメータ，実行プログラムの扱うデータを入力する。
計算装置１０３の構成としては、密結合型ネットワーク
でもよいし、複数のワークステーションをイーサネット
で接続したネットワークのような疎結合型ネットワーク
でも構わない。また、ローカルメモリ型の並列計算機シ
ステムに限らず、共有メモリ型の並列計算機システムで
もよい。前記並列プログラム制御手段１０４，前記実行
状況監視手段１０５，前記使用プロセッサ数決定手段１
０６は、計算装置内の一つあるいは複数のプロセッサに
対応してよい。複数のプロセッサ１０７，１０８，１０
９の中で並列プログラム全体の管理を行うプロセスを持
つマスタープロセッサと，前記マスタープロセスを持た
ないスレーブププロセッサの区別があってもよい。

【００１１】並列プログラム制御手段１０４は、並列プ
ログラムの起動・中断・再開などの制御，使用プロセッ
サ数の変更に関する処理を行う。これらの処理は、並列
プログラムを実行しているプロセスに向けて発せられる
ソフトウェア割り込みを用いて実現する方が望ましい。
また、並列プログラム制御手段１０４，実行状況監視手
段１０５は、並列計算機システムのオペレーティングシ
ステムあるいは並列プログラムを実行するプロセスとは
異なるプロセスにより行われる方が望ましい。ここで、
任意個のプロセッサを使用可能な並列プログラムについ
て説明する。この並列プログラムは、プログラム実行時
のパラメータによってユーザがプロセッサ数を指定でき
るプログラムで、プログラム起動時のみプロセッサ数を
指定可能な並列プログラムと、プログラム実行中でもユ
ーザあるいはプログラム外部よりプロセッサ数を変更可
能な並列プログラムがある。後者の実行中プロセッサ数
変更可能な並列プログラムは、プロセッサ数変更後にプ
ログラムを続行しても支障がないプログラムである。

【００１２】以下に、従来の並列プログラムから、実行
中プロセッサ数を変更可能な並列プログラムに変換する
方法の一例を説明する。同期を取りながら処理を進める
並列プログラムの場合、変換前のプログラムに対し、同
期時にマスタープロセスがソフトウェア割り込み信号の
有無を確認し、使用プロセッサ数変更要求があれば使用
プロセッサの集合を変更後、使用プロセッサにデータを
分配、タスク割当てを行う処理を付加する。また、マス
タープロセスが非同期的にスレーブプロセスにタスクを
与え、処理結果を報告させる並列プログラムの場合、変
換前のプログラムに対し、マスタープロセスが定期的に
割り込み信号の有無を確認することにより、前記同期型
並列プログラムと同様に、実行中プロセッサ数変更可能
な並列プログラムに変換することができる。なお、この
従来の並列プログラムから実行中プロセッサ数を変更可
能な並列プログラムに変換する処理は、並列プログラム
コンパイル時に自動的に行うのが望ましい。

【００１３】本実施例によれば、並列プログラムをコー
ディングする際に、使用プロセッサ数制御のための特別
なコーディングをする必要がないという効果がある。

【００１４】図２に、本実施例における計算装置１０３
における処理手順の一例をフローで示す。

【００１５】まず、ステップ２０１で、入力装置１０１
より使用プロセッサ数制御機能のパラメータや実行する
並列プログラム名，実行パラメータ，並列プログラムの
扱うデータを入力する。ステップ２０２で、使用プロセ
ッサ数の初期値を決定し、ステップ２０３で、並列プロ
グラム制御手段１０４によって並列プログラムを起動す
る。ステップ２０４で、並列プログラム実行中、実行状
況監視手段１０５によってプログラム実行状況を監視す
る。ステップ２０５で、実行状況監視手段105より得ら
れた情報を用いて使用プロセッサ数決定手段１０６によ
り次回プロセッサ数を決定する。ステップ２０６で使用
プロセッサ数を変更する必要があるか判定する。変更の
必要がない場合はステップ２０７に進み、並列プログラ
ムを続行し、以後プログラムが終了するまでプロセッサ
数を変更しない。使用プロセッサ数変更の必要がある場
合はステップ２０８に進み、並列プログラム制御手段10
4により実行中の並列プログラムを強制的に終了させ
る。ステップ２０９で使用プロセッサ数を変更後、ステ
ップ２０３に戻り新しい使用プロセッサ数を用いてプロ
グラムを再実行する。以後は、ステップ２０３，２０
４，２０５，２０６，２０８，２０９を繰り返す。

【００１６】なお、ステップ２０５の並列プログラムの
実行状況を監視する期間の基準としては、実行時間ある
いは区切りの良い処理単位が望ましい。

【００１７】本実施例によれば、使用する並列計算機シ
ステムと、任意個のプロセッサを使用可能な並列プログ
ラムと、入力するデータに応じて、処理時間をほぼ最小
にするプロセッサ数を短時間で自動的に発見することが
できるため、並列プログラムの処理時間を短縮するとい
う効果がある。

【００１８】図３に、本実施例における計算装置１０３
における処理手順の別の例として、実行中に使用プロセ
ッサ数変更可能な並列プログラムを対象にした場合の例
をフローで示す。

【００１９】まず、ステップ３０１で、入力装置１０１
より使用プロセッサ数制御機能のパラメータや実行する
並列プログラム名，実行パラメータ，並列プログラムの
扱うデータを入力する。ステップ３０２で、使用プロセ
ッサ数の初期値を決定し、ステップ３０３で、並列プロ
グラム制御手段１０４によって並列プログラムを起動す
る。ステップ３０４で、並列プログラム実行中、実行状
況監視手段１０５によってプログラム実行状況を監視す
る。ステップ３０５で、実行状況監視手段105より得ら
れた情報を用いて使用プロセッサ数決定手段１０６によ
り次回プロセッサ数を決定する。ステップ３０６で使用
プロセッサ数を変更する必要があるか判定する。変更の
必要がない場合はステップ３０７に進み、並列プログラ
ムを続行し、以後プログラムが終了するまでプロセッサ
数を変更しない。使用プロセッサ数変更の必要がある場
合はステップ３０８に進み、並列プログラム制御手段20
1により実行中の並列プログラムを中断する。ステップ
３０９で使用プロセッサ数を変更、及び、使用プロセッ
サ数変更に伴うデータの再分配の処理を行った後、ステ
ップ３１０で新しい使用プロセッサ数を用いてプログラ
ムを再開する。以後は、ステップ３０４，３０５，３０
６，３０８，３０９，３１０を並列プログラムが終了す
るまで繰り返す。

【００２０】なお、ステップ３０６で、使用プロセッサ
数の変更が必要ない場合でも、ステップ３０４に戻り、
並列プログラムが終了するまで使用プロセッサ数の制御
を行ってもよい。

【００２１】本実施例によれば、使用する並列計算機シ
ステムと、実行中使用プロセッサ数変更可能な並列プロ
グラムと、入力するデータに応じて、処理時間をほぼ最
小にする使用プロセッサ数を処理中に発見することがで
きるため、並列プログラムの処理時間を短縮するという
効果がある。また、並列プログラムの処理能率が実行中
に変化する場合には、並列プログラムが終了するまで使
用プロセッサ数を制御することによって、一定のプロセ
ッサ数を使う場合よりも処理時間が短縮できるという効
果がある。

【００２２】図４に、本実施例に係わる使用プロセッサ
数決定手段１０６における処理手順の一例をフローで示
す。

【００２３】ステップ４０１で、実行状況監視手段１０
５により得られた現行プロセッサ数での処理量，処理時
間を入力する。ステップ４０２で、現行プロセッサ数で
の単位時間当たりの処理量を表す現行処理能率を計算す
る。ステップ４０３で、現行処理能率と前回プロセッサ
数での単位時間当たりの処理量を表す前回処理能率の差
が、あらかじめ与えられた誤差許容値Ｅより小さけれ
ば、ステップ４０４に進み、次回プロセッサ数を現行プ
ロセッサ数に決定する。そうでなければ、ステップ４０
５に進み、現行処理能率と前回処理能率の大小関係を比
較する。現行処理能率が前回処理能率より大きい場合、
ステップ４０６に進み、次回プロセッサ数を前回使用プ
ロセッサ数変更と同符号の変更を行った値、即ち、前回
使用プロセッサ数変更で使用プロセッサ数を増加させて
いる場合には次回プロセッサ数を現行プロセッサ数より
増加させて、そうでない場合には次回プロセッサ数を現
行プロセッサ数より減少させた値に決定する。現行処理
能率が前回処理能率より小さい場合、ステップ４０７に
進み、次回プロセッサ数を前回使用プロセッサ数変更と
異符号の変更を行った値に決定する。

【００２４】なお、処理量の例としては、プログラムの
ループ部分を繰り返す処理の場合には、繰り返し回数の
全使用プロセッサに関する和が考えられる。ループ繰り
返し回数以外では、プログラムで使用される関数やサブ
ルーチンに処理の重さを反映した値を与えておき、実行
された関数・サブルーチンに与えられた値の全使用プロ
セッサに関する和も考えられる。

【００２５】また、ステップ４０６，４０７における使
用プロセッサ数の変更数は、現行処理能率と前回処理能
率の差を反映する方が望ましい。さらに、ステップ４０
７における使用プロセッサ数の変更数は前回使用プロセ
ッサ数変更の変更数を越えないことが望ましい。

【００２６】前回処理能率の初期値と前回プロセッサ数
変更の初期値として、例えば、それぞれ「０」，「使用
プロセッサ数１増加」としておけばよい。前回処理能率
の初期値に関して、使用プロセッサ数と処理能率の関係
が統計的にわかっている場合は、初期使用プロセッサ数
に対応する処理能率とすればよい。前回プロセッサ数変
更の初期値に関しては、使用プロセッサ数増加の幅はい
くつであってもよいし、減少させてもよい。

【００２７】本実施例によれば、短時間で並列処理の効
率を正しく評価できるという効果と、それにより正確な
最適プロセッサ数を求めることができるという効果があ
る。図５に、本実施例に係わる使用プロセッサ数決定手
段１０６における処理手順の別の例をフローで示す。

【００２８】ステップ５０１で、実行状況監視手段１０
５により得られた現行プロセッサ数での処理時間、プロ
セッサ間通信時間を入力する。ステップ５０２で、現行
プロセッサ数での通信時間が処理時間に占める割合を表
す通信オーバーヘッド率を計算する。ステップ５０３
で、通信オーバーヘッド率とあらかじめ与えられた基準
値との差が、あらかじめ与えられた誤差許容値Ｅより小
さければ、ステップ504に進み、次回プロセッサ数を現
行プロセッサ数に決定する。そうでなければ、ステップ
５０５に進み、現行通信オーバーヘッド率と基準値の大
小関係を比較する。通信オーバーヘッド率が基準値より
小さい場合、ステップ５０６に進み、次回使用プロセッ
サ数を現行使用プロセッサ数より増加させる。通信オー
バーヘッド率が基準値より大きい場合、ステップ５０７
に進み、次回使用プロセッサ数を現行使用プロセッサ数
より減少させる。

【００２９】なお、ステップ５０６，５０７における使
用プロセッサ数の変更数は、通信オーバーヘッド率と基
準値との差を反映する方が望ましい。

【００３０】前記通信時間には、プロセッサ間で通信す
る時間と、送信・受信に使用されるＣＰＵ時間も含む。
したがって前記通信時間として、処理時間から、全ての
プロセッサのＣＰＵ時間の平均を引いたものと定義する
のが望ましい。

【００３１】ここで、前記通信オーバーヘッド率を利用
した使用プロセッサ数決定方法の妥当性と、ステップ５
０３における基準値の与え方について論ずるために、最
適プロセッサ数に関する解析を行う。

【００３２】ｎを問題のサイズ、ｐ（ｐ＞１）をプロセ
ッサ数とするとき、Ｓ(ｎ)を逐次プログラムによるＣＰ
Ｕ時間，Ｄ（ｎ，ｐ）を同じ処理を複数のプロセッサ上
で行うオーバーヘッド分のＣＰＵ時間の合計時間，Ｃ
（ｎ，ｐ）をプロセッサ間通信時間，Ｌ（ｎ，ｐ）を負
荷バランスのくずれによるオーバーヘッドの時間とす
る。なお、ここでの「時間」は、サイズｎであるすべて
の入力に対して、プロセッサ数ｐで処理する際に必要な
時間の平均値あるいはその近似値が望ましい。

【００３３】このとき並列プログラムの処理時間は、

【００３４】

【数１】

【００３５】で表される。さらに解析を単純化するため
に、次の仮定をおく。

【００３６】

【数２】

【００３７】

【数３】

【００３８】

【数４】

【００３９】数２，数３はＤ（ｎ，ｐ），Ｃ（ｎ，ｐ）
をｐに関して一次関数で近似したものである。また、数
４は各プロセッサに対する負荷が均等に分散されている
という、理想的な状況を仮定している。

【００４０】以上の仮定の下でｎを固定したとき、Ｔ
（ｎ，ｐ）を最小にするプロセッサ数poptは、

【００４１】

【数５】

【００４２】で与えられる。これは問題のサイズが与え
られたときの最適なプロセッサ数を表す。

【００４３】そのときの処理時間は、

【００４４】

【数６】

【００４５】である。

【００４６】また、Ｃ₂(ｎ)＋Ｄ₁(ｎ)及びＤ₂(ｎ)がＳ
(ｎ）に比べて十分に小さいならば、最適プロセッサ数
における台数効果ＳＰ(ｎ，ｐ_opt(ｎ))は

【００４７】

【数７】

【００４８】で近似される。これはどのような問題のサ
イズに対しても、台数効果の最大値が最適プロセッサ数
のほぼ半分であることを主張している。

【００４９】さらに、通信時間と総処理時間の比

【００５０】

【数８】

【００５１】はｎを固定した場合、ｐの単調増加関数
で、Ｃ₂(ｎ)及びＣ₂(ｎ)＋Ｄ₁(ｎ）に比べて十分に小さ
いならば、ｐが最適なプロセッサ数の時、

【００５２】

【数９】

【００５３】と近似できる。

【００５４】以上の並列プログラムの最適プロセッサ数
に関する解析により、並列プログラムを実行させた時の
通信時間と総処理時間との比、即ち、通信オーバーヘッ
ド率を求めることで、その際に使用したプロセッサ数が
最適かどうかを数９を用いて判定できる。

【００５５】また、ステップ５０３における通信オーバ
ーヘッド率の判定基準値は、数９より、約０.５とすれ
ば良いことが分かる。数８がｐの単調増加関数であるこ
とから、通信オーバーヘッド率が基準値より小さければ
使用プロセッサ数ｐが最適プロセッサ数より小さいこ
と、逆に通信オーバーヘッド率が基準値より大きければ
使用プロセッサ数ｐが最適プロセッサ数より大きいこと
が分かる。

【００５６】なお、基準値としては、０.５よりやや小
さい値、例えば、０.３から０.５の間の適当な値を選択
するのが望ましい。なぜなら、使用プロセッサ数が最適
プロセッサ数前後の場合、プロセッサ間を結ぶ通信手段
の状況が通信時間に影響を与えやすく、使用プロセッサ
数が最適プロセッサ数より小さい場合よりも処理時間が
増加する可能性があるためである。一方、誤差許容値Ｅ
は、０.０１から0.05の間の適当な値を選択するのが望
ましい。

【００５７】本実施例によれば、実行状況監視手段１０
５における監視すべき情報の入手が容易であるという効
果と、アプリケーション，並列計算機のハードウェアに
依存せず適用できるという効果がある。

【００５８】ここで、前記最適プロセッサ数に関する解
析の妥当性を、論理回路の故障を検出するテストパター
ン生成問題を解く並列プログラムを例に検証する。並列
プログラムは、テストパターンを生成できない故障であ
る冗長故障を指摘する冗長故障判定プログラムと、各故
障に対してその故障を検出するパターンを求めるテスト
パターン生成プログラムの２種類である。

【００５９】まず、図６に冗長故障判定プログラムの処
理手順の一例を示す。

【００６０】各スレーブプロセスは回路全体の情報を保
持するとする。ステップ６０１で、マスタープロセスが
回路の信号線の集合を分割し、スレーブプロセスに割り
当てる。ステップ６０２，６０３で、各スレーブプロセ
スは割り当てられた信号線が固定値信号線かどうかを判
定する処理を並列に行う。ステップ６０４で、スレーブ
プロセスは固定値信号線判定結果をマスタープロセスに
報告し、マスタープロセスは報告された結果を集計し、
集計結果をスレーブプロセスに伝達する。ステップ６０
５で、固定値信号線が新規に検出されたかどうかを判定
し、新規に検出されていれば、各スレーブプロセスはス
テップ６０２，６０３に戻り、上記の処理を繰り返す。
固定値信号線が新規に検出されていない場合、ステップ
６０６に進み、マスタープロセスが固定値信号線検出結
果を利用して冗長故障を指摘し、プログラムを終了す
る。

【００６１】前記固定値信号線とは、すべての入力パタ
ーン列に対し、信号線の論理値が０あるいは１に固定さ
れる信号線である。ステップ６０２あるいはステップ６
０３における、固定値信号線を判定する処理は、信号線
に論理値０あるいは１を設定し、その論理値設定により
順次論理値が決定される信号線を特定する操作を行い、
その操作の過程で矛盾が生じた場合に、論理値を設定し
た信号線が設定した論理値の否定値に固定される固定値
信号線と判定する、という手順で行う。このとき、他の
固定値信号線が検出されていないと検出できない固定値
信号線が存在することから、検出可能な全ての固定値信
号線を検出するためには、各プロセスの判定結果を他の
プロセスに伝達しなければならない。そのため、ステッ
プ６０４，６０５の処理が必要となる。

【００６２】ステップ６０６における冗長故障の指摘
は、検出した固定値信号線に対応する故障を次のように
冗長と判定する。論理値が１に固定される固定値信号線
の場合、その信号線の論理値が１に固定される故障であ
る１縮退故障は正常時と故障時の区別がつかないため、
冗長と判定する。論理値が０に固定される信号線の場合
も同様に、その信号線の論理値が０に固定される故障で
ある０縮退故障を冗長と判定する。

【００６３】なお、我々が作成した並列プログラムで
は、１つのスレーブプロセスを１つのプロセッサに対応
させ、マスタープロセスは前記スレーブプロセスをもつ
プロセッサの中の１つのプロセッサに割り当てた。

【００６４】図７に、冗長故障判定の並列プログラムを
実行した際の、プロセッサ数と台数効果の関係を表した
グラフを示す。ここで、台数効果とは、冗長故障判定の
処理を１つのプロセッサ，逐次プログラムで実行した場
合の処理時間を、複数のプロセッサ、並列プログラムで
実行した場合の処理時間で割った値である。対象とした
論理回路は、１９８９年の回路とシステム国際シンポジ
ウム(ＩＳＣＡＳ'８９）の特別セッション「順序回路の
テスト生成」のために用意されたベンチマーク・データ
回路の中の３つの順序回路である。回路ｓ９２３４で
は、プロセッサ数１５までプロセッサ数の増加に従って
台数効果も増加しているが、回路ｓ5378では、プロセッ
サ数１４前後で台数効果が飽和しており、最適プロセッ
サ数は１４前後と言える。同様に、回路ｓ８３８でも台
数効果は飽和しており、最適プロセッサ数は６から１１
の間と言える。

【００６５】図８に、前記３つの回路に対する使用プロ
セッサ数と通信オーバーヘッド率の関係をグラフで示
す。どの回路も、前記最適プロセッサ数に関する解析で
示した通り、プロセッサ数の増加とともに通信オーバー
ヘッド率も増加している。プロセッサ数１５までは台数
効果の飽和していない回路ｓ９２３４では、通信オーバ
ーヘッド率が最大でも０.３を越えていない。一方、回
路ｓ５３７８ではプロセッサ数１５で通信オーバーヘッ
ド率が０.５を越えており、回路ｓ８３８でもプロセッ
サ数９で通信オーバーヘッド率が０.５を越える。この
通信オーバーヘッド率が０.５を越えるプロセッサ数
は、図７に示した最適プロセッサ数にほぼ一致する。

【００６６】以上の冗長故障判定プログラムの実験結果
から、通信オーバーヘッド率を利用した使用プロセッサ
数決定方法によって、使用プロセッサ数を最適プロセッ
サ数の近似値に設定できることを検証した。

【００６７】図９にテストパターン生成プログラムの処
理手順の一例を示す。

【００６８】各スレーブプロセスは回路全体の情報と検
出すべき故障の全部を保持するとする。ステップ９０１
で、マスタープロセスが回路の故障集合を分割し、スレ
ーブプロセスに割り当てる。ステップ９０２，９０３
で、各スレーブプロセスは、割り当てられた故障に対し
てテストパターンを生成する処理を並列に行い、生成し
たパターンに対して故障シミュレーションの処理を並列
に行う。ステップ９０４で、スレーブプロセスは故障検
出結果をマスタープロセスに報告し、マスタープロセス
は報告された結果を集計し、集計結果をスレーブプロセ
スに伝達する。ステップ９０５で、テスト生成終了条件
を達成したかどうかを判定し、終了条件を達成していな
ければ、各スレーブプロセスはステップ９０２，９０３
に戻り、上記の処理を繰り返す。終了条件を達成した場
合、プログラムを終了する。

【００６９】前記故障シミュレーションとは、生成した
パターン列に対し、検出した故障を全て指摘する処理で
ある。このとき、各スレーブプロセスにおける故障シミ
ュレーションは異なるパターン系列に対して処理するた
め、検出される故障も異なる。また他のスレーブプロセ
スに割り当てられた故障を検出することも生じるので、
できるだけテスト生成処理の重複を避けるため、各プロ
セスの故障検出結果を他のプロセスに伝達しなければな
らない。そのため、ステップ９０４，９０５の処理が必
要となる。

【００７０】なお、我々が作成した並列プログラムで
は、１つのスレーブプロセスを１つのプロセッサに対応
させ、マスタープロセスは前記スレーブプロセスをもつ
プロセッサの中の１つのプロセッサに割り当てた。

【００７１】図１０に、テストパターン生成の並列プロ
グラムを実行した際の、プロセッサ数と台数効果の関係
を表したグラフを示す。対象とした論理回路は、ＩＳＣ
ＡＳ'８９ベンチマーク回路の中の２つの順序回路であ
る。回路ｓ７１３では、プロセッサ数１５までプロセッ
サ数の増加に従って台数効果も増加しているが、回路ｓ
２０８では、プロセッサ数８前後で台数効果が飽和して
おり、最適プロセッサ数は８前後と言える。

【００７２】図１１に、前記２つの回路に対する使用プ
ロセッサ数と通信オーバーヘッド率の関係をグラフで示
す。どちらの回路も、前記最適プロセッサ数に関する解
析で示した通り、プロセッサ数の増加とともに通信オー
バーヘッド率も増加している。プロセッサ数１５までは
台数効果の飽和していない回路ｓ７１３では、通信オー
バーヘッド率が最大でも０.４を越えていない。一方、
回路ｓ７１３ではプロセッサ数８で通信オーバーヘッド
率が０.５を越える。この通信オーバーヘッド率が０.
５を越えるプロセッサ数は、図１０に示した最適プロ
セッサ数にほぼ一致する。

【００７３】従ってテストパターン生成プログラムの実
験結果からも、通信オーバーヘッド率を利用した使用プ
ロセッサ数決定方法によって、使用プロセッサ数を最適
プロセッサ数の近似値に設定できることを検証した。

【００７４】以上、冗長故障判定プログラムとテストパ
ターン生成プログラムについて、最適プロセッサ数と通
信オーバーヘッド率との関係が前記最適プロセッサ数に
関する解析に従うことを検証したが、他の並列プログラ
ムでも同様の結果が得られる。また、同期型並列プログ
ラムに限らず、非同期型並列プログラムであっても構わ
ない。

【００７５】図１２に、最適プロセッサ数記憶手段を持
つ並列計算機システムの計算装置１０３のブロック図を
示す。

【００７６】本実施例における計算装置１０３は、入力
データ情報と最適プロセッサ数の関係を記憶する最適プ
ロセッサ数記憶手段１２０１と，任意個のプロセッサを
使用可能な並列プログラムを制御する並列プログラム制
御手段１０４と，並列プログラム実行時の処理状況を監
視する実行状況監視手段１０５と，実行状況監視手段か
ら得られた情報より使用プロセッサ数を決定する使用プ
ロセッサ数決定手段１０６と，並列プログラムの処理に
使用される複数のプロセッサ１０７，１０８，１０９か
ら構成される。

【００７７】前記入力データ情報は、並列プログラムに
おける通信周期等、最適プロセッサ数に影響を及ぼす実
行パラメータと，並列プログラムの対象とするデータ及
びそのサイズが一般的である。

【００７８】前記最適プロセッサ数記憶手段は、前記実
行パラメータ毎に、前記データのサイズと最適プロセッ
サ数の組を記憶したもの、あるいは、最適プロセッサ数
を前記データのサイズの関数として表したものを記憶す
るのが一般的である。もちろん、最適プロセッサ数を、
複数の前記実行パラメータと前記データのサイズを変数
にもつ多変数関数として表してもよい。

【００７９】図１３に、本実施例に係わる最適プロセッ
サ数記憶手段１２０１における処理手順の一例をフロー
で示す。

【００８０】実行パラメータ毎に、データサイズを変数
とする最適プロセッサ数の関数を決定する場合について
説明する。ステップ１３０１で、データサイズを変数と
する最適プロセッサ数の関数を初期化する。ステップ１
３０２で、入力データ及びそのサイズと実行パラメータ
を入力する。ステップ１３０３で、並列プログラム制御
手段１０４によって複数のプロセッサ１０７，１０８，
１０９を制御しながら並列プログラムを実行し、実行状
況監視手段１０５と使用プロセッサ数決定手段１０６を
用いて、使用プロセッサ数を最適化する。ステップ１３
０４で、データサイズと最適プロセッサ数の組を記憶す
る。ステップ１３０５で、既に記憶されているデータサ
イズと最適プロセッサ数の複数の組を用いて、データサ
イズを変数とする最適プロセッサ数の関数を補正する。
ステップ１３０６で、データサイズを変数とする最適プ
ロセッサ数の関数の精度があらかじめ与えられた目標精
度を達成していれば、最適プロセッサ数関数の補正を終
了し、固定された最適プロセッサ数関数を記憶する。そ
うでなければ、目標精度が達成されるまで、ステップ１
３０２からステップ１３０５を繰り返す。

【００８１】データサイズと最適プロセッサ数の複数の
組から、データサイズを変数とする最適プロセッサ数の
関数を与える方法の一例を述べる。まず、データサイズ
の値を複数の階級に分割し、階級値、即ち各階級に対す
る最適プロセッサ数の平均値を求める。それらの階級値
をスプライン関数あるいは折れ線関数などで補間する。
最適プロセッサ数の関数を与える別の方法としては最急
降下法を用いることが考えられる。関数を複数の定数を
含む形で予め決めておき、誤差関数も与えておく。デー
タサイズと最適プロセッサ数の新しい組が与えられる毎
に、その関数に現われる定数を誤差関数が最小となるよ
うに変化させる。

【００８２】本実施例によれば、並列計算機システム，
アプリケーション毎に、最適プロセッサ数を与える関数
を自動的に生成するという効果がある。

【００８３】初期における最適プロセッサ数の関数を与
える方法を、冗長故障判定プログラムを例に述べる。前
記最適プロセッサ数に関する解析において、データサイ
ズに対する最適プロセッサ数の評価式を数５で与えた。
データサイズを回路のゲート数とする場合、この式に現
われる逐次プログラムによるＣＰＵ時間Ｓ(ｎ)，プロセ
ッサ間通信時間をプロセッサ数の関数と見做したときの
１次の係数Ｃ₁(ｎ)，同じ処理を複数のプロセッサ上で
行うオーバーヘッド分のＣＰＵ時間の合計Ｄ₂(ｎ)を、
前記ＩＳＣＡＳ'８９ベンチマーク回路１４品種を用い
た実験により推定すると、それぞれｎの１.６乗，１
乗，１.６乗のオーダーである。これらのオーダーを数
５に適用すると、最適プロセッサ数はｎの０.３乗のオ
ーダーであることを導くことができる。さらに、図７の
ｓ５３７８における最適プロセッサ数の結果を利用する
と、回路ゲート数ｎに対して最適プロセッサ数ｐ
_opt(ｎ）は、次の数１０で近似できる。

【００８４】

【数１０】

【００８５】以上、冗長故障判定プログラムについて、
最適プロセッサ数の近似方法を述べたが、他の並列プロ
グラムでも同様の方法を適用できる。また、同期型並列
プログラムに限らず、非同期型並列プログラムであって
も構わない。

【００８６】本実施例によれば、最適プロセッサ数を与
える関数に対して、早い段階で精度のよい近似が得られ
るという効果がある。また、最適プロセッサ数を与える
関数を補正しない場合でも、精度のよい近似が得られる
という効果がある。

【００８７】図１４に、並列プログラム実行状況を表示
方法の一例を示す。

【００８８】１４０１は、プロセッサ間通信時間と処理
時間に関する情報を表示するウィンドウの例で、横軸１
４０２に時刻，縦軸１４０３に前記通信オーバーヘッド
率をとったグラフである。領域１４０４の高さによって
通信オーバーヘッド率を表しており、ある一定時間毎に
最新の情報を追加表示していく。なお、表示内容は実行
状況監視手段１０５により得られた情報であれば何でも
よいし、ウィンドウによる表示でなくてコンソール画面
に表示させてもよい。

【００８９】本実施例によれば、並列プログラム実行状
況をリアルタイムに把握できるという効果がある。

【００９０】

【発明の効果】以上のように、本発明によれば、並列プ
ログラムの処理時間を短縮するように使用プロセッサ数
を制御する並列計算機システムを提供することができ
る。

【図面の簡単な説明】

【図１】本発明の一実施例に係わる並列計算機システム
の構成を示す説明図である。

【図２】本発明の一実施例に係わる並列計算機システム
の処理手順を示すフロー図である。

【図３】本発明の一実施例に係わる並列計算機システム
の処理手順を示すフロー図である。

【図４】本発明の一実施例に係わる使用プロセッサ数決
定手段の処理手順を示すフロー図である。

【図５】本発明の一実施例に係わる使用プロセッサ数決
定手段の処理手順を示すフロー図である。

【図６】冗長故障判定プログラムの処理手順を示すフロ
ー図である。

【図７】冗長故障判定プログラムにおけるプロセッサ数
と台数効果の関係を示すグラフである。

【図８】冗長故障判定プログラムにおけるプロセッサ数
と通信オーバーヘッド率の関係を示すグラフである。

【図９】テストパターン生成プログラムの処理手順を示
すフロー図である。

【図１０】テストパターン生成プログラムにおけるプロ
セッサ数と台数効果の関係を示すグラフである。

【図１１】テストパターン生成プログラムにおけるプロ
セッサ数と通信オーバーヘッド率の関係を示すグラフで
ある。

【図１２】本発明の一実施例に係わる並列計算機システ
ムの構成を示す説明図である。

【図１３】本発明の一実施例に係わる並列計算機システ
ムの処理手順を示すフロー図である。

【図１４】本発明の一実施例に係わる実行状況の表示例
である。

【符号の説明】

１０１…入力装置、１０２…出力装置、１０３…計算装
置、１０４…並列プログラム制御手段、１０５…実行状
況監視手段、１０６…使用プロセッサ数決定手段、１０
７〜１０９…プロセッサ、１２０１…最適プロセッサ数
記憶手段。

Claims

【特許請求の範囲】

【請求項１】複数のプロセッサとこれらのプロセッサ間
の通信手段をもつ並列計算機システムに関し、任意個のプロセッサを使用可能な並列プログラムを制御
する並列プログラム制御手段と，並列プログラム実行時
の処理状況を監視する実行状況監視手段と，実行状況監
視手段から得られた情報より使用プロセッサ数を決定す
る使用プロセッサ数決定手段を備えることを特徴とする
並列計算機システム。
【請求項２】請求項１記載の並列計算機システムであっ
て、前記並列プログラム制御手段として、並列プログラム実
行中に中断，使用プロセッサ数を変更することを特徴と
する並列計算機システム。
【請求項３】請求項１または請求項２記載の並列計算機
システムであって、前記使用プロセッサ数決定手段として、並列プログラム
実行時に前記実行状況監視手段から得られる処理量と処
理時間を用いて、使用プロセッサ数の変更量を決定する
手段を備えることを特徴とする並列計算機システム。
【請求項４】請求項１または請求項２記載の並列計算機
システムであって、前記使用プロセッサ数決定手段として、並列プログラム
実行時に前記実行状況監視手段から得られるプロセッサ
間通信時間と，前記実行状況監視手段から得られる処理
時間を用いて、使用プロセッサ数の変更量を決定する手
段を備えることを特徴とする並列計算機システム。
【請求項５】請求項１または請求項２記載の並列計算機
システムであって、入力データに関する情報と，処理時間を最短にするある
いは望ましいプロセッサ数である最適プロセッサ数との
関係を記憶する最適プロセッサ数記憶手段を備え、前記
実行状況監視手段，前記使用プロセッサ数決定手段，前
記並列プログラム制御手段，前記最適プロセッサ数記憶
手段を繰り返し実行することにより、入力データに関す
る情報と最適プロセッサ数との関係の精度を高めること
を特徴とする並列計算機システム。
【請求項６】請求項５記載の並列計算機システムであっ
て、予め前記最適プロセッサ数記憶手段に記憶されている入
力データに関する情報と最適プロセッサ数との関係を用
いて、並列プログラム起動時の使用プロセッサ数を決定
することを特徴とする並列計算機システム。
【請求項７】請求項６記載の並列計算機システムであっ
て、前記最適プロセッサ数記憶手段で記憶する入力データに
関する情報と最適プロセッサ数との関係として、並列プ
ログラムに対応する逐次プログラムの入力データ情報と
処理時間との関係、及び、入力データ情報・使用プロセ
ッサ数とプロセッサ間通信時間との関係，入力データ情
報・使用プロセッサ数と並列処理時に複数のプロセッサ
により多重処理されるオーバーヘッドに要する時間との
関係，入力データ情報・使用プロセッサ数と負荷分散の
乱れによるオーバーヘッドに要する時間との関係、の全
部又は一部から導出された関係を用いることを特徴とす
る並列計算機システム。
【請求項８】複数のプロセッサとこれらのプロセッサ間
の通信手段をもつ並列計算機システム上で実行する並列
プログラムの使用プロセッサ数制御方法に関し、任意個のプロセッサを使用可能な並列プログラムに対
し、並列プログラム実行時の処理状況から得られた情報
より使用プロセッサ数を決定し、使用プロセッサ数を変
更後、並列プログラムを再度最初から実行、あるいは、
並列プログラム中断時点から再開することを特徴とする
使用プロセッサ数制御方法。
【請求項９】請求項８記載の使用プロセッサ数制御方法
に関し、並列プログラム実行時の処理状況から得られた情報とし
て、処理量と処理時間から使用プロセッサ数を決定する
ことを特徴とする使用プロセッサ数制御方法。
【請求項１０】請求項８記載の使用プロセッサ数制御方
法に関し、並列プログラム実行時の処理状況から得られた情報とし
て、プロセッサ間通信時間と処理時間から使用プロセッ
サ数を決定することを特徴とする使用プロセッサ数制御
方法。
【請求項１１】複数のプロセッサとこれらのプロセッサ
間の通信手段をもつ並列計算機システム上で実行する並
列プログラムの使用プロセッサ数決定方法に関し、並列プログラムに対応する逐次プログラムの入力データ
情報と処理時間との関係、及び、入力データ情報・使用
プロセッサ数とプロセッサ間通信時間との関係，入力デ
ータ情報・使用プロセッサ数と並列処理時に複数のプロ
セッサにより多重処理されるオーバーヘッドに要する時
間との関係，入力データ情報・使用プロセッサ数と負荷
分散の乱れによるオーバーヘッドに要する時間との関
係、の全部あるいは一部から、入力データに関する情報
と最適プロセッサ数との関係を導出することを特徴とす
る使用プロセッサ数決定方法。
【請求項１２】複数のプロセッサとこれらのプロセッサ
間の通信手段をもつ並列計算機システムに関し、並列プログラム実行中に、プロセッサ間通信時間と処理
時間に関する情報を表示することを特徴とする並列計算
機システム。