JP2806262B2

JP2806262B2 - マルチプロセッサシステムのプロセス割当方法

Info

Publication number: JP2806262B2
Application number: JP6119781A
Authority: JP
Inventors: 英一中野
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1994-06-01
Filing date: 1994-06-01
Publication date: 1998-09-30
Anticipated expiration: 2013-09-30
Also published as: JPH07325806A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はマルチプロセッサシステ
ムのプロセス割当方法に関し、特に行列を上三角行列と
下三角行列の積に分解するさいに発生する処理をマルチ
プロセッサシステムの各プロセスに割り当てるためにマ
ルチプロセッサシステムのプロセス割当方法に関する。

【０００２】

【従来の技術】マルチプロセッサシステムは複数のプロ
セッサを有する。これら複数のプロセッサは並列に処理
を実行する。マルチプロセッサシステムは、各プロセッ
サに割り当てられる処理の演算数を均等にすると、処理
効率が向上するという特性を有する。各プロセッサに割
り当てられる演算数が異なると、少数の演算を割り当て
られたプロセッサは、大量の演算を割り当てられたプロ
セッサの処理終了を待機しなくてはならないからであ
る。

【０００３】これとは別に、行列Ａを上三角行列と下三
角行列の積に分解（ＬＵ分解）する計算が、科学技術計
算で頻繁に実行される。連立一次方程式の求解に利用さ
れるためである。また、行列Ａが対称行列のとき、行列
Ａは上三角行列と対角行列と前記上三角行列の転地行列
との積に分解（ＬＤＬ^T分解）される。これらの計算
は、行列Ａの次数の増大とともに、その計算量が急激に
増加する。このため、情報処理装置の特性を利用して、
行列の分解計算を高速化する技術が提案されている。な
お、ＬＤＬ^T分解は、分解される行列が対称行列の場合
のＬＵ分解計算である。

【０００４】情報処理装置を用いて行列のＬＵ分解を行
う技術の一例は、津田孝夫著１９９０年岩波書店発行
「岩波講座ソフトウエア科学９数値処理プログラミン
グ」第１１８〜１２５頁に記載されている。特に同文献
第１２１頁には、外積形式ガウス法のアルゴリズムが記
載されている。このアルゴリズムにしたがって演算を実
行すれば、行列のＬＵ分解を行うことができる。

【０００５】また、行列を複数のブロックに分解してＬ
ＤＬ^T分解を行う技術の一例は、丸善株式会社発行「コ
ンピュータによる連立一次方程式の解法−ベクトル計算
機と並列計算機−」第７８〜８６頁に記載されている。
特に同文献第８３頁には、対称行列を複数のブロックに
分解してのＬＤＬT分解を行う方法が数学的に開示され
ている。

【０００６】

【発明が解決しようとする課題】これらの従来技術で
は、前述したマルチプロセッサシステムの特性が全く利
用されていなかった。つまり、マルチプロセッサの各プ
ロセッサの演算数が均等になるように、各プロセッサに
処理を割り当てるための処理は行われていない。このた
め、各プロセッサの処理時間は均等になず、行列の分解
計算に時間がかかるという問題点があった。

【０００７】

【課題を解決するための手段】上述の問題点に鑑み、本
発明の１つの目的は、行列のＬＵ分解およびＬＤＬ^T分
解の並列計算の高速化にある。より具体的には、本発明
の１つの目的は、マルチプロセッサシステムの特性を利
用して、行列のＬＵ分解計算をより高速に行うためのプ
ロセス割当方法を提供することにある。また、本発明の
他の目的は、ブロック化された行列のＬＤＬ^T分解計算
の特性を利用して、行列のＬＤＬ^T分解計算をより高速
に行うためのプロセス割当方法を提供することにある。
また、本発明の他の目的は、ベクトル演算機能の特性を
利用して、行列のＬＤＬ^T分解計算をより高速に行うた
めのプロセス割当方法を提供することにある。

【０００８】本発明の他の目的は、行列のＵＬ分解をマ
ルチプロセッサシステムで実行するときに、操作性の良
いＬＵ分解の並列計算方法を提供することにある。より
具体的には、各プロセッサに割り当てる処理を操作者が
指定する必要のないプロセス割当方法を提供することに
ある。

【０００９】上述の目的を達成するため、本発明のマル
チプロセッサのプロセス割当方法は、マルチプロセッサ
システムを用いて次数Ｎの行列についてのループの繰り
返しからなる処理を含む更新処理と分解処理とを実行し
前記行列を上三角行列と下三角行列の積に分解するとき
に、前記更新処理を前記マルチプロセッサシステムの複
数のプロセッサに割り当てるためのマルチプロセッサシ
ステムのプロセス割当方法において、前記更新処理で実
行される総演算数を計算する第１のステップと、この総
演算数と前記マルチプロセッサシステムのプロセッサ数
とから前記マルチプロセッサシステムの各プロセッサが
実行すべき割当演算数を求める第２のステップと、前記
更新処理における前記ループの繰り返しからなる処理を
前記マルチプロセッサシステムのプロセッサ数に等しい
複数の処理に分割しこれら複数の処理の演算数が前記割
当演算数に略一致するように前記複数の処理のそれぞれ
に含まれる前記ループの繰り返し回数を設定する第３の
ステップと、この第３のステップで分割された前記複数
の処理を前記マルチプロセッサの各プロセッサにそれぞ
れ割り当てて実行させる第４のステップとを含む。

【００１０】また、別の実施態様では、本発明のマル
チプロセッサのプロセス割当方法は、マルチプロセッサ
システムを用いてブロック化された次数Ｎの行列の各ブ
ロックについてのループの繰り返しからなる処理を含む
更新処理と分解処理とを実行し前記行列を上三角行列と
対角行列と前記上三角行列の転地行列との積に分解する
ときに前記更新処理および前記分解処理を前記マルチプ
ロセッサシステムの複数のプロセッサに割り当てるため
のマルチプロセッサシステムのプロセス割当方法におい
て前記行列の第ｍ番目のブロックの前記更新処理に要す
る更新演算数を求めるとともに、前記行列の第ｍ＋１番
目のブロックの前記分解処理に要する分解演算数を求め
る第１のステップと、前記更新演算数と前記分解演算数
とから前記マルチプロセッサシステムの各プロセッサが
実行すべき割当演算数を求める第２のステップと、前記
行列の第ｍ番目のブロックの前記更新処理における前記
ループの繰り返しからなる処理を前記マルチプロセッサ
システムのプロセッサ数に等しい複数の処理に分割しこ
の複数の処理のうちの１つの演算数はこの演算数と前記
分解演算数との和が前記割当演算数に略一致し、前記複
数の処理の他のものの演算数は前記割当演算数に略一致
するように前記複数の処理のそれぞれに含まれる前記ル
ープの繰り返し回数を設定する第３のステップと、この
第３のステップで分割された前記複数の繰り返し処理を
前記マルチプロセッサの各プロセッサにそれぞれ割り当
てて実行させる第４のステップとを含む。

【００１１】

【実施例】次に本発明の第１の実施例について、図面を
参照して説明する。本実施例は、行列ＡをＬＵ分解する
ためのものである。

【００１２】図１を参照すると、本実施例が適用される
マルチプロセッサシステム１０は、複数のプロセッサ１
１〜１Ｐと、プロセッサ１１〜１Ｐに共有される主記憶
装置２０とを含む。

【００１３】各プロセッサ１１〜１Ｐは、ベクトルレジ
スタ３を有する。各プロセッサプロセッサ１１〜１Ｐ
は、ベクトル演算機能を有する。

【００１４】主記憶装置２０には分解されるべき行列Ａ
の要素ａ_ijが格納されている。行列Ａの次数はＮであ
る。

【００１５】次に、通常の外積形式ガウス法によるＬＵ
分解計算の手順を説明する。

【００１６】図２を参照すると、本実施例では、ＬＵ分
解の計算手順として、外積形式ガウス法が用いられる。
なお、図２ではフォートラン言語の記法を用いて処理手
順を記述している。外積形式ガウス法では、分解処理８
１と更新処理８２とが、行列Ａの第１〜（Ｎ−１）列に
対して行われる。

【００１７】図３を参照すると、ステップ２において、
まず分解処理８１が行われる。ステップ３において、分
解処理８１の計算結果に応じて、更新処理８２が行われ
る。ステップ１、４および５によって、ステップ２およ
び３がｋ＝１〜（Ｎ−１）の整数に対して繰り返し実行
される。

【００１８】図４を参照すると、分解処理８１は、行列
Ａの領域Ｒ０に対して行われる。更新処理８２は、行列
Ａの領域Ｒ１に対して行われる。領域Ｒ１は三角形を呈
する。更新処理８２の内側のループ７９の繰り返し回数
が、外側のループ７０の変数ｊに依存するためである。
具体的には、ｊの増加に伴って、内側のループ７９の繰
り返し回数は減少する。また、更新処理８２に要する演
算回数は、分解処理８１が要するものと比較してかなり
大きい。

【００１９】次に本実施例の手順について説明する。本
実施例は図４のステップ３の処理を複数のプロセッサに
均等に割り当てる。このために、図２のループ７０が複
数のループに分割される。

【００２０】具体的な手順の説明の前に、図５を参照し
て、関数ｆ（ｋ，Ｎ）の定義を行う。

【００２１】関数ｆは、図５（ａ）に示される２重ルー
プの繰り返し回数である。図５（ａ）の２重ループにお
いて、変数ｘをＮとすれば、更新処理８２の２重ループ
に一致する。つまり、関数ｆは、更新処理８２を途中で
分割したときの演算数を示す。このような関数ｆは、ｋ
およびＮの関数として、図５（ｂ）のように求められ
る。

【００２２】次に本実施例の詳細な手順について説明す
る。

【００２３】図６を参照すると、図３のステップ３は、
ステップ３１〜３５を含む。ステップ３１〜３５は、プ
ロセッサ１１〜１Ｐ以外の処理装置で実行させること
も、プロセッサ１１〜１Ｐの何れかで実行させることも
できる。

【００２４】ステップ３１において、更新処理８２の総
演算数Ｓ＝ｆ（ｋ，Ｎ）を計算する。

【００２５】ステップ３２において、割当演算数ｓに
（Ｓ／Ｐ）が代入される。ここでＰは、マルチプロセッ
サシステム１０が有するプロセッサの数である。割当演
算数ｓは、各プロセッサに割り当てられる演算数であ
る。

【００２６】ステップ３３において、ｉ・ｓ＝ｆ（ｋ，
ｘ）を満たすｘ_i（ｉ＝１、…、Ｐ−１）が求められ
る。ｘiは２次方程式の解なので簡単に求められる。ｘi
は切り捨て等の方法により整数化される。

【００２７】ステップ３４において、ループ７０がルー
プ７１〜７Ｐに分割される。各ｘ_iが繰り返し範囲の分
割点となる。このようにして分割されたループ７１〜７
Ｐの演算数は、ほぼｓに一致する。つまり、各ループの
演算数はほぼ等しい。

【００２８】ステップ３５において、ループ７１〜７Ｐ
を各プロセッサに割り当てる。ループ７１〜７Ｐは、ほ
ぼ等しい演算数を要するので、各プロセッサはほぼ同時
に処理を開始し、ほぼ同時に処理を終了する。このた
め、更新処理８２全体の演算速度が向上する。

【００２９】次に、Ｎ＝１００、Ｐ＝２、ｋ＝１のとき
の処理を一例として説明する。

【００３０】この場合ステップ３３では、ｘ₁＝３１が
求められる。図７を参照すると、これに応じて、ステッ
プ３４では、ループ７０がループ７１および７２に分割
される。ループ７１はプロセッサ１１で、ループ７２は
プロセッサ１２で、それぞれ実行される。図１１および
図１２を参照すると、ループ７１が要する演算数は４９
３０回、ループ７２が要する演算数は４９７０回でほぼ
一致する。図８を参照すると、更新処理８２が行われる
領域は、領域Ｒ１およびＲ２に２分割されている。領域
Ｒ１およびＲ２は、それぞれ、プロセッサ１１および１
２が実行する領域である。図８中の領域の面積は、この
領域が要する演算数に比例する。このため、領域Ｒ１お
よびＲ２は、ほぼ等面積である。

【００３１】次に、Ｎ＝１００、Ｐ＝３、ｋ＝１のとき
の処理を一例として説明する。

【００３２】この場合ステップ３３では、ｘ₁＝２０お
よびｘ2＝４４が、それぞれ求められる。図９を参照す
ると、これに応じて、ステップ３４では、ループ７０が
ループ７１〜７３に３分割される。ループ７１〜７３
は、それぞれ、プロセッサ１１〜１３で実行される。図
１１および図１２を参照すると、ループ７１〜７３が要
する演算数は、それぞれ、３２５８回、３３３６回、３
３０６回であり、ほぼ等しい。図１０を参照すると、更
新処理８２が行われる領域は、領域Ｒ１〜Ｒ３に３分割
されている。領域Ｒ１〜Ｒ３は、それぞれ、プロセッサ
１１〜１３が実行する領域である。Ｐ＝２のときと同
様、領域Ｒ１〜Ｒ３は、ほぼ等面積である。

【００３３】以上のように本実施例では、更新処理８２
で要する総演算数Ｓを求め、この総演算数Ｓとプロセッ
サ数とから各プロセッサに割り当てる割当演算数を求
め、各ループの演算数が割当演算数にほぼ等しくなるよ
うにループ７０を分割し、分割されたループを各プロセ
ッサに割り当てて実行させる。このため、以下のような
効果が達成される。

【００３４】第１に、各プロセッサにほぼ同数の演算を
実行させるため、マルチプロセッサシステムの処理能力
が最大限利用され、行列のＬＵ分解計算が高速に行え
る。

【００３５】第２に、各プロセッサに処理が自動的に割
り当てられるので、操作性が良い。

【００３６】次に、本発明の第２の実施例について、図
面を参照して説明する。本実施例は、対称行列ＡのＬＤ
Ｌ^T分解を行うためのものである。本実施例では、行列
Ａはブロック化され分解される。ブロック化は、プロセ
ッサ１１〜１Ｐと主記憶装置２０の間に設けられるキャ
ッシュメモリのヒット率を向上するために用いられる技
術である。本実施例でも、プロセッサ１１〜１Ｐと主記
憶装置２０の間には、図示しないキャッシュメモリが設
けられている。

【００３７】図１３を参照すると、本実施例では、行列
Ａがブロック１〜Ｍに分割されている。分割幅はＲであ
る。このように分割幅ＲでＨブロック化された行列Ａの
ＬＤＬ^T分解計算は、図１４に示される手順で実行でき
る。ただし、図１４は、（Ｎ−１）がＲの倍数のときの
処理を示す。これ以外のとき、最後のブロックは第１の
実施例に示した方法で分解される。

【００３８】図１４を参照すると、分解処理８３および
更新処理８４を各ブロック毎に実行することによってＬ
ＤＬ^T分解計算が行われる。図１４の処理を以下、説明
する。

【００３９】図１５を参照すると、ステップ２におい
て、ブロックｍに対して分解処理８３が実行される。

【００４０】ステップ３において、ブロックｍに対して
更新処理８２が実行される。

【００４１】ステップ１、４および６によって、ｍ＝１
〜（Ｍ−１）の範囲で、ステップ２および３が繰り返し
実行される。ｍ＝（Ｍ−１）のときの処理終了後は、ス
テップ５が実行される。

【００４２】ステップ５において、最後のブロックであ
るブロックＭに対して、実施例１の分解計算が施され
る。

【００４３】このようなＬＤＬ^T分解計算では、ブロッ
ク（ｍ＋１）の分解処理８１とブロックｍの更新処理８
２とを同時に実行することができる。この点について、
例を用いて説明する。

【００４４】図１６を参照すると、本例では行列Ａがブ
ロック１〜３に３分割されている。

【００４５】図１７を参照すると、Ｔ＝１において、ブ
ロック１の分解処理８３が実行される。Ｔ＝２におい
て、ブロック１の更新処理８４とブロック２の分解処理
８３とが同時に実行される。Ｔ＝３において、ブロック
２の更新処理８４が実行される。Ｔ＝４において、ブロ
ック３に分解処理８１および更新処理８２が実行され
る。

【００４６】このように、Ｔ＝２では、分解処理８１と
更新処理８２とが同時に実行される。行列Ａの分割数が
増せば、分解処理８１と更新処理８２とを並列実行する
機会は増える。本実施例は、ブロック（ｍ＋１）の分解
処理８１とブロックｍの更新処理８２とが同時されると
きに、分解処理８３に要する計算量をも考慮して、更新
処理８４を分割するものである。

【００４７】本実施例の手順について説明する前に、関
数を定義する。

【００４８】関数ｆＤ（Ｌ）は、図１４の分解処理８３
が要する演算数である。ｆＤ（Ｌ）は、図１８のように
なる。

【００４９】関数ｆＲ（Ｌ，ｘ）は、図１９（ａ）に示
される２重ループの繰り返し回数である。図１９（ａ）
の２重ループにおいて、変数ｘをＮとすれば、更新処理
８４の２重ループに一致する。つまり、関数ｆは、更新
処理８４を途中で分断したときの演算数を示す。このよ
うな関数ｆは、ＬおよびＮの関数として、図１９（ｂ）
のように求められる。

【００５０】次に、本実施例で行われる処理分割につい
て説明する。

【００５１】図２０を参照すると、本実施例では、ステ
ップｍの更新処理８４とステップ（ｍ＋１）の分解処理
８３とが並列実行される。プロセッサ１１では、ブロッ
ク（ｍ＋１）の分解処理８３全部と、ブロックｍの更新
処理８４の一部が実行される。これら処理に要する演算
数を合計すると、割当演算数ｓにほぼ等しくなる。プロ
セッサ１１以外のプロセッサでは更新処理８４の一部が
実行される。各プロセッサが実行する演算数は割当演算
数にほぼ等しい。

【００５２】次に、本実施例の詳細な手順について説明
する。

【００５３】図２１を参照すると、ブロックｍの更新
処理８４とブロック（ｍ＋１）の分解処理８３とが並列
実行可能なとき、図１５のステップ２および３は、ステ
ップ３１〜３５で置き換えられる。

【００５４】ステップ３１において、ブロックｍの更新
処理８４とブロック（ｍ＋１）の分解処理８３との総演
算数Ｓ＝ｆＤ（ｌ＋Ｒ）＋ｆＲ（ｌ，Ｎ）を計算する。
ここで、ｌはブロックｍに対応するＬの値である。つま
り、ｌはブロックｍの先頭列番号である。

【００５５】ステップ３２において、割当演算数ｓに
（Ｓ／Ｐ）が代入される。

【００５６】ステップ３３において、ｉ・ｓ＝ｆＤ
（ｌ）＋ｆ（ｌ，ｘ）を満たすｘ_i（ｉ＝１、…、Ｐ−
１）が求められる。ｘ_iは切り捨て等の方法により整数
化される。

【００５７】ステップ３４において、ループ９０がルー
プ９１〜９Ｐに分割される。各ｘ_iが繰り返し範囲の分
割点となる。

【００５８】ステップ３５において、プロセッサ１１に
は分解処理８３およびループ９１を、プロセッサ１２〜
１Ｐにはループ７２〜７Ｐを、それぞれ割り当てる。こ
のように処理を割り当てると、各プロセッサの処理演算
数は、ほぼ一致する。このため、各プロセッサはほぼ同
時に処理を開始し、ほぼ同時に処理を終了する。このた
め、更新処理８２全体の演算速度が向上する。

【００５９】以上のように本実施例では、ブロック化さ
れたＬＤＬ^T分割計算でブロックｍの更新処理８４とブ
ロック（ｍ＋１）の分解処理８３とを並列実行するとき
に、ブロック（ｍ＋１）の分解処理８３の演算数をも考
慮して更新処理８４を分割するようにした。このような
分割では、各プロセッサが実行する演算回数はほぼ一致
し、ブロック化ＬＤＬ^T分解計算が高速に行える。つま
り、ブロック化ＬＤＬ^T分解計算がより高速になる。ま
た、第１の実施例と同様、操作性にも優れている。

【００６０】

【発明の効果】以上のように本発明の第１の実施例で
は、更新処理で要する総演算数を求め、この総演算数と
プロセッサ数とから各プロセッサに割り当てる割当演算
数を求め、各ループの演算数が割当演算数にほぼ等しく
なるように更新処理中の繰り返し処理を分割し、分割さ
れた繰り返し処理を各プロセッサに割り当てて実行させ
る。このため、以下のような効果が達成される。

【００６１】第１に、各プロセッサがほぼ同数の演算を
実行するため、行列のＬＵ分解計算が高速に行えるとい
う効果が達成される。

【００６２】第２に、各プロセッサに処理が自動的に割
り当てられるので、操作性が良いという効果が達成され
る。

【００６３】また、本発明の第２の実施例では、ブロッ
ク化されたＬＤＬ^T分割計算でブロックｍの更新処理８
４とブロック（ｍ＋１）の分解処理とを並列実行すると
きに、ブロック（ｍ＋１）の分解処理の演算数をも考慮
して更新処理を分割するようにした。このため、ＬＤＬ
^T分割計算がより高速になるという効果が達成される。
まだ、第１の実施例と同様に操作性でも優れている。

【図面の簡単な説明】

【図１】本発明が適用されるマルチプロセッサシステ
ム１０の構成を示すブロック図。

【図２】外積形式ガウス法の手順をフォートランの記
法により示す図。

【図３】外積形式ガウス法の手順を示すフローチャー
ト。

【図４】外積形式ガウス法の処理の様子を示す図。

【図５】関数ｆ（ｋ，Ｎ）を示す図。

【図６】本発明の第１の実施例の手順を示すフローチ
ャート。

【図７】本発明の第１の実施例の１実行例を示す図。

【図８】本発明の第１の実施例の１実行例を示す図。

【図９】本発明の第１の実施例の他の実行例を示す
図。

【図１０】本発明の第１の実施例の他の実行例を示す
図。

【図１１】本発明の第１の実施例の実行例を示す図。

【図１２】本発明の第１の実施例の実行例を示す図。

【図１３】ブロック化された行列Ａを示す図。

【図１４】ブロック化ＬＤＬ^T分解の手順をフォート
ランの記法で示す図。

【図１５】ブロック化ＬＤＬ^T分解の手順を示すフロ
ーチャート。

【図１６】ブロック化の一例を示す図。

【図１７】ブロック化ＬＤＬ^T分解の動作例を示す
図。

【図１８】関数ｆＤ（Ｌ）を示す図。

【図１９】関数ｆＲ（Ｌ，ｘ）を示す図。

【図２０】本発明の第２の実施例における処理の分割
を示す図。

【図２１】本発明の第２の実施例の手順を示すフロー
チャート。

【符号の説明】

３ベクトルレジスタ１０マルチプロセッサシステム１１〜１Ｐプロセッサ２０主記憶装置７０〜７Ｐループ８１分解処理８２更新処理８３分解処理８４更新処理９０〜９Ｐループ

Claims

(57)【特許請求の範囲】

【請求項１】マルチプロセッサシステムを用いて次数
Ｎの行列についてのループの繰り返しからなる処理を含
む更新処理と分解処理とを実行し、前記行列を上三角行
列と下三角行列の積に分解するときに、前記更新処理を
前記マルチプロセッサシステムの複数のプロセッサに割
り当てるためのマルチプロセッサシステムのプロセス割
当方法において、前記更新処理で実行される総演算数を計算する第１のス
テップと、この総演算数と前記マルチプロセッサシステムのプロセ
ッサ数とから前記マルチプロセッサシステムの各プロセ
ッサが実行すべき割当演算数を求める第２のステップ
と、前記更新処理における前記ループの繰り返しからなる処
理を前記マルチプロセッサシステムのプロセッサ数に等
しい複数の処理に分割し、これら複数の処理の演算数が
前記割当演算数に略一致するように前記複数の処理のそ
れぞれに含まれる前記ループの繰り返し回数を設定する
第３のステップと、この第３のステップで分割された前記複数の処理を前記
マルチプロセッサの各プロセッサにそれぞれ割り当てて
実行させる第４のステップとを含むことを特徴とするマ
ルチプロセッサシステムのプロセス割当方法。
【請求項２】前記第２のステップは、前記総演算数を前記マルチプロセッサシステムのプロセ
ッサ数で割って前記マルチプロセッサシステムの各プロ
セッサが実行すべき割当演算数を求めることを特徴とす
る請求項１記載のマルチプロセッサシステムのプロセス
割当方法。
【請求項３】マルチプロセッサシステムを用いて、ブ
ロック化された次数Ｎの行列の各ブロックについてのル
ープの繰り返しからなる処理を含む更新処理と分解処理
とを実行し、前記行列を上三角行列と対角行列と前記上
三角行列の転地行列との積に分解するときに、前記更新
処理および前記分解処理を前記マルチプロセッサシステ
ムの複数のプロセッサに割り当てるためのマルチプロセ
ッサシステムのプロセス割当方法において、前記行列の第ｍ番目のブロックの前記更新処理に要する
更新演算数を求めるとともに、前記行列の第ｍ＋１番目
のブロックの前記分解処理に要する分解演算数を求める
第１のステップと、前記更新演算数と前記分解演算数とから前記マルチプロ
セッサシステムの各プロセッサが実行すべき割当演算数
を求める第２のステップと、前記行列の第ｍ番目のブロックの前記更新処理における
前記ループの繰り返しからなる処理を前記マルチプロセ
ッサシステムのプロセッサ数に等しい複数の処理に分割
し、この複数の処理のうちの１つの演算数はこの演算数
と前記分解演算数との和が前記割当演算数に略一致し、
前記複数の処理の他のものの演算数は前記割当演算数に
略一致するように前記複数の処理のそれぞれに含まれる
前記ループの繰り返し回数を設定する第３のステップ
と、この第３のステップで分割された前記複数の処理を前記
マルチプロセッサの各プロセッサにそれぞれ割り当てて
実行させる第４のステップとを含むことを特徴とするマ
ルチプロセッサシステムのプロセス割当方法。
【請求項４】前記第２のステップは、前記更新演算数と前記分解演算数とから総演算数を求め
る第５のステップと、前記総演算数を前記マルチプロセッサシステムのプロセ
ッサ数で割って前記マルチプロセッサシステムの各プロ
セッサが実行すべき割当演算数を求める第６のステップ
とを含むことを特徴とする請求項３記載のマルチプロセ
ッサシステムのプロセス割当方法。
【請求項５】前記マルチプロセッサシステムの各プロ
セッサがベクトル計算機であることを特徴とする請求項
１乃至４のいずれかに記載のマルチプロセッサシステム
プロセス割当方法。