JPH04190422A

JPH04190422A - プログラム生成方法

Info

Publication number: JPH04190422A
Application number: JP32164490A
Authority: JP
Inventors: Toshio Okochi; 俊夫大河内; Chisato Konno; 金野　千里; Mitsuyoshi Inogai; 光祥猪貝
Original assignee: Hitachi ULSI Engineering Corp; Hitachi Ltd
Current assignee: Hitachi ULSI Engineering Corp; Hitachi Ltd
Priority date: 1990-11-26
Filing date: 1990-11-26
Publication date: 1992-07-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】【産業上の利用分野】

本発明は、複数のプロセッサで並列に処理を行うための
プログラムを生成するプログラム生成方法に関し、特に
、電磁場解析、熱伝導解析、流体解析などの物理現象の
シミュレーションを分散メモリ型の並列計算機上で実行
するためのプログラムを生成するのに好適なプログラム
生成方法に関する。

【従来の技術】

物理現象が起こる空間領域の形状等のシミュレーション
モデルの構造とその数値的な解析の計算手順とを特殊な
高水準言語で記述したプログラムから、一般の汎用計算
機で実行可能なＦＯＲＴＲＡＮ言語等の汎用言語による
プログラムを自動的に生成するプログラム生成方法が、
例えば「情報処理学会誌、第２６巻、第１号、　ｐｐ１
６８−１８０Ｊや。特開昭６０−１４０４３３号公報や、特開昭６２−２１
２７７１号公報に記載されている。また、ＦＯＲＴＲＡＮ等の汎用言語によるプログラムを
、ＤＯ小ループ分割することにより、並列実行可能なプ
ログラムにする並列化方法が、例えばｒＰａｒａｌｅｌ
ｌ　Ｃｏｍｐｕｔｉｎｇ　　６（１９８８）　ｐｐｌ−
１８Ｊに記載されている。

【発明が解決しようとする問題点】

上記従来のプログラム生成方法および並列化方法により
、物理現象のシミュレーションを並列計算機で行うため
のプログラムを生成することが出来る。しかし、この場合、並列計算機の各プロセッサ毎に異な
るプログラムを生成する必要かあり、プログラムの総ス
テツプ数が膨大になるという問題がある。また、並列計算機でシミュレーションを行う場合、プロ
セッサ間のデータ通信・同期が必要であり、このオーバ
ーヘッドにより性能が低下する問題がある。さらに、プロセッサ割り付けをユーザが指定することが
出来ないため、最適の割り付けか行われるとは限らない
問題がある。そこで、本発明の第一の目的は、並列計算機の各プロセ
ッサで共通に使用できるプログラムを生成することによ
り、総ステツプ数の少ないプログラムを生成するプログ
ラム生成方法を提供することにある。また、本発明の第二の目的は、プロセッサ間データ通信
のオーバーヘッドの小さいプログラムを生成するプログ
ラム生成方法を提供することにある。さらに、本発明の第三の目的は、ユーザかプロセッサ割
り付け方式を指定することを可能としたプログラム生成
方法を提供することにある。

【問題点を解決するための手段】

本発明は、第１の観点では、処理を行う範囲および処理
を行う単位および処理の内容の情報に基づいて、処理を
行う範囲を複数のプロセッサに分割し、各プロセッサが
担当する範囲に含まれる処理の単位毎に処理の内容に応
じた計算を各プロセッサに行わせるプログラムを生成す
るプログラム生成方法であって、（ａ）処理を行う範囲
を分割して複数のプロセッサに割り付け、（ｂ）各プロ
セッサに割り付けた範囲毎に、その範囲内の処理の単位
における処理の内容に対応する計算の種類を判定して同
じ種類の計算を行う単位同士を組とし、（ｃ）各組の各
単位を指すインデックスにより繰り返し制御情報を生成
し、（ｄ）計算の種類に応じた繰り返し計算プログラム
を生成し、（ｅ）各プロセッサ毎に、そのプロセッサに
対応する繰り返し制御情報と前記繰り返し計算プログラ
ムとを組合せた部分を含むプログラムを生成することを
特徴とするプログラム生成方法を提供する。本発明は、第２の観点では、処理を行う範囲および処理
を行う単位および処理の内容の情報に基づいて、処理を
行う範囲を複数のプロセッサに分割し、各プロセッサが
担当する範囲に含まれる処理の単位毎に処理の内容に応
じた計算を各プロセッサに行わせるプログラムを生成す
るプログラム生成方法であって、（ａ）計算の中の一つ
の式に対応するプログラム部分を実行する際に必要とな
り且つ他のプロセッサから転送されることが必要なデー
タを、式毎に抽出し、（ｂ）前記計算の中の一つの式に
対応するプログラム部分を実行するより先に前記データ
を得るためのプロセッサ間通信を実行するプログラム部
分を生成することを特徴とするプログラム生成方法を提
供する。本発明は、第３の観点では、処理を行う範囲および処理
を行う単位および処理の内容およびプロセッサ割り付け
指定の情報に基づいて、処理を行う範囲を複数のプロセ
ッサに分割し、各プロセッサか担当する範囲に含まれる
処理の単位毎に処理の内容に応じた計算を各プロセッサ
に行わせるプログラムを生成するプログラム生成方法で
あって、（ａ）プロセッサ割り付け指定にしたがって処
理を行う範囲を分割して複数のプロセッサに割り付け、
（ｂ）各プロセッサに割り付けた範囲毎に、その範囲内
の処理の単位における処理の内容に対応する計算の種類
を判定して同じ種類の計算を行う単位同士を組とし、（
ｃ）各組の各単位を指すインデックスにより繰り返し制
御情報を生成し、（ｄ）計算の種類に応じた繰り返し計
算プログラムを生成し、（ｅ）各プロセッサ毎に、その
プロセッサに対応する繰り返し制御情報と前記繰り返し
計算プログラムとを組合せた部分を含むプログラムを生
成することを特徴とするプログラム生成方法を提供する
。

【作用】

上記第１の観点による本発明のプログラム生成方法では
、計算の種類に応じた繰り返し計算プログラムを各プロ
セッサで共通に使用するため、生成されるプログラムの
総コード長を、従来の単一プロセッサ用のプログラムと
ほぼ同等の規模にすることが出来る。また、このコード
長はプロセッサ台数に殆ど依存しない。上記第２の観点による本発明のプログラム生成方法では
、計算の各式に対して、その実行前毎にプロセッサ間で
データ転送を行なうプログラムを生成する。各式の処理
量に比べて、通信・同期の処理量は十分少さいため、演
算時間に対して通信・同期処理のオーバーヘッドが相対
的に小さいプログラムを生成することが出来る。上記第３の観点による本発明のプログラム生成方法では
、領域や数式に基づくプロセッサの割り付け方法をユー
ザが指定できるため、自動割り付けでは最適の割り付け
とならないないような場合に、ユーザにより最適化した
プログラムを生成できるようになる。

【実施例】

以下、図面を参照して本発明の一実施例を説明する。な
お、説明は、次の（１）〜（７）の順序で行う。（１）シミュレーションモデルの説明（２）問題記述プログラムの説明（３）並列計算機の説明（４）並列計算機用プログラムの説明（５）問題記述プログラムから並列計算機用プログラム
を生成するプログラム生成処理の概略説明（６）プログ
ラム生成処理を構成する各処理の詳細説明（７ンＰ　Ｅ　Ｉり付け指定機能の説明（１）シミュレ
ーションモデルの例の説明第３図に示すように、空間領
域３０１は、上下を壁面３０４で囲まれ、左側面３０２
と右側面３０３が解放されている。初期状態は全領域で流速０とし、左側面３０２から流体
が一定の流速で流入するものとする。この場合における空間領域３０１の内部の流れの変化は
、ナビエ・ストークスの方程式と呼ばれる偏微分方程式
の解を時間毎に計算することにより、数値的にシミュレ
ーションできる。（流体の数値シミュレーションの方法
は、例えば［スーパーコンピュータ　日本物理学金偏　
培風館　ｐｐ１７８−１９７Ｊに紹介されている。）このようなシミュレーションには、一般に差分法が用い
られる。すなわち、第４図に示すように、空間領域３０
１を微小領域に分割する。そして、各微小空間を代表す
る点（例えば微小空間の頂点３１０）毎に物理量に対応
じた変数を定義し、時間ステップ毎に所定の計算を行な
ってそれらの変数の値を求める。なお、微小空間はメツ
シュと呼ばれ、各微小空間を代表する点は節点と呼ばれ
る。（２）問題記述プログラムの例の説明第５図は、第４図のシミュレーションモデルを高水準言
語で表わした問題記述プログラムの例である。（かかる
高水準言語は、例えば「情報処理学会論文誌　ＶＯＬ、
２６　Ｎｏ、１　　ｐｐ１６８−１８０Ｊ　ニ紹介され
ている。）この問題記述プログラムＱは、プログラムの異なった構
成要素を表すキーワードで始まり、セミコロンに）で終
わる文の列から成る。ＰＲＯＧ文１０１は、生成されるシュミレーションプロ
グラムの名称を示している。ＭＥＴＨＯＤ文１０２は文数０２析上の手法を示してお
り、（ＦＤＭ）は差分法を示している。文１１１から文１２０よりなる構造規定ブロック１１０
は、シミュレーションモデルの構造を規定するブロック
である。ＤＯＭＡＩＮ文１１１は、解析領域のＸ、　Ｙ座標を指
定する。ＴＩＭＥ文１１２は、解析の時間領域を指定する。ＭＥＳＨ文１１３は、メツシュの分割数を指定する。ＴＳＴＥＰ文１１４は、時間に沿って解を追跡する時間
ステップ間隔を指定する。ＲＥＧＩ　ＯＮ文１１５は、解析領域の部分領域。例えば境界あるいは内部の分割された領域の名称を指定
する。ＣＯＮ　’Ｓ　Ｔ文１１７は、熱伝導率や材質定数など
の定数を宣言する。ＶＡＲ文１１８は、物理変数を宣言する。ＢＣＯＮＤ文１１９は、境界条件を指定する。Ｉ　Ｃ０ＮＤ文１２０は、初期条件を指定する。文１３１から文１４４よりなるスキームブロック１３０
は、数値計算手順を記述するブロックである。ＳＣＨＭＥ文１３１とＥＮＤ　ＳＣＨＥＭＥ文１４４は
、スキームブロック１３０の範囲を指定する。ＩＴＥＲ文１３２からＥＮＤ　　ＩＴＥＲ文１４３の間
は、ＩＴＥＲ文１３２の中のＵＮＴＩ　Ｌ以降の条件が
成立するまで繰り返し実行される。文１３３，１３４，１３６から１４１は、変数に対する
代入文である。文１３５は、式１３５Ａを離散化して得られる連立−次
方程式を変数ＰＭについて解くことにより、変数ＰＭを
更新することを指定する。文１４２は、変数ＰＯの値を、１００ステツプ毎にプリ
ンタに出力することを指定する。（３）並列計算機の説明第２図は、問題記述プログラムから生成される並列計算
機用プログラムを実行する並列計算機のブロック図であ
る。（かかるアーキテクチャは、例えば「情報処理学会
節３８口金国大会講演論文集　ｐｐ１４８６−１４８９
Ｊに詳しく記載されている。）並列計算機２０は、ホス
ト計算機ＨＣと、複数のプロセッサＰＥと、ネットワー
クＮＷからなる。ホスト計算機ＨＣは、メモリＭＳを有し、そこに格納さ
れた並列計算機用プログラム（ＨＣ用プログラム）を実
行する。各プロセッサＰＥは、ローカルメモリＬＳを有し、そこ
にロードされた並列計算機用プログラム（ＰＥ用プログ
ラム）を実行する。ホスト計算機ＨＣは、入出力処理およびプロセッサＰＥ
へのＰＥ用プログラムのロード、プロセッサＰＨの起動
を行なう。各プロセッサＰＥは、ホスト計算機ＨＣによって起動さ
れると、指定されたＰＥ用プログラムを実行する。この
とき、プロセッサＰＥは、ホスト計算機ＨＣの間でデー
タを転送し、また、プロセッサＰＥ間でデータを転送す
る。ＰＥ用プログラムの実行を終えると、ホスト計算機
ＨＣに専用の同期機構を通して終了を伝える。（４）並列計算機用プログラムの説明並列計算機用プログラムは、並列プロセスＦＯＲＴＲＡ
Ｎ言語によって記述されうる。（かかる並列プロセスＦ
ＯＲＴＲＡＮ言語は、例えば「情報処理学会節３８口金
国大会講演論文集ｐｐ１４９０−１４９１Ｊに詳しく記
載されている。）第６図は、ＨＣ用プログラムの一例で
ある。このＨＣ用プログラム１１において、宣言部１１０１は
、問題記述プログラム中に用いられている変数・定数に
対応する配列９行列解法に必要な配列、ＤＯ小ループ御
インデックステーブル、ＰＥ間通信用ｋｅｙテーブルな
どの変数を宣言する。前処理部１１０２は、問題記述プログラム中に用いられ
ている定数に対応する配列、ＤＯ小ループ御インデック
ステーブル、ＰＥ間通信用ｋｅｙテーブルに値を設定す
る。ＰＥ用プログラムの起動部１１０３は、ＰＥ用プログラ
ムを外部記憶装置ＨＤから各プロセッサＰＥにロードし
た後、起動する。入出力処理部１１０４は、問題記述プログラム中の各入
出力文に対応じたプロセッサＰＥからの入出力処理要求
を待ち、要求を検出すると、要求に応じた入出力処理サ
ブルーチン１１０５を呼び出す。入出力処理サブルーチン１１０５は、問題記述プログラ
ム中の各入出力文に対応して、変数の外部記憶装置ＨＤ
への出力、外部記憶装置をＤからのデータ入力を行なう
。第７図は、ＰＥ用プログラムの一例である。このＰＥ用プログラム１２において、宣言部１２０１は
、問題記述プログラム中に用いられている変数・定数に
対応する配列９行列解法に必要な配列、Ｄｏ小ループ御
インデックステーブル、ＰＥ間通信用ｋｅｙテーブルな
どの変数を宣言する。ＨＯ３Ｔ−ＰＥデータ転送部１２０２は、ＰＥ用プログ
ラム１２の実行に必要なデータをホスト計算機ＨＣのメ
モリＭＳから目ローカルメモリＬＳに転送する部分であ
る。必要なデータとは、ＤＯ小ループ御インデックステ
ーブル、ＰＥ間通信用ｋｅｙテーブルの値である。前処理部１２０３および初期条件文や定数文に対応する
初期設定部１２０４は、配列の値の初期設定を行なう。実行部分１２０５は、問題記述プログラム中のスキーム
ブロックに対応する部分で、スキームブロック中の制御
構造に対応じた制御構造を有し、スキームブロック中の
各実行文（代入文および５ＯＬＶＥ文）、入出力文（入
力文および出力文）に対応して次のようなコードを有す
る。Ａ０代入文に対応するコード１）代入文実行に必要なＰＥ間データ転送サブルーチン
の呼び出し１２０６２）代入文実行に対応するサブルーチンの呼び出し１２
０７Ｂ、５ＯＬＶＥ文に対応するコート１）行列生成に必要なＰＥ間データ転送サブルーチンの
呼び出し１２０６２）行列生成と行列解法ライブラリの呼び出しを行なう
サブルーチンの呼び出し１２ｏ７Ｃ０入力文に対応する
コード１）ホスト計算機ＨＣに対する入力実行要求（図示せず
）２）ホスト計算機ＨＣからプロセッサＰＥへの入力デー
タの転送（図示せず）Ｄ、出力文に対応するコード１）プロセッサＰＥからホスト計算機ＨＣへの出力対象
変数の転送１２０８２）ホスト計算機ＨＣに対する出力実行要求１実行文に
対応するサブルーチン１２１０については、第２６図を
参照して後述する。ＰＥ間データ転送サブルーチン１２１１については、第
２７図を参照して後述する。（５）問題記述プログラムから並列計算機用プログラム
を生成するプログラム生成処理の概略説明第１図は、本
発明の一実施例のプログラム生成処理１を示す。プログラム生成処理１は、並列実行のための情報生成処
理２と、コード生成処理１０とからなっている。まず、並列実行のための情報生成処理２は、ＰＥ割り付
け処理４と、ＤＯ小ループ御インデックステーブル生成
処理５と、ＰＥ間通信用ｋｅｙ生成処理６とからなって
いる。ＰＥ割り付け処理４は、解析領域の形状情報およびメツ
シュ情報から、解析領域を分割して各プロセッサＰＨに
割り付けるためのＰＥ担当領域インデックステーブル７
を生成する。ＤＯ小ループ御インデックステーブル生成処理５は、問
題記述プログラム中の各実行文について、その実行文に
対応する並列計算機用プログラム中の処理部分のＤｏル
ープ制御インデックステーブル８を生成する。このＤｏ
ループ制御インデックステーブル８は、各実行文、各プ
ロセッサＰＥそれぞれに対して生成される。ＰＥ間通信用ｋｅｙ生成処理６は、実行時に必要なｊＥ
間通信の全ての場合について、ＰＥ間通信に用いるｋｅ
ｙを決定し、ＰＥ間通信用ｋｅｙテーブル９を生成する
。ＰＥ間通信用ｋｅｙテーブル９は、受信ｋｅｙテーブ
ル９Ａと送信ｋｅｙテーブル９Ｂとからなる。次に、コード生成処理１０は、問題記述プログラムと上
記各テーブル７．８．９とから、並列計算機用プログラ
ムＡを生成する。並列計算機用プログラムＡは、先述の
ようにＨＣ用プログラム１１およびＰＥ用プログラム１
２からなる。（６）プログラム生成処理を構成する各処理の詳細説明（ＰＥ割り付け処理４の詳細、）ＰＥ割り付け処理４は、演算内容に応じて節点数が均等
になるように解析対象の空間領域をブロック状またはス
ライス状に分割し、プロセッサＰＥを割り付ける。（こ
のような領域分割およびＰＥ割り付け方法については、
例えば「情報処理学会筒３８口金国大会講演論文集ｐ１
４９２−１４９３Ｊに述べられている。また、電磁場解
析、熱伝導解析。流体解析などの偏微分方程式で記述される物理現象のシ
ミュレーションを並列計算機上で実行するために必要と
なるプロセッサ割り付け方法に関しては、例えばｒ　Ｉ
ＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｃｏｍｐｕ
ｔｅｒｓＶＯＬ、Ｃ−３６，ＮＯ，１２，ＤＥＣＥＭＢ
ＥＲ１９８７ｐｐ１４０８−１４２４」に記載されてい
る。）各プロセッサＰＥの担当領域を決定すると、ＰＥ担当領
域インデックステーブル７を生成する。第５図の問題記述プログラムＱの例では、スキームブロ
ック１３Ｑ中の最も負荷の大きい演算である５ＯＬＶＥ
文１３５に着目し、この演算内容が完全並列演算である
ことから、領域分割型をブロック状とし、節点数か均等
でかつ部分領域の境界上の節点数が最小となるように分
割する。第８図に、プロセッサＰＥか８台の場合に上記
ＰＥ割り付け処理を行なった例を示す。空間領域３０１
をｒ１〜ｒ８の８つの担当領域に分割し、各々に１台の
プロセッサＰＥを割り付ける。−点鎖線３２０は領域分
割の境界を示す。第９図は、担当領域ｒ６中に含まれる
節点を例示する。第１０図に、ＰＥ担当領域インデンクステーブル７を示
す。これは担当領域ｒｉと各担当領域ｒｉに含まれる節
点のＸ方向、Ｙ方向のインデックスの下限、上限を表わ
したテーブルである。例えば部分領域ｒ６については、
第９図から、Ｘ方向のイ・ンデックスの下限Ｘ６１．上
限Ｘ６５が格納され、また、Ｙ方向のインデックスの下
限Ｙ６１゜上限Ｙ６６が格納されている。なお、スキームブロック中に複数の５ＯＬＶＥ文があり
、各々の最適な領域分割型か異なる場合、各５ＯＬＶＥ
文が別々のブロックとなるようにスキームブロックを部
分ブロックに分割し、各部分ブロックについて上記と同
様の方法でＰＥ割り付けを行なう。この場合、ＰＥ用プ
ログラムは、各部分ブロック毎に独立としいホスト計算
機ＨＣはスキームブロックの制御構造に従ってこれら複
数のＰＥ用プログラムを起動する。複数の部分ブロック
にまたがって参照、更新される変数については、上記Ｐ
Ｅ用プログラムの起動時および終了時にホスト計算機Ｈ
ＣとプロセッサＰＥの間でデータ転送する必要かあるの
で、このデータ転送が最小となるような方法でスキーム
ブロックを部分ブロックに分割するのか好ましい。この
ためには、例えば、複数の５ＯＬＶＥ文か別々の部分ブ
ロックとなるような全ての分割方式について、各部分ブ
ロックでの変数の参照、更新を調べ、各ＰＥ用プログラ
ムの実行時のホスト−ＰＥ間データ転送量が最小となる
分割方式を選択する。第１１図に、複数の５ＯＬＶＥ文を含むスキームブロッ
クの分割の例を示す。この例では、文１７１および文１
７３に対してはブロック状領域分割に基づ＜ＰＥ割り付
けが適しており、文１７２に対してはスライス状領域分
割に基づ＜ＰＥ割り付けが適している。なお、上記方法とは無関係に、領域分割およびＰＥ割り
付け方法を問題記述プログラム中の記述によって指定す
ることも出来る。これについては後述する。（ＤＯループ制御インデックステーブル生成処理５の詳
細）第１２図１：：、Ｄｏ長ループ御インデックス生成処理
５のフロー図を示す。ボックス５０１は、その右側のボックス５０２〜５０５
の処理を、各代入文、５ＯＬＶＥ文について繰り返すこ
とを表わす。離散化規則抽出処理５０２および離散式の種類に依る領
域分割処理５０３は、対象としている実行文について同
一の離散式で計算を行う部分領域に解析対象領域を分割
する。（このような分割方法については例えば特開昭６
２−２１２７７１号公報において詳細に記述されている
。）ボックス５０５は、その右側のボックス５０４の処
理を、各プロセッサＰＥの担当領域毎に繰り返すことを
表わす。ＰＥ担当領域の離散式の種類に依る領域分割処理５０４
は、前記ＰＥ担当領域インデックステ５−。プル７と、前記離散式の種類に依る領域分割処理５０３
の結果とから、プロセッサＰＨの担当領域を同一の離散
式で計算を行う部分領域に分割し、プロセッサＰＥ毎の
Ｄｏ小ループ御インデックステーブル８を生成する。第１３図に、第５図の問題記述プログラムＱの代入文１
３３に、前記離散式の種類に依る領域分割処理５０３を
適用した例を示す。Ｒ１−Ｒ１４が、離散式の種類に依
り分割された領域である。解析対象領域は、節点か角点となる６つの領域Ｒ１〜Ｒ
６と、節点が境界点となる６つの領域Ｒ７〜Ｒ１２と、
節点か内点となる２つの領域Ｒ１３゜Ｒ１４とに分けら
れている。第１４図に、第６のプロセッサＰＥの担当領域ｒ６に、
上記ＰＥ担当領域の離散式の種類に依る領域分割処理５
０４を適用した例を示す。破線３２１は、部分領域の境
界を示す。第１５図に、第６のプロセッサＰＨについてのＤｏ小ル
ープ御インデックステーブル８を示す。これは第６のプロセッサＰＥの担当領域ｒ６と前記離散
式の種類に依り分割された領域Ｒ１〜Ｒ１４の交わる領
域に含まれる節点のＸ方向、Ｙ方向のインデックスの下
限、上限を表わしたテーブルである。例えば担当領域ｒ
６と前記離散式の種類に依り分割された領域ＲＩＯの交
わる領域についテハ、第１４図から、Ｘ方向のインテ・
ノクスの下限Ｘ６１．上限Ｘ６２が格納され、また、Ｙ
方向のインデックスの下限Ｙ６２．上限Ｙ６２が格納さ
れている。例えば領域Ｒ１との交わりのように交わりが
空であるものについては、例えば下限のインデックス＝
１１．上限のインデックス＝１０のように、（下限のイ
ンデックス）〉（上限のインデックス）となる整数値を
設定し、空であることを示す。以上のようにして、各代入文、５ＯＬＶＥ文毎に且つ各
プロセッサＰＥ毎にＤｏ小ループ御インデックステーブ
ル８を生成する。＋ＰＥ間通信用ｋｅｙ生成処理６の詳細）第１６図に、
ＰＥ間通信用ｋｅｙ生成処理６のフロー図を示す。ボックス６０１は、その右側のボックス６０３〜６０５
の処理を、各代入文、５ＯＬＶＥ文について繰り返すこ
とを表わす。離散化規則抽出処理６０３は、第１２図の離散化規則抽
出処理５０２と同じ内容の処理である。通信対象変数抽出処理６０４は、各実行文の離散式から
、計算実行に先立ってプロセッサＰＥ間で転送が必要な
変数を抽出する。参照パターン生成処理６０５は、上記プロセッサＰＥ間
で転送か必要な変数について、更新対象の変数が定義さ
れた節点とその変数の更新時に参照するために受信する
変数の定義された節点の位置関係情報（以下、参照パタ
ーン呼ぶ）を生成する。例えば、第５図の問題記述プログラムＱの代入文１３３
において参照している変数ｔＪｏについては、変数ＵＯ
に対応するＰＥ用プログラム中の配列をＬＬＵＯとする
と、節点（ｉ、ｊ）における離散式については、代入文
１３３のＤＸ　（ＵＯ）の項はＬＬＵＯ（ｉ＋１．ｊ）
とＬＬＵＯ（ｉ　−１、ｊ）を参照し、ＤＹ　（ＵＯ）
の項はＬＬＵＯ（ｉ、ｊ＋１）とＬＬＵＯ（ｉ、ｊ−１
）を参照し、ＬＡＰＬ　（ＵＯ）の項はＬＬＵＯ（ｉ＋
１゜ｊ）とＬＬＵＯ（ｉ−１，Ｊ）とＬＬＵＯ（ｉ。ｊ＋１）とＬＬＵＯ（ｉ、ｊ　　１）とＬＬＵＯ（ｉ、
ｊ）を参照する。つまり、節点（ｉ、ｊ）の上下左右の
４つの節点上の変数ＵＯＯ値か必要となる。これが参照
パターンである。ボックス６２０は、その右側のボックス６２１〜６２５
の処理を、参照パターン毎に繰り返すことを表わす。ボックス６２１は、その右側のボックス６２２〜６２５
の処理を、各プロセッサＰＥ毎に繰り返すことを表わす
。受信データのインデックスを求める処理６２２は、参照
パターンに基づき、プロセッサＰＥが受信するべきデー
タの定義された節点のインデックスを求める。節点（ｉ、ｊ）の上下左右の４つの節点上の変数ＵＯの
値が必要となる上記例の参照パターンでは、第１７図に
示すように、例えば、第６のプロセッサＰＥは、第２の
プロセッサＰＥから受信するべき下の節点（線３３０上
の節点）のインデックスと、第５のプロセッサＰＥから
受信するべき左の節点（線３３１上の節点）のインデッ
クスと、第７のプロセッサＰＥから受信するべき右の節
点ｃ線３３２上の節点）のインデックスとを求める。なお、上の節点は存在しない。受信データのｋｅｙ決定処理６２３は、受信データに通
し番号をつける。この番号付けは、例えば次のように行
なう。まず、上記受信データの定義点の各面に順序付けを行な
う。この各面を受信面と呼ぶ。受信面は、第１７図にお
いて、線３３０，３３１，３３２で示すものである。こ
れは、例えば、各受信面の節点のうちＹ方向のインデッ
クスか最も小さいもの同士を比へ、小さいものをもつ順
に連続した整数値を与え、通し番号を付ける。Ｙ方向の
インデックスが等しいものについては、Ｘ方向のインデ
ックスを比べ、小さいものをもつ順に連続した整数値を
与える。次に、受信面の順に、同じ受信面ではＹ方向のインデッ
クスの小さい順に、同じＹ方向のインテ・ンクスではＸ
方向のインデックスの小さい順に。連続した整数値を与え、全ての受信データの定義点に通
し番号を付ける。この通し番号か受信ｋｅｙである。第１８図に、受信ｋｅｙテーブル９Ａの構成例を示す。受信ｋｅｙテーブル９Ａの各行は、各受信面に対応して
いる。各行毎に、受信面のＸ方向のインデックスの下限
９０１．上限９０２、Ｙ方向のインデックスの下限９０
３．上限９０４、受信ｋｅｙ基底値９０５の各フィール
ドを有する。受信ｋｅｙ基底ｔｉ　９０５は、受信面の
節点の受信ｋｅｙの最小の値を格納する。受信面の各節
点の受信ｋｅｙの値は、その節点のインデックスと前記
Ｘ方向のインデックスの下限９０１．上限９０２、Ｙ方
向のインデックスの下限９０３．上限９０４、受信ｋｅ
ｙ基底値９０５から算出される。送信データおよび送信相手ＰＥ決定処理６２４は、自プ
ロセッサＰ″Ｅの担当領域と他のプロセッサＰＥの受信
面の交わり（以下、送信面と呼ぶ）を求めることにより
、自プロセンサＰＥか他のプロセッサＰＥに対して送信
すべきデータの定義点のインデックスと送信相手プロセ
ッサＰＥを求める。例えば、第１９図に示すように、第
２のプロセッサＰＥの受信面３４０，３４３、第５のプ
ロセッサＰＥの受信面３４１、第７のプロセッサＰＥの
受信面３４２，３４４，３４５かあるとき、これらと第
６のプロセッサＰＥの担当領域ｒ６の交わりを求めれば
、第２０図に示すように、第６のプロセッサＰＥか送信
すべきデータの定義点のインデックスと送信相手プロセ
ッサＰＥを求めることか出来る。送信データのｋｅｙ決定処理６２５は、上記受信データ
のｋｅｙ決定処理６２３で決定した受信ｋｅｙに合わせ
て、対応する送信データの送信ｋｅｙを決定する。第２１図に、送信ｋｅｙテーブル９Ｂの構成例を示す。送信ｋｅｙテーブル９Ｂの各行は、各送信面に対応して
いる。各行毎に、送信面のＸ方向のインデックスの下限
９１１．上限９１２、Ｙ方向のインデックスの下限９１
３．上限９１４、送信ｋｅｙ基底値９１６、送信ｋｅｙ
ディスプレイスメント９１７、送信相手ＰＥ番号９１８
の各フィールドを有する。送信ｋｅｙ基底値９１６は、
送信面の節点の送信ｋｅｙの最小の値を格納する。送信
ｋｅｙディスプレイスメント９１７は、受信ｋｅｙと異
なり、送信ｋｅｙが連続番号にならないことかあるため
、その番号の飛ぶ値を格納する。送信面の各節点の送信
ｋｅｙの値は、その節点のインデックスと前記Ｘ方向の
インデックスの下限９１１、上限９１２、Ｙ方向のイン
デックスの下限９１３、上限９１４、送信ｋｅｙ基底値
９１６、送信ｋｅｙディスプレイスメント９１７から算
出される。（コード生成処理１ｏの詳細）コード生成処理１０は、第２２図に示すＨＣ用プログラ
ム生成処理と、第２３図（ａ）（ｂ）および第２４図に
示すＰＥ用プログラム生成処理からなる。なお、第２２
図、第２３図（ａ）（ｂ）および第２４図において、太
線で囲んだボックス（１００２〜１００５，１０２２，
１０２３，１０２８．１０３０，１０３１．１０４４）
の処理か本発明に特徴的な処理である。それ以外のボッ
クスの処理は、従来公知のプログラム生成方法における
処理と同じである。まず、第２２図のＨＣ用プログラム生成処理９Ａについ
て説明する。ステップ１００１では、問題記述プログラム中に用いら
れている変数、定数１行列解法に必要な配列などに対応
して並列計算機用プログラム中で用いる変数を宣言する
プログラム部分（第６図１１０１）を生成する。ステップ１００２では、Ｄｏ小ループ御インデックステ
ーブル８．ＰＥ間通信用ｋｅｙテーブル９として用いる
配列を宣言するプログラム部分（第６図１１０１）を生
成する。このステップ１００’２の処理は、本発明の特
徴的な処理であり、詳細を後述する。ステップ１００３では、Ｄｏ小ループ御インデックステ
ーブル８．ＰＥ間通信用ｋｅｙテーブル９に値を設定す
るプログラム部分（第６図１１０２）を生成する。ステップ１００４では、ＰＥプログラムのロードおよび
起動を行なうプログラム部分（第６図１１０３）を生成
する。ステップ１００５では、プロセッサＰＥがらの入出力処
理要求を検出して要求に対応じた入出カサブルーチンを
呼び出すプログラム部分（第６図１１０４）を生成する
。ステップ１００６および１００７では、問題記述プログ
ラム中の各入出力文毎に、対応する入出力処理サブルー
チン（第６図１１０５）を生成する。ステップ１００８では、Ｈｃ用プログラムの終端部分を
生成する。次に、第２３図（ａ）（ｂ）のＰＥ用プログラム生成処
理（ＰＥメインプログラムの生成パート）について説明
する。ステップ１０２１では、問題記述プログラム中に用いら
れている変数、定数１行列解法に必要な配列なとに対応
して並列計算機プログラム中で用いる変数を宣言するプ
ログラム部分（第７図１２０１）を生成する。ステップ１０２２では、ＤＯ小ループ御インデックステ
ーブル８．ＰＥ間通信用ｋｅｙテーブル９として用いる
配列を宣言するプログラム部分（第７図１２０１）を生
成する。このステップ１０２２の処理は、本発明の特徴
的な処理であり、詳細を後述する。ステップ１０２３では、ＤＯ小ループ御インデックステ
ーブル８．ＰＥ間通信用ｋｅｙテーブル９に、ホスト計
算機ＨＣのメモリＭＳ上の対応するデータを転送するホ
スト−ＰＥデータ転送のプログラム部分（第７図１２０
２）を生成する。ステップ１０２４では、問題記述プログラム中のメツシ
ュ指定文（第５図のＭＥＳＨ文１１３）に従って、節点
座標値配列にメツシュの座標値を設定するプログラム部
分（第７図１２０３）を生成する。ステップ１０２５では、問題記述プログラム中の初期条
件文や定数文（第５図のＩＣｏＮＤ文１２Ｃ）、Ｃ０Ｎ
５Ｔ文１１７）に従って、ＰＥ用プログラム中の変数テ
ーブルにこれらの文で指定された値を設定するプログラ
ム部分（第７図１２０４）を生成する。ステップ１０２６は、その右のステップ１０２７〜１０
３１を、問題記述プログラム中の各文毎に繰り返す。ステップ１０２７では、問題記述プログラム中の文が実
行文なら右上のステップ１０２８．１０２９を行い、出
力文なら右下のステップ１０３０゜１０３１を行う。ステップ１０２８ては、ＰＥ間データ転送を行うサブル
ーチンを呼び出すプログラム部分を生成する。その際に
、スキームブロックを静的に解析し、必要な変数のロー
カルメモリＬＳ上の通信エリアが既に最新の値に更新さ
れているか否かを判定し、転送の必要性を判定する。ステップ１０２９では、実行文に対応するサブルーチン
を呼び出すプログラム部分を生成する。ステップ１０３０では、ホスト−ＰＥ間データ転送を行
うサブルーチンを呼び出すプログラム部分を生成する。ステップ１０３１では、ホスト計算機ＨＣへの出力実行
要求を行なうプログラム部分を生成する。ステップ１０３２では、ＰＥメインプログラムの終端部
分を生成する。次に、第２４図のＰＥ用プログラム生成処理（実行文に
対応するサブルーチンの生成パート）について説明する
。ステップ１０４０は、スキームブロックの各実行文毎に
、右のステップ１０４１〜１０４７を繰り返す。ステップ１０４１ては、各実行文に対応するサブルーチ
ンのヘッダを生成する。ステップ１０４２では、必要な宣言部を生成する。ステップ１０４３は、離散式の種類に依る領域分割処理
（第１２図５０３）の結果として得られた各部分領域毎
に、右のステップ１０４４．１０４５を繰り返す。ステップ１０４４では、Ｄｏ文を生成する。このとき、
Ｄｏ文の実行範囲として、上記Ｄｏループ制御インデッ
クステーブル８を用いる。ステップ１０４５では、部分領域における離散式を生成
する。ステップ１０４６は、実行文が５ＯＬＶＥ文か否か判定
し、５ＯＬＶＥ文の場合は、右上のステップ１０４７を
行なる。ステップ１０４７ては、行列解法ライブラリを呼び出す
プログラム部分を生成する。次に、前記ステップ１００２および前記ステップ１０２
２における処理の詳細を説明する。Ｄｏ小ループ御インデックステーブル用配列は、実行文
毎に別々である。配列サイズは、離散式の種類に依る領
域分割処理（第１２図５０３）によって生成される部分
領域の数であり、対象とする実行文により異なる。ステップ１００２およびステップ１０２２においては、
この部分領域の数を参照して、各実行文に対応するＤｏ
小ループ御インデックステーブル用配列の宣言コードを
生成する。通信用ｋｅｙテーブル用配列配列参照パターンとＰＥ割
り付けの組毎に別々である。通信用ｋｅｙテーブルのサ
イズは、参照パターンとＰＥ割り付けの組合せによって
決まり、これはプロセッサＰＥにも依存する。並列計算
機用プログラムＡ中での配列サイズは、各プロセッサＰ
Ｅの必要とするテーブルサイズの最大値とする。ステップ１００２およびステップ１０２２においては、
通信用ｋｅｙテーブル生成時に求めた値を参照して、参
照パターンとＰＥ割り付けの組合せ毎に通信用ｋｅｙテ
ーブル用配列配列言コートを生成する。第２５図に、ＰＥ用プログラム１２の宣言コードの一部
を示す。宣言文１２８２は、第５図の問題記述プログラムＱ中の
代入文１３３に対応するＤｏ小ループ御インデックステ
ーブル用配列の宣言文である。配列の各行ＬＬＲＴＡＢ（ｊ、１）（ｊ＝１〜４）は、
第１３図の部分領域Ｒｉ　　（ｉ＝１〜１４）上の離散
式に対応し、ＬＬＲＴＡＢ　（１，ｉ）にはＸ方向イン
デックス下限値、ＬＬＲＴＡＢ　（２゜ｉ）にはＸ方向
インデックス上限値、ＬＬＲＴＡＢ（３，ｉ）にはＸ方
向インデックス上限値、ＬＬＲＴＡＢ　（４，ｉ）には
Ｘ方向インデックス上限値か設定される。この配列のの
各行ＬＬＲＴＡＢ（ｊ、ｉ）をＤｏ小ループ御変数の範
囲として用いる。宣言文１２８３，１２８４は、第５図の問題記述プログ
ラムＱ中の代入文１３３における変数Ｕ０の参照パター
ンに対応する通信用ｋｅｙテーブル用配列配列言コート
である。宣言文１２８３は、送信ｋｅｙテーブル用配列
配列言文である。宣言文１２８４は、受信ｋｅｙテーブ
ル用配列配列言文である。配列ＬＬＳＮＤＫは送信ｋｅｙテーブル用配列配列り、
各行ＬＬＳＮＤＫ（ｊ、１）（ｊ＝１〜７）はｉ番目の
送信面に対応し、ＬＬＳＮＤＫ（１，ｉ）には送信面の
Ｘ方向インデックス下限値、ＬＬＳＮＤＫ　（２，ｉ）
には送信面のＸ方向インデックス上限値、ＬＬＳＮＤＫ
　（３，ｉ）には送信面のＸ方向インデックス上限値、
ＬＬＳＮＤＫ（４，ｉ）には送信面のＸ方向インデック
ス上限値、ＬＬＳＮＤＫ　（５，ｉ）には送信ｋｅｙ基
底値、ＬＬＳＮＤＫ　（６，ｉ）には送信ｋｅｙディス
プレイスメント、ＬＬＳＮＤＫ　（７，ｉ）には送信相
手ＰＥ番号がそれぞれ設定される。配列ＬＬＲＣＶＫは受信ｋｅｙテーブル用配列配列り、
各行ＬＬＲＣＶＫ（ｊ、１）（ｊ＝１〜５）はｉ番目の
受信面に対応し、ＬＬＲＣＶＫ（１，ｉ）には受信面の
Ｘ方向インデックス下限値、ＬＬＲＣＶＫ　（２，ｉ）
　には受信面のＸ方向インデックス上限値、ＬＬＲＣＶ
Ｋ　（３，ｉ）＋：は受信面のＸ方向インデックス上限
値、ＬＬＲＣＶＫ（４，ｉ）には受信面のＸ方向インデ
ックス上限値、ＬＬＲＣＶＫ　（５，ｉ）には受信ｋｅ
ｙ基底値がそれぞれ設定される。次に、第２６図に、第２５図のスキームブロック１３０
の代入文１３３に対応して生成されたサブルーチン（第
７図１２１０）の一部を示す。配列ＬＬＵＭは、第５図の問題記述プログラムＱ中の変
数ＵＭに対応するＰＥ用プログラム１２中の配列である
。ＬＬＲＴＡＢは、上記ＤＯ小ループ御インデックステー
ブル用配列である。Ｄｏ文の制御変数１は、Ｘ方向のインデックスを表わし
ている。制御変数Ｊは、Ｙ方向のインデックスを表して
いる。配列ＬＬＵＭへの代入文１２５３は、問題記述プログラ
ムＱの代入文１３３に対応する各節点上で定義された変
数への代入文である。ＤＯブロック１２５５は、Ｄｏ小ループ御インデックス
テーブル生成処理５における各部分領域内の節点につい
ての代入文の実行コートである。次に、第２７図に、ＰＥ間データ転送サブルーチン（第
７図１２１１）の一部を示す。ＰＥ間データ転送サブル
ーチンは、通信対象変数１通信ｋｅｙテーブル、送信面
の数、受信面の数を引数として受は取り、対象変数の送
受信を実行する。Ｄｏブロック１２６０は、１つの送信面についてのデー
タ送信に対応するコートである。Ｄｏ文１２６５は、各送信面について実行する繰り返し
を示す。変数ＳＰＮは、送信面の数を示す。配列Ｌ　Ｌ　Ｓ　Ｎ　ｐ　Ｋは、上記送信ｋｅｙテーブ
ル用配列配列る。Ｄｏループ制御変数Ｉ、Ｊは、それぞれＸ方向。Ｙ方向のインデックスを示している。文１２６３は、通信用ｋｅｙテーブルおよび予め決めら
れた番号付け規則に従って、各送信デー夕の識別子を算
出する。文１２６４は、データ送信を実行する関数を呼び出すＣ
Ａ　Ｌ　、Ｌ文である。ここで用いられる５ＥＮＤルー
チンは、送信対象変数、送信先ＰＥ番号およびデータ識
別子を引数として実行される。ＤＯブロック１２７０は、１つの受信面についてのデー
タ受信に対応するコートである。ＤＯ文１２７５は、各受信面について実行する繰り返し
を示す。変数ＲＰＮは、受信面の数を示す。配列ＬＬＲＣＶＫは、上記受信ｋｅｙテーブル用配列配
列る。Ｄｏ小ループ御変数１．Ｊは、それぞれＸ方向。Ｙ方向のインデックスを示している。文１２７３は、予め決められた番号材は規則に従って、
各送信データの識別子を算出する。文１２７４は、データ受信を実行する関数を呼び出すＣ
ＡＬＬ文である。ここで用いられるＲＥＣＩＶＥルーチ
ンは、受信データを代入する変数およびデータ識別子を
引数として実行される。ＲＥＣＩＶＥルーチンを実行し
たとき識別子に対応するデータが到着していない場合は
、プロセッサＰＥは、データか到着するまで、他の処理
の実行を休止して待つ。（７）ＰＥ割り付け指定機能の説明第２８図に、ＰＥ割り付け指定記述を含んた問題記述プ
ログラムＱを例示する。シミュレーションモデルおよび
数値計算手順は、第５図の問題記述プログラムＱと全く
同じである。第２８図の問題記述プログラムＱは、領域分割の指定と
ＰＥ割り付けの指定を行った例である。＊ＤＥＣＤＥＦ文１２０は、ＰＥ割り付け定義文であり
、ＭＥＳＨ文１０４で定義されたメツシュの分割方法を
指定する。すなわち、その分割方法に対して名称ＤＥＣ
Ｉを与えると共に、Ｘ、　Ｙ方向毎に、始点インデック
ス１２１２．終点インデックス１２１３．分割数１２１
４を指定する。これにより、Ｘ、Ｙ方向について、始点インデックス１
２１２から終点インデックス１２１３までの間を分割数
１２１４で等分割し、全節点をブロック状に分ける。こ
れにより分割された例を第２９図に示す。＊ＤＥＣＯＭＰ文１２１は、ＰＥ割り付け指定文であり
、５ＯＬＶＥ文１２４を、上記＊ＤＥＣＤＥＦ文１２０
において定義された分割方法ＤＥＣ１に従ってプロセッ
サＰＥに割り付けることを指定する。第３０図に、ＰＥ割り付け指定記述を含んだ別の問題記
述プログラムＱを例示する。シミュレーションモデルお
よび数値計算手順は、第５図の問題記述プログラムＱと
全く同じである。第３０図の問題記述プログラムＱは、複数の実行文に対
し異なるＰＥの組を割り当て、それら複数の実行文を並
列実行することを指定した例である。＊ＰＥＸ文１３０．＊ＰＥＸＥＮＤ文１３１は、複数実
行文並列化指定文であり、上記２つの文で挟まれた複数
の実行文に対し、異なるプロセッサＰＥの組を割り当て
ることにより、これら複数の実行文を同時に実行するこ
とを指定する。この例では、代人文１５３，１５４の２
つの実行文にそれぞれ別のプロセッサＰＨの組を割り当
て、これら２つの実行文を同時に実行することを指定し
ている。例えば、プロセッサＰＨの台数か８台の場合、
代入文１５３，１５４に４台つつ割り当て可能であるか
ら、代入文１５３に対しては第３１図（ａ）のようにプ
ロセッサＰＥか割り当てられ、代入文１５４に対しては
第３１図（ｂ）のようにプロセッサＰＥか割り当てられ
る。第３２図は、上記のように問題記述プログラム中にＰＥ
割り付け指定記述を許す場合におけるＰＥ割り付け処理
４のフロー図である。ステップ４０１では、問題記述プログラム中にＰＥ割り
付け指定文（＊、ＤＥＣＯＭＰ文）かあるか判定する。あれば、ステップ４０２に進む。なければ、ステップ４
０３に進む。ステップ４０２では、ＰＥ割り付け定義文（＊ＤＥＣＤ
ＥＦ文）で定義された内容に従ってＰＥ割り付け方式を
決定する。ステップ４０３では、複数実行文並列仕掛定文（ｓＰＥ
Ｘ文、ＩＰＥＸＥＮＤ文）かあるか判定する。あれば、
ステップ４０４に進む。なければ、ステップ４０６に進
む。ステップ４０４では、＊ＰＥＸ文、ＩＰＥＸＥＮＤ文の
間の実行文の個数に応じて、各実行文に割り当てるＰＥ
の個数を決定する。例えば、複数実行文並列化の対象の
実行文の個数をｎとしたとき、＜ＰＥ台数／　ｎ　＞を
越えない最大の整数値を各実行文に割り当てるＰＥ台数
とする。ステップ４０５では、上記決定したＰＥ台数に従って領
域分割を行ない、各文に対し別々のＰＨの組を割り当て
る。この際の領域分割およびＰＥ割り付けは、従来知ら
れている自動ＰＥ割り付け方法により行なうことが出来
る。ステップ４０６では、従来知られている目動ＰＥ割り付
け方法により、領域分割およびＰＥ割り付けを行う。本発明は、上記実施例に限定されるものではなく、その
要旨を逸脱しない範囲において変更することが出来る。例えば、プログラム生成方法に対する入力を、上記実施
例では高水準の問題記述用言語によって記述されたプロ
グラムとしたが、ＦＯＲＴＲＡＮ等の汎用言語で記述し
たプログラムであっても良い。また、プログラムの応用を、偏微分方程式で記述される
物理現象のシミュレーションとしたが、例えば複数個の
各々並列に実行可能なりｏループを含む一般のＦＯＲＴ
ＲＡＮプログラムであってもよい。この場合には、Ｄｏ
小ループ処理される変数、配列を分割してプロセッサＰ
Ｈに割り付け、Ｄｏ小ループよって繰り返し実行される
プログラム部分の合併と、各プロセッサＰＥが処理すべ
き変数、配列要素を指定する情報を記憶する変数と。その変数を参照しつつ上記プログラム部分を実行する制
御部分とからなる並列計算機用プログラムか生成される
ことになる。

【発明の効果】本発明のプログラム生成方法によれば、複数のプロセッ
サにより並列に実行するためのプログラムの作成工数を
大幅に低減することが出来る。また、計算の種類が同じプログラムを共通化するので、
全体の記述量の少ないプログラムを生成することが出来
る。また、プロセッサ間通信に用いるデータ識別子として、
所定の規則的で番号付けした数値を用いることにより、
データ識別子の管理のためのデータ量を少なくすること
か出来る。また、データを必要とする処理毎にプロセッサ間通信を
行なうことにより、プロセッサが非同期に実行する処理
単位を大きくでき、実行途中でのプロセッサの待ち時間
を少なくし、実行性能を向上させることが出来る。

【図面の簡単な説明】

第１図は本発明の一実施例のプログラム生成方法の全体
のブロック図、第２図は並列計算機の構成図、第３図は
シミュレーションモデルの説明図、第４図は差分法によ
る数値シミュレーションのためのメツシュの説明図、第
５図は問題記述プログラムの例示図、第６図は生成され
るＨＣ用プログラムの概略図、第７図は生成されるＰＥ
用プログラムの概略図、第８図は空間領域の分割の例示
図、１ノ第９図は節点の例示図、第１０図はＰＥ担当領域インデ
ックステーブルの例示図、第１１図はスキームブロック
の例示図、第１２図はＤＯ小ループ御インデックス生成
処理のフロー図、第１３図は離散式の種類に基つく空間
領域の分割の説明図、第１４図は１つのＰＥ担当領域の
離散式の種類に基づく領域分割の例示図、第１５図はＤ
Ｏ小ループ御インデックステーブルの例示図、第１６図
はＰＥ間通信用ｋｅｙ生成処理のフロー図、第１７図は
１つのＰＥの受信データの定義点の例示図、第１８図は
受信ｋｅｙテーブルの例示図、第１９図は他のｌ）Ｈの
受信データの定義点の例示図、第２０図は１２のＰＥの
送信データの定義点の例示図、第２１図は送信ｋｅｙテ
ーブルの例示図、第２２図は）ＩＣ用プログラム生成処
理のフロー図、第２３図（ａ）（ｂ）はＰＥ用プログラ
ムのメインバートの生成処理のフロー図、第２４図はＰ
Ｅ用プログラムの実行文に対応するサブルーチンの生成
処理のフロー図、第２５図はＰＥ用プログラムの一部の
例示図、第２６図は実行文に対応するサブルーチンの一
部の例示図、第２７図はＰＥ間データ転送サブルーチン
の一部の例示図、第２８図は高水準言語中でのＰＥ割り
付け方式指定の例示図、第２９図は第２８図のＰＥ割り
付け方式指定に対応じた空間領域の分割の説明図、第３
０図は高水準言語中でのＰＥ割り付け方式指定の他の例
示図、第３１図（ａ）（ｂ）は第３０図のＰＥ割り付け
方式指定に対応じた空間領域の分割の説明図、第３２図
はＰＥ割り付け処理のフロー図である。（符号の説明）１・・・プログラム生成方法２・・並列実行のための情報生成処理４・・・ＰＥ割り付け処理５・・・ＤＯ小ループ御インデックステーブル生成処理６・・・ＰＥ間通信用ｋｅｙ生成処理７・・ＰＥ担当領域インデックステーブル８・・Ｄｏ小
ループ御インデックステーブル９・・・ＰＥ間通信用ｋ
ｅｙテーブル１０・・コード生成処理１１・・ＨＣ用プログラム１２・・ＰＥ用プログラム。

Claims

【特許請求の範囲】１、処理を行う範囲および処理を行う単位および処理の
内容の情報に基づいて、処理を行う範囲を複数のプロセ
ッサに分割し、各プロセッサが担当する範囲に含まれる
処理の単位毎に処理の内容に応じた計算を各プロセッサ
に行わせるプログラムを生成するプログラム生成方法で
あって、（ａ）処理を行う範囲を分割して複数のプロセッサに割
り付け、（ｂ）各プロセッサに割り付けた範囲毎に、その範囲内
の処理の単位における処理の内容に対応する計算の種類を判定して同じ種類の計算を行う単位同士を組とし、（ｃ）各組の各単位を指すインデックスにより繰り返し
制御情報を生成し、（ｄ）計算の種類に応じた繰り返し計算プログラムを生
成し、（ｅ）前記繰り返し制御情報に基づいて、各プロセッサ
毎に、そのプロセッサに対応する繰り返し制御部分と前記繰り返し計算プログラムとを組合せた部分を含むプログラムを生成することを特徴とするプログラム生成方法。２、物理現象が起こっている空間領域および物理現象を
数値的に解析するための節点および物理現象を数値的に
解くための計算手順の情報を含む問題記述プログラムか
ら、並列計算機上で上記物理現象のシミュレーションを
行う並列計算機用プログラムを生成するプログラム生成
方法であって、（ａ）空間領域を分割して並列計算機の各プロセッサに
割り付け、（ｂ）各プロセッサに割り付けた領域毎に、その領域内
の各節点における計算の種類を判定して同じ種類の計算を行う節点同士を組とし、（ｃ）各組の節点を指すインデックスにより繰り返し制
御情報を生成し、（ｄ）計算の種類に応じた繰り返し計算プログラムを生
成し、（ｅ）各プロセッサ毎に、そのプロセッサに対応する繰
り返し制御情報と前記繰り返し計算プログラムとを組合せた部分を含むプログラムを生成することを特徴とするプログラム生成方法。３、繰り返し制御部分が、各組の節点インデックス範囲
の下限値を示す変数と、上限値を示す変数とを含むこと
を特徴とする請求項１のプログラム生成方法。４、空間領域内の各節点における計算の種類を判定して
同じ種類の計算を行う節点が集合している領域に分割し
、その分割した領域と各プロセッサに割り付けた領域の
交わりをとることにより、各プロセッサに割り付けた領
域毎における節点同士の組を得ることを特徴とする請求
項２または請求項３のプログラム生成方法。５、処理を行う範囲および処理を行う単位および処理の
内容の情報に基づいて、処理を行う範囲を複数のプロセ
ッサに分割し、各プロセッサが担当する範囲に含まれる
処理の単位毎に処理の内容に応じた計算を各プロセッサ
に行わせるプログラムを生成するプログラム生成方法で
あって、（ａ）計算の中の一つの式に対応するプログラム部分を
実行する際に必要となり且つ他のプロセッサから転送されることが必要なデータを、式毎に抽出し、（ｂ）前記計算の中の一つの式に対応するプログラム部
分を実行するより先に前記データを得るためのプロセッサ間通信を実行するプログラム部分を生成することを特徴とするプログラム生成方法。６、物理現象が起こっている空間領域および物理現象を
数値的に解析するための節点および物理現象を数値的に
解くための計算手順の情報を含む問題記述プログラムか
ら、並列計算機上で上記物理現象のシミュレーションを
行う並列計算機用プログラムを生成するプログラム生成
方法であって、（ａ）計算手順の中の一つの式に対応するプログラム部
分を実行する際に必要となり且つ他のプロセッサから転送されることが必要なデータを、式毎に抽出し、（ｂ）前記計算手順の中の一つの式に対応するプログラ
ム部分を実行するより先に前記データを得るためのプロセッサ間通信を実行するプログラム部分を生成することを特徴とするプログラム生成方法。７、各プロセッサの全受信データにその受信データが定
義された節点の位置関係を基に通し番号を付け、その通
し番号をプロセッサ間通信でデータ識別子として用いる
ことを特徴とする請求項６のプログラム生成方法。８、受信データの定義された節点のインデックスの下限
値、上限値およびデータ識別子の代表値を格納する配列
の宣言部と、送信データの定義された節点のインデックスの上限値、下限値および送信データ識別子の代表値お
よび送信先プロセッサ番号を格納する配列の宣言部と、上記配列に値を設定する値設定部と、上記配列を引数としてデータ転送サブルーチンを呼び出すサブルーチン呼出部とを、プロセッサ間通信を実行するプログラム部分として
生成することを特徴とする請求項７のプログラム生成方
法。９、データ転送サブルーチンが、データの定義された節
点のインデックスと引数の配列の値とからデータ識別子
を算出することを特徴とする請求項８のプログラム生成
方法。１０、処理を行う範囲および処理を行う単位および処理
の内容およびプロセッサ割り付け指定の情報に基づいて
、処理を行う範囲を複数のプロセッサに分割し、各プロ
セッサが担当する範囲に含まれる処理の単位毎に処理の
内容に応じた計算を各プロセッサに行わせるプログラム
を生成するプログラム生成方法であって、（ａ）プロセッサ割り付け指定にしたがって処理を行う
範囲を分割して複数のプロセッサに割り付け、（ｂ）各プロセッサに割り付けた範囲毎に、その範囲内
の処理の単位における処理の内容に対応する計算の種類を判定して同じ種類の計算を行う単位同士を組とし、（ｃ）各組の各単位を指すインデックスにより繰り返し
制御情報を生成し、（ｄ）計算の種類に応じた繰り返し計算プログラムを生
成し、（ｅ）前記繰り返し制御情報に基づいて、各プロセッサ
毎に、そのプロセッサに対応する繰り返し制御部分と前記繰り返し計算プログラムとを組合せた部分を含むプログラムを生成することを特徴とするプログラム生成方法。１１、物理現象が起こっている空間領域および物理現象
を数値的に解析するための節点および物理現象を数値的
に解くための計算手順およびプロセッサ割り付け指定の
情報を含む問題記述プログラムから、並列計算機上で上
記物理現象のシミュレーションを行う並列計算機用プロ
グラムを生成するプログラム生成方法であって、（ａ）プロセッサ割り付け指定にしたがって空間領域を
分割して並列計算機の各プロセッサに割り付け、（ｂ）各プロセッサに割り付けた領域毎に、その領域内
の各節点における計算の種類を判定して同じ種類の計算を行う節点同士を組とし、（ｃ）各組の節点を指すインデックスにより繰り返し制
御情報を生成し、（ｄ）計算の種類に応じた繰り返し計算プログラムを生
成し、（ｅ）前記繰り返し制御情報に基づいて、各プロセッサ
毎に、そのプロセッサに対応する繰り返し制御部分と前記繰り返し計算プログラムとを組合せた部分を含むプログラムを生成することを特徴とするプログラム生成方法。１２、物理現象が起こっている空間領域および物理現象
を数値的に解析するための節点および物理現象を数値的
に解くための計算手順およびプロセッサ割り付け指定の
情報を含む問題記述プログラムから、並列計算機上で上
記物理現象のシミュレーションを行う並列計算機用プロ
グラムを生成するプログラム生成方法であって、（ａ）プロセッサ割り付け指定にしたがって計算手順の
中の独立に実行可能な複数の式に並列計算機の各プロセッサを割り付けるとともに、空間領域を分割して並列計算機の各プロセッサに割り付け、（ｂ）各プロセッサに割り付けた領域毎に、その領域内
の各節点における計算の種類を判定して同じ種類の計算を行う節点同士を組とし、（ｃ）各組の節点を指すインデックスにより繰り返し制
御情報を生成し、（ｄ）計算の種類に応じた繰り返し計算プログラムを生
成し、（ｅ）前記繰り返し制御情報に基づいて、各プロセッサ
毎に、そのプロセッサに対応する繰り返し制御部分と前記繰り返し計算プログラムとを組合せた部分を含むプログラムを生成することを特徴とするプログラム生成方法。