JPH0444181A

JPH0444181A - 並列変換処理方法

Info

Publication number: JPH0444181A
Application number: JP15162490A
Authority: JP
Inventors: Yukisuke Sakota; 迫田　行介; Akira Muramatsu; 晃村松; Ikuo Yoshihara; 郁夫吉原
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1990-06-12
Filing date: 1990-06-12
Publication date: 1992-02-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は逐次処理計算機用のソースプログラムを並列計
算機で実行できるプログラムに変換して実行する並列処
理方法に係り、特に数値計算によるシミュレーションプ
ログラムの並列実行に好適な並列処理方法に関する。

［従来の技術］文献（］、）　Ｎ、　Ｅ、　Ａｂｅｌ　ｅｔ　ａｌ：ＴＲＡ
ＮＱＵ　Ｉ　Ｌ　：　Ａｌａｎｇｕａｇｅ　ｆｏｒ　ａ
ｎ　ａｒｒａｙ　ｐｒｏｃｅｓｓｉｎｇ　ｃｏｍｐｕｔ
ｅｒ；Ａ　Ｆ　Ｉ　Ｐ　　Ｓ　Ｊ　ＣＣ、ｐｐ、５７−
７３．１９６９゜（２）　　Ｒ，Ｅ　、　　Ｍｉｌｌｓ
ｔｅｉｎ　　Ｃｏｎｔｒｏｌ　　５ｔｒｕｃｔｕｒｅｓ
ｉｎ　　ｌ１ｌｉａｃ　　ＩＶ　　ＦＯＲＴＲＡＮ；Ｃ
，ＡＣＭ、１６１０、ｐｐ、６２１−６２７．１９７３
゜（３）国政、大沢、相離、用合：格子状接続並列計算
機のためのプログラミング言語ＰＬＡＩＮ；情処研報、
８６−８２．８６−ＮＡ−１９，数値解析１９３．１９
８６．１２゜５、（４）斎藤、他：分散型共有メモリのためのＦＯＲＴＲ
ＡＮインターフェイス；情報処理学会第３８目金国大会講演論文集（ＴＴＩ）　
ＰＰ、１４８０−１４８１゜（５）村岡洋−：並列処理
；昭晃堂、ソフトウェア講座３７、ｐｐ、１３４−１５４　、昭和
６１年４月１０日（１９８６）。

（６）中田育男：コンパイラ；産業図書、コンピュータ
サイエンス・ライブラリーｐｐ、２５７−２５８、昭和
５６年９月ｌＯ日（１９８１）。

（７）「プログラムの部分計算法」電気通信学会誌、第
８６巻２号、ρｐ、１５７〜１６５（昭和５８年２月号
）（８）演中、他：並列計算機Ｈ２Ｐのシステム構成；
情報処理学会第３８目金国大会講演論文集（ｍ）ｐｐｌ
、４８６−１４８７゜（９）申越、他：並列計算機Ｈ２Ｐのプロセッサ間同期
データ転送方式；情報処理学会第３８口金国大会講演論文集（ｍ）　ｐｐ、１４８８１
４８９゜（１０）岩澤、他：並列プロセスＦＯＲＴＲＡＮ言語と
処理系；情報処理学会第３８目金国大会講演論文集（ｍ
）　ｐｐ、１４９０−１４９１゜（１１）ＨＩＴＡＣプ
ログラムプロダク１へＶＯ３２／ＶＯ３３最適化ＦＯＲ
ＴＲＡＮ７７言語文法書；　８０８０−３−２５７−０
１、ｐｐ、６４−６５゜複数の要素プロセッサ（以下Ｐ
Ｅと略す）をその構成要素とする並列計算機、特に文献
（８）にあるような、各ＰＥが局所メモリを持ち、共有
メモリはないか、あるいはあってもそのアクセスが局所
メモリより遅いような疎結合型（分散メモリ型）並列計
算機は、従来の逐次型計算機とは異なり、文献（９）に
あるような、ＰＥ間の通信機能および同期処理機能を有
し、そのため、並列計算機用のプログラムは、並列計算
機の構成、ＰＥ間の通信方法および同期方法を意識して
設計する必要がある。そして、並列計算機固有の機能を
記述するためにプログラミング言語を従来の逐次処理用
の言語に対して通信処理や同期処理を行うための機能を
拡張している。この例としては、文献（１０）、（１）
、（２）、（３）がある。

本発明の対象とする並列化変換処理は、文献（４）に記
載されているような、通常の逐次処理用の計算機プログ
ラムを入力し、並列計算機用のプログラムに自動変換す
るものである。

疎結合並列計算機用の自動並列化変換処理では、逐次処
理プログラムを入力し、その中で宣言されている並列デ
ータ（全体配列と呼ぶことにする）を部分配列データ（
部分配列と呼ぶこと番コする）に分割し、各ＰＥにその
部分配列を割付け、続いて全体配列を処理する繰り返し
ループを解析し、繰り返しループ内の計算式間のデータ
の参照・依存関係を考慮してループを分割して各ＰＥで
分担し、並列実行するようなＰＥ用のプログラムと、そ
のＰＥプログラムを制御するホストプログラムを出力す
る。並列処理計算機のためのコンパイラ一般については
、例えば文献（５）に述べられている。

一般に、プログラムを汎用化するために、配列の大きさ
、式のパラメータ、係数などを変数としておき、実行時
に入力文で入力するように作ることが多いが、並列化変
換処理にとって効率よいプログラムを生成するのを妨げ
る要因となる。疎結合並列計算機で効率良く並列実行で
きるかどうかは、変換前の逐次処理プログラム内の全体
配列への参照を、ＰＥ用のプログラム内の部分配列への
効率良い参照に変換できるかどうかによる。従って、コ
ンパイル時に繰り返しループの制御変数の初期値、終値
、増分が確定している方が部分配列への参照方法が簡単
になり、効率の良いプログラムに変換できる可能性が高
い。コンパイル時に変数の値を確定させる従来技術には
、以下のものがある。

文献（１１）に記載されているように、ＦＯＲＴＲＡＮ
プログラミング言語のパラメータ文は、コンパイル時に
計算する機能であるが、既に入力データにより確定する
ようになっている場合には、パラメータ文を組み込むた
めのプログラムの改造が必要になり、また、複雑な計算
をして値を確定する場合にはパラメータ文は利用できな
い。

定数伝播技術は、文献（６）に記載されているように、
コンパイラの最適化手法の１つで、コンパイル時にプロ
グラム中の定数で与えられたデータのみでユニークに確
定する変数の値を確定し、さらにその値を次々に伝播し
ていくことにより、より確定した部分を増やし、その結
果として最適化効果を高め、効率の良いオブジェクトに
コンパイルする方法である。しかし、入力データにより
確定する変数については効果がない。

部分実行手法は、文献（７）に記載されているように、
プログラムに入力データの一部を与え、それにより実行
可能な部分を実行し、プログラムをより簡約化し、効率
の良いプログラムに変換する方法であるが、文献（７）
にはプログラム内の繰り返しループの部分を各ＰＥが分
担して実行するＰＥ用のプログラムを出力とするような
並列化変換に対して、あるいはＰＥ用のプログラムとホ
ス１−プロセッサ用のプログラムの両方を出方するよう
な変換に対しては言及されていない。

［発明が解決しようとする課題〕上記従来技術では、汎用化のためやプログラムし易さの
点から、本来は定数でよいデータも変数で扱うようにし
ている。そのため逐次処理プロクラムから効率の良い並
列Ｒ１算機用並列プログラムが生成できないという問題
があった。

例えば、第８図（ａ）に示すＦＯＲＴＲＡＮプログラム
で、文５０６と文５０７は、配列Ａの要素にその要素の
添字の値を代入する繰り返しループであるが、その繰り
返しループの範囲は文５０４の入力文でこのプログラム
の外部から与えられている。このプログラムを並列計算
機で実行する場合、第１０図に示すように、ＰＥＩにＡ
　（１）　。

Ａ　（５）、Ａ　（９）、Ａ　（１３）の４つのデータ
を要素とする部分配列ＰＡ３０１を割付け、以下同様に
して、ＰＥ４にはＡ　（４）　、　Ａ　（８）　、　Ａ
（１２）　、　Ａ　（１，６）を要素とする部分配列Ｐ
Ａ３０４を割付ける。ホストプログラムは第８図（ｄ）
の文５３１から文５３６に示すごと＜ＰＥプログラムを
制御し、一方、ＰＥプログラムは第８図（ｅ）の文７４
４から７４８に示すごとく、全体配列Ａの添字である■
（以下全体添字と呼ぶ）の繰り返し範囲Ｍ１．．Ｍ２か
ら、部分配列ＰＡの添字である変数Ｊ（以下部分添字と
呼ぶ）の繰り返し範囲（初期値Ｎ１、終値Ｎ２）を計算
して求める文群が必要になり、効率のよい並列プロクラ
ムを生成することができない。ここでは繰り返し範囲の
増分値を１としたが、この増分値も変数Ｍ３で与えられ
ている場合は、繰り返し範囲Ｅｌ、Ｅ２を計算して求め
る文群はもつと複雑な効率の悪いものになる。

従って、本発明の目的は、上記従来技術の問題点を解決
し、既存の逐次処理言語プログラムに対しても、効率良
い並列プログラムが生成できるような自動並列変換処理
方法を提供することにある。

［課題を解決するための手段］上記目的を達成するため、本発明の並列処理方法は、そ
の基本構想として、単一の処理装置により実行するため
の第１のプログラム（逐次処理言語プログラム）を入力
とし、この第１のプログラムを並列処理のための第２の
プログラム、すなわち、第１のプログラム内の繰り返し
ループ部分を複数の処理装置（ＰＥ）が分担して実行す
る第２のプログラム（ＰＥプログラム、並列プログラム
）に変換する（並列化変換を行う）に当り、入力した第
１のプログラム中の予め実行すべきプレ実行範囲を確定
して置き、この確定したプレ実行範囲を実行することに
よって、その後の並列化変換を行う際に参照される変数
を定数値に置き換えるように構成したことを特徴とする
。

具体的には、本発明は、第１のプログラム（逐次処理言
語プログラム）を入力とし、この第１のプログラム内の
繰り返し部分を第１の各処理装置（各ＰＥ）が分担して
実行する第２のプログラム（ＰＥプログラム）、および
、これらの第２のプ０グラム全体を統括して制御する第
２の処理装置（ホストプロセッサ）が実行する第３のプ
ログラム（ホス１−プログラム）を出力する（プログラ
ムの並列化変換を行う）が、その際に、入力したプログ
ラム中の予め実行すべきプレ実行範囲を確定しておき、
その確定したプレ実行範囲を実行し、その後、プレ実行
範囲外で参照されている変数でその値がプレ実行直後に
確定しており、かつ、この変数がプレ実行範囲外で再定
義されることが変数の定義参照関係を解析することによ
り確認されているとき、この変数を参照する代りに、こ
の変数の持つ値（定数）で置き換えたものを参照して並
列変換するように構成したことを特徴とする。

［作用］上記構成に基づく作用を説明する。

本発明によれば、プレ実行をすることによって、並列化
変換の際に並列処理効率を低下させる変数の値を確定し
、定数として扱えるようにしたので、効率の良い並列化
プログラムを生成することができるようになる。

例えば、第８図（ｅ）のプログラムにおいて、プレ実行
により変数Ｍｌ、Ｍ２の値が確定し、Ｍｌ−４，Ｍ２＝
１６であることが分かれば、ＰＥのプログラムは、第８
図（ｃ）のように、効率良いものにすることができる。

多くの場合Ｍｌ、Ｍ２゜Ｍ３は単純な定数値がプログラ
ムの初期化処理で設定されることが多く、その値が並列
変換時に分かつていれば効率の良い並列プログラムに変
換できることが期待できる。

［実施例コ以下に、本発明の一実施例を図面により説明する。

第１図は本発明の対象の１つとして好適な疎結合（メモ
リ分散型）並列計算機の例である。ホストプロセッサ１
はホスト処理装置２、ホス１〜メモリ３とからなり、外
部記憶装置４及び制御装置５と接続されている。要素プ
ロセッサ（以後ＰＥと略す）群１１〜１４は各々要素プ
ロセッサ処理装置２１〜２４および要素プロセッサメモ
リ３１〜３４からなり、制御装置５を介してホス１−プ
ロセツサ１と接続され、さらに相互通信網６によりＰＥ
間相互に通信可能である。

このような並列計算機システムで並列化変換コンパイラ
を用いて、逐次型言語で書いたプログラムを並列実行す
る方法の１つを第２図に示す。ホストプロセッサの制御
プログラム１００〜１０３では、先ずステップ１０１で
並列化変換コンパイラ１１０〜１１３をホストメモリに
ロードし、起動する。起動された並列化変換コンパイラ
はステップ１１１で並列化変換処理を実行し、ステップ
１１２で、並列化変換されたホストプログラムとＰＥプ
ログラムをコンパイルして外部記憶装置４に格納し、制
御をホストプロセッサの制御プログラムに戻す。

並列化変換コンパイラにおけるデータの流れを第３図に
示す。第３図のステップ１１１では、外部記憶装置４に
格納しである逐次処理言語で書いたオリジナルソースプ
ログラム４０１と実行時に必要な入力データ４０２を入
力し、並列化変換処理を実行し、ホス１−プログラム４
．０３とＰＥプログラム４０４を外部記憶装ｗ４に出力
する。続いて、ステップ１１４と１１５で、ホストプロ
グラム４０３とＰＥプログラム４０４を入力し、コンパ
イルし、それぞれのオブジェクトプログラム４０５と４
０６を外部記憶装置４に出力する。さらに、ステップ１
１６と１１７で、それぞれのオブジェクトプログラム４
０５と４０６を入力し、それぞれのオブジェクトライブ
ラリとリンクし、それぞれのロードモジュール４０９と
４１０を出力する。

第２図に戻り、ホストプロセッサの制御プログラムはス
テップ１０２でホスＩ・プログラム１２１〜１２４をホ
ストメモリにロードし、起動する。

ホストプログラムは、ステップ１２２でＰＥプログラム
１３１〜１３３を各要素プロセッサメモリにロードし、
起動する。ＰＥプログラムは並列に計算を実行し、終了
するとホス１−プロセッサに完了信号を送る。ホストプ
ロセッサは全ＰＥでのＰＥプログラムの完了を待って、
制御をホス１−プロセッサの制御プログラムに戻し、ス
テップ１０３で終了する。

次に、並列化変換コンパイラのステップ１１１で、第８
図（ａ）に示すＦＯＲＴＲＡＮプログラム（並列化変換
処理を施す前のソースプロクラムとして示す）について
の並列化変換処理を、第４図の並列化変換処理２００〜
２０８で説明する。

先ず、ステップ２０１で１よ、入力のオリジナルソース
プログラム５０１〜５０８を構文解析する。

文５０１は、プレ実行することを指示するプレ実行開始
指示文で、これを確認すると、第７図（プレ実行制御の
ためのデータ）のプレ実行フラグ９１をオンにする。文
５０２と５０８は、この範囲が１つのプログラムＥＸで
あることを示す文であり、プログラム名を第５図（構文
解析処理で生成する名前表およびデータ領域の構成図）
の名前表４０の名前文字列４１に、名前種別をプログラ
ム名として登録する。文５０３は１６個の要素データを
持つ配列Ａを宣言する文で、第５図に示す名前表４０、
および各変数に対応したデータ領域をホストメモリ内に
割付ける。第５図の名前表は、１つの名前に対応して１
つのエントリが作られる。各エントりは名前文字列４１
、名前の種別（プログラム名とか変数名の区別。変数名
の場合には、さらに変数のデータ型や精度）４２、変数
が配列の場合の次元数４３、配列のとき、各次元のサイ
ズ４４〜４６、変数に割り付けたデータ領域のアドレス
４７、定義済みフラグ４８からなる。文５０４は外部か
らデータを読み込み変数Ｍ１とＭ２の値を定義する入力
文である。また、文５０５は、プレ実行の終了を指示す
るプレ実行終了指示文で、これを確認すると、第７図の
プレ実行範囲ポインタ９２にその指示文の文表のアドレ
スをセットする。文５０６はループ制御変数工の初期値
を変数Ｍ１の値、終値を変数Ｍ２の値、増分値を値１と
し、以後文５０７までを繰り返すことを制御するＤｏ文
、文５０７は、その繰り返しループの本体で、配列Ａの
第１番目の配列要素に変数１の値を代入する代入文であ
る。

第６図は構文解析処理で生成する文表の構成と中間語の
例を示す図で、プレ実行する前の状態を示している。同
図で文表５１にはソースプログラムの各文に対応したエ
ントリ５２．５３があり、各文を内部表現で構成した中
間語５４．５５のアドレスを保持している。中間語５４
は第８図（ａ）のＤＯ文５０６の中間語である。中間語
の要素６１はこの中間語が００文であることを示し、以
下、６２はＤ○ループ範囲、６３は制御変数、６４は初
期値、６５は終値、６６は増分値、への各ポインタであ
り、６７から７４はその実体であり、それぞれ変数か定
数かの区別を行うと共に、変数のときは名前表へのポイ
ンタ、定数のときは定数値そのもので表わしている。中
間語表５５は第８図（ａ）の代入文５０７の中間語であ
る。中間語の要素７５〜７７は代入文であることの印と
、その左辺と右辺の中間語への各ポインタである。同様
に要素７８〜８０は代入先が配列要素の形式であること
の印と、配列と、その添字への各ポインタからなる。８
１〜８６は変数であることの印と名前表へのポインタで
ある。

文５０８を認識すると構文解析処理２０１を終了する。

ステップ２０２では、プレ実行フラグ９１をチエツクし
、オンであればステップ２０３を実行し、オンでなけれ
ばステップ２０３をスキップする。

ステップ２０３では、文人５１の先頭のエントリのアド
レスをプレ実行文ポインタ９３に設定し、以後プレ実行
文ポインタの指す文人エントリが指す文の中間語を解釈
実行する。この時、入力文、代入文などの変数の値を定
義する文であれば、その変数に対応したデータ領域４９
（第５図）のデータの値の変更を伴い、かつ名前表の定
義済みフラグ４８をオンにし、またプレ実行文ポインタ
９３を次に解釈実行すべき文の文人５１のエントリのア
ドレスに変更していく。そして、プレ実行文ポインタ９
３の値が、プレ実行範囲ポインタ９２の値に等しくなっ
たとき、プレ実行処理２０３を終了する。

ステップ２０４では、プレ実行範囲ポインタ９２が指す
文人のエントリの次のエントリが指す文の中間語から順
に、最後のエントリが指す文の中間語まで走査し、その
中間語内に現れた変数に対し、その変数に対する名前表
の定義済みフラグ４８がオンであり、かつプレ実行終了
指示文から、全定数置換処理が対象としている文までの
、すべての実行経路でその変数の値がどの文でも再定義
されず、また、外部手続き呼び出しの引き数などになっ
て再定義されるような可能性もない場合に限り、その変
数の参照を定義されている定数の参照に変更する。第９
図はプレ実行後の文人の構成と中間語の例を示す構成図
である。第９図を第６図と比べると、例えば、第６図の
６９〜７２の変数Ｍ１と変数Ｍ２の参照はそれぞれ第９
図の６９〜７２の定数１と定数１６の参照となる。

ステップ２０５では、文人５１、中間語５４゜５５、名
前表４０等を用いて、第８図（ｂ）のホストプログラム
５１１〜５１５と同図（ｃ）のＰＥプログラム５２１〜
５２７を生成する。実際にはそれぞれのプログラムに対
応する文人、中間語、名前表を新たに作成するが、以下
の説明は、分かり易さのために、そのソースプログラム
イメージで行うものとする。

ここでは、元のプログラム５０１〜５０８を４台のＰＥ
で分担して実行する場合を考える。まず、第１０図に示
すように配列Ａ３００を分散割付けし、ＰＥＩにＡ　（
１）　、　Ａ　（５）　、　Ａ　（９）　、　Ａ（１３
）の４つのデータを要素とする部分配列ＰＡ３０１を割
付け、以下同様にして、ＰＥ４にはＡ　（４）　、　Ａ
　（８）　、　Ａ　（１２）　、　Ａ　（１６）を要素
とする部分配列ＰＡ３０４を割付ける。

ホストプログラムは第８図（ｂ）に示すごとく文５１１
から文５１５までのプログラムとなる。文５１２はＰＥ
プログラムＰＥＸを各ＰＥの局所メモリにロードする文
、文５１３は各ＰＥにロードされたＰＥプログラムＰＥ
Ｘを起動する文、文５１４は全ＰＥプログラムの実行が
完了するのを待つ全同期処理文である。

一方、ＰＥプログラムＰＥＸは第８図（ｃ）に示すごと
く、文５２１から文５２７までのサブルーチンとなる。

文５２１はＰＥプログラムの入口であることを示す文、
文５２２は部分配列ＰＡをＰＥメモリ上に割り付けるた
めの文、文５２３は各ＰＥが自分のＰＥ番号を求めて変
数ＭＹＰＥに設定するための文である。ＭＹＰＥＮＵＭ
　（）は自ＰＥ番号を取りだすためのシステムに用意し
である関数であり、各ＰＥがハードウェア回路などで実
現してあり、通常の並列計算機システムでは必ず備えて
いる機能である。

文５２４は部分配列に対して繰り返しループを制御する
文、文５２５は部分配列に代入する代入文である。ここ
で、変数Ｊは部分配列ＰＡの添字であるので部分添字と
呼び、これに対して全体配列Ａの添字である■を全体添
字と呼ぶことにする。

全体添字の制御変数の初期値と終値と増分値が分かつて
いるので、部分添字の制御変数の初期値と終値と増分値
は容易に求めることができる。また、全体添字Ｉから部
分添字Ｊを含む式に変換したものが文５２５の代入文の
右辺の式である。

ステップ２０６では、第８図（ｂ）５１１〜５１５に相
当する中間語から、そのソースプログラムに変換しく一
旦、ソースプログラムまで戻し）、外部記憶装置４に出
力する。

ステップ２０７では、第８図（ｃ）　５２１〜５２７に
相当する中間語から、そのソースプログラムに変換しく
一旦、ソースプログラムまで戻し）、外部記憶装置４に
出力する。

ちなみに、本発明を適用しない場合には、ポストプログ
ラムは第８図（ｄ）に示すごとく文５３１から５３６ま
でとなり、特に文５３２のＲＥＡＤ文が必要になり、Ｐ
Ｅプログラムで部分添字を計算２するためにＭｌとＭ２
を文５１４のＰＳＴＡＲＴ文の引き数でＰＥプログラム
に渡す必要があり、また、ＰＥプログラムＰＥＸは第８
図（ｅ）に示すごとく、文７４１から文７５２までのサ
ブルーチンとなる。文７４２は引き数Ｍｌ、Ｍ２がホス
トメモリ上に割り付けられている変数であることをコン
パイラに教えるための文、文７４３は部分配列ＰＡをＰ
Ｅメモリ上に割り付けるための文である。全体添字の制
御変数の初期値Ｍ１と終値Ｍ２が変数のままであるので
、文７４５から文７４８までの全体添字の制御変数の初
期値Ｍ１、終値Ｍ２と自ＰＥ番号ＭＹＰＥから部分添字
の制御変数の初期値Ｎ１、終値Ｎ２を計算するための文
群が必要になる。ここで、文７４５の変数ＩＰには配列
要素Ａ（Ｍｌ）が割り付けられたＰＥのＰＥ番号（１〜
４）が求まり、文７４６の変数ＩＸには全体配列Ａの全
体添字がＭ１以上の要素の内、自ＰＥに割り付けられた
要素の最小の全体添字が求まる。

これに対し、本発明によるプレ実行を行うことにより、
第８図（ｂ）　ｌ　（Ｃ）で説明したように、効率の良
い並列プログラムが生成できるようになる。

さらに、本発明を適用しないで、繰り返しループの制御
変数の増分値も変数（Ｍ３とする）で与えられていると
きには、この全体添字の制御変数の初期値Ｍ１、終値Ｍ
２、増分値Ｍ３と自ＰＥ番号ＭＹＰＥから部分添字の制
御変数の初期値Ｅ１、終値Ｅ２、増分値Ｅ３を計算する
ためのさらに複雑な文群が必要になり５本発明を適用し
た場合の効果がさらに大きいことが容易に推測できる。

本発明では、分散メモリ型並列計算機システム用の、通
常の逐次処理プログラムから並列処理プログラムに並列
化変換するプリプロセッサ等の処理において、ソースプ
ログラム中に変数が与えられ、その値が外部からのデー
タ入力文あるいはプログラム内で複雑な計算処理により
確定される場合にも、プレ実行することにより、並列化
変換時にそれらの変数を定数値として扱えるようになる
ため、効率良い並列プログラムに並列化変換することが
可能になる。したがって、本発明は、次の第１１図に示
すようなソースプログラムに対しても実行効率の高い並
列プログラムを生成することができるようになる。

第１１図（ａ）　５５１〜５５８に示すようなプログラ
ムＥＹで、文５５３はそれぞれ１６の要素を持つ配列Ａ
と配列Ｂと配列りを宣言する文で、文５５４は外部から
データを読み込み配列りの１６の要素の値を定義する入
力文である。文５５６はループ制御変数工の初期値を値
１、終値を値１６、増分値を値１とし、以後文５５７ま
でを繰り返すことを制御する００文、文５５７は、その
繰り返しループの本体で、配列Ａの第Ｌ　（Ｉ）番目の
配列要素に配列Ｂの第■要素Ｂ　（Ｉ）の値を代入する
代入文である。配列ＡおよびＢをそれぞれ第１２図（ａ
）および同図（ｂ）のように４つのＰＥに分散割付けし
、配列りはホストメモリに割り付けておく。

配列りの各要素の持つ値は、第１２図（ｃ）のようにな
っていたとすると、例えば、■が１のときには、ＰＥＩ
がＢ（１）の値を配列の要素Ａ（Ｌ（１））、即ちＡ（
４）に代入する必要があるが、Ａ（４）はＰＥ４に割り
付けられているため、Ｂ（１）の値をＰＥＩからＰＥ４
に送信し、ＰＥ４はＰＥＩから受信しなければならない
。

配列りの各要素の値が並列化変換時に確定していない場
合には、Ｌの値に依らずに実行できるような文群を生成
する必要がある。

ところが、本発明を適用すれば、第１１図（ａ）の文５
５１でプレ実行することが指定され、文５５５までがプ
レ実行される。この時点で配列りの各要素の値は確定し
、もし、以後配列りの各要素の値が再定義されないこと
が、解析により明らかになれば、より効率の良いＰＥプ
ログラムを生成することができる。例えば、配列りの各
要素の値が、第１２図（ｃ）のように、すへての要素の
値が１から１６の間で、かつ同一値のものが存在してい
ない場合には、各全体添字１から１６までに対して、送
信先と受信先のＰＥは必ずそれぞれ１つずつ存在するこ
とが明らかであるので、例えば第１１図（ｂ）のホス１
−プログラムおよび同図（ｃ）のような効率の良いＰＥ
プログラムが生成できるようになる。

第１１図（ｂ）において、文５６２は配列りと配列ＩＬ
の宣言文であり、文５６４と文５６５は参照関係を示す
配列りの逆の参照関係を示す配列■Ｌの要素の値を定義
する繰り返しループである。

第１２図（ｃ）の参照インデックス配列りに対する逆参
照インデックス配列ＩＬを第１２図（ｄ）に示す。文５
６７は各ＰＥにロードされたＰＥプログラムＰＥＹを、
引き数りとＩＬを渡して起動する文である。また、第１
１図（Ｃ）において、文５７１から文５７３でホストメ
モリ上の配列りとＩＬを引き数として受取り、文５７４
では部分配列ＡとＢが宣言されている。繰り返しループ
５７６から５８０では、まず文５７６で部分添字Ｊに関
する繰り返しループを定義し、文５７７で対応する全体
添字Ｉを求めている。文５７８は全体配列Ａの第ｒ−（
Ｂ要素が割り付けられているＰＥの番号を求める計算を
し、変数ＩＰに代入している文であり、文５７９は部分
配列ＰＢの第Ｊ要素を、全体配列Ａの第Ｌ　（１）要素
が割り付けられているＰＥの通信バッファの第１番目の
エントリに送信する文である。文５８０は全体添字の値
ＩＬ（Ｉ）を持った配列Ｂの要素が割り付けられたＰＥ
から自ＰＥへの送信に対する受信処理を行う文であり、
通信バッファの第１Ｌ　（Ｉ）番目のエントリから部分
配列ＰＡの第Ｊ要素に取り込む。ここで、ＭＯＤ　（Ｌ
　（Ｉ）−１，４）＋１の値がＭＯＤ　（１１，４，）
＋１と等しい場合は、同−ＰＥ内で転送が発生するが、
この暗文５８１は自ＰＥの通信バッファに書き込むもの
とする。

上記実施例では、プログラムに判定文や分岐文を含んで
いないが、これらを含んでいる場合でも、制御の流れを
解析し、また変数の値がどの文で定義され、その値がど
の文で参照されているかを解析することにより、プレ実
行により確定した値がどの実行経路でどの文まで有効か
は、容易に判定することができる。また、その変数が外
部手続き呼び出しの引き数になっている場合には、再定
義されたものとすれば問題はない。

上記実施例では、ステップ２０１で作成した中間語をス
テップ２０３で解釈実行する方法であるが、ステップ２
０３でプレ実行する範囲の中間語をコンパイルし、直接
実行するようにしてもよいことはその目的から明らかで
ある。

プレ実行は、コンパイラで行なってもよいし、インタプ
リタで行なってもよい。

上記実施例では対象とするプログラミング言語としてＦ
ＯＲＴＲＡＮを仮定しているが、ＦＯＲＴＲＡＮ以外の
言語に対しても同様の方法が適用でき、同様の効果が得
られることは容易に類推できる。

本実施例ではプレ実行終了指示文あるいはプレ実行開始
指示文は、コメント形式の文としたが、コメン１−の形
式の文である必要は特にない。

また、プレ実行終了指示文をユーザが指定する代りに、
プログラムを解析し、プログラム全体の中での繰り返し
ループの位置関係と制御の流れを基に確定することも可
能である。つまり、通常の数値シミュレーションプログ
ラムでは、第１３図（数値シミュレーションプログラム
構造図）に示すように、初期化処理６０１に続いて文６
０２〜６０７のような時間の経過を追う時間ステップに
関する大きなシミュレーションループがあり、この中で
いくつかの計算処理６０３〜６０５があり、同じくルー
プ内に中間結果の表示や退避などの中間結果処理６０６
、最後の最終結果出力６０８等からなるのが普通である
。そして初期化処理で確定するデータのうち１問題の大
きさや、構造により決定するデータのほとんどは、以後
のシミュレーションループ本体で変更されることがない
。このことはプログラムのデータフロー解析をすること
で容易に知ることができる。

第１５図は、プレ実行の範囲を自動的に解析するだめの
フローを示し、同図に示すごとく、先ずステップ９０１
でプログラムの実行の流れを解析し、合流分岐を中に含
まない単一の流れを１つのブロックとし、第１４図に示
すようなブロックに関する有向グラフを作成する。第１
４図で、ブロック８０１は入口ブロック、ブロック８１
３は出口ブロックである。次にステップ９０２で、入口
ブロック８０１から順にすべてのブロックをたどり、ル
ープを見つける。ブロック８０３と８０４゜８０５と８
０６，８１０と８１１はループの例である。８０９から
８１２も中にループを持ったループである。次にステッ
プ９０３で、各ループの中のプログラムステップ数と繰
り返し予想回数を掛は算して、ループの実行コス１−（
実行時間に相当）を計算する。繰り返し予想回数として
は、繰り返し数が分かつているものはその値、分からな
いものについては例えば−律１００とする。ステップ９
０４で、すべてのループについて実行コストを求めて、
その内の最大の実行コストを待ったループを１つ選び、
そのループの先頭ブロックを開始ブロックとする。次に
ステップ９０５で、入口ブロックから開始ブロックに至
る、同一ブロックを２度以上通らない任意の１つのパス
を選び、そのパス上のブロックの内、入口ブロックから
出口ブロックに至るすべてのパスが必ず通るブロックを
共通ブロックとする。次にステップ９０６で。

共通ブロックの内、開始ブロックを除き、最も入口ブロ
ックから遠いブロックを最終ブロックとする。最後にス
テップ９０７で、最終ブロックの最後にプレ実行最終指
示文を追加する。ただし、最終ブロックが判定分岐文で
終っている場合はその判定分岐文の前にプレ実行最終指
示文を追加する。

このようにして、プレ実行最終指示文をユーザが指定し
なくても並列化処理プログラムで解析してプレ実行範囲
を決定することが可能である。

上記実施例では、各ＰＥとは別に、ＰＥ全体を統括制御
するホストプロセッサを設けたが、ホストとＰＥを区別
しなくてもよい。

上記実施例で用いた分散メモリ型並列実行計算機に対応
した並列化変換プログラムのみならず、共有メモリ型並
列実行計算機に対応した並列化変換プログラムについて
も同様に実施可能であり、かつ効果が得られることは容
易に類推できる。さらに、ベクトル計算機（スーパコン
ピュータ）や通常の逐次型計算機用のコンパイラについ
ても同様に実施可能であり、かつ効果が得られることも
容易に類推できる。

次に、第１６図ないし第１８図により、本発明の別の構
成の装置による実施例を説明する。

第１６図は本発明の対象の１つとして好適な疎結合（メ
モリ分散型）並列計算機の別の例である。

並列変換処理装置１６００は、ホストメモリ３を持つホ
ストプログラム実行部１６０１、外部記憶装置４及び制
御装置５と接続されている。ＰＥプログラム実実行部上
１１〜１４各々要素プロセッサメモリ３１〜３４を持ち
、制御装置５を介して並列変換処理装置１６００と接続
され、さらに相互通信網６によりＰＥプログラム実行部
間相互に通信可能である。

このような並列計算機システムで並列変換処理装置１６
００を用いて、逐次型言語で書いたプログラムを並列実
行する方法を第１７図に示す。並列変換処理装置１６０
０は、先ず、プレ実行並列化部１７０１で逐次計算機ソ
ースプログラムを入力し、ホスト用ソースプログラム４
０３、ＰＥ用ソースプログラム４０４を出力し、ホスト
プログラムコンパイルリンク部１７ｏ２を起動する。ホ
ストプログラムコンパイルリンク部１７０２は、ホスト
用ソースプログラム４０３をホストロードモジュール４
０９に変換し、ＰＥプログラムコンパイルリン９部１７
０３を起動する。ＰＥプログラムコンパイルリン９部１
７０３は、ＰＥ用ソースプログラム４０４をＰＥロード
モジュール４１０に変換し、ホストプログラムロード部
１７０４を起動する。ホストプログラムロート部１７０
４はホストロードモジュール４０９をホストメモリ３に
ロードし、ＰＥプログラムロード部１７０５を起動する
。ＰＥプログラムロード部１７０５はＰＥロードモジュ
ール４１０を各ＰＥメモリ３１〜３４にロードし、ホス
トプログラム実行部１６０１とＰＥプログラム実行部１
１〜１４を起動する。ホストプログラム実行部１６ｏ１
はホストプログラムを実行し、各ＰＥプログラム実行部
１１〜１４はＰＥプログラムを並列に実行し、ＰＥプロ
グラム実行部１１〜１４は実行を終了するとホス１−プ
ログラム実行部１６０１に完了信号を送り、ホストプロ
グラム実行部１６０１はＰＥプログラム実行部１１〜１
４の完了を待って、並列変換処理装置１６００に制御を
戻し、並列実行処理を終了する。

次に、プレ実行並列化部１７０１で、第８図（ａ）に示
すＦＯＲＴＲＡＮプログラム（並列化変換処理を施す前
のソースプログラムとして示す）についての並列化変換
の動作を第１８図に示す。先ず、第１８図の構文解析部
１８０１で、入力のオリジナルソースプログラム５０１
〜５０８を構文解析する。文５０１はプレ実行すること
を指示するプレ実行開始指示文で、これを認識すると、
第７図（プレ実行制御のためのデータ）プレ実行フラグ
９１をオンにする。文５０２と文５０８は、この範囲が
１つのプログラムＥＸであることを示す文であり、プロ
グラム名を第５図（構文解析処理で生成する名前表およ
びデータ領域の構成図）の名前表４０の名前文字列４１
に、名前種別をプログラム名として登録する。文５０３
は１６個の要素データを持つ配列Ａを宣言する文で、第
５図に示す名前表４０、および各変数に対応したデータ
領域をホストメモリ内に割付ける。第５図の名前表は、
１つの名前に対応して１つのエントリが作られる。各エ
ントリは名前文字列４１、名前の種別（プログラム名と
か変数名の区別。変数名の場合には、さらに変数のデー
タ型や精度）４２、変数が配列の場合の次元数４３、配
列のとき、各次元のサイズ４４〜４６、変数に割り付け
たデータ領域のアドレス４７、定義済みフラグ４８から
なる。

文５０４は外部からデータを読み込み変数Ｍ１とＭ２の
値を定義する入力文である。また、文５０５は、プレ実
行の終了を指示するプレ実行終了指示文で、これを認識
すると、第７図のプレ実行範囲ポインタ９２にその指示
文の文人のアドレスをセラＩ・する。文５０６はループ
制御変数■の初期値を変数Ｍ１の値、終値を変数Ｍ２の
値、増分値を値１とし、以後文５０７までを繰り返すこ
とを制御する００文、文５０７は、その繰り返しループ
の本体で、配列Ａの第１番目の配列要素に変数丁の値を
代入する代入文である。

第６図は、構文解析処理で生成する文人の構成と中間後
の例を示す図で、プレ実行する前の状態を示している。

同図で文人５１にはソースプログラムの各文に対応した
エントリ５２．５３があり、各文を内部表現で構成した
中間語５４．５５のアドレスを保持している。中間語５
４は第８図（ａ）のＤｏ文５０６の中間語である。中間
語の要素６１はこの中間語がＤｏ文であることを示し、
以下、６２はＤｏループ範囲、６３は制御変数、６４は
初期値、６５は終値、６６は増分値、への各ポインタで
あり、６７から７４はその実体であり、それぞれ変数か
定数かの区別を行うと共に、変数のときは名前表へのポ
インタ、定数のときは定数値そのもので表わしている。

中間語表５５は第８図（ａ）の代入文５０７の中間語で
ある。中間語の要素７５〜７７は代入文であることの印
と、その左辺と右辺の中間語への各ポインタである。同
様に要素７８〜８０は代入先が配列要素の形式であるこ
との印と、配列と、その添字式への各ポインタからなる
。８１〜８６は変数であることの印と名前表へのポイン
タである。

文５０８を認識すると構文解析部１８０１の動作を終了
し、プレ実行指示の検出部１８０２を起動する。

プレ実行指示の検出部１８０２では、プレ実行フラグ９
１をチエツクし、オンであればプレ実行処理部１８０３
を起動し、オンでなければ定数置換処理部１８０４を起
動する。

プレ実行処理部１８０３では、文人５ｊの先頭のエン１
−りのアドレスをプレ実行文ポインタ９３に設定し、以
後プレ実行文ポインタの指す文人エントリが指す文の中
間語を解釈実行する。この時、入力文、代入文などの変
数の値を定義する文であれば、その変数に対応したデー
タ領域４９（第５図）のデータの値の変更を伴い、かつ
名前表の定義済みフラグ４８をオンにし、またプレ実行
文ポインタ９３を次に解釈実行すべき文の文人５１のエ
ントリのアドレスに変更していく。そして、プレ実行文
ポインタ９３の値が、プレ実行範囲ポインタ９２の値に
等しくなったとき、プレ実行処理部１８０３の動作を終
了し、定数置換処理部１８０４を起動する。

定数置換処理部１８０４では、プレ実行範囲ポインタ９
２が指す文人のエントリの次のエントりが指す文の中間
語から順に、最後のエントりが指す文の中間語まで走査
し、その中間語内に現れた変数に対し、その変数に対す
る名前表の定義済みフラグ４８がオンであり、かつプレ
実行終了指示文から、全定数置換処理が対象としている
文までの、すべての実行経路でその変数の値がどの文で
も再定義されず、また、外部手続き呼び出しの引き数な
どになって再定義されるような可能性もない場合に限り
、その変数の参照を定義されている定数の参照に変更す
る。第９図はプレ実行後の文書の構成と中間語の例を示
す構成図である。第９図を第６図と比べると、例えば、
第６図の６９〜７２の変数Ｍ１と変数Ｍ２の参照はそれ
ぞれ第９図の６９〜７２の定数１と定数１６の参照とな
る。

定数置換処理部１８０４は処理を終えると、ホストプロ
グラム・ＰＥプログラムの分離・変換処理部１８０５を
起動する。

ホストプログラム・ＰＥプログラムの分離・変換処理部
１８０５は、文人５１、中間語５４，５５、名前表４０
等を用いて、第８図（ｂ）のホストプログラム５１１〜
５１５と同図（ｃ）のＰＥプログラム５２１〜５２７を
生成する。実際にはそれぞれのプログラムに対応する文
人、中間語、名前表を新たに作成するが、以下の説明は
、分かり易さのために、そのソースプログラムイメージ
で行うものとする。

ここでは、元のプログラム５０１〜５０８を４台のＰＥ
で分担して実行する場合を考える。まず、第１０図に示
すように配列Ａ３００を分散割付けし、ＰＥＩにｐ、　
（１）　、　Ａ　（５）　、　Ａ　（９）　、　Ａ（ｊ
３）の４つのデータを要素とする部分配列ＰＡ３０１を
割付け、以下同様にして、ＰＥ４にはＡ　（４）　、　
Ａ　（８）　、　Ａ　（１２）　、　Ａ　（１６）を要
素とする部分配列ＰＡ３０４を割付ける。

ホストプログラムは第８図（ｂ）に示すごとく文５１１
から文５１５までのプログラムとなる。文５１２はＰＥ
プログラムＰＥＸを各ＰＥの局所メモリにロードする文
、文５１３は各ＰＥにロートされたＰＥプログラムＰＥ
Ｘを起動する文、文５１４は全ＰＥプログラムの実行が
完了するのを待つ全同期処理文である。

全体添字の制御変数の初期値と終値と増分値が分かつて
いるので、部分添字の制御変数の初期値と終値と増分値
は容易に求めることができる。また、全体添字■から部
分添字Ｊを含むの式に変換したものが文５２５の代入文
の右辺の式である。ホス１〜プログラム・ＰＥプログラ
ムの分離・変換処理部１８０５の処理を終えると、ホス
トプログラム生成部１８０６を起動する。

ホストプログラム生成部１８０６は、第８図（ｂ）５１
１〜５１５に相当する中間語から、そのホストソースプ
ログラム４０３に変換しく一旦、ソースプログラムまで
戻し）、外部記憶装置４に出力し、ＰＥプログラム生成
部］８０７を起動する。

ＰＥプログラム生成部１８０７は、第８図（ｃ）５２１
〜５２７に相当する中間語から、そのソースプログラム
に変換しく一旦、ソースプログラムまで戻し）、外部記
憶装置４に出力し、処理を終える。

以上の実施例によれば、分散メモリ型並列計算機システ
ム用の、通常の逐次処理プログラムから並列処理プログ
ラムに並列化変換するブリプロセッサ等の処理において
、ソースプログラム中で分散割付けされた配列の添字の
値をきめるデータが変数で与えられていて、並列処理す
る場合に、多大なオーバヘッドを生じる並列プログラム
しか生成出来ないような場合にも、プレ実行することに
より、並列化変換時にそれらの変数を定数値として扱え
るようになるため、効率良い並列プログラムに並列化変
換することが可能になるという効果を奏する。例えば、
全体添字に関するＤｏループの制御変数の初期値、終値
、増分値が変数で与えられている場合、部分添字に関す
るＤｏループの制御変数の初期値、終値、増分値が並列
化変換時に求められ、実行効率のよい並列プログラムに
変換できるようになる。

また、」二連の実施例によれば、例えば、ソースプログ
ラム内のＡ　（Ｌ　（Ｉ）　’）　＝Ｂ　（Ｉ）のよう
な演算を並列実行計算機で実行する場合に、プロセッサ
間の通信負荷の小さな、効率良い並列プロセッサを生成
することが可能になり、特に並列実行計算機で実行させ
る場合には、各種の実行時のオーバヘッドを低減するの
に効果がある。

［発明の効果］以上詳しく述へたように、本発明によれば、逐次処理プ
ログラム（第１プログラム）から並列処理プログラム（
第２プログラム）に並列化変換を行うプロセッサ等の処
理システムにおいて、予め、第１プログラム中のプレ実
行範囲を確定して該プレ実行範囲を実行することによっ
て、並列化変換を行う際に、変数として参照する代りに
その変数の持つ値で置き換えた定数として参照すればよ
いので、きわめて効率の良い並列化プログラムを効率よ
く生成できるという効果を奏する。

【図面の簡単な説明】

第１図は本発明の一実施例の分散メモリ型並列実行計算
機システムの全体構成図、第２図は本実施例における並
列計算処理の全体の手順を示す流れ図、第３図はデータ
の流れの関係に対応した並列化変換コンパイラの手順を
示す流れ図、第４図は並列化変換コンパイラの並列化変
換処理の手順を示す流れ図、第５図は構文解析処理で生
成する名前表の構成とデータ領域を示す図、第６図は構
文解析処理で生成する文人の構成と中間語の例を示す図
、第７図はプレ実行を制御するデータの構成図、第８図
は本実施例の入力となるソースプログラムの例を示す図
、第９図は定数置換を施した結果の中間語の例を示す図
、第１０図はデータ要素の配列を分散割り付けした例を
示す図、第１１図は本実施例の入力となるソースプログ
ラムの別の例を示す図、第１２図は配列を分散割り付け
した例と参照インデックス配列および逆参照インデック
ス配列の例を示す図、第１３図は数値シミュレーション
プログラムの構造図、第１４図はブロツクの有向グラフ
の例を示す図、第１５図はプレ実行の範囲を自動的に解
析する手順を示す流れ図、第１６図は本発明の他の実施
例の分散メモリ並列実行計算機システムの全体構成図、
第１７図は第１６図の実施例におけるデータの流れに対
応した並列化変換コンパイラの手順を示す流れ図、第１
８図は第１７図の並列化変換コンパイラの並列化変換処
理の手順を示す流れ図である。１　　ホストプロセッサ、１１〜１４・・・・・・要素
プロセッサ（ＰＥ）、１．ＯＯ〜１０３・・・・・ホス
トプロセッサの制御プログラム、１１０〜１１７・・・
・並列化変換コンパイラ、１２１〜１２４　・・・ホス
トプロクラム、１３１〜１３３・・　ＰＥプログラム、
２００〜２０８・・・・並列化変換処理、４０名前表、
４９・・・・・・データ領域、５１・・−・文人、５４
〜５５・　・中間語、９１〜９３・・・　プレ実行を制
御するデータ、５０１〜５０８・・・・入力プログラム
、５１１〜５１５・・・・・・並列化変換のホストプロ
グラム、５２１〜５２７・・・本発明適用時のＰＥプロ
グラム、５３１〜５３６・・・・本発明非適用時のホス
トプログラム、７４１〜７５２・・・・・本発明非適用
時のＰＥプログラム。

Claims

【特許請求の範囲】１、１つの処理装置のみで実行するための第１のプログ
ラムから、該第１のプログラム中に存在する繰り返しル
ープ処理を複数の処理装置で分担して実行する第２のプ
ログラムに変換し、前記複数の処理装置に前記第２のプ
ログラムを供給する並列化変換ステップを備えた並列処
理システムにおいて、前記並列化変換ステップは、少な
くとも、前記第１のプログラム中の予め実行すべきプレ
実行範囲を確定する確定ステップと、前記確定ステップ
で確定した第１のプログラム中のプレ実行範囲を実行す
るステップと、変数の値の定義参照関係を解析するステ
ップと、前記プレ実行後に前記第１のプログラム中でか
つ前記プレ実行範囲外において参照されている変数につ
いて、この変数の値が前記プレ実行直後に確定しており
、かつ、前記第１のプログラム中の前記プレ実行範囲以
後の定義でこの変数の値が再定義されることがないこと
が前記解析ステップにより確認されているとき、この変
数に代えて、この変数の持つ値として定義されている定
数を参照する定数置換ステップとを備えたことを特徴と
する並列処理方法。２、各々局所メモリを持ち相互結合網により互いに結合
された複数の第１の処理装置と、前記複数の処理装置に
接続され前記複数の処理装置の動作を制御する第２の処
理装置とからなり、１つの処理装置のみで実行するため
の第１のプログラムから、該第１のプログラム中に存在
する繰り返しループ処理を前記複数の第１の処理装置で
分担して実行する第２のプログラムと、前記複数の第１
の処理装置の繰り返しループ処理の実行を制御する第３
のプログラムとに変換し、前記複数の第１の処理装置に
前記第２のプログラムを供給すると共に前記第２の処理
装置に前記第３のプログラムを供給する並列化変換ステ
ップを備えた並列処理システムにおいて、前記並列化変
換ステップは、少なくとも、前記第１のプログラム中の
予め実行すべきプレ実行範囲を確定する確定ステップと
、前記確定ステップにより確定した第１のプログラム中
のプレ実行範囲を実行するステップと、変数の値の定義
参照関係を解析するステップと、前記プレ実行後に前記
第１のプログラム中でかつ前記プレ実行範囲外において
参照されている変数について、この変数の値が前記プレ
実行直後に確定しており、かつ、前記第１のプログラム
中の前記プレ実行範囲以後の定義でこの変数の値が再定
義されることがないことが前記解析手段により確認され
ているとき、この変数を参照するのに代えて、この変数
の持つ値として定義されている定数を参照する定数置換
ステップとを備えたことを特徴とする並列処理方法。３、前記予め実行すべきプレ実行範囲を確定する確定ス
テップは、前記第１のプログラム中にプレ実行範囲を特
定する指示文を置き、この指示文を解読することにより
プレ実行範囲を確定するステップで構成したことを特徴
とする請求項１または２記載の並列処理方法。４、前記予め実行すべきプレ実行範囲を確定する確定ス
テップは、前記第１のプログラムを解析して、プログラ
ム全体の中における繰り返しループの位置関係および制
御の流れを基にプレ実行範囲を確定するステップで構成
したことを特徴とする請求項１または２記載の並列処理
方法。