WO2008041442A1

WO2008041442A1 - Procédé de création de programme par parallélisation, dispositif de création de programme par parallélisation, et programme de création de programme par parallélisation

Info

Publication number: WO2008041442A1
Application number: PCT/JP2007/067310
Authority: WO
Inventors: Makiko Ito; Hideo Miyake; Atsuhiro Suga
Original assignee: Fujitsu Limited
Priority date: 2006-09-29
Filing date: 2007-09-05
Publication date: 2008-04-10
Also published as: JP2008090541A; JP4946323B2

Description

明細書

並列化プログラム生成方法、並列化プログラム生成装置、及び並列化プログラム生成プログラム

技術分野

[0001] 本発明は、一般にプログラム生成方法、装置、及びプログラムに関し、詳しくは並列化プログラム生成方法、装置、及びプログラムに関する。

背景技術

[0002] 近年、シングル ·プロセッサでのプログラム性能には限界があることが知られてきた。

従来、性能を上げるためには、プロセッサの動作周波数を高くすることで単位時間あたりの処理量を増やす方法と、命令を並列に実行することで同時に実行できる処理を増やす方法とがとられてきた。

[0003] し力動作周波数を高くすると消費電力が大きくなるという問題があるとともに、動作周波数の向上には物理的な限界があるという問題がある。また、命令レベルの並列性は高々 2〜4程度であり（非特許文献 1)、投機的な実行などを導入することにより多少並列性を上げることはできる力 S、それにも限界があることが知られている。

[0004] そこで、命令レベルよりも大きな粒度でプログラムを並列化し、複数のプロセッサにて実行することにより、処理性能を向上させる方法が注目されている。しかしながら、制御による分岐が多い逐次プログラムを効果的な並列プログラムへ変換する画一的な方法は、これまでのところ知られていない。

[0005] 逐次プログラムを分割して複数のプロセッサ上で並列に実行するプログラムを生成する手法として、ループに着目したデータ'レベル並列化という方法と、制御に着目した投機的なスレッド実行とレ、う方法が知られて!/、る。

[0006] 特許文献 1では、ループの中におけるデータの依存関係を解析し、配列を分割して、ループの処理を複数のプロセッサで実行させる。この手法は、数値計算等の規則的なループの処理が多!/、場合に有効である。

[0007] また特許文献 2は、逐次プログラムにおける分岐に着目して、投機的なスレッド実行に置換する手法を示す。この手法では、制御の流れに基づいてプログラムを並列化するので、プログラムの潜在的な並列性を充分に抽出できているとはいえない。また、投機的スレッド実行機構を持たな!、マルチプロセッサにおレ、ては予測失敗時の口ールバックのコストが大き!/、ので、分岐予測ヒット率が低!/、アプリケーションにはこの手法は適さない。

[0008] 従って、大規模なソフトウェアを対象として、逐次プログラムを並列化することにより、マルチプロセッサ上で効果的に動作する非投機的なマルチ ·スレッド '·プログラム（並列化プログラム）を生成する方法を提供することが必要になる。但し、このようにして生成する並列化プログラムにおいては、以下に説明するように、スレッド間の依存関係に基づく待ち時間の発生という問題について考慮する必要がある。

[0009] 並列化プログラムの各スレッドの実行を制御する方式としては、例えば、手続を非同期の遠隔呼び出しとして呼び出すことにより並列にスレッドを実行する方式、手続に実行開始するメッセージを送信することにより並列にスレッドを実行する方式、スレッド間で共有メモリを利用して入出力変数の受け渡しを行なうことにより並列にスレツドを実行する方式等が考えられる。し力もこれらの方式では、第 1の手続 (スレッド）の実行結果を利用する第 2の手続がある場合、第 1の手続の終了を待つ命令とそれに続く第 2の手続を実行する命令とを、他の手続の実行に要する時間などを見積もって、プログラム中の適当な場所に配置しておくことになる。この場合、第 1の手続が予想以上に早く終了した場合などに、第 2の手続を実行するまでに、不必要な待ち時間が発生してしまう。

[0010] 図 1は、無駄な待ち時間の発生について説明するための図である。図 1において、プロセッサ 0乃至プロセッサ 3の 4つのプロセッサが用いられる。プロセッサ 0でスレッド制御プログラム 1 (各スレッドに対応する手続の実行及び終了待ちを制御するプログラム）を実行する。図 1の例では、まずプロセッサ 0から、プロセッサ 1乃至プロセッサ 3 に対して手続 A乃至 Cの実行を順番に要求する（start A()〜start C())。その後プロセッサ 0は、手続 Aの終了を待って (wait AO)、手続 Aの実行結果を利用する手続 D の実行を要求する（start D())。その後、手続 Bの終了を待って (wait B())、手続 Bの実行結果を利用する手続 Eの実行を要求する（start E())。更にその後、手続 Cの終了を待って (wait CO)、手続 Cの実行結果を利用する手続 Fの実行を要求する（start F())。

[0011] この例では、手続 Cが終了してから手続 Fの実行を要求するまでに待ち時間が発生している。これは、スレッド制御プログラム中において、手続 Bの終了待ち合わせ（wait B0)と手続 Eの実行要求（start E0)が、手続 Cの終了待ち合わせ (wait C())と手続 F の実行要求（start F0)よりも前に配置されているからである。このような命令配置順のために、手続 Bが終了しないと、手続 Cの終了待ち合わせ及び手続 Fの実行要求が実行されないことになる。

[0012] このような命令配置は、手続 Bが手続 Cよりも早く実行が終了するであろうという見積もりに基づくものである。手続 Cの方が手続 Bよりも早く終了することが分かっていたならば、手続 Cの終了待ち合わせ及び手続 Fの実行要求を、手続 Bの終了待ち合わせ及び手続 Eの実行要求よりも前に配置することが考えられる。し力も実際には、手続の実行に力、かる時間は処理データの内容等にも依存するので、終了時間を正確に見積もることは不可能である。従って、単純な遠隔手続呼び出し、共有メモリによるスレッド、メッセージ送信等の上記方式では、図 1に示すような待ち時間を無くすことはできない。

[0013] 以上説明したように、上記の依存関係待ち合わせ付き非同期遠隔手続呼び出し方式を用いれば、並列化プログラムの実行時における不要な待ち合わせ時間の発生を防ぐこと力 Sできる。従って、大規模なソフトウェアを対象として、逐次プログラムを並列化することにより、マルチプロセッサ上で効果的に動作する非投機的な並列化プログラムを生成する際には、上記の依存関係待ち合わせ付き非同期遠隔手続呼び出し方式に適用可能な並列化プログラムを生成することが望ましレ、。

特許文献 1：特許第 3028821号公報

特許文献 2：特許第 3641997号公報

非特許文 Il U： David W. Wall. Limits of Instruction-Level Parallelism. Proceedings o f the fourth international conference on Architectural support for programming langu ages pp. 176-188 May. 1991.

非特許文献 2 : S. Horwitz, J. Prins, and T. Reps, "Integrating non- interfering versio ns of programs, ACM Transactions on Programming Languages and Systems, vol. 1 1， no. 3， pp. 345—387， 1989.

非特許文献 3 : Jeanne Ferrante, Karl J. Ottenstein, Joe D. Warren, "The Program D ependence raph and Its Use in Optimization, ACM Transactions on Programming

Languages and Systems, pp. 319-419， vol. 9 no. 3， July 1987.

非特許文献 4 : Susan Horwitz, Jan Prins, Thomas Reps, "On the adequacy of progra m dependence graphs for representing programs ' Proceedings of the 15th Annual A

CM Symposium on the Principles of Programming Languages, pp. 146-157， Jan., 19

88.

非特許文献 5 :中田育男著:"コンパイラの構成と最適化"，朝倉書店， 1999

発明の開示

発明が解決しょうとする課題

[0014] 以上を鑑みて、本発明は、大規模なソフトウェアを対象として、マルチプロセッサ上で効果的に動作する非投機的かつ依存関係待ち合わせに基づく並列化プログラムを生成する方法、装置、及びプログラムを提供することを目的とする。

課題を解決するための手段

[0015] 逐次実行プログラムにおける複数のスレッドの実行順及び複数のスレッドの依存関係を登録し、登録した依存関係に基づいて複数のスレッドの実行状態を管理し、実行可能なスレッドを判定して、順次プロセッサに割当てて実行することを特徴とする依存関係待ち合わせ方式により実行される並列化プログラムを生成することを特徴とす

[0016] 並列化プログラム生成方法は、逐次プログラムを入力として、該逐次プログラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、該プログラム依存グラフの該頂点同士を融合することにより該頂点の数を減少させた縮退プログラム依存グラフを生成し、該縮退プログラム依存グラフの頂点の実行順序を計算し、該実行順序を与えられた該複数の頂点のうちで分岐及び合流の何れも含まずに順番に実行される頂点列を基本ブロックとして纏め、該縮退プログラム依存グラフの頂点の各々に相当する手続きを生成し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置し、同一の基本ブロック内部で依存関係がある手続きについては先行手続きに対する後続手続きの依存関係を登録する命令を生成するようにして、該手続きの実行を制御する手続き制御プロダラムを生成する各段階を含むことを特徴とする。

[0017] 並列化プログラム生成装置は、逐次プログラムと並列化プログラム生成プログラムとを格納するメモリと、該メモリに格納された該並列化プログラム生成プログラムを実行することで該メモリに格納された該逐次プログラムから並列化プログラムを生成する演算処理ユニットを含み、該演算処理ユニットは、該並列化プログラム生成プログラムを実行することにより、該逐次プログラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、該プログラム依存グラフの該頂点同士を融合することにより該頂点の数を減少させた縮退プログラム依存グラフを生成し、該縮退プログラム依存グラフの頂点の実行順序を計算し、該実行順序を与えられた該複数の頂点のうちで分岐及び合流の何れも含まずに順番に実行される頂点列を基本ブロックとして纏め、該縮退プログラム依存グラフの頂点の各々に相当する手続きを生成し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置し、同一の基本ブロック内部で依存関係がある手続きについては先行手続きに対する後続手続きの依存関係を登録する命令を生成するようにして、該手続きの実行を制御する手続き制御プログラムを生成することを特徴とする。

[0018] 並列化プログラム生成プログラムは、逐次プログラムを入力として、該逐次プロダラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、該プログラム依存グラフの該頂点同士を融合することにより該頂点の数を減少させた縮退プログラム依存グラフを生成し、該縮退プログラム依存グラフの頂点の実行順序を計算し、該実行順序を与えられた該複数の頂点のうちで分岐及び合流の何れも含まない頂点列を基本ブロックとして纏め、該縮退プログラム依存グラフの頂点の各々に相当する手続きを生成し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置し、同一の基本ブロック内部で依存関係がある手続きについては先行手続きに対する後続手続きの依存関係を登録する命令を生成するようにして、該手続きの実行を制御する手続き制御プログラムを生成する各段階を計算機に実行させるコードを含むことを特徴とする。

発明の効果

[0019] 本発明の少なくとも 1つの実施例によれば、制御の流れグラフではなぐ制御の依存関係を示すグラフであるプログラム依存グラフに基づいて並列化プログラムを生成するので、制御の流れ (分岐）を超えたプログラムの並列性を抽出することができる。また、プログラム依存グラフを縮退してグラフの規模を削減することで、その後の並列化プログラム生成処理の効率化及び最適化が可能になるとともに、大きな粒度での並列化を実現することができる。

[0020] また更に、異なる基本ブロックをまたいでの手続き間の依存関係については、先行手続きの終了待ち合わせを行ってから、後続手続きを実行するようにする。また同一の基本ブロック内部で依存関係がある手続きの実行にっレ、ては、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより手続きを実行する。即ち、基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置して、この命令の配置順により依存関係を非明示的に規定して、依存関係を満たすように手続き制御する。また同一の基本ブロック内部で依存関係がある手続きについては後続手続きの先行手続きへの依存関係を明示的に登録する命令を生成するようにして、依存関係を満たすように手続き制御する。このような構成とすることで、複雑な制御の依存関係が存在する基本ブロック間にっレ、ては、手続きの実行を待ち合わせにより実現することで制御プログラムの生成を容易なものとし、実行順が固定である同一基本ブロック内については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより無駄な待ち合わせ時間をなくすことができる。

図面の簡単な説明

[0021] [図 1]無駄な待ち時間の発生について説明するための図である。

[図 2]依存関係待ち合わせ付き非同期遠隔手続呼び出し方式による手続実行の制御について説明するための図である。園 3]本発明による並列化プログラム生成方法の概略を示す図である。

園 4]手続きプログラム生成方法の概要を示す図である。

園 5]図 4の手続きプログラム生成方法により生成される手続きプログラムを示す図である。

[図 6]手続き制御プログラムの生成方法を示すフローチャートである。

園 7]頂点間の実行順序関係を決定する方法を示すフローチャートである。

[図 8]頂点 V以下の制御の流れを再構成する処理（図 7のステップ S2)を示すフローチャートである。

[図 9]Regionの実行順序関係を計算する処理を示すフローチャートである。

[図 10]逆依存及び出力依存を求める処理（図 9のステップ S4)を示すフローチャートである。

園 11]着目領域を越える変数参照を抽出する処理を示すフローチャートである。園 12]着目領域を越える変数代入を抽出する処理を示すフローチャートである。

[図 13]逆依存の追加処理を示すフローチャートである。

[図 14]出力依存の追加処理を示すフローチャートである。

[図 15]逆依存及び出力依存を求める処理（図 9のステップ S 5)を示すフローチャートである。

園 16]全域木を説明するための図である。

園 17]全域木を模式的に示す図である。

園 18]全域木間の順序関係を計算する処理を示すフローチャートである。

[図 19]図 18の処理による逆依存辺の追加について説明する図である。

[図 20]頂点間の実行順序関係を決定する方法の変形例を示すフローチャートである

[図 21]基本ブロックを抽出する処理のフローチャートを示す図である。

[図 22]制御プログラムを生成する処理のフローチャートを示す図である。

[図 23]基本ブロックの集合 B'の要素 B以下の手続き制御プログラムを生成する処理を示すフローチャートである。

園 24]第 1の実施例の場合の手続き制御プログラムの構造を示す図である。 [図 25] (a)は入力逐次プログラムの部分を示す図、（b)は対応する縮退プログラム依

[図 26]図 25の縮退プログラム依存グラフから第 1の実施例に従い生成される手続き制御プログラムを示す図である。

[図 27]手続き制御プログラムの動作を手続きプログラムの実行とともに示す模式図である。

[図 28]第 2の実施例の場合の制御プログラムを生成する処理のフローチャートを示す図である。

[図 29]基本ブロックの集合 B'の要素 B以下の手続き制御プログラムを生成する処理を示すフローチャートである。

[図 30]第 2の実施例の場合の手続き制御プログラムの構造を示す図である。

[図 31]図 25の縮退プログラム依存グラフから第 2の実施例に従い生成される手続き制御プログラムを示す図である。

[図 32]手続き制御プログラムの動作を手続きプログラムの実行とともに示す模式図である。

[図 33]本発明による並列化プログラム生成方法を実行する装置の構成を示す図であ

符号の説明

10 入力変数の引数受信部分

11 変数宣言部分

12 プログラム本体部分

13 出力変数の送信部分

21 , 22 全域木

31 出力依存辺

32, 33 逆依存辺

510 コンピュータ

511 CPU

512 RAM 513 ROM

514 二次記憶装置

515 可換媒体記憶装置

516 インターフェース

520 ディスプレイ装置

521 キーボード

522 マウス

523 通信装置

発明を実施するための最良の形態

[0023] 以下に、本発明の並列化プログラム生成方法の概略及び実施例を添付の図面を用いて詳細に説明する。

[0024] 図 2は、依存関係待ち合わせ付き非同期遠隔手続呼び出し方式による手続実行の制御について説明するための図である。並列化プログラムの各スレッドの実行を制御する際に、各手続毎に他の手続に対する依存関係を実行条件として指定し、各手続をプロセッサ毎の実行キューに投入し、実行条件が満たされた手続を実行していくという方式が考えられる。このような方式を、依存関係待ち合わせ付き非同期遠隔手続呼び出し方式と呼ぶ。

[0025] 図 2において、プロセッサ 0乃至プロセッサ 3の 4つのプロセッサが用いられる。プロセッサ 0でスレッド制御プログラム 2 (各スレッドに対応する手続きの実行及び依存関係を制御するプログラム）を実行する。この際プロセッサ 0は、手続き呼出しプログラム 3を実行することにより、スレッド制御プログラム 2に規定される各手続きを各プロセッサ毎のキューを用いて管理する。

[0026] 図 2の例では、まず制御プログラム 2の命令 start A()に従って、プロセッサ 1の実行キュー 4に手続 Aが投入される。また制御プログラム 2の命令 start B()に従って、プロセッサ 2の実行キュー 5に手続 Bが投入される。更に制御プログラム 2の命令 start C() に従って、プロセッサ 3の実行キュー 6に手続 Cが投入される。

[0027] 同様に、制御プログラム 2の命令 start D()、 start E()、及び start F()に従って、実行キュー 4乃至 6にそれぞれ手続 D、 E、及び Fが投入される。またスレッド制御プロダラム 2中の d印 (x， y, · · ·)は依存関係を指定する命令であり、手続 Xの依存先が手続 Y、 • · ·であることを示す。即ち、手続 Xを実行するためには、手続 Υ、 · · ·の実行が終了している必要があることを示す。制御プログラム 2の命令 d印 (D， A)に従って、プロセッサ 1の実行キュー 4中の手続 Dに対して、依存先の手続が Aであることが登録される。また制御プログラム 2の命令 d印 (E， A, B)に従って、プロセッサ 2の実行キュー 5中の手続 Eに対して、依存先の手続が A及び Bであることが登録される。更に、制御プログラム 2の命令 d印 (F， A, C)に従って、プロセッサ 3の実行キュー 6中の手続 Fに対して、依存先の手続が A及び Cであることが登録される。

[0028] このようにして各プロセッサ毎に設けた実行キューに投入されている手続を、キューの順番に従って対応するプロセッサで実行する。この際、依存先が登録されていない手続（図 2において NULLで示されている手続）については無条件に実行し、依存先が登録されて!/、る手続につ!/、ては、依存先の手続の終了を検出してから実行する。このようにプロセッサ毎にキューを設け、実行条件が満たされたキュー内の手続き（実行可能手続き）から順番に実行して!/、くことで、図 1に示したような待ち時間を無くすこと力 Sでさる。

[0029] 図 3は、本発明による並列化プログラム生成方法の概略を示す図である。

[0030] ステップ S1で逐次プログラムからプログラム依存グラフ（PDG： Program Dependenc e Graph)を生成する。次に、ステップ S2で、手続きとして他のプロセッサエレメントで実行するに適した処理量となるまで依存関係を縮退することにより、手続きを頂点とする縮退プログラム依存グラフを作成する。ステップ S3で、作成した縮退プログラム依存グラフから、非投機的に手続きの起動と同期を制御する手続き制御プログラムを生成する。またステップ S4で、縮退プログラム依存グラフから、その各頂点に相当する手続きプログラムを生成する。

[0031] まず逐次プログラムからプログラム依存グラフを生成する処理（図 3のステップ S1) について説明する。

[0032] プログラム依存グラフとは、例えば非特許文献 2乃至 4等に説明されるように、プログラムの文を頂点とし、文と文の間の関係を辺で表現したグラフである。非特許文献 2 乃至 4に記載されるプログラム依存グラフは、次のような頂点集合 Vと辺集合 Eの組で表現されるものであり、逐次プログラムを解析することにより生成できる。

[0033] [V:頂点集合]

エントリ:プログラムの開始ポイントを表す。

[0034] 初期定義:プログラム開始時の初期値の定義を表す。

[0035] プリディケート： If-then-elseまたは while-loopの条件判定を表す。

[0036] 代入文:プログラムの代入文を表す。

[0037] 最終使用:プログラム終了時の変数の参照を表す。

[0038] [E:辺集合]

[制御依存辺： v→ ^L w]プリディケート頂点 vに対して、その条件判定結果により、頂点 wに到達するか否かが決まることを表す。 Lは条件判定のフラグを表し、 L=Tのときは条件判定結果が真の場合に頂点 wを実行し、 L=Fのときは結果が偽の場合に頂点 wを実行する。

[0039] [データ依存辺]

[ループ独立フロー依存辺： v→ ^x W]頂点 Vで代入された変数 Xの値を、頂点 Wで

li

参照するような場合のデータ依存関係を表す。ここでは、ループを繰り越さない場合のみを表す。

[0040] [ループ繰り越しフロー依存辺： v→ ^x w]頂点 Vで代入された変数 Xの値を、頂点

lc(L)

wで参照するような場合のデータ依存関係を表す。ループ Lを繰り越す場合を表す。

[0041] [定義順序関係： v→ ^x w]頂点 V及び頂点 wが変数 Xの値を代入し、頂点 uで参

do(u)

照するような場合の、頂点 Vと頂点 Wの順序関係を表す。制御の流れによっては、 V, W ， U,あるいは、 V, Uの順に実行される可能性がある場合に、 V， Wの実行順序を表すものである。

[0042] 以下において、縮退プログラム依存グラフを作成する処理（図 3のステップ S2)について説明する。

[0043] 上記のような一般的なプログラム依存グラフでは、文または代入式を頂点としたダラフとなっている。文または代入式を頂点とした場合、大規模なソフトウェアではグラフの頂点数が数千〜数万となってしまう。一般的に、コンパイラのグラフを用いた最適化の問題の計算量は、グラフの規模に対して指数関数的に増大することが知られている。したがって、例えば数個の手続きなどを対象とした頂点数が数十程度のグラフの場合には、解析が可能である力現実的な規模のソフトウェア全体に対する最適化は困難といえる。

[0044] そこで、プログラム依存グラフの頂点数及び辺数を低減すベぐプログラム依存ダラフの依存関係を縮退して頂点を融合し、粗粒度のプログラム依存グラフを作成する。依存関係を縮退することによりグラフの規模を 1/10〜 1/100とすることで、現実的な時間にて、プログラムの最適化を可能にする。

[0045] 依存関係の縮退は、次のような方法で、縮退可能な依存関係及び頂点の集合を求め、依存関係を削除して頂点を 1つの頂点に融合することにより実行される。

[0046] 1.構文規則に基づく縮退

一般にプログラム依存グラフから等価な逐次プログラムの制御の流れを再構成することは、困難と言われている。これは、制御の依存関係のみの表現となっているため、依存関係を満足する制御の流れは一意に決定できな!/、上に、グラフを変形するような最適化を行なった場合、依存関係を満足するような制御の流れが存在しな!、ような場合も出てくるためである。

[0047] しかし、表現するプログラムの制御構造を、 i戊、 while文、及び、代入文に限定し、プログラム依存グラフの制御依存部分グラフ (頂点と制御依存辺のみで構成される部分グラフ)の形が木構造となる場合は、プログラムの制御の流れを再構成できることが知られている（非特許文献 2)。そこで、プログラムにおける i戊、 while文でない制御文ロック全体とブロック内部の依存関係を 1つの頂点に縮退することで、安全に制御の流れを再構成可能な範囲の縮退プログラム依存グラフを作成する。

[0048] 2.結合度に基づく縮退

プログラム依存グラフを探索して、頂点間の結合の強さを求める。結合度は、データ依存辺とその大きさ、及び、制御依存辺、処理の大きさから計算されるものとする。ある結合度以上の頂点に対して、縮約可能な条件を満足する場合は、頂点を結合し依存関係を縮約する。ここで、次の 2つ条件を満たすときに、頂点を結合しての縮約が可能となる。 [0049] 1)プログラム依存グラフに対応する CFG(Control Flow Graph：制御フローグラフ）上で頂点集合外から頂点集合内への分岐は頂点集合の先頭頂点へのみであり、頂点集合内から頂点集合外への分岐は頂点集合の最後の頂点のみである。

[0050] 2)頂点間のデータ依存パスに外部の頂点が含まれない。

[0051] 以上のようにして、「構文規則に基づく縮退」又は「結合度に基づく縮退」により、頂点数が大幅に削減された縮退プログラム依存グラフを生成することができる。縮退プログラム依存グラフは、次の要素から構成される。

[0052] [V:頂点集合]

エントリ:プログラムの開始ポイントを表す。

[0053] 初期定義:プログラム開始時の初期値の定義を表す。

[0054] プリディケート： If-then-elseまたは while-loopの条件判定を表す。

[0055] 文の集合：プログラムを構成する文の集合を表す。

[0056] 最終使用:プログラム終了時の変数の参照を表す。

[0057] [E:辺集合]

[0058] [データ依存辺]

li

[0059] [ループ繰り越しフロー依存辺： v→ ^x w]頂点 Vで代入された変数 Xの値を、頂点

lc(L)

[0060] [定義順序関係： v→ ^x w]頂点 V及び頂点 wが変数 Xの値を代入し、頂点 uで参

do(u)

照するような場合の、頂点 Vと頂点 Wの順序関係を表す。制御の流れによっては、 V, W ， U,あるいは、 V, Uの順に実行される可能性がある場合に、 V， Wの実行順序を表すものである。 [0061] 以下において、手続き制御プログラムを生成する処理（図 3のステップ S3)及び手続きプログラムを生成する処理（図 3のステップ S4)について説明する。

[0062] まず手続きプログラムの生成について説明する。上記のようにして生成された縮退プログラム依存グラフの頂点は、入力逐次プログラムの文の部分集合であって、文の間の制御の流れの情報を有している。従って、着目する 1つの頂点へのデータフロー入力辺が表す変数を入力とし、データフロー出力辺が表す変数を出力とする、 1つの手続きプログラムを 1つの頂点に対して生成する。また、制御の流れより手続きプログラムの本文を、また、本文の実行に必要な局所変数をそれぞれ生成する。

[0063] 図 4は、手続きプログラム生成方法の概要を示す図である。図 5は、図 4の手続きプログラム生成方法により生成される手続きプログラムを示す図である。

[0064] 図 4のステップ S 1において、着目頂点についてデータフロー入力辺が表す変数を入力として、入力変数を引数として受信するためのプログラム部分を生成する。これにより、図 5に示す入力変数の引数受信部分 10が生成される。ステップ S2において必要な変数を探索する。更にステップ S3において、探索により見つかった変数について変数宣言を生成する。これにより、図 5に示す変数宣言部分 11が生成される。

[0065] ステップ S4において、着目頂点の文の間の制御の流れの情報に基づいて、プログラムの本文を生成する。これにより、図 5に示すプログラム本体部分 12が生成される。ステップ S5において、着目頂点のデータフロー出力辺が表す変数を出力として返すためのプログラム部分を生成する。これにより、図 5に示す出力変数のセット部分 13 が生成される。

[0066] このように、手続きプログラムとしては、頂点が表す文/文の集合を実行する手続きとする。また、入力変数を手続きの引数とし、出力変数を復帰値あるいは、出力変数を格納するアドレスを引数として受け取るような手続きを作成する。

[0067] 次に手続き制御プログラムの生成について説明する。非特許文献 2に記載される技術に基づ!/、て、縮退したプログラム依存グラフから制御の流れを安全に再構成すること力できる。具体的には、縮退したプログラム依存グラフの制御依存部分木について、プログラムの実行順序関係を計算し、基本ブロックを求める。基本ブロックとは、分岐（IF、 GOTO, LOOP等）や合流を含まない順番に実行される頂点の列のことを言う。各中間節点が表す制御構造と子頂点が表す「手続き」の呼び出しを行なうプログラムを生成することで、並列プログラムを生成することができる。「手続き」を実行する上で必要となる入力および出力データの送受信と待ち合わせを行なうコードも生成する。基本ブロック内の手続き呼び出しおよびデータ転送の依存関係に関しては、依存関係待ち合わせのメカニズムを用いて制御する。

[0068] 以下に、本発明の実施例について詳細に説明する。第 1の実施例は、依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を共有メモリで実現する例であり、第 2 の実施例は、依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を分散メモリで実現する例である。まず第 1の実施例と第 2の実施例に共通な部分について説明する。

[0069] 図 6は、手続き制御プログラムの生成方法を示すフローチャートである。まずステツプ S1で、頂点間の実行順序関係を計算する。縮退したプログラム依存グラフは、データ及び制御の依存関係のみを表現したグラフであつて頂点間の実行順序は明示されていないので、これから適切な制御の流れを再構成する必要がある。そこで、縮退したプログラム依存グラフの制御依存部分木について、各中間節点の子頂点の実行順序を計算する。この結果、頂点間の半順序関係を求めることができる。この実行順序関係を用いて、制御プログラムを生成することとなる。またその課程において、逆依存関係、出力依存関係が抽出される。

[0070] 次にステップ S2で、求めた実行順序 (制御の流れ)から、基本ブロックを抽出する。

[0071] 次にステップ S3で、制御プログラムの変数と初期値代入文を生成する。この際、静的単一代入形式 (非特許文献 5、 320頁）に変換することで、並列性を向上されることも考えられる。ここで変数としては、データの受け渡しを行うための変数を生成する。

[0072] 次にステップ S4で、 S1で求めた実行順序順に制御依存部分グラフを探索し、制御プログラムを生成する。プリディケート頂点については、その頂点が表す制御構造を生成する。そして、制御構造の本文として、当該頂点の下位の部分木の制御プロダラムを生成する。基本ブロックについては依存関係に基づく非同期遠隔手続きを行う文を生成する。これについては以下に詳細に説明する。

[0073] 更にステップ S5で、手続きの終了の待ち合わせを行う文を生成する。 [0074] 図 7は、頂点間の実行順序関係を決定する方法を示すフローチャートである。図 7 の処理は、図 6のステップ S 1に相当する。図 7に示す処理の入力は縮退したプロダラム依存グラフ PDGであり、出力は縮退したプログラム依存グラフ PDG及びその制御の流れである。

[0075] ステップ S 1で、縮退したプログラム依存グラフ PDGのエントリ頂点（プログラムの開始ポイント）を Vとする。ステップ S2で、頂点 V以下の制御の流れを再構成する。以上で処理を終了する。

[0076] 図 8は、頂点 V以下の制御の流れを再構成する処理（図 7のステップ S 2)を示すフロ一チャートである。図 8の処理の入力は、縮退したプログラム依存グラフ PDG及び頂点 Vである。

[0077] ステップ S 1で、 Region(v， Ύ) = {u \ u ≡ V, v→ ^Tu ≡ E}が空集合であるか否かを判断する。空集合であれば処理を終了し、空集合でなければステップ S 2に進む。ここで Region(v， T)とは、頂点 uの集合であって、頂点 vから頂点 uへの L=Fの制御依存関係が存在するものである。ここで Vは頂点集合、 Eは辺集合、 v→ ^Tuは L=Fの制御依存辺を示すものである。

[0078] ステップ S2で、 Region(v， T)の実行順序関係を計算する。ステップ S3で、 Region(v， F) = {u | u e V, v→ ^Fu e E}が空集合であるか否かを判断する。空集合であれば処理を終了し、空集合でなければステップ S4に進む。ここで Region(_V， F)とは、頂点 uの集合であって、頂点 Vから頂点 uへの L=Fの制御依存関係が存在するものである。以上で処理を終了する。

[0079] 図 9は、 Regionの実行順序関係を計算する処理を示すフローチャートである。この処理は、図 8のステップ S2及びステップ S4の各々に対応する。図 9の処理の入力は、縮退したプログラム依存グラフ PDG及び V' (着目 Region)である。

[0080] ステップ S 1で、着目領域 V'の各頂点 Vについて、ステップ S2乃至 S 3の処理を繰り返すループを開始する。ステップ S 2で、 Vがプレディケート頂点（If-then-else又は whi le-loopの条件判定を表す頂点）であるか否かを判断する。 Vがプレディケート頂点である場合のみ、ステップ S3を実行する。ステップ S3で、頂点 V以下の実行順序関係を計算する。 [0081] 次に、ステップ S4で、逆依存及び出力依存を求める。ここでは制御の流れに起因するデータ依存関係 (逆依存、出力依存)を抽出する。具体的には、着目領域 (Regio n)を越えるデータ依存関係から、着目領域内の逆依存及び出力依存を表出する。

[0082] 次に、ステップ S 5で、逆依存及び出力依存を求める。ここでは着目領域 (Region) 内の実行順序を決定する。即ち、実行順序が一意に定まらない Region内頂点の集合について適切な実行順序制約を決定する。具体的には、求められた逆依存関係や出力依存関係などによる実行順序制約をもとに、 Region内の逆依存関係や出力依存関係を明らかにして、実行順序を決定する。実行順序が任意となる場合は、実行順序を仮定して逆依存関係、出力依存関係を求め、矛盾が起きない実行順序が得られるまで試行を繰返す。

[0083] 最後にステップ S6でスケジューリングを行う。即ち、上で求めた実行順次関係に基づいて頂点の実行順を決定する。これは、半順序関係の成立するグラフのスケジュ一リングという一般的な問題に帰着できる。従って、トポロジカル 'ソートや、頂点の実行時間の概算を重みとしたリスト'スケジューリングなどのよく知られたスケジユーリング手法を適用することができる。

[0084] 図 10は、逆依存及び出力依存を求める処理（図 9のステップ S4)を示すフローチヤートである。図 10の処理の入力は、縮退したプログラム依存グラフ PDG及び V' (着目 Region)でめ。。

[0085] ステップ S1で、着目領域 V'を越える変数参照を抽出して V とする。ステップ S2で def

、着目領域 V'を越える変数代入を抽出して V とする。ステップ S3で、 V 及び V'に use use 基づいて逆依存辺を追加する。ステップ S4で、 V 及び V，に基づいて出力依存辺を def

追加する。以上で処理を終了する。

[0086] 図 11は、着目領域を越える変数参照を抽出する処理を示すフローチャートである。

図 11の処理は図 10のステップ S 1に相当し、縮退したプログラム依存グラフ PDG及び V， (着目 Region)を入力とする。

[0087] ステップ S1で、頂点の集合 V を空にする。ステップ S2で、着目領域 V'内の各フロ use

一依存辺について以降の処理を繰り返すループを開始する。ここでフロー依存辺としては、ループ独立フロー依存辺とループ繰り越しフロー依存辺とを含む。ステップ S 3で、フロー依存辺 eの依存元頂点を uとするとともに、辺 eの依存先頂点を Vとする。

[0088] ループ繰り越しフロー依存辺である場合には、ステップ S4で、依存先頂点 Vが着目領域 V'に含まれるという条件が満たされるか否かを判定する。またループ独立フロー依存辺である場合には、ステップ S5で、依存元頂点 uが着目領域 V'に含まれず且つ依存先頂点 Vが着目領域 V'に含まれるという条件が満たされるか否かを判定する。この判定結果力yesの場合のみ、ステップ S6を実行する。ステップ S6で、頂点の集合 V に依存先頂点 Vを追加する。

use

[0089] 最後に、ステップ S7で、頂点の集合 V を値として返す。以上で処理を終了する。

use

[0090] 図 12は、着目領域を越える変数代入を抽出する処理を示すフローチャートである。

図 12の処理は図 10のステップ S2に相当し、縮退したプログラム依存グラフ PDG及び V， (着目 Region)を入力とする。

[0091] ステップ S1で、頂点の集合 V を空にする。ステップ S2で、着目領域 V'内の各フロ def

[0092] ループ繰り越しフロー依存辺である場合には、ステップ S4で、依存先頂点 Vが着目領域 V'に含まれるという条件が満たされるか否かを判定する。またループ独立フロー依存辺である場合には、ステップ S5で、依存元頂点 uが着目領域 V'に含まれ且つ依存先頂点 Vが着目領域 V'に含まれなレ、と!/、う条件が満たされるか否かを判定する。何れかの判定結果力 Syesの場合のみ、ステップ S6を実行する。ステップ S6で、頂点の集合 V に依存先頂点 Vを追加する。

def

[0093] 最後に、ステップ S7で、頂点の集合 V を値として返す。以上で処理を終了する。

def

[0094] 図 13は、逆依存の追加処理を示すフローチャートである。図 13の処理は図 10のステツプ S3に相当し、縮退したプログラム依存グラフ PDG、 V (着目 Region)、及び頂点集合 V を入力とする。

use

[0095] ステップ SIで、頂点集合 V の各頂点 Vに対して以降の処理を繰り返すループを use

開始する。ステップ S2で、頂点 Vで使用する各変数 Xに対して以降の処理を繰り返すループを開始する。ステップ S3で、着目領域 V'の各頂点 uに対して以降の処理を繰り返すループを開始する。

[0096] ステップ S4で、頂点 uが変数 Xを定義するか否かを判定する。判定結果が yesの場合のみ、ステップ S5を実行する。ステップ S5において、 Vから uへの逆依存辺を追加する。以上で処理を終了する。

[0097] 図 14は、出力依存の追加処理を示すフローチャートである。図 14の処理は図 10のステップ S4に相当し、縮退したプログラム依存グラフ PDG、 V (着目 Region)、及び頂点集合 V を入力とする。

def

[0098] ステップ S Iで、頂点集合 V の各頂点 uに対して以降の処理を繰り返すループを

def

開始する。ステップ S2で、頂点 uで使用する各変数 Xに対して以降の処理を繰り返すループを開始する。ステップ S3で、着目領域 V'の各頂点 Vに対して以降の処理を繰り返すループを開始する。

[0099] ステップ S4で、頂点 Vが変数 Xを定義するか否かを判定する。判定結果が yesの場合のみ、ステップ S5を実行する。ステップ S5において、 Vから uへの出力依存辺を追加する。以上で処理を終了する。

[0100] 図 15は、逆依存及び出力依存を求める処理（図 9のステップ S5)を示すフローチヤートである。図 15の処理の入力は、縮退したプログラム依存グラフ PDG及び V' (着目

Region)でめ。。

[0101] ステップ S 1で、着目領域内の全域木を求め Sとする。変数 Xを定義する頂点 Vとその変数 Xを使用する RegionR内の頂点との集合として、頂点 Vの変数 Xに関する全域木が、

Span(v, x) = {v} U {u| v→ u ^ E }

li R

と定義される。図 16は、全域木を説明するための図である。図 16に示されるプロダラム依存グラフにおいて、頂点 Vにおいて変数 Xが定義され、 2つの頂点 vl及び v2が変数 Xを使用する。この場合、頂点 v、 vl、及び v2で全域木 21を形成する。また頂点 Vにおいて変数 Xが定義され、 2つの頂点 v3及び v4が変数 Xを使用する。この場合、頂点 v、 v3、及び v4で全域木 22を形成する。図 17は、全域木を模式的に示す図である。全域木 Span(v， X)及び全域木 Span(v， x)が、データ依存グラフとして図 17に示されるように構成される。 [0102] 図 15に戻り、ステップ S2で、実行順が未決定である 2つの任意の全域木を順次選択して以降の処理を繰り返すループが開始される。ステップ S3で、着目領域に閉路がなぐ同一変数 Xに対する独立した全域木 Span(h，x)及び Span(h，x)が存在するか

0 1

否かを判定する。ここで、「独立した」とは、 2つの全域木 Span(h，x)及び Span(h，x)に

0 1 ついて、 Span(h，x)に含まれる頂点と Span(h，x)に含まれる頂点との間に辺（依存関係

0 1

)がないことを言う。

[0103] ステップ S4で R (Region)のオリジナルをスタックに退避させる。ステップ S5で、 h→h

o の出力依存辺を追加し、推移閉包を求める。ステップ S6で、全域木間の順序関係を

1

計算する。

[0104] ステップ S7で、 R (Region)に閉路が存在するか否かを判定する。存在しない場合には、以降の処理ステップ S8〜ステップ S 11をスキップする。存在する場合には、ステツプ S8に進む。ステップ S8で、スタックが空か否かを判断する。空の場合にはエラ一終了する。空でない場合には、ステップ S9で、 Rのオリジナルをスタックから取り出す。

[0105] 以上の処理は、頂点 hから hへの出力依存関係をグラフに追加したときに、巡回グ

0 1

ラフとならない場合には追加した依存関係を確定させ、巡回グラフになった場合には元のグラフに戻すことに相当する。元のグラフに戻した後は、以降に示すように、頂点 h力も hへの出力依存関係をグラフに追加する。即ち、ステップ s ioで、 h→hの出

1 0 1 0 力依存辺を追加し、推移閉包を求める。ステップ S 11で、全域木間の順序関係を計算する。

[0106] 以上の処理により、 2つの全域木 Span(h，x)及び Span(h，x)に対する実行順序が決

0 1

定する。更に、実行順が未決定である 2つの任意の全域木を順次選択して同様の処理を繰り返し、全ての全域木間の順序関係が決定されたところで終了する。

[0107] 図 18は、全域木間の順序関係を計算する処理を示すフローチャートである。図 18 の処理は、図 15のステップ S6及びステップ S 11に相当する。図 18の処理の入力は、縮退したプログラム依存グラフ PDG及び V' (着目 Region)である。

[0108] ステップ S1で、着目領域内の各辺 e (頂点 v→頂点 w)について以降の処理を繰り返すループを開始する。ステップ S 2で、頂点 wで定義され、頂点 Vで参照される各変数 xについて以降の処理を繰り返すループを開始する。

[0109] ステップ S3で、 V — { u

a I V e Span(u, x) }とするとともに、 V — { u | w e Span(u, x b

) }とする。これは、頂点 Vを要素として含む変数 Xに関する全域木における変数 Xを定義する頂点の集合を求めるとともに、頂点 Wを要素として含む変数 Xに関する全域木における変数 Xを定義する頂点の集合を求めることである。

[0110] ステップ S4で、 Vの各頂点 Vについて以降の処理を繰り返すループを開始する。

ステップ S 5で、 Vの各頂点 Vについて以降の処理を繰り返すループを開始する。更 b b

にステップ S6で、 Span(v， x)の頂点であって Span(v， x)の頂点でない各頂点 vにつ a b c いて以降の処理を繰り返すループを開始する。

[0111] ステップ S7で、 vc→vbが E (辺集合）に含まれるか否かを判定する。判定結果が ye sの場合のみステップ S8を実行する。ステップ S8で、 V→vの逆依存辺を追加し、推 c b

移閉包を求める。以降、各ループの処理を繰り返す。

[0112] 図 19は、図 18の処理による逆依存辺の追加について説明する図である。図 19には、頂点 Vの変数 Xに関する全域木 Span(v，x)と頂点 wの変数 Xに関する全域木 Span(w ，x)とが示される。頂点 Vを要素として含む変数 Xに対する全域木 Span(v， x) (即ち Span (v，x))の各頂点 V (即ち v、 25、 26)に対して、全域木 Span(v， x) (即ち Span(w，x))の c b

ヘッド V (変数を定義している頂点 w)への逆依存辺 32、 33を追加する。

b

[0113] 図 20は、頂点間の実行順序関係を決定する方法の変形例を示すフローチャートである。図 20のフローチャートに示す処理を、図 7のフローチャートに示す処理の代わりに用いてもよい。即ち、頂点間の実行順序関係を決定する処理において、前段階のステップ SOとして、 SSA (静的単一代入形式）を適用する処理を実行してもよい。即ち、縮退プログラム依存グラフを静的単一代入形式に変換してもよい。この場合、図 9に示すステップ S 7の処理（逆依存、出力依存を求め着目領域内の実行順序を決定する処理：図 15のフローチャート）を省略することができる。

[0114] 以上により、頂点間の実行順序関係を決定し、逆/出力依存関係を抽出することカできる。即ち、図 6のステップ S 1の処理が実行される。

[0115] 図 21は、基本ブロックを抽出する処理のフローチャートを示す図である。図 21に示す処理は、図 6のステップ S2の処理に相当する。図 21の処理の入力は、実行順序関係が決定された縮退したプログラム依存グラフである。

[0116] 求めた制御の流れの順に頂点を探索し、頂点の種類に応じた処理を行なう。以下の説明において Bは基本ブロックの集合であり、 Bは i番目の基本ブロックである。また Vは現在の頂点（着目頂点）であり、 uは現在の頂点の 1つ前の頂点である。

[0117] まずステップ S2で、最初の基本ブロック BOを空集合として生成する。次にステップ S2で、 uをエントリ頂点（プログラムの開始ポイント）として、 Vをエントリ頂点の次の頂点とする。ステップ S4で、現在の頂点 Vが最終頂点であるか否力、を判断する。最終頂点である場合には、処理を終了して基本ブロックの集合 Bが生成される。

[0118] 現在の頂点 Vが最終頂点でない場合には、ステップ S5に進み、現在の頂点 Vがプレディケート頂点（If-then-else又は while-loopの条件判定を表す頂点）であるか否かを判断する。プリディケート頂点である場合には、ステップ S6に進み、 iをインクリメントしてからの要素を Vとすることで、新たなプリディケートのみの基本ブロック Bを形成する。その後ステップ S 7で、更に iをインクリメントして、新たな空集合の基本ブロック B を形成する。

[0119] 現在の頂点 Vがプレディケート頂点でない場合（S 5で Noの場合）には、ステップ S8 で、現在の頂点 Vと 1つ前の頂点 uとが、同一のプレディケート頂点からの制御依存関係を有し、且つその制御依存関係が同一の条件判定フラグに基づくものであるか否かを判定する。この判定結果が NOとなるのは、例えば uと Vとが、 IF文の内部と外部とに対応する場合や、 IF文の THEN節と ELSE節とに対応する場合等である。即ち、ステップ S8においては、同一の条件判定に応じて双方共に実行される 2つの頂点であるか否かが判定されて!/、る。

[0120] ステップ S8の判定が YESの場合には、ステップ S9で、現在の基本ブロックに現在の頂点 Vを追加する。ステップ S8の判定が NOの場合には、ステップ S10で、 iをインクリメントして新たな空集合の基本ブロック Bを形成する。その後ステップ S11で、この新たに生成された基本ブロック Bに現在の頂点 Vを追加する。その後ステップ S 12で uと Vとをそれぞれ次の頂点に更新し、ステップ S4に戻り以降の処理を繰り返す。

[0121] 以上の処理により、分岐（IF、 GOTO, LOOP等）や合流を含まない順番に実行される頂点の列である各基本ブロック Bを生成し、これらの基本ブロックを要素とする基本ブロックの集合 Bを生成することができる。分岐や合流を含まない頂点の列とは、固定の 1つの実行順に従い順番に実行される頂点の列のことである。図 21のフローチヤートから分かるように、各プレディケート頂点は単独で 1つの基本ブロック Bを構成し、プレディケート頂点でない 1つの基本ブロックには、途中で分岐も合流もなく固定の 1つの実行順に従い順番に実行される頂点の列が含まれることになる。

[0122] 本発明では、異なる基本ブロックをまたいでの手続き間の依存関係については、先行手続きの終了待ち合わせを行ってから、後続手続きを実行するようにする。また同一の基本ブロック内部で依存関係がある手続きの実行につ!/、ては、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより手続きを実行する。即ち、基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置することにより、依存関係を満たすように手続き制御する。また同一の基本ブロック内部で依存関係がある手続きについては後続手続きの先行手続きへの依存関係を明示的に登録する命令を生成するようにして、依存関係を満たすように手続き制御する。このような構成とすることで、複雑な制御の依存関係が存在する基本ブロック間については、手続きの実行を待ち合わせにより実現することで制御プログラムの生成を容易なものとし、実行順が固定である同一基本ブロック内については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより無駄な待ち合わせ時間をなくすことができる。

[0123] 以上により、基本ブロックを抽出することができる。即ち、図 6のステップ S2の処理が実行される。

[0124] 以下にお!/、て、制御プログラムを生成する処理や生成した制御プログラムの具体例等について説明する。以下の説明は、依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を共有メモリで実現する第 1の実施例と、依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を分散メモリで実現する第 2の実施例とで異なる。

[0125] まず依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を共有メモリで実現する第 1の実施例について説明する。

[0126] 図 22は、制御プログラムを生成する処理のフローチャートを示す図である。図 22に示す処理は、図 6のステップ S4 (及び S5)の処理に相当する。図 22の処理の入力は、実行順序関係が決定された縮退したプログラム依存グラフ及び基本ブロックの集合 Bである。

[0127] ステップ S1において、プログラムの先頭を表すエントリ頂点 V の直下の子頂点 V

Entry

を要素とする基本ブロックの集合を B'とする。ステップ S2において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S3で、 Bについての手続き制御プログラムを生成する。ステップ S4で、手続きの終了待ち合わせを生成する。

[0128] 図 23は、基本ブロックの集合 B'の要素 B以下の手続き制御プログラムを生成する処理を示すフローチャートである。図 23の処理は、図 22のステップ S3に相当する。図 23に示す処理の入力は縮退したプログラム依存グラフ PDG及び基本ブロック要素 Bである。

[0129] なおここでは、全ての手続き呼び出しを待ち合わせる方法と、制御の流れによって、待ち合わせが行なわれな!/、可能性がある全ての手続き呼び出しを待ち合わせる方法の 2つが考えられる。制御の流れによらず必ず待ち合わせが行なわれる頂点 V'の集合は次のように表現できる。

國

V'={veV |つョ u Bi ν→ω uEE 且つ ve≡Bi 且つ

(uが vの祖先或いは「ョ w w→_cL_UEE 且つ w→c^Lxe≡E (x=v又は vの祖先)）

従って、待ち合わせが行なわれない頂点の集合 V"は、プログラム ·ブロック頂点の集合 VPBと頂点集合 V'の差分 V"=VPB-V'として表現できる。

[0130] 図 23のステップ S 1で、基本ブロック Bの要素（頂点）の種類を判定する。基本ブロック Bの要素である頂点の種類を判定することによって、基本ブロック Bがプログラム' ブロックの集合である力、、プレディケート頂点であるかが分かる。

[0131] ステップ S1の判定の結果、基本ブロック Bがプログラム.ブロックの集合の場合は、基本ブロック Bに属する頂点の手続きを呼び出す文とその間の依存関係を登録する文とを生成することとなる。具体的には、まずステップ S2において、基本ブロックの先行手続きに対する待ち合わせを生成する。この際、ブロック外からブロック内へのフロー依存関係に関して、手続きの終了待ち合わせを生成する。また同時に、定義順序関係及び逆依存関係、出力依存関係に関しても、手続きの終了待ち合わせを生成する。これは、共有メモリ上の同一変数に対して、データが読み書きされる順を保証するための待ち合わせである。ここでは、次の 5種類の依存関係について、出力元頂点の手続き終了待ち合わせを生成する。

[0132] 1. Bへのループ繰越フロー依存辺

2. Bから B (i≠x)へのループ独立フロー依存辺

3. Bへの定義順序関係、

4. Bへの逆依存関係、

5. Bへの出力依存関係

なお同一頂点への待ち合わせが複数ある場合は、 1つの待ち合わせに集約する。

[0133] 次にステップ S3で、基本ブロック Bの各頂点 Vについて、実行順序の順番で以降の処理を繰り返すループを開始する。ステップ S4で、頂点 Vの非同期遠隔手続き呼び出しを生成する。ステップ S5で、基本ブロック Bに属する頂点から頂点 Vへのループ独立フロー依存関係に関して依存関係を登録する文を生成する。基本ブロック Bの全ての頂点 Vについてこれらの処理を繰り返した後に、ステップ S6で、実行開始を指示する文を生成する。

[0134] ステップ S1の判定の結果、基本ブロック Bがプリディケート頂点 Vの場合は、頂点 V の表す制御構造を生成する。まずステップ S7で、基本ブロック Bの要素 Vの先行手続きに対する待ち合わせを生成する。即ち、条件式で参照する変数の値を確定するために、入力フロー依存辺について、先行する手続き呼び出しを待ち合わせる文を生成する。ここでは、当該頂点の外のループを繰り越すフロー依存辺と、当該頂点へのループ独立フロー依存辺との 2種類のデータ依存入力辺について、出力元頂点の手続き終了待ち合わせを生成する。

[0135] 次にステップ S8で、頂点 Vのプレディケートの種類を判定する。プレディケ一トがループである場合には、ステップ S9に進む。プレディケートが if文である場合には、ステップ S I 4に進む。

[0136] ステップ S8の判定結果がループを示す場合には、ステップ S9において、入力逐次プログラムにお!/、て相当する for文或いは while文を生成する。次にステップ S 10にぉレ、て、頂点 Vへの L=Tの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S11において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S 12で、 Bについての手続き制御プロダラムを生成する。このステップ S 12は入れ子構造となっており、 Bについてステップ S12 を実行することは、この Bについて図 23全体のフローチャートを実行することに相当する。

[0137] ループの終了後、ステップ S13で、頂点 Vへのループを繰り越す先行手続きの終了待ち合わせを生成する。これは、ループを繰り越して条件を判定するので、本文の末尾に、条件式への入力データ待ち合わせ（自ループを繰り越す入力フロー依存辺）を行なう文を追加するものである。

[0138] ステップ S8の判定結果が if文を示す場合には、ステップ S14において、 if文を生成する。次にステップ S 15で、 then節を生成する。ステップ S 16で、頂点 vへの L=Tの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S 17 において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S 18で、 Bについての手続き制御プログラムを生成する。このステップ S 18は入れ子構造となっており、 Bについてステップ S 18を実行することは、この Bについて図 23全体のフローチャートを実行することに相当する。なおステップ S17及び S 18で生成された文が、 then節の本文を構成することになる。

[0139] 次にステップ S 19で、頂点 Vへの L=Fの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S20で、基本ブロックの集合 B'が空集合であるか否かを判定し、空集合の場合には処理を終了する。基本ブロックの集合 B'が空集合でない場合、ステップ S21で、 else節を生成する。ステップ S22で、 B'の各要素 B について、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S23で、 B についての手続き制御プログラムを生成する。このステップ S23は入れ子構造となつており、 Bについてステップ S23を実行することは、この Bについて図 23全体のフロ一チャートを実行することに相当する。なおステップ S22及び S23で生成された文が、 else節の本文を構成することになる。

[0140] 以上の処理を実行することで、基本ブロック B以下の手続き制御プログラムが生成される。図 24は、第 1の実施例の場合の手続き制御プログラムの構造を示す図であ

[0141] 図 24に示されるように、本発明の第 1の実施例の場合の制御プログラムは、変数の宣言初期化部分 41、プレディケートへの入力データ待合わせ部分 42、プレディケ一トの制御構造の生成部分 43、基本ブロックへの入力データ'依存関係の待ち合わせ部分 44、基本ブロック内のスレッド起動と依存関係登録部分 45、及び手続きの終了の待ち合わせ終了処理部分 46を含む。基本ブロックへの入力データ'依存関係の待ち合わせ部分 44では、非同期遠隔手続き呼び出しの起動、依存関係の登録、手続きのディスパッチ（実行開始）を行う。

[0142] なお第 1の実施例においては、複数のプロセッサに共通の共有メモリを用いる。共有メモリを用いる場合、非同期遠隔手続き呼び出しを指示した段階では、先行する手続きの結果が得られていない可能性があり、引数として値を渡すことができない場合がある。そこで、手続きの入出力データは、共有メモリ上の適切な場所に格納されるものとし、そのアドレスを渡すこととする。

[0143] 即ち、手続きの生成においては、入力変数の値が格納されるアドレスと出力結果を格納するアドレスとを手続きの引数とするように、手続きを構成する。更に、頂点の部分プログラムが使用したり定義したりする変数であって、入力の変数以外の変数を求め、それらの変数に対する宣言部を生成する。更に、部分プログラムを出力し、最後に、引数として受け取ったアドレスに対して、出力する変数の値を代入する文を生成する。

[0144] このように共有メモリの場合は、特定のメモリ領域への値の書き込み/参照という形で、入出力データを受け渡す。そのため、データの依存関係から、値を書き込む手続きの完了を待ち合わせて、後続の値を参照する手続きを実行することとなる。

[0145] 以下に、第 1の実施例により生成された手続きプログラム及び手続き制御プログラムにつ!/、て、その構成及び動作を具体的な例を用いて説明する。 [0146] 図 25は、（a)入力逐次プログラムの部分及び (b)対応する縮退プログラム依存ダラフを示す図である。図 25 (a)に示す入力逐次プログラムからプログラム依存グラフを生成し、頂点を結合して縮退することにより、（b)に示す縮退プログラム依存グラフが生成される。頂点 V力、ら Vが存在し、頂点 Vは縮退により文の集合となっている。

0 6 4

[0147] 図 26は、図 25の縮退プログラム依存グラフから第 1の実施例に従い生成される手続き制御プログラムである。最初に変数の宣言があり、使用する変数 X, y, z , a, b, p を宣言する。その後、まず頂点 Vに対応する手続き νθの開始を登録する（文 51)。そ

0

の後のディスパッチ命令（dispatch)により、実行可能手続きである手続き νθが実行される。

[0148] 図 25 (a)に示す逐次プログラムの while文の中は、（b)に示す縮退プログラム依存グラフの頂点 V乃至 Vに対応し、 1つの基本ブロックに相当する。この基本ブロック中

2 5

の頂点 V乃至 Vのうちで、 Vは定義順序関係に従い Vを待ち合わせる必要があり、 V

2 5 3 0

はループ繰越フロー依存に従い Vを待ち合わせる必要がある。従って、文 52でこれ

2 5

らの待ち合わせを実現する。

[0149] 基本ブロック中のグラフの頂点 V乃至 Vについては、手続きと依存関係の登録文 5

2 5

3により、手続きと依存関係とを登録する。即ち、頂点 V乃至 Vに対応する手続き v2

2 5

乃至 v5を登録すると共に、 Vが Vに依存し、 Vが Vに依存することが登録される。即

3 2 5 4

ち、 a = C (x)は x = B (z)が終了しないと実行できないし、 z = F (y)は y=E (p)が終了しないと実行できない。なお手続き及び依存関係の登録と手続きの実行とについては、図 2に示した仕組みと同様であり、手続き呼出しプログラム 3が管理する各プロセッサ毎のキューに手続きと依存関係を登録し、実行可能状態となった手続きを順次実行していく。具体的に、これらの手続きと依存関係の登録文 53の後に、ディスパツチ文 54により実行を指示する。このディスパッチ命令により、上記頂点 V乃至 Vに

2 5 対応する手続き v2乃至 v5は、各々実行可能状態となると直ちに実行される。

[0150] whileループの最後で、 vの終了待ち合わせを設定する。これは vにより while文

4 4

の条件の変数 Pが計算されるためである。

[0151] whileループの後、 Vに対応する手続き v6を実行する前には、 vに対する手続き

6 3

終了待ち合わせが設定される（文 56)。これは Vが Vに依存し、且つ Vと Vとが異なる基本ブロックに属するからである。

[0152] 図 27は、以上の手続き制御プログラムの動作を手続きプログラムの実行とともに示す模式図である。図 27では、プロセッサ 0と手続き vO、 v2乃至 v6にそれぞれ対応するプロセッサとが用いられる。プロセッサ 0により手続き制御プログラムを実行する。

[0153] まず手続き νθの手続きプログラム 61が、対応するプロセッサにより実行される。 whi le文の条件が成立すると、手続き νθが実行中であるので、 νθの終了を待ち合わせす

[0154] 手続き νθが終了し、手続きと依存関係が登録され、ディスパッチ命令が実行されると、手続き v2と v4とにそれぞれ対応する手続きプログラム 62及び 64が、対応するプ口セッサにより実行される。また登録された依存関係に基づいて、 v2が終了すると直ちに、手続き v3の手続きプログラム 63が対応するプロセッサにより実行される。同様に、登録された依存関係に基づいて、 v4が終了すると直ちに、手続き v5の手続きプログラム 65が対応するプロセッサにより実行される。

[0155] なお v2はループ繰越フロー依存に従い v5を待ち合わせる必要がある。従って、 wh ile文の次のループに入った際に、手続き v5の手続きプログラム 65が実行中の間は V 2や _V4の手続きは実行されずに、手続き v5の終了を待ち合わせることになる。

[0156] while文のループが終了すると、手続き v3の終了を待ち合わせてから、手続き v6の手続きプログラム 66が対応するプロセッサにより実行される。

[0157] この例において、手続き vlが第 1の基本ブロックに属し、手続き v2乃至 v5が第 2の基本ブロックに属し、手続き v3が第 3の基本ブロックに属する。このように、異なる基本ブロックをまたいでの手続き間の依存関係（例えば v3から νθへの依存関係）については、先行手続きの終了待ち合わせを行ってから、後続手続きを実行するようにする。また同一の基本ブロック内部で依存関係がある手続き v2乃至 v5の実行については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより手続きを実行する。このような構成とすることで、複雑な制御の依存関係が存在する基本ブロック間については、手続きの実行を待ち合わせにより実現することで制御プログラムの生成を容易なものとし、実行順が固定である同一基本ブロック内については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより無駄な待ち合わせ時間をなくすことができる。 [0158] 以下に、依存関係待ち合わせ付き非同期遠隔手続き呼び出し方式を分散メモリで実現する第 2の実施例について説明する。図 28は、第 2の実施例の場合の制御プログラムを生成する処理のフローチャートを示す図である。図 28に示す処理は、図 6のステップ S4 (及び S5)の処理に相当する。図 28の処理の入力は、実行順序関係が決定された縮退したプログラム依存グラフ及び基本ブロックの集合 Bである。

[0159] ステップ S1において、プログラムの先頭を表すエントリ頂点 V の直下の子頂点 V

Entry

を要素とする基本ブロックの集合を B'とする。ステップ S2において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S3で、 Bについての手続き制御プログラムを生成する。ステップ S4で、手続きの出力データ転送待ち合わせを生成する。

[0160] 図 29は、基本ブロックの集合 B'の要素 B以下の手続き制御プログラムを生成する処理を示すフローチャートである。図 29の処理は、図 28のステップ S3に相当する。図 29に示す処理の入力は縮退したプログラム依存グラフ PDG及び基本ブロック要素 Bである。

[0161] 図 29のステップ S 1で、基本ブロック Bの要素（頂点）の種類を判定する。基本ブロック Bの要素である頂点の種類を判定することによって、基本ブロック Bがプログラム' ブロックの集合である力、、プレディケート頂点であるかが分かる。

[0162] ステップ S1の判定の結果、基本ブロック Bがプログラム.ブロックの集合の場合は、基本ブロック Bに属する頂点の手続きを呼び出す文とその間の依存関係を登録する文とを生成することとなる。具体的には、まずステップ S2において、基本ブロック Bへの入力の待ち合わせを生成する。この際、ブロック外からブロック内へのフロー依存関係に関して、データ転送の待ち合わせを生成する。また定義順序関係及び逆依存関係、出力依存関係に関しても、データ転送の待ち合わせを生成する。即ち、次の 5 種類の辺につ!/、て待ち合わせを生成する。

[0163] 1. Bの要素へのループ繰越フロー依存辺

2. Bの要素から Bの要素（i≠x)へのループ独立フロー依存辺

3. Bの要素への定義順序関係

4. Bの要素への逆依存関係 5. Biの要素への出力依存関係

なお逆依存関係がある場合は、先行頂点の手続きの終了待ち合わせを生成する。これは、制御プログラム上の同一変数に対して、データが転送される順を保証するための待ち合わせである。

[0164] 次にステップ S3で、基本ブロック Bの各頂点 Vについて、実行順序の順番で以降の処理を繰り返すループを開始する。ステップ S4— 1で、基本ブロックを越える頂点 V への入力データ転送指示及び実行結果の出力データ転送指示を生成する。具体的には、ブロックを越えるデータ依存関係がある場合は、制御プロセッサ上の変数にデータがあるため、手続きを実行するプロセッサに対してこのデータを転送する。具体的には、次の 2種類の辺について制御プロセッサ力、ら遠隔プロセッサへのデータ転送を生成する。

[0165] 1.頂点 Vへのループ繰越フロー依存辺

2. Bの要素でな!/、uから頂点 Vへのループ独立フロー依存辺

次にステップ S4— 2で、頂点 Vの遠隔手続き呼び出しを行う文を生成する。

[0166] 更にステップ S5— 1で、入力データ転送への依存関係を登録する文を生成する。

ブロック内のデータ依存の場合は、先行する手続きから直接データが転送されるため、これに対する依存関係を登録する。

[0167] 更にステップ S5— 2で、頂点 Vからの実行結果のデータ転送を指示する文を生成する。この際、基本ブロック越えない手続きへのデータ依存の場合は、後続手続きを実行するプロセッサに直接データ転送する。また基本ブロックを越えるデータ転送の場合は、制御プロセッサへとデータを転送する。またステップ S5— 2では、これらのデータ転送指示から手続き呼び出しへの依存関係を登録する文も併せて生成する。

[0168] 基本ブロック Bの全ての頂点 Vについて上記の処理を繰り返した後に、ステップ S6 で、実行開始を指示する文を生成する。

[0169] ステップ S1の判定の結果、基本ブロック Bがプリディケート頂点 Vの場合は、頂点 V の表す制御構造を生成する。まずステップ S 7で、基本ブロック Bの要素 Vへのデータ転送待ち合わせを生成する。即ち、条件式で参照する変数の値を確定するために、入力フロー依存辺の待ち合わせを行なう文を生成する。ここでは、当該頂点の外のループを繰り越すフロー依存辺と、当該頂点へのループ独立フロー依存辺との 2種類の辺につ!/、て待ち合わせを生成する。

[0170] 次にステップ S8で、頂点 Vのプレディケートの種類を判定する。プレディケ一トがループである場合には、ステップ S9に進む。プレディケートが if文である場合には、ステップ S 14に進む。

[0171] ステップ S8の判定結果がループを示す場合には、ステップ S9において、入力逐次プログラムにお!/、て相当する for文或いは while文を生成する。次にステップ S 10にぉレ、て、頂点 Vへの L=Tの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S11において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S 12で、 Bについての手続き制御プロダラムを生成する。このステップ S 12は入れ子構造となっており、 Bについてステップ S12 を実行することは、この Bについて図 29全体のフローチャートを実行することに相当する。

[0172] ループの終了後、ステップ S13で、プレディケート頂点 Vへのデータ転送待ち合わせを生成する。これは、ループを繰り越して条件を判定するので、本文の末尾に、条件式への入力データ待ち合わせ（自ループを繰り越す入力フロー依存辺）を行なう文を追加するものである。

[0173] ステップ S8の判定結果が if文を示す場合には、ステップ S14において、 if文を生成する。次にステップ S 15で、 then節を生成する。ステップ S 16で、頂点 vへの L=Tの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S 17 において、 B'の各要素 Bについて、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S 18で、 Bについての手続き制御プログラムを生成する。このステップ S 18は入れ子構造となっており、 Bについてステップ S 18を実行することは、この Bについて図 29全体のフローチャートを実行することに相当する。なおステップ S17及び S 18で生成された文が、 then節の本文を構成することになる。

[0174] 次にステップ S 19で、頂点 Vへの L=Fの制御依存関係がある頂点 uを要素とする基本ブロックの集合を B'とする。ステップ S20で、基本ブロックの集合 B'が空集合であるか否かを判定し、空集合の場合には処理を終了する。基本ブロックの集合 B'が空集合でない場合、ステップ S21で、 else節を生成する。ステップ S22で、 B'の各要素 B について、 iの昇順に以降の処理を繰り返すループを開始する。ステップ S23で、 B についての手続き制御プログラムを生成する。このステップ S23は入れ子構造となつており、 Bについてステップ S23を実行することは、この Bについて図 29全体のフロ一チャートを実行することに相当する。なおステップ S22及び S23で生成された文が、 else節の本文を構成することになる。

[0175] 以上の処理を実行することで、基本ブロック B以下の手続き制御プログラムが生成される。図 30は、第 2の実施例の場合の手続き制御プログラムの構造を示す図であ

[0176] 図 30に示されるように、本発明の第 2の実施例の場合の制御プログラムは、変数の宣言初期化部分 71、プレディケートへの入力データ待合わせ部分 72、プレディケ一トの制御構造の生成部分 73、基本ブロックへの入力データ待ち合わせ部分 74、基本ブロック内のスレッド起動と依存関係登録部分 75、及び手続き及びデータ転送の待ち合わせ終了処理部分 76を含む。基本ブロックへの入力データ待ち合わせ部分 74では、手続きの入力データの転送指示、遠隔手続き呼び出しの起動指示、手続きの出力データの転送指示、及び依存関係の登録を行う。第 2の実施例では、手続き間の待ち合わせは、データ転送の待ち合わせとなる。

[0177] 第 2の実施例では、各プロセッサに設けた個別のメモリである分散メモリを使用する。この場合、手続きの入力データは、制御プロセッサから実行するプロセッサに転送するものとし、出力データは遠隔プロセッサから制御プロセッサに転送されるものとする。ただし、基本ブロック内については、手続きを実行するプロセッサ間で、直接データの転送を行うものとする。

[0178] 即ち、手続きの生成においては、入出力変数のためのデータ領域は予め用意し、入力データは予め実行するプロセッサ上に転送されているものとする。また、実行結果は、実行するプロセッサ上に格納し、制御プログラムによって必要とされるプロセッサへ適宜その値を転送されるものとする。

[0179] 更に、頂点の部分プログラムが使用したり定義したりする変数であって、入力の変数以外の変数を求め、それらの変数に対する宣言部を生成する。更に、部分プログラムを出力し、最後に、引数として受け取ったアドレスに対して、出力する変数の値を代入する文を生成する。

[0180] 以下に、第 2の実施例により生成された手続きプログラム及び手続き制御プログラムにつ!/、て、その構成及び動作を具体的な例を用いて説明する。

[0181] この例で用いる入力逐次プログラムの部分及び縮退プログラム依存グラフは、第 1 の実施例の場合と同じであり、図 25 (a)及び (b)にそれぞれ示すものである。図 25 (a )に示す入力逐次プログラムからプログラム依存グラフを生成し、頂点を結合して縮退することにより、（b)に示す縮退プログラム依存グラフが生成される。頂点 V力 Vが

0 6 存在し、頂点 Vは縮退により文の集合となっている。

4

[0182] 図 31は、図 25の縮退プログラム依存グラフから第 2の実施例に従い生成される手続き制御プログラムを示す図である。最初に変数の宣言があり、使用する変数 X, y, z , a, b, pを宣言する。第 2の実施例では分散メモリを想定しているので、各頂点 V及

0 び V乃至 Vに対応する手続き νθ及び v2乃至 v6のそれぞれについて、入力のデータ

2 6

転送指示及び入力のデータ転送に対する手続きの依存関係、並びに、実行結果のデータ転送指示及び手続きに対する実行結果のデータ転送指示の依存関係が規定される。例えば、頂点 Vに対応する手続き νθの場合、入力のデータ転送指示 81、手

0

続き νθの呼び出し指示 82、入力のデータ転送に手続き νθが依存するという依存関係の指定 83、実行結果のデータ転送指示 84、及び手続き νθに実行結果のデータ転送が依存するという依存関係の指定 85が規定されており、これらが登録されることになる。その後のディスパッチ命令により手続き νθが実行される。

[0183] データ転送指示及びその依存関係の指示が含まれて!/、ることを除!/、て、プログラムの制御構造は図 26の場合と同様である。従って、詳細な説明については省略する。

[0184] 図 32は、以上の手続き制御プログラムの動作を手続きプログラムの実行とともに示す模式図である。図 32では、プロセッサ 0と手続き vO、 v2乃至 v6にそれぞれ対応するプロセッサとが用いられる。また更に、データ転送ユニット DTU # 0乃至 DTU # 3 が用いられる。プロセッサ 0により手続き制御プログラムを実行する。

[0185] まずデータ転送ユニット DTU # 0により、データ aを手続き νθのプロセッサに転送する。それに応じて、手続き νθの手続きプログラム 91が、対応するプロセッサにより実行される。 while文の条件が成立すると、手続き νθの実行結果の転送が未完了であるので、 νθからのデータ転送を待ち合わせする。

[0186] 手続き νθからデータ aがプロセッサ 0に転送されると、それに応答して、手続き v2と v 4とにそれぞれ対応する手続きプログラム 92及び 94が、対応するプロセッサにより実行される。この際、データ転送ユニット DTU # 1によりデータ z及び Xを転送する。またデータ転送ユニット DTU # 2によりデータ pを転送する。

[0187] また登録された依存関係に基づいて、データ転送ユニット DTU # 1を介した手続き v2の出力データ Xの転送に応答して、手続き v3の手続きプログラム 93が対応するプ口セッサにより実行される。同様に、登録された依存関係に基づいて、データ転送ュニット DTU # 3を介した手続き v4の出力データ yの転送に応答して、手続き v5の手続きプログラム 95が対応するプロセッサにより実行される。

[0188] なお v2はループ繰越フロー依存に従!/、v5のデータ zを待ち合わせる必要がある。

従って、 while文の次のループに入った際に、手続き v5の手続きプログラム 95が実行中の間は v2や v4の手続きは実行されずに、手続き v5の終了によるデータ zの転送を待ち合わせることになる。

[0189] while文のループが終了すると、手続き v3の出力データ aの転送を待ち合わせてから、手続き v6の手続きプログラム 96が対応するプロセッサにより実行される。

[0190] この例において、手続き vlが第 1の基本ブロックに属し、手続き v2乃至 v5が第 2の基本ブロックに属し、手続き v3が第 3の基本ブロックに属する。このように、異なる基本ブロックをまたいでの手続き間の依存関係（例えば v3から νθへの依存関係）については、先行手続きからのデータ転送待ち合わせを行ってから、後続手続きを実行するようにする。また同一の基本ブロック内部で依存関係がある手続き v2乃至 v5の実行については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより手続きを実行する。このような構成とすることで、複雑な制御の依存関係が存在する基本プロック間については、手続きの実行を待ち合わせにより実現することで制御プログラムの生成を容易なものとし、実行順が固定である同一基本ブロック内については、依存関係待ち合わせ付き非同期遠隔手続呼び出しにより無駄な待ち合わせ時間をなくすこと力 Sでさる。 [0191] 図 33は、本発明による並列化プログラム生成方法を実行する装置の構成を示す図である。

[0192] 図 33に示されるように、本発明による並列化プログラム生成方法を実行する装置は、例えばパーソナルコンピュータやエンジニアリングワークステーション等のコンビュータにより実現される。図 33の装置は、コンピュータ 510と、コンピュータ 510に接続されるディスプレイ装置 520、通信装置 523、及び入力装置よりなる。入力装置は、例えばキーボード 521及びマウス 522を含む。コンピュータ 510は、 CPU511 , RA M512、 ROM513、ハードディスク等の二次記憶装置 514、可換媒体記憶装置 515 、及びインターフェース 516を含む。

[0193] キーボード 521及びマウス 522は、ユーザとのインターフェースを提供するものであり、コンピュータ 510を操作するための各種コマンドや要求されたデータに対するュ一ザ応答等が入力される。ディスプレイ装置 520は、コンピュータ 510で処理された結果等を表示すると共に、コンピュータ 510を操作する際にユーザとの対話を可能にするために様々なデータ表示を行う。通信装置 523は、遠隔地との通信を行なうためのものであり、例えばモデムやネットワークインターフェース等よりなる。

[0194] 本発明による並列化プログラム生成方法は、コンピュータ 510が実行可能なコンビユータブログラムとして提供される。このコンピュータプログラムは、可換媒体記憶装置 515に装着可能な記憶媒体 Mに記憶されており、記憶媒体 Mから可換媒体記憶装置 515を介して、 RAM512或いは二次記憶装置 514にロードされる。或いは、このコンピュータプログラムは、遠隔地にある記憶媒体（図示せず）に記憶されており、この記憶媒体から通信装置 523及びインターフェース 516を介して、 RAM512或いは二次記憶装置 514にロードされる。

[0195] キーボード 521及び/又はマウス 522を介してユーザからプログラム実行指示があると、 CPU511は、記憶媒体 M、遠隔地記憶媒体、或いは二次記憶装置 514からプログラムを RAM512にロードする。 CPU511は、 RAM512の空き記憶空間をワークエリアとして使用して、 RAM512にロードされたプログラムを実行し、適宜ユーザと対話しながら処理を進める。なお ROM513は、コンピュータ 510の基本動作を制御するための制御プログラムが格納されて!/、る。 [0196] 上記コンピュータプログラム（並列化プログラム生成プログラム即ち並列化プロダラム生成コンパイラ）を実行することにより、コンピュータ 510が、上記各実施例で説明されたように並列化プログラム生成方法を実行する。

[0197] 以上、本発明を実施例に基づいて説明したが、本発明は上記実施例に限定されるものではなぐ特許請求の範囲に記載の範囲内で様々な変形が可能である。

[0198] 本国際出願は 2006年 9月 29日に出願した日本国特許出願 2006— 269632号に基づく優先権を主張するものであり、 2006— 269632号の全内容を本国際出願に援用する。

Claims

請求の範囲

[1] 逐次プログラムを入力として、該逐次プログラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、

該プログラム依存グラフの該頂点同士を融合することにより該頂点の数を減少させた縮退プログラム依存グラフを生成し、

該縮退プログラム依存グラフの頂点の実行順序を計算し、

該実行順序を与えられた該複数の頂点のうちで分岐及び合流の何れも含まずに順番に実行される頂点列を基本ブロックとして纏め、

該縮退プログラム依存グラフの頂点の各々に相当する手続きを生成し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きを待ち合わせる命令の後に後続手続きを実行する命令を配置し、同一の基本ブロック内部で依存関係がある手続きについては先行手続きに対する後続手続きの依存関係を登録する命令を生成するようにして、該手続きの実行を制御する手続き制御プログラムを生成する

各段階を含むことを特徴とする並列化プログラム生成方法。

[2] 該手続き制御プログラムを生成する段階は、プロセッサに共通の共有メモリへの値の書き込み及び参照により該手続き間のデータの転送を実現し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きの終了を待ち合わせてから後続手続きを実行するように該手続き制御プログラムを生成することを特徴とする請求項 1記載の並列化プログラム生成方法。

[3] 該手続き制御プログラムを生成する段階は、プロセッサ毎に設けた分散メモリへの値の書き込み及び参照により該手続き間のデータの転送を実現し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きからのデータ転送を待ち合わせてから後続手続きを実行するように該手続き制御プログラムを生成することを特徴とする請求項 1記載の並列化プログラム生成方法。

[4] 該手続き制御プログラムを生成する段階は、入力データのデータ転送に対する手続きの依存関係を登録する命令及び手続きに対する出力データのデータ転送の依存関係を登録する命令を生成することを特徴とする請求項 3記載の並列化プログラム生成方法。

[5] 該実行順序を計算する段階において、該縮退プログラム依存グラフを静的単一代入形式に変換する段階を含むことを特徴とする請求項 2記載の並列化プログラム生成方法。

[6] 逐次プログラムと並列化プログラム生成プログラムとを格納するメモリと、

該メモリに格納された該並列化プログラム生成プログラムを実行することで該メモリに格納された該逐次プログラムから並列化プログラムを生成する演算処理ユニットを含み、該演算処理ユニットは、該並列化プログラム生成プログラムを実行することにより、

該逐次プログラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、

該縮退プログラム依存グラフの頂点の実行順序を計算し、

ことを特徴とする並列化プログラム生成装置。

[7] 該演算処理ユニットは、プロセッサに共通の共有メモリへの値の書き込み及び参照により該手続き間のデータの転送を実現し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きの終了を待ち合わせてから後続手続きを実行するように該手続き制御プログラムを生成することを特徴とする請求項 6記載の並列化プログラム生成装置。

[8] 該演算処理ユニットは、プロセッサ毎に設けた分散メモリへの値の書き込み及び参照により該手続き間のデータの転送を実現し、該基本ブロック間をまたいでの依存関係がある手続きについては先行手続きからのデータ転送を待ち合わせてから後続手続きを実行するように該手続き制御プログラムを生成することを特徴とする請求項 6記載の並列化プログラム生成装置。

[9] 該演算処理ユニットは、入力データのデータ転送に対する手続きの依存関係を登録する命令及び手続きに対する出力データのデータ転送の依存関係を登録する命令を生成することを特徴とする請求項 8記載の並列化プログラム生成装置。

[10] 逐次プログラムを入力として、該逐次プログラムを構成する各文を頂点として有するとともに、文と文の間の関係を該頂点間の辺として有するプログラム依存グラフを生成し、

該縮退プログラム依存グラフの頂点の実行順序を計算し、

該実行順序を与えられた該複数の頂点のうちで分岐及び合流の何れも含まない頂点列を基本ブロックとして纏め、

各段階を計算機に実行させるコードを含むことを特徴とする並列化プログラム生成プログラム。