JPH01194032A

JPH01194032A - 並列コンパイル方法

Info

Publication number: JPH01194032A
Application number: JP1707288A
Authority: JP
Inventors: Teruo Tanaka; 輝雄田中; Shigeo Ihara; 茂男井原; Naoki Hamanaka; 濱中　直樹; Kyoko Iwazawa; 岩澤　京子
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1988-01-29
Filing date: 1988-01-29
Publication date: 1989-08-04

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、並列計算機システムに係り、特に逐次実行型
の高級言語で記述されたソース・プログラムから、並列
に実行するのに好適′なオブジェクトプログラムを生成
する方式に関する。

〔従来の技術〕

各プロセッサがそれぞれ記憶装置を持つような並列シス
テムが実現されている。このようなシステムのプロセッ
サ間データ通信として、メツセージ通信が知られている
。この通信方式では、転送データにそのデータを他の転
送データと識別するためのデータ識別子を付けることに
より、送受信プロセッサ間で転送データの一致性を保証
している。

たとえば、複数台のＴｒａｎｓｐｕｔｅｒを結合したシ
ステムを動作させる言語Ｏｃｅａｍにおいては、プロセ
ス間の識別子として、チャネルを用いていることが、ア
イコツト、ザ　トランスピユータ　インプリメンテーシ
ョンオブオツカム、エフ、ジー。

シー、ニス（１９８４年）第５３３頁から第５４１頁ま
で（ＩＣ０Ｔ、　Ｔｈｅ　Ｔｒａｎｓｐｕｔｅ　Ｉｍｐ
ｌｉｍｅｎｔａｔｉｏｎｏｆ　ＯＣＣＡＭ、　ＦＧＣ３
（１９８４）、　ｐｐ５３３−５４１）。

において論じられている。つまり、データの送受信を行
いたい２つのプロセス間で、同じチャネルを指定し、さ
らに送受信時に同期を取ることにより、送受信処理の対
応関係を保障している。毎回、同期をとることにより、
別のデータの送受信時に同じチャネルを指定することが
できる。

一方、第２図に示すような並列処理システムでは、送信
処理と送信処理が独立に行われる。このシステムは、特
願昭６１−１８２３６１に詳細に記載されている。この
並列処理システムを簡単に説明すると、（１）このシステムはホスト計算機２１と並列処理部２
２から構成され、さらに、並列処理部２２は複数台のプ
ロセッサ２３と任意のプロッサ間でデータ転送可能なネ
ッワーク２４から構成される。

（２）各プロセッサ２３は、プログラムやデータを保持
するローカルメモリ２５と、ローカルメモリ２５から順
次命令を読み出し、実行する命令処理部２６と、送信部
２７および受信部２８から構成される。

（３）データ送信処理は、送信命令（５ｅｎｄ命令）を
実行することにより実現される。命令処理部２６におい
て５ｅｎｄ命令が解読されると、そのオペランドで指定
したレジスタから、転送先プロセッサ番号、データ識別
子およびデータを送信部２７のレジスタ３２にセットす
る。レジスタ３２の３つの情報は、メツセージとして、
ネットワーク２４に送られる。ネットワーク２４上のメ
ツセージは、メツセージ内の転送先プロセッサ番号で示
されたプロセッサの受信部内受信バッファ２９に、デー
タ識別子３ｏとデータ３１の組として取り込まれる。

（４）データ受信処理は、受信命令（Ｒｅｃｅｉｖｅ命
令）を実行することにより実現される。命令処理部２６
においてＲｅｃｅｉｖｅ命令が解読されると、そのオペ
ランドで指定したレジスタから検索用の識別子を取り出
し、受信部２８に送る。受信部２８では、受信バッファ
２９の中から、検索用の識別子と一致するデータ識別子
を検索する。もし、一致するデータ識別子がない場合は
、一致するデータ識別子が到着するまで待つ、もし、一
致するデータ識別子がある場合は命令処理部２６に報告
する。命令処理部２６は対応するデータを取り込む。

このとき、５ｅｎｄ処理とＲｅｃｅｉｖｅ処理は独立に
実行されるため、データ識別子により５ｅｎｄ処理とＲ
ｅｃｅｉｖｅ処理の関係が一意に決まることが重要とな
る。

このデータ識別子の一意性の保証は、プログラム中に表
現されたすべての５ｅｎｄ処理とＲｅｃｅｉｖｅ処理の
組み合わせを区別するだけでは満たされず、プログラム
中のループ構造などでの処理の流れを考慮する必要があ
る。

たとえば、第６図に示すＤｏループは１文４１と文４２
が並列に実行可能である。このＤｏループを２つのプロ
セッサ１およびプロセッサ２で実行する。それぞれ実行
するプログラムを第７Ａ図、第７Ｂ図に示す。プログラ
ム中送信処理（５ｅｎｄ処理）はサブルーチン形式、受
信処理（Ｒｅｃｅｉｖｅ処理）は関数形式で記述した。

　５ｅｎｄ処理の第１引数は転送先プロセッサ番号（Ｐ
Ｅ番号）、第２引数はデータ識別子、第３引数は転送デ
ータをそれぞれ示す、　Ｒｅｃｅｉｖｅ処理の引数は検
索用の識別子を示す。

Ｄｏループのｉ回目の反復処理において、プロセッサ１
は文４５を実行し、次に文４６を実行する６文４６の実
行はＲｅｃｅｉｖｅ処理を含むので、対応するプロセッ
サ２の文４９の実行が終了し、データＢ（Ｉ−１）がプ
ロセッサ１に届くまで待たされる。データＢ（Ｉ−１）
がプロセッサ１に届くと（プロセッサ２で文４９の実行
を終了した）、プロセッサ１は、文４６を実行し、さら
に、Ｄ。

ループの（ｉ　＋　１　）回目の反復処理を行い、文４
５を実行する。この時、プロセッサ２が、ＤＯルプのｉ
回目の反復処理の文５０を終了している保証はない、そ
のため、プロセッサ２の受信バッファに、同じデータ識
別子を持つデータが２つ格納される可能性がある。した
がって、ＤＯループのｉ回目の反復処理と、Ｄｏループ
の（ｉ＋１）回目の反復処理では、データ識別子を別の
値に設定する必要がある。

このような場合、上記並列処理システムにおいては、ル
ープ構造内にあられれる転送処理に対して、すべて異な
るデータ識別子を用いていた。たとえば、第７図のＤｏ
ループの場合、識別子として、ループ変数工が用いられ
ていた。

以下、プログラム中に表現されたすべての５ｅｎｄ処理
とＲｅｃｅｉｖｅ処理の組み合わせを区別するための識
別子の割りっけを静的な割り付け、また、プログラム中
のループ構造などの処理の流れを考慮した割り付けを動
的な割り付けと表現する。

〔発明が解決しようとする問題点〕

上記従来技術では、プログラム中に動的に実行される５
ｅｎｄ処理とＲｅｃｅｉｖｅ処理の対応する数だけ、デ
ータ識別子が必要である。

しかし、データ識別子は有限長であり、プログラムが大
規模になると、−変周いたデータ識別子を再使用する必
要が生じる。そのため、一意性を保証するために、余計
なプロセッサ間の同期処理命令などを挿入する必要を生
じていた。

また、多重ループなどでは、反復処理ごとにデータ識別
子を区別するために、データ識別子を定数でなく、計算
式としてあられす必要を生じ、その計算ステップの増加
により、性能低下の要因となっていた。

本発明の目的は、コンパイル時に、各プロセッサのルー
プ構造などの処理の流れを調べ、５ｅｎｄ処理とＲｅｃ
ｅｉｖｅ処理の一意性を保つように、かつなるべく定数
として、データ識別子を決定することである。

〔問題点を解決するための手段〕

上記目的は、コンパイラの自動並列化処理において、以
下の処理を施すことにより達成される。

１、プログラム上に表現されるすべての５ｅｎｄ処理と
Ｒｅｃｅｉｖｅ処理の各組み合わせに対して、すべて異
なるデータ識別子をつける。この時、プログラム上に表
現される５ｅｎｄ処理とＲｅｃｅｉｖｅ処理の組み合わ
せの数が、有限長のデータ識別子で表わされる数をこえ
た場合は、プログラムをいくつかに分割して処理する。

２、上記プログラムから、５ｅｎｄ処理を行うＳノード
、Ｒｅｃｅｉｖｅ処理を行うＲノードおよびループ構造
をあられす合流点のノードおよび分岐処理ノードを取出
し、コントロールフローグラムを生成する。コントロー
ルフローグラフはプログラムの実行処理の順序関係をあ
られしている。

３、コントロールフローグラフ中のループ構造内にある
すべての対応するＳノードとＲノードの組について、コ
ントロールフローグラフを逆に探索し、ｉ回目のループ
のＳノードが実行可能となる前に、（ｉ　−１）回目の
ループの対応するＲノードが実行終了されているかどう
かを調べる。

４、もし、実行されていない場合は、そのループを２倍
展開し、１にもどる。ここで２倍展開とは、対象とする
ループ構造内の処理をプログラム表現上２回くり返し、
そのループのループ制御変数の増分値を２倍することで
ある。

以上１〜４の処理を行うことにより、５ａｎｄ処理とＲ
ｅｃｅｉｖｅ処理の対応を示すデータ識別子の一意性を
保証することができる。

〔作用〕

上記１〜４の処理を行うことにより、まず、プログラム
上に表現されているデータ識別子の一意性は保証され、
さらに、ループ構造内のすべてのループｉ回目の５ｅｎ
ｄ処理が実行される前に、対応する（ｉ−１）回目のＲ
ｅｃｅｉｖｅ処理の実行が終了していることが保証され
ている。このために、ループ構造などの処理の流れを考
慮してもデータ識別子の一意性は保障される。

〔実施例〕

以下、プロセッサ間でデータ識別子を用いたメツセージ
通信を行う並列プロセッサシステムのためのＦｏｒｔｒ
ａｎコンパイル方法における本発明の一実施例を図面を
用いて詳細に説明する。

第３図に、本発明を適用するコンパイラ全体の構成を示
す。第３図内の構文解析処理１３が、Ｆｏｒｔｒａｎの
ソースプログラム１１を入力とし、これを中間語７に変
換する。中間処理１４は、この中間語７を入力として、
並列化処理１６や最適化処理１７を行い、中間語７を変
形する。コード生成処理１５は、中間処理１４が変形し
た中間語から並列に実行されるオブジェクトコード１２
を生成する。中間処理中並列化処理１６は、並列性検出
部１８、プログラム分割・データ割付け・データ転送部
の検出部１９を経て、データ識別子の生成１を行う。本
発明は、並列化処理の中のデータ識別子の生成処理に関
するものである。

第３図の並列化処理１６のうち、データ識別子の生成に
関する処理の構成を第１図に示す。

データ識別子の生成処理は、入力データとして、中間語
７を用い、第１図に示す各処理を行い、結果として、中
間語７を書きかえる。さらに本処理中に、コントロール
フローグラムおよび３つのリストＡ、Ｂ、Ｃを用いる。

第３図の入力するソースプログラム１１の例として、第
６図のＦｏｒｔｒａｎプログラムを用いて、以下説明を
行う。本プログラム例では、プロセッサ２台への割りつ
けとしたが、もちろんプロセッサ台数が３台以上への割
りつけに対しても、本方法を用いることができる。さら
に、プログラムを分割したプロセスの割りつけ単位を、
各プロセッサに対して、プロセスを１つとしたが、１台
のプロセッサに複数のプロセスを割りつけてもよい。

第６図のＦｏｒｔｒａｎプログラムは、Ｆｏｒｔｒａｎ
コンパイラ１０（第３図）に入力され、構文解析１３（
第３図）で中間語７に変換される。つぎにこの中間語７
から、並列性の検出１８で、文４１と文４２（第６図）
の並列性が検出され、プログラム分割でプロセッサ１と
プロセッサ２用の２つのプログラムに分割される。各プ
ロセッサで用いられるデータは、データＣおよび配列デ
ータＡがプロセッサ１にねりあてられ、データＤおよび
配列データＢがプロセッサ２にわりあてられる。さらに
、プログラム中のデータ転送部が検出される。

これらは情報は、中間語７を変形することにより、デー
タ識別子生成部１に送られる。

データ識別子生成部１では、まず、静的なデータ識別子
の設定を行う。つまり、並列化されプログラム中に表現
される。すべての５ｅｎｄ処理とＲｅｃｅｉｖｅ処理に
対して、データ識別子を異なる値に設定する。（本プロ
グラム例では、上記の設定で必要なデータ識別子は、有
限長のデータ識別子で表現できる個数以下であるとした
。もし、それでないならば、並列化されたプログラムを
いくつかに分割して、処理を行う。）この静的なデータ識別子の設定２を終了した結果の中間
語７をＦｏｒｔｒａｎで表現したものを第７Ａ図および
第７Ｂ図に示す。

次に、コントロールフローグラフの生成３を行う。コン
トロールフローグラフは、５ｅｎｄ処理を行うＳノード
Ｒｅｃｅｉｖｅ処理を行う１２ノード、およびループ構
造を示す分岐処理ノードと合流点ノードから処理手順を
定義するコントロールフローグラフを生成する。

第７Ａ図および第７Ｂ図に対するコントロールフローグ
ラフを第８図に示す。

このコントロールフローグラフを用いて、並列プログラ
ムの動的フロー解析・変更およびデータ識別子の変更を
行う。

以下、データ識別子生成処理の主な制御を第４図、第５
図のＰＡＤ図を用いて詳細に説明する。

まず、第４図を用いて説明する。準備として、リストＡ
には、探索中のループ構造の番号が、リストＢには、探
索済みのループ構造の番号が登録される。最初は、リス
トＡにもリストＢにも何もつながっていない（処理７０
）。

以下、コントロールフローグラフ中にループ構造がなく
なるまでくりかえし行う（処理７１）。

最内側ループ番号として、１０１をリストＡに登録する
（処理７２）。リストＡから、ループ番号１０１を取り
出しく処理７４）、そのループ内のすべてのＳノード（
５ｅｎｄ処理のノード）に対して次の処理を行う。以下
、第５図を用いて説明する。

変数ＦＬＧをＯに初期設定する（処理８０）。

ＦＬＧは、対象とするＳノードとそれに対応するＲノー
ドとの処理の順序関係を保持する。リストＣには、Ｒノ
ード（Ｒｅｃｅｉｖｅ処理ノード）が変数ａｇｅととも
に登録される。ａｇｅは、ループ中のノードの世代（何
回目の反復かを示す）を保持する。最初は、　リストＣ
には、何もつながっていない（処理８１）。Ｓノード６
１を選びそのノードを８０とする。対応するＲノード６
６をＲＯとし、Ｒｏの属するループ１０２をリストＡに
登録、Ｒ０ノードの属するループ１０２をＲＬｏとする
。さらに、Ｓノードのａｇｅを１とする（処理８２．８
３）。

いま、Ｓノードのａｇｅは１だから、処理８５を行う。

処理８Ｓより、Ｒノード６２がａｇｅを０として、リス
トＣに登録される。

次に、リストＣから、Ｒノード６２を取り出して、対応
するＳノード６５を見つけ、ａｇｅをＯとする。ループ
番号１０２はすでに、リストＡに登録済である（処理８
８）。

Ｓノード６ＳはＲＬｏ内のノードっまり、Ｒ０ノード６
６と同じループの中にあるので処理９０を行う。Ｓノー
ド６６のａｇｅは０なので処理９２を行う。さらに、Ｓ
ノードから合流点ノードまでにＲ。ノード６６がないの
で処理９４を行う。この処理９２により、１回目のルー
プのＳノード６１の実行を開始する前に、（ｉ−１）回
目のループのＲノード６６が終了している保証ができな
いことがわかる。処理９４では、保証できないことを示
すためにＦＬＧを１とする。

リストＣには、もうＲノードは登録されていないので、
処理９６に進む。処理９６では、ＦＬＧが１なので、処
理９８を実行する。処理９８では、検索中のループおよ
びリストＡに登録されているループをすべて２倍展開し
、再度、静的に一意になるようにデータ識別子をつけな
おす。２倍展開された結果のループ１０１およびループ
１０２に対するコントロールフローグラフを第９図に示
す。

データ識別子として、新しく１２．１３が用いられてい
る。制御をＬｌで示されるラベルの位置に移す（処理９
９）。

再度、ループ１０１について、調べる。

ＦＬＧを０としｌ理８０）、リストＣをフリーとしく処
理８１）、選択したＳノード１１１を８０とし、対応す
るＲノード１１８をＲｏとし、そのＲｏを含むループ１
０２をＲＬ’。とし、（処理８２）、Ｓノード１１１の
ａｇｅを１とする（処理８３）。

Ｓノード１１１のａｇｅが１であるから、Ｒノード１１
２および、Ｒノード１１４をａｇｅを０として、リスト
Ｃに追加する（処理８５）。

リストＣから、Ｒノード１１４を取り出し、対応するＳ
ノード１１９にａｇｅ＝ｏをつける（処理８８）。Ｓノ
ード１１９はＲＬ０中のノードであり、かつＳノードの
ａｇｅはＯなので、処理９２を行う。さらに、Ｓノード
１１９から合流点ノード１１６までに、Ｒ０ノート１１
８があるので、処理９３を行う。この処理９２により、
ｉ回目のループのＳノード１１１の実行を開始する前に
、（ｉ−１）回目のループのＲノード１１８の実行が終
了していることを保証できる。以上の処理を、Ｓノード
１１３，１１１および１１９に対して行い、すべて５ｅ
ｎｄ処理とＲｅｃｅｉｖｅ処理の組み合わせに対して識
別子の一意性が保証できることがわかる。したがって、
ループ１０１と１０２はりストＢに登録される（処理７
６（第４図））、シたがって、リストＡに登録されてい
たすべてのリストについて調べ終ったので、処理７７（
第４図）を実行する。

処理７７により、ループ１０１とループ１０２がコント
ロールフローグラフからはずされる。

したがって、コントロールフローグラフからループ構造
がなくなり、処理４（第１図）および処理５（第１図）
が終了したことになり、正しく一意性をもつデータ識別
子がつけられたプログラムを中間語７として格納する。

この変換された中間語をＦｏｒｔｒａｎプログラムで表
現したものを第１０Ａ図、第１０Ｂ図に示す。

第７図に対して、第１０図はループ１０１゜１０２がそ
れぞれ２倍展開され、ループ１０１の文４５、文４６（
第７Ａ図）、ループ１０２の文４９、文５０（第７Ｂ図
）が、それぞれループ１０１の文１１１ないし文１１４
（第１０Ａ図）、ループ１０２の文１１７ないし文１２
１に展開され、データ識別子がっけかえられていること
がわかる。なお、本実施例においては、２倍展開により
、データ識別子の一意性が保証されたが、保証されない
場合は、そのループはさらに展開され、評価される。

〔発明の効果〕

本発明によれば、コンパイラによって自動的に、プロセ
ッサ間のデータ通信に必要なデータ識別子の一意を保障
することができる。

さらに、このデータ識別子は可能なかぎり、定数で表現
されるので、プログラム実行中に、データ識別子生成の
ための計算を行わなくてもすみ、第１図はデータ識別子
生成処理の一実施例、第２図は適用する並列処理システ
ムの概要図、第３図はコンパイラの全体図、第４図、第
５図はデータ識別子生成処理の概要を示す図、第６図は
実施例説明のためのソースプログラム、第７Ａ図、第７
Ｂ図は第６図のソースプログラムの並列化を行った途中
経過を示す図、第８図は第７Ａ図、第７Ｂ図に対するコ
ントロールフロー図、第９図は変換後のプログラム（第
１０Ａ図、第１０Ｂ図）に対するコントロールフロー図
である。第１０Ａ図、第１０Ｂ図は第６図の並列化変換
後のプログラムを示す図。

１・・・データ識別子生成処理、２・・・静的なデータ
識別子の設定処理、３・・・コントロールフローグラフ
の生成処理、４・・・コントロールフローグラフの動的
フロー解析・変更処理、５・・・データ識別子の変更処
理、６・・・コントロールフローグラフ、７・・・中間
語、１０・・・Ｆｏｒｔｒａｎコンパイラ、１１・・・
Ｆｏｒｔｒａｎソースプログラム、１２・・・オブジェ
クトコード、１３・・・構文解析、１４・・・中間処理
、１５・・・コード生成処理、１６・・・並列化処理、
１７・・・最適化処理、２１・・・ホスト計算機、２２
・・・並処処理部、２３・・・プロセッサ、２４・・・
ネットワーク、２５・・・ローカルメモリ、２６・・・
命令処理部、２７・・・送信部、２８・・・受信部、２
９・・・受信バッファ。

◇剃りｉ声・ノν →テ゛−り呻流祇第３圓＝臣制巾つｊ蜆 −う−テ゛°−フａゾしに郊４コ竿を面 ν０　　ノθ０１＝７．Ｎ　　　　　　　　　　　　　
　　　　　　　　　−４ｔｐＡ（１）　　−Ａ（’ブ’
−／）＋　　Ｃｘ　　、とう（Ｔ−ｔ）　　　　〜４１
Ｄ（１）　＝２１５（ｘ−ツノ　＋　Ｑｘ　　Ａ　（Ｔ
−／）　　　　　　〜　４２ノθσ　　　ＣＯＡ／７ｉ
〜′ＬＩＩ　　　　　　　　　　　　　　　　　　　　
　　　〜４３掻７Ａ都ｐｏ　ノ１１７／　　Ｉ−１，Ｗ　　　　　　　　　　
　　　　　　〜４４ＣＡＬＬ　　　、１３Ｅ　Ｎｒ）　
（どＥＩＮ２．／／、Ａ　（ｘ−２）ジ　　　　、４５
Ａ（１）＝Ａ（１−υ　＋　Ｃ’　ＲＥＣＥＩＶＥ　　
（７７〕　　　　　、４ｔ／σノ　　Ｃ０Ｍ７＜Ｎｔｌ
Ｅ　　　　　　　　　　　　　　　　　　　　　　　　
　　　　−４７峯７Ｅ面ｐθ　　ノσ２　　　ｒ＝／、、〜′　　　　　　　　
　　　　　　　　　　　〜４２ＣＡＬＬ　　　’３Ｅ−
Ｍ２；）　　（ど■）、υ、！３（１−υラ　　　　　
〜４ヂ１３（１）　　＝　　１３（１−／）　　＋　ｌ
）ｘｇＥｃＥｌ−ＶＥ（）ａ）　　”ｊａミック　　　
Ｃ０）ＩＴｔＡ／ＬＩＥ　　　　　　　　　　　　　　
　　　　　　　　　”り／−伽一制９巾（プ；トローノ
リリメヒホ−−−−）郭遭チー１−５パしれ第２２ −６１僧フ（コ＞１−一ルル５戸コに −−−−＞転ソ１チー７４５ＰＡ

Claims

【特許請求の範囲】

　データ識別子により転送データを識別するプロセッサ
間データ転送方式を用いた並列プロセッサを対象とし、
高級言語で記述された逐次処理型ソースプログラムから
該並列プロセッサによる並列実行のためのオブジェクト
コードを生成するコンパイル方法において、該逐次実行
型ソースプログラムを並列実行型プログラムに変換し、
該並列実行型プログラム上に表現されたデータ転送処理
に対してそれぞれ異なる該データ識別子を生成し、さら
に該並列実行型プログラム内のループ構造内の処理の流
れを調べ、ループ構造内の該データ識別子の一意性が保
たれているか否かを調べ、もし、一意性が保たれていな
い場合は、一意性が保たれるまでループ構造を展開する
ことを特徴とする並列化コンパイル方法。