JPH0552971B2

JPH0552971B2 -

Info

Publication number: JPH0552971B2
Application number: JP2165866A
Authority: JP
Inventors: Marii Jankusun Joisu; Uirii Maakusuteiin Piiitaa
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1989-06-26
Filing date: 1990-06-26
Publication date: 1993-08-06
Also published as: EP0405845A3; CA2019787C; CA2019787A1; EP0405845A2; US5193190A; EP0405845B1; BR9002995A; JPH0336632A; DE69031442D1

Description

【発明の詳細な説明】Ａ産業上の利用分野本発明は最適化コンパイラに関し、さらに詳し
くは、大域的最適化アルゴリズム（ここでは「指
定プロシージヤ（specified procedure）」と呼
ぶ）を用いるコンパイラで大きなプラグラムをコ
ンパイルするときに、メモリ・スペースの不足か
ら最適化プロセスが中止されることのないように
し、もつて生成されるコードの質を高める方法に
関する。

Ｂ従来技術最適化コンパイラは、プログラムにとつて、タ
ーゲツトCPUの有効性及び効率を高める重要な
ツールである。最適化コンパイラの目的は、書か
れた通りのプログラム機能を正確に複製する、可
能な限り最小かつ最速のオブジエクト・コード・
セツトを生成することにある。高水準言語で書か
れたコンピユータ・プログラムについてコンパク
トかつ効率の良いオブジエクト・コードを生成す
るためには、かかる言語に用いられるコンパイラ
は、ラン・タイムやプログラムの必要とするメモ
リ量を減らすための様々な指定プロシージヤを一
般に用いる精巧な大域的最適化器（オプテイマイ
ザ）を活用する必要がある。例えば、コンパイラ
は、部分式削除、コード・モーシヨン（コード移
動）、ストレングス・リダクシヨン（強さの軽減、
つまり遅い動作を等価な高速動作で置換するこ
と）、ストア・モーシヨン、不要コード・シーク
エンス除去といつたことの何れかを、あるいはす
べてを、実行してもよい。このような最適化に関
するいくつかの記述は、下記の文献に見出され
る。

J.T.Schwartz、On Programming−An
Interim Report on the SETL Langnage.
Installment II：The SETL Language and
Examples of its Use、Courant Institute of
Math Sciences、NYU、1983、pp.293−310. E.Morel and C.Renvoise、Global
Optimization by Suppression of Partial
Redundancies、CACM、Vol.22、No.２、pp.96−
103、1979. A.Aho and J.Ullman、Principles of
Compiler Design、Addison−Wesley、1977. これらの最適化指定プロシージヤの各々は、中
間言語（IL）プログラムを、意味的には等価だ
がより効率的なILプログラムに変換する。中間
レベル言語は、その名の示す通り、複雑性及び洗
練度において、高水準ソース・プログラムとマシ
ン・コードの中間にある。中間レベル言語は、複
数の高水準言語の任意のものを複数のマシンの任
意のものをターゲツトとするマシン・コードに変
換することのできるコンパイラを準備するのに特
に有用である。それによれば、すべての翻訳を共
通の中間レベル言語を通じて行い得るので、広範
囲のマシン・タイプとプログラミング言語の両方
をカバーするために開発されねばならないプロダ
クトの数が著しく減少することになる。たいてい
の最適化が普通に行われるのは、中間言語レベル
においてである。

最適化コンパイラにおける最重要の最適化は、
局所的つまり基本ブロツク・レベルではなくて、
大域的に、つまりプログラム・ワイドのレベルで
実行される。これらの最適化の何れを実行すると
きも、一連のデータ・フロー方程式を解かなけれ
ばならない。その際、コンパイラは、コンパイル
されるプログラムの中の式の情報を集める。その
ような情報は、プログラム中の制御フローに依存
する。それ自身のユニークなコード変換のため
に、どの最適化も、コンパイル時に所与の任意の
式がプログラム全体を通じて、いつ、どのように
利用可能であるかを追跡する方法を持たなければ
ならない。

この情報は、プログラムの可能な実行パス
（path）を表わす有向グラフであるところの制御
フローグラフから導かれる。低次のフローグラフ
では、ノードがプログラムの基本ブロツクを表現
し、かつノードはプログラムの制御がそれに沿つ
て流れるところのパスを表現する有向辺によつて
結ばれている。高次のフローグラフでは、ノード
は基本ブロツク又は強連結された領域からなる。

本明細書において、「基本ブロツク」とは、オ
ブジエクト・コードであれソース・コードであ
れ、分岐が到達するのはその最初の命令において
のみであり、かつ制御が離れるのはその最後の命
令の後においてのみであるような直列型のコー
ド・シークエンスである、コンピユータ・プログ
ラム中の任意の命令のセツトのことを言う。「強
連結（された）領域」とは、プログラム制御によ
つて、繰り返して、かつ当該領域の外のノードを
通過することなしに、フオローされ得るパスが存
在する、ノードのセツトを意味する。強連結領域
は、コンパイラの設計においては周知の概念であ
る。「唯一の入口を持つ強連結領域」とは、外か
ら当領域に到達することのできるノードが１つし
かないようなものを言う。以後、「領域」とは唯
一の入口を持つ連連結領域を言う。

「サブグラフ」とは、フローグラフ内のノード
の任意の組合せを言う。すべての強連結領域はサ
ブグラフでもある。しかし、すべてのサブグラフ
が強連結領域とは限らない。「エンテイテイ
（entities）」は、コンパイル中のプログラムを記
述するのに用いられる中間表現のコンポーネント
を指す。これには、変数エントリ、辞書エント
リ、結果、式、命令、及びプログラムの基本ブロ
ツクが含まれる。

プログラムが大きな複雑なものになればなるほ
ど、そのフローグラフは巨大でからみ合つたもの
になり、計算数は増え、かつデータフロー方程式
を解かなければならない式の数も増える。コンパ
イルに必要なメモリ及び処理時間は、大域的最適
化の対象となるソース・プログラム・サイズの２
次関数として増加する。スペースが制限されるこ
とからコンパイラがプログラム全体を最適化でき
ないような状況が生じると、過去においては最適
化を中止せざるを得なかつた。そこで、最適化の
質を高めるための試みがなされてきた。

USP4506325は、情報理論の符号化技術をプロ
グラムのセグメントに適用してオペレータとオペ
ランドを符号化することにより、コンパイラの必
要とする記憶量を減少させる方法を開示する。し
かしながら、プログラムをどのように分けるかに
ついては触れられていない。

USP4571678は、レジスタ割振り技術を改良す
ることによつて、ターゲツト・コンピユータの限
られた数のレジスタを活用する方法を開示する。
しかしながら、ターゲツト・コンピユータの一般
的なメモリ利用可能性を上回る巨大プログラムの
処理については全く触れられていない。

Ｃ発明が解決しようとする課題ハードウエア又はプログラムがコンパイルされ
るコンピユータの制約の中で最適化が実行不可能
であつても、簡単にあきらめることのないような
プログラム・コンパイル技術が必要とされてい
る。

Ｄ問題点を解決するための手段最適化が適用されるスコープは制限可能である
こと、及びそれでも最適化の利点の多くが実現さ
れ得ることが発見された。プログラム・ユニツト
は、その制御フロー構造に基づいて、コンパイラ
による処理が可能なほどに十分小さなセクシヨン
に区分される。

したがつて、本発明は、生成されるコードの品
質を向上させる方法を識別するために指定プロシ
ージヤを用いる最適化コンパイラにおいて、実際
に最適化を行うのに先立つて、コンパイルされる
プログラムを最適化する方法であつて、 (1) 指定プロシージヤに関し、上記プログラムに
ついてのすべての可能な実行パスを表現する制
御フローグラフを展開（develop）し、 (2) 上記プログラム中のサブグラフを識別し、 (3) 以下のサブ・ステツプからなるステツプを実
行することを特徴とする方法である。

(a) 最適化のための検査を行うサブグラフを選
択する。ただし、１番最初の繰り返しで選択
されるサブグラフはプログラム全体である。

(b) 上記サブグラフ中のコード・シークエンス
を検査することによつて、上記指定プロシー
ジヤにおいてデータ・フロー方程式を表現す
るのに用いられるアレイの各デイメンシヨン
に関連する上記サブグラフ中のエンテイテイ
の数を決定する。

(c) 上記アレイを収容するのに必要なメモリの
量を決定する。

(d) 上記メモリ量が上記コンパイルについての
所定のメモリ使用限度を越えしたがつて上記
サブグラフのノード中のコードの最適化が不
成功に終ることを示す場合には下記(e)のサ
ブ・ステツプを上記サブグラフに適用し、そ
うでない場合は上記指定プロシージヤを上記
サブグラフに適用する。

(e) サブ・ステツプ(d)で、発見された記憶領域
が不十分であつた上記サブグラフに含まれる
すべてのサブグラフについて、サブ・ステツ
プ(b)〜(d)を適用する。

Ｅ実施例 E1 概要本発明法を実施する最初のステツプは、最適化
されるプログラムのフローグラフを作成すること
である。フローグラフの作成は周知の技術であ
り、本発明の目的のためには標準的な技術をもつ
てすることができる。次にフローグラフの中の適
当なすべてのサブグラフが識別される。サブグラ
フの選択は、実行される最適化プロシージヤに依
存する。強連結領域は有用であることが多い。し
かし、インターバル、ハンモツク、及びツリーも
使用可能である。そして、極端な場合、サブグラ
フが単独のノードから成り立つていることもあ
る。本実施例では、サブグラフは強連結領域のコ
レクシヨンであるとする。特定の最適化のために
指定プロシージヤを書くためには、最適化の際に
形成されるアレイの数とデイメンシヨンが知られ
ていなければならない。それらのデイメンシヨン
は、例えば命令、結果、式、辞書エントリ、コー
ド・シークエンス中の基本ブロツクといつたエン
テイテイの量に依拠する。作成される特定のエン
テイテイは、引き受け中の指定プロシージヤに依
存する。これらの量はプログラムのサブグラフご
とに一定であるので、最適化の実行前に必要なメ
モリ量を簡単に計算することができる。コンパイ
ラに課されるメモリの限度は、コンパイラのライ
ターによつて１以上のレベルで予め定めることも
可能だし、あるいはコンパイラがシステム・リソ
ースの使用を評価して動的に決定することもでき
る。選択（された）プロシージヤにとつて利用可
能なメモリ量を制約する理由の１つは、選択プロ
シージヤの実行時間を制約することにもある。特
定プロシージヤのプログラム全体への適用につき
必要メモリ量が決定された後、その量は利用可能
メモリ量と比較され、利用可能メモリ量が十分で
あるならば、最適化が実行される。メモリが不十
分ならば、スペースが不十分であつたサブグラフ
内の、最大級の個別サブグラフの各々に対して該
指定プロシージヤを適用することが試みられる。
利用可能なメモリが依然不十分である被包含サブ
グラフの各々について、その被包含サブグラフが
最適化される。もしこれらの被包含サブグラフが
最適化不可能であるならば、被包含サブグラフの
各々がさらなる被包含サブグラフに分解される。
この反復は、最適化に必要なメモリ量が十分小さ
いので割当メモリの範囲内で最適化の実行が可能
であるサブグラフが検査されそして最適化が実行
されるまで継続する。本発明法は１以上の最適化
とともに用いることができる。複数の最適化を実
行するとき、その順序はどのようであつてもよ
い。

特定的な最適化の例は、共通部分式除去及びコ
ード・モーシヨンとして知られる最適化技法であ
る。この最適化に関し、フローグラフを分解して
得るサブグラフは強連結領域である。計算される
データ・セツトの１つは、最適化中の最外側の領
域内の各基本ブロツク及び領域の出口で利用可能
な式のセツト（“avail”セツト）である。この場
合、“avail”セツトのサイズを決定するために
は、２つのタイプのエンテイテイをカウントしな
ければならない。異なる式の数と、共通化
（commoned）中を領域を含む基本ブロツク及び
領域の数である。

利用可能性の情報は、最適化中の最外側領域
（つまり、低次の制御フローグラフ）の基本ブロ
ツク中のコードを通過し、どの式が計算されその
後の引数の再定義によつて殺されないかをマーク
することによつて、収集される。これらのデータ
は外側レベル領域を通じて外方向に伝播し、すべ
ての領域の出口で利用可能な式がどれかが確定さ
れる。このステツプの後、最外側領域の入口で利
用可能なものは何もないという仮定がなされ、こ
の新しい情報は逆に内側領域へと伝播される。フ
ローグラフの領域の内外の間でのデータ・フロー
情報を処理する必要性は、領域を含むループの性
質によつて決まる。明らかに、共通部分式削除
は、巨大で複雑なプログラムについての細分化か
ら思恵を受ける。全体プログラムの基本ブロツ
ク・領域の内外の間で情報を伝播させるための処
理時間は莫大なものになり得る。さらに、アレイ
の要するスペースも巨大になり得る。本発明法に
従つてプログラムを区分することにより、
“avail”セツトの第２デイメンシヨンのみならず
第１のデイメンシヨンも影響を受ける。たいてい
の場合、内側領域に現れる式のセツトを表わすユ
ニバースは、外側領域で見つかる式のセツトにつ
いてのユニバースのサブセツトである。したがつ
て、高次フローグラフ中の次レベルの領域に関し
最適化を行うことによつて、アレイのサイズを著
しく減少させることができる。なぜなら、複数の
デイメンシヨンが影響される蓋然性が高いからで
ある。

E2 具体例第１図を参照して、本発明の具体例を説明す
る。第１図には、典型的な被コンパイル・プログ
ラムの一部分が示されている。この例では、用い
られるサブグラフのタイプの強連結領域（SCR）
である。ノード１〜１５は、１つの入口と１つの
出口ポイントを持つ、１ライン以上のコードから
なる基本ブロツクである。第１図に示されるフロ
ーグラフ全体は、強連結領域２０である。フロー
グラフの内側からノード１へ至るリターン・パス
が存在しないので古典的な定義には適合しないけ
れども、これは真であると定義（define）され
る。

次に内側のSCRのサーチは公知の方法で行う
ことができ、本発明法にとつてクリテイカルなも
のではない。この例では、ノード２はノード１２
から戻るパスを持つけれども、その後のノードか
ら戻るパスはない。フローグラフにおいて次に内
側のSCRは、ノード２〜１２を含む領域１９と
いうことになる。次にSCR１９の内側に含まれ
るSCRも同様に解析される。したがつて、ノー
ド３〜１１を含むパスを反復的にトレースするこ
とができ、領域１８が定義される。同様に、第１
図のフローグラフ中の他の２つのSCRのうち、
１つはノード８，９，１０から成る領域１７であ
り、もう１つはノード７から成る領域１６であ
る。ノード７は、それ自身の内的なリターン・パ
スを具備している。ノード１３〜１５はSCRを
構成しない。なぜなら、当該ノード・グループの
中に、グループ外のノードを通ることなしに制御
が繰り返し流れることを可能にするリターン・パ
スがないからである。

本発明法のプログラムに関しての実行は、まず
第１図に示すようなフローグラフを作成すること
から始まる。次に、プログラム全体が最適化プロ
シージヤのためにテストされる。コンパイラがプ
ログラム全体を通じて作動する間、データ・フロ
ー方程式を表現するアレイのサイズを決定するエ
ンテイテイの数を含めて、最適化プロシージヤに
よつて使用されるエンテイテイのカウントが維持
される。カウントがインクリメントされるとき、
各アレイの各デイメンシヨンのユニツト・サイズ
がノートされ、アレイ中のエレメントの総数が計
算される。これは割当（られた）メモリと比較さ
れる。必要なメモリが割当メモリを上回つたなら
ば、上述のようにして次に小さなSCRを発見し、
同様の調査を行う。最適化を成功させることの可
能な十分小さな領域が見つかつたなら、最適化は
その領域について行われる。他の指定プロシージ
ヤに関して最適化を行う前に、制御フローグラフ
を作り直しても差し支えない。

最適化できるサブグラフが処理された後で、よ
り大きなサブグラフの最適化を試みることが望ま
しいこともある。選択（された）プロシージヤの
適用によつてサブグラフ中のコードのサイズは減
少しているので、含む側の（containing）サブグ
ラフをユニツトとして扱うことが可能になつてい
る。しかしながら、そのような再検査はコンパイ
ル時間を増大させる。しかるに、本発明の趣意は
最適化の際のコンパイル時間とスペースを制限す
ることにある。かかるステツプを実行する場合、
順次高レベルの領域が検査される点を除いて、先
のコード・シークエンス検査と同じやり方で実行
される。

本発明を実施する最良の態様のもう一つの例
が、添付の表の擬似コード・フラグメントによつ
て示される。コードは実際のプログラムから翻案
されたものであり、以下のように動作する。最適
化器は、入力として、最適化を制約するメモリの
制限を受け取る。最適化器は、最適化指定プロシ
ージヤ（ここでは、共通化（commoning）とコ
ード・モーシヨンである）についてデータフロー
方程式を解くために使われることになる、エンテ
イテイ・セツトのユニバースを記述するべく生成
されるマツプをリセツトする。最適化器は、所与
の領域に含まれる基本ブロツク、辞書エントリの
数、及び所与の領域の中で発見される異なるシン
ボリツク・レジスタの使用数を、マツプしかつカ
ウントする。また、指定プロシージヤによつて使
用されるアレイのサイズも計算する。最適化器
は、この合計を割当メモリと比較し、必要なメモ
リが割当を越える場合は、そのノードが最も新し
くマツプされた領域に対応する数を返す。そうで
ない場合は、次の内側に含まれるレベル（the
next contained level）の領域を発見する。その
ような領域が見つかつた場合には、先に実行され
たステツプをその含まれる（contained）領域に
ついて繰り返す。領域に含まれる領域がない場合
には、同一レベルにある次の領域をサーチする。
同一レベルに領域がない場合は、次に高いレベル
の領域を捜す。領域が見つかるまで、さもなけれ
ば上昇すべきレベルがなくなるまで、フローグラ
フ・レベルを通じて上昇が繰り返される。レベル
が残つていない場合、指定プロシージヤに対し
て、プログラム内に最適化すべき領域の見つから
ないことが報告される。コード内のコメントも、
本発明の理解に役立つ。

本発明は、RISCを含む、コンパイル・プロセ
スに中間レベル言語を用いるどのマシンも使用す
ることができる。本発明はまた、最適化器によつ
て活用されるメモリの制限を調整することによつ
て、様々なコンピユータ・システムと一緒に用い
られるコンパイラとともに使用することが可能で
ある。同じ手段によつて、ユーザは同一ソース・
プログラムの様々なレベルでの最適化を達成する
ことができる。最適化が中間言語レベルで行われ
るので、本発明は、FORTRAN、PL／Ｉ、
Cobol、Ｃ、STEL、Pascalを含む高級言語の何
れをも処理する最適化コンパイラとともに使用す
ることが可能である。本発明を使用すれば、最適
化プロセスの実行に用いるコンピユータのメモリ
の制約ゆえに最適化が不可能となつてしまうであ
ろう巨大プログラムについて、少なくとも部分的
な最適化を実行することが可能になる。本発明の
さらなる利点は、大きなプログラムの最適化時に
生じるレジスタ・プレツシヤが軽減されることで
ある。例えば、多くの式がループの外へ移動され
るとき、それらを収めることのできるレジスタの
数を越えることがある。そのとき、レジスタ割振
を行うコードは、これらのレジスタ要求に応えよ
うとして、多くの処理時間とメモリ・スペースを
必要とし、その結果、レジスタ値を後でその値が
用いられるときに検索できるように一時記憶装置
に退避させなければならなくなる。大きなプログ
ラムでの細分化された（partitioned）最適化に
よれば、上記のようなタイプのコード移動
（movement）は内側のサブ領域に限定され、し
たがつてレジスタ割当はその使用により近いもの
になる。これは、内側ループの始まりに移される
式が外側領域中の定数（constant）でもある場合
には、理論的には最善の選択ではないかもしれな
いとはいえ、先の最適化の効果をひつくり返さな
ければならず、その結果コードの質を低下させる
という無駄な処理をしばしば回避する。

Ｆ効果本発明によれば、巨大なプログラムについても
最適化を行うことが可能になる。

【図面の簡単な説明】

第１図は、各最適化ステツプに先立つてコンパ
イルによつて作成されるプログラムの一部分のフ
ローグラフの典型例の説明図である。

Claims

【特許請求の範囲】１生成されるコードの品質を向上させる方法を
識別するために指定プロシージヤを用いる最適化
コンパイラによるプログラムのコンパイルに際し
て、最適化を実行するために、 (a) 指定プロシージヤを実行する前に、上記プロ
グラムについてのすべての可能な実行パスを表
現する制御フローグラフを展開し、 (b) 上記プログラムに含まれるサブグラフを識別
し、 (b) 以下のサブ・ステツプからなるステツプを実
行することを特徴とする方法。 (c1)最適化のための検査を行うサブグラフを定義
する。ただし、１番最初に定義されるサブグ
ラフはプログラム全体である。 (c2)上記サブグラフ中のコード・シークエンスを
検査することによつて、上記指定プロシージ
ヤにおいてデータ・フロー方程式を表現する
のに用いられるアレイの各デイメンシヨンに
関連する上記サブグラフ中のエンテイテイの
数を決定する。 (c3)上記アレイを収容するのに必要なメモリの量
を決定する。 (c4)上記メモリ量が上記コンパイルについての所
定のメモリ使用限度を越えしたがつて上記指
定プロシージヤの適用が不成功に終ることを
示す場合には下記（c5）のサブ・ステツプを
上記サブグラフに適用し、そうでない場合は
上記指定プロシージヤを上記サブグラフに適
用する。 (c5)サブ・ステツプ（c4）で利用可能なメモリが
不十分であると判断された上記サブグラフに
含まれるすべてのサブグラフについて、サ
ブ・ステツプ（c2）〜（c4）を適用する。２複数の指定プロシージヤが実行される請求項
１記載の方法。３上記サブグラフは上記プログラム内の強く連
結された領域である請求項１記載の方法。４上記指定プロシージヤは、コード・モーシヨ
ン、ストア・モーシヨン、冗長コード・シークエ
ンス除去、不要コード・シークエンス除去、及び
式簡略化からなるグループから選択される請求項
１記載の方法。５上記エンテイテイは、命令、結果、式、辞書
エントリ、ソース・コード・プログラム中の領
域、ソース・コード・プログラム中の基本ブロツ
ク、及びそれらの組合せからなるグループから選
択される請求項１記載の方法。６アレイごとに、各デイメンシヨンのユニツ
ト・サイズを掛け合わせて該アレイ中のエレメン
トの総数を求め、１アレイ・エレメントのサイズとアレイ・エレ
メントの数を掛け合わせて該アレイの占めるメモ
リ・ユニツトの数を求め、アレイの必要とするメモリ量を加算して特定の
最適化が必要とするメモリの総量を求めることにより、上記コンパイラによつて生成される
すべてのエンテイテイを収容するのに必要なメモ
リ量を計算する請求項１記載の方法。７最適化の定義と実行に成功した後、当該最適
化の実行されたサブグラフを含むサブグラフにつ
いて、上記指定プロシージヤによる最適化が可能
か否かを検査する請求項１記載の方法。８最適化の定義と実行に成功した後、含む側の
強連結領域について、上記指定プロシージヤによ
る最適化が可能か否かを検査する請求項１記載の
方法。９ (a) 少なくとも１つの内側サブグラフについ
て最適化の定義と実行に成功した後、含む側の
サブグラフについて上記指定プロシージヤによ
る最適化が可能か否かを検査し、 (b) 上記含む側のサブグラフが最適化可能なら
ば、含む側の強連結領域について同様に検査を
行い、最適化可能ならば上記最適化を実行する
請求項１記載の方法。