JPS61183744A

JPS61183744A - コード生成工程での命令形式選択方法

Info

Publication number: JPS61183744A
Application number: JP60283223A
Authority: JP
Inventors: グレゴリー・ジヨン・チヤイテイン; マーチン・エドワード・ポプキンス; ピーター・ウイリー・マークスタイン; ヘンリー・スタンレー・ウオーレン、ジユニア
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1985-02-04
Filing date: 1985-12-18
Publication date: 1986-08-16
Also published as: EP0190622B1; CA1223665A; EP0190622A2; JPH0519173B2; US4656582A; EP0190622A3; DE3685339D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野本発明は最適化アルゴリズムを用いてコードの質向上を
図るディジタル計算機用のコンパイラに、係る。

本発明を適用できる計算機は、−組の汎用レジスタを備
え且つ命令に冗長性があるものである。

命令の冗長性とは、同じオペレーションを実行するのに
幾つかの形式の異なる命令が存在することを意味する。

このような計算機としては、ＩＢＭシステム／３７０、
−［−トローラＭＣ６８０００等がある。本発明を適用
できるためには、レジスタ・オペランドを主記憶オペラ
ンドよりも優先し、且つ主記憶オペランドを記憶装置か
らの明示的なロード（レジスタ・オペランドを用いて行
われる）よりも優先させなければならない。例えば、Ｉ
ＢＭシステム／３７０においては、加算は次の３種類の
何れかで行うことができる。

（１）　　ＡＲｒｌ、ｒ２（２）　　Ａ　　ｒｌ、ｄ　（ｒ２）（３）　　Ｌ　　ｒ３、ｄ　（ｒ２）ＡＲｒｌ、ｒ３（１）はレジスタ加算命令を用いるもので、汎用レジス
タｒ２の内容を汎用レジスタｒ１の内容に加算して、結
果をｒｌに置く。この命令を用いる場合は、加数および
被加数を予め汎用レジスタに入れておく必要がある。

（２）は記憶装置からの加算を行う。ＩＩ　ｄ　Ｉｔは
変位を表わす定数である。レジスタｒ２はベース・レジ
スタであって、その内容とｄとの和によって記憶装置を
アドレス指定する。記憶装置から取出されたワードはｒ
ｌの内容に加算される。

（３）は、一方のオペランドを“ｄ（ｒ２）”によって
アドレス指定された記憶装置から汎用レジスタｒ３ヘロ
ードし１次いでその内容をｒｌの内容に加算する。

システム／３７０における加算操作としては（１）が最
も優れており、（２）がその次であり、（３）が一番劣
る。しかし、ｒ３にロードされた数値がプログラム中の
他の場所で使用されるのであれば、プログラム全体の効
率を考えた場合、（３）が最良になる。このように、同
じ加算であっても、どの形式の命令を選択するのが良い
かは場合によって異なる。このような命令の選択性、即
ち選択の優先原位があることが本発明の前提になってい
る。選択基準としては、目的コードのスペースまたは実
行時間を使用することができる。システム／３７０およ
びＭＣ６８０００の場合は、スペースおよび時間の何れ
においてもレジスタ・オペランドの方が記憶装置オペラ
ンドよりも好ましい。

Ｂ、従来技術最初のコンパイラが世に出て以来ずつと、コンパイラが
生成するコードの質が問題になっている。

最初の市場に出回ったコンパイラは本出願人のＦＯＲＴ
ＲＡＮ　　Ｉコンパイラであるが、その主な目的の１つ
は、科学技術計算の分野において、プログラマがアセン
ブリ言語でコーディングした場合のコードの質に匹敵す
るような目的コードを生成することであった。

最近、様々な高水準言語が考え出されているが、昔から
あるＦＯＲＴＲＡＮも適用範囲を広げるべく改良が続け
られている。しかし依然として、コンパイラが生成する
コードの質を上げることが。

特に製造業の分野で重要問題になっている。その場合、
コンパイラ生成コードの質を計るのに用いる基準は、専
門のアセンブリ言語プログラマが書いたコードである。

１９５０年代から現在にかけて、コンパイラ生成コード
の質を上げるための最適化方式が多数開発されている。

最初のＦＯＲＴＲＡＮコンパイラでも最適化が行われて
いる。コンパイラの最適化は大きく２つに分けることが
できる。即ち、大域最適化および基本ブロック最適化で
ある。大域最適化は、コンパイルされるプログラム全体
の解析に基くもので、′コード移動（ループ外への移動
）”や″共通式除去″等を考慮する。基本ブロック最適
化は、コンパイルされるプログラムの比較的小さな区域
、即ち基本ブロックの解析に基くもので、基本ブロック
には隣接する２つの命令しか含まないものもある。

本発明は何れの最適化方式でも実施できるが、効率の点
では大域最適化が好ましい。従って、以下の説明も大域
最適化を前提にしている。

プログラムの大域解析から得るべき情報は生死の情報だ
けである。これは、各命令の各レジスタ・オペランドに
関連する“最終使用”または“中途使用”の標識で与え
られる。この情報は、各レジスタ・オペランドについて
、当該レジスタが新しい数値のロード前に再び使用でき
るか否かを示す。

Ｃ０発明が解決しようとする問題点プログラムの最適化で問題になるのは、オペランドをど
こからアクセスするかということである。

オペランドは命令形式に応じてレジスタ又は主記憶装置
からアクセスされるか、最適化の効率を上げるためには
、命令形式を適切に選択する必要がある。

従って本発明の目的は、計算機で使用可能な命令セット
とプログラム中でのオペランドの使用パターンに基いて
、オペランドの参照先を適切に決めるコード生成方法を
提供することにある。

Ｄ０問題点を解決するための手段本発明は、最適化コンパイラにおいて記憶装置参照の効
率を上げるため、まず最初に中間コードを生成する。こ
の中間コードは、主記憶装置の参照をロード命令（Ｌ）
及び記憶命令（Ｓ　Ｔ）だけで行い、すべての計算はＲ
Ｒ形式の命令でレジスタを用いて行う。云い換えれば、
最初に生成される中間コードにおいては、算術様データ
に対して、ＳＲ形式、Ｒ５形式及びＳＳ形式の命令は全
く使用されない。次に、共通式の除去、ループ不変式の
移動、演算子の強さの低下、デッド・コードの除去、と
いった標準の技法により、プログラムを最適化する。次
に、コード中で所定のパターンを探索する。このパター
ンは、ロード命令（Ｌ）及びその後のレジスタ操作命令
（ｏｐ）又は記憶命令（Ｓ　Ｔ）を含む、これらの命令
は同じレジスタ又は記憶位置を指定する。所定のパター
ンが見つかると、それをＳＲ形式、ＲＳ形式又はＳＳ形
式の命令で置換える。

上述のパターン探索をレジスタ割当ての後でも行うと最
適化の効率を更に上げることができる。

レジスタ割当ては各命令に実際のレジスタを割当てるも
ので、各記号レジスタを実際の機械レジスタで置換える
ことにより達成される。これは公知、の技術である。最
終的には、計算機で実行可能な機械コードが生成される
。

Ｅ、実施例以下の説明では、２アドレスの命令形式を仮定している
。命令形式としては、ＲＲ形式、ＳＲ形式（システム／
３７０ではＲＸ形式と呼んでいる）、Ｒ８形式、および
ＳＳ形式を使用する。

本発明によるコード改良の例として、コンパイルされる
原始プログラムが次の割当てステートメントを含んでい
るものと仮定する。

Ａ＝Ａ＋ＢＡおよびＢは整数や浮動小数点数などの算術変数である
。このステートメントの実行開始時にＡおよびＢがまだ
レジスタにロードされていなかったとする。ここでは次
の４種類の加算命令を実行できる計算機を仮定している
。

Ａ　　ＲＲニ一方のレジスタの内容を他方のレジスタの
内容に加算する。

Ａ　　ＳＲ：記憶位置の内容をレジスタの内容に加算す
る。

ＡＲ８：レジスタの内容を記憶位置の内容に加算する。

Ａ　　ＳＳ：成る記憶位置の内容を別の記憶位置の内容
に加算する。

使用する側から見ると、ＲＲ形式の加算命令ＡＲＲが最
も好ましく、次いでＳＲ形式及びＲ８形式と続き、ＳＳ
形式の加算命令Ａ　　ＳＳが一番劣る。割当てステート
メントに関して生成できる最良のコードは、Ａ及びＢが
割当てステートメントの後で使用されるか否かによって
左右される。

これには次の４つの場合がある。

（１）割当てステートメントの後でＡ及びＢが共に“生
″。

（２）Ａが“生″で、Ｂが１１死”。

（３）Ａが″死″′で、Ｂが生”。

（４）Ａ及びＢが共に１死″。

本実施例では、上記の４つの場合に対し次のような機械
コード・シーケンスを用いる。

（１）Ｌ　　　　　ｒｌ、ＡＬ　　　　　　　　ｒ２、　ＢＡ　　　ＲＲｒｌ、　　ｒ２（２）Ｌ　　　　　　　ｒｌ、ＡＡ　　　ＳＲｒｌ、Ｂ（３）Ｌ　　　　　　　ｒｌ、ＢＡ　　　Ｒ５ｒｌ、Ａ（４）　　Ａ　　ＳＳ　　　Ａ、Ｂ割当てステートメントで加算を指定する場合以外にも、
例えばアレイ要素をアドレス指定するときのように、加
算が要求されることがある０本発明が適用されるのは、
加算とそのオペランドの他での使用との間に多数の命令
がある場合である（オペランドがレジスタにロードされ
てしまっていても差支えない）。

前述のように、本発明は特にＩＢＭシステム／３７０及
びＭＣ６８０００での最適化コンパイラに適している。

使用するアセンブリ言語はＩＢＭシステム／３７０で一
般に使用しているものに似ている。具体的に云うと、命
令は２アドレス形式であり、記憶命令及びＲ５形式の命
令を除く他のすべての命令においては第１オペランドが
ターゲットであり、記憶命令及びＲＳ形式の命令におい
ては第２オペランドがターゲットである。

ＳＲ形式、ＲＳ形式及びＳＳ形式の命令の場合、もしコ
ンパイラがこれらの命令を早期に生成すると、それらは
一般のプログラム中に留まり、即ち最終目的コード中に
存在し、このような命令をよく使用するプログラムは、
効率が悪くなる。一方、これらの命令の使用によって効
率が改善されることもあるので、これらの命令を全く使
用しないというのも望ましくない。

早期に生成された命令がプログラム中に留まる傾向があ
ることの理由は、そのような命令による主記憶装置の参
照がレジスタの参照に比べて、コンパイラによる解析が
戴しいためである。従って、同じ記憶位置を参照するの
に幾通りもの方法があるが、汎用レジスタの参照方法は
１つしかない。

第１図は本発明が如何にして大域最適化コンパイラに適
応するかを示している。本発明は、゛′命令選択″と呼
ばれるモジュールとして示しである。

このモジュールはコンパイル処理中にレジスタ割当ての
前後で２回呼出される（ブロック４及び６）。

次に第１図を参照しながら本発明の詳細な説明する。

（１）まず、算術様データ（バイト、ハーフワード、フ
ルワード）に対してＳＲ形式、Ｒ５形式及びＳＳ形式の
命令を完全に排除した中間コードを生成する（ブロック
１及び２）。この時点でのコードは、ロード命令及び記
憶命令によってのみ主記憶装置を参照し、すべての計算
はＲＲ形式の命令によりレジスタを用いて行われる。（
ここでは、使用可能なレジスタの数が制限されないもの
と仮定する。）（２）次に、共通式の除去、ループ不変式の移動、演算
子の強さの低下、デッド・コード除去、といった標準の
技法によりプログラムを最適化する（ブロック３）。

（３）コード中で所定のパターン（後述する）を探索し
、見つかるとそれをＳＲ形式、ＲＲ形式又はＳＳ形式の
命令で置換える（ブロック４）。

（４）次にレジスタを割当てる（ブロック５）。

即ち、各記号レジスタを機械レジスタと関連付け、必要
な場合は″スピル″コードを生成する。′スピル′″コ
ードは、記憶命令及びロード命令から成り、レジスタに
入れたい数量が使用可能な機械レジスタの数を超えた場
合に必要である。

（５）ステップ（３）を繰返す（ブロック６）。今回は
、割当てられた実レジスタを用いて中間コードを処理す
る。

（６）最後に機械コードを生成する（ブロック７）。

命令選択の前に大域最適化（ブロック３）を行うには３
つの理由がある。第１の理由は、大域最適化によりコー
ド選択に必要な゛′最終使用”ビットが各レジスタ・オ
ペレンランド毎に得られるためである。第２の理由は、
大域最適化を行う場合。

ＳＲ形式、Ｒ８形式又はＳＳ形式の命令が中間言語コー
ド中に存在しないためである。従ってオプテイマイザが
簡単になる。第３の理由は、命令が基本的であればある
程、最適化の効率が上がるが烏である。基本的な操作は
共通化してループの外に移すことができるが、それらを
組合せて１つの命令にしてしまうと、共通化或いはルー
プ外への移動が戴しくなる。この例を下記に示す。

最良の結果を得るため、命令選択はレジスタ割当ての前
後で行う。レジスタ割当ての前に行うのは、命令選択に
よってレジスタが解放されることが多いからである。例
えば、次の（１）から（２）への変更を行うと、レジス
タｒ２が解放される。

（１）Ｌ　　　　　ｒｌ、ＡＬ　　　　　ｒ２、ＢＡ　　ＲＲｒｌ、ｒ２（２）Ｌ　　　　　ｖｌ、ＡＡ　　ＳＲｒｌ、Ｂ従って、次のレジスタ割当てで、より良いコードを生成
できる（スピル命令が少なくなる）、レジスタ割当ての
後でコード選択を繰返す理由は、レジスタ割当てで生成
された次のような″スピル”コードがＡ　　ＳＲ命令を
用いてうまく変更できるからである。

Ｌ　　　　　ｒｌ、５ＰＩＬＬＩＬ　　　　　ｒ２．５ＰＩＬＬ２Ａ　　ＲＲｒｌ、ｒ２しかし、２回目の命令選択は１回目よりも得るものが少
なく、従って２回目はオプションにしておいて、最高度
の最適化が要求される場合にのみ実行するようにしても
よい。

命令選択の詳細は本発明の主題からは外れるが、便宜上
第２図を参照しながら説明しておく。

ラベル間（プログラム結合点間）でコードを走査し、次
のようなパターン（ブロック１５のパターン１）を探索
する。

Ｌ　　　ｒｌ、ｄ　（ｒｉ、ｒｂ）ＯＰ　　ｒｌ、ｒ２ＳＴ　　ｒｌ、ｄ　（ｒｉ、ｒｂ） ○Ｐ”はレジスタを用いて何らかの操作を行うレジスタ
操作命令を表わし、７１　Ｓ　Ｔ　ＴＪは記憶命令を表
わす。”ｄ　（ｒｉ、ｒｂ）”は、変位ｄ、インデック
ス・レジスタｒｉ及びベース・レジスタｒｂを用いて主
記憶装置を参照することを示す。

ロード命令り及び記憶命令ＳＴのｄ、ｒｉ及びｒｂの値
は同じである。即ち、これらの命令は同じ記憶位置を参
照する。

次の（イ）乃至（へ）の条件が満たされていると、記憶
命令ＳＴを”ＯＰ　　Ｒ８ｒ２．　ｄ　（ｒｉ、ｒｂ）
”で置換え、ロード命令り及びレジスタ操作命令ＯＰを
削除する（デッド・コード除去のパスがあれば、そこで
削除）。

（イ）　ロード命令りと記憶命令ＳＴの間で記憶及びサ
ブルーチン呼出しが行われない。

（ロ）　ロード命令りと記憶命令ＳＴの間でｒｉ及びｒ
ｂのセットがない。

（ハ）　ロード命令りと記憶命令ＳＴの間でｒｌが使用
されていない（記憶命令ＳＴのｒｉ及びｒｂもｒｌと異
なっていなければならない）。

（ニ）　レジスタ操作命令ＯＰと記憶命令ＳＴの間でｒ
２のセットがない。

（ホ）　　ｒｌを最後に使用するのが記憶命令ＳＴであ
る。

（へ）　レジスタ操作命令ＯＰが等価なＲ５形式の命令
″○Ｐ　　ＲＳ”を持っている。

パターン１と同時に次のパターン２も探索する。

パターン１及びパターン２が両方共生じた場合はパター
ン１の変換を行う。

Ｌ　　ｒｌ、ｄ　（ｒｉ、ｒｂ）ＯＰ　　ｒ２、ｒｌ次の条件（イ）乃至（ホ）が満たされていると、レジス
タ操作命令ｏｐを“ＯＰ　　ＳＲｒ２、ｄ（ｒｉ、ｒｂ
）”で置換え、ロード命令りを削除する（デッド・コー
ド除去のパスがあれば、そこで削除）。

（イ）　ロード命令りとレジスタ操作命令ＯＰの間で記
憶及びサブルーチン呼出しが行われない６（ロ）　ロー
ド命令りとレジスタ操作命令○Ｐの間でｒｉ及びｒｂの
セットがない。

（ハ）　ロード命令りとレジスタ操作命令ＯＰの間、で
ｒｌが使用されていない。

（ニ）　　ｒｌを最後に使用するのがレジスタ操作命令
ＯＰである。

（ホ）　レジスタ操作命令ｏＰが等価なＳＲ形式の命令
”ＯＰ　　ＳＲ”を持っている。

パターン１及びパターン２と同時に次のパターン３も探
索する。

Ｌ　　　ｒｌ、ｄｉ　（ｒｉｌ、ｒｂｌ）ＳＴ　　ｒｌ
、ｄ２（ｒｌ２、ｒｂ２）ロード命令り及び記憶命令Ｓ
Ｔは、それぞれ異なった記憶位置をアドレス指定するも
のであってもよい。次の（イ）乃至（ホ）の条件が満た
されていると、記憶命令ＳＴを“ＭＶｄ２（ｒｌ２、ｒ
ｂ２）、ｄｉ　（ｒｉｌ、ｒｂｌ）”で置換え、ロード
命令りを削除する（デッド・コード除去のパスがあれば
、そこで削除）。“Ｍ　Ｖ　”は移動命令である。

（イ）　ロード命令りと記証賞象ＳＴの間で記憶及びサ
ブルーチン呼出しが行われない。

（ロ）　ロード命令りと記憶命令ＳＴの間でｒｉｌ及び
ｒｂｌのセットがない。

（ハ）　ロード命令りと記憶命令ＳＴの間でｒｌが使用
されていない。

（ニ）　　ｒｌを最後に使用するのが記憶命令ＳＴであ
る。

（ホ）　ロード命令り及び記憶命令ＳＴの対がより好ま
しい記憶載量移動命令を持っている。

以上のようなパターン探索を行えば、システム／３７０
やＭＣ６８０００におけるＳＲ形式、Ｒ８形式及びＳＳ
形式の命令を用いるのに有利な場所を見つけることがで
きる。計算機がもつと複雑な命令（例えば、３つのアド
レスを使用するＳＳ形式の加算命令）を持っている場合
にも同様なパターン探索を行える。

パターン探索においては、レジスタの使用が最終使用か
どうかを知ることが重要である。これはプログラムの順
方向探索によってオン・ザ・フライ式に決定することも
できるが、コンパイル時間を考えると、各オペランドに
関連する最終使用ビ、ットを大域オプテイマイザ（第１
図のブロック３）にセットさせるのが好ましい。

例えば、原始プログラムが次のようなステートメントを
含んでいたとする。

Ｘ＝Ｘ−Ｙするとコンパイラはまず次のようなコードを生成する。

Ｌ　　　ｒｌ、Ｘ（ｒｂ）Ｌ　　　ｒ２、Ｙ　（ｒｂ）Ｓ　　　ｒ１％　ｒ２ＳＴ　　ｒｌ、Ｘ　（ｒｂ）ａｔ　Ｓ″は減算命令である。ｒｌが他で使用されてい
−なければ、１番目、３番目及び４番目の命令はパター
ン１に適合する。従って、最初のコードは下記のコード
で置換えられる。

Ｌ　　　　　ｒ２、Ｙ（ｒｂ）Ｓ　　Ｒ５ｒ２．Ｘ（ｒｂ）最初のコードにおいてｒｌが記憶命令ＳＴの後でも使用
されている場合は、パターン１に代ってパターン２に適
合し、従ってコードは次のようになる。

Ｌ　　　　　ｒｌ、Ｘ（ｒｂ）Ｓ　　ＳＲｒｌ、Ｙ　　（ｒｂ）ＳＴ　　　　ｒｌ、Ｘ（ｒｂ）最初のコードにおいてｒｌ及びｒ２が両方共に記憶命令
ＳＴの後でも使用されていると、パターンｌ及びパター
ン２には適合せず、コードは元の形のまま残される。こ
うしておくと、ｒｌ及びｒ２を後で使用する場合、それ
らの内容を主記憶装置から再ロードする必要がない。

他の例として、原始プログラムが次のステートメントを
含んでいたとする。

Ｘ　（Ｉ）　＝Ｙこれは工を変数とするループを表わす。ループ中でＹが
変更されるか否かには関係なく、最初に次のようなコー
ドが生成される。

Ｌ　　　ｒｌ、Ｙ（ｒｂｌ）ＳＴ　　ｒｌ、Ｘ（ｒｂ２、ｒｉ）次にオプテイマイザは、Ｙがループ中で不変であれば、
″コード移動”技法によってロード命令りをループの外
に移す、Ｙが可変の場合は、コードはそのままである。

従って、次のような２種類のコードが可能である。

（１）ループ：・・・Ｌ　　　ｒｌ、Ｙ（ｒｂｌ）ＳＴ　　ｒｌ、Ｘ（ｒｂ２、ｒｉ）（２）　　　　　　Ｌ　　　ｒｌ、Ｙ　（ｒｂｌ）ルー
プ：・・・ＳＴ　　ｒｌ、Ｘ（ｒｂ２、ｒｉ）次にパターン探索を行う、コード（１）はパターン３に
適合するが、コード（２）は適合しない、従って最終コ
ードは次の通りである。

（１）ループ：・・・ＭＶＸ（ｒｂ２、ｒｉ）、Ｙ（ｒ　ｂ　１）（２）　　
　　Ｌ　　　ｒｌ、Ｙ　（ｒｂｌ）ループ：・・・ＳＴ　　ｒｌ、Ｘ　（ｒｂ２、ｒｉ）記憶命令ＳＴが移動命令ＭＶより速く実行できるのであ
れば、実行時間の点で上記のコードが最良である。

上述のように、ロードや記憶のような基本的な命令は場
合によってはループの外に移すことができるが、それら
の組合せをループの外に移すことはできない。従って、
大域最適化の効率は、基本的な命令を取扱う場合は高い
が、移動命令のようなより複雑な命令の場合はそれ程で
はない。

要約して云うと、本発明に従えば、ＳＲ形式、Ｒ５形式
及びＳＳ形式の命令を、それらが有用なときにだけ生成
することができる。

システム／３７０のマスク・テスト命令ＴＭやＭＣ６８
０００の“イミデイエイト”命命のような他の同様な命
令も本発明により適宜に生成することができる。′イミ
デイエイト”命令の場合は。

即値データが２回以上使用されるか、或いはループ中で
使用されるのであれば、即値データをレジスタにロード
してそれを参照するようにした方がよい。１回しか使用
されないのであれば、それを使用する命令の中に即値デ
ータをコンパイルしておくとよい。

Ｆ０発明の効果本発明に従えば、レジスタ及び主記憶装置を効率よく参
照するコードを生成することができる。

【図面の簡単な説明】

第１図は本発明を適用できる最適化コンパイラの流れ図
。第２図は命令選択のステップを示す流れ図。出願人　　インターナショナル・ビジネス・マシーンズ
・コーポレーション代理人　　弁理士　　頓　　宮　　孝　　−（外１名） −ａｔ化コレノくイラ第１図

Claims

【特許請求の範囲】最適化コンパイラにおいて記憶装置参照の効率を上げる
ために下記の（イ）乃至（ハ）のステップを実行するコ
ード生成方法。（イ）記憶装置の参照をロード命令及び記憶命令だけで
行い且つすべての計算をＲＲ形式の命令でレジスタを用
いて行う中間コードを生成するステップ。（ロ）上記中間コードを最適化するステップ。（ハ）ロード命令及びその後のレジスタ操作命令又は記
憶命令を含む所定のパターンを探索し、該パターンが見
つかると、それをＳＲ形式、ＲＳ形式又はＳＳ形式のよ
り短い命令シーケンスで置換えるステップ。