JP2003131887A

JP2003131887A - 変数ロードおよび処理の一括化コンパイル方法

Info

Publication number: JP2003131887A
Application number: JP2001327109A
Authority: JP
Inventors: Eiichiro Sendai; 英一郎千代
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2001-10-25
Filing date: 2001-10-25
Publication date: 2003-05-09

Abstract

(57)【要約】【課題】変数のロードおよび処理の一括化により、プロ
グラムの実行コードサイズの縮小および実行速度の向上
を行うコンパイル方法を提供する。【解決手段】コンパイル対象プログラムの各文につい
て、ＣＰＵの備える命令によって一括処理が行えるかど
うかを判断する（ステップ２０６）。文で利用されてい
る複数の変数が、連続するメモリ領域に配置されてお
り、かつそのサイズの総和がレジスタサイズ以下の場合
には、それら複数の変数の値を同一レジスタ上に一括し
てロードし、そのレジスタ上の値を一括処理する実行コ
ードを生成する（ステップ２０７）。そうでない場合に
は通常の実行コードを生成する（ステップ２０８）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は計算機の利用技術に
おいて、実行コードサイズを縮小し、実行速度を向上さ
せるコンパイル方法に関する。特に、複数の変数に対す
る処理を一括して行うことにより、処理に要する命令数
を削減するコンパイル方法に関する。

【０００２】

【従来の技術】組み込みプログラムでは、実行コードの
格納に必要なＲＯＭサイズにより製品の製造コストが大
きく変化する。そのため、実行コードのサイズが可能な
限り小さくなるようなコンパイル方法が求められてい
る。実行速度の向上に関しては、実行コードサイズが増
加しない範囲内で要求されるのが一般的である。

【０００３】組み込みプログラムでは、制御対象である
機械の状態を取得し、それに応じた処理を行う必要があ
る。機械の状態がビットフラグのように限定された小さ
な範囲の値で表現できる場合には、実行コードサイズの
縮小のため、レジスタサイズより小さなサイズの変数を
使用することが多い。実行時には、機械の状態を示す値
を変数に読み込み、その値を条件比較することで必要な
処理を選択したり、その値をもとにした各種演算処理を
行う。その際に、たとえば条件比較において、レジスタ
サイズより小さな複数の変数の値を参照する場合に、そ
れらの変数の値のロードおよび比較を一括して行うこと
ができれば、実行コードサイズを縮小し、かつ実行速度
を向上させることが可能である。

【０００４】複数の変数のロードの一括化に関しては、
たとえば文献「Ｊ．Ｗ．Ｄａｖｉｄｓｏｎ他，Ｍｅｍｏ
ｒｙＡｃｃｅｓｓＣｏａｌｅｓｃｉｎｇ：ＡＴｅｃ
ｈｎｉｑｕｅｆｏｒＥｌｉｍｉｎａｔｉｎｇＲｅｄ
ｕｎｄａｎｔＭｅｍｏｒｙＡｃｃｅｓｓ, Ｐｒｏｃｅ
ｅｄｉｎｇｓｏｆｔｈｅＡＣＭＳＩＧＰＬＡＮ‘９
４ＣｏｎｆｅｒｅｎｃｅｏｎＰｒｏｇｒａｍｍｉｎ
ｇＬａｎｇｕａｇｅＤｅｓｉｇｎａｎｄＩｍｐｌｅ
ｍｅｎｔａｔｉｏｎ，ｐｐ．１８６−１９４，１９９
４」に示されている手法がある。これによって、複数の
変数の値のロードを1つのロード命令で行う実行コード
を生成することができる。

【０００５】

【発明が解決しようとする課題】上記論文は変数ロード
の一括化を目的とする一般的な手法である。一括ロード
したレジスタ上の値は、対応するSIMD命令が存在する場
合にはそのまま利用することができるが、それ以外の場
合には各変数の値を個々のレジスタに転送する処理が必
要となる。組み込みプログラムの対象とするほとんどCP
UはSIMD命令を備えておらず、ロード一括化によって必
要となる転送処理により、実行コードサイズが逆に増加
する可能性がある。

【０００６】

【課題を解決するための手段】本発明では上記課題を解
決するために、複数の変数に対する処理を通常のCPU命
令を用いて一括して行える場合に限定して、複数の変数
を同一レジスタ上に一括ロードして処理を行うコード生
成を行う。たとえば比較処理の場合、変数と定数との等
値比較の論理積、もしくはその否定形の条件比較文にお
いて、比較対象の変数のサイズの総和がレジスタサイズ
以下であり、かつ連続するメモリ領域に配置されている
時に、比較対象の変数群の値を同一レジスタ上に一括し
て読み込み、比較対象の定数を統合した定数と一括して
比較を行うコードを生成することで、実行コードサイズ
を縮小し、実行速度を向上させる。

【０００７】

【発明の実施の形態】以下、比較処理の一括化の場合に
おける本発明の一実施例を説明する。

【０００８】図１は本発明によるコンパイラが稼動する
計算機システムの構成図である。図示するように、計算
機システムはＣＰＵ１０１、主記憶装置１０４、外部記
憶装置１０５、ディスプレイ装置１０２、キーボード１
０３より構成されている。外部記憶装置１０５にはソー
スプログラム１０６、実行コード１０７が格納される。
主記憶装置１０４には、コンパイラ１０８と、コンパイ
ル処理過程で必要となる中間コード１０９、記号表１１
０および変数参照表１１１が保持される。コンパイル処
理はＣＰＵ１０１がコンパイラプログラム１０８を実行
することにより行われる。キーボード１０３はユーザか
らのコマンドをコンパイラ１０８に与えるのに用いる。
ディスプレイ装置１０２はコンパイルの終了またはエラ
ーをユーザに知らせる。

【０００９】図２はコンパイル処理の流れを示したフロ
ーチャートである。コンパイラの処理は、まずステップ
２０１で、構文解析を行う。構文解析はソースプログラ
ム１０６を読み出し、コンパイラ内部で処理可能な中間
コード１０９を作成する。構文解析処理については、た
とえば「エイホ、セシィ、ウルマン著：コンパイラI
（サイエンス社、１９９０年）３０頁〜７４頁」に記載
されている。次にステップ２０２で、変数参照解析を行
う。変数参照解析についても「エイホ、セシィ、ウルマ
ン著：コンパイラII（サイエンス社、１９９０年）７４
１頁〜７７２頁」に記載がある。変数参照解析によ
り、プログラムに含まれる各文ごとに、文で使用される
変数の集合、文に到達する変数の定義、および文から到
達可能な変数の使用が求められ、これが変数参照表１１
０に記録される。次にステップ２０３で、変数のメモリ
割付けを行う。変数のメモリ割付けについても「エイ
ホ、セシィ、ウルマン著：コンパイラII（サイエンス
社、１９９０年）６３４頁〜６４２頁」に記載があ
る。変数のメモリ割付けにより、プログラムに含まれる
各変数に対応するメモリ領域が決定され、これが記号表
１１１に記録される。次にステップ２０４で、未処理の
文があるか調べ、なければ終了する。未処理の文があれ
ばステップ２０５で文を１つ取り出す（ｓとする）。そ
してステップ２０６でｓが比較一括化の対象であるかの
判定処理を行う。この処理については図３を用いてさら
に詳しく説明する。比較一括化の対象であると判定され
た場合には、ステップ２０７へ進み、比較一括化による
実行コードを生成する。この処理については図４を用い
てさらに詳しく説明する。比較一括化の対象でないと判
定された場合には、ステップ２０８へ進み、通常の実行
コード生成を行う。通常の実行コード生成については、
「エイホ、セシィ、ウルマン著：コンパイラII（サイエ
ンス社、１９９０年）６２４頁〜７０７頁」に記載があ
る。

【００１０】図３はステップ２０６の処理の流れを詳し
く示した図である。ここでは与えられた文ｓが比較一括
化の適用対象であるかどうかの判定処理を行う。まずス
テップ３０１で文ｓが条件比較文であるかを調べ、そう
でなければステップ３０８へ進み、比較一括化の適用対
象外であると判定する。条件比較文である場合にはステ
ップ３０２へ進み、条件比較文中の比較式が、変数と定
数の等値比較の論理積、もしくはその否定形である変数
と定数の非等値比較の論理和であるかどうかを調べる。
そうでなければステップ３０８へ進み、比較一括化の適
用対象外であると判定する。そうであればステップ３０
３へ進み、比較式から比較対象となっている変数群を取
り出す（ｖ１，…ｖｎとする）。次にステップ３０４
で、記号表１１１から変数ｖ１，…ｖｎのサイズを取得
し、その総和を求め、レジスタサイズと比較する。総和
がレジスタサイズより大きい場合にはステップ３０８へ
進み、比較一括化の適用対象外であると判定する。レジ
スタサイズ以下の場合にはステップ３０５へ進み、記号
表１１１から変数ｖ１，…ｖｎのメモリ位置を調べ、メ
モリ中に連続して配置されているかどうかを調べる。連
続して配置されていない場合にはステップ３０８へ進
み、比較一括化の適用対象外であると判定する。連続し
て配置されている場合にはステップ３０６へ進み、変数
参照表１１０から、文ｓに到達する変数ｖ１，…ｖｎの
定義および文ｓから到達可能な変数ｖ１，…ｖｎの使用
が存在するかどうかを調べる。存在する場合にはステッ
プ３０８へ進み、比較一括化の適用対象外であると判定
する。存在しない場合にはステップ３０７へ進み、比較
一括化の適用対象であると判定する。

【００１１】図４はステップ２０７の処理の流れを詳し
く示した図である。ここでは与えられた文ｓに対して、
比較一括化を行った実行コードを生成する。

【００１２】まずステップ４０１で比較対象である変数
群をすべて含むメモリ領域を求める（Ｒとする）。次に
ステップ４０２へ進み、比較対象である定数群を、対応
する変数のメモリ位置の順序に沿って結合する（Ｃとす
る）。定数の結合は、各定数を対応する変数のサイズで
表現した後に行う。次にステップ４０３へ進み、比較式
が変数と定数の等値比較の論理積である場合にはステッ
プ４０４でＲとＣを等値比較する実行コードを生成す
る。そうでない場合にはステップ４０５へ進み、ＲとＣ
を非等値比較する実行コードを生成する。

【００１３】続いて、本実施例の適用例を示す。入力と
して図５（ａ）のようなプログラムを考える。また本適
用例においては生成する実行コードの目的機械のレジス
タサイズは４バイトであるとする。

【００１４】図２のステップ２０２の変数参照解析によ
り、図５（ｂ）のような変数参照表が作成される。

【００１５】次にステップ２０３の変数のメモリ割付け
により、図５（ｃ）のような記号表が作成される。

【００１６】次にステップ２０４で未処理文として文５
０５を取り出し、ステップ２０５で比較一括の適用対象
であるかの判定を行う。ステップ２０５を詳しくした図
３では、最初にステップ３０１で条件比較文かどうかの
判定を行う。文５０５は条件比較文ではないため、ステ
ップ３０８へ進み、比較一括化の適用対象外と判定す
る。そこで図２に戻り、ステップ２０８へ進み、通常の
実行コードの生成を行う。

【００１７】次にステップ２０４へ戻り、未処理文とし
て文５０６を取り出し、ステップ２０５で比較一括の適
用対象であるかの判定を行う。ステップ２０５を詳しく
した図３では、最初にステップ３０１で条件比較文かど
うかの判定を行う。文５０６は条件比較文であるため、
ステップ３０２へ進む。ステップ３０２では、文５０６
中の比較式ｖ１＝＝２＆＆ｖ２＝＝３が変数と定数の等
値比較の論理積、もしくはその否定形であるかどうかの
判定を行う。ｖ１＝＝２およびｖ２＝＝３はいずれも変
数と定数の等値比較であり、かつ両者は論理積として結
合されているため、文５０６はステップ３０２の条件を
満たす。そこでステップ３０３へ進み、比較式から比較
対象である変数ｖ１、ｖ２を取り出す。次にステップ３
０４で、ｖ１、ｖ２のサイズを記号表より取得し、総和
をレジスタサイズと比較する。ｖ１、ｖ２のサイズは２
バイトで、その総和は４バイトであり、レジスタサイズ
の４バイト以下である。そこでステップ３０５へ進み、
ｖ１、ｖ２がメモリ中に連続して配置されているかどう
かを記号表から調べる。ｖ１のメモリ位置は４番地、サ
イズは２バイトであり、ｖ２のメモリ位置は６番地であ
るため、ｖ１、ｖ２は連続して配置されていることがわ
かる。そこでステップ３０６へ進み、文５０６へ到達す
るｖ１、ｖ２の定義、および文５０６から到達可能なｖ
１、ｖ２の使用が存在するかどうかを変数参照表から調
べる。その結果、これらはいずれも存在しないことが分
かるため、ステップ３０７へ進み、比較一括化の適用対
象であると判定する。そこで図２へ戻り、ステップ２０
７へ進み、比較一括化による実行コードの生成を行う。
ステップ２０７を詳しくした図４では、最初にステップ
４０１で比較対象である変数ｖ１、ｖ２のメモリ領域を
記号表より取得し、４番地から始まるサイズが４バイト
の領域を比較変数群の領域Rとする。次にステップ４０
２へ進み、ｖ１、ｖ２の比較対象である定数値２および
３をｖ１、ｖ２のメモリ位置の順に沿って結合し、0x00
020003を統合定数値Cとする。次にステップ４０３へ進
み、現在処理している比較式は変数と定数の等値比較の
論理積であるため、ステップ４０４へ進む。ステップ４
０４では、ＲとＣを等値比較する実行コードの生成を行
う。

【００１８】次にステップ２０４へ戻り、未処理文とし
て文５０８を取り出し、ステップ２０５で比較一括の適
用対象であるかの判定を行う。ステップ２０５を詳しく
した図３では、最初にステップ３０１で条件比較文かど
うかの判定を行う。文５０８は条件比較文ではないた
め、ステップ３０８へ進み、比較一括化の適用対象外と
判定する。そこで図２に戻り、ステップ２０８へ進み、
通常の実行コードの生成を行う。

【００１９】次にステップ２０４へ戻るが、未処理文は
存在しないため、終了する。生成した実行コードは図６
（ａ）のようになる。比較一括化を行わない場合の実行
コードは図６（ｂ）のようになる。

【００２０】使用されている命令のうち、ｌｏａｄ．４
ｂｙｔｅは第２オペランドで指定したメモリ番地から４
バイトの領域の値を第１オペランドで指定したレジスタ
にロードする。ｌｏａｄ．２ｂｙｔｅはロードするデー
タのサイズが２バイトになる他はｌｏａｄ．4ｂｙｔｅ
と同じである。ｓｔｏｒｅ．4ｂｙｔｅは第２オペラン
ドで指定したメモリ番地から４バイトの領域へ第１オペ
ランドで指定したレジスタの値をストアする。ｓｔｏｒ
ｅ．2ｂｙｔｅはストアする領域のサイズが２バイトに
なる他はｓｔｏｒｅ．4ｂｙｔｅと同じである。ａｄｄ
は第２オペランドの値と第３オペランドの値を加算し、
結果を第１オペランドのレジスタへ格納する。ｃｏｍｐ
ａｒｅは第１オペランドの値と第２オペランドの値を等
値比較し、結果を比較フラグに格納する。ｊｕｍｐ．ｎ
ｏｔｅｑｕａｌは比較フラグがオフの場合に、オペラン
ドで指定したラベルアドレスへ分岐する。ｒｅｔｕｒｎ
は呼び出し元の関数へ復帰する。

【００２１】図６（ａ）と図６（ｂ）を比べてみると、
文５０６の比較処理に要する命令は、本発明を適用しな
い場合には文６１３から６１８までの６命令であるのに
対し、本発明を適用した場合には文６０４から６０６ま
での３命令となっており、比較一括化により比較に要す
る命令数が削減され、実行コードサイズが縮小されてい
ることがわかる。

【００２２】

【発明の効果】本発明によれば、コンパイラは連続して
配置されたレジスタサイズより小さな変数と定数の等値
比較の論理積、もしくはその否定形の条件比較文で行う
比較の一括化が可能となる。また、比較以外の処理に関
しても、CPUの備える命令の種類に応じて同様の一括化
を行うことができる。これにより、実行コードサイズの
縮小および実行速度の向上に効果がある。

【図面の簡単な説明】

【図１】本発明のコンパイラが稼動する計算機システム
の構成図。

【図２】コンパイラの処理の流れ。

【図３】比較一括化の可否の判定処理の流れ。

【図４】比較一括化の処理の流れ。

【図５】本発明の比較一括化の例。

【図６】本発明の比較一括化の例（結果）。

【符号の説明】

１０１…ＣＰＵ、１０２…ディスプレイ装置、１０３…
キーボード、１０４…主記憶装置、１０５…外部記憶装
置。

Claims

【特許請求の範囲】

【請求項１】 SIMD命令を備えていないCPU上で実行す
るプログラムにおいて、複数の変数が連続するメモリ領
域に配置され、そのサイズの総和がレジスタサイズ以下
の場合に、該変数群の値を同一レジスタ上に一括してロ
ードし、該レジスタの値を一括して処理することによ
り、実行コードサイズの縮小および実行速度の向上を達
成することを特徴とするコンパイル方法。
【請求項２】請求項１のコンパイル方法であって、変
数と定数との等値比較の論理積、もしくはその否定形の
条件比較文を含むプログラムにおいて、比較対象の変数
のサイズの総和がレジスタサイズ以下であり、かつ連続
するメモリ領域に配置されている時、比較対象の変数群
の値を同一レジスタ上に一括してロードし、比較対象の
定数を統合した定数と一括して比較を行うことで、実行
コードサイズの縮小および実行速度の向上を達成するこ
とを特徴とするコンパイル方法。
【請求項３】請求項１および請求項２のコンパイル方
法を用いたコンパイラ。
【請求項４】請求項３のコンパイラを格納した記憶媒
体。