JP2002527816A

JP2002527816A - プログラム最適化装置および方法

Info

Publication number: JP2002527816A
Application number: JP2000576362A
Authority: JP
Inventors: ミハエル・フィグリン; ミハエル・オクルギン; ドミトリー・バルメンコフ
Original assignee: Motorola Inc
Current assignee: Motorola Solutions Inc
Priority date: 1998-10-13
Filing date: 1998-10-13
Publication date: 2002-08-27
Also published as: EP1121641A1; WO2000022523A1; US6571386B1

Abstract

(57)【要約】オプティマイザ（１００）は、メモリ（１１０）およびプロセッサ（１３０）によって構成される。メモリは、最低化されるプログラム（２００）と、最適化ソフトウェア（３０１）とを格納する。プロセッサは、（ａ）最適化ソフトウェアによって制御され、（ａ）命令(use-vector, exh-vector)によるリソースの使用を示す、プログラム（２００）の命令におけるローカル・ベクトル（"local"）を判定し；（ｂ）ＳＥＳＥ(Single-Entry-Single-Exit)構造（Ｕ，Ｔ，Ｖ，Ｓ）についてプログラム（２００）をスキャンし；（ｃ）ローカル・ベクトルからＳＥＳＥベクトルを判定する。ＳＥＳＥベクトルは、ＳＥＳＥ構造によるリソースの使用を示し、オプティマイザによって合成され、プログラム・ベクトルを取得する。いくつかの命令が修正されると、オプティマイザ（１００）は対応するＳＥＳＥのＳＥＳＥベクトルのみを再計算し、旧ＳＥＳＥベクトルを修正ＳＥＳＥベクトルと再合成して、新たなプログラム・ベクトルを判定する。

Description

【発明の詳細な説明】

（産業上の利用分野）本発明は、一般に、データ処理に関し、さらに詳しくは、プログラム・オプテ
ィマイザおよび最適化方法に関する。

【０００１】（従来の技術）ソフトウェア・プログラムの最適化は、メモリ空間を節約し、プログラム実行
を高速化し、プログラム動作を検証するために重要である。例えば、プログラム
・ソースは、変数であったり、フラグ・レジスタ内のビットであったり、あるい
はメモリ・アレイに格納された情報である。プログラム・リソース（例えば、変
数）およびソース・コード・ワード（例えば、命令）の数を低減するタスクが存
在する。最適化のための役立つ資料として、［１］Cliff Rick: "Global Code M
otion, Global Value Numbering", ACM SIGPLAN 1995, La Jolla, CA USA, page
s 246-257がある。オプティマイザまたは最適化装置(optimizer)は、（ａ）命令
によってアクセスされるリソースがソフトウェア・プログラムにおいてさらに利
用されるかどうか（「USEリソース」）あるいは（ｂ）リソースはさらに利用さ
れず（「EXHリソース」）、空であるとみなされるかどうかを区別することによ
って、リソースのいわゆる「ライブ情報 (live information)」を取得する。

【０００２】例えば、ＣやＰＡＳＣＡＬなどの高級プログラミング言語用のオプティマイザ
が知られている。しかし、アセンブリ言語プログラムにおいてリソースを節約す
ることは、このようなプログラムにおける多くのグローバル変数のためにより複
雑になる。オプティマイザはプログラムを解析し、プログラムを修正して、再度
解析しなければならない。このような手法は、時間およびメモリを消費する作業
である。

【０００３】本発明は、従来技術の欠点および制限を緩和あるいは回避するプログラム・オ
プティマイザを提供することを目的とする。

【０００４】（好適な実施例の説明）図１は、本発明によるプログラム・オプティマイザ（以下、オプティマイザ１
００という）の簡略ブロック図を示す。例えば、オプティマイザ１００は、メモ
リ１１０と、データ・バス１２０およびアドレス・バス１２１と、プロセッサ１
３０とを有する汎用コンピュータによって実現できる。データ入力／出力用の周
辺装置などの他の構成要素は、簡略化のため図示しない。便宜上、オプティマイ
ザ１００のメモリ１１０は、プログラム２００（図２参照）と、本発明の方法を
実行する最適化ソフトウェア３０１（図３の方法３００を参照）とを格納する。

【０００５】本発明の方法に従って、オプティマイザ１００は、（ｉ）ＳＥＳＥまたは１入
力１出力(Single-Entry-Single-Exit)構造レベルで、また（ｉｉ）ＳＥＳＥ解析
の結果を考慮するプログラム・レベルで、フリー・リソースとビジー・リソース
とを区別することにより、プログラム２００を解析する。すなわち、オプティマ
イザ１００はローカル・レベルおよびグローバル・レベルでプログラム２００を
解析し、解析結果を合成する。あるＳＥＳＥを修正した後、オプティマイザ１０
０は修正されたＳＥＳＥのみを再解析し、前回の解析の結果を最終解析のために
利用する。これは従来技術とは異なり、従来技術では、プログラム解析はプログ
ラム全体に対して行われ、いくつかの計算は二度実行される。本発明は、冗長な
再計算を省き、オプティマイザ１００の動作時間をより効率的に利用する。

【０００６】詳細については以下で説明するが（図２および図３参照）、本発明のオプティ
マイザ１００は、（ｉ）最適化されるプログラム２００を格納し、かつ最適化ソ
フトウェア３０１を格納するメモリ１１０と、（ｉｉ）最適化ソフトウェア３０
１から（方法３００に従って）コマンドを受けて、（ａ）命令によるリソースの
使用を示すためにプログラム２００の命令におけるローカル・ベクトルを判定し
；（ｂ）ＳＥＳＥ命令についてプログラム２００をスキャンし；そして（ｃ）ロ
ーカル・ベクトルから、ＳＥＳＥ命令によるリソースの使用を示すＳＥＳＥベク
トルを判定するプロセッサとによって構成される。

【０００７】本発明の利点は、プログラム２００がアセンブリ言語で書けることである。こ
の特長により、本発明は組込み用アプリケーション(embedded applications)の
プログラム２００として特に適する。好ましくは、オプティマイザ１００はプロ
グラム２００を実行する必要はない。プログラム２００のリソースは、アプリケ
ーションによってプログラム２００の実行中に便宜的にアクセスされる。

【０００８】図２は、オプティマイザ１００によって最適化されることが可能なプログラム
２００の簡略フローチャート図を示す。図２は、非制限的な例であることを意図
する。プログラム２００は、命令Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ，Ｇ，Ｈ，Ｉ，Ｊ，Ｋ
，Ｌ，Ｍからなる。本明細書では、「ノード」という用語は「命令(instruction
)」の同義語として用いられる。命令Ｚ，Ｄ，Ｆは、プログラム・フローを条件
付で変更する（「then」および「else」選択肢）ための分岐命令(branch instru
ctions)（丸印）である；また命令Ａ，Ｂ，Ｃ，Ｈ，Ｇ，Ｉ，Ｅ，Ｊ，Ｋ，Ｌ，
Ｍはリニア命令(linear instructions)（四角印）であり、好ましくは、プログ
ラム・フローを変更しない。図２における矢印は、プログラム２００の好適な実
行フローを示す。いくつかの命令の周りの点線枠は、ＳＥＳＥＳ，Ｕ，Ｔ，Ｖ
，Ｗ（以下で定義する）である。命令によるプログラム２００の表現は、「begi
n」，「end」，「if」および「goto」という用語を用いるが、これらの用語は当
技術分野で周知である。 00: begin program 200 (at ENTRY point 210) (2.1) 02: if Z then begin J 06: K 08: L 10: M 12: end 14: else begin A 18: B 20: if D then begin C 22: goto line 18 24: end 26: if F then G 28: else H 30: I 32: E 34: end 36: end program 200 (at EXIT point 212) 左側の二桁の数字は、プログラム行を表す。説明の便宜上、「サクセッサまた
は後任者(successor)」（単数および複数）という用語は、プログラム２００の
実行に適用される。命令Ａは、サクセッサＢを有し、命令ＢはサクセッサＤを有
し、命令ＧはサクセッサＩを有し、命令ＨはサクセッサＩを有し、命令Ｉはサク
セッサＥを有し、命令ＪはサクセッサＫを有し、命令ＫはサクセッサＬを有し、
命令ＬはサクセッサＭを有する。分岐命令Ｚ，Ｄ，Ｆは２つ以上のサクセッサを
有しており、命令ＺはサクセッサＪおよびＡを有し、命令ＤはサクセッサＣおよ
びＦを有し、命令ＦはサクセッサＧおよびＨを有する。

【０００９】同様に、「プレデセサまたは前任者(predecessor)」という用語は、プログラ
ム２００の実行に適用される。命令Ｚはプレデセサとしてエントリ・ポイント（
「ENTRY」）を有し、命令ＡはプレデセサＺを有し、命令ＢはプレデセサＡおよ
びＣを有し、命令ＣはプレデセサＤを有し、命令ＤはプレデセサＢを有し、命令
ＦはプレデセサＤを有し、命令ＧおよびＨはプレデセサＦを有し、命令Ｉはプレ
デセサＧおよびＨを有し、命令ＥはプレデセサＩを有し、命令ＪはプレデセサＺ
を有し、命令ＫはプレデセサＪを有し、命令ＬはプレデセサＫを有し、命令Ｍは
プレデセサＬを有する。エグジット・ポイント２１２（「EXIT」）は、プレデセ
サＭおよびＥを有する。すなわち、プログラム・フローは：（ａ）分岐命令において分割する（例えば、Ｚ，Ｄ，Ｆ；≧＝２サクセッサ）（ｂ）マージ命令においてマージする（例えば、Ｂ，Ｅ，ＥＸＩ；≧＝２サクセ
ッサ）、あるいは（ｃ）リニア命令において変化しない（１サクセッサ，１プレデセサ）のいずれかである。

【００１０】本明細書では、ＳＥＳＥは以下に準拠する命令のグループである：（ａ）グル
ープに属する一つの命令は、常に最初に実行される（シングル・エントリ）；お
よび（ｂ）プログラム・フローが直前の命令においてグループから抜ける（シン
グル・エグジット）とき、グループの外では実行されるのは一つの命令しかない
。これについては、図２の模式図において示されている。各点線枠（例えば、SE
SE T）について、枠内に進む(SESE entry)矢印は一つしかなく（例えば、AからB
）しかなく、また枠から抜ける(SESE ext)矢印は一つしかない（例えば、DからF
）。

【００１１】命令はリソースを指すことができる。説明を簡単にするため、リソースは変数
、例えば、変数"a", "b", "c", "d", "e", "x"を有すると想定する。本明細書で
用いられる「変数」という用語は、例えば、レジスタ，フラグまたはメモリ・ア
レイなど、他のハードウェアおよびソフトウェア・リソースを含むことを意図す
る。例えば、命令ＪからＭは、以下のオペレーションを表すことができる： J: x: = a + e (2.1a) K: b: = x L: x: = c M: x: = d （"="シンボルの）左側の変数は結果(results)であり、右側の変数は引数(argum
ents)である。当技術分野では、変数ベクトルを導入することが知られている。
２つのベクトル分類が用いられる。すなわち、各命令のuse-vectorは、どの変数
が用いられ、どの変数が用いられないかを示すことができる。exhベクトル（"ex
haust"を表す）は、どの変数が命令によって修正されるのかを示すことができる
。さらに、一つの命令を分類するベクトルは「ローカル・ベクトル(local vecto
rs)」であり、２つまたはそれ以上の命令を分類するベクトルは「グローバル・
ベクトル(global vectors)」である。

【００１２】一般に、use-vectorおよびexh-vectorはΨバイナリ値（「ビット」）を有する
：

【００１３】

【数１】

【００１４】ビット値は、例えば、変数が存在する場合には「１」であり、変数が存在しない
場合には「０」である。ビット・インデクスΨ（例えば、１からΨ）は、従来の
ように上記のアルファベット順に従い、"a"がbit₁，"b"がbit₂，"c"がbit₃，"d"
がbit₄，"e"がbit₅，"x"がbit₆である。例えば、命令Ｊのベクトルは次の通り： local_use (J) = (1, 0, 0, 0, 1, 0) and (2.3) local_exh (J) = (0, 0, 0, 0, 0, 1); (2.4) また命令Ｋのベクトルはベクトルは次の通り： local_use (K) = (0, 0, 0, 0, 0, 1) and (2.5) local_exh (K) = (0, 1, 0, 0, 0, 0). (2.6) 基準ベクトル(reference vector)は次のように定義できる： reference = "zero" = (0, 0, 0, 0, 0, 0). (2.7a) あるいは次のように定義できる： reference = (1, 1, 1, 1, 1, 1) (2.7b) 便宜上、本発明について、定義（２．７ａ）の「ゼロ・ベクトル」に関連して説
明する。当業者であれば、本明細書の説明に基づいて、定義（２．７ｂ）による
基準ベクトルでも方法３００を実施できよう。また、バイナリ値の数値Ψは異な
ってもよい。

【００１５】プログラム２００は、例えば次のようにして、命令("inst")およびそのサクセ
ッサ("succ")についてベクトルを関連付けることにより解析できる：

【００１６】

【数２】

【００１７】周知の式":="は、左側の項が右側のオペレーションによって表される値を
受けることを示す。好ましくは、式（２．８）および（２．９）による計算は、
実質的に同時に行われる。プラス+およびマイナス-シンボルは、以下のルールに従ってビットの加算および
減算を表すことができる。 1 + 1 = 1 (2.10) 1 + 0 = 1 0 + 1 = 1 1 - 1 = 0 1 - 0 = 1 0 - 1 = 0 0 + 0 = 0 ただし、このような計算は説明の便宜的な例に過ぎないものとする。

【００１８】更なる表記を簡単にするため、global_use-vectorおよびglobal_exh-vectorは
、総じて「グローバル・ベクトル」という。同様に、local_use-vectorおよびlo
cal_exh-vectorは、総じて「ローカル・ベクトル」という。一般に、以下の表記
：

【００１９】

【数３】

【００２０】は、命令instを指すグローバル・ベクトルが命令instのローカル・ベクトルとサ
クセッサsuccのグローバル・ベクトルとの間の任意のベクトル・オペレーション
（

【００２１】

【数４】

【００２２】シンボルによって表される）によって得られることを示す。サクセッサから命令
ベクトル（例えば、global (inst)を取得する（「バックワード・トラバース(ba
ckward traverse)」ことは説明のため便利であるが、本発明にとって不可欠では
ない。任意で、反対の手法（「フォーワード・トラバース(forward traverse)」
については以下で説明する。

【００２３】マージ命令およびリニア命令instについて、"global (succ)"は一つのサクセ
ッサのベクトルを指す。複数のサクセッサを有する分岐命令inst（例えば、命令
ＤのサクセッサＦおよびＣ）について、"global (succ)"は、以下の（２．１２
）の場合（ａ）を表して、global (inst)の"global_use"部分を計算し、また（
２．１３）の場合（ｂ）を表して、global (inst)の"global_exh"部分を計算す
る：

【００２４】

【数５】

【００２５】図２の例では、Ｎ＜＝２である。ビット・オペレーションは、（２．１２）の合
成(combination)

【００２６】

【数６】

【００２７】の場合には論理和(or)オペレーションであり、（２．１３）の交差(intersectio
n)

【００２８】

【数７】

【００２９】の場合には論理積(and)オペレーションである。すなわち： 1 and 1 = 1 (2.14) 1 and 0 = 0 0 and 1 = 0 0 and 0 = 0 1 or 1 = 1 (2.15) 1 or 0 = 1 0 or 1 = 1 0 or 0 = 0 当技術分野で周知な深さ順序(depth ordering)に従って、プログラム２００は
、（ａ）全ての命令のローカル・ベクトル（例えば、useおよびexh）を判定し；
（ｂ）解析インデクス(analyzing indices)を各命令に割当て；（ｃ）プログラ
ム２００のENTRYからEXITまでグローバル・ベクトルを反復的に計算することに
よって、解析できる。例えば、解析インデクスは、Ｚの場合「１」であり、Ｊの
場合「２」であり、Ｋの場合「３」であり、Ｌの場合「４」であり、Ｍの場合「
５」であり、Ａの場合「７」であり、Ｈの場合「１５」である。便宜的に最も高
い解析インデクスから開始し、またグローバル・サクセッサ・ベクトルがゼロで
あると想定すると、プログラム２００は以下のステップで解析できる：

【００３０】

【数８】

【００３１】解析の最後に、ベクトル・グローバル(Z)は冗長な変数を表す。

【００３２】解析後、いくつかの命令は修正され、いくつかの変数は削除されて、解析は再
度実行される。ただし、このような手法は、いくつかの冗長な計算が二度実行さ
れるという欠点を有する。本発明のオプティマイザ１００は、必要なオペレーシ
ョンの数を低減する。

【００３３】図３は、オプティマイザ１００において適用される本発明の方法３００の簡略
フローチャート図を示す。方法３００は、ローカル・ベクトル判定ステップ３１
０と、スキャン・ステップ３１５と、ＳＥＳＥベクトル判定ステップ３２０と、
ステップ３２０の条件付反復（ライン３２１，クエリー３２２）と、任意で、修
正ステップ３４０および３２０’とによって構成される。矢印およびラベルSTAR
TおよびSTOPは、好適な方法フローを示す。

【００３４】ローカル・ベクトル判定ステップ３１０において、オプティマイザ１００は各
命令（例えば、命令ＡからＺ）についてローカル・ベクトル（local_useおよびl
ocal_exh）を計算し、ローカル・ベクトルを格納する。好ましくは、ローカル・
ベクトルは第１部分ベクトル（例えば、local_use）および第２部分ベクトル（
例えば、local_exh）として与えられる。図２の例では、オプティマイザ１００
は命令Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ，Ｇ，Ｈ，Ｉ，Ｊ，Ｋ，Ｌ，Ｍ，Ｚについてloca
l_useおよびlocal_exh（総じて、"local (inst)"）を計算する。

【００３５】スキャン・ステップ３１５において、オプティマイザ１００は、プログラム２
００における各ＳＥＳＥに属する命令を判定する。当業者であれば、このやり方
は理解できよう。図２の例では、オプティマイザは，（ｉ）命令Ｂ，Ｃ，Ｄ（枠
２０３）付きＳＥＳＥＴ；（ｉｉ）命令Ｆ，Ｇ，Ｈ，Ｉ（枠２０４）付きＳＥ
ＳＥＵ；（ｉｉｉ）命令Ａ，「チャイルド(child)」ＳＥＳＥＴ，「チャイ
ルド」ＳＥＳＥＵおよび命令Ｅ付き「ペアレント(parent)」ＳＥＳＥＳ；お
よび（ｉｖ）命令Ｊ，Ｋ，Ｌ，Ｍ付きＳＥＳＥＶ；ならびにプログラム２００
のＳＥＳＥＷを検出する。言い換えると、ＳＥＳＥのチャイルド・ペアレント
・プログラム階層が確立される。

【００３６】ＳＥＳＥベクトル判定ステップ３２０において、オプティマイザは、ステップ
３１０のローカル・ベクトルを利用して、ＳＥＳＥの一部または全てのＳＥＳＥ
ベクトルを計算する。図２の例では、オプティマイザ１００は以下を計算する。 local (U) = global (F) by iteration within SESE U (3.1) local (T) = global (B) by iteration within SESE T (3.2) local (V) = global (J) by iteration within SESE V (3.3) 好ましくは、オプティマイザ１００は、以下のようにＳＥＳＥ内でＳＥＳＥベク
トルを反復的に与える（式（２．２）および（２．３）を参照）：（ａ）第１部
分ベクトル（例えば、local_use (inst)）を加算（＋）し、第２部分ベクトル（
例えば、local_exh (inst)）を減算（−）し、また第１グローバル・サクセッサ
・ベクトル（例えば、global_use (succ)）を加算することによって、第１グロ
ーバル・ベクトル（例えば、global_use (inst)），および（ｂ）第２部分ベク
トル（例えば、local_exh (inst)）を加算（＋）し、第１部分ベクトル（例えば
、local_use (inst)）を減算（−）して、第２ローカル・サクセッサ・ベクトル
（例えば、global_exh (succ)）を加算することによって、第２グローバル・ベ
クトル（例えば、global_exh (inst)）。反復の詳細については、以下で説明す
る。

【００３７】本発明の重要な特長は、オプティマイザ１００は、好ましくは、現在解析中の
ＳＥＳＥの外のプログラム挙動を考慮しないことである。例えば、ＳＥＳＵＵ
のローカル(U)の判定について、オプティマイザはＳＥＳＥＵに属さない命令
Ｚ，Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｊ，Ｋ，Ｌ，Ｍのローカル・ベクトルを考慮に入れな
い。

【００３８】オプティマイザ１００は、全プログラム２００のグローバル・ベクトル（例え
ば、global (W)）を計算するまで、ステップ３２０を反復する。この反復では、
オプティマイザ１００はＳＥＳＥ階層を上に昇る。図３は、クエリー３２２（「
最高レベル？」）の「ｎｏ」ライン３２１によって、ステップ３２０の反復を示
す。それにより、オプティマイザ１００はチャイルドＳＥＳＥからペアレントＳ
ＥＳＥに進む。チャイルドＳＥＳＥの意味で「グローバル」なベクトルは、より
高い位のペアレントＳＥＳＥの意味では「ローカル」ベクトルになる。図２の例
において、第１反復では、オプティマイザ１００はlocal (U)およびlocal (T)を
利用して、global (A)=local (S)を取得し、また第２反復では、オプティマイザ
１００はlocal (S)およびlocal (V)を利用して、ＳＥＳＥＷ（プログラム２０
０）のグローバル・ベクトルを取得する。ステップ３２０において取得したＳＥ
ＳＥベクトルは、ＳＥＳＥにおけるいくつかの変数を冗長変数として特定する。

【００３９】次のステップ３４０および３２０’は、オプティマイザ１００がプログラム２
００２を修正する際に、任意で実行される。修正ステップ３４０において、オプ
ティマイザ１００はＳＥＳＥにおける冗長変数（"variables"）を削除する。図
２の例では、オプティマイザ１００は、ＳＥＳＥＶの命令Ｋを修正し、これは
命令Ｋ’（プライム記号）になる。次の選択ＳＥＳＥベクトル判定ステップ３２
０’では、オプティマイザ１００は、ＳＥＳＥＴ，Ｕ，Ｓではなく、修正ＳＥ
ＳＥＶ’（"selected SESE"）の修正グローバル・ベクトルを判定する。ステ
ップ３２０’の反復では、オプティマイザ１００はＳＥＳＥＳのベクトル（ス
テップ３２０ですでに取得済み）と、ＳＥＳＥＶ’のベクトルとを利用する。
便宜上、ステップ３２０のベクトル解析について、図２の例でさらに詳しく説明
する。オプティマイザ１００は、以下の計算により、ＳＥＳＥＵについてＳＥ
ＳＥベクトルとしてglobal (F)を判定する：

【００４０】

【数９】

【００４１】左側の括弧内のローマ数字は、好適な解析順序を示す。例えば、（ｉ）における
global (H)は（ｖ）におけるglobal (H)とは異なる。便宜上、オプティマイザ１
００はＳＥＳＥＵに対して深さ順序(depth ordering)をローカルに適用し、命
令Ｆに解析インデクス「１」を割当て、Ｇに「２」を割当て、Ｉに「３」を割当
て、Ｈに「４」を割当てる。次に（ｉ）では、オプティマイザ１００は最高イン
デクス「４」を有する命令「Ｈ」のローカル・ベクトルをゼロ・ベクトル（式（
３．４））に合成する。最初にゼロ・ベクトルを利用するのが便利である。次に
（ｉｉ）では、オプティマイザ１００は、命令Ｅ（命令のＩのサクセッサである
）がＳＥＳＥＵの外にあるので、local (I)をゼロ・ベクトルに合成する。こ
れは、本発明の重要な態様である。好ましくは、オプティマイザ１００は、ＳＥ
ＳＥの外にあるサクセッサ命令を、ＳＥＳＥベクトルの計算では存在しないもの
とみなす。従って、オプティマイザ１００は、global_use (succ)およびglobal_
exh (succ) (global (succ))についてゼロ・ベクトルで式（２．８）および（２
．９）を適用する。好ましくは、オプティマイザ１００は、ＳＥＳＥＵを反復
して移動する（（ｉ）から（ｉｖ）および（ｖ）から（ｖｉｉｉ））。オプティ
マイザ１００のメモリ空間を節約するために、予備結果（例えば、（ｉ）から（
ｖｉｉ））は、好ましくは、一時的にしか格納されない。当業者であれば、この
反復をどのようにして停止させるか理解されよう。好ましくは、この反復は、割
当ての左側（例えば、（３．４）から（３．１１））のグローバル値が変化しな
くなると停止される。例えば、これは、（ｖ）におけるglobal (H)が（ｉ）にお
けるglobal (H)に等しくなり、（ｖｉ）におけるglobal (I)が（ｉｉ）における
global (I)に等しくなり、（ｖｉｉ）におけるglobal (G)が（ｉｉｉ）における
global (G)に等しくなり、更なる割当てにおけるglobal (F)が（ｉｖ）における
global (F)に等しい場合である。ステップ３２０において、オプティマイザ１００は、ＳＥＳＥＴのＳＥＳＥベ
クトルとしてglobal (B)を計算する：

【００４２】

【数１０】

【００４３】 successorがＳＥＳＥの外である場合、このsuccessorは基準ベクトル（例えば、
ゼロ）であると想定される。例えば、命令ＤのサクセッサＦは、現在解析中のＳ
ＥＳＥＴに属さない。従って、サクセッサ・ベクトルはゼロであると想定され
る。オプティマイザは以下を続ける：

【００４４】

【数１１】

【００４５】ステップ３２０において、オプティマイザ１００は、global (A)についてＳＥＳ
ＥＳを解析し、これはＳＥＳＥベクトルになる：

【００４６】

【数１２】

【００４７】好ましくは、リニア・シーケンスは反復を必要としない。

【００４８】ステップ３２０において、オプティマイザ１００は、以下の一般ルールに従っ
て、フォーワード・トラバースにより、ＳＥＳＥＶの連続した命令Ｊ，Ｋ，Ｌ
，Ｍについてglobal (V)を任意で取得できる：

【００４９】

【数１３】

【００５０】任意で、ＳＥＳＥ（「第１ＳＥＳＥ」、例えば、ＳＥＳＥＴ）において特定の
変数を利用できるか、あるいは利用できないかの質問は、第１ＳＥＳＥにおける
変数を評価することによって答えることができる。この答えは、以降のＳＥＳＥ
（例えば、ＳＥＳＥＵ，命令Ｅ）のベクトルに依存する。任意で、以下のサブ
ステップが実行される：（ａ）変数（例えば、global (T)）を考慮する、第１Ｓ
ＥＳＥ内のＳＥＳＥベクトルが与えられる。（ｂ）第１ＳＥＳＥに続くＳＥＳＥ
のＳＥＳＥベクトルが与えられる（例えば、global (U)，命令Ｅ）。（ｃ）サブ
ステップ（ｂ）にて取得した最後のＳＥＳＥベクトルに変数がセットされている
かどうか調べる。

【００５１】また、本発明の方法３００は、以下のステップを有する、プログラム２００を
解析するための方法として説明できる：（ａ）プログラム２００の基本ブロック
（例えば、分岐のない一つの命令または連続した命令）内のライブ情報(live in
formation)（例えば、local_use, local_exh）を計算するステップ；（ｂ）基本
ブロックのライブ情報からＳＥＳＥ構造内のライブ情報（例えば、ＳＥＳＥＴ
，Ｕ，Ｖのglobal_use, global_exh）を評価するステップ；および（ｃ）ＳＥＳ
Ｅ構造（ＳＥＳＥＴ，Ｕ，ＶからＳＥＳＥＳおよびＳＥＳＥＷ）のライブ
情報からプログラム２００のライブ情報を取得するステップ。

【００５２】好ましくは、ステップ（ａ）における解析は、プログラム２００（「フォーワ
ード・トラバース」）の好適な実行フロー（図２における矢印の方向）の順序で
実行され、ステップ（ｂ）における解析は、反復付きの逆順序（「バックワード
・トラバース」）で実行される。

【００５３】さらに、方法３００は、以下のステップにより、プログラム２００におけるリ
ソース・ベクトル（例えば、ＳＥＳＥＷのグローバル・ベクトル）を評価する
ための方法として説明できる：（ａ）反復（例えば、ステップ３２０）によりプ
ログラム２００のＳＥＳＥを解析し、ＳＥＳＥベクトルを与えるステップであっ
て、反復は基準ベクトル（例えば、ゼロ）から開始する、ステップ；および（ｂ
）ステップ（ａ）のＳＥＳＥを利用してプログラム２００を解析し、リソース・
ベクトルを与えるステップ。

【００５４】さらに、本発明は、プログラム（例えば、プログラム２００）のリソースをベ
クトル解析するための方法として説明でき、ここでプログラム・フローは、（ａ
）分岐命令（例えば、Ｚ，Ｆ，Ｄ）において分割し、（ｂ）マージ命令（例えば
、Ｂ，Ｉ，ポイント２１２）においてマージし、（ｃ）リニア命令（例えば、Ｊ
，Ｋ，Ｌ，Ｍ，Ａ，Ｅ）において変化しない。この方法は以下のステップによっ
て構成される：それぞれが一つのフロー・エントリおよび一つのフロー・エグジットを有する
命令のグループ（例えば、ＳＥＳＥＵ，Ｔ，Ｖ）を確立するステップ；各グループにおいて、（ａ）一時点において分岐命令の命令ベクトルを、サクセッサ命令の２つまたは
それ以上のベクトルに関連付け（例えば、式（３．７）においてＦ，Ｇ，Ｈを関
連付ける）、（ｂ）別の時点においてマージ命令の命令ベクトルをそのプレデセサ命令のベク
トル（例えば、global (I)）に関連付け、および（ｃ）リニア命令のベクトルをそのサクセッサ命令のベクトルに関連付ける、ことを選択的に行うことによって、グループのベクトルを与える段階であって、
サクセッサ命令およびプレデセサ命令の任意のベクトルは、サクセッサ命令また
はプレデセサ命令がこのグループに属さない場合に、基準ベクトル（例えば、ゼ
ロ）に設定される、段階；およびグループ・ベクトル（例えば、ＳＥＳＥＵ，Ｔ，Ｖ，ペアレントＳＥＳＥ
Ｓ）をプログラム・ベクトル（例えば、ＳＥＳＥＷ）に合成する段階。

【００５５】当業者であれば、本明細書における説明に基づいて、さらに説明しなくても、
ハードウェアおよびソフトウェアによってオプティマイザ１００を提供できよう
。本発明について特定の構造，デバイスおよび方法の観点から説明してきたが、
当業者であれば、本発明はこのような例に制限されず、発明の全範囲は特許請求
の範囲によって適切に決定されることが、本明細における説明に基づいて理解さ
れよう。

【図面の簡単な説明】

【図１】本発明によるプログラム・オプティマイザの簡略ブロック図を示す。

【図２】一例として、図１のオプティマイザによって最適化されるプログラムの簡略フ
ローチャート図を示す。

【図３】図１のオプティマイザにおいて適用される本発明の方法の簡略フローチャート
図を示す。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ドミトリー・バルメンコフロシア連邦、サンクト・ペテルスブルク 198156、ル・プルコフスカヤ26−27 Ｆターム(参考） 5B081 CC21 CC30

Claims

【特許請求の範囲】

【請求項１】リソースにアクセスする命令を有するプログラムを最適化す
る方法であって：前記命令による前記リソースの使用状態を示す、前記命令のローカル・ベクト
ルを調べる段階；チャイルド・ペアレント・プログラム階層におけるＳＥＳＥ (Single-Entry-S
ingle-Exit)構造に関する前記プログラムをスキャンする段階；および反復的に、前記階層を昇り、前記ローカル・ベクトルからＳＥＳＥベクトルを
調べる段階であって、前記ＳＥＳＥベクトルは前記ＳＥＳＥ構造による前記リソ
ースの使用状態を示すところの段階；によって構成されることを特徴とする方法。
【請求項２】請求項１記載の方法であって：冗長リソースとして前記ＳＥＳＥベクトルによって特定されるリソースを削除
することにより、前記プログラムを修正する段階；および修正されたＳＥＳＥ構造についてのみ、新規ＳＥＳＥベクトルを判定する段階
；をさらに含んで構成されることを特徴とする請求項１記載の方法。
【請求項３】請求項１記載の方法であって：ローカル・ベクトルを判定する前記段階において、前記ローカル・ベクトルは
、第１部分ベクトルおよび第２部分ベクトルとして与えられ；およびＳＥＳＥベクトルを判定する前記段階において、前記ＳＥＳＥベクトルは、（ａ）前記第１部分ベクトルを加算し、前記第２部分ベクトルを減算し、
第１グローバル・サクセッサ・ベクトルを加算することによって、第１グローバ
ル・ベクトルとして、および（ｂ）前記第２部分ベクトルを加算し、前記第１部分ベクトルを減算し、
第２グローバル・サクセッサ・ベクトルを加算することにより、第２グローバル
・ベクトルとして、反復的に与えられることを特徴とする請求項１記載の方法。
【請求項４】複数のサクセッサとして生じるサクセッサについて、ＳＥＳ
Ｅベクトルを判定する前記段階は：（ａ）命令の前記第１グローバル・ベクトルは、前記複数のサクセッサの第１
グローバル・ベクトルの合成(combination)によって与えられ、および（ｂ）命令の前記第２グローバル・ベクトルは、前記複数のサクセッサの第２
グローバル・ベクトルの交差(intersection)によって与えられる、ことを特徴とする請求項３記載の方法。
【請求項５】ＳＥＳＥベクトルを判定する前記段階において、ＳＥＳＥ境
界におけるローカル・ベクトルは、最初に基準ベクトルと比較されることを特徴
とする請求項１記載の方法。
【請求項６】前記基準ベクトルはゼロ・ベクトルであることを特徴とする
請求項５記載の方法。
【請求項７】第１ＳＥＳＥにおいて変数を評価する段階であって：（ａ）前記変数を考慮する、前記第１ＳＥＳＥにおいてＳＥＳＥベクトルを与
えるサブ段階；（ｂ）前記第１ＳＥＳＥに続く、ＳＥＳＥのＳＥＳＥベクトルを与えるサブ段
階；および（ｃ）サブ段階（ｂ）にて得られた最後のＳＥＳＥベクトルにおいて変数がセ
ットされているかどうかを調べるサブ段階；を有する第１ＳＥＳＥにおいて変数を評価する段階をさらに含んで構成される
ことを特徴とする請求項１記載の方法。
【請求項８】プログラムを解析する方法であって：（ａ）前記プログラムの基本ブロック内のライブ情報を計算する段階；（ｂ）前記基本ブロックのライブ情報から、ＳＥＳＥ (Single-Entry-Single-
Exit)構造内のライブ情報を評価する段階；および（ｃ）前記ＳＥＳＥ構造のライブ情報から、前記プログラムのライブ情報を取
得する段階；によって構成されることを特徴とする方法。
【請求項９】段階（ａ）において、シングル・フォーワード・トラバース
が用いられ、段階（ｂ）において、反復的なバックワード・トラバースが用いら
れることを特徴とする請求項８記載の方法。
【請求項１０】使用済みリソース用の第１ベクトルと、使用されなくなっ
たリソース用の第２ベクトルとにおいて、ライブ情報が与えられることを特徴と
する請求項８記載の方法。
【請求項１１】プログラムにおけるリソース・ベクトルを評価する方法で
あって：（ａ）ＳＥＳＥ内で反復により前記プログラムのＳＥＳＥを解析し、ＳＥＳＥ
ベクトルを与える段階であって、反復は基準ベクトルから開始する、段階；およ
び（ｂ）段階（ａ）のＳＥＳＥベクトルを利用して、前記プログラムを解析して
、前記リソース・ベクトルを与える段階；によって、プログラムにおけるリソース・ベクトルを評価する方法。
【請求項１２】前記段階（ａ）において、反復は、ＳＥＳＥベクトルがも
う変化しないときに停止されることを特徴とする請求項１１記載の方法。
【請求項１３】前記基準ベクトルは、ゼロ・ベクトルであることを特徴と
する請求項１１記載の方法。
【請求項１４】プログラムのリソースをベクトル解析する方法であって、
プログラム・フローは：（ａ）分岐命令において分割し、（ｂ）マージ命令においてマージし、および（ｃ）リニア命令において変化しない、前記方法は：それぞれが一つのフロー・エントリおよび一つのフロー・エグジットを有する命
令のグループを確立する段階；各グループにおいて、（ａ）一時点において分岐命令の命令ベクトルを、サクセッサ命令の２つ
またはそれ以上のベクトルに関連付け、（ｂ）別の時点においてマージ命令の命令ベクトルをそのプレデセサ命令
のベクトルに関連付け、および（ｃ）リニア命令のベクトルをそのサクセッサ命令のベクトルに関連付け
る、ことを選択的に行うことによって、前記グループのベクトルを与える段階であ
って、サクセッサ命令およびプレデセサ命令の任意の前記ベクトルは、前記サク
セッサ命令またはプレデセサ命令が前記グループに属さない場合に、基準ベクト
ルに設定される、段階；および前記グループ・ベクトルをプログラム・ベクトルに合成する段階；によって構成されることを特徴とする方法。
【請求項１５】グループ修正をさらに含んで構成される請求項１４記載の
方法であって、ベクトルを与える前記段階は、修正されたグループについてのみ
反復されることを特徴とする請求項１４記載の方法。
【請求項１６】プログラム・オプティマイザであって：最適化されるプログラムを格納し、かつ最適化ソフトウェアを格納するメモリ
；および前記最適化ソフトウェアからコマンドを受けるプロセッサであって：（ａ）前記プログラムの命令におけるベクトルを判定して、前記命令によるリ
ソースの使用を示し；（ｂ）ＳＥＳＥ(Single-Entry-Single-Exit)構造について前記プログラムをス
キャンし；および（ｃ）前記ローカル・ベクトルから、前記ＳＥＳＥ構造による前記リソースの
使用を示すＳＥＳＥベクトルを判定するプロセッサ；によって構成されることを特徴とするプログラム・オプティマイザ。