JPH04500132A

JPH04500132A - ２進符号の機械語のプログラムを別の２進符号の機械語に翻訳する機械処理

Info

Publication number: JPH04500132A
Application number: JP50806789A
Authority: JP
Inventors: ハンター、コリン・ビー; ベニング、ジョン・ピー; プファル、ハンス
Original assignee: ハンター・システムズ・ソフトウェア・インク
Priority date: 1988-07-29
Filing date: 1989-07-10
Publication date: 1992-01-09
Also published as: EP0428560A4; EP0428560A1; WO1990001738A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】２進符号の機械語のプログラムを別の２進符号の機械語に翻訳する機械処理発明の背景この発明はコンピュータ・プログラムを１つのコンピュータ言語から別のコンピュータ言語に翻訳する機械処理、および特に、コンピュータ・プログラムを１つの２進符号の機械語から別の２進符号の機械語に、あるいは１つのアセンブリ語を別のアセンブリ語に翻訳する方法に関する。

従来技術の説明コンピュータ・プログラムを１つのコンピュータ言語から別のコンピュータ言語に（「トランスレータ」）に翻訳する機械処理に関する技術は数多くの文献によりよく明らかにされている。下記の本文はその関連技術を簡潔に説明している。

コンパイラは技術上周知である。それらは、コンパイラ、フォートランまたはパスカルのように、高度な言語で書き込まれたプログラムをアセンブリ語または２進符号の機械語のいずれにも翻訳する。同様にアセンブラは技術上周知であり、それらはアセンブリ言語を２進符号の機械語に翻訳する。

一般に、コンパイラは人間が読み出し得る、つまり高レベル言語（「命令」）の単一ラインを複数のアセンブリ言語または複数の２進符号の機械命令に翻訳する。アセンブラは、一方では一般に１つのアセンブラ語ラインを１つの機械命令（コメントおよびアセンブラ指令は省略）に翻訳する。

したがって、アセンブラを伴わないコンパイラによる最適化の範囲がある。良好な、すなわち最適化するコンパイラは、通常平均コンパイラより少ない命令の特別なシーケンス用機械命令を発生させる。この技術的に周知のぼう大な配列の技法は［グローバル流れ分析」を含むコンパイラ・コード発生を最適化するために開発されてきた。コンパイラ設計用標準手引書は、アホ−（Ａｈｏ）、アール・セティ（Ｒ，＋ｅ！ｈｉ）およびジエイ・ニールマン（ＬＵｌｌｍａｎ）　（１９８６年のウェスレイ（Ｗｅ＋ｌＢ）の追加を含む）により特に第１０章の最適化技法に記載されている。

インタプリタはコンパイラと同じであるが、プログラム・ソースを機械言語にたやすく翻訳する代りをし、インタプリタは各命令を翻訳し、それから翻訳されたコードを実行し、それから次の命令を翻訳かつ実行し、以下同様に実行する。インタプリタは一度に１つの命令のみを処理するので、設計上、同じ言語用コンパイラをより簡素化できるが、最適化範囲はそれ以上床がらない。したがって、インタプリタ・プログラムはコンパイラ・プログラムよりもはるかに低速で実行されがちである。

他のトランスレータ形式も次々と開発されている。多数の高度トランスレータ（例えば、パスカルからコンパイラへのトランスレータ）はそれらが高レベル言語である限りほとんどどうどうめぐりであった。アセンブリ言語でのトランスレータ（例えばアセンブラ・コード８０８０〜８０８６）も報告されるが、まれにしかみられない。明らかにコンパイラの最適化技法はそのようなトランスレータには適さなかった。

いま２進符号の機械語ソース・ファイルを考えてみると、逆アセンブラは長年デバッグ用ツールの標準的機能とされておりかつこれは技術的に周知である。それらは２進符号の機械語の部分をアセンブリ言語の命令と等価な群に翻訳する。それらは複数の周知の問題、特に「段階問題」および「データ問題」、のために使用の制限を受けている。

大部分のコンピュータの２進命令の書式の長さは変化するので、段階問題が生じる。したがって、１つの命令が終了する場所及び別な命令が開始する場所を知ることは時として困難である。特に、逆アセンブラ工程が命令の始めで正しく開始されたか、あるいは途中で開始されたかどうかを知ることは困難である。後者の場合においては、続いて起こるすべての逆アセンブラ命令は一般に誤まりである。多くの問題が、命令を挿入されたデータのバイトまたは語を含むので、データ問題が起こる。

逆アセンブラは、ビットの特別なパターンが実際に命令であるのか、数バイトのデータだけであるのかを決定するのが困難である。そしてもちろん、データ・エリヤ問題が段階問題を悪化させるのは、逆アセンブラを正しい位置で再開始する前にアセンブラがデータ区域の長さを正確に定めなければならないからである。

逆アセンブラと同様に、シミュレータは２進符号の機械語のソースファイルを処理する。しかし、シミュレータは、ソースファイルを同時に翻訳しかつ実行する点でインタプリタと同じである。それらが実行すると、あたかもソースの２進プログラムは異なる機械語により別々のコンピュータで実行されるような効果を持つ。シミュレータは、ソフトウェアを用いてもとのコンピュータの実行を実行用コンピュータで正確にシミュレートするとこの効果を達成できる。シミュレータはほとんど成功しなかったか、それは１つの周知の問題すなわち主としてそれらが極めて低速だからである。まれに数百側ものシミュレータ命令がソースプログラム内の各々の命令のために実行する必要があり、最良シミュレータでさえソース命令毎に１０個から２０個のシミュレータ命令を必要とする。逆アセンブラに伴う前述の問題により、明らかに２進−２進を最適化するトランスレータの例はない。つまり、１つの２進符号の機械語を効率よくもう１つの２進符号の機械語に翻訳するプログラムの例はない。従って、シミュレータがインタプリタの２進 −２進と等価であるのでコンパイラと等価な２進−２進は存在しない。

発明の概要この発明は、効率のよいコンピュータ・プログラムによって１個の２進符号の機械語を別の２進符号の機械語に翻訳する効率的な機械処理を提供する。この機械処理はｒ２進コンパイラ」として呼ばれる。それはデジタルコンピュータ用プログラム内で実行することができる。

その技法は１個のアセンブリ言語を別のアセンブリ言語に翻訳することにも使用することができる。２進コンパイラは、コンパイラがインタプリタでなければならないシミュレータと同じ関係を持つ。さらにちょうどコンパイラが通訳されたコードよりも速く実行するコードを作るので、２進コンパイラで変換されたアプリケーションプログラムはシミュレータによる作動より速く実行する。

本発明の２進コンパイラ処理は、ソース２進プログラムを逆アセンブリすること、大域流れ分析データを用いて逆アセンブリ処理を完成するように、この「大域流れ分析」データを作る２進プログラムを分析すること、および大域流れ分析データを用い最適の２進コードを作るようにソース２進プログラムの翻訳された２進符号の機械語型を作ることを含む。本発明が１つのアセンブリ言語から別のアセンブリ言語への翻訳に使用される場合、逆アセンブリ段階は省略されるが、大域流れ分析は依然として実行される。出力は、最適化された２進コードの代りに最適化されたアセンブリ・コードを作る大域流れ分析データを使用する。

図面および一覧表の簡単な説明本発明の完全な理解ならびにその上述および他の長所はその図示された実施例の下記詳細な説明から得られるが、その実施例はインテル（Ｉｎｌｅｌ）　８０８６マイクロプロセツサ（ｒ８ＯＮコード」）の２進符号の機械語からモトローラ（Ｍｏｔｏ＋ｏｌａ）　６８０２０マイクロプロセツサ（ｒ６８０２０コード」）の２進符号の機械語にプログラムを変換する。

第１図は本発明に従ってデータ処理を実行する機械アルゴリズムの図を示す一般化された流れ図を示し、第２図は第１図のアルゴリズムの処理手順（ＰＲＯＣＥＳＳＰＲＯＣＥＤＵＲＥ）部分のより詳細な流れ図を示し、第３図は第２図のアルゴリズムの１つの手順（ＰＲＯＣＥＳＳＡ　ＰＲＯＣＥＤＵＲＥ）部分のより詳細な流れ図を示し、第４図は第３図のアルゴリズムのビルド・ベーシック・ブロック（ＢＵＩＬＤ　ＢＡＳＩＣＢＬＯＣＫ）部分のより詳細な流れ図を示し、第５図は第３図のアルゴリズムの前方流れ分析（ＦＯＲＷＡＲＤ　ＦＬＯＷ　ＡＮＡＬＹＳＩＳ）部分のより詳細な流れ図を示し、第６図は第３図のアルゴリズムの後方流れ分析（ＢＡＣＫＷＡＲＤ　ＦＬＯＷ　ＡＮＡＬＹＳＩＳ）部分のより詳細な流れ図を示し、第７図は第３図のアルゴリズムの未知分析（ＵＮＫＮＯＷＮＳＡＮＡＬＹＳＩＳ）部分のより詳細な流れ図を示し、第８図は第１図のアルゴリズムの分析完成流れ図（１へへ、へＬＹＳＩＳ　ＣＯλＩＰＬＥＴＥＤ　ＦＬＯＷＧＲＡＰ）１１部分のより詳細な流れ図を示し、第９図は第８図のアルゴリズムのリブ／デッド分析（ＬＩＶＥ／ＤＥＡＤ　ＡＮＡＬＹＳＩＳ）部分のより詳細な流れ図を示し、第１０図は第１図のアルゴリズムの変換命令（ＴＲＡＮＳＬＡＴＥＩＮｓＴＲＵｃ丁１ＯＮ）部分のより詳細な流れ図を示す。

詳細な説明第１図の流れ図により表わされたアルゴリズムの第１段階は、表わされた処理を実行するために必要な入力データ１０４を読出すことである。このデータは２進符号の機械語８０８６個および任意なアプリケーション固有データ（ａｓｄＮ］２および関連ソース２進プログラムを含む。読取りデータ入力は、第１図のブロック１０４で表わされる。

データの入力に続き、処理は第１図の処理手順のアルゴリズムブロック１２０に入る。この処理手順１２０の目的はソース２進プログラムを、制御の変化（呼出し、飛越しまたは復帰）により終了された順次命令の「基本ブロック」にまとめられるそのコンポーネント命令で分析することである。処理手順１２０は、基本ブロック間の制御の流れを表わすデータ構造である「流れグラフ」をも作成する。各基本ブロックとそれぞれ組み合わされたデータ構造は、ブロック内のすべての命令のリストと共に、ブロック内のレジスタ、フラッグ、スタック、およびメモリの使用についての情報を含む。基本ブロックは、コール命令から入力される「手順」にまとめられ、かつ復帰で終了する。

処理手順アルゴリズム１２０が実行されてから、処理は第１図のブロック１２４で表わされる分析完成流れ図アルゴリズムに入る。分析完成流れ図１２４の目的は、数種の異なる方法で処理手順１２０で作られたデータ構造を分析し、かつ翻訳命令ブロック１３２にこの分析結果を送ることである。分析完成流れ図１２４は５種類の異なる分析、すなわち「呼出し、復帰（コール・リターン）分析」、レジスタの「リブ−デッド分析」、フラグの「リブ−デッド分析」、および「整列分析」を実行する。この分析結果は最適化された翻訳コードを発生させる翻訳命令１３２により使用される。

分析完成流れ図アルゴリズム１２４が実行されてから、処理は翻訳命令アルゴリズム・ブロック１３２に入る。翻訳命令】３２０目的は、翻訳コード順序を最適に短縮させるために分析完成流れ図１２４で作られたデータを用いながら、基本ブロックの命令リストにある分析された命令を６８０２０２進符号の機械語の等価命令に翻訳して翻訳コードの順序を最適に短縮することである。翻訳命令１３２を適用した結果は、２進プログラム１４０を作ることである。第１図の処理手順１２０、分析完成流れ図１２４、および翻訳命令１３２の諸アルゴリズムを、これから詳細に説明する。

第２図は処理手順工程１２０の全体図を示す。そのオペレーション中に、処理が最大３つの異なるキューまで、すなわち新手順キュー、上方手順キュー、および下方手順キューまで連結できる手順ブロック（ＰＢｓ）　と呼ばれるデータ構造物を操作する分析中のプログラムが存在し、各々の手順に対して１つのＢＳが存在する。

第２図で示されるように、処理手順工程１２０の第１段階は、新手順キューにより空のＰＢを作ることである。この段階は第２図のブロック２０４で表わされる。ブロック２０８で表わされる次の段階は、新手順キューにどのようなＰＢでも存在するかどうかを決めることである。（もちろん、ループを経た第１回目の回答はイエスである。）ＦＢがキューに存在すれば、処理は、新手順キューから空のＰＢを除去しかつそれを初期設定し、すなわちＰＢ内に始動値を充填する働きをする処理がブロック２１０に移行する。ブロック２１（ｌで表わされた段階後、処理は、処理手順アルゴリズムを表わすブロック２２０に移る。このアルゴリズム２２０は分析中の現時点でできることと同じ程度に、ＰＢで表わされた手順の処理を多く実行する。基本ブロックはこの手順で見８せるのと同程度に多く作られる。

このアルゴリズムのオペレーションの１つの結果は、新しい手順キューに新しいＦＢを置かせたり、既存の（現在のものを含む）　ＰＢを下方の手順キューまたは上方の手順キューのいずれかに置くようにされる。

このアルゴリズムの完成後、処理はブロック２０８で表わされる決定段階に戻る。この段階は、どのようなＰＢでも新手順キュー（あるものは処理へ手順アルゴリズムで作られている）に存在するかどうかを再決定する。この場合もまた、工程はブロック２１０に移り、さらに２２０に移り、もしＰＲがキューに発見されるならば２０８に戻るが、このループは新しいＦＢが新しい手順キューに残らないようになるまで実行する。

この点で、処理は、どのようなＰＢでも下方の手順キューにあるかどうかを決定するブロック２１２で表わされる決定段階に移る。どのようなＰＢが見い出されても、処理はＰｉｔを処理のためにキューから移動し、さらにブロック２１４に移り、続いてブロック２２０（処理人手類）に移る。

この段階の結果は新しいＰＢを作ることになり、したがって、処理は２０８に戻り、かつこのサイクルはすべてのｌ’Ｂが新手順キューおよび下方手順キューの双方から移動されるまで続く。

それから、処理はブロック２１６で表わされる段階に移り、さらにどのようなＰＢでも上方手順キューにあるかどうかを決定する。もしそうであれば、３つのキューのどれにてもＰＢが残らなくなるまで、下方キューのＰＲによく似た処理をされ、そのとき完全な処理手順アルゴリズムが存在する。

第３図は第２図で示された処理へ手順ブロック２２Ｇの詳細を示す。これらの段階の経過中、２進コンパイラは、基本ブロック（ＢＢ）と呼ばれる４種のデータ構造物の４つのキューを操作する。これから述べるように、その４種のキューとは、新キュー、形状キュー、未知キュー、使用キューである。１つのＢＢは手順内の各基本ブロックと組み合わされる。第３図で示されるようにこの処理の第１段階は手順（３０Ｃで識別できるすべてのＢＢを作ることである。それから前方流れ分析は（ブロック３０８）を実行され、さらに後方流れ分析（３１２）　、および最終的に未知分析（３２０）が実行される。少しでもＢＢが３段階（ブロック３２０参照）後の４種のキューのどれにでも残る場合、処理は段階３０４〜３１６を繰り返し、さらにこのループはどのキューにもＢＢがなくなるまで繰返される。

それから処理は、手順自体のＦＢの後方流れデータのどれでもが変形（３２４）されたかどうかを見るために試験する。それが変形される場合、この手順をコールするすべての手順のＰＢは第２図に示されるブロック２１６および２１８で引き続き処理される上方手順キューに置かれる。

第４図は第３図のビルド・アルゴリズム基本ブロック３０４の詳細を示し、それは手順内で識別できるすべてのＢＢを作る。第１段階（ＬＯ２）は最初に利用できるＢＢを新キュー（上述の４種類のキューのうちの１種類）からの第１利用可能ＢＢをとることであり、それから、ジャンプ、コール、リターン、または割込み命令（終了命令として知られている）で始まる連続ディスアセンブラ命令は、始動アドレスで開始する連続ディスアセンブラ命令を続けてディスアセンブルする。ディスアセンブラ命令の符号表示は、ＢＢと組み合わされた命令リストと呼ばれるデータ構造物に蓄積される。

次の段階（４０４）は、現在のＢＨの終了命令（このＢＢは即時サクセサと呼ばれる）の後で、そのコードが直ちに開始するＢＢと共に現在のＢＢと連結することである。即時サクセサＢＢがまだ作られていない場合、いま工程は、このアドレスを持つ新しいＢＢを作り、それを現在のＢＢに連結し、かつ新キューにもそれを置く。即時サクセサが既に存在している場合は、それは形状キュー（４種類のＢＢキューの内の別の１種類）に置かれる。

次の段階（４０８）は、現在のＢＢ内の前方流れ分析を行なうことである。これは、現在のＢＢより論理的に先行しかつそれらの値をＢＢの命令で実行されるすべてのデータの変形を行いながら、ＢＢを経てその終りまで伝搬する前方データ（レジスタ値、スタック値、フラグ値、メモリ値）をすべてＢＢ内に蓄わえることを意味する。現在のＢＢに先行するＢＢはすべてそのプレデセッサと呼ばれる。それらは前節の意味におけるどの即時プレデセッサでもあり、あるいは現在のＢＢへの制御の伝達において生じた終了命令を持つＢＢでもある。この操作の結果、ＢＢと組み合わされたデータ構造物に蓄えられる現在のＢＢの前方データが生じる。

次の段階は、現在のＢＢの終了命令がコール、計算されたジャンプ、または割込み（ブロック４１２）であるかどうかに左右される。それが（４２０）である場合、ＢＢは未知キュー（４種類のＢＢキューの中の別の１種類）に置がれる。

それが（４２０）でない場合（すなわち終了命令が単一ジャンプである場合）　、ＢＢはジャンプの目標アドレスでコードと組み合わされたＢＢに連結される。

ＢＢがそのアドレスにない場合、新しいＢＢが作られて新キューに置かれる。

既存のＢＢは形状キューに置かれる（４１６参照）。

結局、すべての場合（４２４）において、現在のＢＢは使用キュー（４種類のＢＢキューの中の最後の１種類）に置かれる。次に新キューが空である（４２８）かどうかを見るために、チェックが行なわれる。それが空でない場合は、新キューが空になるまで、処理は段階４２０〜４２８を繰り返して行う。

第５図は、手順内のすべてのＢＢに関する前方流れ分析を行うブロック３０８によって表わされる、第３図の前方流れ分析アルゴリズムの詳細を示す。第１段階（５０４）はＢＢを形状キューから離すことである。それから、すべてのプレデセッサからＢＢへの前方データは、ＢＢを経て伝搬されかつその前方データ構造物（ブロック５０８および５１２）内に蓄えられる。即時プレデセッサがコール命令によって終了する場合、ＢＢを経て伝搬される前にデータはコールされた手順を経てまず伝搬される。それから、現在のＢＢの前方データが修正されているかどうかを決定するチェックが行われる。修正されていれば、すべてのサクセサＢＢは形状キューに置かれる。どちらの場合も、どのようなりＢが形状キュー（５２４）に残されるかどうかのチェックが行なわれ、さらにＢＢが残されていると、ＢＢが形状キューからなくなるまで、５０４から５２４までループ全体か再び繰り返えされる。

第６図は、手順のすへてのＢＢの後方流れ分析を行なうブロック３１２により表わされる第３図の後方流れ分析アルゴリズムの詳細を示す。第１段階（６０４）はＢＢを使用キューから離すことである。それからすべてのサクセサからＢＢへの後方データ（式のリスト）は、ＢＢを経て逆伝搬されかつその後方データ構造物（ブロック６０８および６１２）に蓄えられる。どのようなサクセサでもコール命令内で終了する場合、データはＢＢを経て伝搬される前に、コールされた手順を経てまず伝搬される。それから、現在のＢＢの後方データが修正されているかどうかを決定するチェックが行われる（６１６）。修正されていれば、すべてのプレデセッサＢＢは使用キュー（６２０）に置かれる。いずれの場合にも、どのようなりＢでも使用キュー（６２４）に残されるかどうかを知るチェックが行なわれ、さらにＢＢが残されていると、ＢＢが使用キューからなくなるまで、６０４から６２４までのループ全体は再び繰り返し実行される。

第７図は、手順内の未知ＢＢに関する分析を実行するブロック３１６により表わされる第３図の未知分析アルゴリズムの詳細を示す。第１段階（７０４）は、ＢＢを未知キューから離すことである。それから、必要ならばａｓｄファイルにあるデータを用いて、計算されたジャンプまたはコール・アドレスを計算する試みがなされる（７０６）。それから、処理はこの試みの結果に左右されて分けられる（７　］　２７　。計算が目標アドレスを具合良く定めた場合、目標ＢＢへの連結が作られる。そのアドレスに対してＢＢが存在しないと、新ＢＢは新キューにより作られ、すなわち存在するＢＢは形状キューに置かれる。（ブロック７２４参照。）それから、ＢＢ自体は使用キューに置かれ、かつその入力は手順のＰＢ　（７２４）の未知リストから除去される。

目標アドレスを計算する試みが不成功の場合（７２０）　、ＢＢは未知キューに置き直され、かつ入力は手順のＰＢの未知リスト内に作られる。どの場合にも、どのようなりＢでもその未知リスト入力が処理されなかった未知キューに残るかどうかを知るチェック（７２８’ｌが行われる。ＢＢが少しでも残ると、不成功ＢＢが未知キューからなくなるまで７０４カら７２８への全体のループが再び繰返される。

第８図は、コード発生段階のための準備における完成された流れグラフのグローバル流れ分析を行うブロック１２４により表わされた第１図の処理の分析完成流れグラフ・アルゴリズムの詳細を示す。第１段階８０４は基本ブロックの完成した組が、標準分類アルゴリズムに用いられる増加中のアドレスによる命令に分類される段階である。この特別な実行においては、分類アルゴリズムは、デー・イー・ヌース（Ｄ、　Ｅ、　Ｋｎｕ　ｌｈｌ　発行のコンピュータ・プログラム技術の第３巻、１９７３年マサチューセッツ版８０〜１２０頁のアディソン・ウニスリー（Ａｄｆｌ目ｏｎ−Ｗｅｓｌｙ）著「分類および探索」で説明された分類アルゴリズムの記事の解説を用いている。分類段階の完成後、処理は、８０８６コードから５８０２０コードへの特別な場合の翻訳プログラムに対してジャンプ、コール、およびリターン・アドレス使用を最適化する任意の段階（８０８）に進む。この段階は一般の場合には与えられない。

ブロック８０８で表わされた段階の後、処理は、リブ・デッド分析アルゴリズムを表わすブロック８］２に移る。

この段階は、分析完成流れグラフ・アルゴリズム１２４により行なわれる最適化の中核をなす。この段階は、レジスタおよびフラグ用「リブ・デッド」データを計算する完成された流れグラフのグローバル流れ分析を行なう。

このデータは、ソース機械調節フラグ（例えば、キャリーまたはオーバーフロー）およびレジスタが次の命令（「リブ」）で使用されるか、あるいは（「デッド」）で使用されないかどうかを明白にする。この情報は、最適化された目標コードを作る第１図の次のトランスレート命令アルゴリズム１３２により、かつリブ調節フラグ値を維持しあるいはシミュレートする命令を作るだけで、ならびにデッド・レジスタ内のデータを維持しないことにより使用される。それから処理は、８０８６コードから６８０２０コードへの翻訳プログラムの特別な場合に左右される色々な「のそき穴」の最適化を行なうもう一つの段階（１１６）　に移る。

第９図は第８図のブロック８１２、すなわち、リブ・デッド分析アルゴリズムにより表わされる段階の詳細を示す。この段階の経過中、手順ブロック（ＰＢ）の２種類のキュー〔上方キューおよび下方キュー〕ならびに基本ブロックｕＢ）の１種類のキューは完成される。第１段階（９０４）は、下方キューのすべての非復帰手順（すなわちもう１つの手順に戻らない）のためにＰＢを置くことである。次の段階（９０８）　は、下方キューに少しでもＰＢがあるがどうかをチェックすることである。ＦＢがなければ、処理は上方キューに少しでもＦＢがあるかを調べるチェック（９１２）をする。どのキューにもＰＢが少しでもある場合、工程は、リブ・デッド・データおよび手順のための伝達機能（すなわち手順が他の手順から入るリブ・デッド・データを有する作用）を計算する段階９１６を続行する。手順が完全に分析されあるいは工程が前もって分析されていない手順は、コールされたコール命令に出合うときに、この段階は終了する。

それから処理は、手順か完全に分析されたり、分析されない手順へのコールか得られたりする理由で段階９１６か終了したかどうかを定める段階９２０に続く。

手順が完成された場合、上方キューの完成された手順をコールするすへての手順のためにＰＢを置く。未分析手順に対するコールが得られたという理由で段階９１６が終了した場合、未分析手順のＰＢは段階９２８の下方キューに置がれる。

どの場合も、すへての手順が十分分析されるまで、処理は段階９０８に戻り続けかつそれを繰り返す。

第１０図は、６８０２０コ一ド発生を実行するブロック１３２で表わされる第１図の工程のトランスレート命令アルゴリズムの詳細を示す。第１段階（１２０４）は、段階８０４て作られる増加するアドレス命令内に配列されるＢＢの輪がら１つのＢＢを得ることである。それから、命令の符号化オプコード・アドレス・モード、および属性はＢＢと組み合わされた命令リストから読み出される（１２１１８）。これらの符号化された値は、表から翻訳された６８０２０の２進コード（ちょうど１つの命令となる場合が多い）の短いセグメントを選択するための指標として使用される（１２１２）。

６８０２０コードはデータ構造物（１２＋　６）に蓄えられ、それから、ＢＢの命令リスト内に命令がまったくなくなるまで、処理は１２２０を経て段階１２０８に繰り返し戻ることで次の命令の翻訳を始める。

この点で、ＢＢを表わす６８ＯＮ命令は、ファイルの出力である（１２２２）。

それから、翻訳すべきＢＢがなくなるまで、工程は次のＢＨに移りかっ１２２４を経て段階１２０４を遂行する。

言うまでもなく、上記の実施例およびプログラム実行は、本発明の原理の応用を具体的に説明しただけである。

数多くの変形は本発明の主旨および範囲を逸脱せずに当業者によって考案することができる。

特表千４−５００１３２　（１０）国際調査報告

Claims

【特許請求の範囲】

１．１つの２進符号の機械語内に１つ以上の基本ブロックを有する第１コンピュータ・プロを、プログラム式ディジタル・コンピュータを使用して、別の２進符号の機械語内の第２コンピュータ・プログラムに翻訳し、かつその内部メモリにコンピュータを実行させるプログラムを蓄積させる機械処理であって、ａ）前記第１コンピュータ・プログラムの１個の前記基本ブロックを逆アセンブルする段階と、ｂ）グローバル流れ分析データを作るために１つの基本ブロックを分析する段階と、ｃ）前記第１コンピュータのすべての前記基本ブロックが逆アセンブルしかつ分析されるまで、前記（ａ）および（ｂ）段階を続行する段階と、ｄ）前記グローバル流れ分析データを使用して、前記第２コンピュータ・プログラムを作る段階と、を含む、ことを特徴とする機械処理。
２．ディスアセンブラ段階を含む処理であって、ａ）ブランチ、コール、またはリターン命令が達成されるまで前記１つの基本ブロックの命令を絶えずディスアセンブルする段階と、ｂ）各ディスアセンブラ命令のオプコードおよびアドレス・モードの表示を維持する段階と、をさらに含む、ことを特徴とする請求項１記載の処理。
３．前記分析段階を含む処理であって、ａ）ブランチ、コール、リターン命令の目標アドレスを計算し、かつ蓄える段階と、ｂ）次のアドレスを未調節ブランチ命令に蓄える段階と、をさらに含む、ことを特徴とする請求項２記載の処理。
４．前記続行段階を含む処理であって、ａ）蓄えられたアドレス（ブランチ、コール、またはリターンの目標アドレス、あるいは調節されたブランチの後に続く次のアドレスのいずれも）における逆アセンブラを続行する段階と、ｂ）この請求項４の前記（ａ）段階が常に逆アセンブルされているコードのみに遭遇し、あるいはソース・プログラムが終結するかのどちらまでもクレーム２・３の段階を繰り返し実行すること、をさらに含む、ことを特徴とする請求項３記載の処理。
５．前記発生される段階を含む処理であって、ａ）命令内の逆アセンブラ・コードの部分をそのアドレスにより分類する段階と、ｂ）各逆アセンブラ命令のための２進符号の機械語翻訳を発生させる段階と、をさらに含む、ことを特徴とする請求項４記載の処理。
６．計算段階を含む処理であって、ａ）「グローバル流れ分析」を作るために第１コンピュータ・プログラムの現在分っている内容を絶えず計算しかつ新しく入れ替える段階と、ｂ）ブランチ、コール、およびリターンの目標アドレスを計算するために前記グローバル流れ分析スタック・データを使用する段階と、をさらに含む、ことを特徴とする請求項３記載の処理。
７．計算段階を含む処理であって、ａ）「低分析レジスタ・データのグローバル」を作るためにプログラムのレジスタを絶えず計算しかつ新しく入れ替える段階と、ｂ）ブランチ、コールおよびリターンの目標アドレスを計算するために前記グローバル流れ分析レジスタ・データを使用する段階と、をさらに含む、ことを特徴とする請求項３記載の処理。
８．計算段階を含む処理であって、ａ）「グローバル流れ分析メモリ・データを作るために第１コンピュータ・プログラムのキー・メモリ位置の現在分っている内容を絶えず計算しかつ新しく入れ替える段階と、ｂ）ブランチ、コールおよびリターンの目標アドレスを計算するために前記グローバル流れ分析メモリ・データを使用する段階と、をさらに含む、ことを特徴とする請求項３記載の処理。
９．計算段階を含む処理であって、ａ）クレーム６・７または８の方法では計算できないブランチ、コールまたはリターン目標アドレスを計算するためにアプリケーション限定データを使用する段階と、をさらに含む、ことを特徴とする請求項３記載の処理。
１０．スタック、レジスタまたはメモリ位置の内容を決定するために使用される前記アプリケーション限定データを含む、ことを特徴とする請求項９記載の処理。
１１．前記グローバル流れ分析データは、ソース機械調節フラグ（例えば、キャリーまたはオーバー・フロー）が次の命令（「リブ」）により使用されるかあるいは（「デッド」）により使用されないかどうかを計算するために使用され、それからこの情報が、リブ調節フラグ値を維持またはシミュレートするために発生する命令のみにより最適化された目標コードの発生に使用されることを含む、ことを特徴とする請求項５記載の処理。
１２．前記グローバル流れ分析データは、ソース機械レジスタが次の命令（「リブ」）により使用されるかあるいは（「デッド」）により使用されないかどうかを計算するために使用され、それからこの情報は、デッド・レジスタ内の維持されるデータによらず最適化されたコードを発生するために使用されることを含む、ことを特徴とする請求項１１記載の処理。
１３．前記グローバル流れ分析データ（スタック、レジスタ、またはメモリ）は、次の命令（「リブ」）により使用されるかあるいは（「デッド」）により使用されないかどうかを計算するために使用され、それからこの情報は、翻訳された命令によって必要となる一時的な変化を保つためにデッド・レジスタの目標機械等価物の使用により、最適化されたコードを発生させるために使用されることを含む、ことを特徴とする請求項５記載の処理。
１４．前記グローバル流れ分析データは、ソース機械のメモリ内のデータが、異なるデータ・タイプの長さ（例えば１６ビット量および８ビット量）をオペレートする２つ以上の命令により基準とされているかどうかを計算するために使用され、かつ目標機械語およびソース機械語が半語内のバイト、および１語内の半語の順序と異なる場合に、この情報が最適化されたコードを発生させるために使用されることを含む、ことを特徴とする請求項５記載の処理。
１５．前記グローバル流れ分析データは、ソース機械のメモリ内のデータが、データ長さ（例えば、２バイトまたは４バイト）の倍数であるアドレスに並べられるかどうかを計算するために使用され、それから、そのような配列を要求するこれらの目標機械のために、単一メモリは、データが配列され、かつ、データが配列されずあるいは配列が決定できないときのみ基準の倍数が発生される場合に、データを呼出すことを基準とすることを特徴とする請求項５記載の処理。
１６．前記グローバル流れ分析レジスタ・データは、コールされたときに現在のレジスタ内容の効力により、２進符号の機械語に割り込まれたオペレーティング・システム・コールを識別するために使用されることを含む、ことを特徴とする請求項７記載の処理。
１７．入口地点を有するコンピュータ・アセンブラ言語内の第１コンピュータ・プログラムを、その内部メモリにコンピュータを実行できるプログラムを蓄えられるプログラムされたデジタル・コンピュータを使用して第２コンピュータ・アセンブラ言語に翻訳する機械処理であって、ａ）前記入口地点で開始し、第１プログラムが終結するまでグローバル流れ分析（スタック、レジスタ、とメモリのすべてまたは１つ）を絶えず計算する段階と、ｂ）前記グローバル流れ分析データ（スタック、レジスタ、またはメモリ）は、第１プログラム調節フラグ（例えばキャリーまたはオーバーフロー）が次の命令（「リブ」）により使用されるかあるいは（「デッド」）により使用されないかどうかを計算するために使用される段階と、ｃ）リブ調節フラグ値を維持あるいはシミュレートするために発生された命令のみにより、この情報を使用した最適化されたアセンブラ・コードを発生させる段階と、を含む、ことを特徴とする機械処理。
１８．前記段階（ａ）が、ａ）アドレス命令内の第１プログラムを読み出す段階と、ｂ）入口地点で開始し、ブランチ、コールまたはリターン命令が達成されるまでグローバル流れ分析データ（スタック、レジスタ、メモリのすべてまたは１つ）を計算する段階と、ｃ）ブランチ、コール、またはリターン命令の目標アドレスを計算しかつ蓄える段階と、ｄ）無条件ブランチ命令を次の順次アドレスに蓄える段階と、ｅ）蓄えられたアドレス（ブランチ、コール、またはリターンの目標アドレス、あるいは条件付ブランチ後の次の順次アドレス）でグローバル流れ分析データを計算し続ける段階と、ｆ）段階（ｅ）が既に完全分析されたコードにのみ遭遇したり、ソース・プログラムが終結したりするまで、この請求項の段階（ｂ）〜（ｅ）を繰り返し実行する段階とをさらに含む、ことを特徴とする請求項１７記載の機械処理。
１９．コンピュータにプログラムを実行させる内部メモリに記憶されたプログラム式デジタル・コンピュータを用いて、入力点を持つコンピュータ・アセンブラ言語の第１コンピュータ・プログラムを第２コンピュータ・アセンブラ言語に翻訳する機械処理であって、ａ）前記入力点で始動し、第１プログラムが終結するまでグローバル流れ分析データ（スタック、レジスタ、メモリのすべてまたは１つ）を絶えず計算する段階と、ｂ）前記グローバル流れ分析データ（スタック、レジスタ、またはメモリ）を用いて第１プログラム・レジスタが次の命令（「リブ」）によって使用されるか、あるいは（「デッド」）により使用されないかどうかを計算する段階と、ｃ）デッド・レジスタにあるデータを蓄えないことによって、この情報を用いながら、最適化されたアセンブリ・コードを発生させる段階とを含む、ことを特徴とする機械処理。
２０．入力点を持つコンピュータ・アセンブラ言語の第１コンピュータ・プログラムを、コンピュータにプログラムを実行させる内部メモリに記憶されたプログラム式デジタル・コンピュータを用いて第２コンピュータ・アセンブラ言語に翻訳する機械処理であって、ａ）前記入口点で始動し、第１プログラムが終結するまでグローバル流れ分析データ（スタック、レジスタのすべてまたはメモリ）を絶えず計算する段階と、ｂ）前記グローバル流れ分析データ（スタック、レジスタまたはメモリ）を用いて、次の命令（「リブ」）によって第１プログラム・レジスタが使用されるかあるいは（「デッド」）により使用されないかどうかを計算する段階と、ｃ）翻訳された命令によって要求された一時変数を保持するために、デッド・レジスタの第２プログラムの等価を用いて、この情報を使用する最適化されたアセンブラ・コードを発生させる段階とを含む、ことを特徴とする機械処理。
２１．入力点を持つコンピュータ・アセンブラ言語をコンピュータにプログラムを実行させる内部メモリに蓄えられたプログラム式デジタル・コンピュータを用いて第２コンピュータ・アセンブラ言語に翻訳する機械処理であって、ａ）前記入力点で始動し、第１プログラムが終結するまでグローバル流れ分析データ（スタック、レジスタ、およびメモリのすべてまたは１つ）を絶えず計算する段階と、前記グローバル分析命令（スタック、レジスタまたはメモリ）を用いて、ｂ）異なるデータ形式長さ（例えば１５ビットの量および８ビットの量）で操作する２個以上の命令によって原始機械のメモリにあるデータが参照されるかどうかを計算する段階と、ｃ）この情報を用いて最適化されたコードを発生させ、この場合第２プログラムの機械語と第１プログラムの機械語の半語の中のバイトの順序および１語の中に複数の半語がある点で異なる段階とを含む、ことを特徴とする機械処理。
２２．入力点を持つコンピュータ・アセンブラ言語にある第１コンピュータ・プログラムを、コンピュータにプログラムを実行させる内部メモリ内に蓄えられたプログラム式デジタル・コンピュータを用いて、第２コンピュータ・アセンブラ言語に翻訳する機械処理であって、ａ）前記入力点で始動し、第１プログラムが終結するまでグローバル流れ分析データ（スタック、レジスタ、メモリのすべてまたは１つ）を絶えず計算する段階と、ｂ）前記グローバル流れ分析データ（スタック、レジスタ、またはメモリ）を用いて、データ長さ（例えば２バイトまたは４バイト）の倍数であるアドレス上に原始機械のメモリにあるデータが整列されているかどうかを計算する段階と、ｃ）データが整列されている場合データを呼び出す単一メモリ基準を発生させ、かつデータが整列されないときのみ、またはその整列がそのような整列を要求する第２言語を決定し得ない場合に倍数基準を発生させる段階とを含む、ことを特徴とする機械処理。