JPH09330210A

JPH09330210A - コンパイラにおける乗算実施方法

Info

Publication number: JPH09330210A
Application number: JP9047683A
Authority: JP
Inventors: Sullivan Brian; ブライアン・サリバン
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1996-03-18
Filing date: 1997-03-03
Publication date: 1997-12-22
Anticipated expiration: 2017-03-03
Also published as: US5764990A; JP3727039B2

Abstract

(57)【要約】【課題】定数による乗算のような整数乗算演算をコンパ
イラにおいて実行するＡＬＵ命令の効率的シーケンスを
生成する方法および装置を提供する。【解決手段】特定の定数の各々を乗ずる乗算演算を実行
する命令シーケンスを表す１つの整数をあらかじめ定め
られた演算規則に従って生成し、それら整数をルックア
ップ・テーブルに記憶する。コンパイラは、乗数である
特定定数を入力値として受け取り、それを上記ルックア
ップ・テーブルへのインデックスとして使用し、インデ
ックス付けされたテーブル位置にある整数を上記ルック
アップ・テーブルから取り出し、取り出した整数を上記
あらかじめ定められた演算規則の逆算に従って上記命令
シーケンスに展開し、展開した命令シーケンスによって
上記入力値に関する乗算演算を実行し、上記乗算演算の
結果を出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータに関
するもので、特に、ソース・コード・コンパイルの際に
コンピュータによって実行される乗算演算に関するもの
である。

【０００２】

【従来の技術】既知の定数Ｘによる整数乗算が、整数乗
算に関するハードウェア命令を持たないプロセッサ上で
短いシーケンスの命令を使用して実行されることが多
い。(以下、演算論理機構をArithmetic and Logical Un
itの頭文字をとって「ＡＬＵ」と呼称する)。従来技術
のアプローチは、コンパイル段階でこれらのシーケンス
を探索する探索アルゴリズムの使用を伴う。探索アルゴ
リズムが非常に複雑であるので、コンパイラの探索の範
囲を狭くするのに役立つように種々の発見的手法(Heuri
sitics)が使用される。あいにく、これらの発見的手法
は、コンパイラが乗算を実施するため効率の悪いＡＬＵ
命令シーケンスを使用する原因となることが多い。その
ような場合、コンパイラによって作成される実行可能プ
ログラムは、最適でない形態で動作する。

【０００３】更に、特定の整数定数に関して、コンパイ
ル時探索アルゴリズムは、乗算を実施する合理的ＡＬＵ
命令シーケンスを見出すことができない。そのような場
合には、乗算シーケンスは実行時サブルーチンを使用し
て実行されなければならない。実行時のサブルーチンの
使用は、アプリケーションの処理性能を極めて悪化させ
る。

【０００４】整数乗算および除算演算を実行する種々の
技術が提案されてきた。例えば、T.Granlund, P. Montg
omery両氏は、その著"Division By Invariant Integers
using Multiplication, Association of Computing Ma
chinery, 0-89791-662x/94/0006(1994)"で、整数乗算を
使用する任意の非ゼロ整数定数および実行時不変式とし
て除算用コード・シーケンスを提示する整数除算を達成
するアルゴリズムを開示している。このアルゴリズム
は、整数積の上方半分が迅速にアクセスできることを必
要とする２の補数アーキテクチャを仮定する。

【０００５】R. Bernstein氏は,その著" Multiplicatio
n by Integer Constants, Software- Practice and Exp
erience, vol. 16(7), pp. 641-652, John Wiley & Son
s,Ltd.(1986)"で、レジスタの内容に整数定数を乗算す
るため、「加算」、「減算」および「シフト」のシーケ
ンスを見出す方法を開示している。Bernstein氏は,、所
望の限度までのすべての数について小さい星連鎖シーケ
ンスのテーブルを構築するための(上記文献において引
用されている)Knuth氏によって提案された方法を考察し
ている。Bernstein氏は、そのようなテーブルを記憶す
るために必要な空間が膨大であり、Knuth氏によって提
案された方法が命令セットのタイミングに敏感であり、
そのような方法を使用して構築されるテーブルは目標コ
ンピュータの命令セットに依存するものとなると結論づ
けている。このように、既存の技術は整数乗算演算のた
めテーブルを使用することを奨励していない。

【０００６】

【発明が解決しようとする課題】かくして、整数乗算演
算を実行するためＡＬＵ命令の効率的なシーケンスを生
成する問題を解決する技術の提供が求められている。

【０００７】

【課題を解決するための手段】本発明は、定数による乗
算のような整数乗算演算を実行するＡＬＵ命令の効率的
シーケンスを生成する問題を解決する。本発明は、目標
アーキテクチャに関して最も効率的な命令シーケンスを
保有するルックアップ・テーブルを使用して、既知の定
数Ｘによる整数乗算を実現する。本発明は、短いシーケ
ンスのＡＬＵ命令を記憶するために使用することができ
るコンパクトな符号化手段を提供する。ヒューレット・
パッカード社のＰＡ−ＲＩＳＣアーキテクチャに関して
は、そのようなコンパクトな符号化手段は、最高８個ま
での(６４ビット未満の)ＡＬＵ命令からなるシーケンス
を記憶することができる。

【０００８】本発明が構築するルックアップ・テーブル
を使用することによって、既知の定数による整数乗算を
実行するために必要なＡＬＵ命令の最も効率的なシーケ
ンスをコンパイラは常に生成することができる。本発明
の好ましい実施形態において、既知の定数オペランドは
ルックアップ・テーブルへのインデックスとして使用さ
れ、そこから１つの６４ビット整数が取り出される。次
に、この６４ビット整数が、Ｘによる整数乗算を実行す
る短いＡＬＵ命令シーケンスに展開される。特定の整数
Ｘについて最も効率的なシーケンスのＡＬＵ命令を計算
することは計算量の観点から非常に高価であるけれど
も、ルックアップ・テーブルの値は特定のアーキテクチ
ャについてただ一度だけ決定すればよい。

【０００９】発明の課題を解決する手段として、本発明
は、コンパイラにおいて乗算演算を実行する命令シーケ
ンスを含むルックアップ・テーブルを作成するステッ
プ、上記コンパイラへの入力値を提供するステップ、上
記入力値を上記ルックアップ・テーブルへのインデック
スとして使用するステップ、上記入力値によってインデ
ックス付けされたテーブル位置にある整数を上記ルック
アップ・テーブルから取り出すステップ、上記取り出し
た整数を上記命令シーケンスに変換するステップ、上記
コンパイラを用いて上記命令シーケンスを実行して、上
記入力値に関する乗算演算を実行するステップ、および
上記乗算演算の結果を出力値として提供するステップか
らなるコンパイラにおける乗算実施方法を含む。

【００１０】

【発明の実施の形態】本発明は、定数の乗算のような整
数乗算演算を実行するためＡＬＵ命令の効率的なシーケ
ンスを生成する問題を解決する。所与の整数Ｘに関して
ＡＬＵ命令の最も効率的なシーケンスを決定するために
使用されるコンパイル時の簡単なルックアップ・テーブ
ルを提供する。

【００１１】図１は、単一プロセッサ・コンピュータの
アーキテクチャ１０を示す。プロセッサ１１は、システ
ム・バス１５と通信するキャッシュ１２を含む。システ
ム・メモリ１３および１つまたは複数のＩ／Ｏ装置１４
もまたシステム・バスと通信する。コンパイル操作にお
いて、ユーザは、コンピュータ上で動くプログラムであ
るコンパイラにソース・コード・プログラムを入力す
る。コンパイラは、ソース・コードを受け取り、コード
を処理して、(図のコンピュータ・アーキテクチャ１０
のような)目標コンピュータのアーキテクチャに対して
最適化された実行可能ファイルを生成する。

【００１２】図２は、例えば図１で示されたコンピュー
タ・アーキテクチャ１０と関連して使用される場合があ
るソフトウェア・コンパイラ２０を示す。コンパイラ・
フロントエンド・コンポーネント２１が、ソース・コー
ド・ファイル１００を読み取り、それを高水準中間表示
形式(ＨＬＩＲ)１１０に翻訳する。高水準最適化プログ
ラム(ＨＬＯ)２２が、高水準中間表示形式１１０を一層
効率的な形式に最適化する。コード生成ルーチン２３
が、最適化された高水準中間表示形式を低水準中間表示
形式(ＬＬIＲ)１２０に変換する。低水準最適化ルーチ
ン(ＬＬＯ)２４が、低水準中間表示形式１２０を一層効
率的な(機械による実行可能な)形式に変換する。最後
に、オブジェクト・ファイル生成ルーチン２５が、最適
化された低水準中間表示形式をオブジェクト・ファイル
１４１に書き出す。オブジェクト・ファイル１４１は、
他のオブジェクト・ファイル１４０とともにリンカ２６
によって処理され、コンピュータ１０上で実行させるこ
とができる実行可能ファイル１５０が生成される。現代
のコンピュータ・アーキテクチャにおいては、コンパイ
ラは多くのタスクを実行する。例えば、コンパイラは、
Ｃのような高水準言語を一連の機械命令に翻訳する。コ
ンパイラによって実行される諸タスクの中の１つは、乗
算のような整数演算を伴う高水準式の処理を行うことで
ある。

【００１３】乗算演算は非常に一般的である。例えば、
Ｖが変数であるとして５９×Ｖのような乗算演算を含む
式がプログラムの中にあるかもしれない。そのような場
合、コンパイラはそのような乗算演算を実行する方法を
決定しなければならない。既存のコンパイラは、上記の
例のような乗算の場合、５９が出力であるようにシフト
加算(shift and add)命令を合成する方法を決定するた
めに発見的手法を使用する。その後、１つの入力Ｖが命
令の１つのシーケンスに対して提示され、最終的な命令
の出力がＶ×５９となる。

【００１４】上で示したように、コンパイラによって使
用される実行時アルゴリズムの１つは、発見的手法を使
用して探索する探索アルゴリズムである。本発明は、探
索を実行する代わりに、入力値をテーブルへのインデッ
クスとして使用し(すなわち、例えば５９という入力値
を例えばテーブルの中の５９番目のエレメントへのイン
デックスとして使用し)、そこから整数を取り出し、そ
の整数に対してあらかじめ定められた演算シーケンスを
実行することによって整数をいくつかのより小さい整数
に展開する。これらのより小さい整数の各々は、例えば
加算(add)、シフト(shift)、減算(subtract)のような１
つの命令に対応付けされる。更に、監視文字を使用し
て、プロセスが停止しなければならない位置が標示され
る。コンパイラが監視文字に出会う前に生成する最後の
命令の結果が、所望の結果(すなわちＶ×５９)である。
しかし、本発明の代替的実施形態においては、あらかじ
め決められた最大実行命令数を受けとることがプロセス
の終了を示すようにすることもできる。そのようなケー
スでは、監視文字は必要とされない。

【００１５】整数演算シーケンスを見出すための探索に
要する１回のコストが計算上高価な指数アルゴリズムで
あるため、各整数毎にすべての解を事前計算するオフラ
イン処理を使用して、本発明のテーブルは構築される。
テーブルは、目標アーキテクチャに関して最も短く最も
最適な命令シーケンスを単一の整数として記憶する。次
に、この単一整数がコンパイラによって展開され、特定
の定数に関する最適な命令シーケンスが取り出される。

【００１６】各シーケンスは基本的には１つの整数に圧
縮することができるので、テーブルに必要な記憶容量は
最小限のものである。-2¹⁶(すなわち-65,536)から+2
¹⁶(すなわち+65,536)までのすべての整数に関して解が
与えられる本発明の好ましい実施形態において、必要と
されることは、テーブルにインデックスを付け、記憶さ
れた整数を取り出し、整数を最高８個の命令シーケンス
に分解し、１つの変数値を入力してそれに特定の既知の
定数を乗ずる整数乗算演算を実行することだけである。
テーブルをより大きくまたはより小さくすることは可能
である。ＰＡ−ＲＩＳＣアーキテクチャにとって６４ビ
ット整数が自然なサイズであるので、６４ビットの整数
が有用である。しかし、そのように制限しなければなら
ないわけではなく、例えば１２０ビットまたはそれ以上
のサイズを使用することは可能である。

【００１７】本発明は、ある特定の所与の定数整数に関
して１つのシーケンスを事前計算する。例えば、５を乗
算することが必要であれば、"SHIFT 2 and ADD"(２回シ
フトして加算の意味であり本明細書において以下同様の
表記法を用いる)を使用して、オリジナルのソース・オ
ペランドを２回シフトすなわち４倍し、その結果にオリ
ジナルのソース・オペランドが加算され、４プラス１倍
すなわち５倍される。同様に、"SHIFT 3 and ADD"によ
って９が、"SHIFT 1 and ADD"によって３が生成され
る。

【００１８】前述の整数演算を実行するために必要な命
令のすべては、典型的には、実行時コードを用いてルッ
クアップ・テーブルとして記憶するには大き過ぎる。各
命令が、オリジナルのソース・オペランドであろうと実
行に従って生成される一時的オペランデあろうと種々の
オペランドを使用することができるような８個の命令が
あるとすれば、そのためのルックアップ・テーブルを提
供することは難しい。数と８個の命令の間の対応付は通
常難しく、膨大な量の記憶空間が必要となる。本発明の
１つの利点は、テーブルがコンパイラと関連づけられる
ということである。従って、コンパイル時に、特定の乗
算演算を実行する最適な方法を決定するために費やす時
間は少ない。これは、コンパイラのコンパイル速度の向
上に貢献する。

【００１９】更に、単一整数毎に完全に最適なシーケン
スを生成することが必要であるので、本発明のルックア
ップ・テーブルを生成するプロセスはオフラインで実施
することができる。対照的に、既知のコンパイラは、発
見的手法を使用して特定の整数による乗算の方法を決定
することを試み、結果として１つのシーケンスにたどり
着くことができるかもしれない。しかし、１つの乗算演
算を実行することができる何百ものシーケンスが存在す
るので、そのようなシーケンスが最善のシーケンスでな
い可能性がある。ルックアップ・テーブルを提供するこ
とによって、本発明は、生成される命令のツリーの高さ
を最小にし、それによって、特定のアーキテクチャに関
するいくつかの命令を並列して発することができる。従
って、２つまたはそれ以上のＡＬＵが存在すれば、その
複数のＡＬＵが並列して動作し後刻最終結果を組み合わ
せるように、特定のアーキテクチャにとって理想的なテ
ーブル、少なくとも２つの命令を同時に発することがで
きるシーケンスを生成することが可能である。

【００２０】乗算はコンパイラが実行すべき基本動作で
あるので、本発明はコンパイラの低水準最適化ルーチン
と関連する。特定の整数による乗算の方法に関するサブ
ルーチンを提供することが必要とされる場合、本発明の
テーブルはコンパイラがハードディスクから読むことが
できる補助ファイルであるようにすることもできる。ま
た、頻繁にアクセスされるならば、テーブルはキャッシ
ュに記憶してもよい。

【００２１】図３は、本発明に従って整数乗算または除
算シーケンスを記憶するためのコンパクトな符号化を実
施するコンパイル・システムのブロック図である。この
コンパクトな符号化は以下のように行われる。先ず、整
数乗算結果を計算するため所与のアーキテクチャ上で使
用可能なすべてのＡＬＵ命令コード(opcode)が列挙され
る(ステップ２００)。ヒューレット・パッカード社のＰ
Ａ−ＲＩＳＣアーキテクチャに関する限り、これらの命
令コードは、add、sub、sh1add、 sh2add、 sh3add、 n
egおよびshlである。但し、命令コードnegは、ＰＡ−Ｒ
ＩＳＣアーキテクチャではゼロにハード的に設定されて
いるr0からの減算を使用して実施され、shlについては
特別の形式の命令コードか実際には使用される。

【００２２】上記の命令コードは、３つのオペランドを
持つ命令コードと２つのオペランドを持つ命令コードに
分類される(ステップ２１０)。３オペランド命令コード
は、２つの入力を受け取り、１つの出力を生成する命令
コードであり、add、sub、sh1add、sh2add、sh3addを含
む。２オペランド命令コードは、１つの入力を受け取
り、１つの出力を生成する命令コードであり、negを含
む。左シフト命令コードshlは、汎用レジスタ入力、定
数整数入力および出力を持つ３オペランド命令コードで
ある。しかし、shlは、本発明の目的のため、命令コー
ドshl1、shl2、shl3、shl4,...shl30、shl31というよう
に１から３１までの定数整数入力を持つ３１種の２オペ
ランド命令コードとして取り扱われる。更に、最初の命
令コードnopは、ＡＬＵ命令のシーケンスの終了にマー
クをつける監視文字として予約される(２２０)。本発明
の好ましい実施形態であるＰＡ−ＲＩＳＣ上での実施の
ため、次の表１のようにＡＬＵ命令コードおよびそれら
に特定の命令コード番号が与えられる。

【００２３】

【表１】 nop = 0, shl7 = 13, shl2O = 26, sh3add = 1, shl8 = 14, shl2l = 27, sh2add = 2, shl9 = 15, shl22 = 28, sh1add = 3, shIlO = 16, shl23 = 29, sub = 4, shl11 = 17, shl24 = 30, add = 5, shl12 = 18, shl25 = 31, neg = 6, shl13 = 19, shl26 = 32, shl1 = 7, shl14 = 20, shl27 = 33, shl2 = 8, shl15 = 21, shl28 = 34, shl3 = 9, shl16 = 22, shl29 = 35, shl4 = 10, shl17 = 23, shl3O = 36, shl5 = 11, shl18 = 24, shl31 = 37, shl6 = 12, shl19 = 25.

【００２４】次に、２つの入力および１つの出力を持つ
３オペランド命令コードの範囲が記録される(ステップ
２３０)。残りは、入力も出力オペランドもない監視文
字命令コードを除いて、１つの入力および１つの出力を
持つ２オペランド命令コードである。本発明のＰＡ‐Ｒ
ＩＳＣ実施形態においては、２入力および１出力を持つ
３オペランド命令コードの範囲は、１(sh1add)から５(a
dd)までの番号が与えられた命令コードである。

【００２５】ある１つのＡＬＵ命令シーケンスに関し
て、本発明は、シーケンスの最初の命令は、レベル１命
令と呼び、８番目の命令はレベル８命令と呼ぶ。同様
に、１命令(からなる)シーケンスはレベル１シーケン
ス、８命令(からなる)シーケンスはレベル８シーケンス
と呼ぶ。

【００２６】レベル１命令に関して可能な入力はただ１
つであり、それは乗算演算で使用される未知の変数値で
ある。この未知の値をＵと呼ぶ。かくして、ＡＬＵ命令
シーケンスへの６４ビット整数の展開が実行される際
(ステップ２４０)、命令を形成するため単一の入力値Ｕ
を使用することができる。ＡＬＵ命令が展開されるにつ
れ、展開される各レベル毎に使用可能な１つの入力が追
加される。レベル１命令の結果はＬ1と呼ぶ。同様に、
レベル２命令の結果はＬ２と呼ぶ。

【００２７】コンパクト符号化方式は、あらゆるレベル
でそのレベルで可能なすべての命令を列挙することが可
能であるという特性を持つ。レベル１のadd命令に関し
ては、次のような符号がただ１つ使用可能である。add
U,U,L1ＰＡ−ＲＩＳＣ実施形態に関する限り、レベル１
において、監視文字用に１つおよび各命令コード毎に１
つ、計３８のユニークな符号が存在する。

【００２８】次のレベルでは、入力としてオリジナルの
未知の値Ｕかまたはレベル１命令によって新たに計算さ
れた結果のいずれかを使用することが可能である。従っ
て、addのような２入力命令コードについては、２×２
すなわち４つの可能な符号が存在する。各レベルで異な
る符号を挙げる時add命令が交換的性質を持つという事
実を利用することは必要でない。レベル２add命令に関
して、次の４つの異なる符号が使用可能である。 add U,U,L2 add U,L1,L2 add L1,U,L2 add L1,L1,L2 本発明のＰＡ−ＲＩＳＣ実施形態に関する限り、レベル
２において８５のユニークな符号が存在する。これらの
符号は、レベルの二乗(2²=4)をとり、この値を２入力を
持つ命令コードの数に乗ずる(５×４＝２０)ことによっ
て、計算することができる。すなわち、本発明のＰＡ−
ＲＩＳＣ実施形態においては２０の可能な命令がある。
１入力を持つ命令の数がこの値に加えられる。各々が２
つの可能な入力を持つ命令は３７−５＝３２あり、従っ
て、３２×２＝６４の１入力命令がある。シーケンス監
視文字命令のため１が合計に加えられる。

【００２９】次の表２は、各レベルについてのユニーク
な符号の数を示す。

【００３０】

【表２】当該レベルでのレベル２入力命令１入力命令監視命令ユニークな符号の数 1 1²x5=5 1x32=32 1 5+ 32+1=38 2 2²x5=20 2x32=64 1 20+ 64+1=85 3 3²x5=45 3x32=96 1 45+ 96+1=142 4 4²x5=80 4x32=128 1 80+128+1=209 5 5²x5=125 5x32=160 1 125+160+1=286 6 6²x5=180 6x32=192 1 180+192+1=373 7 7²x5=245 7x32=224 1 245+224+1=470 8 8²x5=320 8x32=256 1 320+256+1=577

【００３１】一旦すべての可能な符号がわかれば(ステ
ップ２６０)、整数をＡＬＵ命令シーケンスに展開する
ことができる。

【００３２】図４ないし図６は、本発明に従って整数を
ＡＬＵ命令シーケンスに変換するアルゴリズムを示す。
６４ビットの整数を最高８つまでのＡＬＵ命令からなる
シーケンスに変換するアルゴリズムは次の通りである。
Ｘによる整数乗算を実行するＡＬＵ命令シーケンスを表
現するオリジナルの６４ビット整数をＳ₀と呼ぶ（ステ
ップ３００）。図３を参照して上述されたようにレベル
・テーブルを計算する(ステップ３１０)。上記のレベル
・テーブルにおける各レベルでの符号化のための値は、
E₁=38, E₂=85, E₃ =142, E₄=209....E₈ =577のように表
す。次の式に基づいて、８つの命令を記憶するために必
要とされるビット数を計算することができる。 ceiling (log₂(E₁×E₂....×E₈)) 次の表３の剰余と被除数を計算する(ステップ３２０)。
以下の計算では、除算演算は整数の商を生成する、すな
わち除算演算から生じる端数部分は破棄されると仮定す
る。

【００３３】

【表３】

【００３４】剰余Ｒ₁ないしＲ₈の各々は、該当するレベ
ルでの命令を表す。Ｒ₁はレベル１のために使用される
命令番号を表し、Ｒ₈はレベル８に使用される命令番号
を表す。剰余は命令に対応付けされる(ステップ３３
０)。剰余Ｒ₁からレベル１命令への対応付(ステップ３
４０)はそれほど重要でない。レベル１については剰余
Ｒ₁の値は命令コード番号である。Ｕの値は、レベル１
命令に対するすべての入力に関して使用される。

【００３５】剰余Ｒ₂からレベル２命令への対応付け(ス
テップ３５０)は次の通りである。剰余Ｒ₂が０に等しい
場合、ＡＬＵ命令シーケンスの終了に目印をつける監視
文字にその剰余を対応付けする。ゼロでなければＱ₂＝
Ｒ₂−１とする。Ｑ₂の値が２²×５未満であれば、２入
力命令コードを使用することとして(ステップ３６０)、
Ｑ₂/２²＋１を対応するＡＬＵ命令コード番号とし、Ｑ₂
ｒｅｍ２の値を第１の入力値とし、(Ｑ₂／２)ｒｅｍ２
の値を第２の入力値とする(ステップ３７０)。但し、上
記剰余の値が０であればＵを入力として使用し、上記剰
余の値が１であればＬ１を入力として使用する。Ｑ₂の
値が２²×５以上であれば、Ｐ₂=Ｑ₂−２²×５として、
１入力命令コードを使用することとして(ステップ３６
０)、Ｐ₂／２＋６を対応する命令コード番号を表す整数
とし、Ｐ₂ｒｅｍ２をその入力の値とする(ステップ３８
０)。

【００３６】剰余Ｒ₃からレベル３命令への対応付け(ス
テップ３９０)は次の通りである。剰余Ｒ₃が０に等しい
場合、ＡＬＵ命令シーケンスの終了に目印をつける監視
文字にその剰余を対応付けする。ゼロでなければＱ₃を
Ｒ₃−１に等しくする。Ｑ₃の値が３²×５未満であれ
ば、２入力命令コードを使用することとして(ステップ
４００)、Ｑ₃/３²＋１を対応するＡＬＵ命令コード番号
を表す整数とし(ステップ４２０)、Ｑ₃ｒｅｍ３の値を
第１の入力値とし、(Ｑ₃／３)ｒｅｍ３の値を第２の入
力値とし、上記剰余の値が０であればＵを入力として使
用し、上記剰余の値が１であればＬ１を入力として使用
し、上記剰余の値が２であればＬ２を入力として使用す
る(ステップ４２０)。Ｑ₃の値が３²×５以上であれば、
Ｐ₃=Ｑ₃−３²×５として、１入力命令コードを使用する
こととして(ステップ４００)、Ｐ₃／３＋６を対応する
命令コードを表す整数とし、Ｐ₃ｒｅｍ３をその入力の
値とする(ステップ４１０)。

【００３７】レベル４ないし８に関する対応付けは、本
質的に上述のレベル２および３に関するものと同じであ
る。どのレベルにおいても監視命令が命令として出現す
れば(ステップ４３０)、それはＡＬＵ命令の終了の標示
である(ステップ４４０)。それ以上の展開は必要でな
い。生成される乗算結果は、常に、シーケンスの最後の
命令によって生成される結果である(ステップ４６０)。
さもなければ、最後の命令に出会うまでプロセスは続行
する(ステップ４５０)。本発明のこの実施形態におい
て、仮に８つの命令に出会った後なお監視文字に出会わ
ないとすれば、シーケンスは終了する。

【００３８】上述の通り、既知の定数による整数乗算を
実施する効率的なＡＬＵ命令シーケンを探索するために
時間を費やすことがないので、本発明は一層迅速なコン
パイル時間を提供する。本発明は、所与の定数に関して
事前に計算された解をコンパイラが探し出すことを可能
にする。本発明は、また、多数の定数に対して命令のよ
り効率的なシーケンスが与えられるので、より速い実行
時処理性能を提供する。本発明は、また、一層複雑な探
索アルゴリズムを使用して、ＡＬＵ命令の短いシーケン
スを見つけ出すことを可能にする。なぜならば、本発明
は、探索アルゴリズムからの結果を記憶するルックアッ
プ・テーブルを使用するからである。

【００３９】以下に、本発明の好ましい実施形態である
ＰＡ−ＲＩＳＣアーキテクチャに関する種々の乗算演算
のサンプルを示す。５を乗ずる乗算の好ましいシーケン
スは、次の通り。 SH2ADD%src,%src,%t1 ; %t1=%src*5 icost=1, dcost=1, count=1 ６を乗ずる乗算の好ましいシーケンスは、次の通り。 SH1ADD%src,%src,%t1 ; %t1=%src*3 SHL1%t1,%t2; %t2= %src*6 icost=2, dcost=1, count=1 ７を乗ずる乗算の好ましいシーケンスは、次の通り。 SH2ADD%src,%src,%t1 ; %t1=%src*5 SH1ADD%src,%t1,%t2; %t2=%src*7 icost=2, dcost=2, count=5 ８を乗ずる乗算の好ましいシーケンスは、次の通り。 SHL3%src,%t1; %t1=%src*8 icost=1, dcost=O, count=1 ９を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1 ; %t1=%src*9 icost=1, dcost=1, count=1 １０を乗ずる乗算の好ましいシーケンスは、次の通り。 SH2ADD%src,%src,%t1 ; %t1=%src*5 SHL1%t1,%t2; %t2=%src*10 icost=2, dcost=1, count=1 １１を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1 ; %t1=%src*9 SH1ADD%src,%t1,%t2; %t2=%src*11 icost=2, dcost=2, count=3 １２を乗ずる乗算の好ましいシーケンスは、次の通り。 SH1ADD%src,%src,%t1 ; %t1=%src*3 SHL2%t1,%t2; %t2=%src*12 icost=2, dcost=1, count=1

【００４０】１３を乗ずる乗算の好ましいシーケンス
は、次の通り。 SH3ADD%src,%src,%t1 ; %t1=%src*9 SH2ADD%src,%t1,%t2; %t2=%src*13 icost=2, dcost=2, count=3 １４を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1 ; %t1=%src*9 SH2ADD%src,%t1,%t2; %t2=%src*5 ADD%t1,%t2%t3; %t3=%src*14 icost=3, dcost=2, count=15 １５を乗ずる乗算の好ましいシーケンスは、次の通り。 SH2ADD%src,%src,%t1; %t1=%src*5 SH1ADD%t1,%t1,%t2; %t2=%src*15 icost=2, dcost=2, count=3 １６を乗ずる乗算の好ましいシーケンスは、次の通り。 SHL4%src,%t1; %t1=%src*16 icost=1, dcost=1, count=1 １７を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH3ADD%src,%t1,%t2; %t2=%src*17 icost=2, dcost=2, count=7 １8を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SHL1%t1,%t2; %t2=%src*18 icost=2, dcost=1, count=1 １９を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH1ADD%t1,%t1,%t2; %t2=%src*19 icost=2, dcost=2, count=1

【００４１】２０を乗ずる乗算の好ましいシーケンス
は、次の通り。 SH2ADD%src,%src,%t1; %t1=%src*5 SHL2%t1,%t2; %t2=%src*20 icost=2, dcost=1, count=1 ２１を乗ずる乗算の好ましいシーケンスは、次の通り。 SH2ADD%src,%src,%t1 ; %t1=%src*5 SH2ADD%t1,%src,%t2; %t2=%src*21 icost=2, dcost=2, count=1 １２３を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH2ADD%src,%src,%t2 ; %t2=%src*5 SUB%t2,%t1,%t3; %t3=%src*123 icost=3, dcost=2, count=1 １６７１を乗ずる乗算の好ましいシーケンスは、次の通
り。 SHL10%src,%t1; %t1=%src*1024 SH3ADD%src,%src,%t2; %t2=%src*9 SUB%src,%t1,%t3; %t3=%src*1023 SH3ADD%t2,%t2,%t4; %t4=%src*81 SH3ADD%t4,%t3,%t5; %t5=%src*1671 icost=5, dcost=2, count=1 ２３５１７を乗ずる乗算の好ましいシーケンスは、次の
通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH3ADD%t1,%t1,%t2; %t2=%src*81 SH3ADD%src,%t1,%t3; %t3=%src*17 SH3ADD%t2,%src,%t4; %t4=%src*649 SH2ADD%t4,%t3,%t5; %t5=%src*2613 SH3ADD%t5,%t5,%t6; %t6=%src*23517 icost=6, dcost=4, count=115

【００４２】２を乗ずる乗算の好ましいシーケンスは、
次の通り。 SHL1%src,%t1 ; %t1=%src*2 icost=1, dcost=O, count=1 ３を乗ずる乗算の好ましいシーケンスは、次の通り。 SH1ADD%src,%src,%t1 ; %t1= %src*3 icost=1, dcost=1, count=1 ６を乗ずる乗算の好ましいシーケンスは、次の通り。 SH1ADD%src,%src,%t1 ; %t1= %src*3 SHL1%t1,%t2 ; %t2=%src*6 icost=2, dcost=1, count=1 １１を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH1ADD%src,%t1,%t2 ; %t2= %src*11 icost=2, dcost=2, count=3 ２２を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH1ADD%src,%t1,%t2 ; %t2= %src*11 SHL1%t2,%t3 ; %t3=%src*22 icost=3, dcost=2, count=8 ４３を乗ずる乗算の好ましいシーケンスは、次の通り。 SH2ADD%src,%src,%t1; %t1=%src*5 SH1ADD%src,%src,%t2; %t2=%src*3 SH3ADD%t1,%t2,%t3; %t3=%src*43 icost=3, dcost=2, count=2 ８６を乗ずる乗算の好ましいシーケンスは、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH2ADD%src,%src,%t2; %t2=%src*5 SH3ADD%t1,%t1,%t3; %t3=%src*81 ADD%t2,%t3,%t4; %t4=%src*86 icost=4, dcost=2, count=8

【００４３】１７１を乗ずる乗算の好ましいシーケンス
は、次の通り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH3ADD%t1,%t1,%t2; %t2=%src*81 SH1ADD%t2,%t1,%t3; %t3=%src*171 icost=3, dcost=3. count=2 １７３を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH2ADD%src,%src,%t1; %t1=%src*5 SH2ADD%t1,%src,%t2; %t2=%src*21 SH3ADD%t2,%t1,%t3; %t3=%src*173 icost=3, dcost=3, count=1 ３４２を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH3ADD%t1,%t1,%t2; %t2=%src*81 SH1ADD%t2,%t1,%t3; %t3=%src*171 SHL1%t3,%t4; %t4=src*342 icost=4, dcost=3, count=11 ３４６を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH3ADD%src,%src,%t1; %t1=%src*9 SHL8%src,%t2; %t2=src*256 SH2ADD%t1,%t1,%t3; %t3=src*45 SH1ADD%t3,%t2,%t4; %t4=%src*346 icost=4, dcost=3, count=8 ６８３を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH3ADD%src,%t1,%t2; %t2=%src*17 SH3ADD%t1,%t1,%t3; %t3=%src*81 SH1ADD%t1,%t2,%t4; %t4=%src*35 SH3ADD%t3,%t4,%t5; %t5=%src*683 icost=5, dcost=3, count=158

【００４４】１８６７を乗ずる乗算の好ましいシーケン
スは、次の通り。 SHL6%src,%t1; %t1=%src*64 SUB%t1,%src,%t2; %t2=%src*-63 SH1ADD%t2,%t2,%t4; %t4=%src*-189 SH3ADD%t3,%t4,%t5; %t5=%src*1867 icost=5, dcost=3, count=1 １３６６を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH3ADD%src,%src,%t1; %t1=%src*9 SHL10%src,%t2; %t2=%src*1024 H3ADD%t1,%t1,%t3; %t3=%src*81 SH1ADD%t1,%t2,%t4; %t4=%src*1024 SH2ADD%t3,%t4,%t5; %t5=%src*1366 icost=5, dcost=3, count=17 ３７３４を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH3ADD%src,%src,%t1; %t1=%src*9 SH1ADD%src,%t1,%t2; %t2=%src*11 SH1ADD%t1,%t2,%t3; %t3=%src*29 SHL7%t3,%t4; %t4=%src*3712 SH1ADD%t2,%t4,%t5; %t5=%src*3734 icost=5, dcost=5, count=5 ２７３１を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH2ADD%src,%src,%t1; %t1=%src*5 SHL5%t1,%t2; %t2=%src*320 SH1ADD%t1,%src,%t3; %t3=%src*11 SH2ADD%t1,%t2,%t4; %t4=%src*340 SH3ADD%t4,%t3,%t5; %t5=%src*2731 icost=5, dcost=3, count=2

【００４５】１０４５２を乗ずる乗算の好ましいシーケ
ンスは、次の通り。 SHL6%src,%t1; %t1=%src*64 SH3ADD%t1,%src,%t2; %t2=%src*513 SH1ADD%t1,%t1,%t3; %t3=%src*192 SH2ADD%t2,%t2,%t4; %t4=%src*2565 SH2ADD%t4,%t3,%t5; %t5=%src*10452 icost=5, dcost=3, count=1 ５４６２を乗ずる乗算の好ましいシーケンスは、次の通
り。 SH2ADD%src,%src,%t1; %t1=%src*5 SH2ADD%t1,%src,%t2; %t2=%src*21 SHL8%t2,%t3; %t3=%src*5376 SH1ADD%t2,%src,%t4; %t4=%src*43 SH1ADD%t4,%t3,%t5; %t5=%src*5462 icost=5, dcost=4, count=12 ５９を乗ずる乗算の好ましいシーケンスは、次の通り。 SHL6%src,%t1; %t1=%src*64 SH2ADD%src,%src,%t2; %t2=%src*5 SUB%t2,%t1,%t3; %t3=%src*59

【００４６】以上、本発明を好ましい実施形態を参照し
て記述したが、本発明の理念および有効範囲を逸脱する
ことなく種々の修正または変更を行うことが可能である
点は容易に認められることであろう。

【００４７】本発明には、例として次のような実施様態
が含まれる。（１）コンパイラにおける乗算演算を実施する方法であ
って、上記コンパイラにおける上記乗算演算を実行する
命令シーケンスを含むルックアップ・テーブルを作成す
るステップと、上記コンパイラへの入力値を提供するス
テップと、上記入力値を上記ルックアップ・テーブルへ
のインデックスとして使用するステップと、上記入力値
によってインデックス付けされたテーブル位置にある整
数を上記ルックアップ・テーブルから取り出すステップ
と、上記取り出した整数を上記命令シーケンスに変換す
るステップと、上記コンパイラを用いて上記命令シーケ
ンスを実行して、上記入力値に関する乗算演算を実行す
るステップと、上記乗算演算の結果を出力値として提供
するステップと、を含むコンパイラにおける乗算実施方
法。（２）上記命令シーケンスの終了を示す監視命令を上記
命令シーケンスに含めるステップを更に含む、上記
（１）に記載のコンパイラにおける乗算実施方法。（３）上記監視命令に出会う前に実行される最後の命令
によって生成される結果を上記出力値として提供するス
テップを更に含む、上記（２）に記載のコンパイラにお
ける乗算実施方法。

【００４８】（４）コンパイラにおける乗算演算を実施
する装置であって、上記コンパイラにおける上記乗算演
算を実行する命令シーケンスを含み、上記コンパイラに
よって使用されるルックアップ・テーブルと、上記コン
パイラへの入力値を使用して上記ルックアップ・テーブ
ルへインデックス付けする手段と、上記入力値によって
インデックス付けされたテーブル位置にある整数を上記
ルックアップ・テーブルから取り出す手段と、上記取り
出した整数を上記命令シーケンスに変換する手段と、を
備え、上記コンパイラが上記命令シーケンスを実行し
て、上記入力値に関する乗算演算を実行し乗算演算の結
果の出力値を提供する、コンパイラにおける乗算実施装
置。（５）上記命令シーケンスの終了を示す監視命令を更に
備える、上記（４）に記載のコンパイラにおける乗算実
施装置。（６）上記監視命令に出会う前に実行される最後の命令
によって生成される結果を上記出力値として上記コンパ
イラが提供する、上記（５）に記載のコンパイラにおけ
る乗算実施装置。

【００４９】（７）コンパイラにおける乗算演算を実施
する方法であって、所与のアーキテクチャ上で乗算結果
を計算するために使用可能な各ＡＬＵ命令コードを列挙
するステップと、上記命令シーケンスの第Ｎ番目の命令
がレベルＮ命令であり、Ｎ個の命令からなるシーケンス
をレベルＮ命令シーケンスとして、各レベル毎に上記Ａ
ＬＵ命令コードを符号化してルックアップ・テーブルに
書き込むステップと、を含むコンパイラにおける乗算演
算実施方法。（８）上記命令コードを、２つの入力を受け取り１つの
出力を生成する命令コード、および１つの入力を受け取
り１つの出力を生成する命令コードに分類するステップ
と、ＡＬＵ命令シーケンスの終了にマークをつける監視
文字として上記命令コードの１つを予約するステップ
と、２入力および１出力を持つ命令コードの範囲を数え
上げて記録するステップと、を含む上記（７）に記載の
コンパイラにおける乗算演算実施方法。（９）上記コンパイラを使用して、入力値によって上記
ルックアップ・テーブルにインデックス付けするステッ
プと、インデックス付けされたルックアップ・テーブル
位置にある上記符号化されたＡＬＵ命令を、対応するＡ
ＬＵ命令シーケンスに展開するステップと、を含む上記
（７）に記載のコンパイラにおける乗算演算実施方法。（１０）符号化する上記ステップが、上記レベルに対応
する数を二乗した値に、２入力を持つ命令コードの数を
乗算し、その結果の積に１入力を持つ命令コードの数を
加算し、その合計に監視文字を定義するための１を加え
ることを含む、上記（７）に記載のコンパイラにおける
乗算演算実施方法。（１１）すべての可能な符号化を確定した後ＡＬＵ命令
シーケンスの各々を表す整数を生成するステップを更に
含む上記（７）に記載のコンパイラにおける乗算演算実
施方法。

【００５０】（１２）コンパイラにおける乗算演算を実
施する装置であって、所与のアーキテクチャ上で乗算結
果を計算するため使用可能な各ＡＬＵ命令コードを列挙
する手段と、上記命令シーケンスの第Ｎ番目の命令がレ
ベルＮ命令であり、Ｎ個の命令からなるシーケンスをレ
ベルＮ命令シーケンスとして、各レベル毎に符号化され
た上記ＡＬＵ命令コードを記憶するルックアップ・テー
ブルと、を備えるコンパイラにおける乗算演算実施装
置。（１３）上記命令コードが、２つの入力を受け取り１つ
の出力を生成する命令コード、および１つの入力を受け
取り１つの出力を生成する命令コードに分類され、ＡＬ
Ｕ命令シーケンスの終了にマークをつける監視文字とし
て上記命令コードの１つが予約され、２入力および１出
力を持つ命令コードの範囲が数え上げられ記録される、
上記（１２）に記載のコンパイラにおける乗算演算実施
装置。（１４）上記ルックアップ・テーブルにインデックス付
けするため上記コンパイラによって使用される入力値
と、インデックス付けされたルックアップ・テーブル位
置にある上記符号化されたＡＬＵ命令を、対応するＡＬ
Ｕ命令シーケンスに展開する手段と、を更に備える上記
（１２）に記載のコンパイラにおける乗算演算実施装
置。（１５）上記レベルに対応する数を二乗した値に、２入
力を持つ命令コードの数を乗算し、その結果の積に１入
力を持つ命令コードの数を加算し、その合計に監視文字
用の１を加えることによって上記ＡＬＵ命令コードが符
号化される、上記（１３）に記載のコンパイラにおける
乗算演算実施装置。（１６）すべての可能な符号化を確定した後ＡＬＵ命令
シーケンスの各々を表す整数を生成する手段を更に備え
る上記（１２）に記載のコンパイラにおける乗算演算実
施装置。

【００５１】（１７）１つの整数をＡＬＵ命令シーケン
スに展開する方法であって、入力値Ｕを使用して、該入
力値に定数値Ｘを乗ずる乗算演算を実行するＡＬＵ命令
シーケンスを表す整数をＳ₀と名付けるステップと、上
記命令シーケンスの第Ｎ番目の命令がレベルＮ命令であ
り、Ｎ個の命令からなるシーケンスをレベルＮ命令シー
ケンスとして、各レベルにおけるＡＬＵ命令符号化値を
含むレベル・テーブルを計算するステップと、剰余の各
々がＡＬＵ命令を表す剰余および被除数を計算するステ
ップと、上記剰余を上記ＡＬＵ命令に対応づけるステッ
プと、上記ＡＬＵ命令シーケンスを実行して乗算結果を
生成するステップと、を含む乗算命令シーケンス展開方
法。（１８）上記第１の剰余Ｒ₁の値が命令コード番号であ
り、Ｕの値がすべてのレベル１命令に対する入力である
ように上記第１の剰余Ｒ₁からレベル１命令への対応付
けを行うステップを更に含む、上記（１７）に記載の乗
算命令シーケンス展開方法。（１９）第２の剰余Ｒ₂が０に等しい場合、ＡＬＵ命令
シーケンスの終了に目印をつける監視文字にその剰余を
対応付けし、ゼロでなければＱ₂＝Ｒ₂−１とし、Ｑ₂の
値が2²×5未満であれば、２入力命令コードを使用する
こととして、Ｑ₂／２²＋１が対応するＡＬＵ命令コード
番号であり、Ｑ₂ｒｅｍ２の値が第１の入力値であり、
(Ｑ₂／２)ｒｅｍ２の値が第２の入力値であり、上記剰
余の値が第１の値であればＵを入力として使用し、上記
剰余の値が第２の値であればレベル１演算結果Ｌ１を入
力として使用し、第２の剰余Ｒ₂が０に等しくない場
合、Ｐ₂=Ｑ₂−２²×５として、１入力命令コードを使用
することとして、Ｐ₂／２＋６を対応する命令コード番
号とし、Ｐ₂ｒｅｍ２をその入力の値とするように、第
２の剰余Ｒ₂からレベル２命令への対応付けを行うステ
ップを含む、上記（１７）に記載の乗算命令シーケンス
展開方法。（２０）第Ｎ番目のの剰余Ｒ_Nが０に等しい場合、ＡＬ
Ｕ命令シーケンスの終了に目印をつける監視文字にその
剰余を対応付けし、ゼロでなければＱ_N＝Ｒ_N−１とし、
Ｑ_Nの値が２^N×５未満であれば、２入力命令コードを使
用することとして、Ｑ_N／Ｎ²＋１が対応するＡＬＵ命令
コード番号であり、Ｑ_NｒｅｍＮの値が第１の入力値で
あり、(Ｑ_N／Ｎ)ｒｅｍＮの値が第２の入力値であり、
上記剰余の値が第１の値であればＵを入力として使用
し、上記剰余の値が第２の値であればレベル１演算結果
Ｌ１を入力として使用し、第Ｎ番目の剰余Ｒ_Nが０に等
しくない場合、Ｐ_N=Ｑ_N-1−Ｎ²×５として、１入力命令
コードを使用することとして、Ｐ_N／Ｎ＋６を対応する
命令コード番号とし、Ｐ_NｒｅｍＮをその入力の値とす
るように、第Ｎ番目の剰余Ｒ_NからレベルＮ命令への対
応付けを行うステップを含む、上記（１７）に記載の乗
算命令シーケンス展開方法。

【００５２】（２１）１つの整数をＡＬＵ命令シーケン
スに展開する装置であって、上記命令シーケンスの第Ｎ
番目の命令がレベルＮ命令であり、Ｎ個の命令からなる
シーケンスをレベルＮ命令シーケンスとして、各レベル
におけるＡＬＵ命令符号化値を含むレベル・テーブル
と、入力値Ｕを使用して、該入力値に定数値Ｘを乗ずる
乗算演算を実行するＡＬＵ命令シーケンスを表す整数を
Ｓ₀と名付ける手段と、剰余の各々がＡＬＵ命令を表す
剰余および被除数を計算する手段と、上記剰余を上記Ａ
ＬＵ命令に対応づける手段と、上記ＡＬＵ命令シーケン
スを実行して乗算結果を生成する手段と、を備える乗算
命令シーケンス展開装置。（２２）上記第１の剰余Ｒ₁の値が命令コード番号であ
り、Ｕの値がすべてのレベル１命令に対する入力である
ように、上記第１の剰余Ｒ₁からレベル１命令への対応
付けを行う手段を更に備える、上記（２１）に記載の乗
算命令シーケンス展開装置。（２３）第２の剰余Ｒ₂が０に等しい場合、ＡＬＵ命令
シーケンスの終了に目印をつける監視文字にその剰余を
対応付けし、ゼロでなければＱ₂＝Ｒ₂−１とし、Ｑ₂の
値が2²×5未満であれば、２入力命令コードを使用する
こととして、Ｑ₂／２²＋１が対応するＡＬＵ命令コード
番号であり、Ｑ₂ｒｅｍ２の値が第１の入力値であり、
(Ｑ₂／２)ｒｅｍ２の値が第２の入力値とし、上記剰余
の値が第１の値であればＵを入力として使用し、上記剰
余の値が第２の値であればレベル１演算結果Ｌ１を入力
として使用し、第２の剰余Ｒ₂が０に等しくない場合、
Ｐ₂=Ｑ₂−２²×５として、１入力命令コードを使用する
こととして、Ｐ₂／２＋６が対応する命令コード番号で
あり、Ｐ₂ｒｅｍ２がその入力の値であるように、第２
の剰余Ｒ₂からレベル２命令への対応付けを行う手段を
更に備える、上記（２１）に記載の乗算命令シーケンス
展開装置。（２４）第Ｎ番目のの剰余Ｒ_Nが０に等しい場合、ＡＬ
Ｕ命令シーケンスの終了に目印をつける監視文字にその
剰余を対応付けし、ゼロでなければＱ_N＝Ｒ_N−１とし、
Ｑ_Nの値が２^N×５未満であれば、２入力命令コードを使
用することとして、Ｑ_N／Ｎ²＋１が対応するＡＬＵ命令
コード番号であり、Ｑ_NｒｅｍＮの値が第１の入力値で
あり、(Ｑ_N／Ｎ)ｒｅｍＮの値が第２の入力値であり、
上記剰余の値が第１の値であればＵを入力として使用
し、上記剰余の値が第２の値であればレベル１演算結果
Ｌ１を入力として使用し、第Ｎ番目の剰余Ｒ_Nが０に等
しくない場合、Ｐ_N=Ｑ_N-1−Ｎ²×５として、１入力命令
コードを使用することとして、Ｐ_N／Ｎ＋６が対応する
命令コード番号であり、Ｐ_NｒｅｍＮがその入力の値で
あるように、第Ｎ番目の剰余Ｒ_NからレベルＮ命令への
対応付けを行う手段を更に備える上記（２１）に記載の
乗算命令シーケンス展開装置。

【００５３】

【発明の効果】既知の定数による整数乗算を実施する効
率的なＡＬＵ命令シーケンを探索するために時間を費や
す必要がないので、本発明は迅速なコンパイル時間を実
現する。本発明は、また、多数の定数に対して効率的な
命令シーケンスを与えられるので、迅速な実行時処理性
能を提供する。

【図面の簡単な説明】

【図１】単一プロセッサのコンピュータ・アーキテクチ
ャを示すブロック図である。

【図２】図１で示されたコンピュータ・アーキテクチャ
と関連して使用される場合があるソフトウェア・コンパ
イラのブロック図である。

【図３】本発明に従って整数乗算または除算シーケンス
を記憶するコンパクトな符号化方式を実施するコンパイ
ル・システムの動作の流れ図である。

【図４】図５および図６とともに、本発明に従って整数
をＡＬＵ命令シーケンスに変換するアルゴリズムの動作
の流れ図である。

【図５】図４および図６とともに、本発明に従って整数
をＡＬＵ命令シーケンスに変換するアルゴリズムの動作
の流れ図である。

【図６】図４および図５とともに、本発明に従って整数
をＡＬＵ命令シーケンスに変換するアルゴリズムの動作
の流れ図である。

【符号の説明】

１０コンピュータ・アーキテクチャ１１プロセッサ１２キャッシュ１３メモリ１４入出力１５システム・バス２１コンパイラ・フロントエンド・コンポーネン
ト２２高水準オブジェクト(ＨＬＯ) ２３コード生成ルーチン２４低水準最適化ルーチン(ＬＬＯ) ２５オブジェクト・ファイル生成ルーチン２６リンカ１００ソース・コード１１０高水準中間表示形式(ＨＬＩＲ) １２０低水準中間表示形式(ＬＬIＲ) １４０、１４１オブジェクト・ファイル１５０実行可能ファイル

Claims

【特許請求の範囲】

【請求項１】コンパイラにおける乗算演算を実施する方
法であって、上記コンパイラにおける上記乗算演算を実行する命令シ
ーケンスを含むルックアップ・テーブルを作成するステ
ップと、上記コンパイラへの入力値を提供するステップと、上記入力値を上記ルックアップ・テーブルへのインデッ
クスとして使用するステップと、上記入力値によってインデックス付けされたテーブル位
置にある整数を上記ルックアップ・テーブルから取り出
すステップと、上記取り出した整数を上記命令シーケンスに変換するス
テップと、上記コンパイラを用いて上記命令シーケンスを実行し
て、上記入力値に関する乗算演算を実行するステップ
と、上記乗算演算の結果を出力値として提供するステップ
と、を含むコンパイラにおける乗算実施方法。