JP2001282532A

JP2001282532A - プロセッサにおける通信命令結果及びプロセッサのためのコンパイル方法

Info

Publication number: JP2001282532A
Application number: JP2001032090A
Authority: JP
Inventors: Nigel Peter Topham; ナイジェル・ピーター・トファム
Original assignee: Siroyan Ltd
Current assignee: Siroyan Ltd
Priority date: 2000-02-08
Filing date: 2001-02-08
Publication date: 2001-10-12
Also published as: US6826677B2; US20010016901A1; CN1308274A; GB0002848D0; GB0102461D0; EP1124182A3; GB2355094B; EP1124182A2; GB2355094A

Abstract

(57)【要約】【課題】レジスタ割り当てにおけるコンパイラのタス
クを単純化し、命令のセットをよりコンパクトにする。【解決手段】ソフトウェアでパイプラインを実行する
プロセッサ１は、実行される複数の命令を予め決められ
たシーケンスで発行する命令発行装置１０を含む。命令
のシーケンスは、実行時に各値を発生する複数の値発生
命令を含む。命令実行装置１４，１６及び１８は発行さ
れた命令を実行する。レジスタファイル２０は複数のレ
ジスタを有し、実行された命令が発生した複数の値を記
憶する。動作中に、プロセッサ１は、値発生命令が発生
した複数の値を、各値発生命令が発行された順序に従
い、各シーケンス番号に割り当てる。発生された各値
は、その値に割り当てられたシーケンス番号に依存して
その発生された値を記憶するために、複数のレジスタの
うちの１つに割り当てられる。上記複数のレジスタは、
値発生命令が発行される毎に名前を変更されてもよい。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、プロセッサにおけ
る複数の通信命令結果と、プロセッサのためのコンパイ
ル方法とに関する。特に、本発明は、マイクロプロセッ
サのようなプロセッサにおける命令結果を記憶するため
に複数のレジスタを割り当てることに関する。

【０００２】

【従来の技術】ハイパフォーマンスコンピューティング
において、ハイレートでの命令の実行が、通常、目標の
マシン（例えばマイクロプロセッサ）に要求される。実
行時間は、しばしば、アプリケーションプログラム内の
複数のループ構造によって支配される。ハイレートでの
命令の実行を可能にするために、プロセッサは、複数の
個別の実行装置を含んでもよく、上記各個別の装置を用
いることで、他の複数の実行装置による複数の命令の実
行と平行して、１つ又はそれよりも多くの命令を実行す
ることができる。

【０００３】そのような複数の実行装置は、複数の個別
のステージから構成されるいわゆるソフトウェアパイプ
ラインを提供するために用いることができる。各ソフト
ウェアパイプラインのステージは、特定の実行装置への
固定された物理的な対応を持たない。むしろ、アプリケ
ーションプログラムにおけるループ構造がコンパイルさ
れるとき、ループの個別の反復を構成する複数の機械語
命令は、ソフトウェアパイプラインのスケジュールに従
って、異なる複数の実行装置による実行に対してスケジ
ュールが決定されている。このスケジュールは複数の逐
次的なステージに分割され、複数の命令は、複数の逐次
的な反復に係る複数の開始の間の、選択されたループ開
始インターバルを有して、複数の異なる実行装置によっ
て、オーバーラップする方法で実行されるべき複数の反
復を可能にするような方法でスケジュールが決定され
る。従って、反復ｉの第１のステージが終了し、その反
復が第２のステージに入るとき、次の反復ｉ＋１の実行
は、反復ｉ＋１の第１のステージで開始される。従っ
て、反復ｉ＋１の第１のステージにおける複数の命令
は、反復ｉの第２のステージにおける複数の命令の実行
に対して、並列に実行される。

【０００４】そのようなソフトウェアでパイプライン処
理された複数のループにおいて、通常は、パイプライン
における複数の異なる命令の間で通信されなければなら
ない、複数のループ可変値、すなわち、ループの各異な
る反復において再評価されなければならない複数の表現
が存在する。そのような複数のループ可変値に関して、
それらを、いわゆる回転するレジスタファイルに記憶す
ることができる。この場合、各ループ可変値は、回転す
るレジスタファイル内の論理的なレジスタ番号に割り当
てられ、この論理的なレジスタ番号は、１つの反復から
次の反復に向かう間に変化しない。回転するレジスタフ
ァイルの内側で、各論理的なレジスタ番号は、レジスタ
ファイル内の物理的なレジスタにマッピングされ、この
マッピングは、新しい反復が開始される毎に、すなわ
ち、パイプラインの境界が交差される毎に回転される。
従って、複数の異なる反復における対応する複数の命令
はすべて、同一の論理的なレジスタ番号を参照すること
ができ、１回の反復によって発生される値が、異なる反
復の続いて実行される命令によって上書きされることを
防止すると同時に、コンパイルされた複数の命令を単純
化する。

【０００５】

【発明が解決しようとする課題】以上に考察されたプロ
セッサについて、回転するレジスタファイル内の複数の
レジスタを、ループ計算において発生される複数の値に
割り当てることにおけるコンパイラのタスクは、本願明
細書において後でより詳細に説明されるように複雑であ
る。ゆえに、ループ計算内で、ループ可変値を含む、複
数の中間の値を識別するための機構であって、回転する
レジスタファイル内で複数のレジスタを割り当てること
のコンパイラのタスクを単純化できる機構を提供するこ
とが望ましい。また、そこにおいて複数の命令がよりコ
ンパクトになる、プロセッサのための命令セットを提供
することも望ましい。

【０００６】

【課題を解決するための手段】本発明の第１の態様によ
れば、実行されるべき複数の命令を予め決められたシー
ケンスで発行する命令発行手段を含み、複数の命令にて
なる上記シーケンスは、実行されるときに各値を発生す
る、予め選択された複数の値発生命令を含み、上記発行
された複数の命令を実行する命令実行手段と、複数のレ
ジスタを有し、上記実行された複数の命令によって発生
された複数の値を記憶するレジスタ手段と、上記複数の
値発生命令によって発生された上記複数の値を、それら
の各値発生命令の発行の順序に従って、各シーケンス番
号に割り当てるシーケンス番号割り当て手段と、上記発
生された各値を、その値に割り当てられたシーケンス番
号に依存して、その発生された値を記憶するための上記
複数のレジスタのうちの１つに割り当てるレジスタ割り
当て手段とを含むプロセッサが提供されている。

【０００７】そのようなプロセッサに対し、複数のレジ
スタを割り当てることのコンパイラのタスクは単純化さ
れる。例えば、レジスタ手段は回転するレジスタファイ
ルの形式であってもよく、複数のレジスタは、予め選択
された複数の値発生命令の内の１つが発行される毎に、
再マッピングされてもよい（名前を変更されてもよ
い）。また、複数の値発生命令が、それらの各発生され
た値を記憶するためにあて先レジスタを特定する必要が
ないので、そのようなプロセッサのための命令セット
は、よりコンパクトであることができる。

【０００８】本発明の第２の態様によれば、複数のハイ
レベルプログラム命令のシーケンスを、プロセッサによ
って実行されるべき対応する複数のローレベル命令のシ
ーケンスに変換するためのコンパイル方法が提供され、
上記方法は、上記対応するシーケンスに係るどの上記複
数のローレベル命令が予め選択された複数の値発生命令
であり、どれが予め選択された複数の値要求命令である
かを決定するステップを含み、上記各値発生命令は、実
行されるときに、値を発生する命令であり、上記各値要
求命令は、実行されるときに、以前に発行された値発生
命令によって発生された上記値を要求する命令であり、
上記方法は、それらの各値発生命令が実行中に発行され
る順序に従って、上記発生された複数の値を各シーケン
ス番号に割り当てるステップと、実行中の上記プロセッ
サによる使用のために上記各値要求命令を情報を用いて
符号化して、その命令によって要求された上記発生され
た値を識別するステップとを含み、その情報は、その発
生された値に割り当てられた上記シーケンス番号に依存
する。

【０００９】本発明の第３の態様によれば、コンピュー
タ上で動作するとき、上記コンピュータに、本発明に係
る上述の第２の実施形態を具体化するコンパイル方法を
実行させるコンピュータプログラムが提供される。

【００１０】本発明の第４の態様によれば、コンピュー
タ上で動作するとき、上記コンピュータに対して、複数
のハイレベルプログラム命令のシーケンスを、プロセッ
サによって実行されるべき対応する複数のローレベル命
令のシーケンスに変換するコンパイル方法を実行させる
コンピュータプログラムが提供され、上記コンピュータ
プログラムは、上記対応するシーケンスに係るどの上記
複数のローレベル命令が予め選択された複数の値発生命
令であり、どれが予め選択された複数の値要求命令であ
るかを決定する決定部を含み、上記各値発生命令は、実
行されるときに、値を発生する命令であり、上記各値要
求命令は、実行されるときに、以前に発行された値発生
命令によって発生された上記値を要求する命令であり、
上記コンピュータプログラムは、それらの各値発生命令
が実行中に発行される順序に従って、上記発生された複
数の値を各シーケンス番号に割り当てる割り当て部と、
上記プロセッサによる使用のために各値要求命令を情報
を用いて符号化して、その命令によって要求された上記
発生された値を識別する符号化部とを含み、その情報
は、その発生された値に割り当てられた上記シーケンス
番号に依存する。

【００１１】

【発明の実施の形態】以下、添付された図面を実施例と
して参照する。

【００１２】図１は、本発明の実施形態に係るプロセッ
サの構成要素を図示する。この実施例において、上記プ
ロセッサは、ソフトウェアのパイプライン処理と巡回的
なレジスタの名前の変更とを実行するためのハードウェ
アサポートを有する超長命令語（very long instructio
n word; ＶＬＩＷ）プロセッサである。プロセッサ１
は、命令発行装置１０と、スケジュール記憶装置１２
と、各第１、第２及び第３の実行装置１４，１６及び１
８と、レジスタファイル２０とを含む。命令発行装置１
０は、それぞれ第１、第２及び第３の実行装置１４，１
６及び１８に接続された３つの発行スロットＩＳ１，Ｉ
Ｓ２及びＩＳ３を有する。第１のバス２２は、３つの実
行装置１４，１６及び１８のすべてを、レジスタファイ
ル２０に接続する。第２のバス２４は、第１及び第２の
装置１４及び１６（しかしこの実施形態では第３の実行
装置１８は除く）を、この実施例では外部のランダムア
クセスメモリ（ＲＡＭ）装置であるメモリ２６に接続す
る。上記メモリ２６は、それに代わって、プロセッサ１
の内部のＲＡＭであることができる。

【００１３】ちなみに、図１は、複数の実行装置をレジ
スタファイル２０及びメモリ２６に接続する、共有され
たバス２２及び２４を図示しているが、それに代わっ
て、各実行装置がレジスタファイル及びメモリへのそれ
ら自身の個別の接続を有することが理解されよう。

【００１４】プロセッサ１は、一連の処理サイクルを実
行する。各処理サイクルにおいて、命令発行装置１０
は、発行スロットＩＳ１乃至ＩＳ３のそれぞれにおい
て、１つの命令を発行できる。上記複数の命令は、スケ
ジュール記憶装置１２に記憶された（以下に説明され
る）ソフトウェアパイプラインのスケジュールに従って
発行される。

【００１５】異なる複数の発行スロットにおいて、命令
発行装置１０によって発行された複数の命令は、対応す
る実行装置１４，１６及び１８によって実行される。こ
の実施形態において、実行装置のそれぞれは、同時に１
つよりも多くの命令を実行することができるので、新し
い命令を実行することは、関係した実行装置に発行され
た以前の命令の実行の完了前に開始することができる。

【００１６】複数の命令を実行するために、各実行装置
１４，１６及び１８は、第１のバスを介して各レジスタ
ファイル２０へのアクセスを有する。ゆえに、レジスタ
ファイル２０に含まれた複数のレジスタに保持される複
数の値は、実行装置１４，１６及び１８によって読み出
し、かつ書き込むことができる。またさらに、第１及び
第２の装置１４及び１６は、外部メモリ２６の複数の記
憶場所に記憶される複数の値に係る読み出し及び書き込
みをイネーブルするように、第２のバス２４を介して外
部メモリ２６へのアクセスを有する。第３の実行装置１
８は、外部メモリ２６へのアクセスを持たず、そのた
め、この実施形態において、レジスタファイル２０に含
まれた複数の値を操作することだけが可能である。

【００１７】次に、図１のプロセッサの動作をより詳細
に説明し、プロセッサに対する複数のコンパイル命令の
ためのコンパイル処理を、特定の実施例に関して説明す
る。この特定の実施例において、ハイレベル言語Ｃで記
述されたアプリケーションプログラムが以下の単純なル
ープを含むことが仮定されている。

【００１８】

【数１】１：ｆｏｒ（ｉ＝０；ｉ＜ｍ；ｉ＋＋）２：ｄｙ（ｉ）＝ｄｙ（ｉ）＋ｄａ＊ｄｘ（ｉ）

【００１９】そのようなループは、線形代数を実行する
ために用いられる複数のアプリケーションプログラム
（パッケージ）において、非常に一般的に見出だされ
る。このループにおいて、アレーｄｙの各素子ｄｙ
（ｉ）（ｉ＝０，１，．．．ｍ−１）は、一定値ｄａ
と、別のアレーｄｘの対応する素子ｄｘ（ｉ）との積に
よって増加させられる。

【００２０】図１のプロセッサのためにこのループをコ
ンパイルする処理は、図２に図示されたように、シンボ
ル的なデータフローグラフの生成から始まる。次のステ
ップは、図２のデータフローグラフを、図１のプロセッ
サの実際の機械語命令に近い形式に変換することのさま
ざまな最適化を実行することである。この最適化のステ
ップの間に、コンパイラは、ループ内で何の値が変化し
たかということ（ループ可変値）と、何の値が同じまま
残っているかということ（ループ不変値）とを決定す
る。例えば、ｄａの値はループの継続時間全体を通じて
変更されない。

【００２１】アレーｄｘ及びｄｙは外部メモリ２６（図
１）における複数の記憶場所の中に記憶され、従って、
図２のデータフローグラフにおけるそれらへの参照記号
は、対応する複数のメモリアクセス動作に変換されなけ
ればならない。従って、各アレーｄｘ及びｄｙは、アレ
ーの複数の素子が記憶されている外部メモリ２６の複数
の記憶場所を指示するために、少なくとも１つのポイン
タを必要とする。そのような各ポインタはレジスタファ
イル２０のレジスタに保持される。

【００２２】一定値ｄａは、メモリにおけるその位置へ
の同様のポインタを用いて扱うことができるが、上記値
はループ不変値であるので、ループの実行中に、それを
レジスタファイル２０のそれ自身のレジスタに直接に保
持することはより便利かつ高速である。最後に、最適化
処理において、コンパイラは、自動インクリメントアド
レス指定モードのような、利用可能なプロセッサ命令に
係る任意の有利な特徴を考慮する。

【００２３】最適化処理から結果的に得られる図２のデ
ータフローグラフの内部コンパイラ表現の一実施例が図
３に示されている。図３は、個別の機械語命令と、それ
らの依存関係を図示する（第１の命令から第２の命令へ
の矢印のポインティングは、上記第２の命令が上記第１
の命令を実行した結果に依存していることを示す）。ま
た、図３における各矢印は、そこから矢印が指示する命
令の実行を完了するために要求されるプロセッササイク
ルの数を示す数を、それに関連付けた。

【００２４】図３における第１の命令Ｉ１は、ロード命
令“ｌｄｖ０，（ｒ１＋＋）”である。この命令は、
レジスタファイル２０のレジスタｖ０に、アレー素子ｄ
ｘ（ｉ）の値をロードするために用いられる。上記値
は、レジスタファイルの別のレジスタｒ１によって指示
される、外部メモリ２６の中の記憶場所から読み出され
る。命令Ｉ１における“ｒ１”の後の“＋＋”は、レジ
スタｒ１によって指示された記憶場所から読み出した後
で、レジスタｒ１は外部メモリ２６における次に続いた
位置を指示するようにインクリメントされるべきである
ことを示している。これは、プロセッサ１の自動インク
リメントアドレス指定モードに係る特徴の利点を持つコ
ンパイラの１つの例である。

【００２５】第２の命令Ｉ２は、乗算命令“ｍｕｌｖ
１，ｒ３，ｖ０”である。この乗算命令は、第１の命令
Ｉ１においてレジスタｖ０にロードされたｄｘ（ｉ）の
値を、レジスタファイル２０のもう１つのレジスタｒ３
に保持されたｄａの値によって乗算するために用いられ
る。上記乗算の結果は、レジスタファイル２０のレジス
タｖ１に記憶される。

【００２６】図３における第３の命令Ｉ３は、もう１つ
のロード命令“ｌｄｖ２，（ｒ２＋＋）”である。こ
の第２のロード命令は、レジスタファイル２０のレジス
タｒ２によって指示された記憶場所に保持されたアレー
素子ｄｙ（ｉ）の値を、レジスタファイル２０のレジス
タｖ２にロードするために用いられる。また、この第２
のロード命令は、読み出し動作の後にレジスタｒ２を自
動的にインクリメントする自動インクリメントアドレス
指定モードの命令であり、従って、次にそれは、その場
所が読み出されると直ちに、次の記憶場所を指示する。

【００２７】図３における第４の命令Ｉ４は、加算命令
“ａｄｄｖ３，ｖ１，ｖ２”である。この命令は、レ
ジスタｖ１及びｖ２に保持された各値（すなわち、ｄａ
＊ｄｘ（ｉ）及びｄｙ（ｉ））をともに加算し、その結
果をレジスタファイル２０の別のレジスタｖ３の中に記
憶する。

【００２８】図３における第５の命令Ｉ５は、記憶命令
“ｓｔｖ３，（ｒ４＋＋）”である。この命令は、レ
ジスタｖ３に保持された値を、レジスタファイル２０に
含まれた別のレジスタｒ４によって指示された、外部メ
モリ２６の中の、ｄｙ（ｉ）のための記憶場所に記憶す
るために用いられる。

【００２９】第２のロード命令Ｉ３においてｄｙ（ｉ）
が読み出される（レジスタｒ２によって指示された）記
憶場所は、記憶命令Ｉ５においてｄｙ（ｉ）が書き込ま
れるところと同一の（レジスタｒ４によって指示され
た）記憶場所でなければならない。ゆえに、第２のロー
ド命令Ｉ３と記憶命令Ｉ５との双方において、ｄｙ
（ｉ）を指示するために単一のレジスタ（例えばｒ２）
を用いることはより好適であると考えられる。しかしな
がら、この例において、ソフトウェアでパイプライン処
理をすることが、結果的に、（後の記述から明らかにな
るように）次の反復における第２のロード命令Ｉ３が現
在の反復における記憶命令Ｉ５の前に実行されることを
もたらすので、単一のレジスタを用いることは不可能で
ある。記憶命令Ｉ５が、ｄｙ（ｉ）を指示するためにロ
ード命令Ｉ３と同一のレジスタｒ２を用いることになっ
ていれば、レジスタｒ２は、それが現在の反復の記憶命
令Ｉ５によって用いられる前に、次の反復のロード命令
Ｉ３によってインクリメントされる。この理由のため
に、ｄｙ（ｉ）を指示するために図３において２つのレ
ジスタｒ２及びｒ４が用いられ、上記２つのレジスタは
各反復の開始部分において同一の値を有し、それぞれは
反復の過程の間に１回だけインクリメントされるが、ｒ
４をインクリメントすることはレジスタ２のそれと比較
して延期される。

【００３０】図３において、命令Ｉ１乃至Ｉ４によって
発生された結果はすべて、異なる反復において互いに区
別されなければならないループ可変値である。この理由
のために、これらの中間の値は、一時的なレジスタ識別
子（数）ｖ０乃至ｖ３に割り当てられる。これらは最後
のレジスタ割り当てではないが、コンパイラによって適
用される複数の命令結果（データフローグラフにおける
矢印）に対する一時的なラベルに過ぎない。一方、レジ
スタｒ１乃至ｒ４は最後の（永久の）レジスタ番号を割
り当てられるが、それは、レジスタｒ１乃至ｒ４に対し
てあて先指定される計算結果が、１回の反復よりも長く
ならない待ち時間及び存続時間を有するため、すなわ
ち、与えられた反復においてｒ１が再び書き込まれるこ
とを必要とする時まで、以前の反復においてｒ１に記憶
された発生された値は、他の反復によってはもはや必要
とされないためである。

【００３１】概念的には、図３に図示されたループの１
つの反復を実行する処理は、前任者（predecessor）を
持たないノードにおいて開始する木（ツリー）の複数の
ノードを評価し、木の根（ルート）に向かって動作する
ことを伴う。ゆえに、この場合、図３において、実行の
順序はＩ１からＩ５へと向かう。

【００３２】コンパイル処理の次のステージは、ソフト
ウェアパイプラインのスケジュールを生成することであ
る。

【００３３】ソフトウェアのパイプライン処理の第１の
フェーズは、ループ開始インターバル（ＩＩ）、すなわ
ち、ループの逐次的な複数の反復に係る開始の間の間隔
を決定することを伴う。このループ開始インターバル
は、データフローグラフにおける任意のサイクルの存在
と同様に、実行する命令数と比較して、プロセッサ中で
利用可能な資源に依存する。例えば、図１のプロセッサ
は、３つの命令発行スロットＩＳ１乃至ＩＳ３と３つの
実行装置１４，１６及び１８とを有し、上記実行装置の
中で第１及び第２の実行装置１４及び１６のみが外部メ
モリ２６にアクセスすることができる。また、それは、
実行装置が、それらが異なるタスクを実行するために個
別に最適化されているという意味で、「特別な」装置と
してもよい場合である。例えば、複数の実行装置の内の
特定のものだけが特定のタイプの命令を実行できるとし
てもよい。

【００３４】本実施例において、利用可能な資源を考慮
して、ループ開始インターバルＩＩが２つのプロセッサ
サイクルとして決定されることを仮定する。また、第３
の実行装置１８のみが、加算及び乗算命令を実行するた
めに必要な資源（例えば、演算論理装置ＡＬＵ）を備え
ていると仮定する。

【００３５】この第１のフェーズの後で、次のフェーズ
は、いわゆるモジュロのスケジューリングの拘束条件
（modulo scheduling constraint）に従うスケジュール
を生成することである。この拘束条件は、１つの反復を
形成する複数の命令（すなわち、図３における命令Ｉ１
乃至Ｉ５）に関する。各利用可能な発行スロットに対し
て、サイクルｙにおいて同一の発行スロットからの発行
に対してスケジュールが決定された命令が存在しないと
き、かつそのときに限って、ある命令は、サイクルｘに
おいて関連したスロットからの発行に対してスケジュー
ルが決定されてもよい。ここで、ｙはＩＩを法としてｘ
に等しい。このモジュロ拘束条件は、条件を満たすなら
ば、各発行スロットが、プロセッササイクル毎に１つの
命令の最大値を発行することを保証する。

【００３６】以下の表１は、図３の木構造に対応するモ
ジュロスケジューリング表を示す。表１は、ループの１
つの反復を作成する５つの命令Ｉ１乃至Ｉ５がどのよう
にスケジュールが決定されるかを示している。特に、表
の列３乃至５は、各命令が発行されているときのスケジ
ュールにおけるサイクルと、それが発生しているところ
のソフトウェアパイプラインのステージと、それによっ
て命令が発行されている発行スロット（すなわち、命令
を実行する実行装置）とを示す。表１において、最後の
４つの列は論理的なレジスタ番号を示し、網掛けは、図
５、図６（Ａ）及び図６（Ｂ）を参照して後に詳細に説
明されるように、値の存続時間を示すために用いられて
いる。

【００３７】

【表１】

【００３８】表１に示されたように、モジュロのスケジ
ューリングの拘束条件のために、どの２つの命令も、同
一の発行スロットにおいて、互いに複数２個のサイクル
だけ離れてスケジュールが決定されることができない。
従って、サイクル０においていったん第１のロード命令
Ｉ１が発行スロット１からの発行に対してスケジュール
が決定されたときは、次の命令、すなわちサイクル２に
おいて発行されるべき乗算命令Ｉ２は、発行スロット１
とは異なる発行スロットに、この場合は発行スロット３
にスケジュールが決定されなければならない。発行スロ
ット３は、この例において第３の実行装置１８のみが乗
算命令を実行することができるので選択された。同様
に、サイクル３においていったん第２のロード命令Ｉ３
が発行スロット１からの発行のためにスケジュールが決
定されたときは、次の命令、すなわちサイクル５におけ
る発行のためにスケジュールが決定される加算命令Ｉ４
は、スロット１とは異なるスロット、この場合では再び
スロット３から発行されなければならない。記憶命令Ｉ
５である第５の命令は、サイクル９において発行される
ように要求される。モジュロ拘束条件のために、これ
は、発行スロット１又は発行スロット３のいずれにおい
ても発行することができず、従って発行スロット２に割
り当てなければならない。

【００３９】表１におけるスケジュールは１つの反復の
みに関するということが理解されよう。すべてのＩＩサ
イクルで、もう１つの反復が同一のスケジュールに従っ
て開始される。従って、現在の反復がステージ１にある
とき、直接に先行する反復はステージ２にあり、その前
の反復はステージ３にあり、その前の反復はステージ４
にあり、かつ、その前の反復はステージ５にある。複数
の命令は、すべてのＩＩサイクルで各発行スロットが同
一の命令を発行するように、すべての反復において、複
数の同じ発行スロットによる発行に対してスケジュール
が決定される。

【００４０】図４は、第１乃至第６の異なる反復（ｉ＝
０乃至ｉ＝５）が互いにどのようにオーバーラップして
いるかを図示している。図４において、表記法は以下の
ようになる。

【００４１】Ｌ１は第１のロード命令Ｉ１を示す。Ｍは
乗算命令Ｉ２を示す。Ｌ２は第２のロード命令Ｉ３を示
す。Ａは加算命令Ｉ４を示す。Ｓは記憶命令Ｉ５を示
す。

【００４２】サイクル０において、第１の反復（ｉ＝
０）は、発行スロット１から第１のロード命令Ｌ１の発
行を開始する。サイクル１において開始される命令は存
在しない。サイクル２において、第２の命令（ｉ＝１）
の実行は、発行スロット１からのロード命令Ｌ１の発行
によって開始される。また、同時に、第１の反復の乗算
命令Ｍは発行スロット３から発行される。サイクル３に
おいて、第１の反復の第２のロード命令Ｌ２のみが発行
される。第１の反復のＬ２の発行のときに、第２の反復
のＬ１が未だ完了していないということは理解されよ
う。それより、この実施形態において、図１のプロセッ
サにおける第１の実行装置１４が、これら２つのロード
命令を互いに並列に実行できなければならないことが従
う。

【００４３】サイクル４において、第３の反復（ｉ＝
２）の実行は、その反復の第１のロード命令Ｌ１をスロ
ット１から発行することによって開始される。それと同
時に、第２の反復の乗算命令Ｍが発行スロット３から発
行される。

【００４４】すべての反復に対するすべての動作が完了
するまで、実行はこの方法で継続する。

【００４５】反復を実行することに係るパイプライン処
理の性質を、図４から見ることができる。例えば、サイ
クル８において、第５の反復（ｉ＝４）は表１のスケジ
ュールのステージ１に存在し、それと同時に、第４の反
復（ｉ＝３）はステージ２に存在し、第３の反復（ｉ＝
２）はステージ３に存在し、第２の反復（ｉ＝１）はス
テージ４に存在し、かつ、第１の反復（ｉ＝０）はステ
ージ５に存在する。

【００４６】上述のように、“ｖ０”乃至“ｖ３”は、
複数のレジスタに割り当てられた一時的な識別子（ラベ
ル）に過ぎない。これらの一時的なレジスタ識別子は、
複数の命令によって特定されるべき論理的なレジスタ識
別子に翻訳されなければならない。この翻訳のタスク
は、複数のレジスタが実行時間にプロセッサによって割
り当てられる方法を考慮して、コンパイラによって実行
される。

【００４７】本発明の実施形態に係るプロセッサに対し
てこのタスクがどのように実行されるかを説明する前
に、最初に、以前に考察された、本発明の実施形態では
ないプロセッサに対してタスクがどのように実行される
かについて、図５、図６（Ａ）及び図６（Ｂ）を参照し
て説明を与える。

【００４８】図５は、以前に考察されたプロセッサにお
けるレジスタファイル１２０の一部の概略的な表示を示
す。図５に図示された部分１２０Ｒは、ループ可変値を
保持するためにプロセッサによって用いられる部分であ
る。また、レジスタファイル１２０は、ループ不変値を
保持するためにもう１つの部分（図５には図示せず。）
を有していてもよい。

【００４９】図５に図示されたように、部分１２０Ｒ
は、レジスタファイル２０において逐次的なアドレスで
配置された複数（本実施例では１６個）のレジスタｒ０
乃至ｒ１５を備える。

【００５０】レジスタファイル１２０において、ある命
令において特定された論理的なレジスタ識別子は、マッ
ピングオフセットＯＦＦＳＥＴを用いて物理的なレジス
タアドレスにマッピングされる。例えば、図５に図示さ
れたように、マッピングオフセットＯＦＦＳＥＴは１０
であり、このことは、論理的なレジスタ識別子ｓ０が物
理的なレジスタｒ１０にマッピングされることを意味す
る。論理的なレジスタ識別子ｓ１は、物理的なレジスタ
ｒ１１にマッピングされる、などである。上記マッピン
グは、例えば、ＯＦＦＳＥＴが１０に等しいとき論理的
なレジスタ識別子ｓ６が物理的なレジスタｒ０にマッピ
ングされるように、部分１２０Ｒを「ラップアラウン
ド」する。

【００５１】図５のレジスタファイルを有する、以前に
考察されたプロセッサにおいて、ソフトウェアパイプラ
インを実行することが用いられるとき、新しい反復の実
行が開始される毎に、すなわちすべてのＩＩプロセッサ
サイクル毎に、マッピングオフセット値ＯＦＦＳＥＴは
変化される。マッピングオフセット値を変化すること
は、複数の命令において特定された複数の論理的なレジ
スタ識別子と、レジスタファイル２０の部分２０Ｒにお
ける実際の複数の物理的なレジスタとの間のマッピング
を変化させることの効果を有する。このことは複数のレ
ジスタの名前を変更することに等しい。

【００５２】ソフトウェアでパイプライン処理された方
法で実行される複数の命令（すなわち、本実施例におい
て表１に示された５つの命令）は、実行されている特定
の反復に関わりなく、複数の同じ論理的なレジスタ識別
子を保持することを必要とする。しかしながら、そのと
き、複数のレジスタの名前を変更することは、任意の与
えられた反復において発生された各ループ可変値を、上
記値が必要とされる限り（すなわち、表１における４つ
の最後の列のうちの関連した１つにおいて、網掛けで図
示された上記値の存続時間に対して）、その値を要求し
ている任意の他の命令によって必要に応じてアクセス可
能なそれ自身のレジスタに提供するものでなければなら
ない。

【００５３】例えば、表１に図示されたように、サイク
ル０において発行された第１のロード命令によって発生
された値を記憶するためのレジスタは、一時的なレジス
タ識別子ｖ０を割り当てられ、関連した、発生された値
は、乗算命令の入力オペランドのうちの１つとしてサイ
クル２において必要とされるので、３つのプロセッササ
イクルのうちの最小の存続時間を有する。同様に、サイ
クル２において発行された乗算命令によって発生された
値は、一時的なレジスタ識別子ｖ１を割り当てられ、こ
の発生された値は、サイクル５において加算命令によっ
て必要とされるので、４つのプロセッササイクルのうち
の最小の存続時間を有する。

【００５４】以前に考察されたプロセッサにおけるすべ
てのＩＩサイクルごとの複数の物理的なレジスタの名前
の変更と、値の存続時間とを考慮して、以前に考察され
たプロセッサに対して、コンパイラは、本実施例におい
て複数のループ可変値を保持するために用いられる複数
のレジスタを識別するために、９つの異なる論理的なレ
ジスタ識別子ｓ０乃至ｓ８を用いることを必要とすると
いうことがわかる。

【００５５】次に図６（Ａ）及び図６（Ｂ）を参照し
て、以前に考察されたプロセッサに対して、一時的なレ
ジスタ識別子ｖ０乃至ｖ３が、コンパイラによって、表
１に示された論理的なレジスタ識別子ｓ０乃至ｓ８に翻
訳される方法を説明する。図６（Ａ）及び図６（Ｂ）に
おいて、最初にマッピングオフセット値ＯＦＦＳＥＴが
１０であることが仮定されている。第１の反復（ｉ＝
０）が開始されるとき、第１のロード命令は、ロードさ
れた値を記憶するための物理的なレジスタを割り当てら
れることを必要とする。この値がレジスタを要求する最
初の値であるとき、そのレジスタは、レジスタファイル
１２０内で物理的なレジスタｒ１０にマッピングされて
いる論理的なレジスタ識別子ｓ０を用いて特定される。

【００５６】以前に考察されたプロセッサにおける複数
のレジスタの名前の最初の変更は、プロセッササイクル
２の開始部分において発生し、その結果、ＯＦＦＳＥＴ
は１だけデクリメントされて９になる。

【００５７】２つの命令、すなわち第１の反復の乗算命
令と第２の反復の第１のロード命令とが、サイクル２に
おいて発行される。乗算命令は、第１の反復の第１のロ
ード命令によって発生された値を要求する。サイクル２
の開始部分において発生した複数のレジスタの名前を変
更したことを理由として、物理的なレジスタｒ１０から
その値を検索するために論理的なレジスタ識別子ｓ１を
用いなければならない。第２の反復の第１のロード命令
における論理的なレジスタ識別子は、第１の反復の第１
のロード命令におけるそれと同一（ｓ０）でなければな
らない。また、第１の反復における乗算命令は、その結
果を記憶するためのレジスタに提供されなければならな
い。現在使用中であるレジスタｒ９及びｒ１０の後段に
おける最初の空きレジスタは、論理的なレジスタ識別子
ｓ２に対応するレジスタｒ１１になる。

【００５８】サイクル３において、第１の反復の第２の
ロード命令が発行される。この命令は、そのロードされ
た値を記憶するためのレジスタを要求する。レジスタｒ
９乃至ｒ１１がすでに使用中になった後に、最初の空き
レジスタはレジスタｒ１２になる。しかしながら、後述
される理由によって、ｒ１２は、後に続く反復において
発生される値のためにコンパイラによって予約されなけ
ればならず、そのため、第１の反復の第２のロード命令
によって発生された、ロードされた値は、論理的なレジ
スタ識別子ｓ４を要求するレジスタｒ１３に割り当てら
れる。

【００５９】以前に考察されたプロセッサにおける複数
のレジスタの名前の次の変更は、プロセッササイクル４
の開始部分において発生し、その結果、ＯＦＦＳＥＴは
再び１だけデクリメントされ、値８を有する。

【００６０】サイクル４において、第２の反復の乗算命
令及び第３の反復の第１のロード命令が発行される。こ
れらの命令に対する論理的なレジスタ識別子は、以前の
乗算命令及び第１のロード命令に対するものと同一であ
る。物理的なレジスタｒ１０は、以前の反復においてそ
のレジスタに記憶されたループ可変値の存続時間はサイ
クル２で満了するので、第２の反復の乗算命令の結果を
記憶するために再利用できる。

【００６１】サイクル５において、発行された命令は、
第１の反復の加算命令及び第２の反復の第２のロード命
令である。加算命令に対する複数の入力オペランドは、
レジスタｒ１１及びｒ１３に含まれ、論理的なレジスタ
識別子ｓ３及びｓ５を指定する加算命令を必要とする。
レジスタｒ１３が使用中になった後の最初の空きレジス
タであるレジスタｒ１４は、加算命令の結果に係る記憶
装置に対して割り当てられる。このレジスタは論理的な
レジスタ識別子ｓ６によって特定される。

【００６２】レジスタｒ１２が第１の反復においてスキ
ップされなければならない理由を以下に示す。第２の反
復の第２のロード命令の結果を記憶するためのレジスタ
を割り当てるために用いられる論理的なレジスタ識別子
ｓ４は、対応する第１の反復の第２のロード命令におい
て特定された論理的なレジスタ識別子と同一でなければ
ならない。第１の反復においてｓ４がｒ１２にマッピン
グされたならば、第２の反復においてｓ４はｒ１１にマ
ッピングする。しかしながら、このことは、第１の反復
の乗算命令によって発生された値を記憶するレジスタで
あるｒ１１が、サイクル５の開始部分において未だ使用
中であるので、実行できない。

【００６３】結果として得られる、図３の命令Ｉ１乃至
Ｉ５に対応する翻訳された命令のセットは、それ自身、
図６（Ａ）の下部に図示されている。

【００６４】一時的なレジスタ識別子ｖ０乃至ｖ３を論
理的なレジスタ識別子ｓ０乃至ｓ８に翻訳することにお
けるコンパイラのタスクは、図６（Ａ）及び図６（Ｂ）
から、以前に考察されたプロセッサに対して複雑なもの
であることが分かる。明らかに利用可能なレジスタｒ１
２は、例えば、第２のロード命令の発生された値を記憶
するために、第１の反復において割り当てることができ
ず、このことは、後に続くサイクルにおいてコンフリク
トをもたらす。

【００６５】以下の表２は、表１に対応するが、本発明
の実施形態に係るモジュロスケジューリング表を示す。

【００６６】

【表２】

【００６７】表２において、各個別の反復に対して要求
される５つの命令は、表１と同一のサイクル及び発行ス
ロットにおいてスケジュールが決定されるが、各命令の
フォーマットは、変化され、かつ単純化されている。

【００６８】再び図３を参照すると、静的にスケジュー
ルが決定されたプロセッサにおいて、図３の木のノード
が評価される順序は、コンパイラによって固定されてい
る。ゆえに、コンパイラは、プログラムの実行中に、値
が発生され、かつ消費される、正確な順序を認識してい
る。この知識を用いて、コンパイラは、現在の命令が発
行されたとき達したシーケンス番号に対するそれらのシ
ーケンス番号によって、以前に計算された複数の値に参
照記号をつけることができる。

【００６９】ソフトウェアでパイプライン処理されたル
ープスケジュールの実行中に発生された各値は、コンパ
イルする間にコンパイラによってシーケンス番号を割り
当てられる。例えば、発生された第１の値はシーケンス
番号０を有し、続いて発生された値は、増大する続きの
順序で番号を与えられる。ループスケジュールがソフト
ウェアでパイプライン処理されたとき、同時にループア
クティブのｋ回の反復が存在する。ここで、ｋは、スケ
ジューリングが実行された後の、ソフトウェアパイプラ
インのステージ数である。上記ｋ回の反復は、以前の反
復の後の各逐次的な反復を開始するＩＩのサイクルを用
いて、時間についてオーバーラップする方法で実行され
る。

【００７０】図７は、以前に記述された図４の表を再び
表すが、コンパイルする間に複数のシーケンス番号が複
数の値にどのように割り当てられるかを説明するため
に、ある複数の命令に対して括弧でくくられた数が付加
されている。

【００７１】図７におけるサイクル８において、第５の
反復（ｉ＝４）に係る第１のロード命令が発行される。
このロード命令は値発生命令であり、上記値発生命令
は、その反復に係る後に続く乗算命令Ｍによって必要と
される値ｄｘ（ｉ）を発生する。図７に図示されたよう
に、サイクル８の第１のロード命令Ｌ１によって発生さ
れた値に対して、コンパイラによって与えられるシーケ
ンス番号が０であることを仮定する。

【００７２】また、サイクル８において、第５の反復の
第１のロード命令Ｌ１と同時に、もう１つの値発生命令
が命令発行装置１０によって発行される。その、他の命
令とは、先行する（第４の）反復の乗算命令Ｍである。
同時に発行されたその値発生命令は発行スロット３から
発行され、上記発行スロット３は複数の発行スロットの
予め決められた順序（１→２→３）において発行スロッ
ト１の後に存在し、従って、コンパイラは、第１のロー
ド命令Ｌ１によって発生された値に割り当てられたシー
ケンス番号の後の次のシーケンス番号、すなわちシーケ
ンス番号１に、乗算命令によって発生された値を割り当
てる。

【００７３】従って、任意の与えられたサイクルにおい
て、２つ又はそれよりも多くの値発生命令が複数の異な
る発行スロットから発行されてもよいが、コンパイラ
は、それらの命令によって発生された複数の値に、複数
の異なるシーケンス番号を系統的に割り当てることがで
きる。同時に発行された複数の命令に係る複数の発行ス
ロットの予め決められた順序で複数のシーケンス番号を
割り当てることによって、上記割り当てを系統化（予測
可能化）する。

【００７４】サイクル９において、発行スロット１は、
もう１つの値発生命令、すなわち第４の反復の第２のロ
ード命令Ｌ２を発行する。従って、この命令によって発
生された値はシーケンス番号２を割り当てられる。同様
に、第３の反復の加算命令Ａはサイクル９において発行
スロット３から発行される。再び、この命令は値発生命
令であり、従って、上記命令によって発生された値は、
シーケンス番号を割り当てられなければならない。サイ
クル９において加算命令によって発生された値に割り当
てられるシーケンス番号は３であるが、それは、関連し
た加算命令に対する発行スロット（発行スロット３）
が、同時に発行された他の値発生命令（第４の反復のＬ
２）が発行された発行スロット（スロット１）に（複数
の発行スロットの予め決められた順序で）続くからであ
る。

【００７５】サイクル９においても発行される、第１の
反復に対する記憶命令は、値発生命令ではない。実際
に、それは値消費命令である。従って、記憶命令に関連
付けられたいかなる値に割り当てられるシーケンス番号
も存在しない。

【００７６】サイクル１０において、２つの値発生命
令、すなわち新しい反復（第６の反復）の第１のロード
命令Ｌ１と以前の（第５の）反復の乗算命令とが、命令
発行装置１０によって同時に発行される。Ｌ１はスロッ
ト１から発行されるので、それによって発生される値
は、次のシーケンス番号、すなわち４を割り当てられ
る。乗算命令はスロット３から発行され、その発生され
た値はシーケンス番号５を割り当てられる。

【００７７】実行時間における、プロセッサによる複数
の命令のシーケンスの実行中に、プロセッサは、複数の
レジスタを複数の発生された値に、それらの値を発生す
る複数の値発生命令の発行の順序に従って割り当て、そ
のため、図７におけるシーケンス番号０乃至５を有する
上記発生された値は、図８に図示されたレジスタに割り
当てられる。

【００７８】再び表２を参照して、次に、表２における
乗算命令の形式を説明する。この乗算命令は、“＠５”
として特定される第１のオペランドと、“ｒ３”として
特定される第２のオペランドとを有する。第２のオペラ
ンドは簡単であって、単純に、表１にあるようなレジス
タｒ３の内容を示している。このレジスタはループ不変
値ｄａを記憶する。第１のオペランドに対する参照記号
“＠５”は、第１のオペランドに対して要求された値
が、現在のシーケンス番号よりも小さいシーケンス番号
５を有する値であることを示している。図７のサイクル
１０の乗算命令が発行されるとき、割り当てられたシー
ケンス番号は５に達する。ゆえに、参照記号“＠５”か
ら、プロセッサは、それが、その割り当てられたシーケ
ンス番号が現在のシーケンス番号より小さい５である
値、すなわち、サイクル８において発行された第１のロ
ード命令Ｌ１によって発行された値を、第１のオペラン
ドとして用いなければならないことを実行時間において
認識している。また、それは、Ｌ１の結果を記憶するた
めに割り当てられたレジスタが、レジスタファイル２０
の名前の変更が可能な部分において最後に割り当てられ
たレジスタ、すなわち論理的なレジスタ識別子５を有す
るレジスタの前の５つのレジスタであるということを認
識している。

【００７９】従って、乗算命令Ｍのような値要求命令に
よって必要とされる各入力値は、その入力値に割り当て
られたシーケンス番号と、値要求命令が発行される時点
に達したシーケンス番号との間の差によって正確に特定
することができる。この差（例えば“＠５”）はシーケ
ンスオフセットと呼んでもよい。

【００８０】図９は、発生された複数の値に対するシー
ケンス番号割り当てとレジスタ割り当てと識別の機能を
実行する本発明の一実施形態に係る図１のプロセッサの
複数の構成要素をより詳細に図示する。

【００８１】図９において、レジスタファイル２０は合
計でＮ個のレジスタを有し、そのうち、より小さな番号
を付けられたＫ個のレジスタは、静的にアドレス指定さ
れた領域２０Ｓを形成し、より大きな番号を付けられた
Ｎ−Ｋ個のレジスタは、動的にアドレス指定された（名
前の変更が可能な）領域２０Ｒを形成する。この名前の
変更が可能な領域は、一般に、図５に関してすでに説明
された部分１２０Ｒと同様である。静的にアドレス指定
された領域２０Ｓの複数のレジスタは、複数のループ不
変値を記憶するために用いられ、そのとき、名前の変更
が可能な領域２０Ｒの複数のレジスタは、複数のループ
可変値を記憶するために用いられる。２つの領域の間の
境界はプログラム可能であってもよい。表２の例におい
て、レジスタｒ１乃至ｒ４は、静的にアドレス指定され
た領域２０Ｓに存在し、境界は、名前の変更が可能な領
域がｒ５（すなわちＫ＝５）において開始するようにプ
ログラムされる。

【００８２】値発生命令がいつ発行されるかを検出する
値発生命令検出装置３０が設けられる。値発生命令検出
装置３０は、都合のよいように、図１の命令発行装置１
０に含まれている。そのような命令の発行を検出する
と、値発生命令検出装置３０はＲＥＮＡＭＥ信号を発生
する。ＲＥＮＡＭＥ信号は、レジスタ名前変更装置３２
に適用される。レジスタ名前変更装置３２は、マッピン
グオフセット値ＯＦＦＳＥＴを記憶するマッピングオフ
セット記憶装置３４に接続される。ＲＥＮＡＭＥ信号に
応答して、レジスタ名前変更装置３２は、マッピングオ
フセット記憶装置３４に記憶されたマッピングオフセッ
ト値ＯＦＦＳＥＴを１だけデクリメントする。

【００８３】マッピングオフセット記憶装置３４に記憶
されたマッピングオフセット値ＯＦＦＳＥＴは、マッピ
ング装置３６に適用される。また、マッピング装置３６
は、論理的なレジスタ識別子（Ｒ）を受信し、物理的な
レジスタアドレス（Ｐ）を出力する。論理的なレジスタ
識別子（数）は、０乃至Ｎ−１の範囲の整数である。マ
ッピング装置３６は、複数の論理的なレジスタ識別子か
ら複数の物理的なレジスタアドレスへの全単射のマッピ
ングを実現する。各物理的なレジスタアドレスもまた０
乃至Ｎ−１の範囲の整数であり、実際のハードウェアの
複数のレジスタのうちの１つを直接に識別する。

【００８４】ある命令が論理的なレジスタ番号Ｒをその
複数のオペランドのうちの１つであると特定し、かつ、
Ｒが、その両端を含むものとして０乃至Ｋ−１の範囲に
存在するならば、物理的なレジスタ番号は、そのオペラ
ンドの論理的なレジスタ番号と同一である。しかしなが
ら、ＲがＫ乃至Ｎ−１の範囲に存在するならば、そのオ
ペランドの論理的なレジスタ番号は次式のようなＰによ
って与えられる。

【００８５】

【数２】Ｐ＝Ｋ＋｜Ｒ−Ｋ＋ＯＦＦＳＥＴ｜_Ｎ−Ｋ

【００８６】この表記において、｜ｙ｜_ｘは、ｘを法と
するｙ（y modulo x）を意味する。

【００８７】名前の変更が可能な複数のレジスタのうち
の１つに記憶装置を要求する値を発生する値発生命令が
発行されるとき、名前の変更が可能な領域２０Ｒにおけ
る次の空きレジスタは、発生される予定の値に自動的に
割り当てられる。そのレジスタは、単純に、論理的なレ
ジスタ番号０を有する、すなわち物理的なレジスタ番号

【数３】Ｋ＋｜ＯＦＦＳＥＴ−Ｋ｜_Ｎ−Ｋを有するレジスタである。命令を実行する実行装置は、
割り当てられたレジスタの物理的なレジスタ番号を通知
され、そのため、最終的に値が発生されるときに、それ
を、関連する物理的なレジスタの中に記憶することがで
きる。次いで、マッピングオフセット値ＯＦＦＳＥＴ
は、検出装置３０によって発行されたＲＥＮＡＭＥ信号
に従って、１だけデクリメントされる。

【００８８】名前の変更が可能な複数のレジスタのうち
の１つに記憶された値を要求する値要求命令が発行され
るとき、要求された値を記憶するレジスタは、最後に割
り当てられたレジスタに関連したそのシーケンスオフセ
ットを用いて、その命令において特定される。論理的な
レジスタ識別子Ｒを提供するために、このシーケンスオ
フセットを直接に用いることができる。ゆえに、上記シ
ーケンスオフセットはマッピング装置３０に適用され、
従って上記マッピング装置３０は、対応する物理的なレ
ジスタ番号Ｐを発生する。例えば、図８において、反復
ｉ＝４の乗算命令が発行されるときに最後に割り当てら
れたレジスタは、論理的なレジスタ識別子Ｒ＝０を有す
るレジスタである。この乗算命令は、発生された値ｄｘ
（４）が、論理的なレジスタ識別子Ｒ＝５を有するレジ
スタに保持されることを要求する。従って、シーケンス
オフセット“＠５”は、要求されたレジスタの論理的な
レジスタ識別子（５）を直接に提供する。

【００８９】ちなみに、発行された命令が、値発生命令
と値要求命令との双方でありうることが理解されよう。

【００９０】次に図１０を参照して、複数のハイレベル
プログラム命令のシーケンスを、図１のプロセッサによ
って実行されるべき複数のローレベル命令の対応するシ
ーケンスに変換することに用いるためのコンパイル方法
の複数の構成要素を、以下に説明する。プロセッサがソ
フトウェアでパイプライン処理される実行をサポートす
る場合において、コンパイル方法は、ソフトウェアパイ
プラインのスケジュールを発生するために、図２、図３
及び表１を参照して前に述べられた複数のステップを含
んでもよい。

【００９１】図１０における第１のステップＳ１におい
て、コンパイラは、対応するシーケンスのどのローレベ
ル命令が予め選択された値発生命令であり、対応するシ
ーケンスのどのローレベル命令が予め選択された値要求
命令であるかを決定する。例えば、図３における命令Ｉ
１乃至Ｉ４はすべて、予め選択された値発生命令であ
る。それに加えて、命令Ｉ２、Ｉ４及びＩ５はすべて、
以前に発行された複数の値発生命令に係る複数の発生さ
れた値を要求する、予め選択された値要求命令である。

【００９２】ステップＳ２において、コンパイラは、複
数の値発生命令に係る複数の発生された値に、それらの
命令の発行された順序で、複数のシーケンス番号を割り
当てる。割り当てられた複数のシーケンス番号は、以前
に図７を参照して説明された、ソフトウェアパイプライ
ンのループの場合におけるすべてのオーバーラップする
反復を反映しなければならない。

【００９３】次いでステップＳ３において、各値要求す
る命令は、関連した値要求命令によって要求された発生
された値に割り当てられたシーケンス番号に依存した、
上述されたシーケンスオフセットのような情報を用いて
符号化される。

【００９４】本発明の実施形態に係るコンパイル方法
は、コンピュータプログラムに従って動作する汎用コン
ピュータによって実装することができる。このコンピュ
ータプログラムは、記憶媒体（例えばフロッピー（登録
商標）ディスク又はＣＤ−ＲＯＭ）又は信号のような、
任意の適当な伝送媒体によって伝送してもよい。そのよ
うな伝送信号は、インターネットのような通信ネットワ
ークを介してダウンロードされる信号であることができ
る。添付されたコンピュータプログラムに係る請求項
は、それ自身がコンピュータプログラムであるように、
又は上述の形式のうちの任意のコンピュータプログラム
を包含するように解釈されるものとする。

【００９５】各入力値に対するシーケンスオフセットを
計算することにおけるコンパイラのタスクは、与えられ
た値要求命令に対して、シーケンスオフセットが、関連
した入力値に割り当てられたシーケンス番号と、命令が
発行されたとき達した割り当てられたシーケンス番号と
の間の単純な差であるというように、単純である。この
ことは、コンパイラのタスクを、レジスタファイルの回
転する（名前の変更が可能な）部分におけるレジスタ割
り当てに関して、さらにより単純かつ短時間で実行でき
るものにする。

【００９６】それに加えて、表２における各命令は、特
定されることを必要とするあて先レジスタが存在しない
ので、表１におけるその対応する命令よりも短い。この
ことは、符号をよりコンパクトにし、実行をより高速に
することができる。

【００９７】本発明に係るもう１つの実施形態は、２つ
又はそれよりも多くのレジスタ名前変更モードを有する
プロセッサを提供することができる。例えば、図１１に
図示されたように、プロセッサは、現在選択されたレジ
スタの名前変更モードをユーザ登録するために用いられ
る、第１及び第２のモードビットＭ１及びＭ２を有する
モードレジスタを備えてもよい。モードレジスタ４０
は、例えば、図９におけるレジスタ名前変更装置３２に
設けられてもよい。第１のモードビットＭ１は、レジス
タの名前の変更がイネーブルされたか、又はディスエー
ブルされたかを制御するために用いられる。第２のモー
ドビットＭ２は、第１のモードビットＭ１がレジスタの
名前の変更がイネーブルされていることを示していると
きのみ、有効である。この場合、第２のモードビットＭ
２は、２つの利用可能なレジスタの名前変更モードのう
ちのどちらを用いるものとするかを制御するために用い
られる。これら２つのの利用可能なモードのうちの１つ
は、表２と図７乃至図９を参照して記述された、値発生
命令が発行される毎に複数のレジスタが名前を変更され
るモードである。他の利用可能なレジスタの名前変更モ
ードは、他の任意の適当なレジスタの名前変更モードで
あってもよい。例えば、他の利用可能なモードは、図
５、図６（Ａ）及び図６（Ｂ）を参照して記述された、
以前に考察されたモードであってもよく、上記モードに
おいて、ソフトウェアパイプラインの境界が交差される
毎に、すなわち全てのＩＩプロセッササイクルで、複数
のレジスタは名前を変更される。ここで、ＩＩは、上述
のループ開始インターバルである。

【００９８】もちろん、レジスタの名前の変更をディス
エーブルする能力を提供することを全く望まないとき
は、第１のモードビットＭ１を省略することができる。
同様に、値発生命令の発行に基づいて、単純にレジスタ
の名前の変更をイネーブルするかディスエーブルするか
を望むときは、第２のモードビットＭ２を省略してもよ
い。

【００９９】上記の、又はそれぞれのモードビットは、
実行時間において、例えばプログラムの制御の元で、動
的に変化してもよい。

【０１００】次に、表２及び図７乃至図９を参照して記
述された基本的なレジスタの名前を変更する技術に係る
オプションの拡張を、図１２及び図１３を参照して以下
に説明する。このオプションの拡張は、ループ本体が１
回又はそれより多くの回数だけ実行される通常の場合と
比較して、ソフトウェアでパイプライン処理されたルー
プ本体が全く実行されない特別な場合に発生することが
ある、可能なレジスタ位置の不整合を克服することを意
図している。ソフトウェアパイプラインのループ本体が
全く実行されないというこの特別な場合は、例えば、ル
ープ命令が、ループが反復すると設定し、それと同時
に、ループ制御変数が開始値から終了値へと増大するよ
うに変化されるが、終了値はそれ自身が、実行中にルー
プ命令が発生したときに開始値よりも小さい変数である
というときに、発生することがある。この特別な場合
は、結果的に、以下に説明されるように、ループ本体が
１回又はそれよりも多くの回数だけ実行されるときに、
後に続くものと不整合である複数のレジスタ位置をもた
らす。

【０１０１】ｖ個の値発生命令とｐ個のソフトウェアパ
イプラインのステージを有するソフトウェアでパイプラ
イン処理されたループスケジュールについて考察する。
例えば、表２のスケジュールにおいて、ｖ＝４であり、
ｐ＝５である。ループがｎ回反復するとき、レジスタフ
ァイルは、ループの実行中に、ｖ（ｎ＋ｐ−１）回だけ
回転される。コンパイラは、ループの内側で発生され、
続いてループの外側で使用される複数の値の、レジスタ
ファイルにおける位置を予測するためにこの情報を用い
る。通常は、ループの最後の反復において発生された複
数の値が、続いて、ループの外側において要求される。
最後の反復において発生されたそのような各値は、実際
に、ループ反復の計数値ｎと独立な位置であり、かつ、
ループ反復の計数値ｎが０よりも大きいならばループか
らの出口について不変な位置を有する。ループの最後の
反復は、ループのスケジュールがｐ回だけ発行されるこ
とを要求する。ゆえに、最後の反復の開始と、ループか
らの最後の出口との間に、ループのｐｖ回の回転が存在
する。任意の値が、ループへのエントリの時点で有効で
あり、かつ、ループからの出口の時点で有効であると
き、少なくともｐｖ個の回転するレジスタが存在しなけ
ればならない。

【０１０２】以前の反復においてそれ自身の関数として
計算された、ループの１つの反復において発生された任
意の値は、回帰（recurrence）と呼ばれる。そのような
複数の回帰は、ループエントリに先行して初期化され、
次いで、ループが完了された後に用いられる。図１２に
ループの１つの実施例が図示されている。この実施例に
おいて、スカラー変数ｓは、ループへのエントリに先行
して初期化され（ライン１）、ループ本体の中に回帰を
有し（ライン４）、また、ループが完了された後に使用
される（ライン７）。ゆえに、その存続時間はループ全
体に広がっている。

【０１０３】前述されたように、各反復において、ライ
ン４におけるコードが、論理的なレジスタ番号Ｓ_Ｒから
以前の反復において発生されたｓの値を読み出し、論理
的なレジスタ番号Ｓ_Ｗに現在の反復において発生された
新しい値ｓを書き込むように、コンパイラは配置する。
これらのレジスタ番号は、レジスタファイルをｖ回だけ
回転させた後に、以前の反復においてレジスタ番号Ｓ_Ｗ
に書き込まれた値が、いまでは、現在の反復においてレ
ジスタ番号Ｓ_Ｒにおいて利用可能であるように、選択さ
れる。

【０１０４】図１２のライン１で定義されているｓの初
期値は、適当なレジスタＳ_１に書き込まれなければなら
ず、Ｓ_１は次のように選択されなければならない。すな
わち、第１の反復がライン４でＳ_Ｒから読み出すとき、
ライン１でＳ_１に書き込まれた値は、今やレジスタＳ_Ｒ
においてアクセス可能であるように回転された。第１の
反復におけるライン１とライン４の間の正確な回転数
は、ライン４が発生するソフトウェアパイプラインのス
テージと、ループスケジュール内でｓを用いる命令の位
置とに依存する。Ｓ_１における値をＳ_Ｒに動かすために
要求される回転数をｑとする。

【０１０５】論理的なレジスタ番号Ｓ_Ｗへのｓの最後の
書き込みは、ループの最後の反復のライン４で発生す
る。この最後に書き込まれた値は、ライン７においてル
ープから出た後で、論理的なレジスタ番号Ｓ_Ｅから読み
出される。Ｓ_Ｗにおける値をＳ _Ｅに動かすために要求さ
れる回転数をｔとする。

【０１０６】これらのレジスタＳ_１，Ｓ_Ｗ，Ｓ_Ｒ及びＳ
_Ｅの間の関係は、図１３において概略的に図示されてい
る。図１３において、円周は、レジスタファイルの回転
する領域を表す。回転する領域（すなわち図１３の円
周）のサイズはｐｖ個のレジスタであると仮定されて、
上記のサイズは、少なくとも１つの、ループからの出口
の時点でも有効な、ループへのエントリの時点で有効で
ある値が存在するときに必要とされるレジスタ数であ
る。回転する領域における個別のレジスタは、円周の周
囲に等しい間隔を互いに有して分離されている。

【０１０７】（ライン４における）ｓの読み出しは、ソ
フトウェアパイプラインのステージｋにおいて発生する
と仮定されている。ここで、次式が成立する。

【０１０８】

【数４】０≦ｋ≦ｐ−１

【０１０９】また、（ライン４における）ｓの読み出し
は、スケジュールの時間中にｗ回の回転が発生したとき
に発生すると仮定されている。ここで、次式が成立す
る。

【０１１０】

【数５】０≦ｗ≦ｖ−１

【０１１１】ゆえに、次式が成り立つ。

【０１１２】

【数６】ｑ＝ｋｖ＋ｗ

【数７】ｔ＝ｖ（ｐ−ｋ−１）＋ｖ−ｗ

【０１１３】このことから、ライン１におけるｓの初期
の定義から、ｓを用いる出口の後の（post-exit）値要
求命令がそれを発見することを期待できる位置への回転
数は、ｑ＋ｔ−ｖによって与えられ、それは単純にｖ
（ｐ−１）である。

【０１１４】従って、ループが実行される前にｓが書き
込まれた、初期の論理的なレジスタＳ_１を与えられたと
すれば、コンパイラは、ループが完了された後で、最後
に書き込まれたｓの値が、論理的なレジスタ番号Ｓ_１＋
ｖ（ｐ−１）において発見されたことを認識している。
しかしながら、このことは、図１２のライン２のループ
制御変数Ｎが実行時間に０又は負であると発見されると
きに発生することがある、ループの本体が全く実行され
ない特別な場合には適用されない。この特別な場合に
は、ライン７で必要とされるｓの値は、他の全ての場合
におけるようにレジスタＳ_１＋ｖ（ｐ−１）において発
見されるよりは、むしろ単純にＳ_１において発見され
る。実行時間にＮが０又は負である可能性に対処するた
めに、コンパイラが複数の特別な命令を用いてコンパイ
ルされたコードを補う必要があるので、この不整合は不
便である。コンパイラがこの種の特別な尺度を取らなけ
ればならないことを除去することが望まれる。

【０１１５】従って、上述されたレジスタの名前を変更
する方法の拡張において、実行時間にループ反復計数値
が０であると発見され、ゆえにループ本体が全く実行さ
れないときに、プロセッサがループの終了を経過し、か
つ実行の継続を行う前に、レジスタファイルはｖ（ｐ−
１）回だけ回転されるように、プロセッサは配置され
る。これは、ループから出た後の第１の命令の発行の前
に、ｖ（ｐ−１）個のシーケンス番号をスキップするこ
との効果を有する。これは、都合のよいことには、命令
を実際に実行することなく、ループスケジュールの命令
をｐ−１回だけ発行することによって達成できる。各値
発生命令の発行の動作はレジスタファイルを回転し、従
って、ループスケジュールの完了の各発行はレジスタフ
ァイルをｖ回だけ回転する。この方法で、ループ反復計
数値がゼロであるとき、ｓの初期値は所望されるよう
に、論理的なレジスタＳ_１＋ｖ（ｐ−１）において利用
可能にされる。

【０１１６】ｐ−１回の命令の発行は、ソフトウェアで
パイプライン処理されたループのシャットダウンモード
にまっすぐに進ませることと、複数の命令のうちの任意
の命令が実行されることを防止するために、付加的な
（大域的な）叙述を誤りに設定することとによって達成
することができる。

【０１１７】上述の拡張は、プロセッサに、ループ反復
計数値がゼロである場合に、実行時間に特別な動作を実
行しなければならないようにさせる。しかしながら、こ
のことは通常はありそうにない出現（occurrence）であ
るので、典型的な実行時間ペナルティは小さい。

【０１１８】また、拡張は、他のレジスタの名前を変更
する技術、例えば図５、図６（Ａ）及び図６（Ｂ）を参
照して記述された、以前に考察された技術が用いられて
いるときも適用可能である。この場合、プロセッサはゼ
ロ反復計数値の事象において、複数のレジスタをｐ−１
個のレジスタだけ回転させるように配置される。

【０１１９】従って、本発明のもう１つの態様は、（値
発生命令の発行ごとの代わりに）ソフトウェアパイプラ
インの境界が交差される毎に、名前の変更が可能な複数
のレジスタの名前を変更するプロセッサであり、かつ、
ゼロ反復計数値の事象において、１つ又はそれより多く
の名前の変更が可能なレジスタをスキップするプロセッ
サを提供できる。そのようなプロセッサにおいて、スキ
ップされたレジスタの数は、値発生命令の数と独立であ
り、ソフトウェアパイプラインのステージ数に依存す
る。好ましくは、スキップされたレジスタの数はｐ−１
である。

【０１２０】ちなみに、正確に計算されるべきシーケン
スオフセットに対して、叙述された実行のためにオフさ
れる複数の命令は、複数の値の番号付けに未だ先行して
いなければならないことが理解されよう。しかしなが
ら、これは、決して、ループ内の複数の中間の値を記憶
するために必要とされるレジスタの数を増大させない。

【０１２１】上記の技術は、複数の回帰値（任意の以前
の反復においてそれ自身の関数として計算された任意の
ループ可変値）がループの外側で正しい順序で初期化さ
れたならば、ソフトウェアのパイプライン処理と関連し
て正しく動作する。

【０１２２】各値要求命令に含まれた情報は、シーケン
スオフセットである必要がない。要求された値を保持す
るレジスタの識別を、現在達したシーケンス番号とは異
なるその割り当てられたシーケンス番号を直接に用い
て、又はいくつかの基準点に関して用いて、特定するこ
とができる。同様に、レジスタ割り当てをより柔軟にす
るために、値要求命令において、割り当てられたシーケ
ンス番号に依存した情報を特定することができる。例え
ば、発生された値を記憶するために０とは異なる論理的
なレジスタ番号を示すために、シーケンスオフセット
（例えば“＠−２”）を特定することができる。また、
割り当てられたシーケンス番号に基づいて、あて先レジ
スタを明示的に特定することができる。

【０１２３】発生された複数の値に割り当て可能な複数
のシーケンス番号は、例えば２５５の限界値を有し、そ
のため、上記限界値に達した後でシーケンスは再び０か
ら開始することが理解されよう。

【０１２４】以上の記述は、実施例として、ソフトウェ
アパイプラインの実行が可能なＶＬＩＷプロセッサに関
連するが、本発明はこれらの特徴を有さないプロセッサ
に対しても適用可能であることが理解されよう。本発明
の実施形態に係るプロセッサは、マルチメディアアプリ
ケーション、ネットワークルータ、動画の携帯電話機、
インテリジェント自動車、ディジタルテレビジョン、音
声認識、３Ｄゲームなどにおいて用いるための、高度に
集積化された「システム・オン・ア・チップ」（ＳＯ
Ｃ）におけるプロセッサ「コア」として含んでもよい。

【図面の簡単な説明】

【図１】本発明を実施形態に係るプロセッサの構成要
素を示す図である。

【図２】コンパイル処理において用いられる、シンボ
ル的なデータフローグラフを示す概略図である。

【図３】上記コンパイル処理において用いられる、図
２のグラフの木構造で表された内部表現を示す概略図で
ある。

【図４】プロセッサにより複数の命令をソフトウェア
でパイプライン処理された実行の説明に用いるための表
である。

【図５】以前に考察されたプロセッサに含まれるレジ
スタファイルの一部を表現する概略図である。

【図６（Ａ）】図５における以前に考察されたプロセ
ッサに対し、コンパイル処理において複数のレジスタが
どのように指定されるかを説明することに用いるための
表である。

【図６（Ｂ）】図５における以前に考察されたプロセ
ッサに対し、コンパイル処理において複数のレジスタが
どのように指定されるかを説明することに用いるための
表である。

【図７】本発明の実施形態に係るプロセッサにより複
数の命令をソフトウェアでパイプライン処理された実行
の説明に用いるための表である。

【図８】図７の実行において複数のレジスタがどのよ
うに割り当てられるかを説明する概略図である。

【図９】本発明の一実施形態に係る図１のプロセッサ
の構成要素を示す図である。

【図１０】本発明の実施形態に係るコンパイル処理の
説明に用いるためのフローチャートである。

【図１１】本発明のもう１つの実施形態に係るプロセ
ッサにおけるモードレジスタの構成要素を示す図であ
る。

【図１２】ループを含むハイレベル命令の一実施例を
示す図である。

【図１３】図１２のループを実行することに用いられ
る複数のレジスタを表す概略図である。

【符号の説明】

１…プロセッサ、１０…命令発行装置、１２…スケジュール記憶装置、１４，１６，１８…実行装置、２０…レジスタファイル、２０Ｒ，２４Ｓ…レジスタファイルの領域、２２，２４…バス、２６…外部メモリ、３０…値発生命令検出装置、３２…レジスタ名前変更装置、３４…マッピングオフセット記憶装置、３６…マッピング装置、４０…モードレジスタ、ＩＳ１，ＩＳ２，ＩＳ３…命令発行スロット、Ｍ１，Ｍ２…モードビット。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 9/44 ３２２Ｇ

Claims

【特許請求の範囲】

【請求項１】実行されるべき複数の命令を予め決めら
れたシーケンスで発行する命令発行手段を含み、複数の
命令にてなる上記シーケンスは、実行されるときに各値
を発生する、予め選択された複数の値発生命令を含み、上記発行された複数の命令を実行する命令実行手段と、複数のレジスタを有し、上記実行された複数の命令によ
って発行された複数の値を記憶するレジスタ手段と、上記複数の値発生命令によって発生された上記複数の値
を、それらの各値発生命令の発行の順序に従って、各シ
ーケンス番号に割り当てるシーケンス番号割り当て手段
と、上記発生された各値を、その値に割り当てられたシーケ
ンス番号に依存して、その発生された値を記憶するため
の上記複数のレジスタのうちの１つに割り当てるレジス
タ割り当て手段とを含むプロセッサ。
【請求項２】上記レジスタ割り当て手段は、上記発生
された各値を、実行されるときにその値を発生する上記
値発生命令に含まれた情報と独立に、その上記レジスタ
に割り当てるように動作可能である請求項１記載のプロ
セッサ。
【請求項３】上記複数の命令のシーケンスは、実行さ
れたときに、上記複数の値発生命令のうちの以前に発行
された１つに係る上記発生された値を要求する、少なく
とも１つの予め選択された値要求命令をさらに含み、上
記プロセッサは、そのような値要求命令の実行中に、上
記以前に発行された命令に係る上記発生された値に割り
当てられた上記シーケンス番号に依存し、上記値要求命
令に含まれた情報を用い、その値を記憶するように割り
当てられた上記レジスタを識別するように動作可能であ
る割り当てられたレジスタ識別手段をさらに含む請求項
１又は２記載のプロセッサ。
【請求項４】上記情報は、上記予め決められたシーケ
ンスでの上記値要求命令の発行の時点における最後に割
り当てられたシーケンス番号と、上記以前に発行された
命令に係る上記発生された値に割り当てられた上記シー
ケンス番号との間の差を表すシーケンスオフセットであ
る請求項３記載のプロセッサ。
【請求項５】上記レジスタ手段は、上記発生された複数の値を記憶するように割り当て可能
な複数の物理的なレジスタのセットと、上記命令実行手段によって特定される論理的なレジスタ
識別子を、上記セットのうちの対応する各物理的なレジ
スタにマッピングするマッピング手段と、上記プロセッサの動作中に、上記複数の論理的なレジス
タ識別子と上記対応する複数の物理的なレジスタとの間
の上記マッピングを動的に変化させるレジスタ名前変更
手段とを含む先行する任意の請求項記載のプロセッサ。
【請求項６】上記レジスタ割り当て手段は、上記各値
発生命令に係る上記発生された値を、その値発生命令の
発行の時点で適用可能な上記マッピングにおいて、予め
決められた論理的なレジスタ識別子を有する上記複数の
物理的なレジスタのうちの１つに割り当てるように動作
可能である請求項５記載のプロセッサ。
【請求項７】上記レジスタ名前変更手段は、そのよう
な値発生命令が発行される毎に、上記マッピングを変化
させるように動作可能である請求項５又は６記載のプロ
セッサ。
【請求項８】上記レジスタ名前変更手段は、そのよう
な値発生命令が発行されるときに上記マッピングが変化
されないディスエーブルドモードと、そのような値発生
命令が発行される毎に上記マッピングが変化されるイネ
ーブルドモードとの間で選択的に切り換え可能である請
求項７記載のプロセッサ。
【請求項９】上記レジスタ名前変更手段は、そのよう
な名前発生命令が発行される毎に上記マッピングが変化
される第１の名前変更モードと、上記第１の名前変更モ
ードとは異なる第２の名前変更モードとの間で選択的に
切り換え可能である請求項７又は８記載のプロセッサ。
【請求項１０】上記第２の名前変更モードにおいて、
ソフトウェアでパイプライン処理されるループの実行中
にソフトウェアのパイプライン処理の境界が交差される
毎に、上記マッピングは変化される請求項９記載のプロ
セッサ。
【請求項１１】上記レジスタ名前変更手段が上記複数
のモードのうちのいずれを有するかを特定するように、
１つ又はそれよりも多くのモードビットを有するモード
レジスタをさらに備えた請求項８乃至１０のうちの１つ
に記載のプロセッサ。
【請求項１２】上記セットのうちの上記複数の物理的
なレジスタは、レジスタファイルの名前の変更が可能な
領域において、連続的なアドレスで１つずつ隣接して配
置され、上記マッピング手段は、特定された論理的なレジスタ識
別子を、マッピングオフセットを用いて、その対応する
物理的なレジスタにマッピングするように動作可能であ
り、上記マッピングオフセットは、上記特定された論理
的なレジスタ識別子と、上記名前の変更が可能な領域に
おける、上記対応する物理的なレジスタの上記アドレス
との間の変化する差を表す請求項５乃至１１のうちの１
つに記載のプロセッサ。
【請求項１３】上記レジスタ名前変更手段は、上記マ
ッピングオフセットをインクリメント又はデクリメント
することによって、上記マッピングを変化するように動
作可能である請求項１２記載のプロセッサ。
【請求項１４】上記論理的なレジスタ識別子は上記シ
ーケンスオフセットによって直接に提供される請求項４
に従属されるとして解釈されたときの請求項１２又は１
３記載のプロセッサ。
【請求項１５】上記命令発行手段は、複数の命令発行
スロットを有し、上記複数の命令発行スロットのうちの
各異なる１つずつにおいて複数の命令を同時に発行する
ように動作可能であり、上記命令実行手段は、上記複数の命令発行スロットにそ
れぞれ対応し、その上記対応する命令発行点において発
行された上記複数の命令を実行するようにそれぞれ動作
可能である複数の命令実行装置を有する先行する任意の
請求項記載のプロセッサ。
【請求項１６】上記シーケンス番号割り当て手段は、
２つ又はそれよりも多くの値発生命令が各異なる命令発
行スロットにおいて同時に発行されたとき、そのような
各異なる複数のシーケンス番号を、それらの命令が発行
される上記各命令発行スロットに割り当てられた、予め
決められた発行スロットの順序に従って、それらの２つ
又はそれよりも多くの値発生命令に係る上記発生された
複数の値に割り当てるように動作可能である請求項１５
記載のプロセッサ。
【請求項１７】上記プロセッサはソフトウェアでパイ
プライン処理された方法において上記シーケンスの複数
の命令を実行するように動作可能であり、上記予め選択
された複数の値発生命令は、実行されたときに複数のル
ープ可変値を発生する複数の命令を含む先行する任意の
請求項記載のプロセッサ。
【請求項１８】複数の反復のゼロ番号を要求する上記
複数の命令の実行中にソフトウェアでパイプライン処理
されたループが発見された事象において、上記シーケン
ス番号割り当て手段に、上記第１の命令の発行前に１つ
又はそれよりも多くの上記シーケンス番号をループに従
ってスキップさせるように動作可能であるループ取り扱
い手段をさらに備えた先行する任意の請求項記載のプロ
セッサ。
【請求項１９】上記スキップされたシーケンス番号の
数は、上記ループの反復毎に発行された上記複数の値発
生命令の数と、上記ループにおいてソフトウェアでパイ
プライン処理されたステージ数とに依存する請求項１８
記載のプロセッサ。
【請求項２０】上記ループ取り扱い手段は、上記事象
において、上記ループにおいてソフトウェアでパイプラ
イン処理するステージ数に依存して、上記ループに係る
複数の命令を複数回だけ発行させると同時に、上記命令
実行手段がそれらの命令を実行することを禁止するよう
に動作可能であり、それによって、上記ループ内の上記
値発生命令は上記複数回だけ発行される請求項１８又は
１９記載のプロセッサ。
【請求項２１】複数のハイレベルプログラム命令のシ
ーケンスを、プロセッサによって実行されるべき対応す
る複数のローレベル命令のシーケンスに変換するための
コンパイル方法であって、上記対応するシーケンスに係るどの上記複数のローレベ
ル命令が予め選択された複数の値発生命令であり、どれ
が予め選択された複数の値要求命令であるかを決定する
ステップを含み、上記各値発生命令は、実行されるとき
に、値を発生する命令であり、上記各値要求命令は、実
行されるときに、以前に発行された値発生命令によって
発生された上記値を要求する命令であり、それらの各値発生命令が実行中に発行される順序に従っ
て、上記発生された複数の値を各シーケンス番号に割り
当てるステップと、実行中の上記プロセッサによる使用のために上記各値要
求命令を情報を用いて符号化して、その命令によって要
求された上記発生された値を識別するステップとを含
み、その情報は、その発生された値に割り当てられた上
記シーケンス番号に依存する方法。
【請求項２２】上記符号化するステップにおいて、上
記情報は、上記対応するシーケンスにおける上記値要求
命令が発行される時点において、最新の上記発生された
値に割り当てられた上記シーケンス番号と、その命令に
よって要求された上記発生された値に割り当てられた上
記シーケンス番号との間の差を表すシーケンスオフセッ
トである請求項２１記載の方法。
【請求項２３】上記符号化するステップにおいて、上
記各値発生命令は、上記発生された値をどこに記憶する
かを識別するように、プロセッサによる使用のためのい
かなる情報も用いずに符号化された請求項２１又は２２
記載の方法。
【請求項２４】上記複数のハイレベルプログラム命令
のシーケンスはループ構造を含み、上記ループ構造を分析し、上記ループ構造に係る上記複
数のハイレベルプログラム命令を、ソフトウェアのパイ
プライン処理に従ってプロセッサによって反復的に実行
されるべき上記複数のローレベル命令のスケジュールに
変換するステップと、上記スケジュールにおける上記複数の命令のうちの１つ
が、その上記発生された値がループ可変値であるような
値発生命令であるとき、その命令に係る上記発生された
値を、異なる複数の反復における異なる複数のシーケン
ス番号に割り当てるステップとをさらに含む請求項２１
乃至２３のうちの１つに記載の方法。
【請求項２５】コンピュータ上で動作するときに、上
記コンピュータに対して、複数のハイレベルプログラム
命令のシーケンスを、プロセッサによって実行されるべ
き対応する複数のローレベル命令のシーケンスに変換す
るコンパイル方法を実行させるコンピュータプログラム
を伝送する記録媒体であって、上記コンピュータプログラムは、上記対応するシーケンスに係るどの上記複数のローレベ
ル命令が予め選択された複数の値発生命令であり、どれ
が予め選択された複数の値要求命令であるかを決定する
決定部を含み、上記各値発生命令は、実行されるとき
に、値を発生する命令であり、上記各値ハイ要求命令
は、実行されるときに、以前に発行された値発生命令に
よって発生された上記値を要求する命令であり、それらの各値発生命令が実行中に発行される順序に従っ
て、上記発生された複数の値を各シーケンス番号に割り
当てる割り当て部と、上記プロセッサによる使用のために各値要求命令を情報
を用いて符号化して、その命令によって要求された上記
発生された値を識別する符号化部とを含み、その情報
は、その発生された値に割り当てられた上記シーケンス
番号に依存する記録媒体。