JP3529888B2

JP3529888B2 - レジスタ割当て方法及びレジスタファイルポートアクセス装置

Info

Publication number: JP3529888B2
Application number: JP10805695A
Authority: JP
Inventors: フレドリック・シー・アマーソン; ロバート・エム・イングリッシュ; ラジブ・グプタ; 坦渡邊
Original assignee: Hitachi Ltd; Hewlett Packard Co
Current assignee: Hitachi Ltd; HP Inc
Priority date: 1994-04-06
Filing date: 1995-04-06
Publication date: 2004-05-24
Anticipated expiration: 2019-05-24
Also published as: US5564031A; EP0676691A3; EP0676691A2; JPH07281897A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は一般にディジタルコンピ
ュータに関し、特にディジタルコンピュータのレジスタ
の管理に関する。

【０００２】

【従来技術及びその問題点】ノイマン型ディジタルコン
ピュータは操作中に種々の値を保持するためのレジスタ
セットを備えている。レジスタセットの大きさは可変で
ある。全てのノイマン型装置は少なくともプログラムカ
ウンタ（ＰＣ）を備えている。一般に、オペランド及び
結果を保持するためのレジスタ（“演算レジスタ”）も
備えている。ＲＩＳＣ（縮小命令セットコンピュータ）
マシンは、一般に、メモリへの書込み・メモリからの読
出しを行うがデータに対する操作は行わないロード（Ｌ
ＯＡＤ）及びストア（ＳＴＯＲＥ）命令以外では、レジ
スタからレジスタへの命令（メモリに直接アクセスする
命令から区別される）しか持っていない。ＲＩＳＣマシ
ンは大きなレジスタセットを持つ傾向があり、例えば３
２個またはもっと多くにも達する。レジスタは、中間結
果、アドレスインデックス及びサブルーチンのような呼
び出し元と呼び出し先のプロシージャ間の引渡データ
（パラメータ）を保持するために使用される。幾つかの
プロセッサは汎用レジスタに加えて浮動小数点レジスタ
を備えている。ＣＩＳＣアーキテクチャは、通常、評価
スタックを備えており、評価スタックはオペランドが明
示的には示されない０アドレス演算を提供する。ＲＩＳ
Ｃは、通常、評価スタックを備えていない。コンパイラ
は、ＲＩＳＣアーキテクチャにおいては、演算のためで
はなく、通常はパラメータ引渡及びレジスタ内容の追出
し(register spills)のために、スタックをメモリ内に
保持する。殆どのアーキテクチャにおいて、プロシージ
ャ呼び出しに当たってのレジスタのセーブと復元のオー
バーヘッドは負担になる。このオーバーヘッドはメイン
メモリ参照の５％から４０％を占める。このオーバーヘ
ッドを減らすために、いくつかのバンクを設け、新たな
バンクを各呼び出されたプロシージャに割り当てること
が知られている。この技術はレジスタウインドウと称さ
れる。J.Hennessy,D. Patterson著のComputer Architec
ture -- a Quantitative Approach(1990) Section 8.
7、を参照のこと。レジスタウインドウを使用すること
により、これらのレジスタバンクつまり“ウインドウ”
を、パラメータを引き渡すための共通エリアを提供する
ためにオーバーラップさせる。レジスタはプロシージャ
呼出しに当たって変化しないグローバル(global)レジス
タと、プロシージャ呼出しに当たって変化するローカル
レジスタに分けられる。バッファが一杯になった後に、
プロシージャ呼び出しが行われたとき（ウインドウオー
バフロー）、またはバッファが空になった後にプロシー
ジャからの復帰が起こったとき（ウインドウアンダーフ
ロー）、レジスタのブロックはメモリにセーブされる。

【０００３】レジスタウインドウは、現在、サンマイク
ロシステムのＳＰＡＲＣ（登録商標）アーキテクチャで
実現されており、更にレジスタウインドウをリング構成
で操作することを開示している米国特許第5,159,680号
で説明されている。米国特許第5,233,691号は、バス競合
を起こさない時間にメモリにレジスタを予め書き込むこ
とにより、オーバーフローによる書き込みを行う必要性
を減らすレジスタウインドウシステムを開示している。
オーバーラッピングウインドウを実現する高性能レジス
タファイルは米国特許第5,226,142号及び米国特許第5,2
26,128号に開示されており、米国特許第5,083,267号及び
米国特許第5,036,454号はループのために循環レジスタ
を使用することを開示している。

【０００４】レジスタウインドウのような従来技術のア
ーキテクチャが有する１つの問題は、レジスタのバンク
（すなわちレジスタウインドウ）のサイズが固定されて
いることである。このサイズはプロシージャ毎に変化さ
せることができない。その結果、プロシージャに割り当
てられたローカルレジスタエリア内の全てのレジスタが
実際にそのプロシージャにより使用されるわけではな
く、逆に、多くの場合、プロシージャにそのプロシージ
ャが必要とする十分なレジスタが割り当てられているわ
けではない。これにより、メモリ参照が最適化されない
ために、パフォーマンスの低下が引き起こされる。

【０００５】レジスタウインドウの他の制限は、オーバ
ーラップレジスタの個数もまた固定されていることであ
る。この場合にも、その個数は実際に呼び出されるプロ
シージャが必要とするパラメータの数を充分に上回るこ
とがあり、一方ではレジスタの使用密度が減る。その
上、この固定されたオーバーラップにより、単一のプロ
シージャ呼び出しに関して引渡されるパラメータの個数
が勝手に限定される。

【０００６】循環レジスタ(rotating register)空間
は、あるデータを使用する操作が呼び出される何サイク
ルか前にそのデータの準備を開始しそのデータが必要に
なったときにはそれが使用可能になっているようにする
ために、ソフトウエアのパイプライン化されたループに
よって使用される。ソフトウエアのパイプライン化され
たループ内で必要とされるレジスタの個数は、ループの
特性により変わる。もし、従来技術のように循環レジス
タ空間のサイズが固定されているなら、大多数のループ
を扱うために例えば６４個のレジスタのような広大な空
間を割り当てなければならない。しかし、１６個または
それ以下のレジスタしか必要としない多くの小ループが
あり、また６４個よりも多くのレジスタを必要とする多
くの大ループがある。小ループの場合には、多くのレジ
スタが不必要に割り当てられまた開放され、大ループの
場合には、レジスタの不足により処理速度が低下する。

【０００７】上記事情に鑑み、従来技術のレジスタウイ
ンドウのグループサイズが固定されているという枠組み
に制約されない、レジスタの効率的な割り当て及び割り
当て解除方法を提供することが必要とされる。

【０００８】

【目的】上記背景に鑑み、本発明の目的は、コンピュー
タにおいて呼び出し及び復帰操作の平均速度を向上させ
ることにある。他の目的は、プロセッサの処理において
レジスタセーブ及び復元の回数を最小限にすることにあ
る。他の目的は、呼び出されたプロシージャにより必要
とされる一時的なローカル記憶装置を効果的に割り当て
ることにある。更に本発明の目的は、ルーチンの呼び出
し元、あるいは呼出し先が使用する記憶装置にかかわり
なく十分なレジスタ記憶装置を割り当てることにある。
更に他の目的は、現在使われていないレジスタについて
はセーブや復元を行わないことによって、効率を向上す
ることにある。他の目的は、プロセッサ内で使用可能な
限定された個数のレジスタを割り当て及びセーブするこ
とに関連するオーバーヘッドをへらすことにある。更に
他の目的は、プロシージャが必要とするならばレジスタ
の全範囲をそのプロシージャにより利用できるようにす
ることまで含む、呼び出されたプロシージャの要求を満
たすために、レジスタセットを動的に分割することにあ
る。他の目的は、ソフトウエアのパイプラン化されたル
ープのためにプロシージャが必要とするのと丁度同じ個
数の循環レジスタをそのプロシージャに割り当てること
にある。他の目的は、レジスタの使用密度を増加させる
ことにある。更に他の目的は、コンパイラの介入なしに
レジスタのセーブ及び復元を行うことにある。

【０００９】

【概要】本発明の１つの側面は、物理レジスタをスタテ
ィックレジスタとスタックレジスタに分割することにあ
る。これにより、スタックレジスタがスタックをポイン
ティングするベースレジスタまたはリロケーションレジ
スタを介して間接的にアドレスできるようになる。プロ
シージャ呼び出しの際にレジスタをセーブしプロシージ
ャからの復帰の際にセーブされていたレジスタを復元す
るようにプロシージャに要請する代わりに、本方法で
は、全てのプロシージャが、その呼び出し元とは独立し
た一組のレジスタをスタックから割り当てる（プロシー
ジャからの復帰の際にはその様なレジスタの割当てを解
除してスタックへ戻す）ことができるようにする。もし
そのような割り当てがスタックオーバーフローまたはア
ンダーフローをもたらさないなら、メモリアクセスは不
要である。

【００１０】もしハードウエアが十分大きなスタックを
実現するなら、呼び出されたプロシージャがローカルレ
ジスタを直ちに入手できること、それがない場合にはレ
ジスタのセーブ及び復元を必要とするメモリパイプが使
えること、及びメモリとのトラフィックが減少すること
からもたらされるキャッシュ動作の改善により、システ
ムスループット、資源利用及びプログラム実行時間の改
善が期待される。

【００１１】プロシージャにより要求される（また、お
そらくは必要な）レジスタの正確な個数がそのプロシー
ジャに割り当てられる。もっと具体的には、本発明によ
れば、各プロシージャ及び各ループには正確にそれら特
性に合う所要の個数のレジスタが割り当てられる。この
ようにして、レジスタは不必要に割り当てられることも
なく不必要に保持／復帰されることもない。この特徴は
レジスタの効果的な使用及び実行時間の短縮につなが
る。

【００１２】本発明はコンパイラの介入なしにディジタ
ルコンピュータで動的にレジスタをプロシージャに割り
当てる方法を含む。この方法は以下のステップを含む：
複数のスタックレジスタを有する論理レジスタスタック
を定義するステップ；ローカルリローケション項（loca
l relocation term,“ｌｒｅｌ”と称する）を初期化し
て、前記論理レジスタスタックをコンピュータの前記物
理レジスタセットにマッピングするためのオフセットを
定義するステップ；第１のスタックポインタ値（ＴＯ
Ｌ）を初期化することにより、第１のプロシージャによ
り指定される任意の個数のスタックレジスタをローカル
レジスタとして第１のプロシージャに割り当てて、前記
論理レジスタスタック内の前記ローカルレジスタの範囲
を区切るステップ；前記第１のプロシージャの実行の間
の間のレジスタアクセス操作について、各ローカルレジ
スタを前記ローカルリロケーション項に応じて前記物理
レジスタセットにマッピングするステップ。

【００１３】第２のプロシージャを呼び出すための準備
にあたっては、この方法は以下のステップを要する；第
１のスタックポインタ値（ＴＯＬ）を“以前のＴＯＬ”
（ＯＴＯＬ）と称される第２のスタックポインタ値とし
てストアするステップ；第１のスタックポインタ値（Ｔ
ＯＬ）をインクリメントすることにより、第１のプロシ
ージャにより指定された個数のスタックレジスタを第１
のプロシージャにパラメータ引渡レジスタとして追加し
て割り当てて、パラメータ引渡レジスタを含めるように
するステップ；呼び出されたプロシージャが参照するよ
うに、割り当てられたパラメータ引渡レジスタ内に選択
されたパラメータをストアするステップ。我々はまた、
パラメータ引渡レジスタをローカルリロケーション項に
応じて物理レジスタセットにマッピングする。

【００１４】第２のプロシージャを呼び出すに当たっ
て、この方法は更に第１のプロシージャパラメータ引渡
レジスタを含む初期ローカルレジスタ空間を第２のプロ
シージャに割り当てるステップを含む。このステップに
より、これらのレジスタにストアされたパラメータを、
メモリを参照せずに第２のプロシージャから利用できる
ようにする。第２のプロシージャが必要とする個数の追
加のスタックレジスタは、スタックポインタ値をインク
リメントすることによりローカルレジスタとして第２の
プロシージャに割り当てられる。この割り当ては、第１
のプロシージャのローカルレジスタ内容を先ずメモリに
セーブするという操作を経ずに実行される。第２のプロ
シージャからの復帰に当たっては、この方法では、スタ
ックポインタ値をローカルレジスタの個数分デクリメン
トすることにより、ローカルレジスタの割り当てを解除
する操作が行われる。このように、本発明には、ローカ
ルレジスタ内容をセーブ及び復元することなしに第２の
プロシージャを呼び出しまたそこから復帰することが含
まれる。

【００１５】本発明の他の側面は、物理アドレスをレジ
スタファイルポートに提供するレジスタファイルポート
アクセス回路である。この回路は仮想アドレスを受け取
り、仮想アドレスをスタティックレジスタアドレス空間
と比較してこの仮想アドレスがスタティックレジスタア
ドレス空間内にあるか否かを提示する。もしスタティッ
クレジスタアドレス空間内にあれば、この回路はこの仮
想アドレスを、対応レジスタにアクセスするための第１
の物理アドレスとしてレジスタファイルポートに結合す
る。この回路には更に、受け取った仮想アドレスをロー
カルリロケーション項と結合して第２の物理アドレスを
形成する回路と、仮想アドレスがスタティックレジスタ
アドレス空間内になければ第２の物理アドレスをアドレ
スとしてレジスタファイルポートに結合する手段も含ま
れる。アクセス回路は、ローカルリロケーション項を仮
想アドレスと予め定められた物理レジスタの総数を法(m
odulo)とするモジューロ加算を行うように構成される。

【００１６】本発明の、上述した、またそれ以外の目
的、特徴及び利点は、以下の図面を参照して進められる
好適な実施例の詳細な説明からもっと容易に明らかにな
るであろう。

【００１７】

【実施例】図１はレジスタウインドウとして知られてい
る、レジスタを割り当てる従来技術の方法を示す概念図
である。以下において、参照番号は、図示されているア
ドレス空間モデルを参照するために使用される。図の参
照番号をレジスタ番号と混同してはいけない。ここで
は、物理レジスタ番号を示すために小文字のｒを使用
し、論理または仮想レジスタスタック番号を示すために
大文字のＲを使用する。省略記法“ＶＲ”は仮想レジス
タを意味し、“ＰＲ”は物理レジスタを意味する。

【００１８】図１において、番号ｎ−１がついた第１の
ウインドウには、グローバルレジスタｒ０からｒ９及び
ローカルレジスタＲ１０からＲ３１が割り当てられる。
新たなプロシージャが呼び出されると、別の一連のレジ
スタがこの新たなプロシージャに割り当てられる。番号
１のウインドウを参照すると、レジスタｒ０からｒ９
は、グローバルであるので、そのままである。呼び出し
の後、６個のレジスタが前段のウインドウにオーバーラ
ップして、呼び出し側のレジスタＲ１０からＲ１５まで
がレジスタＲ３１からＲ２６になる。１０個のレジスタ
はウインドウに含まれないので、各プロシージャからは
一度に３２個のレジスタが見えていても、ウインドウ毎
に１６個（３２−１０−６）の固有のレジスタがある。
オーバーラップしたレジスタはパラメータ引渡のために
使用される。同様に、ウインドウ番号ｎ＋１において、
呼出側のレジスタのＲ１０からＲ１５（ウインドウｎ）
は、呼び出し後、Ｒ３１からＲ２６となり、再び、６個
の重複レジスタが提供される。従来技術で述べたよう
に、固定サイズでの分割を行うレジスタウインドウ技術
は、使用されないときでもセーブされるレジスタを生成
する。

【００１９】本発明は、個々のプロシージャが物理レジ
スタのプールからあるいはそこへの任意の個数（論理レ
ジスタスタックの数により制限される）のレジスタの割
り当て及び割り当て解除を必要に応じて実行できるよう
にすることにより、プロシージャインターフェースにお
いてセーブされまた復元されるレジスタの個数を最小限
にする。このプールの中のレジスタは、以下に述べる間
接あるいはリロケーションポインタを介してアクセスさ
れる。レジスタスタックはレジスタで利用可能なソフト
ウエアスタックの頂部として見ることができ、従って、
容易にかつ速やかにアクセスされる。そのようなレジス
タの“動的割り当て(dynamic allocation)”は、コンパ
イラにより予め定められているのではなく、呼び出され
たプロシージャ自身により制御される。

【００２０】本発明の一実施例では、１２８個の固定小
数点及び１２８個の浮動小数点レジスタを設けてよい。
典型的なハードウエアレジスタファイルは、６４個のス
タティックレジスタ及び６４個の循環レジスタを有して
いてよい。レジスタファイルは独立した集積回路で実現
してよいし、あるいはプロセッサデバイス上に実装して
よい。物理レジスタファイル自体の実現の詳細は知られ
ており、ここではあまり関係がない。本発明は固定小数
点レジスタと浮動小数点レジスタの一方または両方に等
しく適用可能である。説明の都合上、固定小数点レジス
タに適用するものとして本発明を説明する。以下の説明
では、次に示す用語を使用する。

【００２１】物理レジスタ（ＰＲ）：システムアーキテ
クチャから見える物理レジスタ。物理レジスタの実際の
個数は単なる設計事項である。物理レジスタはレジスタ
ファイル内で実現されると仮定している。仮想レジスタ（ＶＲ）：命令中で指定されるレジスタ番
号である。ＶＲ番号はＰＲ番号と同じであってよいし、
あるいはＶＲを修正して、対応するＰＲのアドレスを決
定してもよい（以下で説明する）。スタティックレジスタ：グローバルレジスタ(Grobal Re
gisters)とも称され、スタック操作あるいは循環に関与
しないレジスタである。言い換えれば、これらレジスタ
のは、間接操作なしで、シラブル(syllable)で提供され
るレジスタアドレスを使用して直接アクセスされる。以
下の実施例では、ＶＲアドレス０から３１は、スタティ
ックレジスタであるＰＲ０から３１にアクセスするため
に修正なしに使用される。循環レジスタ(Rotating Registers)：これらのレジスタ
はソフトウエアパイプライン化に関与するための、プロ
シージャにより割り当てられたレジスタであり、循環レ
ジスタベースＲＲＢ(Rotating Register Base)からのオ
フセットとしてアクセスされる。どのプロシージャも、
いかなる時でも物理レジスタの個数によりほぼ制限され
る任意の個数の循環レジスタにアクセスできる。循環レ
ジスタはリングとしてアドレスされる。スタックレジスタ：スタック操作及び循環に関与するレ
ジスタのプールである。スタックレジスタをアクセスす
るためのベースあるいは間接操作を指定するスタックポ
インタを使うことにより、スタックレジスタのプールは
リングとして管理される。（従って、循環レジスタはリ
ング内のリングとして管理される。）言い換えれば、も
しＶＲ（ｉ）が物理的に実現されているスタックレジス
タの中の最大のアドレスを有しているものに対応するな
らば、ＶＲ（ｉ＋１）は最小アドアドレスを有するスタ
ックレジスタに対応する。以下に述べる実施例では、９
６個のスタックレジスタ（Ｒ３２からＲ１２７）が存在
する。循環レジスタはスタックレジスタのプールから抜
き出される。ＶＲｓ３２から１２７は、ベースポインタ
により修正されて、対応するＰＲを決定する。ローカルレジスタ(Local Registers)：現プロシージャ
からアクセス可能なスタックレジスタである。

【００２２】上述の循環レジスタベース（ＲＲＢ）に加
えて、好ましい実施例はスタックレジスタファイルの中
をポインティングする次のような追加の間接つまりベー
スレジスタを維持する。（好ましくは、プロシージャは
次のベースレジスタの各々の２つのコピーを有する。そ
の１つは固定小数点スタックであり、他方は浮動小数点
スタックである。）有効レジスタ群の下限（底）ＢＯＶ：レジスタスタック
を介してアクセス可能なソフトウエアスタックの深さを
マーキングするスタックポインタである。ＢＯＶを越え
て割り当て処理を実行するとスタックのオーバフローを
招き、ＢＯＶを越えて割り当て解除処理を実行するとス
タックのアンダフローを招く。以下で更に説明する。ローカルレジスタ群の下限ＢＯＬ：現プロシージャから
アクセス可能なスタックレジスタ群の一方の端の境界を
示すスタックマーカである。現プロシージャの全てのス
タックレジスタはＢＯＬに関してアクセスされる。一般
に、Ｐがスタックレジスタの総数であり、ｉ及びｊが、
ｉ＜３２の場合ｊ＝ｉ、ｉ≧３２の場合ｊ＝［（ＢＯＬ
＋ｉ−３２）ｍｏｄＰ］＋３２によって関連付けられ
るとするとき、ＶＲｉはＰＲｊにアクセスする（ここ
で、ＰＲ０からＰＲ３１はスタティックレジスタである
と仮定している）。好ましい実施例において、ＢＯＬは
デフォルトで最初のスタックレジスタ（ＰＲ３２）を指
す。ローカルレジスタ群の上限（頂上）ＴＯＬ：現プロシー
ジャからアクセス可能なレジスタ群の他端の境界を示す
スタックマーカである。プロシージャがローカルエリア
内に存在しないレジスタ、すなわちＢＯＬ境界からＴＯ
Ｌ境界までの範囲の外にあるレジスタにアクセスしよう
とすると例外を引き起こす。ローカルレジスタ群の以前の上限ＯＴＯＬ：パラメータ
レジスタの割り当ての行われる以前のＴＯＬの値であ
る。ＴＯＬとＯＴＯＬの間の一連のレジスタは割り当て
られたパラメータレジスタである。循環レジスタ群の下限ＢＯＲ：循環にかかわるスタック
レジスタ群の一端の境界を示すスタックマーカである。循環レジスタ群の上限ＴＯＲ：循環にかかわるスタック
レジスタ群の他端の境界を示すスタックマーカである。

【００２３】一般に、レジスタスタックにおける利益は
スタックレジスタにだけあてはまり、コンパイラは依然
としてスタティックレジスタのための呼び出し元／呼び
出し先、セーブ／復元戦略を採り入れ続けねばならな
い。全ての議論及び説明は固定小数点スタックと浮動小
数点スタックに等しく適用される。各スタックは自分自
身のベースレジスタセットを有する。固定小数点レジス
タファイル及び浮動小数点レジスタファイルは各々別々
に制御される。本発明を説明するために、固定小数点ス
タックを詳細に述べる。

【００２４】ローカル、パラメータ及び循環レジスタは
新たに定義された操作であるａｌｌｏｃを実行すること
により割り当てられまたは割り当て解除される。ローカ
ルレジスタが割り当てられ／割り当て解除される場合に
は、レジスタの割り当て及び割り当て解除により、ＴＯ
Ｌ及びＯＴＯＬが修正される。ＴＯＬ及びＯＴＯＬは割
り当て及び割り当て解除されるローカルレジスタの個数
だけインクリメント／デクリメントされる。パラメータ
レジスタの割り当て／割り当て解除により、ＴＯＬが修
正される。ＴＯＬは、以下の図３Ａ−Ｉに示されるよう
に、割り当て及び割り当て解除されるパラメータレジス
タの個数だけインクリメント／デクリメントされる。レ
ジスタの割り当て及び割り当て解除は、スタックがオー
バフロー／アンダフローするときＢＯＶにも影響を及ぼ
すかもしれない。

【００２５】循環レジスタの割り当て／割り当て解除に
より、ＢＯＲ、ＴＯＲ、ＴＯＬ、及びＯＴＯＬが修正さ
れる。循環レジスタが割り当てられる際、ＢＯＲはＴＯ
Ｌの内容にセットされる。ＴＯＬ、ＯＴＯＬ及びＴＯＲ
はＴＯＬと割り当てられる循環レジスタの個数の合計に
セットされる。循環レジスタの割り当て解除より、逆方
向の修正が行われる。上述した機構により、プログラム
に影響を与えることなしに、例えば装置モデル毎に物理
レジスタの個数を変えることができる。

【００２６】プロシージャ呼出し（すなわち、ブランチ
アンドリンクの実行）の実行に当たって、各種のベース
レジスタの現在の状態がパラメータレジスタ０にストア
される。よってコンパイラは呼び出されたプロシージャ
へ渡す／呼び出されたプロシージャから送られるパラメ
ータの個数以外に、追加のパラメータレジスタを１個割
り当てなけらばならない。更にＢＯＬはＯＴＯＬの値に
セットされ、ＯＴＯＬはＴＯＬの値にセットされる。プ
ロシージャからの復帰に当たっては、各種のベースレジ
スタはパラメータレジスタ０にストアされた値に設定し
なおされる。プロシージャからの復帰は、呼び出された
プロシージャのローカルレジスタ及び循環レジスタの割
り当て解除を伴うので、スタックアンダーフローを招く
ことがある。

【００２７】割り当てを行っている際にＴＯＬがＢＯＶ
を越えようとするとき、スタックはオーバーフローした
と言われる。全ての演算が、スタックに実装されている
レジスタの個数を法として行われるということを想起さ
れたい。あるいは、モジューロ加算(modulo-plus)機能
を使用して固定小数点レジスタアドレス空間を飛び越し
てもよい。同様に、割り当て解除を行っている際にＢＯ
ＬがＢＯＶを越えようとするとき、スタックはアンダー
フローした言われる。オーバーフロー／アンダーフロー
の発生はハードウエアで検出され、トラップハンドラが
適切にスタックレジスタをソフトウエアスタックに追出
すために／ソフトウエアスタックからスタックレジスタ
への復元を行うために呼び出される。

【００２８】上述した機構により、スタックオーバーフ
ロー及びアンダーフローを予期してレジスタスタックの
内容の流し出しまたそこへの充填をバックグラウンドで
行うハードウエア（ソフトウエア）を使用することがで
きる。従って、従来の意味でのスタックオーバーフロー
及びアンダーフローは、後述するところの我々がレジス
タ清浄化(register cleaning)と呼んでいる処理により
回避することができる。

【００２９】割り当て処理操作は、例を使うことによっ
て最も良く説明できる。プロシージャＡでＢＯＬが物理
レジスタ３８をポインティングし、ＴＯＬが物理レジス
タ４７をポインティングすると仮定する。するとプロシ
ージャＡは１０個のローカルレジスタを有する。プロシ
ージャＢの呼び出しに先立って、プロシージャＡは４個
のパラメータレジスタを割り当てる。これにより、ＯＴ
ＯＬが４７にセットされ、ＴＯＬは５１にセットされ
る。ブランチアンドリンクが実行されるとき、これらの
ベースレジスタの値がパラメータレジスタ０、すなわち
物理レジスタ４８にパックされる（以下の制御レジスタ
Ａについての説明を参照）。更に、ＢＯＬは４７にセッ
トされる。呼び出されたプロシージャ（Ｂ）のローカル
空間の下限をＯＴＯＬに配置することにより、パラメー
タレジスタは両者に共通となり、またこれらのレジスタ
部分はＢのローカル領域の下限部となる。ＯＴＯＬ及び
ＴＯＬは５１にセットされる。プロシージャＢに１０個
のローカルレジスタを割り当てると仮定する。この場
合、ＴＯＬ及びＯＴＯＬを６０にセットする。プロシー
ジャＢから復帰すると、ＢＯＬ、ＴＯＬ及びＯＴＯＬは
夫々初期値３８，４７，５１にリセットされる。

【００３０】ある実施例では、プロシージャＢによりプ
ロシージャＡへ戻される値を物理レジスタ４８から５１
に入れることができる。その代わりに、復帰値をスタテ
ィックレジスタに入れることもできる。これにより、復
帰後直ちにパラメータレジスタの割り当てを解除して次
のプロシージャ呼び出しのために利用できる。

【００３１】プロシージャが呼び出されるとき１つのパ
ラメータレジスタ（ここでは４８）を使ってポインタ値
がストアされるということにも注意されたい。もっと具
体的に言えば、復帰情報は制御レジスタに記憶され（以
下で更に説明する）、コンパイラは、復帰前に、復帰情
報をローカルレジスタ領域にコピーし、また制御レジス
タにストアすることが必要とされる。好ましくは、ＴＯ
Ｌ及びＯＴＯＬ値自体はセーブされないが、それらの値
を計算できるようにする代わりの値、公称上、以前の値
に対するオフセット、がセーブされる。オフセット値を
使用することによって、これらの値を任意のレジスタに
記憶できるようになる。かくして、レジスタを任意量だ
け循環しても、上記機構は依然として正確に動作する。
他の実施例では、この目的のためにパラメータレジスタ
を余分に割当てて、パラメータ引渡に使用できるレジス
タの総数を呼び出し側のプロシージャにより割り当てら
れた実際の数に等しくなるようにする。循環レジスタの
割り当て／割り当て解除は、同様の態様で動作する。

【００３２】各レジスタスタックは、スタックオーバー
フローの際にはレジスタがセーブされ、またスタックア
ンダーフローの際にはレジスタが読み出される固有のソ
フトウエアスタックを有する。従って、各レジスタスタ
ックはまさに適当なソフトウエアの先端部分を表す。

【００３３】上述の方法を実現するに当たって、以下の
制御レジスタを提供するのが好都合である：制御レジスタＡ：これは固定小数点スタック用の各種の
ベースポインタ−ＢＯＶ，ＢＯＬ，ＴＯＬ，ＢＯＲ，Ｔ
ＯＲ及びＯＴＯＬ−を収容する。制御レジスタＢ：これは浮動小数点用の別のベースポイ
ンタ−ＢＯＶ，ＢＯＬ，ＴＯＬ，ＢＯＲ，ＴＯＲ及びＯ
ＴＯＬ−を収容する。制御レジスタＣ：これは固定小数点レジスタのためのレ
ジスタスタックをバックアップしているソフトウエアス
タックのメモリアドレスを含む。制御レジスタＤ：これは浮動小数点レジスタのためのレ
ジスタスタックをバックアップしているソフトウエアス
タックのメモリアドレスを含む。プロシージャ呼び出しの実行の準備として、適当なベー
スポインタがパラメータレジスタ０にストアされること
を想起されたい。

【００３４】図２に目を向けると、Ｒ０からＲ１２７ま
での番号が付与されたレジスタセットについての論理ア
ドレス空間モデルが示されている。スタティックレジス
タ５０（Ｒ０からＲ３１）は例えばグローバル値のため
にリザーブされ、ローカルレジスタ割り当て機構には関
与しない。スタックレジスタＲ３２からＲ１２７は参照
番号５８により示される（この参照番号はアドレスでは
ないことに注意）。このモデルにより示される仮想アド
レスはソフトウエアプロシージャから見たレジスタスタ
ックを示す。仮想アドレス（ＶＲ）は、以下に述べられ
る物理レジスタファイルにアクセスするために実際のつ
まり物理レジスタアドレス（ＰＲ）に変換される。初期
状態では、割り当てられていないアドレス空間６０がレ
ジスタスタック全体を構成している。

【００３５】図３Ａから図３Ｉは、呼び出された一連の
プロシージャから見える仮想アドレス空間を示してい
る。呼び出されたプロシージャは、各図の上部に書かれ
たＡ、Ｂ、Ｃ、Ｄで示している。このモデルで方向
「上」、「下」、及び表記「上限」、「下限」は任意で
ある。例えば、ローカルレジスタを「上限」、ここでは
Ｒ１２７から下向きに割り当て、スタックの下限（ＶＲ
３２）に到達したとき回り込みを行うこともできる。我
々は、Ｒ３２から上向きに割り当てることによって本発
明を説明する方を選択した。動作の原理は、一貫性を保
つ限り同一である。

【００３６】図３Ａに目を向けると、第１のプロシージ
ャＡへの呼び出しを行った後の図２の論理アドレス空間
が示されている。論理アドレス空間（すなわち一連の仮
想レジスタ）６２はプロシージャＡに対してローカルな
ものとしてプロシージャＡに割り当てられている。ＢＯ
Ｌ(Bottom of Local)ポインタはプロシージャＡのロー
カル空間の下限を示し、ＴＯＬ(Top of Local)はプロシ
ージャＡのローカルアドレス空間の上限を区切ってい
る。ＢＯＶ(Bottom of Valid)は、ＢＯＬの値に初期化
され、現在割り当てられている空間の範囲を区切ってい
る。参照番号６０は未だ割り当てられていない仮想レジ
スタ（つまりアドレス空間）、すなわちＴＯＬよりも上
の空間またはＢＯＶよりも下の空間を示す。図３Ｂにお
いて、プロシージャＡは次に呼び出されるプロシージャ
へのパラメータ引渡のためにパラメータ空間６４を割り
当てる。パラメータ空間６４はプロシージャＡに割り当
てられているローカルアドレス空間をインクリメントす
る。この様子は、それに合わせてＴＯＬポインタがパラ
メータ空間６４の上限に上向きに調整されていることに
示されている。ポインタＯＴＯＬはパラメータレジスタ
の割り当ての前のＴＯＬ値を示している。

【００３７】プロシージャＡは次にプロシージャＢを呼
び出す。注意したように、ポインタ（制御レジスタＡ）
は第１のパラメータレジスタにストアされる。図３Ｃを
参照すると、いつものように、プロシージャＢは、ＢＯ
Ｌポインタで表わされるように、スタックの下限（ＶＲ
３３）で始まるローカル（仮想）アドレス空間を割り当
てる。プロシージャＢのローカル空間の最初の部分は、
パラメータ空間６４がプロシージャＡとＢに共通になる
ように、プロシージャＡのパラメータ引渡レジスタ６４
にマッピングされる。呼び出されたプロシージャのロー
カル空間は常にスタックの下限（ＢＯＬ）で始まり、こ
の空間はまた呼び出し側のプロシージャのパラメータ空
間で始まる。

【００３８】従って、プロシージャ呼び出しは、パラメ
ータ引渡空間（例えば６４）が下限側に向かうように仮
想レジスタスタックを押し込む、つまりプッシュダウン
すると考えることができる。呼び出し側プロシージャの
パラメータ空間（例えば６２）は、図３Ｃのアドレス空
間の上限部分に回り込み、ＢＯＶ(Bottom of Valid)ポ
インタを調整することにより区切られている。プロシー
ジャＢも（純粋にローカルな）レジスタ６６を更に割り
当て、ＴＯＬポインタにより区切っている。上と同様
に、残りの割り当てられずに残っているアドレス空間は
６０によって示される。

【００３９】図４Ａから図４Ｉは、レジスタファイルの
ような物理アドレス空間をモデル化している。この段階
で、図３Ａから図３Ｉにモデル化された仮想アドレス空
間と物理アドレス空間の関係を質的に考慮することは役
に立つ。図４Ａを参照すると、ＢＯＬ及びＢＯＶポイン
タはレジスタファイルアドス空間の原点を示している。
これらは例えば物理アドレス０で良い。プロシージャＡ
の仮想アドレス空間６２（図３Ａ）はＴＯＬポインタで
区切られている物理アドレス空間１０２（図４Ａ）に対
応する。図４Ｂはまた、プロシージャＡにより割り当て
られ、図３Ｂの仮想アドレス空間６４に対応するパラメ
ータ空間１０４も示している。参照番号１００は物理ア
ドレス空間モデル中でに現在割り当てられていないアド
レス空間を示している。一般に、図３Ａから図３Ｉの参
照番号に４０を加算すれば、夫々図４Ａから図４Ｉの対
応する参照番号になる。

【００４０】図４Ｃは、ＴＯＬポインタを調整すること
により図３ＣのプロシージャＢのローカルアドレス空間
６６に対応するアドレス空間１０６が更に割り当てられ
たことを示している。従って、呼び出されたプロシージ
ャの仮想アドレス空間は常にレジスタスタックの下限か
ら始まるが、物理レジスタファイル内ではこれに対応す
るデータのリロケーションはないことが観察できる。リ
ロケーションを実際に行う代わりに、図４Ａから図４Ｉ
に示されるように、追加されるレジスタは、前に割り当
てられた物理アドレス空間に影響を与えることなしに呼
び出されたプロシージャにより必要に応じて割り当てら
れる。次に、これ以上のプロシージャ呼び出しを考慮す
るために図３Ｄを参照する。

【００４１】プロシージャＢは図３Ｄに示されるよう
に、ＴＯＬポインタを調整することによりパラメータ引
渡アドレス空間７０を割り当てる。プロシージャＡと共
通のパラメータアドレス空間６４を有する残りのローカ
ルアドレス空間６６は影響されない。図３Ｄに示され、
ＢＯＶアドレスポインタによって表わされるプロシージ
ャＡのローカルアドレス空間６２は、アドレス空間の上
限部にそのまま残っている。

【００４２】図３Ｅを参照すると、プロシージャＢは更
に別のプロシージャＣを呼び出す。プロシージャＣにつ
いての論理アドレス空間は以下の部分で構成される：論
理アドレス空間の下限（ＢＯＬ）で始まり、アドレス空
間７０はプロシージャＢと共通のパラメータ引渡空間で
ある。プロシージャＣはＴＯＬポインタで表わされるロ
ーカルアドレス空間７２を割り当てる。呼び出し側プロ
シージャ（Ｂ）のローカルアドレス空間６４，６６は、
プッシュダウンされ、図３Ｅのモデルの上限部分に回り
込んむ。プロシージャＡローカル空間６２は現在の呼び
出しに適応するためにプッシュダウンされ、またＢＯＶ
がそれに従って動かされる。言い換えれば、レジスタス
タックは論理的に循環する。いつものように、残りの割
り当てられていないアドレス空間は６０で示される。

【００４３】図４Ｄ及び図４Ｅは夫々図３Ｄ及び図３Ｅ
でモデル化された論理アドレス空間に対応する物理アド
レス空間を示している。図４Ｄを参照すると、パラメー
タ引渡空間１１０は、図３ＤでプロシージャＢにより割
り当てられた仮想パラメータ空間７０に対応する。同様
に、図４Ｅのローカルアドレス空間１１２は、図３Ｅで
プロシージャＣにより割り当てられた仮想ローカルアド
レス空間７２に対応する。

【００４４】ここで図３Ｆを参照すると、プロシージャ
Ｃは前に割り当てられたローカル空間７２に加えて循環
レジスタアドレス空間７４を割り当てる。ＴＯＬ（及び
ＴＯＲ；図３Ｇ参照）ポインタは循環レジスタ空間の上
限を示し、ＢＯＲは循環レジスタ空間の下限を示してい
る。仮想アドレス空間６２，６４及び６６は影響されな
い。図４Ｆは、ＢＯＲ及びＴＯＬで境界付けられる物理
アドレス空間１１４の対応する割り当てを示している。
循環レジスタの個数は、ソフトウエアのパイプライン化
されたループの特性に応じて変えられる。プロシージャ
が現在利用可能なアドレス空間を越える循環レジスタ空
間を割り当てようとする場合のみ、レジスタオーバーフ
ローが起こる。この場合については、以下に述べられ
る。

【００４５】次に、図３Ｇを参照すると、他のプロシー
ジャの呼び出しを見越してプロシージャＣは循環レジス
タ空間７４の上限の上にパラメータ引渡空間７６を割り
当てる。パラメータ空間を区切るためにＴＯＬを調整す
る。論理アドレス空間６０はまだ割り当てられていない
レジスタである。図４Ｇは、プロシージャＣが他のプロ
シージャにパラメータを通すための物理アドレス空間１
１６の対応する割り当てを示している。

【００４６】図３Ｈはもう１つのプロシージャＤがプロ
シージャＣにより呼び出された後の仮想アドレス空間モ
デルを示している。前にプロシージャＣにより割り当て
られたパラメータ空間７６は、いつものように、プロシ
ージャＤのローカルアドレス空間の下限に現れている。
更に、プロシージャＤはＴＯＬポインタを調整すること
によりローカルアドレス空間７８を割り当てる。呼び出
しプロシージャ、すなわちプロシージャＣ、についてロ
ーカルなアドレス空間（共通パラメータ引渡空間７６を
除く）は、図３Ｈの７０，７２及び７４で示されるよう
に、プッシュダウンされ、モデルの上限部に回り込んで
いる。プロシージャＢについてローカルなアドレス空間
６６及び６４はこれに従ってプッシュダウンされる。同
様に、プロシージャＡのローカル空間６２は、スタック
上で更にプッシュダウンされ、未だ以って割り当てられ
ていないアドレス空間６０を残して、ＢＯＶ(Bottom of
Valid)ポインタにより区切られる。図４Ｈは、プロシ
ージャＤがローカルレジスタとして使用する物理アドレ
ス空間１１８の対応する割り当てを示す。

【００４７】プロシージャＤは次に、図３Ｈの６０によ
り示される利用可能なアドレス空間を越えて循環レジス
タ空間を割り当てようとする。これはレジスタオーバー
フロー条件を引き起こす。その結果、ＢＯＶポインタの
上方にあるメモリ空間の部分がメモリ（図示せず）にセ
ーブされる。セーブされる部分は論理アドレス空間６２
と６４及び６６の一部分を含む。ＢＯＶポインタはオー
バーフローセーブ操作の結果繰り上がり、これにより空
いている空間を追加する。この結果の割り当てられてい
ないアドレス空間６０は、プロシージャＤの循環レジス
タの要求に合致するよりも大きい。この結果は図３Ｉに
示されており、ここで８０はプロシージャＤの循環レジ
スタ空間を示している。

【００４８】図３Ｉを参照すると、プロシージャＤはＢ
ＯＲ及びＴＯＬポインタで区切られている循環レジスタ
アドレス空間８０を割り当てし終わっている。この場
合、必要最小限の空間より幾分大きいものがメモリにセ
ーブされている。その結果、割り当てられていない部分
６０が残っている。これは単に最小限の今すぐに必要と
いうのではなく、予め定められた個数のアドレスを動か
すようにオーバーフローセーブ機構を構成していること
から起こる。上述のセーブ操作によってリロケーション
されたアドレスの個数は、好ましくは従属ハードウエア
で効率よく実現できるように選択される。この結果現れ
るヒステリシスは、使用時に必要になるメモリ参照の回
数を減少させ得る。他の実施例では、保留されている割
り当てを調整するために十分なアドレス空間のみをセー
ブする。レジスタオーバーフロー及びセーブ後であっ
て、所要の循環レジスタを割り当てた後の物理アドレス
モデルは図４Ｉに示される。ここで１２０はプロシージ
ャＤの循環レジスタ空間を示している。

【００４９】レジスタオーバーフローセーブ及び復元機
構の詳細は知られている。しかし、本発明の他の側面
は、完全にレジスタオーバーフローを回避するための、
仮想アドレスレジスタシステムとともに作動する「清浄
化(cleaning)」機構にある。「清浄な(clean)」レジス
タは、メモリ内容の正確なコピーを有するレジスタとし
て定義される。逆に、「汚染した(dirty)」レジスタは
メモリ内容の信頼できるコピーを持っていない。汚染し
たレジスタは恐らくは有効なものである。すなわち、お
そらく現在割り当てられている。清浄なレジスタ空間は
ＢＯＣ(Bottom ofClean)及びＴＯＣ(Top of Clean)ポイ
ンタで表わされている。ＢＯＣは本質的にはＢＯＶと同
じである。初期状態では、定義により、レジスタ内容が
メモリにコピーされるまでは清浄なレジスタが存在しな
いので、ＴＯＣはＢＯＣに等しい。レジスタの清浄化は
バックグラウンドにおいてトランスペアレントに、すな
わちもしそうでなければ遊んでしまうプロセッササイク
ルを「盗む」ことにより実行される。

【００５０】ＴＯＣがＢＯＬより小さいとき、あるレジ
スタはメモリをまだ更新していない。レジスタ清浄化機
構は次のレジスタ、すなわちＴＯＣ＋１での値をメモリ
にコピーする。この機構は次にＴＯＣをインクリメント
し、その結果、ＴＯＣは常に先頭の清浄なレジスタをポ
インティングする。一般にローカルレジスタは頻繁に汚
染されるので、無視することができる。そこでＢＯＬま
でしか清浄化しないことが好ましい。清浄化操作はソフ
トウエアからはトランスペアレントであり、ここで説明
するレジスタ割り当て／割り当て解除方法及び装置とは
独立である。

【００５１】レジスタファイルポートアクセス回路ケース１：スタティックレジスタアクセス図５は本発明に関するレジスタファイルポートアクセス
回路１４０のブロック図を示している。物理レジスタ、
例えば１２８個のレジスタは、レジスタファイル１４４
のような一連のハードウエアレジスタファイル中に提供
される。図５に示されるタイプのアクセス回路が各レジ
スタファイルポートに対して提供される。回路機能の１
つは、例えばソフトウエアプロシージャにより提供され
るアドレスである論理アドレスＲを、レジスタファイル
にアクセスするための対応する物理レジスタアドレスに
マッピングすることである。回路１４０において、論理
レジスタアドレスＲがライン１４２上に入力され、マル
チプレクサ１４６への３つの入力の１つに結合される。

【００５２】コンパレータ１５０は、Ｒの値を具体的な
アプリケーション中でのグローバルつまりスタティック
レジスタの個数（この例では３２）に等しい定数と比較
し、この論理アドレスがスタティックレジスタの範囲の
中に入るかどうか（つまり、Ｒ＜３２かどうか）を判定
する。もしＲが３２より小さいときは、提示されたアド
レスがスタティックレジスタの範囲内にあり、コンパレ
ータ１５０からの出力はマルチプレクサ制御ライン１５
２をアサートして、ＭＵＸ１４６が物理アドレスとして
レジスタファイルに入力するものとして値Ｒ自体を選択
するようにする。言い換えれば、Ｒはスタティックレジ
スタについては修正されない。上述のように、スタティ
ックレジスタはスタックレジスタ操作には関与しない。

【００５３】ケース２：レジスタスタックアクセスもしＲが３２以上（かつｑｕｐまたはｐｄｎがアサート
されていない）ならば、Ｒは有効なレジスタスタック仮
想アドレスであり、物理レジスタアドレスにマッピング
されなければならない。さしあたり、循環レジスタが現
プロシージャに割り当てられていないと仮定する。この
場合、モジューロ加算を行う加算器(modulo-plus adde
r)１５４の出力はＭＵＸ１４６を介してレジスタファイ
ル１４４に供給される物理アドレスとして選択される。
モジューロ加算を行う加算器１５４は、物理レジスタア
ドレスを決定するためにモジューロ演算を使用して、論
理アドレスＲをローカルリロケーション項（“ｌｒｅ
ｌ”）、つまりオフセットと結合する。リロケーション
の加算は、スタック内に物理的に実装されているレジス
タ数についての法を取って実行される。ローカルリロケ
ーション項ｌｒｅｌは、（ＢＯＬ値）−（固定されたレ
ジスタの個数）に等しい。ｌｒｅｌは任意であり、予め
定められたリロケーションオフセット量またはブロック
サイズに限定されない、ということに注意されたい。こ
のように、所与のプロシージャにより割り当てられた個
数丁度のレジスタが使用される。逆に、復帰に当たって
は、丁度同じ個数のレジスタが割り当て解除される。

【００５４】説明のため、ハードウエアレジスタの総数
が１２８個で、レジスタ０から３１が固定されたレジス
タであり、レジスタスタックが９６個のレジスタを備え
ていると仮定する。次に、仮想スタックアドレスＲ＝４
４及びＢＯＬ＝４０であると仮定する。すると、Ｒと（ＢＯＬ−３２）をモジューロ加算したもの＝（４
４＋８）ｍｏｄ９６＝５２である。この例では、モデューロ加算による回り込み
（ラップアラウンド）は起こらない。しかし、もしＢＯ
Ｌ＝９０なら、Ｒと（ＢＯＬ−３２）のモジューロ加算＝（４４＋５８
（つまり１０２））ｍｏｄ９６＝６である。ただし、このモジューロ加算演算の結果は更に
Ｒ０からＲ３１を飛び越えるようにさせるので、最終的
には３８となる。一般には、Ｐをスタックレジスタの総
数とし、ｉとｊが、ｉ＜３２ならｊ＝ｉ、ｉ≧３２なら
ｊ＝［（ＢＯＬ＋ｉ−３２）ｍｏｄＰ］＋３２という
関係にあるとき、ＶＲｉはＰＲｊをアクセスする。

【００５５】ケース３：レジスタ復元及び清浄化レジスタファイルポートアクセス回路１４０はまた、レ
ジスタ復元及びレジスタ「清浄化」(register cleanin
g)のためにアクセスができるようにする。制御信号ｑｕ
ｐは、すでに上書きされているがレジスタファイル内で
再度有効(valid)にしなければならないレジスタを復元
するためにメインメモリから読み出すことを指示する。
この制御信号は、もっと多くの有効なレジスタを提供す
るためにスタックアンダーフローにともなって使用され
る。ｑｕｐがアサートされると、この信号はＭＵＸ１４
６を制御して、レジスタファイルをアクセスするための
アドレスとしてＱＵＰを選択する。ＱＵＰは復元される
べき次のレジスタのアドレス、すなわちＢＯＶ−１であ
る。

【００５６】ＱＵＰはローカル空間の外側を清浄にする
ための次のレジスタのアドレスである。これは次の使用
可能な、つまり有効ではないレジスタである。よって、
ＱＵＰアドレスは単にＴＯＬ＋１である。メインメモリ
の内容はレジスタファイルのこのアドレスにコピーさ
れ、定義によりそのレジスタを清浄にする。ＴＯＣは常
に清浄な空間の上限をポインティングするようにインク
リメントされる。

【００５７】制御信号ｑｄｎはメインメモリにその内容
をコピー（書き込み）することによりレジスタを清浄に
することを指示する。ｑｄｎがアサートされると、それ
はＱＤＮをレジスタファイルをアクセスするためのアド
レスとして選択するようにＭＵＸを制御する。ＱＤＮは
清浄にすべき次のレジスタのアドレス、すなわちＴＯＣ
＋１である。レジスタ清浄化機構はこのレジスタの内容
をメインメモリにコピーする。この機構は次にＴＯＣを
インクリメントし、ＴＯＣが清浄なレジスタ群のうちの
上限にあるものを常にポインティングするようにする。

【００５８】ＱＵＰ及びＱＤＮは互いに排他的である。
ポートはこれらの中の一方または他方の何れかを備える
が、両方ということはない。ＱＵＰはレジスタファイル
内のストアポートで実現され、常にメモリからの読み出
しを行う。ＱＤＮはレジスタファイル内の読み出しポー
トで実現され、常にメモリへの書き込みを行う。図５及
び図６中の“ＱＵＰまたはＱＤＮ”という表記法は、図
面を増やさずにこの相互の排他性を伝えようとするもの
である。

【００５９】循環レジスタ実装付きのレジスタファイル
ポートアクセス図６において、レジスタファイルポートアクセス回路１
６０がブロックの形態で示されている。図６の回路１６
０は図５の回路１４０と共通のいくつかの素子を備えて
いる。ここで同じ様な参照番号は共通の回路素子を示
す。共通の特徴の記載は省略する。図６はレジスタスタ
ック内で循環レジスタを実現するための追加の回路素子
を含んでいる。以前と同様に、論理アドレスＲは入力ノ
ード１４２に提供される。コンパレータ１６４は論理ア
ドレスＲとＢＯＲ(Bottom of Rotating)ポインタを比較
する。別のコンパレータ１６６はＲとＴＯＲポインタを
比較する。ＲがＢＯＲより大きく、ＴＯＲより小さいと
きは、論理アドレスは循環レジスタとして現プロシージ
ャに割り当てられたレジスタを指している。

【００６０】物理アドレスｒはＲに循環リロケーション
項(rotating relocation term)ｒｒｅｌを加算したもの
に等しい。循環リロケーション項ｒｒｅｌは、循環レジ
スタ内で回り込みが起きないと仮定すると、循環レジス
タセット内の循環を考慮に入れれば、ローカルリロケー
ション項ｌｒｅｌに循環レジスタベース値（ＲＲＢ）を
加算したものに等しい。従って、ｒ＝Ｒ＋ｌｒｅｌ＋ＲＲＢとなる。しかし、循環レジスタ内で回り込みが起これ
ば、ｒ＝Ｒ＋ｌｒｅｌ＋ＲＲＢ−（ＴＯＲ−ＢＯＲ）となる。

【００６１】ここでＴＯＲ−ＢＯＲは循環レジスタセッ
トの大きさを与える。アクセス回路１６０で、Ｒは加算
器１７０でｒｒｅｌに加算され（前述のモデューロ加算
演算を使用）、その結果はＭＵＸ１６２に与えられる。
ｌｒｅｌ及びＲＲＢはＲよりも前にわかるので、リロケ
ーション項ｒｒｅｌを前以って計算しておくことができ
る。回り込みが起こる場合、別のリロケーション項ｒｒ
ｅｌ＃がモジューロ加算器１７２でＲに加算され、その
結果がＭＵＸ１６２に与えられる。ここで、ｒｒｅｌ＃
はｌｒｅｌ＋ＲＲＢ−（ＴＯＲ−ＢＯＲ）に等しい。ｒ
としてＭＵＸ１６２で選択される値は、以下のように決
定される。何も手を打たないと論理アドレスが循環レジ
スタの境界を越えてしまう場合に循環レジスタ内で回り
込みが起こる。従って、問題は、Ｒ−ＢＯＲ＋ＲＲＢ＞ＴＯＲ−ＢＯＲかどうか？ということである。代数学から、このテス
トはＲ＞ＴＯＲ−ＲＲＢかどうか？というテストと等
価である。これは、ＲとＴＯＲ−ＲＲＢとを比較する、
図６のコンパレータ１６８により判定される。その判定
結果が真であれば、コンパレータ１６８は物理アドレス
ｒとしてモデューロプラス加算器１７２の出力を選択す
るようにＭＵＸ１６２を制御する。結果が偽であれば、
循環レジスタは回り込まなかったのであり、コンパレー
タ１６８は物理アドレスｒとしてモデューロプラス加算
器１７０の出力を選択するようにＭＵＸ１６２を制御す
る。

【００６２】種々の回路は回路１４０または１６０の所
要機能を達成するために工夫される。例えば、清浄なア
ドレスという特徴はあるアプリケーションでは実現され
るが他のアプリケーションでは実現されない。あるアプ
リケーションは従属(subject)スタック内の循環レジス
タを提供しないが、このようなアプリケーションでは図
５のような回路で十分である。他のアプリケーションで
は、循環オフセットＲＲＢを他の場所で計算し、必要に
応じて結果を加算器１７０に提供してよい。夫々の実現
形態の、性能上のトレードオフを持ちやすい具体的内容
は、本明細書を読んだ当業者には自明であろう。レジス
タファイルポートアドレッシングがクリティカルパスで
あるアプリーケーションでは、例えば高速の並列ハード
ウエアが提案される。

【００６３】図７は本発明を実現するためのレジスタフ
ァイルシステムの一例を概略的に示すブロック図であ
る。ｑｕｐ／ｐｄｎ，ＴＯＲ，ＢＯＲ，ＲＲＢ，ＱＵＰ
／ＱＤＮ，ｌｒｅｌ，ｒｒｅｌ及びｒｒｅｌ＃が付され
た一連のレジスタは、対応するポインタ値を維持するた
めに提供される。これらのレジスタは、所要のポインタ
値を、上述したレジスタファイルポートアクセス回路１
６０のような再マッピング回路に供給するためにバス１
７６を介して結合されている。レジスタファイル１４４
内で使用される各レジスタファイルポート毎に、このよ
うな再マッピング回路が１つ提供される。この一般的な
構成の種々の変形は、前述の目的及び動作を見れば、熟
達したハードウエア設計者には明らかであろう。例え
ば、複数のポインタ値をもっと少ないレジスタ内に収め
てもよい。選択された途中の値または途中のアトレス
を、性能を最適化するために前以って計算しておいても
よい。種種の作業のハードウエアとソフトウエア（マイ
クロコードを含む）への振り分けのような他の変形は、
特定の実現形態についての設計上のトレードオフと適応
の問題であり、これらは皆上記実施例と等価であると考
えられる。

【００６４】本発明の好ましい実施例で発明の原理を図
示、説明したが、本発明はその原理から逸脱することな
く配置及び細部を修正できることは当業者には明らかで
ある。本願特許請求の範囲の精神及び範囲内で得られる
全ての修正を本願の技術的範囲である。

【００６５】

【効果】以上詳細に説明したように、本発明によればレ
ジスタを有効に活用でき、プロシージャ呼出し／復帰に
伴うレジスタセーブ／復元のためのメモリアクセスを最
小化することができる方法及び装置が提供される。

【図面の簡単な説明】

【図１】レジスタウインドウを示す概念図。

【図２】一連のレジスタの論理アドレス空間モデルを示
す図。

【図３Ａ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｂ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｃ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｄ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｅ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｆ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｇ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｈ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図３Ｉ】本発明の操作を示す図２のレジスタセットの
論理アドレス空間モデルを示す図。

【図４Ａ】図３Ａの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｂ】図３Ｂの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｃ】図３Ｃの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｄ】図３Ｄの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｅ】図３Ｅの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｆ】図３Ｆの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｇ】図３Ｇの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｈ】図３Ｈの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図４Ｉ】図３Ｉの論理アドレス空間モデルに対応する
物理アドレス空間モデルを示す図。

【図５】本発明の一実施例を実現するレジスタファイル
ポートアクセス回路を示すハードウエアブロック図。

【図６】本発明の、レジスタスタック内に循環レジスタ
を有する他の実施例を実現するレジスタファイルポート
アクセス回路を示すハードウエアブロック図。

【図７】本発明を実現するレジスタファイルシステムの
一例を示すハードウエアブロック図。

【符号の説明】

ＢＯＶ，ＢＯＬ，ＴＯＬ，ＯＴＯＬ，ＢＯＲ，ＴＯＲ：
ベースレジスタ５０：スタティックレジスタ６０：割り当てられていないアドレス空間１４０，１６０：レジスタファイルポートアクセス回路１４４：レジスタファイル１４６：マルチプレクサ１５０，１６４，１６６，１６８：コンパレータ１５２：マルチプレクサ制御ライン１５４，１７０，１７２：加算器

───────────────────────────────────────────────────── フロントページの続き (72)発明者フレドリック・シー・アマーソンアメリカ合衆国カリフォルニア州サンタ・クララ、ヒルズデイル・アベニュー 451 アパートメント・ナンバー・ピー (72)発明者ロバート・エム・イングリッシュアメリカ合衆国カリフォルニア州メンロー・パーク、イースト・クリーク・プレイス４ (72)発明者ラジブ・グプタアメリカ合衆国カリフォルニア州ロス・アルトス、エコー・ドライブ 1052 (72)発明者渡邊坦神奈川県川崎市麻生区王禅寺1099番地株式会社日立製作所システム開発研究所内 (56)参考文献特開平５−12015（ＪＰ，Ａ) 特開平４−92282（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 9/42

Claims

(57)【特許請求の範囲】

【請求項１】コンパイラの介在なしに、デジタルコンピ
ュータにおいてプロシージャにレジスタを動的に割り当
てる方法であって、複数のスタックレジスタを有する論理レジスタスタック
を定義するステップと、前記論理レジスタスタックを物理レジスタセットにマッ
ピングするためのオフセットを定義するために、ローカ
ルリロケーション項（ｌｒｅｌ）を初期化するステップ
と、第１のスタックポインタ値（ＴＯＬ）を初期化すること
により、第１のプロシージャによって指定される任意の
数のスタックレジスタをローカルレジスタとして該第１
のプロシージャに割り当てて、前記論理レジスタスタッ
クにおいて該ローカルレジスタの範囲を区切るステップ
と、第１の循環レジスタポインタ値（ＢＯＲ）および第２の
循環レジスタポインタ値（ＴＯＲ）を、前記第１のスタ
ックポインタ値（ＴＯＬ）に初期化するステップと、前記第１のプロシージャによって循環レジスタとして指
定されたレジスタの任意の数だけ、前記第２の循環レジ
スタポインタ値（ＴＯＲ）および前記第１のスタックポ
インタ値（ＴＯＬ）をインクリメントすることにより、
レジスタを、循環レジスタとして前記第１のプロシージ
ャに割り当てるステップと、前記第１のプロシージャから復帰するに先立って、前記
第２の循環レジスタポインタ値（ＴＯＲ）および前記第
１のスタックポインタ値（ＴＯＬ）を、該第１のプロシ
ージャの循環レジスタの数だけデクリメントすることに
より、該循環レジスタの割り当てを解除するステップ
と、前記第１のプロシージャの実行中のレジスタアクセス操
作に関連して、前記ローカルリロケーション項（ｌｒｅ
ｌ）に応答して物理アドレス（ｒ）を求めることによ
り、ローカルレジスタのそれぞれの論理レジスタアドレ
ス（Ｒ）を、前記物理レジスタにマッピングするステッ
プと、を含み、前記物理レジスタにマッピングするステップは、（ａ）前記論理レジスタアドレス（Ｒ）がスタティック
レジスタの範囲内にあるならば、該論理レジスタアドレ
ス（Ｒ）に等しくなるよう前記物理アドレスをセット
し、（ｂ）前記論理レジスタアドレス（Ｒ）が前記スタティ
ックレジスタの範囲内になく、かつ該論理レジスタが循
環レジスタでないならば、前記論理レジスタ（Ｒ）およ
び前記ローカルリロケーション項（ｌｒｅｌ）を、前記
任意の数のスタックレジスタを法とし、前記スタティッ
クレジスタの範囲だけオフセットされたモジューロ加算
を実行することで、前記物理アドレスをセットし、（ｃ）前記論理レジスタアドレス（Ｒ）がスタティック
レジスタの範囲内になく、かつ前記論理レジスタが循環
レジスタならば、前記論理レジスタアドレス（Ｒ）が、
前記ＴＯＲおよびＢＯＲによって定義される循環レジス
タの範囲内にあるかどうかを判断し、（ｃ−１）前記論理アドレスＲが前記循環レジスタの範
囲内にあるならば、前記論理レジスタアドレス（Ｒ）お
よび循環リロケーション項（ｒｒｅｌ）のモジューロ加
算したものに前記物理アドレスをセットし、該循環リロ
ケーション項（ｒｒｅｌ）は、循環レジスタベース値
（ＲＲＢ）に前記ローカルリロケーション項（ｌｒｅ
ｌ）を加算したものに等しく、（ｃ−２）前記論理レジスタアドレス（Ｒ）が前記循環
レジスタの範囲内にないならば、前記論理レジスタアド
レス（Ｒ）および別の循環リロケーション項（＃ｒｒｅ
ｌ）のモジューロ加算したものに前記物理アドレスをセ
ットし、該別の循環リロケーション項（＃ｒｒｅｌ）
は、前記循環レジスタベース値（ＲＲＢ）から前記循環
レジスタの範囲を差し引いたものを前記ローカルリロケ
ーション項（ｌｒｅｌ）に加算したものに等しい、プロシージャにレジスタを動的に割り当てる方法。
【請求項２】前記第１のスタックポインタ値（ＴＯＬ）
をストアして、第２のスタックポインタ値（ＯＴＯＬ）
を形成するステップと、前記第１のスタックポインタ値（ＴＯＬ）をインクリメ
ントすることにより、前記第１のプロシージャによって
指定される任意の数の追加スタックレジスタを、パラメ
ータ引き渡しレジスタとして該第１のプロシージャに割
り当てて、該パラメータ引き渡しレジスタを含むように
するステップと、呼び出されたプロシージャが参照するために、前記割り
当てられたパラメータ引き渡しレジスタに少なくとも１
つのパラメータをストアするステップと、をさらに含
み、前記少なくとも１つのパラメータをストアする前記ステ
ップは、前記ローカルリロケーション項に応答して、前
記パラメータ引き渡しレジスタを前記物理レジスタセッ
トにマッピングすることを含む、請求項１に記載のプロ
シージャにレジスタを動的に割り当てる方法。
【請求項３】第２のプロシージャを呼び出すステップ
と、前記第１のプロシージャのパラメータ引き渡しレジスタ
を有する初期ローカルレジスタスペースを前記第２のプ
ロシージャに割り当て、該レジスタにストアされた前記
少なくとも１つのパラメータを、メモリ参照なしに前記
第２のプロシージャに利用可能なようにするステップ
と、前記スタックポインタ値をインクリメントすることによ
り、前記第２のプロシージャによって指定される任意の
数の追加のスタックレジスタを、ローカルレジスタとし
て該第２のプロシージャに割り当て、前記第１のプロシ
ージャのローカルレジスタの内容をはじめにメモリにセ
ーブすることなしに、該第２のプロシージャのローカル
レジスタを含むようにするステップと、前記第２のプロシージャから復帰する時、ローカルレジ
スタの数だけ前記スタックポインタ値をデクリメントす
ることによって、該ローカルレジスタの割り当てを解除
し、これによって、ローカルレジスタの内容をセーブお
よび復元することなく、該第２のプロシージャを呼び出
し、またそこから復帰するステップと、をさらに含む、請求項２に記載のプロシージャにレジス
タを動的に割り当てる方法。
【請求項４】前記第２のプロシージャを呼び出す時、前
記第１および第２のスタックポインタ値（ＴＯＬ、ＯＴ
ＯＬ）をストアして、該第２のプロシージャから復帰す
る際に参照するためのストアされた値を形成するステッ
プをさらに含み、前記割り当てを解除するステップは、前記第１および第
２のスタックポインタ値を前記ストアされた値にリセッ
トすることを含む、請求項３に記載のプロシージャにレ
ジスタを動的に割り当てる方法。
【請求項５】追加のパラメータレジスタを前記第１のプ
ロシージャに割り当てるステップをさらに含み、前記第１および第２のスタックポインタ値をストアする
前記ステップは、前記第２のプロシージャからの復帰の
際に参照するために、スタックポインタオフセット値を
前記追加のパラメータレジスタにストアすることを含
む、請求項４に記載のプロシージャにレジスタを動的に
割り当てる方法。
【請求項６】前記割り当てを解除するステップは、前記
追加のパラメータレジスタにストアされた前記スタック
ポインタオフセット値からスタックポインタ値を計算
し、該計算された値に、前記スタックポインタ値をリセ
ットすることを含む、請求項５に記載のプロシージャに
レジスタを動的に割り当てる方法。
【請求項７】前記第２のプロシージャにおいて、前記第
１のプロシージャのパラメータ引き渡しレジスタのうち
の選択された一つに、計算された値をストアすることに
よって、該計算された値を前記第１のプロシージャに返
すステップをさらに含む、請求項３に記載のプロシージ
ャにレジスタを動的に割り当てる方法。
【請求項８】スタティックレジスタセットを提供し、前
記第２のプロシージャにおいて、該スタティックレジス
タの選択された一つに、計算された値をストアすること
によって、該計算された値を前記第１のプロシージャに
返すステップをさらに含み、これにより、前記パラメータレジスタが、次のプロシー
ジャ呼び出しに即座に利用可能なようにする、請求項３
に記載のプロシージャにレジスタを動的に割り当てる方
法。
【請求項９】レジスタファイルポートをアクセスする物
理アドレスを提供するためのレジスタファイルポートア
クセス装置であって、現プロシージャから仮想アドレス（Ｒ）を受け取る入力
手段と、前記仮想アドレス（Ｒ）を予め決められた定数と比較し
て、該仮想アドレスがスタックレジスタのスタティック
レジスタを示すかどうかを判断する第１のコンパレータ
手段と、前記仮想アドレスをローカルリロケーション項（ｌｒｅ
ｌ）に加算して、第１の物理アドレスを形成する手段
と、前記仮想アドレスおよび前記第１の物理アドレス（ｒ）
のうちの一つを選択して、該選択されたアドレスを前記
レジスタファイルポートに接続する第１のマルチプレク
サ手段と、前記第１のマルチプレクサ手段に結合され、前記仮想ア
ドレスがスタックレジスタを示すならば前記第１の物理
アドレスを選択し、前記仮想アドレスがスタティックレ
ジスタを示すならば該仮想アドレスを選択し、これによ
り、スタックレジスタ参照を、前記現プロシージャに割
り当てられた物理レジスタアドレスに振り替える制御手
段と、前記仮想アドレス（Ｒ）を第１および第２の循環レジス
タポインタ値（ＢＯＲ，ＴＯＲ）と比較し、該仮想アド
レスが、前記現プロシージャに循環レジスタとして割り
当てられたレジスタを示すかどうかを判断する第２のコ
ンパレータ手段と、前記仮想アドレス（Ｒ）を第１の循環リロケーション項
（ｒｒｅｌ）に加算して、第１の物理アドレスを形成す
る手段と、前記仮想アドレス（Ｒ）を第２の循環リロケーション項
（ｒｒｅｌ＃）に加算して、第２の物理アドレスを形成
する手段と、前記第１および第２の物理アドレスのうちの一つを選択
し、該選択されたアドレスを、前記レジスタファイルポ
ートアドレス端子に結合する第２のマルチプレクサ手段
と、前記第２のマルチプレクサ手段を制御して、前記仮想ア
ドレス（Ｒ）が、前記循環レジスタセット内の回り込み
を示さなければ前記第１の物理アドレスを選択し、前記
仮想アドレスが前記循環レジスタ内の回り込みを示すな
らば前記第２の物理アドレスを選択する制御手段と、を
備え、前記第１の循環リロケーション項（ｒｒｅｌ）は、前記
ローカルリロケーション項（ｌｒｅｌ）に前記循環レジ
スタのベース値（ＲＲＢ）を加算したものに等しく、前
記第２の循環リロケーション項（ｒｒｅｌ＃）は、前記
循環レジスタベース値（ＲＲＢ）から前記循環レジスタ
セットのサイズを差し引いたものを、前記ローカルリロ
ケーション項（ｌｒｅｌ）に加算したものに等しく、こ
れにより、前記循環レジスタセット内の回り込みを調整
する、レジスタファイルポートアクセス装置。