JPH10207706A

JPH10207706A - ループとストライドの一方または両方の予測を行うロードターゲットバッファを具現するマイクロプロセッサ回路、システム、および方法

Info

Publication number: JPH10207706A
Application number: JP10031916A
Authority: JP
Inventors: Z N Kai George; ゼット．エヌ．カイジョージ; H Shell Johnathan; エィチ．シエルジョナサン
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1996-12-31
Filing date: 1998-01-05
Publication date: 1998-08-07
Anticipated expiration: 2018-01-05
Also published as: EP0855644B1; EP0855644A2; US5953512A; EP0855644A3; JP3830651B2

Abstract

(57)【要約】【課題】データプリフェッチによるデータへのアクセ
スの改善。【解決手段】複数のエントリ５６_１をそなえたロード
ターゲット回路５６の中の複数のエントリの各々には、
行をデータフェッチ命令に対応させるための値（ＡＤＤ
ＲＥＳＳＴＡＧ）が含まれる。更に、各ロードターゲ
ット回路行には複数のポインタ（ＰＯＩＮＴＥＲＡ，
ＰＯＩＮＴＥＲＢ，ＰＯＩＮＴＥＲＣ）も含まれ
る。複数のポインタの各々は、データフェッチ命令の生
起に対応するターゲットデータアドレスを記憶するため
のものである。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はマイクロプロセッサ
に関するものであり、更に詳しくはループとストライド
の一方または両方の予測を行うロードターゲットバッフ
ァを具現するマイクロプロセッサ回路、システム、およ
び方法に関するものである。

【０００２】

【従来の技術】マイクロプロセッサ技術は早いペースで
進歩し続けており、設計のすべての側面に考慮が払われ
ている。性能については、種々の関連および非関連のマ
イクロプロセッサ回路の速度および動作を改善すること
によりマイクロプロセッサ全体の、より早い速度が達成
されている。たとえば、動作効率が改善されている一つ
の領域は、並列と故障命令の実行を行えるようにするこ
とによって行われる。もう一つの例として、命令、デー
タの一方または両方を含む情報に対して、より早く、よ
り大きなアクセスが行えるようにすることによっても、
動作効率は改善される。本発明は主としてこのアクセス
能力を目指しており、更に詳しくはデータロード動作ま
たはデータ記憶動作に応答してこのようなデータをプリ
フェッチすることによりデータに対するアクセスを改善
することを目指している。

【０００３】情報に対するアクセス時間を改善すること
を目指している最新式のコンピュータシステムでの非常
に一般的な一つのアプローチは、システムの中に一つ以
上のレベルのキャッシュレベルを含めることである。た
とえば、キャッシュメモリをマイクロプロセッサ上に直
接形成すること、マイクロプロセッサが外部キャッシュ
メモリにアクセスすること、の一方または両方を行える
ようにする。通常、最低のレベルのキャッシュ（すなわ
ち、アクセスすべき最初のキャッシュ）は、階層構造で
それより上のキャッシュ（一つまたは複数）より小さ
く、早く、そして与えられたメモリの階層構造の中のキ
ャッシュ数は変わり得る。いずれにしても、キャッシュ
階層構造を使用するとき、情報アドレスが発せられると
き、アドレスを通常、最低レベルのキャッシュ宛てとす
ることにより、そのアドレスに対応する情報がそのキャ
ッシュに記憶されているか、すなわちそのキャッシュに
「ヒット」があるか調べる。ヒットが起きると、アドレ
ス指定された情報がキャッシュから検索され、メモリ階
層構造の中でより高位のメモリにアクセスする必要は無
い。ここで、より高位のメモリはヒットキャッシュメモ
リに比べて多分アクセスが遅い。これに反して、キャッ
シュヒットが生じなかった場合には、キャッシュミスが
生じたと言われる。次にこれに応じて、問題のアドレス
が次の、より高位のメモリ構造に呈示される。この次
の、より高位のメモリ構造がもう一つのキャッシュであ
る場合には、もう一度ヒットまたはミスが生じ得る。各
キャッシュでミスが生じた場合には、結局プロセスはシ
ステム内の最高位のメモリ構造に達し、その点で、その
メモリからアドレス指定された情報を検索することがで
きる。

【０００４】

【発明が解決しょうとする課題】キャッシュシステムが
存在するとした場合、速度を増大するためのもう一つの
従来技術の手法では、キャッシュシステムと組み合わせ
て、情報のプリフェッチが行われる。プリフェッチと
は、投機的検索、または情報検索の準備であって、情報
が外部メモリのような高位のメモリシステムから検索さ
れてキャッシュに入り、次の後続のクロックサイクル後
のある点で、予想される事象に対してマイクロプロセッ
サが検索された情報を必要とするものと想定している。
この点で、ロードの場合の方が多分、検索に関連してよ
り多く考えられるが、プリフェッチはデータの記憶にも
関連し得る。更に詳しく述べると、検索されたデータを
マイクロプロセッサが使用し得るように特定のデータが
検索される場合に、ロードが行われる。しかし、記憶動
作では、まず一群のデータが検索され、その群の一部が
上書きされる。更に、記憶質問のようないくつかの記憶
動作は、実際にデータを検索することはしないで、近づ
いている事象に対してマイクロプロセッサの外部のリソ
ースを用意する。この事象が情報をそのリソースに記憶
する。この「従来の技術」および後に続く「発明の実施
の形態」の目的のため、これらの各場合をプリフェッチ
の型と考えるべきである。いずれにしても、データを投
機的に検索してオンチップキャッシュに入れるプリフェ
ッチの場合に、プリフェッチを生じた予想された事象が
実際に生じると、プリフェッチされた情報は既にキャッ
シュに入っているので、キャッシュからフェッチするこ
とができ、高位のメモリシステムからそれを捜し求める
必要は無い。換言すれば、実際のフェッチが必要になっ
た場合、プリフェッチによりキャッシュミスの危険性が
低下する。

【０００５】

【課題を解決するための手段】上記の手法のもとで、本
発明者はマイクロプロセッサの中に、プリフェッチのた
めのアドレスとして使用すべきデータのアドレスを予測
するロードターゲットバッファ（ＬＴＢ）を設ける。更
に本発明では、比較的簡単なものからかなり複雑なデー
タパターンまでの範囲の種々の異なる型のデータパター
ンを識別した後に、予測する。したがって以下、これら
に対処する種々の実施例、および熟練した当業者が確か
め得る他の考慮を示す。

【０００６】一実施例では、ロードターゲット回路が提
供される。ロードターゲット回路には、複数のエントリ
が含まれる。ロードターゲット回路の中の複数のエント
リの各々には、行をデータフェッチ命令に対応させるた
めの値が含まれる。更に、各ロードターゲット回路行に
は複数のポインタも含まれる。複数のポインタの各々
は、データフェッチ命令の生起に対応するターゲットデ
ータアドレスを記憶するためのものである。他の回路、
システム、および方法も開示され、特許請求される。

【０００７】

【発明の実施の形態】図１には、全体が１０で表された
本発明の実施例によるマイクロプロセッサに基づくシス
テムのブロック図を示す。システム１０にはマイクロプ
ロセッサ１２が含まれており、マイクロプロセッサ１２
はバスＢをそなえている。図１２に関連して後で説明す
るように、バスＢは種々の外部装置に接続され得る。し
かし、実施例に対する状況を与える目的で、外部メモリ
１４だけがバスＢに接続されるものとして示されてい
る。付加的な品目については後で説明する。マイクロプ
ロセッサ１２はマイクロプロセッサ構造の種々の異なる
型を表すことができることに注意すべきである。熟練し
た当業者は、多数のこのような構造を知っているか、確
認することができる。しかし、この点で、図１の構成要
素に関連する以外のこのようなマイクロプロセッサに関
連する詳細は、説明を簡略にするために図示も、説明も
しない。

【０００８】図１のブロックでマイクロプロセッサ１２
には、当業者に知られている仕方のメモリ階層構造、す
なわち最低位の記憶システムから始まって、より高位の
記憶システムに向かうデータを読み書きする階層構造が
含まれている。このようなシステムの最低レベルには、
０レベルのデータキャッシュ回路があり、これは図１で
はＬ０データキャッシュ１６として示されている。「Ｌ
０」表示は当業者には知られているようにメモリ階層構
造の事柄を示す。詳しく述べると、低い数字が表示され
たキャッシュ回路は一般に、後で説明するＬ１およびＬ
２のデータキャッシュ回路のようなより高い数字の名称
をそなえたキャッシュ回路に比べて（後で説明する）マ
イクロプロセッサパイプラインの実行ユニットにより近
い。更にキャッシュの数字名称は、キャッシュから読ん
だり書いたりするときにキャッシュが通常アクセスされ
る上がっていく順番の表示を与える。このように、この
ようなアクセスはまずＬ０キャッシュに対して行われ、
そのキャッシュに対してキャッシュミスが生じた場合に
は、Ｌ１キャッシュに対するアクセスが続いて行われる
というようにメモリ階層構造を通っていき、ついにキャ
ッシュまたは他のメモリ構造にヒットが見出される。本
実施例ではＬ０データキャッシュ１６は、１６バイトの
ブロックで合計１Ｋバイトのデータを記憶するように動
作することができる４個の部分からなるセット対応の
（４−ｗａｙｓｅｔａｓｓｏｃｉａｔｉｖｅ）キャ
ッシュであり、各部分は一度に６４ビット（すなわち、
８バイト）を出力するように動作できることが好まし
い。

【０００９】マイクロプロセッサ１２には更にＬ１デー
タキャッシュ１８が含まれている。Ｌ１データキャッシ
ュ１８はバス１９を介してＬ０データキャッシュ１６に
接続される。この場合も、「Ｌ１」という名称はこのキ
ャッシュがメモリ階層構造でＬ０データキャッシュ１６
に比べて高位にあるということを必ず示す。本実施例で
はＬ１データキャッシュ１８は、３２バイトのブロック
で合計８Ｋバイトのデータを記憶するように動作するこ
とができる２個の部分からなるセット対応のキャッシュ
であり、各部分は一度に１２８ビット（すなわち、１６
バイト）を出力するように動作できることが好ましい。

【００１０】システム１０には、Ｌ２統合キャッシュ２
０も含まれている。Ｌ２統合キャッシュ２０は、３２バ
イトのサブブロックをそなえた６４バイトのブロックで
合計６４Ｋバイトのデータを記憶するように動作するこ
とができる４個の部分からなるセット対応のキャッシュ
であり、各部分は一度に２５６ビット（すなわち、３２
バイト）を出力するように動作できることが好ましい。
Ｌ２キャッシュを統合キャッシュと呼ぶのは、データを
記憶する他に他の情報も記憶するということを意味する
ということに注意すべきである。詳しく述べると、後で
示すように、Ｌ２統合キャッシュ２０はアドレス変換情
報の他に、命令も記憶する。しかし、代替実施例では、
情報の型（一つまたは複数）が変わり得るということに
注意すべきである。いずれにしてもこのときデータに対
して、Ｌ０データキャッシュ１６からＬ１データキャッ
シュ１８に、そしてＬ２統合キャッシュ２０へとメモリ
階層構造が形成されるということに注意すべきである。
したがって、Ｌ２統合キャッシュ２０のアドレス指定を
生じ得る第一の発生源は、Ｌ１データキャッシュ１８の
ミスに応答するＬ１データキャッシュ１８である。Ｌ１
データキャッシュ１８のミスはＬ０データキャッシュ１
６のミスから生じる。更にキャッシュミスを生じた各フ
ェッチの場合、この階層構造の次の、より高いレベルで
データが捜し求められる。したがって、Ｌ２統合キャッ
シュ２０でミスが生じた場合には、データは外部メモリ
１４からアドレス指定される。Ｌ２統合キャッシュ２０
にはアクセス制御器２２も含まれていることにも注意す
べきである。後で詳細に説明するように、アクセス制御
器２２はＬ２統合キャッシュ２０にアクセスするように
という要求を受ける。ここでそれらの要求は、Ｌ２統合
キャッシュ２０から情報をフェッチまたはプリフェッチ
するためのものである。

【００１１】Ｌ２統合キャッシュ２０に関連する図１に
示された他の情報径路について説明する前に、バスＢに
向かう上向きの図１の説明を完了するものとして、Ｌ２
統合キャッシュ２０は更にバス２４を介してバスインタ
フェースユニット（ＢＩＵ）２６に接続され、ＢＩＵ２
６はバスＢに接続される。前に示唆したように、バスＢ
によりマイクロプロセッサ１２からの外部アクセスが可
能となり、したがってマイクロプロセッサ１２と外部メ
モリ１４等のマイクロプロセッサ外部の他の要素との間
の通信を制御し、遂行することができる。熟練した当業
者には明らかなように、外部メモリ１４はメモリ階層構
造でＬ２統合キャッシュ２０より高位である（そしても
ちろん、Ｌ１データキャッシュ１８およびＬ０データキ
ャッシュ１６よりも高位である）。もう一つの例とし
て、バスＢと主メモリ１４との間に外部キャッシュを接
続してもよい。このようにして、マイクロプロセッサ１
２はこのような外部キャッシュと通信することができ
る。更にもう一つの例として、マイクロプロセッサ１２
は多マイクロプロセッサシステムで他のマイクロプロセ
ッサと通信してもよい。たとえば、それらの他のマイク
ロプロセッサのオンチップメモリと通信してもよい。い
ずれにしても、これらの外部装置は例としてのものであ
り、この点で、マイクロプロセッサ１２の外部の付加的
な要素は簡単さのため詳細に説明しない。このような要
素の例は熟練した当業者は知っていたり、確かめること
ができる。

【００１２】上記のように、Ｌ２統合キャッシュ２０も
命令を記憶する。これについては、Ｌ２統合キャッシュ
２０のアドレス指定を生じ得る第二の発生源はＬ１命令
キャッシュ２８である。詳しく述べると、Ｌ１命令キャ
ッシュ２８はバス３０を介してＬ２統合キャッシュ２０
に接続される。その名前が示すように、Ｌ１命令キャッ
シュ２８は（Ｌ１データキャッシュ１８にデータが記憶
されるのに対して）命令を記憶する。実施例では、Ｌ１
命令キャッシュ２８はＬ１データキャッシュ１８と同様
の構成と大きさになっており、したがって合計８Ｋバイ
トの情報を記憶するように動作することができる２個の
部分からなるセット対応のキャッシュであることが好ま
しい。ここでは、情報は３２バイトのブロックの命令で
あり、各部分は一度に１２８命令ビット（すなわち、１
６バイト）を出力するように動作することができる。

【００１３】Ｌ２統合キャッシュ２０のアドレス指定を
生じ得る第三の発生源はトランスレーション・ルックア
サイド・バッファ（ＴＬＢ）３２である。詳しく述べる
と、ＴＬＢ３２はバス３４を介してＬ２統合キャッシュ
２０に接続されている。実施例では、マイクロプロセッ
サの分野では普通に行われているように、論理命令アド
レスは対応する物理的アドレスに翻訳（ｔｒａｎｓｌａ
ｔｅ）される。このような状況においてＴＬＢ３２はい
くつかの既存の翻訳のテーブルを記憶しているので、後
続の時点にこのような翻訳にアクセスすることができ、
翻訳を再計算する必要は無い。更に、ＴＬＢ３２の探索
にミスがあった場合には、ＴＬＢ３２に結合されたハー
ドウェアは主メモリのページテーブルを通るテーブルウ
ォークを開始することにより、アドレス翻訳を決定す
る。これらの主メモリページテーブルは一部または全部
をＬ２統合キャッシュ２０に記憶してもよい。実施例で
は、ＴＬＢ３２は２５６エントリ、４個の部分からなる
セット対応のものであり、各行が単一の翻訳を記憶する
ような大きさになっていることが好ましい。

【００１４】図１に示すように異なるレベルのキャッシ
ュがあるが、このようなキャッシュは各々、仲裁回路３
６にも接続される。仲裁回路３６は、低位のキャッシュ
のミスに基づいて各キャッシュへの相次ぐアクセスの一
般的な動作を示すために含まれる。たとえば、上記のよ
うに、Ｌ０データキャッシュ１６へのキャッシュアクセ
スがキャッシュミスになった場合、Ｌ１データキャッシ
ュ１８がアクセスされ、次にＬ２統合キャッシュ２０が
アクセスされというようにして、以下同様に行われる。
したがって仲裁回路３６は、動作に対する仲裁制御を表
し、熟練した当業者は種々のやり方でこれを具現するこ
とができる。仲裁回路３６はＬ２統合キャッシュ２０の
アクセス制御器２２にも接続されていることに注意すべ
きである。このようにして、より低レベルのキャッシュ
のミスに基づいてＬ２統合キャッシュ２０に対するアク
セス要求が示されたとき、仲裁回路３６はこのアクセス
要求をアクセス制御器２２に与える。しかし、後で詳し
く説明するように、アクセス制御器２２は付加的な制御
レベルも表し、これによりこれらの要求は順位をつけて
表に並べられ、優先順位に基づいてＬ２統合キャッシュ
２０に再送出される。

【００１５】Ｌ２統合キャッシュ２０のアドレス指定を
生じ得る第四の発生源は、Ｌ２統合キャッシュ２０にス
ヌーブ（ｓｎｏｏｐ）要求を出す任意の回路である。当
業者には知られているように、スヌープはメモリ階層構
造の異なるレベルを通してメモリの一貫性を確実にする
機能である。スヌープ要求はマイクロプロセッサの内部
または外部で発生することができる。通常、スヌーブ
は、メモリシステムの一つ以上のレベルに対するアドレ
スを示すことにより行われる。図１でこの機能は、ＢＩ
Ｕ２６から仲裁回路３６へのスヌープアドレス入力とし
て示されている。仲裁回路３６は図１のキャッシュ構造
のいずれかにスヌープアドレスを示すことができる。各
キャッシュには、一貫性プロトコルを具現するというよ
うな当業者には知られている要因に応じて種々の仕方で
スヌープアドレスに応答するように指示することができ
る。たとえば、スヌープアドレスに対応する情報を記憶
しているか確かめることだけを行うようにキャッシュに
指示することができる。もう一つの例として、スヌープ
アドレスに対応する情報をそなえていれば、このような
情報を出力するようにキャッシュに指示することができ
る。更にもう一つの例として、スヌープアドレスに対応
する情報をそなえていれば、このような情報を無効にす
るようにキャッシュに指示することができる。いずれに
してもスヌープアドレスは、Ｌ２統合キャッシュ２０に
対する更にもう一つの潜在的なアドレスとなる。

【００１６】マイクロプロセッサ１２のアドレス指定可
能なメモリ階層構造の種々の構成要素を示したか、次
に、メモリ階層構造からのアドレス指定可能な情報を必
要とするマイクロプロセッサの構成要素について説明す
る。これについては、マイクロプロセッサ１２には全体
を３８で表したパイプラインが含まれる。パイプライン
３８を使用して、複合命令セットコンピュータ（ＣＩＳ
Ｃ：ｃｏｍｐｌｅｘｉｎｓｔｒｕｃｔｉｏｎｓｅｔ
ｃｏｍｐｕｔｅｒ）で命令を受けて、処理することが
できる。パイプライン３８は４０から５０までの偶数の
参照番号を付した６段階をそなえるものとして例示され
ている。４０から５０までの各段階は、いくつかの点に
おいて、当業者には知られている段階（一つまたは複
数）を表しており、異なる構成の中では名前や機能が異
なることがあり得る。したがって、以下の説明は例を示
すものであり、発明の実施例を限定するものではない。
パイプライン３８について一般的に注意すべきことは命
令を開始段で受けるということである。本例では、開始
段は命令フェッチ段４０である。命令フェッチ段４０に
は、ブランチターゲットバッファ（ＢＴＢ）４１が含ま
れる。ブランチターゲットバッファ（ＢＴＢ）４１は、
当業者には知られているようにブランチ命令の状況で命
令のフェッチを助ける。段４０による命令フェッチは、
上記のようなＬ１命令キャッシュ２８からの第一のレベ
ルで行われる。命令フェッチによっては、特にメモリ階
層構造システムのより遅い構成要素にアクセスするため
に、１クロックサイクルより長い間、パイプラインを停
止させることがあり得るということに注意すべきであ
る。代表的には、受信された命令はその後、一つ以上の
復号段４２で復号される。したがって、パイプラインに
は整数個の復号段が含まれ得るが、パイプライン３８に
は例としてこのような復号段４２が一つしか含まれてい
ない。通常、復号プロセスは多段（ずなわち、多クロッ
ク）プロセスであることは理解されるはずである。復号
段４２（一つ以上の段）はより複雑な命令を伸長して、
本明細書でマイクロオペレーションコードと呼ぶ一つ以
上の簡単なオペレーンョンとする。これらのマイクロオ
ペレーションコードは、代表的には単一の実行クロック
で実行させることができる。マイクロオペレーションコ
ードは構成や製造者により異なる名前が付けられている
ことに注意すべきである。たとえば、テキサスインスツ
ルメント社の規格では、マイクロオペレーションコード
はアトミックオペレーション（ＡＯｐ）と呼ばれる。こ
れらのＡＯｐは全体として完成すれば、そのオプコード
とオペランドがある場合にはそれらを含む命令セット命
令の完成と卒業を表す。ＡＯｐはいくつかのＲＩＳＣ命
令とほぼ同等であるので、マイクロプロセッサの種々の
部分に接続されて、復号された命令の実行を次に開始す
るコードであることに注意すべきである。したがって、
ＡＯｐは他の構成でＲＯｐ、μＯｐ、またはＲＩＳＣ８
６命令と呼ばれるものと同等である。

【００１７】復号段４２からマイクロオペレーションコ
ードが発生すると、スケジュール段４４がマイクロプロ
セッサの対応する適当な実行ユニットに対してそれらの
コードを指定する。いくつかの協定では、スケジュール
段は各マイクロオペレーションコードのそれの実行ユニ
ットへの発行と呼ばれる。たとえば、マイクロプロセッ
サに三つの実行ユニット（たとえば、演算ユニット、ロ
ード／記憶ユニット、および浮動小数点ユニット）が含
まれている場合には、対応する各実行ユニットは３個以
内のマイクロオペレーションコードの群を形成して、単
一のクロックサイクルでの実行に対して割り当てること
ができる。実際には、たとえば、演算ユニットが１個よ
り多く、ロード／記憶ユニットが１個より多いというよ
うにして、マイクロプロセッサが３個より多い実行ユニ
ットを含むことがあり得る。このような場合には、単一
のクロックサイクルで実行すべきマイクロオペレーショ
ンコードの数をそれに応じて増大することができる。本
明細書で使用する用語として、マイクロオペレーション
コードの群はその大きさにかかわらず、「マシンワー
ド」と呼ばれる。このようなマシンワードが実行リソー
ス当たり５０ビット以上を必要とすることもまれでない
ので、三つの実行ユニットをそなえたマイクロプロセッ
サは幅が１５０ビットのオーダのマシンワードに応答し
て動作することがあり得る。

【００１８】スケジュール段４４に続く段の説明をする
前に、マシンワードは上記の代わりとして異なる発生源
から、すなわちマイクロプログラムメモリ５２から来る
ことがあるということにも注意すべきである。マイクロ
プログラムメモリはこの分野ではマイクロＲＯＭと呼ば
れることが多い。マイクロプログラムメモリ５２は一般
に、マシンワードの種々の列（ｔｈｒｅａｄ）で予めプ
ログラミングされたＲＯＭである。マイクロプログラム
メモリ５２の出力は、スケジュール段４４の出力と同様
にマルチプレクサ５４の入力として接続される。その結
果として、ここでは詳細に説明する必要のない種々の制
御信号に応答してマルチプレクサ５４は、スケジュール
段４４からのマシンワードではなくてマイクロプログラ
ムメモリ５２からのマシンワードを次の後続の段に与え
る。更に詳しく述べると、マイクロプログラムメモリ５
２に対するエントリポイントアドレスを発生することが
できる。この場合、このような列の最初のマシンワード
が出力され、次に後続の各クロックサイクルの間に列の
中の後続のマシンワードを出力することができる。した
がって、このブロセスを繰り返すことにより、マイクロ
プログラムメモリ５２からの全体の列の中の一つの列が
パイプライン３８の残りに送られる。パイプライン３８
の残りは次にマイクロプログラムメモリの列の中の各マ
シンワードを実行し、完了することができる。

【００１９】マルチプレクサ５４の後のオペランドフェ
ッチ段４６は、現在発せられているマシンワードの中の
マイクロオペレーションコードのいずれか一つ以上を実
行するために必要な任意のデータをフェッチする。代表
的にはこのデータには、レジスタまたはメモリからフェ
ッチされたオペランドが含まれる。メモリからデータを
検索する状況で、段４６はＬ０データキャッシュ１６に
接続され、そのキャッシュからデータを捜す。この場合
も、そのキャッシュレベルでミスが生じると、熟練した
当業者には明らかなように、より高位のレベル、たとえ
ばＬ１データキャッシュ１８、Ｌ２統合キャッシュ２
０、または外部メモリ１４からデータを捜す。命令フェ
ッチと同様に、いくつかのデータフェッチも１クロック
サイクルより長くパイプラインを停止させることがあ
る。

【００２０】実行段４８には、一つ以上の演算ユニッ
ト、一つ以上のロード／記憶ユニット、および浮動小数
点ユニットのような多数の実行ユニットが含まれる。こ
のような各ユニットに対して、ユニットはマシンワード
のそれに対応する部分を実行する。すなわち、各実行ユ
ニットはそれに割り当てられたマイクロオペレーション
コードでそれに対応する機能を遂行する。実行段４８の
一つ以上の実行ユニットがデータにアクセスすることも
ある。したがって、段４８はＬ０データキャッシュ１６
にも接続され、その接続により、マイクロプロセッサ１
２のメモリ階層構造でそのキャッシュより高位の付加的
なデータ記憶構造だけでなく、そのキャッシュにもアク
セスする。

【００２１】最後に、段５０は命令を卒業する。これは
命令を完了し、マイクロプロセッサの構成された状態に
対して、もしあればその命令の影響を及ぼすということ
を意味する。更に、命令の結果があれば、それがレジス
タファイルのようなある記憶装置に書き込まれる。この
最後の動作は一般にライトバック（ｗｒｉｔｅｂａｃ
ｋ）と呼ばれ、ときにはパイプラインの最終段の一部で
ないが、命令の卒業と同時に生じる機能と考えられる。

【００２２】以上の説明から熟練した当業者には明らか
なように、マイクロプロセッサ１２にはそのメモリ階層
構造からの情報にアクセスできる種々の回路が含まれ、
その情報はデータ、命令、またはアドレス翻訳テーブル
のいずれであってもよい。ここまで説明したアクセスは
このような情報の実際のフェッチを処理する。すなわ
ち、その情報がパイプライン３８に直接フェッチされる
情報の検索を処理する。代表的には、フェッチされた情
報は、それがフェッチされたサイクルの直後のクロック
サイクルで作用を受ける。たとえば、命令フェッチ段４
０により第一のクロックサイクルでフェッチされた命令
は、第一のクロックサイクルに続く次のクロックサイク
ルに復号段４２により復号することができる。もう一つ
の例として、第一のクロックサイクルにデータフェッチ
段４６によりフェッチされるデータは、第一のクロック
サイクルに続く次のクロックサイクルに、実行段４８の
実行ユニットが使用することができる。最後に、注意す
べきことは、上記のアクセスの型は説明のためのもので
あり、アクセスの他の型も熟練した当業者は確かめるこ
とができる。たとえば、ある命令は、パイプラインの種
々の異なる段階のいずれかにあるとき、メモリの階層構
造にアクセスして、情報をパイプラインにフェッチする
ことができる。更に、上記のパイプライン３８の説明は
単に例示のためのものである。したがって当業者には知
られているように、他の型のパイプライン構成の種々の
パイプライン段を通るときに、命令は情報をパイプライ
ンにフェッチすることができる。

【００２３】フェッチによる情報のアクセスについて説
明してきたが、システム１０には、フェッチではなくて
プリフェッチを必要とする情報アクセスに関する種々の
回路および方法も含まれる。プリフェッチがフェッチと
異なるのは、プリフェッチされた情報は受信するとすぐ
に情報に作用する必要が実際にあるので、検索されるの
ではなくて投機的に検索されるという点である。本実施
例では、後で説明するようにシステム１０のメモリ階層
構造を通る実効アクセス時間を短縮するためにプリフェ
ッチが使用される。更に、上記の「従来の技術」で説明
したように、プリフェッチはロード、データ記憶、また
は記憶質問のような場合に関係し得る。いずれにしても
この点で、後の実施例の理解を容易にするため、前置き
の説明を行う。前に述べたように、外部メモリ１４に記
憶される情報は種々のキャッシュにも記憶され、異なる
キャッシュを特徴付けているのは、一部はメモリ階層構
造の中でのそれらの位置と、与えられたキャッシュが記
憶する情報の型である。プリフェッチの場合、マイクロ
プロセッサ１２の中の種々の回路（それらの回路につい
ては後で説明する）の中の一つがプリフェッチを希望す
ると、要求する回路は所望の情報に対応するプリフェッ
チ要求を発する。後で詳細に述べるように、プリフェッ
チ要求には少なくとも所望の情報のアドレスと所望の情
報の大きさについての何らかの表示（たとえば、バイト
数）が含まれることが好ましい。実施例ではプリフェッ
チ要求が、より低レベルのキャッシュ構造ではなくて、
Ｌ２統合キャッシュ２０に直接結合されることに注意す
べきである。換言すれば、フェッチ要求と異なりプリフ
ェッチ要求は、その要求により捜される特定の型の情報
を記憶しているかも知れない最低レベル（一つまたは複
数）のキャッシュにはアクセスしない。このアプローチ
が行われる理由は、実施例ではＬ２統合キャッシュ２０
はその情報が下方包括的であるからである。換言すれ
ば、Ｌ２統合キャッシュ２０より下位のキャッシュ内の
どの情報もＬ２統合キャッシュ２０にも記憶されている
からである。たとえば、Ｌ１データキャッシュ１８が情
報のキャッシュ列を記憶する場合には、その同じ情報が
Ｌ２統合キャッシュ２０にも記憶される。したがって、
プリフェッチ動作がＬ２統合キャッシュ２０に発せられ
てキャッシュミスになった場合、それより低位のキャッ
シュはどれも要求された情報を記憶していないこともわ
かるので、プリフェッチ動作を続行して、チップ上の情
報をＬ２統合キャッシュ２０に入れることが有益であ
る。一旦情報がチップ上にもたらされると、その後、そ
の情報が必要になった場合、より容易にアクセスできる
（すなわち、少なくともＬ２統合キャッシュ２０でアク
セスできる）ので、外部アクセスは必要でない。したが
って、これに関して注意すべきことは、プリフェッチの
利点のほとんどはプリフェッチされたデータをオンチッ
プで持ってくることにより行われる。換言すれば、プリ
フェッチが無くて、その情報に対するフェッチが後で発
せられ、その情報をオフチップで検索しなければならな
い場合には、このアクセスのために多数のクロックサイ
クルが必要になると思われる。しかし、情報をオンチッ
プでプリフェッチすることにより、オンチップキャッシ
ュの中の少なくとも１個から情報を入手することができ
る。したがって、その情報にアクセスするための時間
は、オフチップアクセスで必要とされる時間に比べてか
なり短くなる。更に、プリフェッチ動作がＬ２統合キャ
ッシュ２０に発せられてキャッシュヒットになった場
合、情報はＬ２統合キャッシュ２０から入手でき、Ｌ２
統合キャッシュ２０に比べて階層構造でより低位のキャ
ッシュからさえも入手できることがわかっている。した
がって、いずれの位置でも、オフチップリソースから情
報を検索しなければならない場合に比べて比較的短い期
間内に、情報にアクセスすることができる。この好まし
い動作の付加的な利点については、後で説明する。いず
れにしても、付加的な介在無しに、一旦プリフェッチ要
求がＬ２統合キャッシュ２０に示されると、Ｌ２統合キ
ャッシュ２０がその情報を記憶していることを一般的に
確かめることができるか、またはその情報をより高位の
レベルのメモリから検索してＬ２統合キャッンュ２０に
入れることができる。代替案として、プリフェッチされ
た情報をマイクロプロセッサ１２の中の何か他のリソー
スに、たとえば一群のプリフェッチバッファの中に記憶
してもよい。ここで、それらのバッファはＬ２統合キャ
ッシュ２０の一部であるか、または別個の構造である。
いずれにしても、一旦情報がプリフェッチされれば、そ
して投機的プリフェッチが正しければ、すなわち、その
情報がその後実際のフェッチに必要であれば、これはキ
ャッシュ（Ｌ２統合キャッシュ２０）または他のオンチ
ップリソースからアクセス可能であるので、情報に対す
る実効アクセス時間が最小化される。

【００２４】プリフェッチの上記の説明で更に注意すべ
きことは、次のような、本実施例が扱う二つの考慮すべ
き問題が生じるということである。第一に、どの回路が
プリフェッチを発するかという考慮すべき問題がある。
第二に、プリフェッチ情報のアクセスは付加的な介在無
しに上記のようにしてＬ２統合キャッシュ２０に対して
進むと前に述べたが、後で詳しく説明するように本実施
例は場合によってはプリフェッチ機能で介在する回路お
よび方法を提供する。

【００２５】上記したように、実施例では種々の回路が
プリフェッチを発し得る。これに関してまず注意すべき
ことは、実際のフェッチを発し得る上記の回路のいくつ
かはプリフェッチ要求も発し得るということである。た
とえば、実行段４８はデータに対するプリフェッチ要求
を、たとえばそれの一つ以上のロード／記憶ユニットの
動作により発することができる。もう一つの例として、
当業者にはＢＴＢは命令に対する実際のフェッチを発す
る（すなわち、直ちに復号等を行うためパイプラインに
配置するために実際のフェッチを発する）ことが知られ
ているが、本実施例では命令フェッチ段４０のＢＴＢ
（ブランチターゲットバッファ）４１もプリフェッチ要
求を発することができるので、一つ以上の命令がＬ２統
合キャッシュ２０にプリフェッチされる。これについて
は、本発明と出願人が同じで、に出願され、ここに引用
されている米国特許出願第号、「マイクロプ
ロセッサにおけるブランチ予測とキャッシュプリフェッ
チの組み合わせ」（ＣｏｍｂｉｎｅｄＢｒａｎｃｈ
ＰｒｅｄｉｃｔｉｏｎＡｎｄＣａｃｈｅＰｒｅｆ
ｅｔｃｈＩｎＡＭｉｃｒｏｐｒｏｃｅｓｓｏｒ）
（代理人処理番号ＴＩ−２４１５４）を参照できる。マ
イクロプロセッサ１２には、プリフェッチ要求を発する
ことができる付加的な回路が含まれる。詳しく述べると
マイクロプロセッサ１２には更に、Ｌ２統合キャッシュ
２０に接続されたロードターゲットバッファ（ＬＴＢ）
５６も含まれる（ただし代替実施例では、それが発する
プリフェッチ要求はどこか他の所に、たとえば、より低
レベルのキャッシュ（一つまたは複数）に接続すること
ができる）。この点で、そして前置きとして注意すべき
ことはＬＴＢ５６に、あるデータフェッチ命令のアドレ
ス、およびそれらの命令により将来、どのデータが使用
されるかに基づくマイクロプロセッサ１２による予測が
含まれる。このようにして、一旦データフェッチ命令自
身がパイプライン３８にフェッチされると、ＬＴＢ５６
を使用してデータフェッチ命令に対応するエントリをそ
なえているか判定する。そうであれば、その予測および
多分、データフェッチ命令に対応する他の情報に基づい
て、ＬＴＢ５６はＬ２統合キャッシュ２０にプリフェッ
チ要求を発することができる。他の介在無しに、Ｌ２統
合キャッシュ２０から始まってメモリ階層構造を通って
上向きに伝搬するプリフェッチ動作によりプリフェッチ
要求に応答するので、データが現在オンチップである
（そのキャッシュの一つの中にある）と確認されるか、
またはそれがプリフェッチ要求に応答してマイクロプロ
セッサ上に検索することができる。したがって、一旦検
索された場合、命令がパイプライン３８を通るときにデ
ータフェッチ命令がデータを要求すれば、データは後続
の使用に利用できる。他の介在が無い場合にプリフェッ
チ要求に応答してプリフェッチ動作が行われるというこ
とを少し前に説明した。しかし、これについては場合に
よって、要求に応答するプリフェッチ動作は他のシステ
ムパラメータに基づいて抑制または変形することができ
る。このようなシステムの更に詳しい情報については、
本発明と出願人が同じで、本発明と同じ日に出願され、
ここに引用されている米国特許出願第号、「マイクロプ
ロセッサに基づくシステムでプリフェッチ処理のための
回路、システム、および方法」（Ｃｉｒｃｕｉｔｓ，Ｓ
ｙｓｔｅｍｓ，ＡｎｄＭｅｔｈｏｄｓＦｏｒＰｒｅ
ｆｅｔｃｈＨａｎｄｌｉｎｇＩｎＡＭｉｃｒｏ
ｐｒｏｃｅｓｓｏｒ−ＢａｓｅｄＳｙｓｔｅｍ）（代
理人処理番号ＴＩ−２４１５３）を参照できる。

【００２６】ＬＴＢ５６はデータフェッチ命令によって
フェッチすべきデータのアドレスを予測する。説明の目
的で、このデータをターゲットデータと呼び、そのアド
レスをターゲットデータアドレスと呼ぶことにする。Ｌ
ＴＢ５６の予測に応答して、データフェッチ命令が実行
される前に、ターゲットデータアドレスのターゲットデ
ータをマイクロプロセッサチップ上のキャッシュ（たと
えば、Ｌ２統合キャッシュ２０）または他のメモリ構造
にプリフェッチすることができる。したがって、その後
データフェッチ命令がデータを要求すると、何か外部記
憶装置からデータをフェッチしないで、オンチップキャ
ッシュまたはメモリ構造からデータをフェッチすること
ができる。換言すれば、このようにしてプリフェッチす
ることにより、キャッシュミスのコストが低減されるの
で、マイクロプロセッサの効率が向上する。しかし、プ
リフェッチの利点があるとして、この利点が実現される
のは、ＬＴＢが与えられたデータフェッチ命令に対する
データパターンを正確に予測できる場合だけである。後
で詳細に説明するように、本実施例は種々の複雑なデー
タパターンに対して正確な予測を与えることにより従来
の技術を改善する。

【００２７】少なくとも現在の出版物は科学分野のソフ
トウェアを対象とした簡単なロードターゲットの予測に
ついて論じており、したがって、このようなソフトウェ
アでしばしば出会うデータ構造を対象としている。これ
と異なり、本発明者は業務のためのデータレコード処理
ソフトウェアは科学および技術のソフトウェアと異な
る、かなり異なる型のデータ構造を含むことを認識し
た。したがって、現在のＬＴＢはこのような異なるデー
タ構造に対して良好に適合していない。したがって本発
明者は本明細書で、データレコード処理ソフトウェアに
対して特に有益なターゲットデータのプリフェッチを許
容する種々の実施例を示す。レコード処理ソフトウェア
とはレコード集約的なプログラムを表わそうとしてい
る。レコードのファイル内の各レコードに対して、命令
のループが繰り返されることが多い。この概念を更に導
入するために、図２ａは全体を６０で表した簡単なレコ
ードを示しており、このレコードには例として６０ａか
ら６０ｅまでの５個のフィールドが含まれている。もち
ろん、これより少ない数またはより多い数のフィールド
を使用してもよく、それらのフィールドの主題は非常に
変化してもよい。図２ａの例は、後の説明のために一般
的な状況を示している。レコード６０の最初のフィール
ド６０ａはＥＭＰＬＯＹＥＥＮＡＭＥ（従業員の氏
名）を表し、残りのフィールドはその従業員の属性を指
定する。詳しく述べると、第二のフィールド６０ｂはそ
の従業員のＩ．Ｄ．ＮＵＭＢＥＲ（ＩＤ番号）を表し、
第三のフィールド６０ｃはその従業員のＨＯＵＲＬＹ
ＷＡＧＥ（時給）を表し、第四のフィールド６０ｄはそ
の従業員のＨＯＵＲＳＷＯＲＫＥＤＦＯＲＴＨＥ
ＰＡＳＴＭＯＮＴＨ（先月の労働時間）（以後ＨＯ
ＵＲＳＷＯＲＫＥＤ（労働時間）と略す）数を表す。
第五のフィールド６０ｅは、後でより良く理解できるよ
うに、フィールド６０ｃおよび６０ｄに基づくその従業
員に対するＰＡＹＤＵＥ（支払い賃金）を表す。

【００２８】後の説明に対する背景を示すため、図２ｂ
は４個のレコード６２、６４、６６、および６８を示
す。これらは図２ａのレコード６０のフォーマットに従
っている。しかし、この場合も後の説明のための例を示
すため、レコード６２、６４、６６、および６８の各々
に対して特定の情報が与えられている。たとえば、レコ
ード６２には、ＥＭＰＬＯＹＥＥＮＡＭＥ（従業員氏
名）としてアベ・アダムス（ＡｂｅＡｄａｍｓ）、そ
のＩ．Ｄ．ＮＵＭＢＥＲ（ＩＤ番号）として１２３、そ
のＨＯＵＲＬＹＷＡＧＥ（時給）として６．５０ド
ル、そのＨＯＵＲＳＷＯＲＫＥＤ（労働時間）数として
１８５、そのＰＡＹＤＵＥ（支払い賃金）として１２
０２．５０ドルがリストされている。熟練した当業者
は、各フィールドのデータについて再度説明しなくて
も、レコード６４、６６、および６８の各々に対してど
のようにこのデータが示されているか理解できるはずで
ある。また、レコード６２、６４、６６、および６８に
示された実際の情報フィールドは虚構で作成されたデー
タに過ぎず、したがって、生死にかかわらず、いかなる
個人をも反映したものではない。

【００２９】本実施例がＬＴＢ技術に関連するものであ
るとして、ＬＴＢ５６の予測が充分な回数、正確である
場合には、ＬＴＢ５６の使用はマイクロプロセッサの効
率を改善する。これに関して、レコードフォーマットを
導入し、本発明者はデータレコードを処理するためのあ
る公知の手法の環境で予測が充分に許容できるようにす
るためのＬＴＢ５６の構成の仕方を理解した。図３はこ
のような手法の一つを紹介するものである。詳しく述べ
ると、データレコード処理ソフトウェアにより普通に使
用される一つの手法では、三つの別々のメモリエリアを
使用して、三つの異なるデータレコードの処理が重なり
合えるようにする。このプロセスを示すため、図３には
ＡＲＥＡ１、ＡＲＥＡ２、ＡＲＥＡ３と名付けられた三
つの、このようなメモリエリアが示されている。代表的
には、図３に関連して説明したやり方で使用されるＡＲ
ＥＡはメモリ内の別々のページであるが、メモリエリア
を供するための他の手法を使用してもよい。いずれにし
ても、三つのＡＲＥＡの中の各エリアの位置は、その開
始アドレスによりソフトウェアにはわかる。説明のため
の例を示すため、ＡＲＥＡ１はメモリのアドレス１２０
０で始まり、ＡＲＥＡ２はメモリのアドレス２２００で
始まり、ＡＲＥＡ３はメモリのアドレス５２００で始ま
るものとする。例示のため、種々のＡＲＥＡのアドレス
は熟練した当業者には理解されるように１６進数であ
る。

【００３０】一旦、図３のＡＲＥＡの位置がわかれば、
各ＡＲＥＡはすぐ後に説明するようにレコードファイル
のレコードの中の一つのレコードに対する一時的な作業
スペースとして使用される。例として図２ｂのレコード
を使用すると、各メモリＡＲＥＡは相次ぐレコードのた
めに使用される。更に、このようなＡＲＥＡの使用は次
のように重なり合う。図３でｔ１と示された第一の時点
に、ＡＲＥＡ１の開始アドレスである１２００から始ま
って、データレコードがＡＲＥＡ１にフェッチされる。
したがって本例では、図２ｂからのレコード６２がＡＲ
ＥＡ１にフェッチされる。第五のフィールド（すなわ
ち、ＰＡＹＤＵＥ（支払い賃金））が図３に示されて
いるが、その値は最初はレコードの中に無くて、後で説
明するように、後で計算されて、メモリに書き込まれる
ことに注意すべきである。また注意すべきことは、この
ようなレコード６２の入力は代表的には、別個のダイレ
クトメモリアクセス制御器（ＤＭＡ）等を使用するなど
して、中央処理装置（ＣＰＵ：Ｃｅｎｔｒａｌｐｒｏ
ｃｅｓｓｉｎｇｕｎｉｔ）に負担をかけることなく行
われるということである。このようにして、ｔ１の間
に、ＤＭＡを使用して、ディスク記憶装置のようなある
記憶装置からレコード６２がフェッチされ、ＡＲＥＡ１
の開始アドレスである１２００から始まってＡＲＥＡ１
に入力される。図３でｔ２で示される第二の時点には、
データレコードがＡＲＥＡ２の開始アドレスである２２
００から始まってＡＲＥＡ２にフェッチされる。したが
って本例では、図２ｂからのレコード６４がＤＭＡを介
してＡＲＥＡ２に入力される。しかしｔ２の間で更に注
意すべきことは、レコード６４がＡＲＥＡ２に入力され
ている間に、ＡＲＥＡ１のレコード６２がＣＰＵによっ
て処理されつつあるということである。すなわち、レコ
ード６２のフィールドは、それらのフィールドのどれか
を読み出すため、そしてそれらのフィールドに情報を書
き込むためにプログラムコードが利用できる。その後、
図３でｔ３で示される第三の時点には、データレコード
がＡＲＥＡ３の開始アドレスである５２００から始まっ
てＡＲＥＡ３にフェッチされる。したがって本例では、
図２ｂからのレコード６６がＤＭＡを介してＡＲＥＡ３
に入力される。しかし、ＡＲＥＡ１とＡＲＥＡ２の両方
が既にレコードを受けているので、ｔ３の間で更に注意
すべきことは、ＤＭＡを介してレコード６６がＡＲＥＡ
３に入力されている間に、ＡＲＥＡ２のレコード６４が
処理されつつあり、ＡＲＥＡ１のレコード６２が出力さ
れつつあるということである。ＡＲＥＡ１のレコード６
２について更に詳しく述べると、注意すべきことは、こ
れもＤＭＡ等を使用することによりＣＰＵに負担をかけ
ることなくディスク記憶装置に出力されるということで
ある。

【００３１】ＡＲＥＡ１からＡＲＥＡ３のフォーマット
が与えられているが、それらのＡＲＥＡに記憶されたレ
コードの処理を続ける前に注意すべきことは、エリア当
たり一つのレコードの上記のフォーマットは例示のため
のものであるということである。したがって、代替案と
して、この性質のＡＲＥＡに対する、ある入力／出力は
ブロック状レコードによって行われる。この用語は当業
者には知られている。ブロック状レコードは、複数のレ
コードが単一のエリアに配置される場合を示す。ここ
で、それらの複数のレコードはブロックと呼ばれる。た
とえば、図３で、レコード６２および６４をＡＲＥＡ１
に記憶し、レコード６６および６８をＡＲＥＡ２に記憶
することができる。このように、以下に教示される種々
の概念から理解されるように、本実施例により異なるデ
ータパターンが実現され、収容することができる。

【００３２】ＡＲＥＡ１からＡＲＥＡ３の各ＡＲＥＡが
上記のようにしてレコードを受けた後、注意すべきこと
は、レコードのファイルの中の各レコードを処理しなけ
ればならないので、手順が続行されるということであ
る。このようにして、ｔ４で、レコードファイルの中の
次のレコードがＡＲＥＡ１に入力される。図３には示さ
れていないか、ｔ４の間に、図２ｂのレコード６８がＡ
ＲＥＡ１に入力される。更に、この同じｔ４の間に、レ
コード６４がＡＲＥＡ２から出力され、ＡＲＥＡ３のレ
コード６６が処理される。この手順が与えられると、熟
練した当業者には理解できるように、相次ぐレコードを
メモリ内で効率的に処理できるとともに、ディスク記憶
装置からの、そしてディスク記憶装置へのそれらのレコ
ードのアクセス時間を短縮できる。換言すれば、三つの
メモリエリアでなく、単一のメモリエリアだけを使用す
る場合には、単一のレコードがそのエリアに入力され、
処理された後、そのエリアから出力され、その後、次の
単一レコードについて同様のことが行われ、以下同様に
進められる。この後者の手順では、一つのレコードの入
力の時間、もう一つのレコードの処理の時間、更にもう
一つのレコードの出力の時間に重なりが無いので、多数
のレコードを処理するためには、かなり、より長い時間
が必要とされる。したがって、要するに、図３に示す手
法はレコード処理効率を改善する。しかし、更に、後で
説明するように、図３の手順がどのようにして検出され
てＬＴＢ５６に記録される予測可能性のレベルを生じる
かということも本発明者は理解した。上記のプロセスと
組み合わせてプリフェッチを使用することにより、マイ
クロプロセッサの効率を更に改善することができる。

【００３３】本実施例の説明を更に進める。次の表１
は、図２ｂのレコードを処理するための簡単な擬似コー
ドプログラムを示す。

【表１】ＬＴＢ５６の構成の説明を進める前に、表１の擬似コー
ドに関連した付加的な注釈を加えることは有用である。
まず注意すべきことは、擬似コードとして表１のコード
は単なる一例に過ぎず、コードにより示される機能を遂
行するためにマイクロプロセッサが使用する実際のコー
ドは、形式、複雑さの一方または両方が異なり得るとい
うことである。いずれにしても、表１が示そうとしてい
ることは、種々のプログラムコード行がメモリの中のど
こかに記憶されるということと、プログラム行が図２ｂ
のレコードファイルの中の各レコードに対して種々の動
作を行うということである。プログラムコードのメモリ
記憶について注意すべきことは、表１は各プログラム行
に対するメモリアドレスをリスト表示したものであり、
アドレスはアドレス１０から始まり、相次ぐ命令毎に１
づつ大きくなる。したがって、この点以降、このような
各命令は表１のそのアドレスで表す。コードにより行わ
れる動作に対して表１の例は、各従業員が先月かせいだ
金額を計算するものである。すなわち、表１の例は図２
ａに示されたＰＡＹＤＵＥ（支払い賃金）フィールド
を計算するものである。詳しく述べるとＰＡＹＤＵＥ
（支払い賃金）は、各従業員のＨＯＵＲＬＹＷＡＧＥ
（時給）にその従業員のＨＯＵＲＳＷＯＲＫＥＤ（労
働時間）を乗算することにより計算される。更に詳しく
述べると、命令１１および１２はこれらの乗数の各々を
それぞれのレジスタにロードし、命令１３はそれらのレ
ジスタの乗算を行い、積を第三のレジスタに記憶する。
最後に、命令１３は結果を対応するレコードに対するＰ
ＡＹＤＵＥ（支払い賃金）フィールドに記憶させる。
もちろん、種々の付加的な動作を行うことはできるが、
本例は下記の原理を説明するのに充分なはずである。

【００３４】本発明者は次に、図３のメモリＡＲＥＡに
関連して観察され、そして本実施例に従ってＬＴＢ５６
により予測され得る動作のルーピングパターンについて
説明する。このルーピング手法を説明するために、図２
ｂのレコードの処理段を通って上記の擬似コードをたど
ってみる。Ｊ＝１に対する擬似コードについては、レコ
ード６２（すなわち、ＡｂｅＡｄａｍｓ）が処理され
る。命令１１はターゲットデータアドレス１２１４にあ
るＡｂｅのＨＯＵＲＬＹＷＡＧＥ（時給）のターゲッ
トデータをロードする。命令１２はターゲットデータア
ドレス１２１８にあるＡｂｅのＨＯＵＲＳＷＯＲＫＥ
Ｄ（労働時間）のターゲットデータをロードする。命令
１３は、これらの二つの乗数の積を計算し、これをレジ
スタＲＥＧ３に記憶させる。最後に命令１４は命令１３
により得られた積を、ＰＡＹＤＵＥ（支払い賃金）フ
ィールドに対応するメモリＡＲＥＡ位置、すなわちター
ゲットデータアドレス１２１Ｃに記憶さぜる。次に命令
１５によりＪが増大させられ、Ｊ＝２に対して、同じ命
令によりレコード６４（すなわち、ＢａｒｒｙＢａｒ
ｎｅｓ）に対するデータが処理される。したがってこの
場合も、命令１１がターゲットデータアドレス２２１４
にあるＢａｒｒｙのＨＯＵＲＬＹＷＡＧＥ（時給）の
ターゲットデータをロードする。命令１２は、ターゲッ
トデータアドレス２２１８にあるＢａｒｒｙのＨＯＵＲ
ＳＷＯＲＫＥＤ（労働時間）のターゲットデータをロ
ードする。その後、積が計算され、ターゲットデータア
ドレス２２１Ｃに書き込まれる。再びＪが増大させら
れ、Ｊ＝３に対して、同じ命令によりレコード６６（す
なわち、ＣｉｎｄｙＣｏｘ）に対するデータが処理さ
れる。したがってこの場合も、命令１１がターゲットデ
ータアドレス５２１４にあるＣｉｎｄｙのＨＯＵＲＬＹ
ＷＡＧＥ（時給）のターゲットデータをロードする。
命令１２は、ターゲットデータアドレス５２１８にある
ＣｉｎｄｙのＨＯＵＲＳＷＯＲＫＥＤ（労働時間）の
ターゲットデータをロードする。その後、積が計算さ
れ、ターゲットデータアドレス５２１Ｃに記憶される。

【００３５】ファイルの最初の三つのレコードを処理し
たとき、前に述べたようにＡＲＥＡ３のレコードが上記
の命令によって処理されているとき、ＡＲＥＡ１に次の
レコードがロードされる。したがって上記の例では、Ａ
ＲＥＡ３のＣｉｎｄｙＣｏｘに対するレコードが処理
されている間、ＤｉａｎｅＤａｖｉｓに対するレコー
ド６８がＡＲＥＡ１にフェッチされている。したがっ
て、Ｊ＝４に対して表１からの命令が続行され、同じ命
令によりレコード６８（すなわち、ＤｉａｎｅＤａｖｉ
ｓ）に対するデータが処理される。したがってこの場合
も、命令１１がターゲットデータアドレス１２１４にあ
るＤｉａｎｅのＨＯＵＲＬＹＷＡＧＥ（時給）のター
ゲットデータをロードする。命令１２は、ターゲットデ
ータアドレス１２１８にあるＤｉａｎｅのＨＯＵＲＳ
ＷＯＲＫＥＤ（労働時間）のターゲットデータをロード
する。その後、積が計算され、ターゲットデータアドレ
ス１２１Ｃに記憶される。最後に、図２ｂには付加的な
データが示されていないが、熟練した当業者には理解さ
れるように、相次ぐ各レコードに対して命令１０から１
４がメモリＡＲＥＡ毎に繰り返される。したがって、一
つのメモリＡＲＥＡのデータを処理したとき、プロセス
はルーピング形式で次のメモリエリアに継続する。すな
わち、ＡＲＥＡ１から、ＡＲＥＡ２に、ＡＲＥＡ３に、
そして再びＡＲＥＡ１に戻る。

【００３６】上記を想定して、本発明者は次に上記のこ
とからのデータロードの予測可能性についての本発明者
の理解について説明する。たとえば、命令１１の各生起
について考えてみる。Ｊ＝１の場合、命令１１がターゲ
ットアドレス１２１４からのデータを要求した。Ｊ＝２
の場合、命令１１がターゲットアドレス２２１４からの
データを要求した。Ｊ＝３の場合、命令１１がターゲッ
トアドレス５２１４からのデータを要求した。最後に、
Ｊ＝４の場合、命令１１がターゲットアドレス１２１４
からのデータをもう一度要求した。このようにして、更
に付加的なレコードの処理が行われると、ターゲットア
ドレスのパターン、すなわち１２１４から２２１４へ、
５２１４へ、１２１４に戻るパターンがあり、各レコー
ドに対して繰り返される。したがって、レコードの完全
性のため、本発明者はループを予測できるということを
理解する。これにより、単一の命令（すなわち、命令１
１）がルーピング形式で、すなわち第一のアドレスか
ら、第二のアドレスに、第三のアドレスに、そして第一
のアドレスに戻る形式でデータを要求する。更に、命令
１２もこのようにしてループ状となるが、アドレス１２
１８から、２２１８へ、５２１８へ、１２１８に戻り、
これが繰り返される。実際、種々のデータレコード処理
ソフトウェアプログラムに対して、このプロセスが生じ
得ることがわかる。したがって、与えられたデータフェ
ッチ命令に対して、本実施例はこのようなルーピング手
法を検出する。更に本実施例は、データフェッチ命令が
検出された形式でループ動作を続けるということを更に
予測する。最後に、（好ましくはＬＴＢ５６に記憶され
ている）予測に基づいて、本実施例はこのルーピング形
式で使用されるべきデータをプリフェッチすることがで
きる。これにより、キャッシュミスが最少限となり、後
で詳しく説明するようにマイクロプロセッサの効率が改
善される。

【００３７】図４は上記のＬＴＢ５６に示された単一の
エントリ５６_１の第一の実施例を示す。実施例ではＬＴ
Ｂ５６に８個の部分からなるセット対応構造で２０４８
個のオーダのエントリを含めることができるが、図４に
は１個の部分の１エントリだけが示されている。本実施
例の残りのエントリは同じフォーマットをそなえること
が理解されるはずである。一般にＬＴＢ５６の各エント
リは、異なるデータフェッチ命令に対応する情報を記憶
するように動作することができる。したがって後でより
良く理解されるように、ＬＴＢ５６で２０４８個までの
異なるデータフェッチ命令を一度に識別することができ
る。各エントリ特有の形式化については後で詳細に説明
するが、ここではＬＴＢ５６全体の効果を簡単に紹介す
る。一般に、データフェッチ命令が命令フェッチ段４０
によってフェッチされたとき、ＬＴＢ５６が探索され
て、そのフェッチ命令に対応するエントリをＬＴＢ５６
が記憶しているか判定される。ＬＴＢ５６が記憶してい
ない場合には、後で詳細に説明するようにエントリが作
成され、更新される。一旦エントリが作成され、妥当な
状態に設定されると、上記のようにそれはデータフェッ
チ命令によりフェッチされるべきデータのアドレスの一
つ以上の予測を与える。換言すれば、データフェッチ命
令が命令フェッチ段４０によりフェッチされ、ＬＴＢ５
６がそのデータフェッチ命令に対応する妥当なエントリ
をそなえていることが見出されたとする。この場合、デ
ータフェッチ命令がまだ命令パイプライン３８の相対的
に上にある間に、ＬＴＢ５６からの予測を使用して、Ｌ
ＴＢエントリによって予測されたデータアドレスに対す
るプリフェッチ要求が発せられる。その結果、この要求
に応答して、データをマイクロプロセッサチップ上のキ
ャッシュ等にプリフェッチすることができる。その後、
データフェッチ命令がその実行段に達したとき、それは
キャッシュから直接データをフェッチすることができ、
マイクロプロセッサ外部のメモリからそれにアクセスす
る必要は無い。このようにして、エントリ５６_１につい
ての以下の詳細な説明からより良く理解されるように、
マイクロプロセッサの効率が向上する。

【００３８】エントリ５６_１の最初の三つの値はデータ
フェッチ命令に一般的なものであり、残りの７個の値は
データフェッチ命令に対応するデータをプリフェッチす
るための予測に向けられている。これらの値の各々につ
いては後で説明する。

【００３９】エントリ５６_１の一般的な値から始める
と、その最初の値はＡＤＤＲＥＳＳＴＡＧ（アドレスタ
グ）である。ＡＤＤＲＥＳＳＴＡＧはデータフェッチ
命令がメモリのどこに記憶されているかというアドレス
をリストしたものである。たとえば、エントリ５６_１が
表１の第一のロード命令に対応していれば、ＡＤＤＲＥ
ＳＳＴＡＧは１１の値に対応する。エントリ５６_１の
第二の値には、データフェッチ命令についてのＭＩＳＣ
ＥＬＬＡＮＥＯＵＳＣＯＮＴＲＯＬＩＮＦＯＲＭＡ
ＴＩＯＮ（雑制御情報）が含まれている。ここでこのよ
うな情報は、ブランチ命令に対するＢＴＢにリストされ
た情報と類似のものとすることができる。たとえば、こ
の値の一部として妥当なインジケータを記憶することが
できる。これにより、エントリ内の情報が妥当である
か、そしてこのような情報を分析する他の回路が依存で
きるか、後で判定することができる。他の例について
は、熟練した当業者は確かめることができる。エントリ
５６_１の第三の値は、データフェッチ命令のＡＣＣＥＳ
ＳＴＹＰＥ（アクセス型）である。アクセス型の種々
の例は前に紹介した。たとえば、もっと単刀直入なアク
セス型はフェッチ要求である。この場合、データフェッ
チ命令はあるメモリ位置から情報を検索する（すなわ
ち、ロードする）ために探索を行う。しかし、もう一つ
の例として、要求はデータ記憶質問であるかも知れな
い。この場合、データ記憶質問はあるメモリ構造を準備
してデータを検索する要求であるが、実際にはデータは
検索されない。かわりに、要求はデータフェッチ記憶質
問であるかも知れない。ここで、データ記憶質問と同様
に、データフェッチ記憶質問でも、あるメモリ構造を準
備してデータを検索する。しかし、この場合は更に、準
備の一部として一群のデータが検索されてキャッシュに
入る。その群の一部はその群への後続の記憶により上書
きされるものと予想されている。更に他の型の要求につ
いては、熟練した当業者は確かめることができる。

【００４０】エントリ５６_１の予測に関する値について
説明しているが、エントリ５６_１の第四の値はＮＥＸＴ
ＰＯＩＮＴＥＲ（ネクストポインタ）である。これ
は、対応するデータフェッチ命令に対してフェッチされ
るべきデータの次の予測として三つの異なるポインタと
それに対応する制御のうちどれを使用するかを示すもの
である。更に詳しく述べると、エントリ５６_１の残りの
６個の値は３個のポインタ（ＰＯＩＮＴＥＲＡ、ＰＯ
ＩＮＴＥＲＢ、およびＰＯＩＮＴＥＲＣ）として示
されている）とそれらの各ポインタに対する制御値（そ
れぞれＡＣＯＮＴＲＯＬ、ＢＣＯＮＴＲＯＬ、Ｃ
ＣＯＮＴＲＯＬとして示されている）に対応している。
各ＰＯＩＮＴＥＲはターゲットデータアドレスを記憶す
ることができる。したがって、そのアドレスにおけるデ
ータはエントリ５６_１に結合された命令に対してプリフ
ェッチされるべきターゲットデータの予測を表す。ＣＯ
ＮＴＲＯＬ情報については後で詳しく説明する。この点
で、ＮＥＸＴＰＯＩＮＴＥＲ値に戻って説明する。下
記の例を使用して示すようにその値は、３個のポインタ
およびそれに対応するＣＯＮＴＲＯＬの中のどれが、エ
ントリ５６_１に対するＡＤＤＲＥＳＳＴＡＧで識別さ
れたデータフェッチ命令に対する次のターゲットデータ
アドレスを予測するかを示す。したがって、ＮＥＸＴ
ＰＯＩＮＴＥＲは２ビットの値であることが好ましい。
ここで２ビットの状態は、次の表２に示すように３個の
ＰＯＩＮＴＥＲとそのＣＯＮＴＲＯＬの中の一つを示
す。

【表２】表２でＮＥＸＴＰＯＩＮＴＥＲの２進値が００であれ
ば、これは与えられたデータフェッチ命令に対するター
ゲットデータアドレスに対する予測として使用されるべ
き次のＰＯＩＮＴＥＲがＰＯＩＮＴＥＲＡであるとい
うことを示す。これにより、ＰＯＩＮＴＥＲＡに対応
するＣＯＮＴＲＯＬ情報によって制御される。同様に、
値０１および１０はそれぞれＰＯＩＮＴＥＲＢおよび
ＰＯＩＮＴＥＲＣに対応する。最後に、１１の値は代
替実施例で使用するために取って置かれる。

【００４１】３個のＰＯＩＮＴＥＲの各々に対するＣＯ
ＮＴＲＯＬ情報は、ＰＯＩＮＴＥＲが妥当であるか否か
を示すため、そして妥当であれば、それの対応するＰＯ
ＩＮＴＥＲに対するフェッチパターン型を符号化するた
めに使用される。フェッチパターン型については、下記
のように本実施例はデータフェッチパターンの異なる型
を検出することができる。これらのモードの一つはルー
プモードであり、これは上記の表１の擬似コードと関連
して説明した例に対応し、後で更に説明する。他のモー
ドにはストライディング（ｓｔｒｉｄｉｎｇ）パターン
が含まれるが、これについては後で詳しく説明する。い
ずれにしても、検出されたパターンはＣＯＮＴＲＯＬ情
報に符号化される。これまでルーピング（ｌｏｏｐｉｎ
ｇ）だけが紹介されてきたので、表３にはＣＯＮＴＲＯ
Ｌ情報の種々の表示が示されている。これらはＰＯＩＮ
ＴＥＲが妥当であるか否か、そして妥当である場合に
は、それに対応するルーピングの型を３ビットの値で示
す。

【表３】表３で、ＣＯＮＴＲＯＬの２進値が０００に等しいと、
これは対応するＰＯＩＮＴＥＲ値が妥当でないというこ
とを示す。一方、ＣＯＮＴＲＯＬの左端のビットが１に
等しければ、ＣＯＮＴＲＯＬの右の２ビットは、下記の
例で示すように、現在のＰＯＩＮＴＥＲが指定するアド
レスからフェッチした後、制御がそれにループを形成す
べきＰＯＩＮＴＥＲを指定する。最後に、ＣＯＮＴＲＯ
Ｌの左端のビットが０に等しく、右側の２ビットの中の
１ビットが非０であれば、後で詳しく説明するように代
替実施例で使用するための更に付加的なモードが表され
る。

【００４２】エントリ５６_１の特性と上記の種々の側面
を更に示すため、表１に関連してエントリ５６_１の中の
値の設定について以下説明する。更に詳しく述べると、
以下の説明は表１の命令１１に当てはまるが、表１の命
令１２にも同様に当てはまる。前に述べたように表１の
プログラムは、マイクロプロセッサ１２がアクセスでき
るメモリ、たとえば外部メモリ１４の中に命令として記
憶される。したがって、それらの命令を処理するため、
各命令がパイプライン３８内にフェッチされ、それを通
ってその実行段に向かう。したがって、このプロセスの
間に、命令１１が初めて（すなわち、命令１０のＪ＝１
に対して）命令フェッチ段４０によりフェッチされる。
この点で当業者には知られた手法により、命令がロー
ド、記憶、記憶質問等のようなデータフェッチ命令であ
るということが検出される。命令がデータフェッチ命令
であると検出されたことに応答して、ＬＴＢ５６はそれ
のエントリの一つが命令１１に対応するか判定するよう
に求められる。現在の例では、これが命令１１がフェッ
チされる最初であるので、ＬＴＢ５６は命令１１に対応
するエントリをそなえていない。したがって、後で説明
するようにエントリが作成される。更に、エントリがＬ
ＴＢ５６で検出された場合には、命令１１に制御タグを
付けることもできるので、それがパイプライン３８を通
るとき、ＬＴＢ５６でそれに対して既に設定されたエン
トリをそなえるデータフェッチ命令であることがわか
る。

【００４３】ＬＴＢ５６内でのエントリの作成にはま
ず、ＬＴＢ５６のどこでエントリを作成するか決めるこ
とが含まれる。これについては、ＬＴＢ５６にまだ未使
用の行があれば、それらの行の一つをランダムまたは何
か置換アルゴリズムにより選択して、命令１１に対応す
るように使用することができる。これに反して、ＬＴＢ
５６の各行が他のデータフェッチ命令に対して既に設定
されていれば、既存の各エントリに対応する最古使用
（ＬＲＵ：ｌｅａｓｔｒｅｃｅｎｔｌｙｕｓｅｄ）
がチェックされ、最古使用であるエントリが立ちのかせ
られ（すなわち、無効にされ）て、その場所に新しいエ
ントリを形成することができる。ＬＲＵを使用してテー
ブル内のエントリを立ちのかすことについては、キャッ
シュの使用におけるように当業者には知られており、こ
こに引用されているパターソンとヘネシー箸「コンピュ
ータ構成の定量的アプローチ」というテキストの第５章
に示されている（”ＣｏｍｐｕｔｅｒＡｒｃｈｉｔｅ
ｃｔｕｒｅＡＱｕａｎｔｉｔａｔｉｖｅＡｐｐｒ
ｏａｃｈ”，ＳｅｃｏｎｄＥｄｉｔｉｏｎ，ｂｙＰ
ａｔｔｅｒｓｏｎａｎｄＨｅｎｎｅｓｓｙ，Ｍｏｒ
ｇａｎＫａｕｆｍａｎｎＰｕｂｌｉｓｈｅｒｓ，Ｉ
ｎｃ．）。二つの手法に構わず、本発明の実施例に戻っ
て、現在の例としてエントリ５６_１の中の命令１１のた
めにエントリが形成されたものとする。エントリ５６_１
を選択すると、それのアドレスタグの値が、１１に対応
するように、すなわち現在のデータフェッチ命令がメモ
リの中に記憶されているアドレスを表すように、設定さ
れる。更に後でより良く理解されるように、ＮＥＸＴ
ＰＯＩＮＴＥＲの値が０１に、すなわち、ＰＯＩＮＴＥ
ＲＢが命令１１の次の生起の際に使用されるべき次のポ
インタであるということを示すように設定される。更
に、これは命令１１の最初の生起であるので、命令１１
の次の生起がどのようなデータを必要とするかを予測す
る情報は一般に充分でない。しかしデフォルトとして、
現在のデータフェッチ命令（すなわち、命令１１）がル
ープモードの一部である、すなわち上記の表１の擬似コ
ードの例によって示されるように命令の生起毎にルーピ
ング形式でデータが集められるものと予測される。した
がって、ＰＯＩＮＴＥＲＡのターゲットアドレスから
ＰＯＩＮＴＥＲＢのターゲットアドレスに向かってル
ープが形成されると考えられるので、ＰＯＩＮＴＥＲ
Ａに対応するＡＣＯＮＴＲＯＬ情報が１０１に設定さ
れる。これにより、次のターゲットアドレスがＰＯＩＮ
ＴＥＲＢにより指示されるループモードが予測され
る。しかし、この予測を超えて、残りのＰＯＩＮＴＥＲ
ＢおよびＰＯＩＮＴＥＲＣに対応するＣＯＮＴＲＯ
Ｌ情報値が非妥当（すなわち、表３に示す０００）に設
定される。エントリ５６_１が設定された後、結局、命令
１１はパイプライン３８を通り、それが必要とするデー
タに対する実際のアドレスを確かめることができる。し
かし、この点で、そのアドレスがＰＯＩＮＴＥＲＡの
値の中に記憶される。図３に関連して示した例で説明し
たように、命令１１の最初の生起はアドレス１２１４か
らのデータを必要とする。したがって、１２１４のアド
レスがＰＯＩＮＴＥＲＡの中に記憶される。

【００４４】表１からの上記の説明を続ける。Ｊ＝２で
ある次の繰り返しのため、命令１４は制御を命令１０に
戻す。したがって、２回目に、命令１１が命令フェッチ
段４０によってフェッチされる。再び、命令１１がデー
タフェッチ命令であることが検出されるので、ＬＴＢ５
６を使用して、それのエントリの一つが命令１１である
か判定する。現在の例では、命令１１の前の生起のた
め、そして他のどの介在事象もエントリに影響を及ぼさ
なかったと仮定しているので、エントリ５６_１のＡＤＤ
ＲＥＳＳＴＡＧが命令１１に対応するものとして検出
される。これに応答して、エントリ５６_１のＮＥＸＴ
ＰＯＩＮＴＥＲを使用して、予測されたターゲットデー
タアドレスのどれが命令１１に対応するものか判定す
る。上記のようにＮＥＸＴＰＯＩＮＴＥＲはＰＯＩＮ
ＴＥＲＢを示すので、可能性のあるターゲットデータ
アドレスとしてＰＯＩＮＴＥＲＢの値が調べられる。
更に上記のようにＰＯＩＮＴＥＲＢに対応するＢＣ
ＯＮＴＲＯＬは現在、非妥当に設定されている。したが
って、この点で、命令１１の第二の生起に対するターゲ
ットデータアドレスの予測は無い。これに応答して、ま
ずＮＥＸＴＰＯＩＮＴＥＲの値が１０に設定される。
すなわち、ＰＯＩＮＴＥＲＣが、命令１１の次の生起
時に使用するべき次のポインタであることが示される。
更に、再びデフォルトとして、現在のデータフェッチ命
令（すなわち、命令１１）がループモードの一部となる
ことが予測される。したがって、ＰＯＩＮＴＥＲＢの
ターゲットデータアドレスからＰＯＩＮＴＥＲＣのタ
ーゲットデータアドレスに向かってループが形成される
と考えられるので、ＢＣＯＮＴＲＯＬが１１０に設定
される。これにより、次のターゲットアドレスがＰＯＩ
ＮＴＥＲＣにより指示されるループモードが予測され
る。その後、再びプロセスは命令１１がパイプライン３
８を通過するのを、それの実際のターゲットデータアド
レスが判定されるまで待つ。図３に関連して示した例で
は、上記のように命令１１の第二の生起はアドレス２２
１４からのデータを必要とするので、２２１４のアドレ
スがＰＯＩＮＴＥＲＢに記憶される。これまでの例の
ように二つのターゲットデータアドレスが二つのＰＯＩ
ＮＴＥＲ（たとえば、ＰＯＩＮＴＥＲＡおよびＰＯＩ
ＮＴＥＲＢ）に記憶された後、（または代わりとして、
第二のアドレスが記憶されているのと同時に、またはそ
れが記憶される前に）、後で明らかになる理由により付
加的な試験が行われる。詳しく述べると、二つのターゲ
ットデータアドレスが一致するか判定される。しかし、
現在の例では、このような一致は無い。したがって、後
で詳しく説明するようにループモードの仮定のもとでプ
ロセスが続行される。

【００４５】表１からの上記の例について更に説明を続
ける。Ｊ＝３である次の繰り返しのため、命令１４は制
御を命令１０に戻す。したがって、３回目に、命令１１
が命令フェッチ段４０によってフェッチされる。再び、
命令１１がデータフェッチ命令であることが検出され、
ＬＴＢ５６を使用して、命令１１に対応するエントリ５
６_１にアクセスする。これに応答して、エントリ５６_１
のＮＥＸＴＰＯＩＮＴＥＲ値を使用して、予測された
ターゲットデータアドレスのどれが命令１１に対応する
ものか判定する。ＮＥＸＴＰＯＩＮＴＥＲはＰＯＩＮ
ＴＥＲＣを示すので、可能性のあるターゲットデータ
アドレスとしてＰＯＩＮＴＥＲＣの値が調べられる。
しかし、上記のようにＰＯＩＮＴＥＲＣに対応するＣ
ＣＯＮＴＲＯＬは現在、非妥当に設定されている。し
たがって、この点で、命令１１の第三の生起に対するタ
ーゲットデータアドレスの妥当な予測は無い。これに応
答して、まずＮＥＸＴＰＯＩＮＴＥＲの値が００に設
定される。すなわち、ＰＯＩＮＴＥＲＡが、命令１１
の次の生起時に使用するべき次のポインタであることが
示される。もう一度、デフォルトとして、現在のデータ
フェッチ命令１１がループモードの一部となることが予
測される。これにより、ＰＯＩＮＴＥＲＣのターゲッ
トデータアドレスからＰＯＩＮＴＥＲＣのターゲット
データアドレスに向かってルーピングされるので、ＰＯ
ＩＮＴＥＲＣに対応するＣＣＯＮＴＲＯＬが１００
に設定される。これにより、次のターゲットアドレスが
ＰＯＩＮＴＥＲＡにより指示されるループモードが予
測される。その後、再びプロセスは命令１１がパイプラ
イン３８を通過するのを、それの実際のターゲットデー
タアドレスが判定されるまで待つ。図３に関連して示し
た例では、上記のように命令１１の第三の生起はアドレ
ス５２１４からのデータを必要とするので、５２１４の
アドレスがＰＯＩＮＴＥＲＣに記憶される。これまで
の例のように三つのターゲットデータアドレスが三つの
すべてのＰＯＩＮＴＥＲに記憶された後、（または代わ
りとして、第三のアドレスが記憶されているのと同時
に、またはそれが記憶される前に）、後で明らかになる
理由により付加的な試験が行われる。詳しく述べると、
最も最近のターゲットデータアドレス（たとえば、ＰＯ
ＩＮＴＥＲＣの中にあるターゲットデータアドレス）
が最も最古のターゲットデータアドレス（たとえば、Ｐ
ＯＩＮＴＥＲＡの中にあるターゲットデータアドレ
ス）と一致するか判定される。しかし、現在の例では、
このような一致は無い。したがって、後で詳しく説明す
るようにループモードの仮定のもとで、現在説明してい
るプロセスが続行される。しかし注意すべきことは、後
で詳しく説明する代替ブロセスでは、最も最近のターゲ
ットデータアドレス（たとえば、ＰＯＩＮＴＥＲＣの
中にあるターゲットデータアドレス）がＰＯＩＮＴＥＲ
Ｂの中にあるターゲットデータアドレスとも一致する
かという判定も行われるということである。

【００４６】説明の、この点現在で上記の表１の例をま
とめると、命令１１が３回処理された例でエントリ５６
_１が図５にリストされた値となる。したがって要約する
と、まず使用すべきＮＥＸＴＰＯＩＮＴＥＲはＰＯＩ
ＮＴＥＲＡである。更に、各ＰＯＩＮＴＥＲに対して
ループモードが予測される。換言すれば、ＰＯＩＮＴＥ
ＲＡが第一のターゲットデータアドレス（すなわち、
１２１４）を表し、それに対応するＡＣＯＮＴＲＯＬ
が予測するところによれば、ＰＯＩＮＴＥＲＡにより指
示されるデータが命令１１により使用された後、それの
次の生起がＰＯＩＮＴＥＲＢのターゲットデータアド
レスに対してループとなる。同様に、ＰＯＩＮＴＥＲ
Ｂが第二のターゲットデータアドレス（すなわち、２２
１４）を表し、それに対応するＢＣＯＮＴＲＯＬが予
測するところによれば、ＰＯＩＮＴＥＲＢにより指示
されるデータが命令１１により使用された後、それの次
の生起がＰＯＩＮＴＥＲＣのターゲットデータアドレ
スに対してループとなる。ＰＯＩＮＴＥＲＣが第三の
ターゲットデータアドレス（すなわち、５２１４）を表
し、それに対応するＣＣＯＮＴＲＯＬが予測するとこ
ろによれば、ＰＯＩＮＴＥＲＣにより指示されるデー
タが命令１１により使用された後、それの次の生起がＰ
ＯＩＮＴＥＲＡのターゲットデータアドレスに戻るル
ープを完成する。

【００４７】上記のことから熟練した当業者には明らか
なように、命令１１の後続の生起毎に、ＬＴＢエントリ
５６_１はその命令に対するデータフェッチのパターンを
正確に予測する。たとえば、データフェッチ命令の第四
の生起に対する例を続けると、命令フェッチ段４０によ
り命令１１がフェッチされ、エントリ５６_１が検出さ
れ、使用される。ＰＯＩＮＴＥＲＡが現在制御しつつ
あるということをＮＥＸＴＰＯＩＮＴＥＲ値が示し、
ＡＣＯＮＴＲＯＬがループモードを示し、そして命令
１１のこの第四の生起ではターゲットデータアドレス１
２１４のターゲットデータが必要になるということをＰ
ＯＩＮＴＥＲＡの値が予測する。したがってこの点
で、ＬＴＢ５６またはそれと結合された回路によりプリ
フェッチ要求が発せられ、ターゲットデータアドレス１
２１４のデータのプリフェッチが要求される。したがっ
て図１ｂおよび図２に戻って、この第四の生起によりプ
リフェッチ要求が発せられ、ＤｉａｎｅＤａｖｉｓに
対するＨＯＵＲＬＹＷＡＧＥ（時給）が検索される。
このように、データフェッチ命令１１がパイプライン３
８を通るとき、このデータをオンチップキャッシュにプ
リフェッチすることができる。その後、データフェッチ
命令１１が実行されるとき、それは代替案のように外部
メモリから検索する必要無しにオンチップキャッシュか
らデータをロードすることができる。この代替案では、
はるかに長い時間を要する。

【００４８】データフェッチ命令１１の第四の生起と、
その命令の後続の各生起を更に使用して、エントリ５６
_１が正確であることを保証する。たとえば、第四の生起
の間に、データフェッチ命令の実行の前または実行の間
に、それの実際のターゲットデータアドレスが判定され
る。現在の例で、図２ｂのレコードでは、実際のターゲ
ットデータアドレスは予測されたアドレスと同じ、すな
わち、１２１４のアドレスとなる。その結果、エントリ
５６_１はその予測が正しいままとなり、修正する必要は
無い。実際、熟練した当業者には理解されるように、デ
ータフェッチ命令１１の相次ぐ生起毎に、図５の値によ
り示される予測は正確である。これにより、データフェ
ッチ命令１１の各生起に対して、メモリアドレス１２１
４、２２１４、および５２１４からのデータの連続した
プリフェッチを行うことができる。したがって、これら
の各場合に、エントリ５６_１の正確さが確かめられ、そ
の中の値は乱されない。

【００４９】三つのアドレスを含むルーピングパターン
に対してエントリ５６_１を成功裏に設定する例を示し
た。命令１１の第二の繰り返し（すなわち、Ｊ＝２）に
関連して説明したように、二つのターゲットデータアド
レスが一致するかという比較も行われ、上記の例ではこ
のような一致は無かった。しかし注意すべきことは、本
実施例は、ある命令に対するターゲットデータアドレス
として同じデータアドレスが繰り返しアクセスされるデ
ータパターンを検出することもでき、上記の比較はこの
ような検出を行うための一つの手法である。更に詳しく
述べると、代わりの例として、命令１１が上記のように
ルーピングではなくて、アドレス１２１４に繰り返しア
クセスしたものと仮定する。このようにして、命令１１
の第二の繰り返し後に、上記の手法を使用してＰＯＩＮ
ＴＥＲＡとＰＯＩＮＴＥＲＢの両方が１２１４に設
定される。しかし前に説明したように、ＰＯＩＮＴＥＲ
Ｂが設定された後にＰＯＩＮＴＥＲＡとＰＯＩＮＴ
ＦＲＢの比較も行われる。しかし、現在の例では二つ
は一致するので、代替予測手法はデータフェッチ命令が
同じターゲットデータアドレスに繰り返しアクセスする
命令であるということを予測する。これに応答して、Ｎ
ＥＸＴＰＯＩＮＴＥＲが０１に維持され、これにより
ＰＯＩＮＴＥＲＢがもう一度ＮＥＸＴＰＯＩＮＴＥ
Ｒであることが示される。その結果、命令１１の相次ぐ
生起毎に、ＰＯＩＮＴＥＲＢが予測されたターゲット
データアドレスを記憶しているということをＮＥＸＴ
ＰＯＩＮＴＥＲは連続的に示す。これにより、同じアド
レスのループモードが示される。したがって、その点以
降、そして予測の誤りが検出されるまで、命令１１に対
するターゲットデータアドレスとして同じアドレス（た
とえば、１２１４）が使用される。注意すべきことは、
ＰＯＩＮＴＥＲＡがこの同じターゲットデータアドレ
スを記憶するので、代わりにＮＥＸＴＰＯＩＮＴＥＲ
はＰＯＩＮＴＥＲＡを示すものとして維持することによ
り、アドレスの相次ぐ各生起がターゲットデータアドレ
スとしてアドレス１２１４を予測するようにもできる。
実際、更にＰＯＩＮＴＥＲＡとＰＯＩＮＴＥＲＢの
両方が同じアドレスを指示するので、ＰＯＩＮＴＥＲ
ＡとＰＯＩＮＴＥＲＢとの間にループを形成するよう
に制御を設定できる。これにより、実際上、両者が指示
する同じアドレス（すなわち、１２１４）が命令１１の
相次ぐ生起に対するターゲットデータアドレスとなる。

【００５０】上記の同じアドレスパターンを検出する場
合の他に、命令１１の３回目の繰り返し（すなわち、Ｊ
＝３）に関連して説明したように、ＰＯＩＮＴＥＲＣ
の設定に関連して、それが最古のターゲットデータアド
レス（たとえば、、ＰＯＩＮＴＥＲＡの中のターゲッ
トデータアドレス）と一致するか判定される。上記の例
では一致が無かったので、プロセスはループモードの仮
定のもとで続行された。しかし、ここで注意すべきこと
は、本実施例はループに上記のような三つではなくて二
つのアドレスだけが含まれるルーピングデータパターン
を検出することもできるということである。更に詳しく
述べると、代わりの例として、命令１１が一つの生起で
アドレス１２１４にアクセスし、次の生起でアドレス２
２１４にアクセスし、次の生起でアドレス１２１４にル
ープで戻り、以下同様にルーピングパターンを繰り返す
ものと仮定する。したがって、命令１１の３回目の繰り
返しの後、上記の手法を使用してＰＯＩＮＴＥＲＡと
ＰＯＩＮＴＥＲＢは１２１４と２２１４にそれぞれ設
定されるが、ＰＯＩＮＴＥＲＣも１２１４に設定され
る。また上記したように、ＰＯＩＮＴＥＲＣの設定後
に、ＰＯＩＮＴＥＲＡとＰＯＩＮＴＥＲＣとの比較、
およびＰＯＩＮＴＥＲＢとＰＯＩＮＴＥＲＣとの比
較もある（ＰＯＩＮＴＥＲＡとＰＯＩＮＴＥＲＣと
が一致すれば、ＰＯＩＮＴＥＲＢとＰＯＩＮＴＥＲ
Ｃとを比較する必要は無い。現在の筋書きでは、ＡがＣ
に等しければ、ＢはＣに等しくないからである（ＡはＢ
に等しくないと既に判定されたため））。しかし現在の
例では、ＰＯＩＮＴＥＲＡとＰＯＩＮＴＥＲＣとが
一致するので、代わりの予測手法がデータフェッチ命令
はＰＯＩＮＴＥＲＢ内のアドレスからループでＰＯＩ
ＮＴＥＲＡ内のアドレスに戻る命令であると予測する
（すなわち、ＰＯＩＮＴＥＲＣとＰＯＩＮＴＥＲＡ
とが同じターゲットデータアドレスを表すから）。これ
に応答して、ＮＥＸＴＰＯＩＮＴＥＲが０１に設定さ
れる。これにより、ＰＯＩＮＴＥＲＢがもう一度ＮＥ
ＸＴＰＯＩＮＴＥＲであるということが示される。更
に、ＡＣＯＮＴＲＯＬが１０１に設定されることにより
次のＰＯＩＮＴＥＲがＰＯＩＮＴＥＲＢであることが
示されるとともに、ＢＣＯＮＴＲＯＬが１００に設定
されることにより次のＰＯＩＮＴＥＲがＰＯＩＮＴＥＲ
Ａであることが示される。その後、データフェッチ命
令の生起毎に、ＮＥＸＴＰＯＩＮＴＥＲがＰＯＩＮＴ
ＥＲＡとＰＯＩＮＴＥＲＢとの間に切り換えること
ができるので、それらの二つのＰＯＩＮＴＥＲによりそ
れぞれ示される二つのアドレスの間でループが継続され
る。

【００５１】上記の説明は、データフェッチ命令１１の
４回目の生起とその命令の後続の各生起がエントリ５６
_１の正確な予測を生じる例を示す。しかし他の場合に
は、問題となっているデータフェッチ命令が三つのター
ゲットデータアドレスの間にループとなっているように
思われるが、データフェッチ命令の付加的な生起によ
り、予測されたループパターンからはずれた実際のター
ゲットデータアドレスが生じる。この場合、エントリ５
６_１はある仕方で修正される。このような修正の一例を
後で、ルーピングの前にストライディングを行う実施例
に関連して説明する。しかし更に他の修正は、熟練した
当業者が確かめることができ、図４の実施例で与えられ
る種々の値のフォーマットに構成することもできる。

【００５２】これまで説明してきたようにＬＴＢ５６の
実施例によるループモードの構成が与えられた場合、後
で説明するようにＬＴＢ５６の各エントリのフォーマッ
トを拡張することにより、付加的な実施例を実現するこ
とができる。この実施例は、上記の場合のようにルーピ
ングを予測するだけでなく、ターゲットデータアドレス
後であるが、次のターゲットデータアドレスに対してル
ープを形成する前に、ストライド（ｓｔｒｉｄｅ）を予
測する。付加的な実施例に対する紹介として、図６ａは
図２ａのレコード６０をもう一度示しているが、そのレ
コードに付加的な四つのフィールド６０ｆから６０ｉが
付加されている。図６ａに示すように、これらのフィー
ルドはそれぞれ、今月の第一週から第四週に対するＷＥ
ＥＫＬＹＨＯＵＲＳＷＯＲＫＥＤ（週労働時間）数を
表す。したがって、これらのフィールドは加算される
と、フィールド６２ｄに示されたＨＯＵＲＳＷＯＲＫ
ＥＤＦＯＲＰＡＳＴＭＯＮＴＨ（先月の労働時
間）を与える。もちろん本例では、与えられた月が４週
しかないものと仮定している。この仮定は、本実施例の
以後の説明の基礎を与えるとともに、例を簡単にするた
めに行われたものである。いずれにしても、４週を仮定
し、そして前には説明しなかったが、フィールド６０ｆ
から６０ｉを加算し、その結果をフィールド６０ｄに記
憶するプログラムによって、フィールド６０ｄの値を書
き込むことができる。

【００５３】図６ａの概念を更に説明するために、図６
ｂは図２ｂのレコード６２、６４、６６、および６８を
示すが、それらのレコードに図６ａにより導入された新
しいフィールドが付加されている。たとえば、Ａｂｅ
Ａｄａｍｓに対応するレコード６２で、フィールド６０
ｆから６０ｉはＡｂｅが先月の第一週に４０時間働き、
先月の第二週に５０時間働き、先月の第三週に５０時間
働き、先月の第四週に４５時間働いたということを表
す。熟練した当業者には理解されるように、このデータ
はレコード６４、６６、および６８の各々に対しても与
えられる。その中の各フィールドのデータについて再び
説明することはしない。

【００５４】図６ａおよび６ｂがあたえられたとき、下
の表は図６ｂのレコードを処理するための簡単な擬似コ
ードプログラムを示す。このプログラムは、各ＷＥＥＫ
ＬＹＨＯＵＲＳＷＯＲＫＥＤ（週労働時間）フィール
ドの和を判定することによりＨＯＵＲＳＷＯＲＫＥＤ
ＦＯＲＴＨＥＰＡＳＴＭＯＮＴＨ（先月労働時
間）の各レコードに対する値を与える。

【表４】

【００５５】付加的なＬＴＢ５６の実施例の説明を進め
る前に、再び注意すべきことは、表４が擬似コードを表
し、したがってコードによって示される機能を果たすた
めマイクロプロセッサが使用する実際のコードは形式と
複雑さの一方または両方が異なることがあり得る。いず
れにしても、もう一度、表４のプログラムコードの種々
の行がメモリのどこかに記憶され、プログラム行は図６
ｂのレコードファイルの中の各レコードに対して種々の
動作を行う。プログラムコードのメモリ記憶装置に対し
て、上記の表１と同様に、表４はプログラムの各行に対
するメモリアドレスをリストしたものである。表４の例
に対して、プログラムコードを記憶するメモリアドレス
はアドレス２０から始まって、相次ぐ命令毎に増大す
る。この点以降、このような各命令は表４のそれのアド
レスによって表される。コードによって行われる動作に
ついては、表４の例の命令２２から２６は、従業員のレ
コードにリストされた４週の各々に対してＷＥＥＫＬＹ
ＨＯＵＲＳＷＯＲＫＥＤ（週労働時間）を従業員毎
に加算することにより、従業員毎のＨＯＵＲＳＷＯＲ
ＫＥＤＦＯＲＴＨＥＰＡＳＴＭＯＮＴＨ（先月
の労働時間）を計算する。更に詳しく述べると、命令２
１がレジスタＲＥＧ２をクリアした（すなわち、それを
０にセットした）後、４回の繰り返しに対して命令２３
はＷＥＥＫＬＹＨＯＵＲＳＷＯＲＫＥＤ（週労働時
間）の四つの値の相次ぐ一つをレジスタＲＥＧ１にロー
ドする。それらの各々に対して、命令２３はロードし、
命令２４はレジスタＲＥＧ１とＲＥＧ２の内容を加算
し、結果をレジスタＲＥＧ２に記憶する。したがって熟
練した当業者には理解されるように命令２４は、与えら
れた従業員レコードに対して命令２３によりロードされ
た値の各々の和をレジスタＲＥＧ２に累積する。四つの
週フィールドのすべてに対して加算が完了すると、命令
２６はＨＯＵＲＳＷＯＲＫＥＤＦＯＲＴＨＥＰ
ＡＳＴＭＯＮＴＨ（先月の労働時間）と名付けられた
フィールドに対応するロケーションのレコードに総計を
戻して記憶する。もう一度、命令２７から２９によって
更に示されるように、種々の付加的な動作が行われ得
る。詳しく述べると、すべての繰り返しの後に命令２４
がＨＯＵＲＳＷＯＲＫＥＤＦＯＲＴＨＥＰＡＳ
ＴＭＯＮＴＨ（先月の労働時間）の合計を与えると、
命令２７がその従業員のＨＯＵＲＬＹＷＡＧＥ（時
給）をロードする。命令２８がこの値にその従業員のＨ
ＯＵＲＳＷＯＲＫＥＤＦＯＲＴＨＥＰＡＳＴ
ＭＯＮＴＨ（先月の労働時間）を乗算する。その結果、
そのときレジスタＲＥＧ２にある積がその従業員に対す
るＰＡＹＤＵＥ（支払い賃金）を表す。したがって命
令２９により、その値がレコードに書き戻される。最後
に、更に付加的な動作が行われ得るが、以下に示す原理
を説明するためには本例は充分なはずである。

【００５６】本発明者は次に、ストライディングパター
ンの後にルーピングパターンが続く動作について説明す
る。これについては、図３のメモリＡＲＥＡフォーマッ
トに関連して述べた。メモリＡＲＥＡフォーマットをよ
り良く示すために、図７は図３のメモリＡＲＥＡをもう
一度示すが、それらのＡＲＥＡはＷＥＥＫＬＹＨＯＵ
ＲＳＷＯＲＫＥＤ（週労働時間）フィールドの各々に
対してターゲットデータアドレスを示すように拡張され
る。たとえば、ＡＲＥＡ１はＡｂｅＡｄａｍｓに対す
るＷＥＥＫＬＹＨＯＵＲＳＷＯＲＫＥＤ（週労働時
間）をアドレス１２２１、１２２４、１２２７、および
１２２Ａに記憶する。同様に、ＡＲＥＡ２はＢａｒｒｙ
Ｂａｒｎｅｓに対するＷＥＥＫＬＹＨＯＵＲＳＷ
ＯＲＫＥＤ（週労働時間）をアドレス２２２１、２２２
４、２２２７、および２２２Ａに記憶する。ＡＲＥＡ３
はＣｉｎｄｙＣｏｘに対するＷＥＥＫＬＹＨＯＵＲ
ＳＷＯＲＫＥＤ（週労働時間）をアドレス５２２１、５
２２４、５２２７、および５２２Ａに記憶する。

【００５７】次に、ストライディングの後にルーピング
が続くパターンについて説明する。図６ｂのレコードの
処理段階により、表４の擬似コードについて説明する。
Ｊ＝１の擬似コードで、レコード６２（すなわち、Ａｂ
ｅＡｄａｍｓ）が処理される。命令２１により、合計
を記憶しているレジスタＲＥＧ２がクリアされる。命令
２２により、レコードに対して四つのＷＥＥＫＬＹＨ
ＯＵＲＳＷＯＲＫＥＤ（週労働時間）フィールドの各
々を処理するループが開始される。次に命令２３によ
り、１２２１のターゲットデータアドレスにある、Ａｂ
ｅのＷＥＥＫＬＹＨＯＵＲＳＷＯＲＫＥＤ［＃１］の
ターゲットデータ（すなわち、４０）がロードされる。
次に命令２４により、ロードされた値がレジスタＲＥＧ
２の中の値と加算され、その値がレジスタＲＥＧ２に記
憶される。したがって、この点では、レジスタＲＥＧ２
が０にクリアされたので、レジスタＲＥＧ２には合計４
０が記憶される。次に、命令２５がプログラムを命令２
３に戻す（すなわち、Ｋ＝２）。したがって、これは命
令２３の第二の生起を表す。命令２３のこの第二の生起
により、１２２４のターゲットデータアドレスにある、
ＡｂｅのＷＥＥＫＬＹＨＯＵＲＳＷＯＲＫＥＤ［＃
２］のターゲットデータ（すなわち、５０）がロードさ
れる。次に命令２４により、ロードされた値（すなわ
ち、５０）がレジスタＲＥＧ２の中の値（すなわち、４
０）と加算され、その値（すなわち、９０）がレジスタ
ＲＥＧ２に記憶される。命令２３から２４の上記の繰り
返しは、Ｋ＝３およびＫ＝４に対して再び行われる。こ
のようにして、命令２３の第三の生起により、１２２７
のターゲットデータアドレスにある、ＡｂｅのＷＥＥＫ
ＬＹＨＯＵＲＳＷＯＲＫＥＤ［＃３］のターゲット
データ（すなわち、５０）がロードされる。次に命令２
４により、ロードされた値（すなわち、５０）がレジス
タＲＥＧ２の中の値（すなわち、９０）と加算され、そ
の値（すなわち、１４０）がレジスタＲＥＧ２に記憶さ
れる。更に、命令２３の第四の生起により、１２２Ａの
ターゲットデータアドレスにある、ＡｂｅのＷＥＥＫＬ
ＹＨＯＵＲＳＷＯＲＫＥＤ［＃４］のターゲットデ
ータ（すなわち、４５）がロードされる。次に命令２４
により、ロードされた値（すなわち、４５）がレジスタ
ＲＥＧ２の中の値（すなわち、１４０）と加算され、そ
の値（すなわち、１８５）がレジスタＲＥＧ２に記憶さ
れる。この点で、プログラムは命令２６まで継続する。
命令２６により、レジスタＲＥＧ２の中の合計（すなわ
ち、１８５）がＡｂｅＡｄａｍｓに対するＨＯＵＲＳ
ＷＯＲＫＥＤＦＯＲＴＨＥＰＡＳＴＭＯＮＴＨ
（先月の労働時間）に対応するメモリアドレスに記憶さ
れる。したがって、１８５という値がメモリアドレス１
２１８に記憶される。最後に、前記のように命令２７か
ら２９で、ＡｂｅＡｄａｍｓに対するＰＡＹＤＵＥ
（支払い賃金）も計算される。

【００５８】上記で単一の繰り返しＪ＝１は、ストライ
ディングとして知られるデータロードの予測可能性の一
つの型を示す。ストライディングはそれだけで、またぐ
ようにして行われるデータフェッチのその後の認識と予
測として知られている。しかし、直前の段落に示された
例の単一の繰り返しのストライディングについての以下
の説明の後に、更に本実施例のもとでストライディング
をループ検出とどのように組み合わせることができるか
も示される。この組み合わせにより、従来技術に比べて
更に付加的な利点が得られる。一般にストライディング
とは、一旦初期フェッチ（とそのアドレス）が設定され
れば、後続の次のフェッチに対しては「ストライド」と
呼ばれる一定距離がとられるように、相次いでデータを
フェッチするデータ処理パターンを指す。たとえば、初
期フェッチアドレスが１０進数１０００で、ストライド
が１０進数１０であれば、フェッチに対するアドレス系
列は１０００、１０１０、１０２０、１０３０等とな
る。当業者には知られているようにストライディングに
ついて多くの情報を得るためには、次の二つの文書を参
照できる。両者ともここに引用されている。（１）アイ
イーイーイー（ＩＥＥＥ）から文書番号０−８１８６−
３１７５−９／９２，著作権１９９２として発行されて
いるインテル社のジョン・ダブリュー・シー・フ、およ
びイリノイ大学のジャナク・エッチ・パテルとボブ・エ
ル・ジャンセン著「スカラプロセッサにおけるストライ
ド指向のプリフェッチ」（”ＳｔｒｉｄｅＤｉｒｅｃ
ｔｅｄＰｒｅｆｅｔｃｈｉｎｇｉｎＳｃａｌａｒ
Ｐｒｏｃｅｓｓｏｒｓ”，ｂｙＪｏｈｎＷ．Ｃ．Ｆｕ
ｏｆＩｎｔｅｌＣｏｒｐ，ａｎｄＢｏｂＬ．
ＪａｎｓｓｅｎｓｏｆｔｈｅＣｅｎｔｅｒｆｏ
ｒＲｅｌｉａｂｌｅａｎｄＨｉｇｈ−Ｐｅｒｆｏｒ
ｍａｎｃｅＣｏｍｐｕｔｉｎｇａｔｔｈｅＵｎ
ｉｖｅｒｓｉｔｙｏｆＩｌｌｉｎｏｉｓ）、および
（２）１９９５年１月１３日付けのミシガン大学のマイ
ケル・ゴールダとトレバー・エヌ・マッジ著「キャッシ
ュ待ち時間のためのハードウェアサポート」（”Ｈａｒ
ｄｗａｒｅＳｕｐｐｏｒｔｆｏｒＨｉｄｉｎｇ
ＣａｃｈｅＬａｔｅｎｃｙ”，ｂｙＭｉｃｈａｅｌ
ＧｏｌｄｅｒａｎｄＴｒｅｖｏｒＮ．Ｍｕｄｇ
ｅｏｆｔｈｅＡｄｖａｎｃｅｄＣｏｍｐｕｔｅ
ｒＡｒｃｈｉｔｅｃｔｕｒｅＬａｂａｔｔｈｅ
ＵｎｉｖｅｒｓｉｔｙＯｆＭｉｃｈｉｇａｎ）。

【００５９】前に紹介したように、上記のＪ＝１の単一
の繰り返しはストライディングの例を示す。たとえば、
Ｊ＝１の場合、命令２３に対するＫの各生起について考
えてみる。第一に、Ｊ＝１でＫ＝１の場合、命令２３は
ターゲットアドレス１２２１からのデータを要求した。
第二に、Ｊ＝１でＫ＝２の場合、命令２ターゲット
アドレス１２２４からのデータを要求した。第三に、Ｊ
＝１でＫ＝３の場合、命令２３はターゲットアドレス１
２２７からのデータを要求した。最後に、Ｊ＝１でＫ＝
４の場合、命令２３はターゲットアドレス１２２Ａから
のデータを要求した。したがって、命令２３の四つの生
起にわたって、そのターゲットデータアドレスは１２２
１、１２２４、１２２７、および１２２Ａであった。し
たがって、ストライディングの状況で、初期フェッチは
アドレス１２２４に対するものであった。次の三つのア
クセスの各々に対して、ストライドは３であった。

【００６０】前の段落はストライディングを示すが、表
４の例は更にストライディングと組合わされたルーピン
グも示す。この組合わせを本実施例により検出し、後で
詳しく説明するようにＬＴＢ５６に符号化される。更に
詳しく述べると、直前に説明したようにＪ＝１に対して
Ｋが１から４までくりかえされた後、Ｊが２に増大させ
られる。ストライディングだけが予測される従来技術で
は、命令２３の次の生起に対して、最後にアクセスされ
たアドレス（すなわち、１２２Ａ）に３のストライドが
加算される。これにより、命令２３のこの次の生起がア
ドレス１２２Ｄのデータを使用するという予測が得られ
る。しかし、このような予測は不正確である。詳しく述
べると、Ｊ＝２のとき、命令２３の第一の生起はレコー
ド６４に対するＷＥＥＫＬＹＨＯＵＲＳＷＯＲＫＥ
Ｄ（週労働時間）［＃１］を要求し、その値が図７のメ
モリＡＲＥＡ２のアドレス２２２１に記憶される。しか
し、後で詳しく説明するように本実施例では、ストライ
ドからこの変化を正確に予測することができる。これに
より、従来技術に比べて更に改善される。

【００６１】表４の命令２３の例および図７のメモリＡ
ＲＥＡ内のレコードについての説明を続けることによ
り、本発明者が認め、本実施例に入れた、ストライドの
後、ルーピングを行うというパターンの繰り返しが熟練
した当業者に理解されよう。上記の例の説明を続ける。
この例のこの点現在で、命令２３によりアクセスされる
ターゲットデータアドレスは１２２１、１２２４、１２
２７、および１２２Ａである。ここで、命令２３の相次
ぐ生起に対するターゲットデータアドレス系列に注意す
べきである。したがって、アドレス２２２１はＪ＝２で
Ｋ＝１のときアクセスされる。次に、Ｊ＝２の間のＫの
残りの３回の繰り返しについて考えてみる。Ｊ＝２でＫ
＝２の場合、命令２３はターゲットアドレス２２２４か
らのデータを要求する。Ｊ＝２でＫ＝３の場合、命令２
３はターゲットアドレス２２２７からのデータを要求す
る。Ｊ＝２でＫ＝４の場合、命令２３はターゲットアド
レス２２２Ａからのデータを要求する。したがって、Ｊ
＝２であるときの命令２３の４回の生起に対して、その
ターゲットデータアドレスは２２２１、２２２４、２２
２７、および２２２Ａであった。命令２３の相次ぐ生起
の各々の詳細を説明しなくても熟練した当業者には理解
されるように、Ｊ＝３の場合、命令２３の４回の生起は
ターゲットデータアドレス５２２１、５２２４、５２２
７、および５２２Ａからのデータを要求する。しかしこ
の点で、前に説明したように、ＡＲＥＡ３が処理された
後、プロセスはループでＡＲＥＡ１に戻る。したがって
Ｊ＝４の場合、命令２３の第一の生起では、ループで戻
ってターゲットアドレス１２２１からのデータを要求す
る。その後、命令２３の次の三つの生起はターゲットア
ドレス１２２４、１２２７、および１２２Ａからのデー
タを要求する。

【００６２】上記で、ストライディングの後にルーピン
グの組み合わせを要約する。Ｊ＝１の場合、命令２３は
４回実行し、それらの回数の間、３の距離でストライド
する（たとえば、アドレス１２２１、１２２４、１２２
７、および１２２Ａ）。しかし、次にＪは増大させられ
るので、命令２３の次の実行は３の距離ストライドしな
い。その代わりに、初期の実施例の仕方でのループの始
まりは、命令２３がアドレス２２２１からのデータを要
求するときに形成される。その後、命令２３は次の三つ
のアクセスに対して３の距離を再びストライドする。こ
の点で、命令２３が次にアドレス５２２１からのデータ
を要求したとき、もう一度ループが続く。距離３のスト
ライドを３回行った後、ループが始まる同じアドレス、
すなわちアドレス１２２１からのデータを命令２３が次
に要求したとき、ループは完了する。したがって、命令
２３のすべての生起をまとめると、命令２３は１２２１
から１２２４へ、１２２７へ、１２２Ａへストライドし
た後、ループで２２２１に至り、そこから２２２４へ、
２２２７へ、２２２Ａへストライドした後、ループで５
２２１に至り、そこから５２２４へ、５２２７へ、５２
２Ａへストライドした後、ループで１２２１に戻り、命
令２３のすべての生起に対してこのパターンを連続的に
繰り返す。

【００６３】上記で、図８は上記のＬＴＢ５６で説明さ
れた、単一のエントリ５６_１の付加的な実施例を示す。
ここでエントリ５６_１には、上記の図４と同じ値が含ま
れているが、５個の付加的な値も含まれている。それら
の値により、本実施例では、単独で、または上記のよう
なルーピングとの組み合わせで、種々のストライドパタ
ーンを予測することができる。エントリ５６_１の最初の
１０個の値については、前の説明を参照できる。したが
って、図８に示された新しく付加された値について集中
的に説明する。簡単に述べると、図８に新しく示された
値には、ＳＴＲＩＤＥＬＥＮＧＴＨ（ストライド長
さ）、ＳＴＲＩＤＥＴＨＲＥＳＨＯＬＤ（ストライド
閾値）、ＳＴＲＩＤＥＣＯＵＮＴＥＲ（ストライドカ
ウンタ）、ＴＥＭＰＯＲＡＲＹＰＯＩＮＴＥＲＳＡ
ＶＥＲ（一時ポインタセーバ）、およびＳＴＲＩＤＥ
ＣＯＮＴＲＯＬ（ストライド制御）が含まれる。図８に
は後で詳しく説明するように３個のＰＯＩＮＴＥＲに共
同使用される一組のストライドに関連した値が示されて
いるが、代替実施例では各ポインタとそれに結合された
ＣＯＮＴＲＯＬはそれ自身のストライドに関連した値を
そなえることができる。したがってこの代替実施例で
は、より複雑なデータパターンを予測することができ
る。これにより、単一のデータフェッチ命令の場合、一
つのストライド系列に対する長さや閾値は次のストライ
ド系列に対する長さや閾値と異なる。いずれにしても、
これらのストライドに関連した値の各々については以下
に説明する。

【００６４】図８に示されたストライドに関連した値の
情報と動作を示すために、それらの値の各々に対して、
まず前置きの説明を行う。上記の表４の命令２３の例に
より、サンプル情報を示す。説明を進める前に、ターゲ
ットデータアドレス１２２１、１２２４、１２２７、お
よび１２２Ａをストライドすることにより命令２３がど
のように進むかを前に示したことを想起されたい。次
に、図８のストライドに関連した値については、ＳＴＲ
ＩＶＥＬＥＮＧＴＨ（ストライド長さ）値は相次ぐス
トライドターゲットデータアドレス相互の間の相違の大
きさを表す。したがって現在の例では、ＳＴＲＩＤＥ
ＬＥＮＧＴＨは３に等しい。すなわち、アドレス１２２
１と１２２４との間のストライドは３、アドレス１２２
４と１２２７との間のストライドは３などである。ＳＴ
ＲＩＤＥＴＨＲＥＳＨＯＬＤ（ストライド閾値）は与
えられたストライド系列のターゲットアドレスの数であ
る。したがって現在の例では、ＳＴＲＩＤＥＴＨＲＥ
ＳＨＯＬＤは４に等しい（すなわち、１２２１、１２２
４、１２２７、および１２２Ａの系列には４個のアドレ
スがある）。次にＳＴＲＩＤＥＣＯＵＮＴＥＲ（スト
ライドカウンタ）は、与えられたストライド系列の中の
系列毎に進むカウンタである。進むことにより、相次ぐ
各ストライドの跡をたどるようにＣＯＵＮＴＥＲが増減
することを示そうとしている。実施例でこの機能を達成
するため、そして後で詳しく説明するように、ＳＴＲＩ
ＤＥＣＯＵＮＴＥＲには最初、ＳＴＲＩＤＥＴＨＲ
ＥＳＨＯＬＤがロードされた後、各ストライドが行われ
たとき０の値に向かって減らされる。ＴＥＭＰＯＲＡＲ
ＹＰＯＩＮＴＥＲＳＡＶＥＲ（一時ポインタセー
バ）はストライドアドレスの系列の中の初期アドレスを
記憶するために使用される。したがって本例では、１２
２１のアドレスはＴＥＭＰＯＲＡＲＹＰＯＩＮＴＥＲ
ＳＡＶＥＲに記憶される。後で詳しく説明するよう
に、ストライド系列の終わりに、このアドレスは最初に
それを与えたＰＯＩＮＴＥＲの一つ（すなわち、Ａ、
Ｂ、またはＣ）に戻される。ＴＥＭＰＯＲＡＲＹＰＯ
ＩＮＴＥＲＳＡＶＥＲを設ける代わりに、代替実施例
ではストライド系列の終わりに初期アドレスを再計算し
てもよい。この場合、再計算された初期アドレスはそれ
を与えたＰＯＩＮＴＥＲに戻される。最後に、ＳＴＲＩ
ＤＥＣＯＮＴＲＯＬ（ストライド制御）は、後で更に
説明するように単独またはルーピングと組合わされてス
トライド手法の動作を制御するために熟練した当業者が
構成することができる付加的な情報を供給するだけであ
る。

【００６５】図８の種々のストライドに関連した値を紹
介したが、前に説明したように、ＰＯＩＮＴＥＲＡ、
ＰＯＩＮＴＥＲＢ、およびＰＯＩＮＴＥＲＣは各々
対応するＣＯＮＴＲＯＬ値をそなえ、またルーピングに
関連するときのそれらの値の内容はルーピングデータパ
ターンに関する限り表３に関連して前に紹介した。しか
し、これから紹介し、以下更に詳しく説明するように、
図８の実施例には更に種々のストライドに関連したパタ
ーンも含まれている。この機能を更に果たすために、各
ＰＯＩＮＴＥＲに対応するＣＯＮＴＲＯＬ情報は更にス
トライドに関連した動作を示し、またこれに関連して下
の表５は表３の値を繰り返しているが、種々のストライ
ド動作を入れるように表３の予備値のいくつかについて
定義もしている。

【表５】表５でＣＯＮＴＲＯＬ情報の２進値が００１、０１０、
または０１１に等しい場合、これはＣＯＮＴＲＯＬに対
応するＰＯＩＮＴＥＲがストライドの作用に関連してい
ることを示している。相違点はストライドの大きさであ
る。特定のストライドの相違点を以下に説明する。

【００６６】表５に示すように、ＣＯＮＴＲＯＬ情報の
２進値が００１に等しい場合、これはストライドモード
を示す。この場合、ＬＴＢ５６のエントリのＳＴＲＩＤ
ＥＬＥＮＧＴＨ値にストライドの長さが記憶されてい
る。この側面を示すため、表４のコード例、そして更に
詳しくは、ＬＴＢ５６のエントリ５６_１が命令２３のス
トライド動作にどのように関連するかについて以下に説
明する。この目的のため、図９はストライド動作の間、
命令２３に対してデータプリフェッチ予測を可能にする
ように設定されたときのエントリ５６_１を示している。
命令２３を設定するためのステップについては後で詳し
く説明する。したがって、図９でエントリ５６_１が事前
に設定され、表４の擬似コードがフェッチされ、前記の
パイプライン３８により処理されるべきものであると仮
定する。このようにして、命令フェッチ段４０は命令２
３をフェッチし、前記の場合のように、それがデータフ
ェッチ命令であることを検出する。このようにしてＬＴ
Ｂ５６を使用して、それが命令２３に対応するエントリ
を記憶しているか判定する。詳しく述べると、エントリ
５６_１の中のアドレスタグフィールドは命令２３のアド
レスに一致するか判定され、したがってＬＴＢ５６はこ
のようなエントリをそなえているか判定される。次に、
エントリ５６_１のＮＥＸＴＰＯＩＮＴＥＲ値が使用さ
れ、それはＰＯＩＮＴＥＲＡとそれに対応するＡＣ
ＯＮＴＲＯＬは命令２３に対するターゲットデータアド
レスへの現在のプリフェッチ要求があれば、その現在の
プリフェッチ要求を制御するはずである。

【００６７】上記に応答して、ＡＰＯＩＮＴＥＲＣ
ＯＮＴＲＯＬＩＮＦＯＲＭＡＴＩＯＮが評価され、そ
れは現在のアクセスがストライドの一部であることを示
す（すなわち、００１の値）。ここで、ストライドの長
さはＳＴＲＩＤＥＬＥＮＧＴＨ値に記憶されている。
この点から先のステップを更に説明するために、図１０
は全体が７０で表された方法を示す。方法７０はストラ
イド動作の現在の型に応答する種々の好ましいステップ
を表す。図示するように、方法７０は一般にステップ７
２で始まる。ステップ７２は単に、００１に等しいＣＯ
ＮＴＲＯＬ情報値に応答して（またはストライドモード
の動作を示す他の制御値のいずれかに応答して）方法が
始まったことを示すだけである。次に、方法７０はステ
ップ７４に続く。ステップ７４はＳＴＲＩＤＥＣＯＵ
ＮＴＥＲが０に等しいか調べる。方法７０の説明が完了
すればより良く理解されるように、これが１２２１、１
２２４、１２２７、および１２２Ａのストライド系列に
対する命令２３の第一の生起であるので、ＳＴＲＩＤＥ
ＣＯＵＮＴＥＲは０にリセットされている。したがっ
て、ステップ７４は真であるはずであり、方法７０はス
テップ７６に進む。何らかの理由でストライド系列の命
令の第一の生起でＳＴＲＩＤＥＣＯＵＮＴＥＲの値が
非零であれば、方法７０はステップ７７に進む。ステッ
プ７７は、ＳＴＲＩＤＥＣＯＵＮＴＥＲの誤った設定
に応答するためのエラーハンドラの一例である。

【００６８】ステップ７７のエラーハンドリングは二つ
の動作を行う。第一に、現在のＰＯＩＮＴＥＲに対する
ＣＯＮＴＲＯＬ情報は非妥当に設定される。したがっ
て、現在の例では、ＡＣＯＮＴＲＯＬが０００に設定
される。第二に、ＮＥＸＴＰＯＩＮＴＥＲ値が後続の
次のポインタを指すように進められる。したがって、現
在の例では、ＮＥＸＴＰＯＩＮＴＥＲの値が０１に設
定される。最後に、このエラーハンドリングが完了する
と、フローはステップ７７からステップ９０に進む。後
でも述べるようにステップ９０は、単にエントリ５６_１
の現在の処理に対する方法７０の終わりを表すに過ぎな
い。

【００６９】命令２３の現在の例におけるように、スト
ライディングを開始すべきデータフェッチ命令があるＬ
ＴＢ５６の妥当なエントリについて当てはまるように、
ＳＴＲＩＤＥＣＯＵＮＴＥＲが０に等しいことがわか
った後に、ステップ７６に達する。次に、ステップ７６
は二つのセットアップ動作を行う。第一に、ステップ７
６は現在のＰＯＩＮＴＥＲの値をＴＥＭＰＯＲＡＲＹ
ＰＯＩＮＴＥＲＳＡＶＥＲ（一時ポインタセーバ）に
コピーする。したがって現在の例では、ＰＯＩＮＴＥＲ
Ａに記憶された１２２１という値がＴＥＭＰＯＲＡＲ
ＹＰＯＩＮＴＥＲＳＡＶＥＲにコピーされる。後で
より明らかになる理由により、このＴＥＭＰＯＲＡＲＹ
ＰＯＩＮＴＥＲＳＡＶＥＲから後で検索されて、Ｐ
ＯＩＮＴＥＲＡに入る。第二に、ステップ７６はＳＴ
ＲＩＤＥＣＯＵＮＴＥＲにＳＴＲＩＤＥＴＨＲＥＳ
ＨＯＬＤをロードする。したがって、相次ぐストライド
の生起毎に前に述べたようにカウントが減っていく。こ
れについても、後で詳しく説明する。この二つのセット
アップ動作の後、方法７０はステップ７８に続く。

【００７０】ステップ７８は、対応するＰＯＩＮＴＥＲ
によって示されるアドレスで開始するようにプリフェッ
チ要求を発する。したがって、現在の例では、ＰＯＩＮ
ＴＥＲＡが問題になっているので、ステップ７８は１
２２１のターゲットデータアドレスにプリフェッチ要求
を発する。したがって、このプリフェッチ要求が実際の
プリフェッチ動作を誘発した場合、前に説明したように
アドレス１２２１のデータを検索してオンチップキャッ
シュに入れることができる。したがって、命令２３がパ
イプライン３８を通るとき適当な時点に達すると、その
データはそのキャッシュからフェッチして容易に利用す
ることができる。したがって再び、プリフェッチの利点
を実現することができる。ここでは、アドレスのストラ
イド系列の最初の場合にそれが示されている。次に、方
法７０はステップ８０に進む。

【００７１】ステップ８０では、ＳＴＲＩＤＥＣＯＵ
ＮＴＥＲの値を減少させる。現在の例では、図９で説明
したように、ＳＴＲＩＤＥＣＯＵＮＴＥＲはＳＴＲＩ
ＤＥＴＨＲＥＳＨＯＬＤからの４という値を記憶してい
る。したがってステップ８０で、この値を４から３に減
らす。後でより良く理解されるように、直前のステップ
７８によるプリフェッチ要求の相次ぐ発行毎に、ステッ
プ８０は再びカウントを減少させる。したがって、最後
にカウントは０に達し、与えられたストライドアドレス
の系列に対するすべてのストライドの場合が生じたとい
うことを示す。次に、方法７０はステップ８２に進む。

【００７２】ステップ８２は再び、ＳＴＲＩＤＥＣＯ
ＵＮＴＥＲが０に達したか判定する。直前の段落で説明
したように、与えられたストライドアドレスの系列に対
するすべてのストライドの場合が生じると、カウントが
０に達する。ＳＴＲＩＤＥＣＯＵＮＴＥＲが０に達して
いない場合には、方法７０はステップ８４に進む。これ
に反して、ＳＴＲＩＤＥＣＯＵＮＴＥＲが０に達した
場合には、方法７０はステップ８６に進む。現在の例で
は、ＳＴＲＩＤＥＣＯＵＮＴＥＲは３に等しいので、
方法７０はステップ８４に進む。

【００７３】ステップ８４は現在ポインタの値をＳＴＲ
ＩＤＥＬＥＮＧＴＨの値だけ増大させる。現在の例で
は、ＰＯＩＮＴＥＲＡは１２２１に等しく、ＳＴＲＩ
ＤＥＬＥＮＧＴＨは３に等しい。したがって、ステップ
８４に応答して、ＰＯＩＮＴＥＲＡの値が１２２１か
ら１２２４に増大される。次に、方法７０はステップ７
８に進む。

【００７４】上記の説明で熟練した当業者には理解され
るように、方法７０がステップ８４からステップ７８に
戻ることにより、一つ以上の付加的なプリフェッチ要求
が発せられる。後続の各プリフェッチ要求は前のプリフ
ェッチ要求のアドレスにＳＴＲＩＤＥＬＥＮＧＴＨの
値を加えたものを発する。たとえば、前に説明したよう
に、ステップ７８の第一の場合に１２２１のプリフェッ
チ要求が発せられ、そしてその後、ＰＯＩＮＴＥＲＡ
の値がＳＴＲＩＤＥＬＥＮＧＴＨの３だけ大きくされ
て１２２４の値となる。したがって次に、ステップ７８
はもう一度プリフェッチ要求を発するが、ここではアド
レス１２２４で行われる。更にステップ８０で再びＳＴ
ＲＩＤＥＣＯＵＮＴＥＲが減らされるが、ここでは３
から２に減らされる。後に続くステップ８２が制御をス
テップ８４に移し、ＰＯＩＮＴＥＲＡが増大させら
れ、このようにして続行される。したがって、このプロ
セスで１２２１、１２２４、１２２７、および１２２Ａ
の系列に対するプリフェッチ要求を発する。しかし、ア
ドレス１２２Ａでプリフェッチ要求を発行した後、ステ
ップ８０は再びＳＴＲＩＤＥＣＯＵＮＴＥＲを減少さ
せる。したがって、この点で、ＳＴＲＩＤＥＣＯＵＮ
ＴＥＲは１から０に減少させられる。その結果、ステッ
プ８２は制御をステップ８６に渡す。したがって、制御
のこの変化が生じるのは、ストライド系列（すなわち、
１２２１、１２２４、１２２７、および１２２Ａ）のす
べてのアドレスがプリフェッチ要求の対象となった後で
ある。

【００７５】ストライディングアドレスの系列に対応す
るすべてのプリフェッチ要求が発せられた後にステップ
８６で、ＴＥＭＰＯＲＡＲＹＰＯＩＮＴＥＲＳＡＶ
ＥＲからの値が現在のＰＯＩＮＴＥＲにコピーされて戻
される。現在の例では、前に説明したようにステップ８
６の前に、ＰＯＩＮＴＥＲＡの値はアドレス１２２
Ａ、すなわち、ストライドアドレスの系列１２２１、１
２２４、１２２７、および１２２Ａの最後のアドレスに
等しい。しかし、ステップ８６でＴＥＭＰＯＲＡＲＹ
ＰＯＩＮＴＥＲＳＡＶＥＲからのコピーバックによ
り、現在ＰＯＩＮＴＥＲの値がストライドアドレスの系
列の初めにあった値に戻される。したがって現在の例で
は、前に（ステップ７６で）ＴＥＭＰＯＲＡＲＹＰＯ
ＩＮＴＥＲＳＡＶＥＲに記憶された１２２１という値が
今ＰＯＩＮＴＥＲＡに戻される。したがって熟練した
当業者には理解されるように、ＰＯＩＮＴＥＲＡに基
づくプリフェッチ要求の次の場合には、その要求はもう
一度、ストライド系列の終わりではなくてストライド系
列の初めのアドレスに向けられる。更に、そしてＴＥＭ
ｐＯＲＡＲＹＰＯＩＮＴＥＲＳＡＶＥＲの紹介と関
連して前に説明したように、そのＳＡＶＥＲを使用する
代わりに、別の方法でＳＡＶＥＲに記憶された初期アド
レスを再循環させることによりステップ７６の結果を達
成することができる。たとえば、１２２１の終了アドレ
スの場合、ＳＴＲＩＤＥＬＥＮＧＴＨに（ＳＴＲＩＤ
ＥＴＨＲＥＳＨＯＬＤ−１）の値を乗算することがで
き、その積を終了アドレスから減算することができる。
これにより、ＰＯＩＮＴＥＲＡを再記憶するための初
期アドレスが与えられる。

【００７６】ステップ８６の後、方法７０はステップ８
８に進む。ステップ８８は、問題になっているＬＴＢ５
６のエントリに対するＮＥＸＴＰＯＩＮＴＥＲインジ
ケータを進める。現在の例では、図９について説明した
ようにＮＥＸＴＰＯＩＮＴＥＲの値は現在００に設定
されている。すなわち、ＮＥＸＴＰＯＩＮＴＥＲは表
２に示された値によりＰＯＩＮＴＥＲＡを指す。した
がって、ステップ８８はＮＥＸＴＰＯＩＮＴＥＲ値を
０１に進める。これにより、ＰＯＩＮＴＥＲＢが、行５
６_１が使用される次の場合に対して使用されるべき次の
ＰＯＩＮＴＥＲであるということが示される。換言すれ
ば、フェッチ段４０によりフェッチされることに応答し
て次回に命令２３が検出されたとき、行５６_１が再び使
用されるが、そのときはステップ８８によるＮＥＸＴ
ＰＯＩＮＴＥＲの現在の前進に基づいてＰＯＩＮＴＥＲ
ＢとＢＣＯＮＴＲＯＬが制御を行う。更に注意すべ
きことは、ＮＥＸＴＰＯＩＮＴＥＲのこの前進はルー
ピング形式でエントリ５６_１の相次ぐ各ポインタに対し
て続行される。換言すれば、ステップ８６に達したとき
ＮＥＸＴＰＯＩＮＴＥＲがＰＯＩＮＴＥＲＣを示す
ように設定されると、その場合にＮＥＸＴＰＯＩＮＴ
ＥＲを前進させたとき、ＮＥＸＴＰＯＩＮＴＥＲは次
のＰＯＩＮＴＥＲとしてＰＯＩＮＴＥＲＡを指す。こ
のようにして、円形形式がＰＯＩＮＴＥＲＡからＰＯ
ＩＮＴＥＲＢに、ＰＯＩＮＴＥＲＣに、ＰＯＩＮＴＥ
ＲＡに戻る等のように形成される。

【００７７】今説明したステップ８８の動作の他に、ス
トライドを完了させ、円形の順序の次のＰＯＩＮＴＥＲ
以外のＰＯＩＮＴＥＲに対するループを形成できるよう
にすることにより、本発明の範囲内で更にもう一つの実
施例を作成することができる。換言すれば、前の段落で
は、ＮＥＸＴＰＯＩＮＴＥＲをＰＯＩＮＴＥＲＣか
らＰＯＩＮＴＥＲＡに進める場合について説明した。
これにより、ＰＯＩＮＴＥＲＣに関連するストライド
系列が完了した後、円形ルーピング形式が維持される。
換言すれば、表５に与えられたストライド制御値で、前
の段落が示唆するところによれば、ストライド系列が完
了した後、ＮＥＸＴＰＯＩＮＴＥＲを単に増大させ
る。これにより、今完了したストライド系列に関連して
使用されたばかりのＰＯＩＮＴＥＲに円形順序で続くＰ
ＯＩＮＴＥＲにより、次のターゲットデータアドレスが
示される。しかし、代替実施例として、ストライド系列
が完了した後、異なるＰＯＩＮＴＥＲがＮＥＸＴＰＯ
ＩＮＴＥＲとなるように、更に付加的な制御を行うこと
もできる。たとえば、各ＬＴＢエントリに付加的な値を
含めることができる。またはＣＯＮＴＲＯＬ内のビット
数を増やすことができる。いずれにしても付加的な機能
により、ストライド系列の完了後に、今使用したばかり
のＰＯＩＮＴＥＲに円形状に続かないＰＯＩＮＴＥＲが
指定される。たとえば、ＰＯＩＮＴＥＲＡがストライ
ド系列を支配した上記の例で、この付加的な制御によっ
てＮＥＸＴＰＯＩＮＴＥＲを１０に変えることができ
る。これにより、（上記の例のようなＰＯＩＮＴＥＲ
Ｂではなくて）ＰＯＩＮＴＥＲＣが、データフェッチ命
令の次の生起に対して使用すべき次のＰＯＩＮＴＥＲで
あるということが示される。このように各ＬＴＢエント
リで、上記のものより更にもっと複雑なデータパターン
を検出し、示すことができる。

【００７８】ステップ８８の後、方法７０はステップ９
０に達する。前に説明したように、ステップ７７のエラ
ーハンドリングの後にも、ステップ９０に達することが
あり得る。いずれにしても、ステップ９０は単に、ＬＴ
Ｂ５６の中の、ストライドモードの動作に基づく与えら
れたエントリに対する方法７０の終わりを表しているに
過ぎない。したがって、ステップ９０の後、方法７０は
多数の付加的な回数繰り返すことができる。それらの回
数はフェッチされた命令とＬＴＢ５６の中のエントリと
が一致したことに応答してもう一度開始される。ここ
で、一致するＬＴＢエントリはストライドモードを示す
ために設定された適当なＣＯＮＴＲＯＬ情報値をそなえ
ており、ストライドの長さはＳＴＲＩＤＥＬＥＮＧＴ
Ｈ値に示されている。

【００７９】上記の説明から熟練した当業者には理解さ
れるように、図８の実施例では、プリフェッチ要求をス
トライディングアドレスの系列に発することができる。
実際、本例を継続することにより、熟練した当業者には
理解されるように図８の実施例では、ストライディング
アドレス相互の間にルーピングも行うことができる。更
に詳しく述べると、図９を再び参照することにより、Ｐ
ＯＩＮＴＥＲＢがアドレス２２２１を表すことがわか
る。前に説明したように、上記の例のステップ８８は、
ＮＥＸＴＰＯＩＮＴＥＲを変更して、行５６_１が使用
される次の場合に使用されるべき次のＰＯＩＮＴＥＲと
してＰＯＩＮＴＥＲＢを示す。このように、本例を続
けて説明する。フェッチ段４０によりフェッチされるこ
とに応答して命令２３が次に検出されたとき、フェッチ
を予測するために行５６_１が再び使用されるが、この点
ＢではＢＣＯＮＴＲＯＬとＰＯＩＮＴＥＲＢが使用
される。更に注意すべきことは、ＢＣＯＮＴＲＯＬは
ルーピングモードを示すということである。したがっ
て、命令２３のこの場合に対して、再びプリフェッチ要
求がアドレス２２２１に対して発せられるが、その後に
命令２３の次の三つの生起の各々に対する三つのストラ
イドが続く。すなわち、次の三つのこのような生起はア
ドレス２２２４、２２２７、および２２２Ａに対するプ
リフェッチ要求を生じる。更に、プリフェッチ要求の一
部としてアドレス２２２Ａが発せられると、再びＮＥＸ
ＴＰＯＩＮＴＥＲが増大させられ、今度は次のアクセ
スのための制御としてＰＯＩＮＴＥＲＣおよびそれの
ＣＣＯＮＴＲＯＬが示される。熟練した当業者には理
解されるように、命令２３の次の４回の生起に対しても
う一度アドレスのストライドパターンが生じる。それら
のアドレスには５２２１、５２２４、５２２７、および
５２２Ａが含まれる。最後に、これが完了したとき、再
びＮＥＸＴＰＯＩＮＴＥＲが増大させられる。今度は
次のアクセスのための制御としてＰＯＩＮＴＥＲＡお
よびそれのＡＣＯＮＴＲＯＬを生じるループバックが
完成する。このようにして、このパターンは多数回繰り
返すことができる。これにより、ストライドの後にルー
プが続く組み合わせ機能が得られる。

【００８０】上記の例では、各ＰＯＩＮＴＥＲに対して
ＣＯＮＴＲＯＬ情報値が設けられており、ＣＯＮＴＲＯ
Ｌ値は００１に等しい。すなわち、ストライドモードが
示され、ストライドの大きさがエントリ５６_１のＳＴＲ
ＩＤＥＬＥＮＧＴＨに記憶された。しかし、代わりと
して０１０および０１１に等しいＣＯＮＴＲＯＬ値を使
用してもよい。それらの値は各々、（表５にＬＥＮＧＴ
Ｈ１およびＬＥＮＧＴＨ２として示されている）既知の
固定長さに対応している。たとえば、ＬＥＮＧＴＨ１は
３バイトの値とすることができる。この場合、ＳＴＲＩ
ＤＥＬＥＮＧＴＨ値からの値を使用する、前の例は代
わりに０１０のＣＯＮＴＲＯＬ値を使用して達成され
た。そしてそのＣＯＮＴＲＯＬ値から、それに対してプ
リフェッチ要求が発せられる次の予測されたアドレスを
計算するとき３というストライド長さを使用することが
わかっている。もう一つの例として、ＬＥＮＧＴＨ２は
与えられた構成に対する１ワードの大きさとすることが
できる。したがって、ＬＥＮＧＴＨ２はあるマシンにつ
いては４バイトとすることができる。したがって、この
ような場合には、ＣＯＮＴＲＯＬ値が０１１に等しけれ
ば、エントリのＳＴＲＩＤＥＬＥＮＧＴＨ値を使用す
る必要は無く、代わりに０１１符号化からわかるような
４バイトの固定値を使用して相次ぐストライドアドレス
を計算する。上記の他に、更により複雑なストライディ
ングデータパターンに対しては、一つのＰＯＩＮＴＥＲ
に対応するＣＯＮＴＲＯＬがもう一つのＰＯＩＮＴＥＲ
に対応するＣＯＮＴＲＯＬとモードが異なってもよい。
たとえば、ＡＣＯＮＴＲＯＬを００１、ＢＣＯＮＴ
ＲＯＬを０１０、そしてＣＣＯＮＴＲＯＬを０１１と
することができる。このように、各ＣＯＮＴＲＯＬはス
トライドモードに関連するが、ストライド長さが異なっ
ている。更に他の例も、熟練した当業者には理解されよ
う。

【００８１】上記のアドレスのパターンを背景として、
この点までプリフェッチ要求が発せられるということを
述べてきた。したがって、要求が実際にプリフェッチ動
作を生じるということを肯定的に述べていない。換言す
れば、一旦プリフェッチ要求が発せられると、その要求
に応答してプリフェッチ動作が実際に行われるか否かは
要求している回路にはわからない。プリフェッチ動作が
行われれば、多分、要求されたデータはその後、オンチ
ップキャッシュで利用できるので、そのキャッシュから
実際のフェッチによってそのデータを使用することがで
きる。しかし、場合によっては、プリフェッチ要求にサ
ービスしない、すなわち、プリフェッチ要求に応答した
プリフェッチ動作を許さないことが望ましいこともあ
る。このような場合の二つの例を以下に述べる。

【００８２】プリフェッチ要求は発せられるが、その要
求に応答したプリフェッチは生じたり、生じなかったり
する場合の第一の例として、本実施例の更にもう一つの
側面では、ＬＴＢ５６の各エントリに一つ以上の付加的
な値を付加することができる。または上記のエントリに
アクセスする、ある付加的な回路を接続することができ
る。この付加的な回路は、キャッシュ行交差に基づいで
過去のプリフェッチ要求と比べて現在のプリフェッチ要
求を評価する。更に詳しく述べると、二つのアドレスを
評価することにより後続のアドレスが前のアドレスと同
じキャッシュ行の中にあるか否かを判定する種々の回路
がこの分野では知られている。後続のアドレスが前のア
ドレスと同じキャッシュ行の中に無ければ、後続のアド
レスは前のアドレスに対して行交差であると言われる。
すなわち、そのアドレスは一つのキャッシュ行と前のア
ドレスに対応するもう一つのキャッシュ行との間の境界
と交差する。本実施例の状況では、この機能をストライ
ド動作と組み合わせて使用することにより、性能を更に
改善する。更に詳しく述べると、プリフェッチ要求の一
部として相次ぐ各ストライドアドレスが発せられるにつ
れて、ストライドアドレスをこのような行交差検出回路
に提出することが好ましい。後続のアドレスがキャッシ
ュ行と交差しない場合には、したがって、前のストライ
ドアドレスに関連して多分捜された（かプリフェッチさ
れたかの一方または両方の）データを捜していることに
なる。したがって、他の考慮が無い場合には、後続のプ
リフェッチ要求はプリフェッチ動作を生じる必要は無
い。というのは、先行アドレスが既にプリフェッチ動作
を生じたからであり、またその動作により、後続のプリ
フェッチ要求で捜されるデータは既にキャッシュの中に
あることが保証されたからである。これをより良く説明
するため、命令２３の例に戻る。前に説明したように、
方法２０によって取り扱われるとき、命令２３は１２２
１、１２２４、１２２７、および１２２Ａのストライド
アドレスを発した。今、アドレス１２２１と１２２４が
一つのキャッシュ行の中にそろっており、アドレス１２
２７と１２２Ａが一つのキャッシュ行の中にそろってい
るものとする。命令２３の第一の生起に対しては、アド
レス１２２１に対応してプリフェッチ要求が発せられる
ことが前に示されている。これは系列の中の最初のアド
レスであるので、何か他の理由が無ければ、プリフェッ
チ要求に応答してプリフェッチ動作を行うことができ
る。このようにして、アドレス１２２１のデータがオン
チップキャッシュ内にプリフェッチされる。しかし、ア
ドレス１２２４もアドレス１２２１と同じキャッシュ内
にあるので、１２２１に対するアドレスがこのようにし
てプリフェッチされるのと同時にアドレス１２２４のデ
ータもプリフェッチされる。次に、命令２３の第二の生
起に対しては、アドレス１２２４に対応してプリフェッ
チ要求が発せられることが前に示された。しかし、ここ
で、キャッシュ行交差検出回路は現在のアドレス１２２
４が先行するアドレス１２２１と同じキャッシュ行の中
にあることを検出する。これに応答して、アドレス１２
２４のデータに対してはプリフェッチ要求が発せられる
事が好ましいが、これに応答してこの点ではプリフェッ
チ動作が行われないことが好ましい。なぜなら、アドレ
ス１２２１のデータと同時に、捜し求められたデータが
既に以前にキャッシュにプリフェッチされていたからで
ある。この例について、説明を続ける。命令２３の第三
の生起に対しては、アドレス１２２７に対応してプリフ
ェッチ要求が発せられることが前に示された。ここで、
キャッシュ行交差検出回路は現在のアドレス１２２７が
先行するアドレス１２２４と同じキャッシュ行の中に無
いことを検出する。したがって、アドレス１２２７のデ
ータに対して発せられたプリフェッチ要求に応答して、
プリフェッチ動作を行うことができることが好ましい。
これにより、アドレス１２２７（および１２２Ａ）のデ
ータが異なるキャッシュ行にフェッチされる。これによ
り、この場合も、そのデータは後でフェッチのためオン
チップで利用できる。

【００８３】プリフェッチ要求は発せられるが、その要
求に応答したプリフェッチは生じたり、生じなかったり
する場合の第二の例として、かなり前に説明したよう
に、付加的なシステムパラメータが、プリフェッチ動作
を行うべきか、または異なるが関連した応答性のプリフ
ェッチ動作が行われるように実際に要求を修正するべき
かということの有効性に影響を及ぼす。再び、これらの
付加的な考慮をするためには、前に引用した米国特許出
願第号、「マイクロプロセッサに基づくシス
テムでプリフェッチ処理のための回路、システム、およ
び方法」（Ｃｉｒｃｕｉｔｓ，Ｓｙｓｔｅｍｓ，Ａｎｄ
ＭｅｔｈｏｄｓＦｏｒＰｒｅｆｅｔｃｈＨａｎ
ｄｌｉｎｇＩｎＡＭｉｃｒｏｐｒｏｃｅｓｓｏｒ
−ＢａｓｅｄＳｙｓｔｅｍ）（代理人処理番号ＴＩ−
２４１５３）を参照できる。

【００８４】図８および９のエントリ５６_１によって行
われるストライド動作とそれに続くルーピング動作につ
いて説明してきた。それらの図のエントリ５６_１の特性
と、前に紹介した種々の側面を更に説明するために、表
４の例の命令２３と関連して図９のエントリ５６_１の中
の値の設定について説明する。前に説明したように、表
４のプログラムは、外部メモリ１４のような、マイクロ
プロセッサ１２がアクセスできるメモリに命令として記
憶される。したがって、それらの命令を処理するため
に、各命令はパイプライン３８内にフェッチされ、それ
を通ってその実行段４８に向かう。したがって、このプ
ロセスの間、命令２３が初めて（すなわち、Ｊ＝１でＫ
＝１の場合）命令フェッチ段４０によってフェッチされ
る。この点で当業者には知られた手法により、命令がロ
ード、記憶、記憶質問等のようなデータフェッチ命令で
あるということが検出される。命令２３がデータフェッ
チ命令であると検出されたことに応答して、図５のエン
トリ５６_１に関連して説明したように同じ初期ステップ
が行われる。したがって、それらの詳細をここで再び説
明しなくても前の説明を参照して理解し得る。簡単に述
べると、前に説明したように、ＬＴＢ５６を使用して、
それのエントリの一つが命令２３に対応するか判定す
る。そして、エントリを検証するか、またはＬＴＢ５６
の中の新しい列に（たとえば、ＬＴＢ５６の最も古く使
用されたエントリを立ちのかせることにより）エントリ
を作成する。しかし、更に前に述べたように、図４のエ
ントリはストライドに関連した属性を含んでおらず、デ
フォルト予測はループが含まれているということだっ
た。したがって、図４のエントリ５６_１に対して、デー
タフェッチ命令を受けて、それのターゲットデータアド
レスをエントリに入れた後、ＮＥＸＴＰＯＩＮＴＥＲ
の値が０１に設定される。これにより、ＰＯＩＮＴＥＲ
Ｂがデータフェッチ命令の次の生起の際に使用すべき次
のポインタであるということが示される。しかし、図８
のエントリ５６_１の本実施例では、それに種々の付加的
なストライド処理能力が含まれている。その結果、後で
更に説明するように、それのデフォルト予測は、アドレ
ス系列がルーピングでなくストライディングを行うとい
うことである。したがって、ＮＥＸＴＰＯＩＮＴＥＲ
の値は００に維持される。すなわち、ＰＯＩＮＴＥＲ
Ａが命令２３の次の生起の際に使用すべき次のポインタ
であるということが示される。しかし、この点では単一
のターゲットデータアドレスしか無いので、それはＴＥ
ＭＰＯＲＡＲＹＰＯＩＮＴＥＲＳＡＶＥＲとＰＯＩ
ＮＴＥＲＡに記憶され、ＡＣＯＮＴＲＯＬは００１
に設定される。表５で説明したようにこれは、ストライ
ド長さがＳＴＲＩＤＥＬＥＮＧＴＨ値に記憶されたス
トライドモードエントリを示す。更に、ＰＯＩＮＴＥＲ
Ａの値がストライドアドレスの系列の中の第一のアド
レスであると予測されるので、ＳＴＲＩＤＥＣＯＵＮ
ＴＥＲは１に初期設定される。最後にＳＴＲＩＤＥＣ
ＯＮＴＲＯＬは「不完全」に設定される。換言すれば、
本例の現在の点では、ストライド系列が完全であるか否
かわからない。したがって、後で理解されるような制御
の目的のため、ＳＴＲＩＤＥＣＯＮＴＲＯＬの中にあ
る値（たとえば、ある２進コード）が設定されて、この
不完全なステータスを表示する。

【００８５】命令２３の第二の生起により、ＬＴＢにヒ
ットが生じる。これに応答して、ＮＥＸＴＰＯＩＮＴ
ＥＲがＰＯＩＮＴＥＲＡであり、ＰＯＩＮＴＥＲＡ
に対するＣＯＮＴＲＯＬ値が００１（すなわち、ストラ
イドモードエントリ））、ＳＴＲＩＤＥＣＯＵＮＴＥ
Ｒが１に設定され、ＳＴＲＩＤＥＣＯＮＴＲＯＬが
「不完全」に設定されているということが判定される。
これに応答して、この第二の生起からの実際のターゲッ
トデータアドレスを使用して、その値とＰＯＩＮＴＥＲ
Ａに既に記憶されている値（すなわち、命令２３の第
一の生起による実際のターゲットデータアドレス）との
差が計算される。したがって現在の例では、１２２１と
いう第一の生起のターゲットデータアドレスが１２２４
という第二の生起のターゲットデータアドレスから減算
される。これにより、３という差が得られる。更に、ス
トライドモードとしてデフォルトモードが予測されるの
で、次にこの差はエントリ５６_１のＳＴＲＩＤＥＬＥ
ＮＧＴＨ値に記憶される。更に、デフォルト予測によれ
ば命令２３のこの第二の生起は一連のストライドアドレ
スの中の２番目であるので、ＳＴＲＩＤＥＣＯＵＮＴ
ＥＲはこのとき１から２に増やされる。更に、現在のタ
ーゲットデータアドレス（すなわち、１２２４）がＰＯ
ＩＮＴＥＲＡに記憶される。最後に、二つの相次ぐア
ドレスだけが受信、分析されたので、ＮＥＸＴＰＯＩ
ＮＴＥＲは００にとどまってＰＯＩＮＴＥＲＡを示
し、ＡＣＯＮＴＲＯＬは００１にとどまり、ＳＴＲＩ
ＤＥＣＯＮＴＲＯＬは不完全なステータスを表示し続
ける。

【００８６】命令２３の第三の生起によって、ＬＴＢに
再びヒットが生じる。これに応答して、対応するエント
リに対して再び、ＮＥＸＴＰＯＩＮＴＥＲがＰＯＩＮ
ＴＥＲＡであり、ＡＣＯＮＴＲＯＬが００１に設定
されていると判定される。しかし、ここでは、ＳＴＲＩ
ＤＥＣＯＵＮＴＥＲが１より大きいということも検出
される。「不完全な」というＳＴＲＩＤＥＣＯＮＴＲ
ＯＬ値と組合わされたこの表示から、ストライド系列が
設定されつつあり、まだ完成しておらず、データフェッ
チ命令の二つの生起しか含んでいないということがわか
る。したがって再び、この第三の生起からの実際のター
ゲットデータアドレスを使用して、その値とＰＯＩＮＴ
ＥＲＡに既に記憶されている値（すなわち、命令２３
の第二の生起からの実際のターゲットデータアドレス）
との差が計算される。したがって、現在の例では、差は
３に等しい。次に、この差は既にＳＴＲＩＤＥＬＥＮ
ＧＴＨに記憶されている差と比較される。したがって、
現在の例では、一致していることが見出されるので、ア
ドレスのストライド系列が継続していると推定される。
その結果、（３という）同じ差がＳＴＲＩＤＥＬＥＮ
ＧＴＨ値にとどまる。更に、現在のターゲットデータア
ドレス（すなわち、１２２７）がＰＯＩＮＴＥＲＡに
記憶される。更に、ＳＴＲＩＤＥＣＯＵＮＴＥＲはこ
のとき２から３に増やされる。

【００８７】命令２３の第四の生起により、再びＬＴＢ
５６にヒットが生じ、対応するＮＥＸＴＰＯＩＮＴＥ
ＲがＰＯＩＮＴＥＲＡに設定され、ＡＣＯＮＴＲＯ
Ｌが００１に設定され、ＳＴＲＩＤＥＣＯＮＴＲＯＬ
が「不完全」に設定される。しかし、ＳＴＲＩＤＥＣ
ＯＵＮＴＥＲが２より大きい（たとえば、現在３に等し
い）ので、データフェッチ命令のこの第四の生起に対す
る実際のターゲットデータアドレスはＰＯＩＮＴＥＲ
Ａの値（すなわち、命令の第三の生起による値）とＳＴ
ＲＩＤＥＬＥＮＧＴＨに記憶された値との和となると
このとき予測される。換言すれば、この第四の生起がも
う一度、上記の第一から第三の生起で始まった系列のス
トライドになるということがこのとき予測される。した
がって、現在の例では、ＳＴＲＩＤＥＬＥＮＧＴＨの
中の３という値がＰＯＩＮＴＥＲＡの中の１２２７の値
に加算され、その結果得られる１２２Ａのターゲットデ
ータアドレスを使用してそのアドレスのプリフェッチ要
求が発せられる。更に結局、命令のこの第四の生起によ
り、命令はパイプライン３８に沿って充分に進むので、
実際のターゲットデータアドレスが発せられる。これに
応答して、この第四の生起からの実際のターゲットデー
タアドレスを使用して、その値と前にＰＯＩＮＴＥＲ
Ａに記憶された命令２３の第三の生起からの値との差を
計算することにより、この第四の生起がもう一度ストラ
イドであったということを確かめる。ここで、差は３に
等しいので、ＳＴＲＩＤＥＬＥＮＧＴＨに既に記憶さ
れている値と比較したとき、その結果は一致する。した
がって、予測されたターゲットデータアドレスは正確で
あったことが確かめられるので、更に、アドレスのスト
ライド系列が継続していると推定される。その結果とし
て、同じ差（３）がＳＴＲＩＤＥＬＥＮＧＴＨ値にと
どまり、ＳＴＲＩＤＥＣＯＵＮＴＥＲがこのとき３か
ら４に増やされる。更に、現在のターゲットデータアド
レス（すなわち、１２２Ａ）がＰＯＩＮＴＥＲＡに記
憶される。

【００８８】命令２３の第五の生起により、再びＬＴＢ
５６にヒットが生じ、対応するＮＥＸＴＰＯＩＮＴＥ
ＲがＰＯＩＮＴＥＲＡに設定され、ＡＣＯＮＴＲＯ
Ｌが００１に設定され、ＳＴＲＩＤＥＣＯＮＴＲＯＬ
が「不完全」に設定される。もう一度、ＳＴＲＩＤＥ
ＣＯＵＮＴＥＲが２より大きい（たとえば、現在４に等
しい）ので、データフェッチ命令のこの第五の生起に対
する実際のターゲットデータアドレスはＰＯＩＮＴＥＲ
Ａの値（すなわち、命令の第四の生起による値）とＳ
ＴＲＩＤＥＬＥＮＧＴＨに記憶された値との和となる
とこのとき予測される。したがって、現在の例では、Ｓ
ＴＲＩＤＥＬＥＮＧＴＨの中の３という値がＰＯＩＮ
ＴＥＲＡの中の１２２Ａの値に加算され、その結果得
られる１２２Ｄのターゲットデータアドレスを使用して
そのアドレスのプリフェッチ要求が発せられる。更に結
局、命令のこの第五の生起により、命令はパイプライン
３８に沿って充分に進むので、実際のターゲットデータ
アドレスが発せられる。これに応答して、この第五の生
起からの実際のターゲットデータアドレスを使用して、
その値と前にＰＯＩＮＴＥＲＡに記憶された命令２３
の第四の生起からの値との差を計算することにより、こ
の第五の生起がもう一度ストライドであったということ
を確かめる。しかし、ここで、図７で説明したように命
令２３の第五の生起に対する実際のターゲットデータア
ドレスは２２２１である。したがって、この第五のアド
レスとＰＯＩＮＴＥＲＡに記憶された１２２Ａの値と
の差はＳＴＲＩＤＥＬＥＮＧＴＨに既に記憶されてい
る３という差に等しくない。このように、不一致に応答
して、現在の生起までのストライド系列が完了してい
る、すなわち、アドレス１２２１、１２２４、１２２
７、および１２２Ａの系列が完了していると判定され
る。したがって、これに応答して、その系列の第一のア
ドレスがＴＥＭＰＯＲＡＲＹＰＯＩＮＴＥＲＳＡＶ
ＥＲからＰＯＩＮＴＥＲＡに戻される。更に、ＳＴＲＩ
ＤＥＣＯＮＴＲＯＬの不完全なステータスがこのとき
再設定されて、ＰＯＩＮＴＥＲＡに対するストライド
分析が完全であることを示す。したがってＳＴＲＩＤＥ
ＬＥＮＧＴＨは、系列内のストライドアドレス相互の
間の適当な距離をそなえている。更に、前に説明したよ
うに、ストライド糸列のアドレス毎にＳＴＲＩＤＥＣ
ＯＵＮＴＥＲは増やされた。したがって、ストライド系
列の検出を終了すると、ＳＴＲＩＤＥＣＯＵＮＴＥら
の値がＳＴＲＩＤＥＴＨＲＥＳＨＯＬＤに移され、Ｓ
ＴＲＩＤＥＣＯＵＮＴＥＲが１に戻される。更に、次
にＮＥＸＴＰＯＩＮＴＥＲが０１の値に設定される。
これにより、ＰＯＩＮＴＥＲＢがデータフェッチ命令
の次の生起を制御すべきであるということが示される。
最後に、命令２３の第五の生起による現在のターゲット
データアドレスがＰＯＩＮＴＥＲＢとＴＥＭＰＯＲＡ
ＲＹＰＯＩＮＴＥＲＳＡＶＥＲに記憶され、ＢＣ
ＯＮＴＲＯＬが００１に設定される。

【００８９】命令２３の第六の生起は種々の点で上記の
第二の生起に類似しているが、ここではＰＯＩＮＴＥＲ
ＡでなくＰＯＩＮＴＥＲＢに対して動作が行われ
る。したがって、ＬＴＢ５６内のヒットに応答して、対
応するＮＥＸＴＰＯＩＮＴＥＲがＰＯＩＮＴＥＲＢ
であり、ＰＯＩＮＴＥＲＢに対するＣＯＮＴＲＯＬ値
が００１に設定され、ＳＴＲＩＤＥＣＯＵＮＴＥＲが
１に設定され、ＳＴＲＩＤＥＣＯＮＴＲＯＬが「不完
全」に設定される。これに応答して、この第六の生起か
らの実際のターゲットデータアドレスを使用して、その
値とＰＯＩＮＴＥＲＢに既に記憶されている第五の生
起の実際のターゲットデータアドレスの値との差が計算
される。したがって現在の例では、２２２１という第五
の生起のターゲットデータアドレスが２２２４という第
六の生起のターゲットデータアドレスから減算される。
これにより、３という差が得られる。しかしこの点で、
前に説明したようにＰＯＩＮＴＥＲＡは既にストライ
ド系列に対応して完全に設定され、また前に説明したよ
うに各ＰＯＩＮＴＥＲは同じストライドリソースを共通
使用する。したがって、ＰＯＩＮＴＥＲＢがストライ
ド系列にも対応できる程度まで、ＳＴＲＩＤＥＬＥＮ
ＧＴＨがＰＯＩＮＴＥＲＡの既に設定されたストライ
ド系列に対するのとＰＯＩＮＴＥＲＢに対するのと同
じであることが保証される。したがって、第六および第
五の実際のターゲットデータアドレスから計算された３
というストライド長さが与えられたとき、この差がＳＴ
ＲＩＤＥＬＥＮＧＴＨ内の値と比較される。ここで、一
致が生じるので、ストライド系列に関連したＰＯＩＮＴ
ＥＲＢの設定を続行することができる。しかし注意す
べきことは、一致しない場合には代替のステップが行わ
れるということである。たとえば、前に述べた代替実施
例では、各ＰＯＩＮＴＥＲはそれ自身の対応するストラ
イド属性をそなえているので、ＰＯＩＮＴＥＲＢはス
トライド系列の異なる型、すなわちＳＴＲＩＤＥＬＥ
ＮＧＴＨ、ＳＴＲＩＤＥＴＨＲＥＳＨＯＬＤの一方ま
たは両方が異なる系列に対応するように設定することが
できる。熟練した当業者は更に他の代替実施例を確かめ
ることができる。いずれにしても、ストライド長さが一
致する現在の例に戻ると、ＳＴＲＩＤＥＣＯＵＮＴＥ
Ｒは１から２に増やされる。デフォルト予測によれば、
命令２３のこの第六の生起はＰＯＩＮＴＥＲＢに対す
る一連のストライドアドレスで二番目だからである。更
に、現在のターゲットデータアドレス（すなわち、２２
２４）がＰＯＩＮＴＥＲＢに記憶される。最後に、二
つの相次ぐアドレスだけが受信、分析されたので、ＮＥ
ＸＴＰＯＩＮＴＥＲは０１にとどまってＰＯＩＮＴＥ
ＲＢを示し、ＢＣＯＮＴＲＯＬは００１にとどま
り、ＳＴＲＩＤＥＣＯＮＴＲＯＬは不完全なステータ
スに設定されたままになる。

【００９０】上記で熟練した当業者には理解されるよう
に、命令２３の第三、第四、および第五の生起に関連し
たＰＯＩＮＴＥＲＡの完了と同様にして、命令２３の
第七、第八、および第九の生起に対して前のステップを
繰り返すことによりＰＯＩＮＴＥＲＢに対応する値を
完了することもできる。したがって、命令２３の第九の
生起の後、ＰＯＩＮＴＥＲＢにはＴＥＭＰＯＲＡＲＹ
ＰＯＩＮＴＥＲＳＡＶＥＲからの２２２１のアドレ
スが戻され、ＳＴＲＩＤＥＣＯＮＴＲＯＬは完了ステ
ータスを示すように再設定される。このようにして、一
旦次にＰＯＩＮＴＥＲＢがＮＥＸＴＰＯＩＮＴＥＲ
として示されると、それはストライド値との組み合わせ
で一連の４個のストライドアドレスを予測する。それら
のストライドアドレスは２２２１、２２２４、２２２
７、および２２２Ａである。更に注意すべきことは、第
九の生起を使用して現在のストライド系列が完了したと
推論されれば、ＳＴＲＩＤＥＣＯＵＮＴＥＲの値がＳ
ＴＲＩＤＥＴＨＲＥＳＨＯＬＤの値と比較される。こ
のステップは、多数のＰＯＩＮＴＥＲの間でストライド
に関連した値が共通使用されるため、再び必要とされ
る。換言すれば、この点で、前に説明したようにＳＴＲ
ＩＤＥＴＨＲＥＳＨＯＬＤは既に１２２１、１２２
４、１２２７、および１２２Ａのストライド系列に対し
て完全に設定されている。したがって、ＰＯＩＮＴＥＲ
Ｂがストライド系列にも対応できる程度まで、ＳＴＲ
ＩＤＥＴＨＲＥＳＨＯＬＤがＰＯＩＮＴＥＲＡの既
に設定されたストライド系列に対するのとＰＯＩＮＴＥ
ＲＢに対するのと同じであることが保証される。した
がって、４というＳＴＲＩＤＥＴＨＲＥＳＨＯＬＤが
与えられたとき、それがＳＴＲＩＤＥＣＯＵＮＴＥＲ
内の値と比較される。ここで、一致が生じるので、スト
ライド系列に関連したＰＯＩＮＴＥＲＢの設定が完了
する。

【００９１】ＰＯＩＮＴＥＲＢとそのＣＯＮＴＲＯＬ
がストライドモードを示すように完結した後も、ＰＯＩ
ＮＴＥＲＡとＰＯＩＮＴＥＲＢの値を比較するため
に付加的なステップを設けることができる。これら二つ
の値が一致すれば、代替の予測として、命令２３が４個
のアドレスを通って繰り返しストライド系列を遂行した
後、もとの同じアドレス（すなわち、ＰＯＩＮＴＥＲ
ＡとＰＯＩＮＴＥＲＢの両方に記憶されたアドレス）に
戻ると予測することができる。換言すれば、ＰＯＩＮＴ
ＥＲＡに対応する与えられたストライド系列に対し
て、系列が完了した後、同じ系列の開始アドレスにルー
プで戻ると判定することができる。この場合、更に前に
述べたように、ステップ８８に関連して代替案を説明し
た。これにより、ストライドを完了し、その後に円形の
順序で次のＰＯＩＮＴＥＲ以外のＰＯＩＮＴＥＲへのＮ
ＥＸＴＰＯＩＮＴＥＲ表示を続けることができる。し
たがって、この現在の段落はこのような代替案から利益
を得る。この代替案により、ストライド系列を完了する
ことができ、現在完了しているストライドを支配した同
じＰＯＩＮＴＥＲをＮＥＸＴＰＯＩＮＴＥＲが表すこ
とができる。換言すれば、現在の例に対して、ＮＥＸＴ
ＰＯＩＮＴＥＲ値は００に設定されたままになる。し
たがって、ストライド系列が完了すると、今完了したば
かりのストライド系列をも制御したＰＯＩＮＴＥＲＡ
が再びデータフェッチ命令の次の生起を支配する。

【００９２】最後に、図７の例およびエントリ５６_１の
設定に戻って、熟練した当業者には理解されるように、
第二組のストライドアドレス（すなわち、２２２１、２
２２４、２２２７、および２２２Ａ）に対する前のステ
ップが命令２３の第十から第十三の生起に対して繰り返
されることにより、ＰＯＩＮＴＥＲＣに対応する値が
完了する。したがって、命令２３の第十三の生起後に、
ＰＯＩＮＴＥＲＣにＴＥＭＰＯＲＡＲＹＰＯＩＮＴ
ＥＲＳＡＶＥＲからの５２２１のアドレスが再記憶さ
れ、ＣＣＯＮＴＲＯＬが００１に設定され、ＳＴＲＩ
ＤＥＣＯＮＴＲＯＬが分析完了を示すように再設定さ
れる。このようにして、一旦ＰＯＩＮＴＥＲＣがＮＥ
ＸＴＰＯＩＮＴＥＲとして示されると、それはストラ
イド値との組み合わせで一連の４個のストライドアドレ
スを予測する。それらのストライドアドレスは５２２
１、５２２４、５２２７、および５２２Ａである。更
に、命令２３の第十三の生起に対する実際のターゲット
データアドレスを受けた後、熟練した当業者には理解さ
れるように、ＮＥＸＴＰＯＩＮＴＥＲはＰＯＩＮＴＥ
ＲＡを指示する。したがって、第十三の生起の実際の
ターゲットデータアドレスはＰＯＩＮＴＥＲＡの中の
ターゲットデータアドレスと一致することが確かめられ
る。したがって、現在の例では、一致が見出される。こ
れにより、ＰＯＩＮＴＥＲＣに関連するストライド系
列の終わりからＰＯＩＮＴＥＲＡで表されるような次
のストライド系列の初めに至るループが完成する。

【００９３】上記で、熟練した当業者には理解されるよ
うに、命令２３の第十三の生起の後、そのエントリ５６
_１が（すなわち、図９に示すように）完成し、上記のよ
うなストライドの後にループが続く系列を正確に予測す
るように検証される。したがって、図１０の方法での使
用を容易にするために、エントリ５６_１を更に修正し
て、命令２３の次の生起（すなわち、第十四の生起）と
その後の他の生起が図１０の方法に従うようにすること
が好ましい。したがって、これを達成するため、ＳＴＲ
ＩＤＥＣＯＵＮＴＥＲにＳＴＲＩＤＥＴＨＲＥＳＨ
ＯＬＤをロードした後、一回減らすことが好ましい。と
いうのは、命令２３の第十三の生起、すなわち、現在の
ストライド系列の第一の生起は、それのターゲットデー
タの実際のフェッチが行われたという点で既に処理され
ているからである。したがって、この点以降、図１０の
方法は、エントリ５６_１の予測が正確なままである限
り、上記のようにプリフェッチ要求を発することができ
る。

【００９４】上記で、熟練した当業者は本実施例がどの
ようにデータフェッチ命令に対するルーピングとストラ
イディングの両方のデータパターンを正確に予測できる
かを理解するはずである。更に、符号化の種々の例をそ
れらの予測に対して示し、それらの符号化を設定するた
めの種々の手法を示したが、熟練した当業者は他の代替
案を確かめることができる。たとえば、図４の実施例は
３個のＰＯＩＮＴＥＲ（およびそれらの対応するＣＯＮ
ＴＲＯＬフィールド）をそなえており、これは図２ａか
ら図７に紹介されたようなパターンを検出するためには
好ましいが、種々のデータパターンに対して代わりの個
数のＰＯＩＮＴＥＲを使用してもよい。もう一つの例と
して、図８の実施例に対する代替実施例を上記し、それ
によれば各ＰＯＩＮＴＥＲとそれに結合されたＣＯＮＴ
ＲＯＬはそれ自身のストライドに関連した値の組をそな
えているが、更にもう一つの実施例として、ストライド
に関連した値のテーブルを設け、ＬＴＢ５６の一つ以上
のエントリがそのテーブルを参照し、またはそのテーブ
ルをＬＴＢ５６の一つ以上のエントリからの一つ以上の
ＰＯＩＮＴＥＲと結合するようにもできる。換言すれ
ば、ストライド値のリソースプールを異なるＬＴＢ５６
によって共通使用することができるか、または一つ以上
のこのようなエントリの中の異なるＰＯＩＮＴＥＲによ
って共通使用することができる。熟練した当業者は、更
に他の例を確かめることができる。したがって、本実施
例を詳細に説明してきたが、特許請求の範囲に規定され
た発明の範囲を逸脱することなく、上記の説明に対して
種々の置き換え、変形、または変更を行うことができ
る。

【００９５】以上の説明に関して更に以下の項を開示す
る。（１）ロードターゲット回路であって、複数のエントリ
を具備し、前記複数のエントリの各々が、行をデータフ
ェッチ命令に対応させるための値と、複数のポインタで
あって、複数のポインタの各々がデータフェッチ命令の
生起に対応するターゲットデータアドレスを記憶するた
めのものである、複数のポインタと、を具備する、ロー
ドターゲット回路。（２）第１項記載のロードターゲット回路であって、前
記複数のエントリの各々には更に、前記複数のポインタ
の中のどの一つがデータフェッチ命令の与えられた生起
に対するターゲットデータアドレスを与えるかを表すた
めのネクストポインタ値も含まれる、ロードターゲット
回路。（３）第１項記載のロードターゲット回路であって、前
記複数のエントリの各々には更に複数のコントロール値
が含まれ、複数のコントロール値の中の各コントロール
値は前記複数のポインタの中の一つのポインタに対応す
る、ロードターゲット回路。

【００９６】（４）第１項記載のロードターゲット回路
であって、前記複数のエントリの各々が更に、前記複数
のポインタの中のどの一つがデータフェッチ命令の与え
られた生起に対するターゲットデータアドレスを与える
かを表すためのネクストポインタ値と、複数のコントロ
ール値の中の各コントロール値が前記複数のポインタの
中の一つのポインタに対応するような、複数のコントロ
ール値と、を具備し、そして前記複数のポインタの各々
が論理的に順次かつ円形の順序に配列されており、そし
て前記複数のエントリの中の与えられた一つに対して、
ループモードを示す前記複数のコントロール値の中の与
えられた一つに応答して、前記ネクストポインタが前記
複数のコントロール値の中の前記与えられた一つに対応
する前記複数のポインタの中の第一のポインタから、前
記複数のポインタの中の前記第一のポインタのターゲッ
トデータアドレスに対応するプリフェッチ要求を発した
後、順次かつ円形の順序で前記複数のポインタの中の第
二のポインタに増やされる、ロードターゲット回路。

【００９７】（５）第１項記載のロードターゲット回路
であって、前記複数のエントリの各々が更に、前記複数
のポインタの中のどの一つがデータフェッチ命令の与え
られた生起に対するターゲットデータアドレスを与える
かを表すためのネクストポインタ値と、複数のコントロ
ール値の中の各コントロール値が前記複数のポインタの
中の一つのポインタに対応するような、複数のコントロ
ール値と、を具備し、そして前記複数のエントリの中の
与えられた一つに対して、ループモードを示す前記複数
のコントロール値の中の与えられた一つに応答して、前
記ネクストポインタが前記複数のコントロール値の中の
前記与えられた一つに対応する前記複数のポインタの中
の第一のポインタから、前記複数のポインタの中の前記
第一のポインタのターゲットデータアドレスに対応する
プリフェッチ要求を発した後、前記複数のポインタの中
の第二のポインタに調整される、ロードターゲット回
路。

【００９８】（６）第１項記載のロードターゲット回路
であって、前記複数のエントリの各々が更に、複数のコ
ントロール値の中の各コントロール値が前記複数のポイ
ンタの中の一つのポインタに対応するような、複数のコ
ントロール値と、ストライド系列の中のデータターゲッ
トアドレスの数を示すためのストライドスレッショルド
値と、を具備するロードターゲット回路。（７）第６項記載のロードターゲット回路であって、更
にプリフェッチ要求を発するための回路をも具備し、そ
して前記複数のエントリの中の各エントリは更に、その
エントリに対応するプリフェッチ要求の系列の中で発せ
られたデータターゲットアドレスの数を計数するための
ストライドカウンタをも具備する、ロードターゲット回
路。

【００９９】（８）第６項記載のロードターゲット回路
であって、更にプリフェッチ要求を発するための回路を
も具備し、前記複数のエントリの中の与えられた一つに
対して、データフェッチ命令の相次ぐ生起に応答して、
そして更にストライドモードを示す前記複数のコントロ
ール値の中の一つに応答して、前記プリフェッチ要求を
発するための回路が、前記ストライドスレッショルド値
によって示されるストライド系列の中のデータターゲッ
トアドレスの数に等しい数のプリフェッチ要求を発す
る、ロードターゲット回路。（９）第１項記載のロードターゲット回路であって、前
記複数のエントリの各々が更に、複数のコントロール値
の中の各コントロール値が前記複数のポインタの中の一
つのポインタに対応するような、複数のコントロール値
と、ストライド系列の中の相次ぐデータターゲットアド
レスの間のストライド長さを示すためのストライドレン
グス値と、を具備するロードターゲット回路。

【０１００】（１０）第９項記載のロードターゲット回
路であって、更にプリフェッチ要求を発するための回路
をも具備し、前記複数のエントリの中の与えられた一つ
に対して、データフェッチ命令の相次ぐ生起に応答し
て、そして更にストライドモードを示す前記複数のコン
トロール値の中の一つに応答して、前記プリフェッチ要
求を発するための回路が、相次ぐプリフェッチ要求を発
し、前記相次ぐプリフェッチ要求の各々がデータターゲ
ットアドレスを含み、そして前記相次ぐプリフェッチ要
求の中の第一の要求の後の相次ぐプリフェッチ要求の各
々のデータターゲットアドレスは、それ自身と直前のプ
リフェッチ要求のデータターゲットアドレスとの間の差
としてストライドレングスをそなえる、ロードターゲッ
ト回路。（１１）第１項記載のロードターゲット回路であって、
前記複数のエントリの各々が更に、複数のコントロール
値の中の各コントロール値が前記複数のポインタの中の
一つのポインタに対応するような、複数のコントロール
値と、ストライド系列の中のデータターゲットアドレス
の数を示すためのストライドスレッショルド値と、スト
ライド系列の中の相次ぐデータターゲットアドレスの間
のストライド長さを示すためのストライドレングス値
と、を具備するロードターゲット回路。

【０１０１】（１２）第１項記載のロードターゲット回
路であって、更にプリフェッチ要求を発するための回路
をも具備し、そして前記複数のエントリの各々が更に、
複数のコントロール値の中の各コントロール値が前記複
数のポインタの中の一つのポインタに対応するような、
複数のコントロール値と、ストライド系列の中のデータ
ターゲットアドレスの数を示すためのストライドスレッ
ショルド値と、ストライド系列の中の相次ぐデータター
ゲットアドレスの間のストライド長さを示すためのスト
ライドレングス値と、前記複数のポインタの中のどの一
つがデータフェッチ命令の与えられた生起に対するター
ゲットデータアトレスを与えるかを表すためのネクスト
ポインタ値と、を具備し、前記複数のエントリの中の与
えられた一つに対して、データフェッチ命令の相次ぐ生
起に応答して、そして更にストライドモードを示す前記
複数のコントロール値の中の一つに応答して、前記プリ
フェッチ要求を発するための回路が、前記ストライドス
レッショルド値によって示されるストライド系列の中の
データターゲットアドレスの数に等しい数のプリフェッ
チ要求を発し、そして前記複数のエントリの中の与えら
れた一つに対して、ループモードを示す前記複数のコン
トロール値の中の与えられた一つに応答して、前記ネク
ストポインタが前記複数のコントロール値の中の前記与
えられた一つに対応する前記複数のポインタの中の第一
のポインタから、前記複数のポインタの中の前記第一の
ポインタのターゲットデータアドレスに対応するプリフ
ェッチ要求を発した後、前記複数のポインタの中の第二
のポインタに増やされる、ロードターゲット回路。

【０１０２】（１３）第１項記載のロードターゲット回
路であって、前記複数のエントリの各々が更に、前記複
数のポインタの中のどの一つがデータフェッチ命令の与
えられた生起に対するターゲットデータアドレスを与え
るかを表すためのネクストポインタ値をも具備し、そし
て更に複数のコントロール値の中の各コントロール値が
前記複数のポインタの中の一つのポインタに対応するよ
うな、複数のコントロール値と、ネクストポインタ値を
一定値に維持することにより、データフェッチ命令の多
数回の生起に対して複数のポインタの中の一つを表し、
これにより同一アドレスループモードを作成するための
回路と、をも具備するロードターゲット回路。

【０１０３】（１４）第１項記載のロードターゲット回
路であって、更にプリフェッチ要求を発するための回路
をも具備し、そして前記複数のエントリの中の与えられ
た一つに対して、データフェッチ命令の相次ぐ生起に応
答して、そして更に同一アドレスループモードに応答し
て、前記プリフェッチ要求を発するための回路が、同一
ターゲットデータアドレスをそなえた相次ぐプリフェッ
チ要求を発する、ロードターゲット回路。（１５）第１項記載のロードターゲット回路であって、
前記複数のポインタが３個のポインタであるロードター
ゲット回路。（１６）第１項記載のロードターゲット回路であって、
前記データフェッチ命令がロード命令である、ロードタ
ーゲット回路。（１７）第１項記載のロードターゲット回路であって、
前記データフェッチ命令が記憶命令である、ロードター
ゲット回路。

【０１０４】（１８）マイクロプロセッサであって、命
令を受信するための命令パイプラインと、受信された命
令がデータフェッチ命令であるか否かを判定するための
回路と、複数のエントリを含むロードターゲット回路
と、を具備し、そして前記複数のエントリの各々が、行
をデータフェッチ命令に対応させるための値と、複数の
ポインタの各々が前記データフェッチ命令の生起に対応
するターゲットデータアドレスを記憶するような複数の
ポインタと、を具備する、マイクロプロセッサ。

【０１０５】（１９）命令パイプラインをそなえたマイ
クロプロセッサを動作させる方法であって、複数の生起
の各々がデータフェッチ命令に対する対応する複数の実
際のターゲットデータアドレスを生じるような、複数の
生起にわたって命令パイプラインでデータフェッチ命令
を受信し、複数の生起の中の第一の生起に応答して、マ
イクロプロセッサ上のロードターゲットバッファに、デ
ータフェッチ命令に対応するエントリを形成し、複数の
生起に応答して、データフェッチ命令に対する対応する
複数の実際のターゲットデータアドレスに基づいて、タ
ーゲットデータアドレスの予測をエントリの中で符号化
する、ステップからなり、予測が第一の予測型と第二の
予測型とから選択され、第一の予測型はループモードで
あり、ループモードでは複数の実際のターゲットデータ
アドレスがループ系列を形成し、ループ系列は開始ルー
プターゲットデータアドレスをそなえ、終了ループター
ゲットデータアドレスに移り、開始ループターゲットデ
ータアドレスに戻ることにより繰り返し、そして第二の
予測型はストライドモードであり、ストライドモードで
は複数の実際のターゲットデータアドレスが開始ストラ
イドターゲットデータアドレスから多数の付加的な相次
ぐアドレスに移り、相次ぐターケットアドレスの各々の
ターゲットデータアドレスはそれ自身と直前のターゲッ
トデータアドレスとの間に共通の距離をそなえている、
マイクロプロセッサ動作方法。

【０１０６】（２０）複数のエントリ（５６_１）をそな
えたロードターゲット回路（５６）。ロードターゲット
回路の中の複数のエントリの各々には、行をデータフェ
ッチ命令に対応させるための値（ＡＤＤＲＥＳＳＴＡ
Ｇ）が含まれる。更に、各ロードターゲット回路行には
複数のポインタ（ＰＯＩＮＴＥＲＡ，ＰＯＩＮＴＥＲ
Ｂ，ＰＯＩＮＴＥＲＣ）も含まれる。複数のポイン
タの各々は、データフェッチ命令の生起に対応するター
ゲットデータアドレスを記憶するためのものである。

【図面の簡単な説明】

【図１】多レベルメモリシステムからの情報のフェッ
チおよびプリフェッチの両方を行うための種々の構成要
素がある、その多レベルメモリシステムをそなえたマイ
クロプロセッサの電気図である。

【図２】レコードを示す図であって、ａはデータ処理
ソフトウェアによって処理されるべきレコードの一例の
フォーマットを示す図、ｂはａで示されるフォーマット
に従う４個のレコードで使用されるべきデータの一例を
示す図である。

【図３】図２の最初の３個のレコードを記憶する３個
のメモリエリアの構成を示し、このメモリエリア構成に
より、単一の期間の間に、データが記憶装置から第一の
エリアに入力され、その間に、データが第二のエリアで
処理され、第三のエリアのデータが記憶装置に出力され
るというように、相次ぐデータレコードをオーバラップ
して取り扱うことができる、メモリエリア構成図であ
る。

【図４】ルーピングデータパターンを収容するため
の、ロードターゲットバッファ（ＬＴＢ）の中のエント
リの第一の実施例を示す図である。

【図５】３個の相次ぐアドレス１２００、２２００、
および５２００の間のルーピングを示すように、ある値
が完了した図４のＬＴＢエントリを示す図である。

【図６】レコードを示す図であって、ａは図２ａのレ
コードに更に付加的なフィールドを付加したフォーマッ
トを示す図、ｂはａで示されるフォーマットに従う４個
のレコードで使用されるべきデータの一例を示す図であ
る。

【図７】図３の３個のメモリエリアの構成を示すが、
図６ｂに示された付加的なデータをも含むメモリエリア
の構成図である。

【図８】ＬＴＢの中のエントリの第二の実施例を示
し、ストライディングデータパターン、ルーピングデー
タパターン、またはストライディングデータパターンと
ルーピングデータパターンの組み合わせを収容するエン
トリの第二の実施例を示す図である。

【図９】３個の相次ぐアドレス１２２１、２２２１、
および５２２１の間のルーピング、とともにアドレス１
２２１からアドレス１２２Ａを通るストライディングを
示すように、ある値が完了した図８のＬＴＢエントリを
示す図である。

【図１０】相次ぐストライドアドレスに対して相次ぐ
プリフェッチ要求が発せられるように、図８のＬＴＢエ
ントリに応答して動作する方法を示す図である。

【符号の説明】

１２マイクロプロセッサ３８命令パイプライン５６ロードターゲットバッファ５６_１エントリＡＤＤＲＥＳＳＴＡＧアドレスタグＣＯＮＴＲＯＬコントロールＮＥＸＴＰＯＩＮＴＥＲネクストポインタＰＯＩＮＴＥＲポインタＳＴＲＩＤＥＬＥＮＧＴＨストライド長さＳＴＲＩＤＥＴＨＲＥＳＨＯＬＤストライド閾値

Claims

【特許請求の範囲】

【請求項１】ロードターゲット回路であって、複数のエントリを具備し、前記複数のエントリの各々
が、行をデータフェッチ命令に対応させるための値と、複数のポインタであって、複数のポインタの各々がデー
タフェッチ命令の生起に対応するターゲットデータアド
レスを記憶するためのものである、複数のポインタと、を具備する、ロードターゲット回路。
【請求項２】命令パイプラインをそなえたマイクロプ
ロセッサを動作させる方法であって、複数の生起の各々がテータフェッチ命令に対する対応す
る複数の実際のターゲットデータアトルスを生じるよう
な、複数の生起にわたって命令パイプラインでデータフ
ェッチ命令を受信するステップと、複数の生起の中の第一の生起に応答して、マイクロプロ
セッサ上のロードターゲットバッファに、データフェッ
チ命令に対応するエントリを形成するステップと、複数の生起に応答して、データフェッチ命令に対する対
応する複数の実際のターゲットデータアドレスに基づい
て、ターゲットデータアドレスの予測をエントリの中で
符号化するステップと、を含み、予測が第一の予測型と第二の予測型とから選択され、第一の予測型はループモードであり、該ループモードで
は複数の実際のターゲットデータアドレスがループ系列
を形成し、該ループ系列は開始ループターゲットデータ
アドレスをそなえ、終了ループターゲットデータアドレ
スに移り、開始ループターゲットデータアドレスに戻る
ことにより繰り返し、第二の予測型はストライドモードであり、該ストライド
モードでは複数の実際のターゲットデータアドレスが開
始ストライドターゲットデータアドレスから多数の付加
的な相次ぐアドレスに移り、相次ぐターケットアドレス
の各々のターゲットデータアドレスはそれ自身と直前の
ターゲットデータアドレスとの間に共通の距離をそなえ
ている、マイクロプロセッサ動作方法。