JP4027620B2 - 分岐予測装置、プロセッサ、及び分岐予測方法 - Google Patents

分岐予測装置、プロセッサ、及び分岐予測方法 Download PDF

Info

Publication number
JP4027620B2
JP4027620B2 JP2001186473A JP2001186473A JP4027620B2 JP 4027620 B2 JP4027620 B2 JP 4027620B2 JP 2001186473 A JP2001186473 A JP 2001186473A JP 2001186473 A JP2001186473 A JP 2001186473A JP 4027620 B2 JP4027620 B2 JP 4027620B2
Authority
JP
Japan
Prior art keywords
branch
history
instruction address
index
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001186473A
Other languages
English (en)
Other versions
JP2003005956A (ja
Inventor
真一郎 多湖
智尋 山名
好正 竹部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001186473A priority Critical patent/JP4027620B2/ja
Priority to US10/091,147 priority patent/US7055023B2/en
Priority to EP02251556A priority patent/EP1271308A3/en
Publication of JP2003005956A publication Critical patent/JP2003005956A/ja
Application granted granted Critical
Publication of JP4027620B2 publication Critical patent/JP4027620B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3802Instruction prefetching
    • G06F9/3804Instruction prefetching for branches, e.g. hedging, branch folding
    • G06F9/3806Instruction prefetching for branches, e.g. hedging, branch folding using address prediction, e.g. return stack, branch history buffer
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3842Speculative instruction execution
    • G06F9/3848Speculative instruction execution using hybrid branch prediction, e.g. selection between prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般に分岐命令の分岐予測方式及びプロセッサに関し、詳しくは、PHT(Pattern History Table)を用いた分岐予測方式及びプロセッサに関する。
【0002】
【従来の技術】
パイプライン動作を実行するプロセッサにおいては、分岐命令の分岐結果を待ってから分岐先アドレスに分岐するのでは、命令フェッチのタイミングが遅くなりパイプライン動作に乱れが生じる。従って、分岐命令を実行する前に分岐予測をし、パイプライン動作の流れに沿った一連の命令フェッチを可能にする必要がある。
【0003】
分岐命令には、その分岐命令自体が分岐し易い或いは分岐し難いといったように、ローカルな意味で分岐方向に偏りが存在する場合が多い。また最近実行された分岐命令の分岐結果に依存してある分岐命令が分岐し易い或いは分岐し難いといったように、グローバルな意味で分岐方向に偏りが存在する場合も多い。PHT(Pattern History Table)は、このような分岐傾向のローカル性及びグローバル性を考慮して、高い精度で分岐を予測する方式である。
【0004】
図1は、従来のPHTを利用した分岐予測方式の構成図である。
【0005】
図1の分岐予測装置は、XOR回路11、GHRユニット12、及びPHTユニット13を含む。GHR(Global History Register)12は、最近実行した分岐命令について分岐したか否かに関する履歴を記録しておくレジスタである。分岐命令が分岐した場合にはレジスタ内部を左に1ビットシフトしながら最下位ビットに1を格納し、分岐命令が分岐しなかった場合にはレジスタ内部を左に1ビットシフトしながら最下位ビットに0を格納する。例えば、GHR12が6ビット長であり、現在の内容が“011001”であるとする。この状態で、ある分岐命令を実行した結果が「分岐」であったとすると、GHR12の内容を左に1ビットシフトし更に1を最下位ビットに挿入する。結果として、GHR12の内容は“110011”となる。この“110011”は、6回前の分岐命令が分岐、5回前の分岐命令が分岐、4回前の分岐命令が非分岐、3回前の分岐命令が非分岐、2回前の分岐命令が分岐、最も最近の分岐命令が分岐であったことを示す。
【0006】
XOR回路11は、プログラムカウンタ10が示す実行する分岐命令アドレスとGHRユニット12の内容との排他的論理和を計算する。計算された排他的論理和は、PHTユニット13にインデックスとして供給される。
【0007】
PHT13は、各インデックスに対して例えば2ビットのカウントを格納するRAMである。ここでインデックスは、上述のようにプログラムカウンタ10の示す実行する分岐命令アドレスとGHRユニット12の内容との排他的論理和である。また、インデックスの内容である2ビットのカウント値は、そのインデックスをヒットした場合の予測結果である。カウント値が0及び1の場合には分岐しないと予測し、カウント値が2及び3の場合には分岐すると予測する。
【0008】
例えば、GHR12の内容が“110011”であり、分岐命令アドレスが“001000”である場合、インデックスは“111011”となる。このインデックス“111011”の内容の2ビットカウント値を参照して、例えばカウント値が2であるとする。上述のように2或いは3のカウント値は分岐予測を意味するので、命令アドレスが“001000”である現在実行しようとしている分岐命令は、分岐すると予測する。実際に命令を実行した結果として分岐すれば、カウント値に1を加算する。また実際に命令を実行した結果として分岐しない場合には、カウント値から1を減算する。従って、例えば実際の実行結果として分岐したとすると、カウント値は3に設定される。
【0009】
その後、例えば、GHRユニット12が全く同一の内容“110011”である状態で、同じ分岐命令アドレス“001000”の分岐命令を再度実行する場合、インデックスは前回と同一の“111011”となる。この場合のカウント値は3であり、分岐命令は分岐すると予測する。前述のように、GHRユニット12の内容は、最近実行した分岐命令の分岐結果の履歴である。従って、最近の分岐傾向が同一の条件で同一の分岐命令を実行した場合には、その分岐結果は同一のインデックスに蓄積されていく。次回同一のインデックスを参照したときには、そのカウント値が分岐予測に用いられる。
【0010】
最近実行した分岐命令の分岐結果の履歴が、上記の履歴と若干異なる場合として、例えばGHRユニット12の内容が“110010”であるとする。これは上記の場合“110011”と比較して、最後の分岐命令の結果が異なっていた場合である。この場合、上記と同一の分岐命令アドレス“001000”の分岐命令を実行するとすると、インデックスは“111010”となる。従って、このインデックスには、過去の分岐の履歴が“110010”である条件で分岐命令アドレス“001000”の分岐命令を実行した場合について、分岐結果が蓄積されていくことになる。
【0011】
従って、仮に分岐命令がプログラム中に1つしか存在しない場合には、各インデックスは、この分岐命令の分岐の結果を種々の分岐履歴に対して蓄積することになり、分岐履歴を反映した非常に高い精度での分岐予測が可能となる。しかし分岐命令がプログラム中に複数個存在する場合には、PHTユニット13内で互いの分岐命令の結果が干渉し合うことになり、予測精度が低下する。例えば、GHRユニット12の内容が“111010”の場合に分岐命令アドレス“000001”の分岐命令を実行するとすると、インデックスは“111011”となり、上記のようにGHR12の内容が“110011”であり分岐命令アドレスが“001000”である場合と同一のインデックスとなってしまう。このようにXOR回路11でインデックスを計算する方式では、異なった分岐命令間で同一のインデックスを共有することになり、分岐結果の記録が干渉してしまい予測精度が低下する。
【0012】
予測精度を低下させないためには、GHRユニット12の内容とプログラムカウンタ10の内容とを繋ぎ合わせてインデックスを作成すればよい。例えば、GHR12の内容が“110011”であり分岐命令アドレスが“001000”である場合には、インデックスを“110011001000”とすればよい。しかしこの場合には、インデックスが長くなることで、PHTユニット13のRAMのエントリ数が大幅に増大してしまう。実際、この場合のエントリ数は64倍(=26)に増大することになる。
【0013】
【発明が解決しようとする課題】
上述のように、分岐予測に使用するPHTにおいてエントリが干渉する構成においては、分岐予測の精度が低下してしまうという問題がある。しかし予測精度を向上させるために、PHTのメモリ容量を必要以上に増大させることは望ましくない。可能な限り小さなメモリ容量で可能な限り予測精度を向上させることが望ましい。
【0014】
従って本発明は、PHTを使用する分岐予測方式において、可能な限り小さなメモリ容量を使用しながらエントリ干渉を回避して分岐予測の精度を向上させた分岐予測方式を提供することを目的とする。
【0015】
【課題を解決するための手段】
本発明による分岐予測装置は、過去の分岐命令の履歴を保持する履歴レジスタと、該履歴レジスタが保持する該履歴と命令アドレスとから異なった分岐命令間で同一のインデックスを共有可能な第1のインデックスを生成するインデックス生成回路と、各第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファと、該第1の値及び該第2の値の何れかを選択することで分岐予測を行う選択ユニットを含むことを特徴とする。
【0016】
上記分岐予測装置において、該選択ユニットは、現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在する場合には該第1の値を選択し、該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在しない場合には該第2の値を選択することを特徴とする。
【0017】
上記分岐予測装置においては、履歴テーブル(PHT)のエントリに命令の一部をタグとして設けることで、異なった分岐命令間でのPHTエントリの干渉を避けることが可能になる。しかしながらあるインデックスを参照しても、タグが現在の命令に一致しない場合には、当該履歴状況での当該命令に関する情報は登録されていないことになる。このような場合には、分岐先バッファ(BTB)を分岐予測に使用する。即ち、履歴テーブルがヒットした場合(タグが一致)には、履歴テーブルの第1の値を分岐予測に使用し、履歴テーブルがミスした場合(タグが不一致)には、分岐先バッファの第2の値を分岐予測に使用する。
【0018】
このように本発明による分岐予測方式では、エントリ干渉を回避して高精度な分岐予測が可能になるので、実際の分岐方向が確定する前に予測に基づいて命令フェッチしても、予測がはずれる可能性は小さく、パイプライン動作の乱れを避けることが出来る。
【0019】
また本発明による分岐予測方式では、分岐先バッファの第2の値を予測に併用することにより、従来のようにPHT単体で分岐予測を実行する場合と比較して、分岐結果を学習させるまでの時間が短くてすむ。従って、本発明による分岐予測方式は、コンテキストスイッチによる状況変化に短時間で対応できる。
【0020】
【発明の実施の形態】
以下に、本発明の実施例を添付の図面を用いて詳細に説明する。
【0021】
図2は、本発明によるPHTを利用した分岐予測装置の構成図である。
【0022】
本発明による分岐予測装置は、XOR回路21、GHRユニット22、タグ付きPHTユニット23、比較ユニット24、BTB(Branch Target Buffer)25、比較ユニット26、及び選択ユニット27を含む。
【0023】
GHR(Global History Register)22は、最近実行した分岐命令について分岐したか否かに関する履歴を記録しておくレジスタである。分岐命令が分岐した場合にはレジスタ内部を左に1ビットシフトしながら最下位ビットに1を格納し、分岐命令が分岐しなかった場合にはレジスタ内部を左に1ビットシフトしながら最下位ビットに0を格納する。XOR回路21は、プログラムカウンタ20が示す実行する分岐命令アドレスとGHRユニット22の内容との排他的論理和を計算する。計算された排他的論理和は、タグ付きPHTユニット23にインデックスとして供給される。
【0024】
タグ付きPHTユニット23は、XOR回路21の出力である各インデックスに対して、タグ23aとカウント値23bとを格納するRAMである。またBTBユニット25は、命令アドレスの一部をインデックスとして、タグ(命令アドレスの一部)25aと、分岐命令の分岐先アドレス25bと、バイアスビット25cとを格納するRAMである。
【0025】
BTBユニット25は、従来の分岐予測方式においても使用されるユニットであり、分岐命令が分岐すると予測されると、その分岐先アドレスを直ちに提供するために設けられる。通常分岐先アドレスは、フェッチした分岐命令をデコードして命令を実行する時に算出する必要があるために、分岐先アドレスの特定には時間を要する。BTBを設けておき各分岐命令に対して分岐先アドレスを格納しておくことで、分岐命令が分岐すると予測される時に、分岐先アドレスを直ちにBTBから読み出すことが出来る。ここでBTBのメモリ容量を小さくするために、命令アドレスの一部をインデックスとし、残りの部分をタグとして、当該インデックスのエントリの一部としてタグを格納しておく。
【0026】
プログラムカウンタ20から命令アドレスが入力されると、この命令アドレスに対応するインデックスからタグ25aを読み出し、読み出したタグ25aと入力命令アドレスの対応部分とを比較する。この比較は、比較ユニット26によって実行される。比較結果が一致を示す場合(ヒットした場合)には、この命令アドレスの分岐命令が登録されていることになり、当該インデックスに格納されている分岐先アドレス25bをプリフェッチアドレスとして使用する。
【0027】
バイアスビット25cは、その分岐命令が分岐し易いが分岐し難いかを示す。1ビットで構成される場合には、例えば“1”が分岐し易いことを示し、“0”が分岐し難いことを示す。このバイアスビット25cは、その分岐命令自体が分岐し易いか分岐し難いかを示す、ローカルな意味での分岐方向の偏りに関する情報である。
【0028】
タグ付きPHTユニット23は、XOR回路21が求めた命令アドレスの一部とGHRユニット22との排他的論理和をインデックスとして、過去に実行した分岐結果の情報をカウント値23bとして保持する。本発明においては、タグ付きPHTユニット23は、カウント値23bだけでなく、命令アドレスの一部をタグ23aとして保持している。
【0029】
プログラムカウンタ20の命令アドレスとGHRユニット22の内容とからXOR回路21によりインデックスが求められると、タグ付きPHTユニット23からタグ23aを読み出し、読み出したタグ23aと入力命令アドレスの対応部分とを比較する。この比較は、比較ユニット24によって実行される。比較結果が一致を示す場合(ヒットした場合)には、GHRユニット22の内容が示す履歴状態での当該命令アドレスの分岐命令の情報が登録されていることになる。この場合には、このインデックスに格納されているカウント値23bを、分岐予測に使用する。カウント値23bは、例えば2ビットカウンタのカウントであり、0及び1の場合には分岐しないと予測し、2及び3の場合には分岐すると予測する。
【0030】
タグ23aを設けることで、異なった分岐命令間でのPHTエントリの干渉を避けることが可能になる。しかしながら、あるインデックスを参照しても、タグ23aが現在の命令に一致しない場合(ミスした場合)には、当該履歴状況での当該命令に関する情報は登録されていないことになる。本発明では、このような場合には、BTBユニット25のバイアスビット25cを分岐予測に使用する。
【0031】
即ち、タグ付きPHTユニット23がヒットした場合(タグが一致)には、タグ付きPHTユニット23のカウント値23bを分岐予測に使用し、タグ付きPHTユニット23がミスした場合(タグが不一致)には、BTBユニット25のバイアスビット25cを分岐予測に使用する。この選択は、選択ユニット27によって実行される。選択ユニット27は、比較ユニット24からの比較結果によって、タグ付きPHTユニット23がヒットしたか否かを検出する。この検出に基づいて、比較ユニット24は、タグ付きPHTユニット23からのカウント値23b或いはBTBユニット25からのバイアスビット25cの何れかを選択し、選択したデータに基づいて分岐予測をして分岐予測結果を出力する。なおBTBユニット25がヒットしていない場合には、分岐先アドレス25bが利用できないので、一律に「分岐しない」と予測して予測結果を出力する。
【0032】
図3は、本発明による分岐予測のフローチャートである。
【0033】
ステップS1で、BTBユニット25がヒットしたか否かを判断する。ヒットした場合にはステップS3に進み、ミスした場合にはステップS2に進む。
【0034】
ステップS2で、BTBユニット25がヒットしておらず分岐先アドレス25bが利用できないので、一律に「分岐しない」と予測する。
【0035】
ステップS3で、タグ付きPHTユニット23がヒットしたか否かを判断する。ヒットした場合にはステップS5に進み、ミスした場合にはステップS4に進む。
【0036】
ステップS4で、BTBユニット25のバイアスビット25cに基づいて分岐予測を行う。
【0037】
ステップS5で、タグ付きPHTユニット23のカウント値23bに基づいて分岐予測を行う。
【0038】
図4は、本発明によるデータ更新処理のフローチャートである。
【0039】
ステップS1で、BTBユニット25がヒットしたか否かを判断する。ヒットした場合にはステップS3に進み、ミスした場合にはステップS2に進む。
【0040】
ステップS2で、ヒットしなかった対象命令アドレスを、その分岐先アドレスと共にBTBユニット25に登録する。この際、実際に命令を実行した分岐結果を、BTBユニット25のバイアスビット25cとして格納する。即ち、実際の命令実行の結果、分岐をしたのであれば1をバイアスビット25cに格納し、分岐しなかったのであれば0をバイアスビット25cに格納する。
【0041】
ステップS3では、BTBユニット25がヒットしているので、BTBユニット25の対象命令アドレスを更新する。
【0042】
ステップS4で、タグ付きPHTユニット23がヒットしたか否かを判断する。ヒットした場合にはステップS8に進み、ミスした場合にはステップS5に進む。
【0043】
ステップS 5で、対象命令を実際に実行した結果、実際の分岐方向が分岐予測と一致したか否かを判断する。ここで判断対象の分岐予測は、タグ付きPHTユニット23がミスした場合であるので、BTBユニット25のバイアスビット25cに基づいて行われたものである。判断の結果、一致する場合にはステップS6に進み、一致しない場合にはステップS7に進む。
【0044】
ステップS6で、何もせずに処理を終了する。これは、分岐予測の結果と実際の分岐の結果とが一致する場合には、現状の分岐予測が適切であると判断できるからである。
【0045】
ステップS7で、タグ付きPHTユニット23に当該履歴状況での当該命令に関する情報を登録する。即ち、対象となるインデックスに、対象となる命令アドレスのタグ23aを格納すると共に、カウント値23bに実際の分岐結果を格納する。例えば、分岐した場合には2(“10”)を格納し、分岐しなかった場合には1(“01”)を格納する。これは、分岐予測の結果と実際の分岐の結果とが一致しない場合には、BTBユニット25のバイアスビット25cに基づく現状の分岐予測が不適切であると判断できるからである。
【0046】
ステップS8では、タグ付きPHTユニット23がヒットしているので、タグ付きPHTユニット23のカウント値23bを更新する。具体的には、実際の分岐結果が分岐の場合にカウント値23bを1増加させ、分岐結果が分岐でない場合にカウント値23bを1減少させる。なおカウント値23bが既に最大値(例えば2ビットカウンタなら3)の場合には、実際の分岐結果が分岐であってもカウント値23bはそのままである。またカウント値23bが既に最小値(例えば0)の場合には、実際の分岐結果が非分岐であってもカウント値23bはそのままである。
【0047】
ステップS9で、BTBユニット25のバイアスビット25cとタグ付きPHTユニット23のカウント値23bとについて、夫々の値をチェックする。バイアスビット25cとカウント値23bとが、夫々0と0(“00”)であるか或いは夫々1と3(“11”)である場合に、ステップS11に進む。それ以外の場合には、ステップS10に進む。
【0048】
ステップS10で、LRUビット等を更新する。ここでLRU(Least Recently Used)ビットとは、タグ付きPHTユニット23の各エントリに付加され、参照されてから最も使われなかったエントリを特定するためのビットである。タグ付きPHTユニット23を分岐予測に使用する毎に、このLRUビットを更新する。LRUビットの意味については後述する。
【0049】
ステップS11で、タグ付きPHTユニット23の対象エントリを無効にする。即ち、タグ付きPHTユニット23の当該対象エントリを実質的に削除する。これは、タグ付きPHTユニット23のカウント値23bが特定の分岐方向を強く示唆しており且つBTBユニット25のバイアスビット25cがそれと同一の分岐方向を示している場合には、BTBユニット25のバイアスビット25cで分岐を予測しても同一の予測結果が得られるので、タグ付きPHTユニット23から登録を抹消することで、タグ付きPHTユニット23のRAMのメモリ空間を有効に使用するためである。
【0050】
以上が、本発明によるデータ更新処理である。
【0051】
以下に、本発明におけるセットアソシアティブ方式について説明する。
【0052】
本発明においては、図2に示されるように、タグ付きPHTユニット23が複数個設けられていてもよい。このように複数のタグ付きPHTユニット23を設けることで、同一インデックスに対して複数のエントリを格納可能になる。例えば、4セットのPHTが設けられる4−ウェイセットアソシアティブ方式においては、同一インデックスに対して、4つまでのエントリを格納可能である。
【0053】
このようにセットアソシアティブ方式を使用した場合には、データ更新時にどのエントリを削除するかを決定する必要がある。例えば4−ウェイセットアソシアティブにおいて既に4つのエントリを使用している状況で、5つめのエントリを格納する必要があるとすると、既存の4つのエントリの何れかを選択して削除する必要がある。例えば、図4のステップS7では、タグ付きPHTユニット23に当該履歴状況での当該命令に関する情報を登録するが、既に同一のインデックスに対するエントリが満杯である場合には、既存の登録の何れかを削除して新規登録に置き換える必要がある。
【0054】
図4のステップS10に関連して説明したLRUビットは、既存エントリを新規エントリで置き換える際に、置き換え対象のエントリを特定するために使用される。LRUビットは、各エントリに対して保持され、各エントリの参照順序を示すビットである。このLRUビットを調べることで、参照されてから最も長期間使われなかったエントリを特定して、新規エントリと置き換えることが出来る。
【0055】
LRU方式は置き換え対象のエントリを特定する方式の1つに過ぎず、他の方式として、最も使用されなかった最低使用頻度のエントリを置換するLFU(Least Frequently Used)方式、最も過去に登録されたエントリを置換するFIFO(First-In First-Out)方式、任意に選択したエントリを置換するランダム方式などがある。
【0056】
なおセットアソシアティブ方式を使用せずタグ付きPHTユニット23が一つだけ設けられる場合には、各インデックスに対して1つのエントリしか格納することは出来ない。この場合、タグ付きPHTユニット23に新規の情報を登録する際に、既に同一のインデックスに対して別の命令アドレスの登録がなされている場合には、この既存の登録を削除して、新規登録に置き換えることになる。
【0057】
また図2に示されるように、BTBユニット25に対してもセットアソシアティブ方式を用いても良い。
【0058】
以下に、本発明による分岐予測を具体的なプログラムの例を用いて説明する。
【0059】
図5は、分岐命令を含むプログラムの一例である。
【0060】
GHRユニット22の長さは6であり、その初期値を000000とする。
【0061】
命令アドレス000001において、BTBユニット25に0001をインデックスとしてアクセスすると、タグミスが検出され「分岐しない」と予測する。これは図3のステップS2に対応する。実際の命令実行の結果、分岐命令が分岐するので予測がはずれる。BTBユニット25のインデックス0001のエントリにタグ00、バイアス1、分岐先アドレス000011を登録する。これは図4のステップS2に対応する。
【0062】
GHRユニット22は、左に1ビットシフトしながら最下位ビットに分岐を表す1を格納し、結果として000001となる。この状態で、予測結果と各レジスタ/メモリの内容は、
PC=000001, 予測失敗, BTB[0001]=00-1-000011, GHR:000001
となる。ここでPCはプログラムカウンタを示し、BTBの内容は、タグ00、バイアス1、及び分岐先アドレス000011の順に示される。
【0063】
次に命令アドレス000100において、BTBユニット25に0100をインデックスとしてアクセスすると、タグミスが検出され「分岐しない」と予測する。実際の命令実行の結果、分岐命令が分岐しないので予測があたる。BTBユニット25のインデックス0100のエントリにタグ00、バイアス0を登録する。
【0064】
GHRユニット22は、左に1ビットシフトしながら最下位ビットに非分岐を表す0を格納し、結果として000010となる。この状態で、予測結果と各レジスタ/メモリの内容は、
PC=000001, 予測成功, BTB[0100]=00-0- ******, GHR:000010
となる。
【0065】
更に命令アドレス0005、0006、0007、及び0008の分岐命令が分岐しない。結果として、上記と同様に,
PC=000101, 予測成功, BTB[0101]=00-0- ******, GHR=000100
PC=000110, 予測成功, BTB[0110]=00-0- ******, GHR:001000
PC=000111, 予測成功, BTB[0111]=00-0- ******, GHR=010000
PC=001000, 予測成功, BTB[1000]=00-0- ******, GHR=100000
となる。
【0066】
更に命令アドレス001100において、BTBユニット25に1100をインデックスとしてアクセスすると,タグミスが検出され「分岐しない」と予測する。実際の命令実行の結果、分岐命令が分岐するので予測がはずれる。BTBユニット25のインデックス1100のエントリに、タグ00、バイアス1、分岐先アドレス001001を登録する。
【0067】
GHRユニット22は、左に1ビットシフトしながら最下位ビットに分岐を表す1を格納し、結果として000001となる。この状態で、予測結果と各レジスタ/メモリの内容は、
PC=001100, 予測失敗, BTB[1100]=00-1-001001, GHR=000001
となる。
【0068】
ここで命令アドレス001001に分岐したので、再び命令アドレス001100において、BTBユニット25に1100をインデックスとしてアクセスを行う。今回はタグヒットが検出され、分岐先アドレス001001を得る。BTBユニット25がタグヒットしたので、タグ付きPHTユニット23がタグヒットするか否かをチェックする。これは図3のステップS3に対応する。
【0069】
具体的には、アドレス001100とGHRの内容000001との排他的論理和001101をインデックスとして、タグ付きPHTユニット23にアクセスする。タグ判定結果はミスなので、BTBユニット25のバイアスビットに基づいて、「アドレス001001に分岐する」と予測する。これは図3のステップS4に対応する。実際の命令実行の結果、分岐命令が001001に分岐し予測が的中する。従って、図4のステップS6にあるように、BTBユニット25及びタグ付きPHTユニット23の更新はしない。この状態で、予測結果と各レジスタ/メモリの内容は、
PC=001100, 予測成功, BTB[1100]=00-1-001001(更新無し), GHR=000011
である。命令アドレス001100の分岐命令によって、ループが更に3回実行されると、
PC=001100, 予測成功, BTB[1100]=00-1-001001(更新無し), GHR=000111
PC=001100, 予測成功, BTB[1100]=00-1-001001(更新無し), GHR=001111
PC=001100, 予測成功, BTB[1100]=00-1-001001(更新無し), GHR=011111
となる。
【0070】
ループが6回実行(5回分岐)された後に、命令アドレス001100において、上記と同様に「アドレス001001に分岐する」と予測する。この場合、ループは6回目で終了するので、分岐命令は分岐せず予測がはずれる。従って、図4のステップS7に示されるように、命令アドレス001100とGHRの内容011111との排他的論理和010011をタグ付きPHTユニット23のインデックスとし、タグ1100とカウント値0を登録する。この状態で、予測結果と各レジスタ/メモリの内容は、
PC=001100, 予測失敗, PHT[010011]=1100-0, GHR=111110
となる。
【0071】
その後、命令アドレス001111において命令アドレス000010に分岐すると、
PC=001111, 予測失敗, BTB[1111]=00-1-000010, GHR=111101
となる。
【0072】
命令アドレス000010以降の命令を再度実行すると、
PC=000100, 予測成功(非分岐), BTB及びPHT更新なし, GHR=111010
PC=000101, 予測成功(非分岐), BTB及びPHT更新なし, GHR=110100
PC=000110, 予測成功(非分岐), BTB及びPHT更新なし, GHR=101000
PC=000111, 予測成功(非分岐), BTB及びPHT更新なし, GHR=010000
PC=001000, 予測成功(非分岐), BTB及びPHT更新なし, GHR=100000
PC=001100, 予測成功(分岐), BTB及びPHT更新なし, GHR=000001
PC=001100, 予測成功(分岐), BTB及びPHT更新なし, GHR=000011
PC=001100, 予測成功(分岐), BTB及びPHT更新なし, GHR=000111
PC=001100, 予測成功(分岐), BTB及びPHT更新なし, GHR=001111
PC=001100, 予測成功(分岐), BTB及びPHT更新なし, GHR=011111
PC=001100, 予測成功(非分岐), PHT[010011]=1100-0, GHR=111110
となる。ここで、ループの最後の繰り返しにおける命令アドレス001100の実行においては、BTBユニット25及びタグ付きPHTユニット23が双方共にヒットし、タグ付きPHTユニット23のカウント値23bは0なので、非分岐を予測する。最後に、
PC=001111, 予測成功(分岐), BTB及びPHT更新なし, GHR=111101
となる。従って、今回は分岐予測が全て的中することになる。
【0073】
このプログラムの実行において、本発明による分岐予測方式では、タグ付きPHTユニット23では1つのエントリしか使用していない。このように、本発明の分岐予測方式は、RAMの使用容量が少なくても、高い予測精度を実現することが出来る方式である。
【0074】
なお図1に示される従来技術の分岐予測方式では、上記プログラムを実行した場合に、命令アドレス000010以降の命令を2度目に実行した際であっても、PHTエントリの干渉により全ての予測を的中させることは出来ない。
【0075】
図6は、本発明による分岐予測装置を採用したプロセッサの構成例を示す。
【0076】
図6のプロセッサ100は、命令キャッシュ101、データキャッシュ102、命令フェッチユニット103、命令実行制御部104、レジスタ105、レジスタ106、演算部107乃至110を含む。
【0077】
命令キャッシュ101及びデータキャッシュ102は、それぞれ命令及びデータを一時的に格納する。命令フェッチユニット103は、プログラムカウンタの示すアドレスの命令を、命令キャッシュ101から順次フェッチする。命令実行制御部104は、命令フェッチユニット103がフェッチした命令を順次デコードして、デコード結果に基づいて命令実行動作を制御する。レジスタ105、レジスタ106、及び演算部107乃至110は、演算実行ユニットを構成する。この演算実行ユニットは、命令実行制御部104の制御の下で動作して、命令に基づいた演算を実行する。ここで演算部107乃至110は、夫々命令0乃至3を独立に実行する形となっており、パイプライン動作を高速に実行可能な構成となっている。
【0078】
図2に示される本発明による分岐予測装置は、命令フェッチユニット103に設けられ、分岐命令があるときにその分岐方向を予測して、予測分岐方向に対応したアドレスの命令をフェッチする。本発明による分岐予測方式ではエントリ干渉を回避して高精度な分岐予測が可能になるので、実際の分岐方向が確定する前に予測に基づいて命令フェッチしても、予測がはずれる可能性は小さく、パイプライン動作の乱れを避けることが出来る。
【0079】
また本発明による分岐予測方式では、BTBユニット25のバイアスビット25cを使用することにより、従来のようにPHT単体で分岐予測を実行する場合と比較して、分岐結果を学習させるまでの時間が短くてすむ。従って、本発明による分岐予測方式は、コンテキストスイッチによる状況変化に短時間で対応できる。8KBのRAMを使用したベンチマークjpeg, jbig, mpeg4, ghostscriptにおいて、本発明による分岐予測方式は、平均で96%の予測精度を実現した。
【0080】
以上、本発明を実施例に基づいて説明したが、本発明は上記実施例に限定されるものではなく、特許請求の範囲に記載の範囲内で様々な変形が可能である。
【0081】
【発明の効果】
本発明による分岐予測方式では、エントリ干渉を回避して高精度な分岐予測が可能になるので、実際の分岐方向が確定する前に予測に基づいて命令フェッチしても、予測がはずれる可能性は小さく、パイプライン動作の乱れを避けることが出来る。
【0082】
また本発明による分岐予測方式では、BTBのバイアスビットを予測に併用することにより、従来のようにPHT単体で分岐予測を実行する場合と比較して、分岐結果を学習させるまでの時間が短くてすむ。従って、本発明による分岐予測方式は、コンテキストスイッチによる状況変化に短時間で対応できる。
【図面の簡単な説明】
【図1】従来のPHTを利用した分岐予測方式の構成図である。
【図2】本発明によるPHTを利用した分岐予測装置の構成図である。
【図3】本発明による分岐予測のフローチャートである。
【図4】本発明によるデータ更新処理のフローチャートである。
【図5】分岐命令を含むプログラムの一例である。
【図6】本発明による分岐予測装置を採用したプロセッサの構成図である。
【符号の説明】
21 XOR回路
22 GHRユニット
23 タグ付きPHTユニット
24 比較ユニット
25 BTB(Branch Target Buffer)
26 比較ユニット
27 選択ユニット27

Claims (14)

  1. 過去の分岐命令の履歴を保持する履歴レジスタと、
    該履歴レジスタが保持する該履歴と命令アドレスとから異なった分岐命令間で同一のインデックスを共有可能な第1のインデックスを生成するインデックス生成回路と、
    各第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、
    該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレス又は予測分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファと、
    該第1の値及び該第2の値の何れかを選択することで分岐予測を行う選択ユニット
    を含むことを特徴とする分岐予測装置。
  2. 過去の分岐命令の履歴を保持する履歴レジスタと、
    該履歴レジスタが保持する該履歴と命令アドレスとから第1のインデックスを生成するインデックス生成回路と、
    各第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、
    該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレス又は予測分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファと、
    該第1の値及び該第2の値の何れかを選択することで分岐予測を行う選択ユニット
    を含み、
    該選択ユニットは、現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在する場合には該第1の値を選択し、該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在しない場合には該第2の値を選択することを特徴とする分岐予測装置
  3. 該選択ユニットは、該現在の命令アドレスに対して該分岐先バッファにエントリが存在しない場合には分岐しないと予測することを特徴とする請求項2記載の分岐予測装置。
  4. 該インデックス生成回路は、該履歴レジスタが保持する該履歴と該命令アドレスとの排他的論理和として該第1のインデックスを生成することを特徴とする請求項1乃至3のいずれか一項に記載の分岐予測装置。
  5. 該履歴テーブルは該第1のインデックスの各々に対して複数のエントリが登録できるように複数個設けられることを特徴とする請求項1乃至4のいずれか一項に記載の分岐予測装置。
  6. 過去の分岐命令の履歴を保持する履歴レジスタと、
    該履歴レジスタが保持する該履歴と命令アドレスとから異なった分岐命令間で同一のインデックスを共有可能な第1のインデックスを生成するインデックス生成回路と、
    各第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、
    該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファと、
    該第1の値及び該第2の値の何れかを選択することで分岐予測を行う選択ユニットと、
    命令の実行を制御する実行制御ユニットと、
    該命令を実行する演算実行ユニット
    を含むことを特徴とするプロセッサ。
  7. 過去の分岐命令の履歴を保持する履歴レジスタと、
    該履歴レジスタが保持する該履歴と命令アドレスとから第1のインデックスを生成するインデックス生成回路と、
    各第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す 第1の値とを格納する履歴テーブルと、
    該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファと、
    該第1の値及び該第2の値の何れかを選択することで分岐予測を行う選択ユニットと、
    命令の実行を制御する実行制御ユニットと、
    該命令を実行する演算実行ユニット
    を含み、
    該選択ユニットは、現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在する場合には該第1の値を選択し、該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在しない場合には該第2の値を選択することを特徴とするプロセッサ
  8. 該選択ユニットは、該現在の命令アドレスに対して該分岐先バッファにエントリが存在しない場合には分岐しないと予測することを特徴とする請求項7記載のプロセッサ
  9. 該インデックス生成回路は、該履歴レジスタが保持する該履歴と該命令アドレスとの排他的論理和として該第1のインデックスを生成することを特徴とする請求項6乃至8のいずれか一項に記載のプロセッサ
  10. 該履歴テーブルは該第1のインデックスの各々に対して複数のエントリが登録できるように複数個設けられることを特徴とする請求項6乃至9のいずれか一項に記載のプロセッサ
  11. 過去の分岐命令の履歴と命令アドレスとから異なった分岐命令間で同一のインデックスを共有可能に生成する第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファとを設けた構成において、
    該第1の値及び該第2の値の何れかを選択し、
    選択した値に応じて分岐予測を行う
    各段階を含むことを特徴とする分岐予測方法。
  12. 過去の分岐命令の履歴と命令アドレスとから生成する第1のインデックスに対して該命令アドレスの一部であるタグと分岐のし易さを示す第1の値とを格納する履歴テーブルと、該命令アドレスの少なくとも一部を第2のインデックスとして該命令アドレスが示す命令の分岐先アドレスと分岐のし易さを示す第2の値とを格納する分岐先バッファとを設けた構成において、
    該第1の値及び該第2の値の何れかを選択し、
    選択した値に応じて分岐予測を行う
    各段階を含み、
    該選択する段階は、現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在する場合には該第1の値を選択し、該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在しない場合には該第2の値を選択することを特徴とする分岐予測方法
  13. 該現在の命令アドレスに対して該分岐先バッファにエントリが存在しない場合に該分岐先バッファに該現在の命令アドレスを登録し、
    該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在せず且つ該第2の値に基づく予測結果が誤りである場合に該履歴テーブルに該現在の命令アドレスに関する登録を行う
    各段階を含むことを特徴とする請求項12記載の分岐予測方法。
  14. 該現在の命令アドレスに対して該分岐先バッファにエントリが存在し且つ該現在の命令アドレスと現在の履歴とに対して該履歴テーブルにエントリが存在せず且つ該第2の値に基づく予測結果が正しい場合に該履歴テーブルに該現在の命令アドレスに関する登録を行わないことを特徴とする請求項12又は13記載の分岐予測方法。
JP2001186473A 2001-06-20 2001-06-20 分岐予測装置、プロセッサ、及び分岐予測方法 Expired - Fee Related JP4027620B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001186473A JP4027620B2 (ja) 2001-06-20 2001-06-20 分岐予測装置、プロセッサ、及び分岐予測方法
US10/091,147 US7055023B2 (en) 2001-06-20 2002-03-06 Apparatus and method for branch prediction where data for predictions is selected from a count in a branch history table or a bias in a branch target buffer
EP02251556A EP1271308A3 (en) 2001-06-20 2002-03-06 Apparatus and method for branch prediction based on history table

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001186473A JP4027620B2 (ja) 2001-06-20 2001-06-20 分岐予測装置、プロセッサ、及び分岐予測方法

Publications (2)

Publication Number Publication Date
JP2003005956A JP2003005956A (ja) 2003-01-10
JP4027620B2 true JP4027620B2 (ja) 2007-12-26

Family

ID=19025911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001186473A Expired - Fee Related JP4027620B2 (ja) 2001-06-20 2001-06-20 分岐予測装置、プロセッサ、及び分岐予測方法

Country Status (3)

Country Link
US (1) US7055023B2 (ja)
EP (1) EP1271308A3 (ja)
JP (1) JP4027620B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3802038B2 (ja) 2003-01-30 2006-07-26 富士通株式会社 情報処理装置
US7831817B2 (en) * 2003-04-15 2010-11-09 Arm Limited Two-level branch prediction apparatus
US7130967B2 (en) 2003-12-10 2006-10-31 International Business Machines Corporation Method and system for supplier-based memory speculation in a memory subsystem of a data processing system
US20050149680A1 (en) * 2003-12-30 2005-07-07 Intel Corporation Fast associativity collision array and cascaded priority select
US20050188158A1 (en) * 2004-02-25 2005-08-25 Schubert Richard P. Cache memory with improved replacement policy
DE602005027338D1 (de) 2004-04-21 2011-05-19 Fujitsu Ltd Abzweigungsvorhersageeinrichtung, verfahren dafür und prozessor
US20060036834A1 (en) * 2004-08-13 2006-02-16 Subramaniam Maiyuran Trace reuse
JP4362096B2 (ja) 2004-09-30 2009-11-11 富士通株式会社 情報処理装置,リプレース方法,リプレースプログラム及びリプレースプログラムを記録したコンピュータ読取可能な記録媒体
US20060218385A1 (en) * 2005-03-23 2006-09-28 Smith Rodney W Branch target address cache storing two or more branch target addresses per index
US7437543B2 (en) * 2005-04-19 2008-10-14 International Business Machines Corporation Reducing the fetch time of target instructions of a predicted taken branch instruction
US20070162895A1 (en) * 2006-01-10 2007-07-12 International Business Machines Corporation Mechanism and method for two level adaptive trace prediction
JP5145809B2 (ja) 2007-07-31 2013-02-20 日本電気株式会社 分岐予測装置、ハイブリッド分岐予測装置、プロセッサ、分岐予測方法、及び分岐予測制御プログラム
US7925865B2 (en) * 2008-06-02 2011-04-12 Oracle America, Inc. Accuracy of correlation prefetching via block correlation and adaptive prefetch degree selection
US8205068B2 (en) * 2008-07-29 2012-06-19 Freescale Semiconductor, Inc. Branch target buffer allocation
CN101763248A (zh) * 2008-12-25 2010-06-30 世意法(北京)半导体研发有限责任公司 用于多模式分支预测器的系统和方法
JP5633169B2 (ja) * 2010-03-25 2014-12-03 富士通株式会社 分岐予測方法及びその方法を実行する分岐予測回路
JP2011209774A (ja) * 2010-03-26 2011-10-20 Fujitsu Ltd 分岐予測方法及びその方法を実行する分岐予測回路
US8683129B2 (en) * 2010-10-21 2014-03-25 Oracle International Corporation Using speculative cache requests to reduce cache miss delays
WO2012098435A1 (en) * 2011-01-21 2012-07-26 Freescale Semiconductor, Inc. Integrated circuit device and method for calculating a predicate value
US8924693B2 (en) * 2011-01-21 2014-12-30 Apple Inc. Predicting a result for a predicate-generating instruction when processing vector instructions
WO2012103373A2 (en) * 2011-01-27 2012-08-02 Soft Machines, Inc. Variable caching structure for managing physical storage
WO2012103359A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Hardware acceleration components for translating guest instructions to native instructions
WO2012103367A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Guest to native block address mappings and management of native code storage
US8694973B2 (en) * 2011-09-27 2014-04-08 Unisys Corporation Abstracting computational instructions to improve performance
US9229723B2 (en) * 2012-06-11 2016-01-05 International Business Machines Corporation Global weak pattern history table filtering
US9262169B2 (en) * 2012-06-11 2016-02-16 International Business Machines Corporation Branch prediction table install source tracking
CN105122206B (zh) 2013-03-15 2018-11-09 英特尔公司 用于支持推测的访客返回地址栈仿真的方法和装置
WO2014151652A1 (en) 2013-03-15 2014-09-25 Soft Machines Inc Method and apparatus to allow early dependency resolution and data forwarding in a microprocessor
US10007522B2 (en) * 2014-05-20 2018-06-26 Nxp Usa, Inc. System and method for selectively allocating entries at a branch target buffer
US9952870B2 (en) * 2014-06-13 2018-04-24 Wisconsin Alumni Research Foundation Apparatus and method for bias-free branch prediction
US9823932B2 (en) * 2015-04-20 2017-11-21 Arm Limited Branch prediction
US20170153894A1 (en) * 2015-11-27 2017-06-01 Arm Limited Apparatus and method for branch prediction
US10747540B2 (en) * 2016-11-01 2020-08-18 Oracle International Corporation Hybrid lookahead branch target cache
US10261797B2 (en) * 2017-04-27 2019-04-16 International Business Machines Corporation Indirect target tagged geometric branch prediction using a set of target address pattern data
US11526359B2 (en) * 2018-10-03 2022-12-13 Arm Limited Caching override indicators for statistically biased branches to selectively override a global branch predictor
CN113900966B (zh) * 2021-11-16 2022-03-25 北京微核芯科技有限公司 一种基于Cache的访存方法及装置
CN114020441B (zh) * 2021-11-29 2023-03-21 锐捷网络股份有限公司 一种多线程处理器的指令预测方法及相关装置
CN118502823A (zh) * 2023-11-02 2024-08-16 北京市合芯数字科技有限公司 分支预测方法、装置、电子设备及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW253946B (en) * 1994-02-04 1995-08-11 Ibm Data processor with branch prediction and method of operation
US5822577A (en) * 1996-05-01 1998-10-13 International Business Machines Corporation Context oriented branch history table
US5864697A (en) * 1996-06-28 1999-01-26 Texas Instruments Incorporated Microprocessor using combined actual and speculative branch history prediction
US5995749A (en) * 1996-11-19 1999-11-30 Advanced Micro Devices, Inc. Branch prediction mechanism employing branch selectors to select a branch prediction
DE69727773T2 (de) * 1996-12-10 2004-12-30 Texas Instruments Inc., Dallas Verbesserte Verzweigungsvorhersage in einem Pipelinemikroprozessor
US6108775A (en) * 1996-12-30 2000-08-22 Texas Instruments Incorporated Dynamically loadable pattern history tables in a multi-task microprocessor
US6073230A (en) * 1997-06-11 2000-06-06 Advanced Micro Devices, Inc. Instruction fetch unit configured to provide sequential way prediction for sequential instruction fetches
US6374349B2 (en) * 1998-03-19 2002-04-16 Mcfarling Scott Branch predictor with serially connected predictor stages for improving branch prediction accuracy
DE19926580C2 (de) 1998-07-14 2001-01-11 Ibm Verfahren und Vorrichtung zur Vorhersage von Sprungzieladressen
US6553488B2 (en) 1998-09-08 2003-04-22 Intel Corporation Method and apparatus for branch prediction using first and second level branch prediction tables
JP2000132390A (ja) * 1998-10-23 2000-05-12 Toshiba Corp プロセッサ及び分岐予測器
US6189091B1 (en) * 1998-12-02 2001-02-13 Ip First, L.L.C. Apparatus and method for speculatively updating global history and restoring same on branch misprediction detection
US6247122B1 (en) * 1998-12-02 2001-06-12 Ip-First, L.L.C. Method and apparatus for performing branch prediction combining static and dynamic branch predictors
US6272623B1 (en) 1999-01-25 2001-08-07 Sun Microsystems, Inc. Methods and apparatus for branch prediction using hybrid history with index sharing
US6550004B1 (en) * 1999-11-05 2003-04-15 Ip-First, Llc Hybrid branch predictor with improved selector table update mechanism
US6421774B1 (en) * 1999-11-05 2002-07-16 Ip First L.L.C. Static branch predictor using opcode of instruction preceding conditional branch
US6687789B1 (en) * 2000-01-03 2004-02-03 Advanced Micro Devices, Inc. Cache which provides partial tags from non-predicted ways to direct search if way prediction misses

Also Published As

Publication number Publication date
US7055023B2 (en) 2006-05-30
US20020199091A1 (en) 2002-12-26
EP1271308A2 (en) 2003-01-02
JP2003005956A (ja) 2003-01-10
EP1271308A3 (en) 2006-01-04

Similar Documents

Publication Publication Date Title
JP4027620B2 (ja) 分岐予測装置、プロセッサ、及び分岐予測方法
US5210831A (en) Methods and apparatus for insulating a branch prediction mechanism from data dependent branch table updates that result from variable test operand locations
JP3542021B2 (ja) セット予測によりセット連想キャッシュの遅延を少なくする方法及び装置
US5790823A (en) Operand prefetch table
US5943687A (en) Penalty-based cache storage and replacement techniques
TWI506434B (zh) 預取單元、資料預取方法、電腦程式產品以及微處理器
US6178498B1 (en) Storing predicted branch target address in different storage according to importance hint in branch prediction instruction
US20150186293A1 (en) High-performance cache system and method
US5774710A (en) Cache line branch prediction scheme that shares among sets of a set associative cache
US20050120193A1 (en) Context look ahead storage structures
JPH08249181A (ja) ブランチ予測式データ処理装置および動作方法
US6912650B2 (en) Pre-prefetching target of following branch instruction based on past history
JP2006520964A (ja) 分岐ターゲットに基づいて分岐予測をするための方法および装置
JP2006520964A5 (ja)
CN117472446B (zh) 基于处理器的多级取指目标缓冲器的分支预测方法
JP3486690B2 (ja) パイプライン方式プロセッサ
JP2001195304A (ja) キャッシュ記憶装置
JP2596712B2 (ja) 近接した分岐命令を含む命令の実行を管理するシステム及び方法
CN117311814A (zh) 取指单元、指令读取方法及芯片
CN100397365C (zh) 解决分支目标地址快取中死结提取条件的装置与方法
US20150193348A1 (en) High-performance data cache system and method
US7793085B2 (en) Memory control circuit and microprocessory system for pre-fetching instructions
CN117093271B (zh) 一种分支指令的预取方法及装置
JP2001022577A (ja) 情報処理装置
HK40072652A (en) Fetch unit for predicting target for subroutine return instructions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070705

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees