WO2007099604A1

WO2007099604A1 - コンピュータの分岐予測装置

Info

Publication number: WO2007099604A1
Application number: PCT/JP2006/303769
Authority: WO
Inventors: Megumi Yokoi
Original assignee: Fujitsu Limited
Priority date: 2006-02-28
Filing date: 2006-02-28
Publication date: 2007-09-07
Also published as: JP5136404B2; EP1990713A1; US20080320288A1; JPWO2007099604A1; US8578140B2; EP1990713A4; EP1990713B1

Abstract

取得段階で複数命令を取得する取得部と、次の実行段階で実行される命令が分岐命令であるか否かを予測する分岐命令予測部と、命令の実行部と、を備え分岐命令予測部は、分岐命令の分岐先アドレスを履歴情報として記憶する履歴記憶部と、分岐命令の分岐先アドレスを前記履歴情報として記憶すべき場合に、複数の格納先のいずれかを選択するための選択情報を参照して格納先を選択する選択部と、格納先に分岐先アドレスを記憶する記憶制御部と、格納先への記憶に対応して選択情報を更新する更新部と、を有し、格納先に格納すべき分岐アドレスが複数ある場合に、第１の分岐先アドレスを格納先に記憶したときに更新手段によって更新された後の選択情報にしたがって第２の分岐先アドレスの格納先を選択する。

Description

明細書

コンピュータの分岐予測装置

技術分野

[0001] 本発明は、コンピュータの分岐予測機構に関するものである。

背景技術

[0002] コンピュータの分岐予測機構は、過去に実行された命令のメモリ上での記憶アドレス（以下、命令アドレスと、う）を基に分岐命令の実行履歴を管理することによって、次に分岐命令が実行される場合の分岐先を予測していた。

[0003] その場合、分岐予測機構は、過去に記憶元から分岐命令が取得 (命令をフェッチするという）された命令アドレス (分岐元アドレス）の一部からセットァソァシァティブ方式の記憶装置のセットを決定する。そして、分岐予測機構は、分岐元アドレスのさらに他の部分をタグにして、当該セット内の 1つのウェイに分岐先アドレスを記憶してお

<o

[0004] そして、分岐予測機構は、命令のフェッチ段階で命令アドレスを利用して、上記記憶装置を検索する。そして、過去に実行済みの分岐命令で、その分岐先アドレスが記憶装置に記憶されている場合には、分岐予測機構は、その命令アドレスが命令は分岐命令であり、さらに、その分岐先への分岐が発生すると予測する。

[0005] そして、分岐予測機構は、該当するセット内のタグの内容がフツチ中の命令アドレスの部分 (タグに格納されるべき部分）と一致するウェイから分岐先アドレスを入手する。このようにして、分岐予測機構は、命令のフツチと並行して、その命令が分岐命令であるか否力 (分岐元の命令アドレスの部分をタグにして分岐先アドレスが記憶されて、る力否力を判定することができる。

[0006] さらに、この技術では、コンピュータは、命令が分岐命令であった場合に予測される分岐先アドレスを入手できる。したがって、コンピュータがパイプライン処理を行っている場合であっても、現在の命令フェッチと並行して、事前に予測される分岐先から次のステージでの命令フェッチを準備することができる。

[0007] そして、現在フツチ中の命令力得られた分岐先が予測された分岐先であった場合には、ノィプライン処理を止めることなく各ステージを並列動作できる。一方、現在フェッチ中の命令力も得られた分岐先が予測された分岐先でな力つた場合には、正しい分岐先力命令フェッチを再開することになる。現在フェッチ中の分岐命令の命令アドレスに対応して上記記憶手段に分岐先が記憶されていな力つた場合 (分岐予測がヒットしな力たが分岐命令が実行された場合)も、分岐予測を利用できず、フエツチ後の分岐命令をデコードして得られた分岐先アドレスから命令フェッチを再開することになる。

[0008] このような従来の分岐予測機構への分岐先アドレスの登録においては、例えば、分岐元アドレスが上記記憶装置に記憶されていた場合 (アドレスがヒットしたという）、分岐先アドレスとともにヒットしたウェイの番号を分岐命令に付加していた。そして、分岐命令の実行結果にしたカ^、、その番号のウェイに存在するデータを更新していた。すなわち、例えば、分岐予測が正し力つた場合で、次にも同様にその分岐先に分岐する可能性が高い場合には、分岐予測機構は、そのウェイの情報を維持するとともに、そのウェイの情報が極力長期に保持されるように管理情報を更新して、た。

また、アドレスがヒットしな力つたにも拘わらず (分岐予測が外れて）、実際に分岐が発生し、分岐先を新たに記憶装置に記憶するべき場合には、分岐予測機構は、管理情報により予め決定されていた新規登録すべきウェイにその分岐先を記憶するとともに、そのウェイの情報が極力長期に保持されるように管理情報を更新して、た。

[0009] 本出願人は、すでに、このようなゥヱイの管理 (分岐元アドレス力決定されるセット内において、どのウェイを優先的に保持すべきか)を効率的に実施するための提案を行っている（下記特許文献 1参照)。この技術では、各ウェイにリプレースフラグおよびノリツドフラグと、う情報をそれぞれ 1ビット設け、分岐先アドレスが新たに書き込まれたウェイへの次の書き換えが極力遅くなるように対応するリプレースフラグが更新される。

[0010] そして、新たに記憶すべき分岐先が発生した場合、現在の 1組のリプレースフラグ（ウェイの数に対応するビットパターン）によって、次に記憶すべきウェイ (そのウェイの現在の分岐予測先情報は破棄されることになる）が決定されていた。

[0011] ところ力 1回のフェッチにおいて、複数命令、例えば、 4命令をフェッチする方式のコンピュータでは、以下のような問題が生じる。すなわち、その 4命令中に複数の分岐命令が含まれている場合があり、そのいずれをも記憶装置に記憶する必要が生じる場合がある。これは、典型的には、例えば、 4命令中で最初に現れた分岐命令が実行されず、第 2番目に表れた分岐命令が実行された場合である。そのような場合、一般的には、実際に分岐が発生した分岐先が記憶装置登録される。

[0012] し力しながら、他の事情、例えば、グローバルヒストリによって分岐予測を行う分岐予測機構では、実際に分岐が発生した分岐先の他に、分岐が発生しな力つた分岐先ァドレスを記憶する必要が生じる場合がある。一例としては、 2つの分岐命令によって 2 重のループが形成されている場合、グロ一ノレヒストリによれば、現在実行されなかつた分岐先が将来実行される分岐先として記憶手段に記憶される対象となる。なお、グローバルヒストリに関しては、本出願人によってすでに提案がなされている（下記特許文献 2参照)。

[0013] 同様に、スーパースカラマシンのように、複数本のパイプラインを備え、複数命令を同時にデコード Z実行する場合にも、複数の分岐命令が同一のステージで検索される可能性がある。すなわち、それら複数の分岐命令の命令アドレスから生成されるセットがー致し、セット内のウェイを競合する場合がある。

[0014] また、複数命令をフェッチする方式でなくても、分岐予測が外れた場合で、グローバルヒストリから予測された分岐先と実際の分岐先の両方を記憶すべき場合もある。特許文献 1：特開 2004 - 38298号公報

特許文献 2：特開 2004— 38323号公報

発明の開示

発明が解決しょうとする課題

[0015] 上述のように、複数の分岐命令による複数の分岐先を記憶装置に記憶するとともに、リプレースフラグを管理すべきである。しかし、従来の技術では、次に新たな分岐先を格納できるウェイは 1つだけ選択されていたため、 1回の命令フェッチの結果について、複数の分岐先を記憶装置に記憶することができな力つた。すなわち、複数の分岐先を新たに記憶装置に記憶する場合に、適切に複数のウェイを選択できていなかつた。さらに困難な問題としては、そのような複数のゥヱイを選択する場合に、新たに書き換えられた複数のウェイの情報 (分岐先アドレス)が極力長期間保持されるように、管理する技術は提案されていな力つた。

[0016] したがって、複数の分岐先アドレスを記憶装置に登録する必要がある場合に、どちらかの情報が欠落する可能性があった。すなわち、分岐先がヒットしな力つた場合、あるいは、分岐先の予測が外れた場合で、複数の分岐先を登録すべき場合に、情報の欠落が発生し、分岐予測の性能を低下させる原因となっていた。また、分岐先がヒットしたがグローバルヒストリによって複数の分岐先の登録が必要となる場合も同様である。本発明の目的は、このような従来の技術の問題を解決することにある。

課題を解決するための手段

[0017] 本発明は前記課題を解決するために、以下の手段を採用した。すなわち、本発明は、少なくとも命令の記憶元から命令を取得する取得段階と前記命令を処理する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で複数命令を取得する取得部と、前記コンピュータによって次の実行段階で実行される命令が分岐命令であるか否かを過去に実行された命令の履歴情報にしたがって予測する分岐命令予測部と、前記取得された命令の少なくとも 1つを前記実行段階で実行する実行部と、を備え前記分岐命令予測部は、前記実行された分岐命令の分岐先アドレスを、前記分岐命令の記憶元を参照するための命令アドレスから決定される複数の格納先の、ずれかに前記履歴情報として記憶する履歴記憶部と、実行された分岐命令の分岐先アドレスまたは前記取得段階で取得された分岐命令の分岐先アドレスを前記履歴情報として記憶すべき場合に、前記複数の格納先の、ずれかを選択するための選択情報を参照して格納先を選択する選択部と、選択された格納先に前記分岐先アドレスを記憶する記憶制御部と、前記格納先への記憶に対応して前記選択情報を更新する更新部と、を有し、前記選択部は、前記格納先に格納すベき分岐アドレスが複数ある場合に、第 1の分岐先アドレスを前記格納先に記憶したときに前記更新手段によって更新された後の前記選択情報にしたがって第 2の分岐先アドレスの格納先を選択するコンピュータの分岐予測装置である。

[0018] 本発明によれば、第 1の分岐先アドレスを前記格納先に記憶したときに生じる前記更新手段による更新の後の前記選択情報にしたがって第 2の分岐先アドレスの格納先を選択するので、 1回の実行サイクルにお、て複数の分岐先アドレスを登録する必要がある場合にも、選択情報にしたがった適正な格納先に格納できる。なお、ここで命令を処理するとは、命令に従った所定の処理を実行することをいい、例えば、条件付き分岐命令の場合には、条件の判定と判定結果に基づく分岐先への分岐または分岐しない処理を含む。

[0019] 前記選択情報は、前記命令アドレスによって決定される前記複数の格納先への書き込み順を指定する、複数の格納先のそれぞれに対して 1ビットの書き込み順情報を含み、前記選択部は、前記書き込み順情報にしたがって前記分岐先アドレスの格納先を選択するようにしてもよい。本発明によれば、複数の格納先のそれぞれに対して 1ビット書き込み順情報によって格納先を選択できる。

[0020] 前記履歴記憶部は、前記命令の取得段階において取得中の命令アドレスにしたがつて前記複数の格納先力その命令が分岐命令であった場合の分岐先アドレスを検索し、前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先力検索されたものである場合に、その格納先を第 1の格納先とするとともに、前記選択情報にしたがって第 2の格納先を選択するようにしてもよい。

[0021] 本発明によれば、複数の分岐先アドレスを格納する必要がある場合に、すでにいずれかの格納先力分岐アドレスが検索されていた場合には、その格納先を第 1の格納先とし、さらに、前記選択情報にしたがって、第 2の格納先を選択できる。

[0022] 前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先から検索されたものでない場合に、前記選択情報にしたがって第 1の格納先を選択するとともに、前記選択情報を更新し、前記更新された選択情報にしたがって第 2の格納先を選択するようにしてちょい。

[0023] 本発明によれば、複数の分岐先アドレスを格納する必要がある場合に、すでに!/ヽずれかの格納先力も分岐アドレスが検索されていない場合には、選択情報にしたがつて第 1の格納先を選択するとともに、その選択にともなって選択情報を更新した上で、第 2の格納先を選択できる。したがって、複数の分岐先アドレスを適正な格納先に格納できる。

[0024] 前記選択情報は、前記複数の格納先ごとにその格納内容が有効か無効かを示すフラグ情報を有し、前記選択部は、前記フラグ情報によって格納内容が無効であると示されて!/、る格納先を優先して選択するようにしてもょ、。格納内容が無効な格納先を優先して選択することで、効率的に格納先を管理できる。

発明の効果

[0025] 本発明によれば、複数の分岐先アドレスを記憶装置に登録する必要がある場合に、情報が欠落することなぐ分岐予測の性能低下を抑制できる。

図面の簡単な説明

[0026] [図 1]本処理装置が有する 4ウェイ ·セット'ァソシァティブ方式の分岐予測装置の概略構成を説明するための図（その 1)である。

[図 2]本処理装置が有する 4ウェイ 'セット'ァソシァティブ方式の分岐予測装置の概略構成を説明するための図（その 2)である。

[図 3]分岐履歴記憶装置のセットを構成する各ウェイの構成を説明するための図である。

[図 4]置換対象ウェイ選択部の概略構成を示す図である。

[図 5]リプレースフラグによってウェイを選択する論理を説明するための図である。

[図 6]無効なウェイが選択された場合に、リプレースフラグの反転の有無を決定する論理を示す図である。

[図 7]分岐予測装置を含む処理装置のシステム構成図である。

[図 8]16バイト単位でフェッチされた命令中で 2つの分岐命令が存在する場合に、分岐予測の発生パターンを示す図である。

[図 9]分岐命令の実行結果と、次の分岐命令の分岐予測結果との組合せを示す図である。

[図 10]2つの分岐命令が存在し、 1つ目がヒットした場合の分岐命令の実行結果と、次の予測結果の組合せを示す図である。

[図 11]2つの分岐命令が存在し、 2つ目がヒットした場合の分岐命令の実行結果と、次の予測結果の組合せを示す図である。圆 12]分岐が予測されな力つた場合の実行結果と次の予測との組合せのノターンを示す図である。

圆 13]分岐予測装置で実行される分岐履歴検索処理の概要を示す図である。

[図 14]リプレースフラグにしたがって 2つのウェイを選択する処理の詳細を示す図である。

[図 15]2つの無効ウェイ選択処理の詳細を示す図である。

圆 16]無効ウェイと有効ウェイ選択処理の詳細を示す図である。

[図 17]有効な 2つのウェイ選択処理の詳細を示す図である。

[図 18]分岐命令格納処理のフローチャートである。

圆 19]変形例に係る分岐予測装置で実行される分岐履歴検索処理の概要を示す図である。

符号の説明

101 アドレス生成ユニット

102 命令キャッシュ

103 デコーダ

120 演算ユニット

121 主記憶装置

122 プログラムカウンタ

123 命令フツチ制御ユニット

124 命令キャッシュ制御ユニット

126 分岐リザべーシヨンステーション

127 その他リザべーシヨンステーション

128 命令完了管理ユニット

129 オペランドキャッシュ

130 分岐履歴記憶装置

131 データキャッシュ制御ユニット

140 グローバルヒストリ

発明を実施するための最良の形態 [0028] 以下、図面を参照して本発明の実施の形態に係る処理装置を説明する。

[0029] 《第 1実施形態》

以下、図 1から図 7の図面に基づいて本発明の第 1実施形態に係る処理装置を説明する。

[0030] 図 1および図 2は、本処理装置が有する 4ウェイ ·セット'ァソシァティブ方式の分岐予測装置 100の概略構成を説明するための図である。また、図 7は、図 1および図 2 に示した分岐予測装置 100を組み込んだ処理装置のシステム構成図である。

[0031] 図 1および図 2に示すように、分岐予測装置 100は、主に、 4つのウェイ WOから W3 を持つ分岐履歴記憶装置 130、アドレス生成ユニット 101、キャッシュメモリ 102、デコーダ 103、分岐履歴検索結果判定ユニット 104、等価性判定部 105、ヒットウェイ選択部 106、置換対象ウェイ選択部 107、分岐履歴検索結果判定部 108、および、グローバルヒストリ 140等を備える。これらはバス等を介して接続されて、る。

[0032] 図 3は、分岐履歴記憶装置 130のセットを構成する各ウェイの構成を説明するための図である。分岐履歴記憶装置 130は、 SRAM等の比較的高速にアクセス可能な記憶装置である。 4ウェイの分岐履歴記憶装置 130は、 1つのセット内に 4つのウェイに対応するエントリを有する。図 3に示すように、各エントリは、タグ部 TGとデータ部 D Tを含む。タグ部 TGは、命令アドレス（の一部) TG1、ノリツドフラグ V、リプレースフラグ尺、および、その他のフラグ TG2からなる。データ部 DTは、所定データとしての分岐先アドレス DT1からなる。

[0033] 1つのセットは、アドレス生成ユニット 101から出力される命令アドレス Aの一部（例えばく 15 : 5 >)によって決定される。本実施形態では 4ウェイなので、セットの決定により 4つのエントリが指定されることになる。さらに、その 4つのエントリのうち、命令ァドレス Aの一部（例えばく 31 : 16 >)によって一のエントリが決定される。この一のェントリを決定するために、命令アドレス TG1には命令アドレスの一部（例えばく 31： 1 6 >)が格納されている。例えば、登録時に、命令アドレス Aの一部く 15 : 5 >を使つてセットが決定され、残りの部分がセット内のいずれかのエントリ（4つのウェイに対応する 4つのエントリのいずれ力）のタグ部（命令アドレス TG1を含む）にデータとして格納されるようになつている。なお、命令アドレスく 31 : 16 >との記載は、命令アドレス TGIが命令アドレス（例えば 32ビット）の一部 31ビット目力も 16ビット目であることを意味する。

[0034] ノリツドフラグは、エントリの有効又は無効を示すフラグである。例えば、ノリツドフラダカであればそのノリツドフラグを含むエントリが有効であること、ノリツドフラグが "0"であればそのバリッドフラグを含むエントリが無効であることを示す。エントリが有効とは、ウェイに登録されたデータである分岐先アドレスが抹消されて、な、と、う意味である。ノリツドフラグは、置換対象のウェイを選択するためにも用いられる。

[0035] リプレースフラグは、置換対象のウェイを選択するために用いられるフラグである。

分岐先アドレスには、キャッシュメモリ 102 (または主記憶装置)からフェッチされた分岐命令の分岐先アドレスが格納される。

[0036] アドレス生成ユニット 101は、命令アドレス A等を生成し出力するためのものである。

アドレス生成ユニット 101はプログラムカウンタ等を含む。キャッシュメモリ 102は、 SR AM等の比較的高速にアクセス可能な記憶装置である。デコーダ 103は、キャッシュメモリ 102 (または主記憶装置)力もフェッチされた分岐命令等をデコードするためのものである。

[0037] 等価性判定部 105は、アドレス生成ユニット 101から出力される命令アドレス A (の一部）とタグ部 TGの命令アドレス TG1とを比較し、一致する命令アドレス TG1が存在すればヒット信号 (ヒットを示すビット）を出力する。ヒットウェイ選択部 106は、各ウェイ力のヒット信号に基づいてヒットしたウェイを指定するヒットウェイ選択信号を出力する。

[0038] 分岐履歴検索結果判定ユニット 104は、分岐予測装置から得られた分岐先アドレス力 Sメモリ領域 (キャッシュメモリ 102または主記憶装置)力フェッチされた分岐命令の分岐先アドレスと等しいか、つまり、予測が正し力つたかどうかを判定するためのものである。

[0039] 置換対象ウェイ選択部 107は、主に置換対象のウェイを選択するためのものである。図 4に置換対象ウェイ選択部 107の概略構成を示す。置換対象ウェイ選択部 107 は、各ウェイ wayO (WO)力 way3 (W3)それぞれから、同一アドレス Aによって指定されるエントリに含まれるリプレースフラグ R (replace flag wavO, replace flag ― wayl, replace― flag― way 2, replace― flag― way3)およびノリツドフラグ (wa yO― valid, wayl― valid, way2― valid, way 3― valid)を取得する。置換対象ゥエイ選択部 107は最終的に、置換対象のウェイを指定する置換対象ウェイ選択信号（ replace— way< 1 : 0 >)およびその選択信号によって指定されるウェイに書き込むリプレースフラグ（new— replace— flag)を出力する。

[0040] 置換対象ウェイ選択部 107は、ウェイ W0から W3それぞれカゝら取得されたリプレースフラグに基づいて、置換対象のウェイを選択する。図 5は、それらリプレースフラグによってウェイが選択される論理を説明するための図である。同図は、ウェイ wayOから way3それぞれから左側のリプレースフラグ（例えば（wayO, wayl, way2, way3) = (0, 0, 0, 0) )が取得された場合には、置換対象のウェイとして右側の〇が位置するウェイ (例えばウェイ 0)が選択されることを示す。

[0041] 例えば、図 5において、リプレースフラグが（0, 0, 0, 0)である場合を考える。この場合、図 5によれば、置換対象として wayOが選択される。選択されたウェイのリプレ一スフラグは反転されるので、この場合リプレースフラグは、（1, 0, 0, 0)となる。

[0042] そして、リプレースフラグが（1, 0, 0, 0)の場合には、図 5によれば、置換対象として waylが選択される。そして、リプレースフラグは、（1 , 1, 0, 0)となる。

[0043] さらに、リプレースフラグが（1, 1, 0, 0)の場合には、図 5によれば、置換対象として way2が選択される。そして、リプレースフラグは、（1, 1, 1, 0)となる。

[0044] さらに、リプレースフラグが（1, 1, 1, 0)の場合には、図 5によれば、置換対象として way3が選択される。そして、リプレースフラグは、（1, 1, 1, 1)となる。

[0045] さらに、リプレースフラグが（1, 1, 1, 1)の場合には、図 5によれば、置換対象として wayOが選択される。そして、リプレースフラグは、（0, 1, 1, 1)となる。

[0046] このように、図 5の表にしたがって、ウェイを選択するとともに、リプレースフラグを反転した場合、選択されたウェイが次に選択される時期を可能な限り送らせて、 LRUに近、効率を達成することができる。

[0047] 例えば、単純に図 5の表を最上段の行 (0, 0, 0, 0)と第 8行目（0, 0, 0, 1)との間で遷移する場合には、常に、選択されたウェイが次に選択される時期は最後 (4番目 )となる。また、第 9行目（1, 0, 1, 0)と最下段の行（1, 0, 1, 1)との間で遷移する場合には、常に、選択されたウェイが次に選択される時期は最後 (4番目）となる。

[0048] 置換対象ウェイ選択部 107は、ウェイ WOから W3それぞれカゝら取得されたバリッドフラグすべてが有効であれば、リプレースフラグに基づいて選択されたウェイ（図 5の関係で定まるウェイ）を指定する置換対象ウェイ選択信号 (replace— wayく 1： 0 > )を出力する。

[0049] また、置換対象ウェイ選択部 107は、ウェイ wayOから way3それぞれから取得されたノリツドフラグに基づいて、置換対象のウェイを選択する。すなわち、置換対象ゥェィ選択部 107は、各ウェイから取得されたバリッドフラグのうち少なとも 1つが無効であれば、ノリツドフラグに基づ、て選択されたウェイ (その無効なエントリを有するウェイ）を指定する置換対象ウェイ選択信号 (repl_ace__Wayく 1 : 0 >)を出力する。

[0050] また、置換対象ウェイ選択部 107は、置換対象ウェイ選択信号 (replace— wayく 1

: 0 >)によって指定されるウェイに書き込むリプレースフラグ（new— replace— flag) を出力する。すなわち、置換対象ウェイ選択部 107は、ウェイ wayOカゝら W3それぞれ力も取得されるノリツドフラグすべてが有効であれば、置換対象ウェイ選択信号 (repl ace— wayく 1 : 0 »によって指定されるウェイから取得されたリプレースフラグを反転したリプレースフラグ (new— replace— flag)を出力する。一方、置換対象ウェイ選択部 107は、ウェイ wayOから way3それぞれから取得されたノリツドフラグのうち少なくとも 1つが無効であれば、図 6の表にしたがってリプレースフラグ (new— replace— flag)を出力する。

[0051] 同図の各行は、左側部分のリプレースフラグの組 (wayO, wayl, way2, way3)によってユニークに区別される。各行は、現在のそれぞれのウェイのリプレースフラグの状態を示している。また、表の右側部分のウェイの組 (wayO, wayl, way2, way3) 力無効なウェイの位置に相当する。このようにして、各行の右側部分で、無効な位置に相当する表のエントリに、反転の有無が指定される。

[0052] 今、ウェイ wayOから way3それぞれから左側のリプレースフラグの組（例えば（wayO , wayl, way2, way3) = (0, 0, 0, 0) )力 S取得され、かつ、置換対象クエイ選択信号 (replace— wayく 1 : 0 »によって無効なエントリを有するウェイとして右側部分のいずれかのウェイ (例えば wayOのウェイ）が指定されたとする。すると、表の左側部分で（0, 0, 0, 0)の組で指定される行において、表の右側部分において wayOの箇所には、 "反転"が指定されている。したがって、この場合の選択信号によって指定されるウェイ 0から取得されたリプレースフラグは反転され、リプレースフラグ（new— repla ce_flag)として出力されることになる。

[0053] また、例えば、同行のウェイ 2の箇所には、 "反転"が指定されていない（空欄である )。このような場合には、リプレースフラグは反転されることなぐそのままリプレースフラグ（new_replace_flag)として出力される。

[0054] 例えば、（0, 0, 0, 0)の状態で、ノリツドフラグにしたがって wayOが選択された場合には、図 6より反転が指定されているので、リプレースフラグは、（1, 0, 0, 0)となる。この場合、図 5の表にしたがうと、次に WayOが選択されるのは、最も遅く（4番目に）なる。

[0055] また、例えば、（0, 0, 0, 0)の状態で、バリッドフラグにしたがって waylが選択された場合には、図 6より反転が指定されているので、リプレースフラグは、（0, 1, 0, 0 )となる。この場合、図 5の表にしたがうと、次に Waylが選択されるのは、第 12行 (0, 1, 0, 0) = >第13行(0, 1, 0, 1) = >第14行（1, 1, 0, 1)と遷移した後である。この場合、最も遅い 4番目の遷移より 1つ前の 3番目の遷移で waylが選択されることになる。

[0056] このような図 5および図 6の状態遷移は、論理ゲートによって実現できる。例えば、本出願人がすでに出願済みの特開 2004— 38298において図 5および図 6のリプレ一スフラグと出力との関係を実現する論理回路が示されている。

[0057] グローバルヒストリ 140は、過去に実行された分岐命令ごとに分岐方向の履歴を記憶した記憶部を有し、過去の複数回の分岐の結果から分岐予測を管理する。すなわち、過去の複数回の分岐の履歴の規則性力それぞれ分岐命令の将来の分岐の有無を予測する。

[0058] また、グローバルヒストリ 140は、例えば、分岐命令ごとに最近の連続分岐成立回数および最近の連続分岐不成立回数を記憶する。そして、現在は分岐が成立したとすると、現在の連続分岐成立回数が前回の連続分岐成立回数を越えない場合には次も分岐成立 (分岐する）と予測し、現在の分岐連続成立回数が前回の連続分岐成立回数と一致した場合には、次には分岐不成立 (分岐しない）と予測する。また現在は分岐が成立しなかったとすると、現在の連続分岐不成立回数が前回の連続分岐不成立回数を超えない場合には、次も分岐不成立 (分岐しない）と予測し、現在の分岐連続不成立回数が前回の連続分岐不成立回数と一致した場合には、次には分岐成立 (分岐する）と予測する。

[0059] 本実施形態のグローバルヒストリ 140は、グローバルヒストリに基づく分岐予測を分岐履歴記憶装置 130に送出し、分岐命令のウェイへの登録の要否を指示する。分岐履歴記憶装置 130は、分岐命令の実行によって分岐先アドレスが確定した後、グロ一バルヒストリ 140からの指示にした力 ^、、各分岐命令に付加された候補のウェイに格納する。

[0060] 図 7は、以上のような分岐予測装置を含む処理装置のシステム構成図である。本処理装置は、例えば、主記憶装置 121に格納された命令を読み出して実行する、いわゆるプログラム内蔵方式のコンピュータである。

[0061] 図 7のように、この処理装置は、命令を実行する演算ユニット 120と、演算ユニット 1 20で実行される命令および演算ユニット 120が処理するデータ等を格納する主記憶装置 121と、演算ユニット 120が実行すべき命令の主記憶装置 121上のアドレスを指定するプログラムカウンタ 122とを有している。このようなプログラムカウンタ 122の制御に基づく処理装置の制御は周知である。

[0062] 図 7では、さらに具体的に、プログラムカウンタ 122の生成するアドレスに基づいて命令のフツチを制御する命令フツチ制御ユニット 123と、命令キャッシュ 102を管理し命令フェッチ制御ユニット 123からの命令フェッチ要求にしたがって命令をフェツチする命令キャッシュ制御ユニット 124と、命令キャッシュ 102からフェッチされた命令を保持する命令バッファ 125と、命令バッファ 125の命令をデコードするデコーダ 10 3と、デコードされた命令の実行タイミングを制御するリザべーシヨンユニット (分岐命令の実行を制御する分岐リザべーシヨンユニット 126およびレジスタ演算命令、ァドレス演算命令の実行を制御するその他リザべーシヨンユニット 127)と、命令の実行完了を監視する命令完了管理ユニット 128と、演算ユニット 120で実行される命令のォぺランドを高速に演算ユニット 120に供給するオペランドキャッシュ 129と、主記憶装置 121とオペランドキャッシュ 129との間でデータの授受を管理するデータキャッシュ制御ユニット 131とを有して、る。

[0063] このうち、命令フェッチ制御ユニット 123が図 1のアドレス生成ユニット 101に該当する。以下、本処理装置の制御手順を説明する。まず、プログラムカウンタ 122からの命令アドレス (命令が格納された主記憶装置 121上のアドレス）が命令フツチ制御ュニット 123に送出される。

[0064] 命令フェッチユニット 123は、命令キャッシュ制御ユニット 124にその命令アドレスの命令取得を指示するとともに、分岐予測装置 100に対して、分岐予測を指示する。すると命令キャッシュ 102での命令取得処理と並行して、分岐予測装置 100での分岐履歴記憶装置 130の検索がなされる。

[0065] そして、分岐予測装置 100は、現在の命令アドレスで分岐命令がヒットした場合には、その分岐先アドレスを命令フェッチ制御ユニット 123に送出する。このとき、分岐予測装置 100は、分岐先アドレスとともに、ヒットしたウェイについてのウェイの番号とリプレースフラグの値 (以下、ウェイの情報という）を命令フェッチ制御ユニット 123に送出する。

[0066] 命令フツチ制御ユニット 123は、分岐予測装置 100でヒットした分岐命令の分岐先アドレスによって、さらに、次の命令取得を命令キャッシュ制御ユニット 124に指示する（このような処理は、通常、パイプラインのステージを形成する）。なお、分岐予測力 Sヒットしな力つた場合には、分岐しな、次の命令アドレスを命令フェッチ制御ュ-ット 123の内部で生成し、次の命令取得を命令キャッシュ制御ユニット 124に指示する

[0067] そして、命令フェッチ制御ユニット 123は、命令キャッシュ制御ユニット 124からフエツチされた命令群を命令バッファ 125から参照する。そして、命令フツチ制御ュ-ット 123は、ヒットした場合にはヒットしたウェイの情報、またヒットしな力つた場合には、図 5および図 6の表に示した論理にしたがって、次に分岐命令を格納すべきウェイの情報を命令バッファ 125上の分岐命令に付与する。ウェイの情報が付与された命令は、それぞれデコーダ 103に送出される。

[0068] その結果、命令はデコードされ、分岐リザべーシヨンステーション 126、その他リザベーシヨンステーション 127、および命令完了ユニット 128に送出される。なお、命令がデコードされた後も、ウェイの情報は分岐命令とともに分岐リザべーシヨンステーシヨン 126で維持されている。デコードされた命令は、その他リザべーシヨンステーション 127によってオペランドの処理等に基づいて、実行の待ち合わせを受ける。そして、オペランドが揃った時点で、各命令が演算ユニット 120またはデータキャッシュ制御ユニット 131で実行される。

[0069] 一方、分岐命令については、分岐リザべーシヨンステーション 126によって命令の待ち合わせがなされる。そして、分岐命令の実行によって分岐する力否か、また分岐する場合には分岐先アドレスが確定したときに、完了報告が分岐リザべーシヨンステーシヨン 126から、命令完了ユニット 128および分岐予測装置 100に送出される。このとき、分岐命令の命令アドレス、分岐先アドレス、および格納すべきウェイの情報（ウェイの番号とリプレースフラグ)が分岐予測装置 100に送出される。

[0070] このとき、分岐リザべーシヨンステーション 126内の分岐履歴検索結果判定部 108 ( 図 1参照）は分岐予測が正し力つた力否かを判定する。すなわち、（al)その命令アドレスにて分岐予測装置 100によって分岐予測がヒットし (分岐履歴記憶装置 130に分岐先アドレスが格納されて、た）、 (a2)フツチされた分岐命令がその分岐先ァドレスに分岐した場合に、分岐予測が正し力つたことが分かる。あるいは、（bl)その命令アドレスにて分岐予測装置 100がヒットせず、（b2)フェッチされた命令が分岐命令ではな力つた力もしくは分岐命令であっても分岐しな力つた場合に、分岐予測が正しかつたことがわかる。

[0071] この場合、すでにキャッシュ制御ユニット 124に依頼済みの命令フェッチは、そのまま続行されること〖こなる。

[0072] また、分岐予測が正しくな力つた場合には、すでに、キャッシュ制御ユニット 124に依頼済みの命令フェッチおよびその後に続く一連の処理は中断されることになる。同時に分岐リザべーシヨンステーション 126からは、正しい分岐先からの再命令フェッチを行うよう、命令フェッチ制御ユニット 123に指示が出される。

[0073] グローバルヒストリ 140は、このような分岐命令の実行結果にしたがって、分岐予測装置 100の分岐履歴記憶装置 130に登録すべきか否かを判定する。そして、グロ一バルヒストリ 140は、エントリの更新指示を分岐履歴記憶装置 130に送出する。

[0074] 分岐予測装置 100は、グローバルヒストリ 140からの更新指示にしたがい、セレクタ 132を介して実行された分岐命令をウェイに格納する。このとき格納されるウェイは、分岐予測の時点で、命令バッファ 125にお、て分岐予測装置 100によって各命令に付与されたウェイ番号のウェイである。さらに、分岐命令のウェイへの格納とともに、同じく命令に付与されたリプレースフラグを格納する。

[0075] 以上述べたように、本実施形態の処理装置によれば、図 5および図 6のルールにしたがって、置換対象となる機会が順番に巡ってくることになる。つまり、最新の登録されたウェイができるだけ遅く置換対象として選択されるようになる。ただし、組合せによつては、最も遅い場合よりも 1つだけ早く置換の機会が来る場合もあるが、すべての組合せで、「最も遅く置換の機会が来る」か、あるいは、「最も遅い順番よりも 1つだけ早い順番で (例えば、 4ウェイの場合に、 3回目の書き換えタイミングで)置換の機会が来る」制御が実現され、完全な LRUではないが、それに近い状態で動作する。

[0076] すなわち、本実施形態の分岐予測装置 100によれば、各ウェイに 1ビットのリプレースフラグを用意し、取り決めにしたがってリプレースフラグ、およびバリッドフラグカもェントリの置換の制御を行い、またリプレースフラグを更新することで、 LRUに近い動作での分岐履歴記憶装置 130のエントリの入れ替えが実現される。このために必要な情報は、ウェイにつき 1ビットのフラグのみである。また、その情報を外部に出すときは、さらに 1ビットに圧縮される。これは、従来の LRUのような方法と比べて、格段に低コストとなることを意味する。

[0077] 《第 2実施形態》

以下、図 8から図 14の図面に基づいて、本発明の第 2実施形態に係る処理装置を説明する。上記第 1実施形態では、図 5および図 6に示したテーブルに基づいて、新規に書き込まれたウェイが極力遅く書き換えられるように制御する分岐予測装置 100の処理について説明した。本実施形態では、同一のフェッチステージで複数の命令がフェッチされる処理装置において、第 1実施形態の場合と同様に、ウェイの管理を行う処理装置について説明する。本実施形態に置ける他の構成および作用は、第 1実施形態の場合と同様である。そこで、同一の構成要素については、同一の符号を付してその説明を省略する。また、必要に応じて、図 1から図 7の図面を参照する。

[0078] 本実施形態では、処理装置は、 1命令 4バイトの命令を実行する。また、処理装置は、 16バイト、すなわち、 1つの命令フェッチステージにおいて 4命令をフェッチする（本実施形態では、このような処理を同時にフェッチするという）。

[0079] 上記 4命令は同一の命令アドレスで命令フェッチされるので、同一のセット（ラインともいう）内の 4つのウェイを共有する。そして、取得した分岐命令が次回の命令フェツチにおいて取得され実行されると予測される場合、分岐予測装置 100は、そのような分岐命令の分岐先アドレスをいずれかのウェイに格納する。この場合、分岐予測装置 100は、まず、その分岐命令の分岐元アドレスの一部によって、内蔵する分岐履歴記憶装置 130の 4つのウェイを共有する 1つのセットを決定する。そして、そのセット内の 4つのウェイ力も書き換えられるべきウェイを決定する。

[0080] すなわち、セット内の各ウェイにそれぞれ 1ビットのリプレースフラグとバリッドフラグが付与されており、リプレースフラグとバリッドフラグの現在の状態にしたがって、次に書き換えられるべきウェイが決定される。そして、分岐予測装置 100は、そのウェイに対応するエントリに、タグ (分岐元アドレスの一部で、セットの決定に使用されな力つた部分のビットを含む)を書き込むとともに、ウェイに分岐先アドレスを書き込む。さらに、分岐予測装置 100は、現在のリプレースフラグの状態にしたがって、リプレースフラグの状態を設定する (反転する、または、反転しない)。この設定は、第 1実施形態と同様、現在書き込まれたウェイが今後書き換えるタイミングが完全には最も遅くすることはできないが、極力遅くなる（最も遅い順番カゝ、最も遅い順番より 1回早い順番）、所定の規則にしたがつている。

[0081] 本実施形態で想定する命令セットアーキテクチャの仕様では、同時にフェッチされる 4命令中には、通常動作においては高々 2個の分岐命令しか含まれないと仮定できる。したがって、本実施形態では、同一のフェッチステージで複数命令がフェッチされる命令アドレスに対応して、セット (ラインとも!、う）を共有する分岐命令の数は高々 2個と仮定する。すなわち、分岐予測と命令の実行結果に基づいて、同一タイミング（同一のステージ)で、分岐予測手段が登録すべき分岐命令の数は、最大 2個と仮定する。 [0082] このような命令の実行において、分岐予測装置 100の処理の概要は、以下の通りである。

(1)現在フツチ中の命令アドレスによる分岐履歴記憶装置 130の検索により、分岐命令がヒットした場合には、分岐予測装置 100は、ヒットしたウェイの情報をリプレースフラグの更新に使用する。

[0083] さらに、フェッチされた 4命令中のヒットしなかった分岐命令で、グローバルヒストリ 14 0の予測カゝら今後分岐すると予測される分岐命令が存在する場合、現在のリプレースフラグの状態から図 5にしたがって新たなウェイを選択する。

[0084] このとき、ノリツドフラグにより無効なウェイが存在することが分力つた場合には、分岐予測装置 100は、無効なウェイを優先して選択し、図 6の表にしたがって、リプレースフラグの反転の有無を決定する。そして、グローバルヒストリ 140の指示にしたがい、分岐予測装置 100は、そのヒットしな力つた分岐命令の分岐先アドレスをそのウェイに格納するとともに、リプレースフラグを更新する。

(2)現在フツチ中のアドレスによる分岐履歴記憶装置 130の検索により、分岐命令力 Sヒットせず、かつ、 2つの命令 (これを第 1の候補、および第 2の候補と呼ぶ)を分岐履歴記憶装置 130に記憶すべき場合には、分岐予測装置 100は、まず、現在のリブレースフラグおよびバリッドフラグ力第 1の候補を格納すべきウェイを決定し、リプレ一スフラグを仮に書き換える。次に、第 1の候補の選択によって仮に書き換えられた状態のリプレースフラグの組合せとバリッドフラグから、第 2の候補を格納すべきウェイを決定し、リプレースフラグをさらに仮に書き換える。そして、最終的には、グローバルヒストリ 140の指示にした力^、、実際に格納するか否かが決定され、リプレースフラグが書き換えられる。

[0085] <分岐予測装置 100の処理概要 >

分岐予測装置 100は、命令フェッチに際して分岐履歴記憶装置 130に登録された分岐履歴を利用して分岐予測を実行する。上述のように、命令フェッチは、 16バイト (4 命令）単位で行われる。したがって、分岐予測装置 100は、 16バイト内に含まれる分岐命令を検索することになる。分岐予測装置 100は、命令アドレスの一部を用いて分岐履歴記憶装置 130にアクセスし、 4ウェイ分のデータを取得する。これらのデータには、上記リプレースフラグおよびバリッドフラグも含まれて、る。

[0086] この分岐履歴記憶装置 130には、分岐する分岐命令が格納されている。分岐予測装置 100は、分岐履歴記憶装置 130の検索時、該当するセットの 4つのゥヱイに対応する 4つのエントリ（タグが格納されている）を、命令アドレスの一部（タグとなるべきビット部分）と比較する。そして、エントリのタグがそのビット部分と一致した時点（分岐命令が分岐履歴記憶装置 130でヒットした時点)で、分岐予測装置 100は、分岐先に分岐するとみなす。

[0087] したがって、分岐を予測しな力つた場合も、新たに分岐履歴記憶装置 130に登録すべき分岐命令がフェッチされた 4命令中に存在する場合がある。

[0088] 第 1に、 4つの命令中に分岐しない分岐命令が存在する場合である。この場合、たとえ現在の処理 (ステージ)でその分岐命令が分岐しなくても、次回分岐することがグローバルヒストリ 140により予測され、登録指示が出される場合がある。第 2に、分岐予測が誤った場合である。これは、分岐予測装置 100が分岐予測を誤った結果、分岐履歴記憶装置 130がヒットせず、かつ、フェッチされた 4命令中の分岐命令が分岐した場合である。この場合、分岐予測装置 100は、分岐が予測されず分岐した分岐命令を次に「分岐する分岐命令」として無条件で登録するすなわち、分岐予測装置 1 00は、リプレースフラグにより予め決定され、命令に負荷されていたウェイの情報に従ってエントリにタグおよび分岐先アドレスを格納する。

[0089] 図 8に、 16バイト単位でフェッチされた命令中で 2つの分岐命令が存在する場合に、分岐予測の発生パターンを示す。 2つの分岐命令のうち、例えば 1つ目の分岐命令が分岐すれば、当然 2つ目の分岐命令は実行されない。本実施形態では、分岐予測装置 100は、 16バイト中の最初の分岐命令がヒットした時点で、 2つ目の分岐命令の予測は必要ないものとして処理する。

[0090] 図 9に、分岐命令の実行結果と、次の分岐命令の分岐予測結果との組合せを示す。図 9では、 "分岐する（Taken) "を" Tk"で示し、 "分岐しない（NotTaken) "を" N— tk"で示している。図のように、フェッチされた 2つの分岐命令が分岐予測装置 100の処理対象となるのは、 1つ目の分岐命令が分岐しな力つた場合である。以下、図 8の（ 1— 1)、 (1 - 2) ,および（2)のそれぞれについて、図 9から図 12とともに説明する。 (1— 1)現在のフェッチステージで、フェッチされた 16バイト中に 2つの分岐命令が存在し、 1つ目がヒットしたとする。図 10に、この場合の 2つ目の分岐命令の実行結果と、次の予測結果の組合せを示す。この場合、ヒットしたウェイには、 1つ目の分岐命令が登録されており、ヒットしなかった 2つ目の分岐命令の処理が問題となる。

[0091] 図 10において、パターン 7は、 1つ目の分岐命令がヒットし、かつ、分岐した場合である。本実施形態の分岐予測装置 100は、分岐履歴検索時に書き換えるゥイの情報をー且命令フェッチ制御ユニット 123に送出し、命令のデコードおよび実行後に分岐リザべーシヨンステーション 126から戻されたウェイの情報にしたがって分岐先アドレスをウェイに格納する。このため、 1つ目の分岐命令で分岐すると、 2つ目の分岐命令をウェイに格納する機会はこの時点では消滅する。

[0092] また、図 10において、 "ヒットした"にも拘わらず、実行結果が" N— Tk"というのは、分岐予測を誤ったことを示す。

[0093] 図 10の場合に、 2つ目の分岐命令の登録動作が生じるのは、パターン 2、 3、 5、および 6である。このうち、パターン 2、 3については、 1つ目の分岐命令が"次の予測"において，， N— Tk"の場合であり、 1つ目の分岐命令のヒットしたウェイが書き換えられても構わない場合である。

[0094] 一方、パターン 5、 6については、 1つ目の分岐命令の"次の予測"が" Tk"であるので、予測上は、 1つ目の分岐命令の実行が優先することとなる。このため、 1つ目の分岐命令のヒットしたウェイを 2つ目の分岐命令によって書き換えたくない場合である。この場合に、 2つ目の分岐命令の登録を抑止するか、 2つ目の分岐命令を登録するための別のウェイ（同一セット内ウェイ）を準備する必要がある。

(1— 2)次に、フェッチされた 16バイト中に 2つの分岐命令が存在し、 2つ目がヒットしたとする。図 11に、この場合の 2つ目の分岐命令の実行結果と、次の予測結果の組合せを示す。この場合、ヒットしたウェイには、 2つ目の分岐命令が登録されており、ヒットしなかった 1つ目の分岐命令の処理が問題となる。

[0095] 図 11において、パターン 7は、 1つ目の分岐命令がヒットしな力つた力分岐した場合であり、この場合には、 2つ目の分岐命令は実行されない。また、図 11においても、 "ヒットした"にも拘わらず、実行結果が" N— Tk"というのは、分岐予測を誤ったことを示す。

[0096] 図 11で、 1つ目の分岐命令の登録が必要になるのは、パターン 4から 7である。このうち、パターン 5、 6については、ヒットした二つ目の分岐命令のウェイの情報しかなかつた場合、ヒットしたウェイに 1つ目の分岐命令を登録してしまうと、ー且登録できたとしても、直ちに、 2つ目の分岐命令の再登録によって上書きされることになる。

[0097] また、パターン 4については、 2つ目の分岐命令が今回はヒットした (分岐すると予測された）けれども次には分岐しないと予測された結果、エントリの消去動作が発生する。つまりこの場合には、ヒットした二つ目の分岐命令のウェイの情報しかな力つた場合、ヒットしたウェイに 1つ目の分岐命令を登録してしまうと、 2つ目の分岐命令の消去動作によって、せっかく登録した一つ目の分岐命令が消去されてしまうことになる。

[0098] これらの問題を回避するために、図 10のパターン 5、 6および図 11のパターン 4— 6 については、一つ目のヒットしなかった分岐命令について、ヒットしたウェイとは異なる場所に分岐先アドレスを登録する必要がある。これには、リプレースフラグで決定されるウェイを使用することが考えられる。

[0099] すなわち、命令フェッチによって得られた 4つの命令でヒットした分岐命令は、そのままヒットしたウェイを使用するように設定される。具体的には、分岐予測装置 100は、ヒットした分岐命令にヒットしたウェイの情報を付加してデコーダ 103に送出する。

[0100] また、ヒットしなかったがフェッチされた 4つの命令に含まれており、次に分岐が予測される分岐命令は、リプレースフラグにしたがって選択されるウェイを使用するように設定される。具体的には、分岐予測装置 100は、ヒットしな力つた分岐命令にリプレ一スフラグとバリッドフラグにしたがって選択されたウェイの情報を付加してデコーダ 1 03に送出する。

[0101] さらに、 4つの命令がデコードされ、実行された結果にしたがって、分岐予測装置 1 00は、ウェイの情報（リプレースフラグ、バリッドフラグ等）と格納内容とを更新する。具体的には、分岐予測装置 100は、不図示のグローバルヒストリ 140の予測にしたがつて、次に分岐が予測される分岐先アドレスのウェイへの登録、リプレースフラグの変更、およびヒットしたウェイのノリツドフラグを変更する。

[0102] 例えば、デコードされた 4つの命令中に 2つ分岐命令が含まれ、このうち、後の分岐命令がヒットした場合を考える。この場合に、グローバルヒストリ 140の予測内容力ヒットしな力つた最初の分岐命令が次に分岐する分岐命令であり、ヒットした分岐命令は次に分岐が予測されな、、 t 、うものであったとする（図 11のパターン 4の場合)。このような場合、ヒットした分岐命令が格納されていたウェイは、ノリツドフラグがオフされ、無効なウェイ (未使用のウェイ）にされる。登録は順番に行われるので二つ目の分岐命令のための消去動作によって一つ目が消去されるのを防ぐため、次に分岐が予測される一つ目の分岐命令のために、ヒットしたウェイ以外のウェイを用意する必要がある。

[0103] また、図 11のパターン 7のように、ヒットしなかった最初の分岐命令を実行した結果それが分岐し、分岐予測が外れた場合には、その分岐命令を登録するウェイを用意する必要がある。また、図 11のパターン 5、 6のように、ヒットしたウェイの分岐先ァドレスへの次回の分岐が予測されるとともに、ヒットしな力つた最初の分岐命令が次に分岐されると予測された場合も、ヒットしたウェイの他、さらになるウェイを用意する必要がある。

(2)次に、図 8の最後のパターン (分岐が予測されな力つた場合である。図 8において (2)で示されている）について説明する。この場合の実行結果と次の予測との組合せのパターンを図 12に示す。今、同時フェッチされた 4命令中に 2つの分岐命令が含まれている場合を想定する。このうち、パターン 2、 3および 4においては、登録動作が生じるのは 2つの分岐命令のうち、 1つ目あるいは 2つ目だけであるので、登録すべきウェイは 1つでよい。

[0104] 一方、パターン 5、 6のとき、次に分岐が予測されるのは、同時にフェッチされた 4命令中の 1つ目の分岐命令である。し力し、パターン 5では、グローバルヒストリ 140が 2 つ目の分岐命令の分岐をも予測している。またパターン 6では、二つ目の分岐命令について予測が" N—Tk"であったにも関わらず実行結果が" Tk "であったため、登録動作が生じる。

[0105] このような場合が生じるのは、実行されるプログラム中に 2重のループがあって、 1つ目の分岐命令が内側の小さなループを形成し、 2つ目の分岐命令が外側の大きなループを形成する場合が考えられる。この場合、 2つ目の分岐命令は、 1つ目の分岐命令（内側の小さなループを形成する分岐命令）が N—Tkとなったときに実行されることになる。したがって、このような場合には、グロ一ノレヒストリ 140力、分岐するとの予測 (登録する旨の指示）が送出される。このような場合、それぞれの分岐命令を登録するウェイを用意する必要がある。以下、バリッドフラグの状態を場合分けして説明する。

(a)無効なウェイが 2つ以上存在する場合

無効なウェイが存在する場合には、無効なウェイを優先して使用する。分岐予測装置 100は、無効なウェイのうち、ウェイ番号の若い方から 2つウェイを取得する。すなわち、無効なウェイが存在する場合のリプレースラグの操作論理（図 6)にしたがって、 2回分のウェイの取得操作を行った結果、更新されたリプレースフラグを 2つ送出する

[0106] 例えば、読み出したリプレースフラグが（wayO、 wayl、 way2、 way3) = (0, 0, 0, 1)だったとする。また、無効なウェイが wayO, wayl, way3であったとする。

[0107] このとき、 1つ目の分岐命令を登録すべき候補のウェイ (第一候補）は、例えば、番号の若い順に選択すると、 wayOとなる。また、 2つ目の分岐命令を登録すべき候補のウェイ (第二候補）は、 waylとなる。リプレースフラグの反転の有無は、図 6の操作表にしたがう。

[0108] 例えば、読み出したリプレースフラグが（0, 0, 0, 1)であって、無効なウェイである w ayOを使用した場合には、図 6より、リプレースフラグの反転が必要となる。このため、第一候補として，登録用ウェイ番号 wayOおよび、リプレースフラグ 1 (0の反転)を命令フェッチ制御ユニット 123に送出する。

[0109] このとき、分岐予測装置 100は、ー且、 wayoのリプレースフラグは 1になったと仮定し、さらに次のウェイの選択を続行する。すなわち、リプレースフラグは、（wayO, way 1, way2, way3) = (1, 0, 0, 1)と仮定される。分岐予測装置 100は、この仮定に基づいて第二候補の反転の有無を決定する。すなわち、リプレースフラグが（1, 0, 0, 1 )であって、無効なウェイである waylを使用した場合、図 6より、リプレースフラグの反転は必要ない。

[0110] そこで、分岐予測装置 100は、第二候補として、登録用ウェイ番号 waylおよび、リプレースフラグ 0を送出する。すなわち、以上の処理によって分岐予測装置 100は、第一候補: wayO, リプレースフラグ = 1 ;

第二候補: way 1, リプレースフラグ =0 :

を決定し、命令フェッチ制御ユニット 123に送出する。

[0111] すると、命令フツチ制御ユニット 123は、命令バッファ 125を参照し、分岐命令が存在する場合に、第一候補、第二候補の順に、ウェイ番号およびリプレースフラグを分岐命令に付与する。

(b)無効なウェイが 1つだけ存在する場合

この場合、分岐予測装置 100は、無効なウェイを第一候補として決定する。次に、分岐予測装置 100は、無効なウェイが存在する場合のリプレースフラグ操作表（図 6) にしたがって、操作を行った後のリプレースフラグの組合せを仮定する。そして、分岐予測装置 100は、仮定されたリプレースフラグの組合せから、第二候補を決定する。

[0112] 例えば、読み出したリプレースフラグが（wayO, wayl, way2、 way3) = (0, 0, 0,

1)だったとする。また、無効なゥイが wayOであったとする。

[0113] このとき、 1つ目の分岐命令用のウェイ (第一候補）は wayOとなる。リプレースフラグの操作 (仮定）は、操作表にしたがう。リプレースフラグが（0, 0, 0, 1)のときは、 way

0を使用した場合、リプレースフラグの反転が必要となる（図 6参照)。そこで、分岐予測装置 100は、第一候補として、登録用ウェイ番号 wayOおよび，リプレースフラグ 1 (

0の反転)を送出する。

[0114] このとき、分岐予測装置 100は、ー且、 wayOのリプレースフラグは 1になったと仮定し、リプレースフラグは（wayO, wayl, way2, way3) = (1, 0, 0, 1)となる。

[0115] 分岐予測装置 100は、この仮定に基づいて第二候補を決定する。本例では、 1つの無効なウェイを使用すれば、残りのウェイはすべて有効なウェイである。この場合には、分岐予測装置 100は、リプレースフラグによるウェイの決定表（図 5参照）から、置換対象のウェイとして way2を選択し、これを第二候補とする。この場合には、分岐予測装置 100は、選択した way2のリプレースフラグを反転して送出する（バリッドフラグは有効であるので、図 6の論理にしたがうことなぐリプレースフラグが無条件に反転される)。すなわち、以上の処理によって分岐予測装置 100は、第一候補: wayO, リプレースフラグ = 1 ;

第二候補: way2, リプレースフラグ = 1 ;

を決定し、命令フェッチ制御ユニット 123に送出する。

(c)無効なウェイがない場合

この場合、分岐予測装置 100は、リプレースフラグによるウェイの決定表（図 5)から、候補を選択する。例えば、読み出したリプレースフラグが (wayO, wayl, way2, w ay3) = (0, 0, 0, 1)だったとする。

[0116] 分岐予測装置 100は、リプレースフラグによるウェイの決定表（図 5)から、置換対象のウェイとして way3を選択し、これを第一候補とする。 way3のリプレースフラグは、無条件に反転して送出されるので、その後のリプレースフラグの状態は、（wayO, wa yl, way2, way3) = (0、 0、 0、 0)となると仮定される。

[0117] 分岐予測装置 100は、この仮定されたリプレースフラグに基づいて第二候補を決定する。すなわち、分岐予測装置 100は、図 5の表カゝら置換対象のウェイとして wayOを選択し、第二候補とする。このとき、 wayOのリプレースフラグは無条件に反転して送出される。すなわち、以上の処理によって分岐予測装置 100は、

第一候補: way3、リプレースフラグ =0

第二候補: wayO、リプレースフラグ = 1

を決定し、命令フェッチ制御ユニット 123に送出する。

[0118] 以上のように、分岐履歴記憶装置 130の読み出し時点で、分岐予測装置 100は、 2 つの候補ウェイ (第一候補、第二候補)を決定し、命令フツチ制御ユニット 123に送出する。

[0119] 命令フェッチ制御ユニット 123は、フェッチされた順に分岐命令に第一候補、および第二候補の情報 (ウェイ番号およびリプレースフラグ)を付与する。これらの情報は、命令に付加された状態で、分岐リザべーシヨンユニット 126に保持される。そして、分岐命令の実行結果とともに、第一候補の情報が付加された分岐命令または第二候補の情報が付加された分岐命令が分岐予測装置 100に戻される。

[0120] このとき、グローバルヒストリ 140からは、次に分岐が予測された分岐か否かの指示が分岐予測装置 100に通知される。分岐予測装置 100は、グローバルヒストリ 140の予測にしたがって、分岐命令に付与された番号のウェイに分岐命令を登録する。

[0121] <処理フロー >

図 13から図 18の図面により、分岐予測装置 100の処理を説明する。図 13から図 1 7は、分岐予測装置 100で実行される分岐履歴検索処理を示している。一方、図 18 は、一旦分岐予測装置 100から、分岐予測結果と、ウェイの情報が命令フェッチ制御ユニット 123に送出され、分岐命令のデコードおよび実行後に分岐リザべーシヨンュニット 126から、分岐命令（ウェイの情報が付加された分岐命令）が戻された後の処理を示している。

[0122] これらの処理は、基本的には、図 5および図 6に示された論理にしたがって、高々 2 個のウェイを選択する処理である。したがって、図 5および図 6の論理を実現する論理回路を 2回駆動させる制御回路 (論理ゲートの組合せ）により、以下の処理が実現される。

[0123] 図 13のように、分岐予測装置 100は、命令フツチ制御ユニット 123からの分岐予測指示にしたカ^、、命令アドレスを基に、分岐履歴記憶装置 130のセットを決定する。そして、決定されたセットを構成するウェイに対応するエントリからタグを読み出す（ Sl)。

[0124] 次に、分岐予測装置 100は、分岐命令がいずれかのウェイでヒットした力否かを判定する（S2)。すなわち、分岐予測装置 100は、ヒットタグの内容が、タグを構成すベき命令アドレスの一部、例えば、命令アドレスく 31 : 16 >と一致した場合には、ヒットしたと判定する。

[0125] ヒットした場合には、分岐先アドレスを命令フェッチ制御ユニット 123に送出する。さらに、分岐予測装置 100は、現在のノリツドフラグおよびリプレースフラグの設定にしたカ^、ウェイを選択する（S4)。

[0126] すなわち、無効なウェイがあった場合には、そのウェイを優先して選択する。その際に、図 6の表にしたがって、リプレースフラグの反転の有無を決定する。また、無効なウェイがない場合には、現在のリプレースフラグの設定を元に、図 5の表にしたがって、ウェイを選択する。すでに、第 1実施形態で説明したにょうに、リプレースフラグから図 5の選択および図 6の反転の有無を決定する処理は、論理ゲートの組合せによつて実現できる。

[0127] そして、分岐予測装置 100は、ウェイ (ヒットしたウェイと S3で選択されたウェイ、または、 S4で選択された 2つのウェイ)の情報を命令フェッチ制御ユニット 123に送出する (S5)。

[0128] 一方、 S2の判定で、分岐命令がいずれのウェイにおいても、ヒットしなかった場合、分岐予測装置 100は、リプレースフラグにしたがって 2つのウェイを選択する（S4)。そして、分岐予測装置 100は、選択された 2つのウェイの情報を命令フェッチ制御ュニット 123に送出する（S6)。

[0129] 図 14に、分岐予測装置 100がリプレースフラグにしたがって 2つのウェイを選択する処理（図 13の S5、 2ウェイ選択処理という）の詳細を示す。この処理では、分岐予測装置 100は、まず、無効なウェイが 2つ存在するか否かを判定する（S51)。該当するセットに 2つ以上の無効なウェイが存在する場合には、分岐予測装置 100は、 2つの無効ウェイ選択処理を実行する（S52)。

[0130] また、無効なウェイが 2つ存在しない場合、分岐予測装置 100は、まず、無効なゥェィが 1つ存在するか否かを判定する（S53)。該当するセットに 1つの無効なウェイが存在する場合には、分岐予測装置 100は、無効ウェイと有効ウェイ選択処理を実行する（S54)。

[0131] また、該当するセットに無効なウェイが存在しない場合には、分岐予測装置 100は、有効な 2つのウェイ選択処理を実行する（S55)。

[0132] 図 15に、 2つの無効ウェイ選択処理（図 14の S52)の詳細を示す。この処理では、分岐予測装置 100は、ウェイのバリッドフラグを参照し、第 1の無効ウェイを選択する（ S521)。どの無効なウェイを選択するかについて特に制限はない。例えば、ウェイの番号の若、順に選択してもよ、。

[0133] 次に、分岐予測装置 100は、図 6の表の論理にしたがって、リプレースフラグの反転の有無を仮決定する（S522)。さらに、分岐予測装置 100は、ウェイのバリッドフラグを参照し、第二の無効ウェイを選択する（S523)。そして、 S522で仮決定されたリブレースフラグの状態と、図 6の表の論理にしたがって、さらに、リプレースフラグの反転の有無を仮決定する（S524)。なお、これらのウェイの情報 (番号とリプレースフラグ）は、図 6の S6の処理で送出される。反転の有無が仮決定されたリプレースフラグは、分岐命令の実行後、分岐履歴の格納において、反転が確定する。

[0134] 図 16に、無効ウェイと有効ウェイ選択処理（図 14の S54)の詳細を示す。この処理では、分岐予測装置 100は、ウェイのノリツドフラグを参照し、無効ウェイを選択する（ S541)。

[0135] 次に、分岐予測装置 100は、図 6の表の論理にしたがって、リプレースフラグの反転の有無を仮決定する（S 542)。次に、分岐予測装置 100は、仮決定されたウェイの状態にしたがって、有効なウェイを 1つ選択する（S543)。そして、選択されたウェイのリプレースフラグを仮に反転する（S524)。なお、仮に反転されたリプレースフラグは、分岐命令の実行後、分岐履歴の格納において、反転が確定する。

[0136] 図 17に、有効な 2つウェイ選択処理（図 14の S55)の詳細を示す。この処理では、分岐予測装置 100は、現在のリプレースフラグを参照し、第一のウェイを選択する（S 551)。

[0137] 次に、分岐予測装置 100は、選択された第一のウェイのリプレースフラグを仮に反転する（S552)。次に、分岐予測装置 100は、仮反転されたウェイの状態にしたがつて、有効な第二のウェイを 1つ選択する（S553)。そして、選択された第二のウェイのリプレースフラグを仮に反転する（S554)。

[0138] 図 18に、分岐命令格納処理のフローチャートを示す。この処理では、分岐予測装置 100は、実行が完了した分岐命令またはフェッチされて分岐しなカゝつた分岐命令と、その分岐命令に付加されているウェイの情報（ウェイの番号、仮決定された反転の有無）を分岐リザべーシヨンステーション 126から取得する（S 11)。

[0139] 次に、分岐予測装置 100は、グローバルヒストリ 140から、その分岐命令が次に分岐するか否かの情報（グローバルヒストリ 140の予測）を取得する（S 12)。なお、グロ一バルヒストリ 140による予測そのものは、本実施形態の処理と直接関係がないので、その説明を省略する。

[0140] そして、分岐予測装置 100は、その分岐命令が次に分岐すると予測されているか否かを判定する（S 13)。そのウェイのノリツドフラグをクリアし、無効なウェイとする（S 14)。 S13の判定で、次に分岐すると判定された場合、分岐予測装置 100は、分岐履歴 (分岐先アドレス)をその分岐命令に付加されている情報で指定されたウェイに格納する（S15)。このとき、その命令アドレスの一部がタグとしてエントリに格納される

[0141] 次に、分岐予測装置 100は、分岐命令に付加されている情報にしたがってリプレースフラグを設定する（S 16)。この時点で、仮設定されたリプレースフラグの内容が確定すること〖こなる。

[0142] 以上述べたように、本実施形態の分岐処理装置 100によれば、 1回のフェッチにお V、て複数命令をフェッチするような装置にぉ、ても、 LRUに近、効率でリプレースフラグを管理することができる。すなわち、 LRUほど最適の選択はできないが、図 5および図 6の表にしたがって、書き換えたウェイを可能な限り後の時点 (第 1実施形態の場合と同様、最悪でも 4つのウェイに対して最後に書き換えられたウェイが 3回目のァクセスで書き換えられる場合がある）で書き換えるにょうにウェイの書き換えを制御できる。

[0143] 《変形例》

上記第 2実施形態では、 1回のフェッチで 2つ以上の分岐命令が存在することがあり得る処理装置において、図 5および図 6のテーブルにしたがって、書き換えるべきゥェィを選択する処理を示した。この処理では、 2つ分岐命令の分岐先アドレスを格納するウェイとして、まず、 1つのウェイを選択し、その後、仮にリプレースフラグを設定した上で、第 2番目のウェイを決定した。

[0144] しかし、このような複雑な処理を実行する代わりに、以下のような処理を行ってもよ!ヽ

[0145] 例えば、ヒットしたウェイの番号を元にウェイ番号を生成してウェイを選択するようにしてちよい。

[0146] 例えば、 4つのウェイ番号を示す 2ビットの信号を way<l: 0>とすれば、 "00"、 "01 "、 "10"、 "11"のビットパターンが存在する。例えば、ヒットしたウェイが存在する場合には、一方のビット wayく 1>を反転するという処理を構成すればよい。この場合、ヒットしたウェイが" 00"であれば、上位ビットを反転し" 10"を生成してウェイを選択すればよい。このようなビットの操作は、ハードウェア (論理ゲート)で簡易に実現できる。 [0147] また、これは例えば、上記第 1実施形態および第 2実施形態で用いたバリッドフラグを優先してもよい。すなわち、ヒットしたウェイが存在する場合で、 2つ目のウェイを選択する場合（図 13の S4)、まず、バリッドフラグ力も無効なウェイが存在する力否かを判定するようにしてもよい。そして、無効なウェイが存在する場合には、その無効なゥエイを 2つ目のウェイとして、選択するようにし、無効なウェイが存在しない場合には、上記のようなビットの反転によってヒットしたウェイ以外のウェイを選択するようにしてもよい。このような制御にすることで、無効なウェイを有効に利用するとともに、ヒットしたウェイの上書きを極力低減することができる。

[0148] また、ヒットしな力つた場合には、リプレースフラグで決定されるウェイを通常通り一つの候補とし、そのウェイの番号を元にして、前述のヒットしたウェイ番号がある場合と同様の処理を行ってもよい。つまり、リプレーフラグで決定された 4つのウェイ番号を示す 2ビットの信号を wayく 1: 0>とすれば、 "00"、 "01"、 "10"、 "11"のビットパターンが存在する。ここから、一方のビット wayく 1>を反転するという処理などでもう一つのウェイ番号を構成すればよい。例えば、元のリプレースフラグによる一つ目の分岐命令のためのウェイが" 00"であれば、上位ビットを反転し" 10"を生成して二つ目の分岐命令のためのウェイとすればょ、。

[0149] 図 19に、このような変形例に係る分岐履歴検索処理のフローチャートを示す。図 19 の処理で、図 13と同様の処理については、図 13と同一の符号を付している。

[0150] すなわち、図 19のように、分岐予測がヒットした場合には、分岐予測装置 100は、ヒットしたウェイの情報を基に、ヒットしたウェイ以外のウェイを

つ選択する（S4A)。

[0151] 一方、ヒットしな力つた場合には、分岐予測装置 100は、 2ウェイ選択処理を実行する（S5A)。この場合の 2ウェイ選択処理は、図 14と同様の処理でもよい。また、 2ゥェィ選択処理として、上述のように、ノリツドフラグとリプレースフラグとで決定されるゥェィを通常通り一つの候補とし、そのウェイの番号を元にして、前述のヒットしたウェイ番号がある場合と同様のビット反転処理を行って 2つ目の候補としてもよい。

Claims

請求の範囲

[1] 少なくとも命令の記憶元から命令を取得する取得段階と前記命令を実行する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で複数命令を取得する取得部と、

前記コンピュータによって次の実行段階で実行される命令が分岐命令である力否かを過去に実行された命令の履歴情報にしたがって予測する分岐命令予測部と、前記取得された命令の少なくとも 1つを前記実行段階で実行する実行部と、を備え前記分岐命令予測部は、

前記実行された命令または前記取得された命令に含まれる分岐命令の分岐先ァドレスを、前記命令の記憶元を参照するための命令アドレス力決定される複数の格納先のいずれかに前記履歴情報として記憶する履歴記憶部と、

実行された分岐命令の分岐先アドレスまたは前記取得段階で取得された分岐命令の分岐先アドレスを前記履歴情報として記憶すべき場合に、前記複数の格納先のいずれかを選択するための選択情報を参照して格納先を選択する選択部と、

選択された格納先に前記分岐先アドレスを記憶する記憶制御部と、前記格納先への記憶に対応して前記選択情報を更新する更新部と、を有し、前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合に、第 1の分岐先アドレスを前記格納先に記憶したときに前記更新手段によって更新された後の前記選択情報にしたがって第 2の分岐先アドレスの格納先を選択するコンピュータの分岐予測装置。

[2] 前記選択情報は、前記命令アドレスよって決定される前記複数の格納先への書き込み順を指定する、複数の格納先のそれぞれに対して 1ビットの書き込み順情報を含み、

前記選択部は、前記書き込み順情報にしたがって前記分岐先アドレスの格納先を選択する請求項 1に記載のコンピュータの分岐予測装置。

[3] 前記履歴記憶部は、前記命令の取得段階において取得中の命令アドレスにしたがつて前記複数の格納先力その命令が分岐命令であった場合の分岐先アドレスを検索し、前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先から検索されたものである場合に、その格納先を第 1の格納先とするとともに、前記選択情報にしたがって第 2の格納先を選択する請求項 1または 2に記載のコンピュータの分岐予測装置。

[4] 前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先から検索されたものでない場合に、前記選択情報にしたがって第 1の格納先を選択するとともに、前記選択情報を更新し、前記更新された選択情報にしたがって第 2の格納先を選択する請求項 1または 2に記載のコンピュータの分岐予測装置。

[5] 前記選択情報は、前記複数の格納先ごとにその格納内容が有効か無効かを示すフラグ情報を有し、

前記選択部は、前記フラグ情報によって格納内容が無効であると示されて、る格納先を優先して選択する請求項 1から 4のいずれかに記載のコンピュータの分岐予測装置。

[6] 少なくとも命令の記憶元から命令を取得する取得段階と前記命令を実行する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で複数命令を取得する取得部と、

実行された分岐命令の分岐先アドレスまたは前記取得段階で取得された分岐命令の分岐先アドレスを前記履歴情報として記憶すべき場合に、前記複数の格納先のいずれかを選択するための選択情報を参照して格納先を選択する選択部と、選択された格納先に前記分岐先アドレスを記憶する記憶制御部と、前記格納先への記憶に対応して前記選択情報を更新する更新部と、を有し、前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先から検索されたものである場合に、その格納先を第 1の格納先とするとともに、前記第 1の格納先を元に生成した前記第 1の格納先以外の第 2の格納先を選択するコンビユータの分岐予測装置。

[7] 前記選択情報は、前記複数の格納先ごとにその格納内容が有効か無効かを示すフラグ情報を有し、

前記選択部は、前記フラグ情報によって格納内容が無効であると示されて、る格納先を優先して選択する請求項 6に記載のコンピュータの分岐予測装置。

[8] 少なくとも命令の記憶元から命令を取得する取得段階と前記命令を実行する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で複数命令を取得する取得部と、

選択された格納先に前記分岐先アドレスを記憶する記憶制御部と、前記格納先への記憶に対応して前記選択情報を更新する更新部と、を有し、前記選択部は、前記格納先に格納すべき分岐アドレスが複数ある場合で、かつ、第 1の分岐先アドレスが前記履歴記憶部によって前記いずれかの格納先から検索されたものでない場合に、前記選択情報にしたがって第 1の格納先を選択するとともに、前記第 1の格納先を元に生成した前記第 1の格納先以外の第 2の格納先を選択するコンピュータの分岐予測装置。