WO2007099605A1

WO2007099605A1 - 圧縮したアドレス情報により分岐予測する処理装置

Info

Publication number: WO2007099605A1
Application number: PCT/JP2006/303770
Authority: WO
Inventors: Megumi Yokoi; Masaki Ukai; Takashi Suzuki
Original assignee: Fujitsu Limited
Priority date: 2006-02-28
Filing date: 2006-02-28
Publication date: 2007-09-07
Also published as: EP1990714A1; JP5136405B2; DE602006013515D1; US20080313446A1; JPWO2007099605A1; US7949862B2; EP1990714A4; EP1990714B1

Abstract

取得段階で命令を取得する取得部と、取得部が取得する命令の記憶元である命令アドレスを決定するアドレス制御部と、次の命令実行段階で処理される命令が分岐命令であるか否かを過去に処理された命令の履歴情報にしたがって予測する分岐命令予測部と、取得された命令の少なくとも１つを実行段階で実行する実行部と、を備え、アドレス制御部は、命令アドレスに含まれる所定の上位ビット部分と下位ビット部分のうち、上位ビット部分を圧縮した上位アドレス情報を生成する符号化部と、上位アドレス情報から上位ビット部分を復元する復元部とを有し、分岐命令予測部は、処理された分岐命令の分岐先アドレスに対応する上位アドレス情報と下位ビット部分とを、分岐命令の記憶元の命令アドレスに対応する上位アドレス情報と下位ビット部分から決定される複数の格納先のいずれかに履歴情報として記憶する履歴記憶部を有する処理装置である。

Description

明細書

圧縮したアドレス情報により分岐予測する処理装置

技術分野

[0001] 本発明は、情報処理装置、特に命令処理装置に関する。

背景技術

[0002] 情報処理装置の分岐予測機構は、過去に実行された命令のメモリ上での記憶アドレス（以下、命令アドレスと、う）を基に分岐命令の実行履歴を管理することによって、次に分岐命令が実行される場合の分岐先を予測していた (例えば、下記特許文献 1 参照)。

[0003] その場合、分岐予測機構は、過去に記憶元から命令を取得 (命令をフェッチすると V、う）された分岐命令の命令アドレス (分岐元アドレス）の一部のビット部分力もセットァソァシァティブ方式の記憶装置のセットを決定する。そして、分岐予測機構は、分岐元アドレスのさらに他のビット部分をタグにして、当該セット内の 1つのウェイに分岐先アドレスを記憶しておく。

[0004] そして、分岐予測機構は、命令のフェッチ段階で命令アドレスを利用して、上記記憶装置を検索する。そして、過去に実行済みの分岐命令で、その分岐先アドレスが記憶装置に記憶されている場合には、分岐予測機構は、該当するセット内のタグの内容が一致するウェイ力も分岐先アドレスを入手できる。すなわち、命令のフェッチと並行して、その命令が分岐命令である力否か (分岐元の命令アドレスの部分をタグにして分岐先アドレスが記憶されて、る力否力 )を判定することができた。

[0005] すなわち、この技術では、情報処理装置は、現在のフェッチ中の命令のアドレスを取得することにより、命令のフェッチと並行して、その命令が分岐命令である力否かを判定し、命令が分岐命令であった場合に予測される分岐先アドレスを入手できる。したがって、情報処理装置がパイプライン処理を行っている場合であっても、現在の命令フツチと並行して、事前に予測される分岐先力次のステージでの命令フツチを準備することができる。

[0006] そして、現在フツチ中の命令力得られた分岐先が予測された分岐先であった場合には、ノィプライン処理を止めることなく各ステージを並列動作できる。一方、現在フェッチ中の命令力も得られた分岐先が予測された分岐先でな力つた場合には、正しい分岐先力命令フェッチを再開することになる。現在フェッチ中の分岐命令の命令アドレスに対応して上記記憶手段に分岐先が記憶されていな力つた場合 (分岐予測がヒットしな力たが分岐命令が実行された場合)も、分岐予測を利用できず、フエツチ後の分岐命令をデコードして得られた分岐先アドレスから命令フェッチを再開することになる。

[0007] ところで、従来、情報処理装置において、命令が格納される空間は、 32ビットァドレス空間であった。し力し、処理されるデータ量の増加に対応して、アドレス空間を 64 ビットに拡張したものも存在する。そのような情報処理装置では、データ空間のみならず命令空間も 64ビット化された。

[0008] しかし、実際のプログラムのサイズは 4GBよりもかなり小さく（最も大き、プログラムでも数百 MB程度である）、 64ビット分の完全なアドレスすべてを投機的な実行処理部に記憶または処理させるのは、ハードウェア資源の無駄といえる。

[0009] したがって命令セットアーキテクチャで定義されたやむを得な、部分だけを 64ビット化することが効率的である。そこで、分岐予測により投機的に命令フツチを制御する制御部などは極力下位 32ビットのアドレスだけを用いて、従来と同様の命令フェツチ等の制御を行ってきた。

[0010] 具体的な方法としては、予め上位 32ビットのアドレスを固定しておき、その固定された上位 32ビットと下位 32ビットの 4Gバイト空間とを用いて命令フェッチを行う。そして、 4Gバイト空間を越えれば、上位 32ビットを再定義する、というものが考えられる。

[0011] つまり、プログラムカウンタの上位 32ビットは通常固定しておく。そして、上位 32ビットを変更するような、分岐命令や例外、割り込みなどでプログラムカウンタの上位 32ビットを変える事象が発生したときには、上位 32ビットを改めて求める。この場合、その上位 32ビットを変更しょうとする命令 (事象）の完了をもって投機処理中の命令フヱッチ Z命令実行パイプラインをー且完全にクリアすることになる。

[0012] そのため、プログラムカウンタの上位 32ビットを新しい値に書き換えたのちに、その新しいアドレスでもって命令フェッチより再開する。すなわち、上位 32ビットが変更される事象があるときには投機実行の恩恵を全く受けることができなヽ。これでもプログラムサイズが小さい以上問題はないはずであった。ところが、実際の OSは、割り付けるべきプログラムサイズが小さ、場合でも、 64ビットの命令アドレスの上位 32ビットを複数個所利用する制御をするようになった。

[0013] この場合には、 64ビットの仮想メモリ空間に、プログラムが散在することもありえないことではない。そうすると、個々のプログラムが小さい場合でも、分岐命令によって 32 ビットの 4Gバイトアドレスを越える分岐が頻繁に発生することもありえる。

特許文献 1：特開 2004— 38398号公報

発明の開示

発明が解決しょうとする課題

[0014] 従来の方法では、 32ビットの 4Gバイトアドレスを越える度に、上位 32ビットを再定義するまでの期間は投機命令フェッチを失敗するということになる。例えば、 4Gバイトを越えた分岐命令があつたとして、たとえ下位 32ビットが正しく分岐予測機構により予測されたとしても、上位 32ビットは古いままであるために、予測を誤ることになる。

[0015] 投機命令フェッチを失敗すると!/、うことは、結果として一切の投機実行が失敗するということであり、その損失は計り知れない。これを改善し、より高い性能を求めるためには、すべてにおいて 64ビットアドレスを完全に使用して分岐予測等を行うことが考えられる。しかし、前述の通り、コストやクロックサイクルを考慮すると、これは現実解ではない。本発明の目的は、このような従来の問題点を解決することにある。

課題を解決するための手段

[0016] 本発明は前記課題を解決するために、以下の手段を採用した。すなわち、本発明は、少なくとも命令の記憶元から命令を取得する取得段階と前記命令を処理する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で命令を取得する取得部と、前記取得部が取得する命令の記憶元である命令アドレスを決定するアドレス制御部と、前記コンピュータによって次の命令実行段階で処理される命令が分岐命令であるか否かを過去に処理された命令の履歴情報にしたがつて予測する分岐命令予測部と、前記取得された命令の少なくとも 1つを前記実行段階で処理する実行部と、を備え、前記アドレス制御部は、前記命令アドレスに含まれる所定の上位ビット部分と下位ビット部分のうち、前記上位ビット部分を圧縮した上位アドレス情報を生成する符号ィ匕部と、前記上位アドレス情報力上位ビット部分を復元する復元部とを有し、前記分岐命令予測部は、前記処理された分岐命令の分岐先アドレスに対応する上位アドレス情報と下位ビット部分とを、前記分岐命令の記憶元の命令アドレスに対応する上位アドレス情報と下位ビット部分力決定される複数の格納先のいずれかに前記履歴情報として記憶する履歴記憶部を有する処理装置である。

[0017] 本発明によれば、処理された分岐命令の分岐先アドレスに対応する上位アドレス情報と下位ビット部分と力分岐命令の記憶元の命令アドレスに対応する上位アドレス情報と下位ビット部分力決定される複数の格納先のいずれかに履歴情報として記憶される。この場合、上位アドレス情報は、上位ビット部分を圧縮した情報である。したがって、命令アドレス長が拡張され、アドレス空間が増加した場合であっても、圧縮された上位アドレス情報と下位ビット部分によって効率的に分岐先アドレスに対応する情報を管理できる。なお、ここで、命令を処理するとは、命令にしたがった所定の処理を実行することをいい、例えば、条件付き分岐命令の場合には、条件の判定と判定結果に基づく分岐先への分岐または分岐しない処理を含む。

[0018] 前記符号化部は、前記上位ビット部分を複数のアドレス範囲ごとに区分し、区分された第 1のアドレス範囲を識別する第 1の上位アドレス情報と前記第 1のアドレス範囲以外のアドレス範囲を識別する第 2の上位アドレス情報とを生成し、前記アドレス制御部は、前記分岐命令の分岐先アドレスが、前記第 1の上位アドレス情報で識別される前記第 1のアドレス範囲に分岐する分岐命令である場合に、前記復元部を通じて前記第 1のアドレス範囲に対応する上位ビット部分を生成し、前記分岐命令が前記第 2 の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合に前記分岐命令の種類に応じて上位ビット部分を復元するようにしてもょ、。

[0019] 本発明によれば、上位ビット部分が複数のアドレス範囲ごとに区分されている。そして、分岐先アドレスが第 1の上位アドレス情報で識別される前記第 1のアドレス範囲である場合には、その第 1のアドレス範囲に対応する上位ビット部分が生成される。一方、分岐先アドレスが前記第 2の上位アドレス情報で識別されるアドレス範囲である場合には、分岐命令の種類に応じて上位ビット部分が復元される。このため、例えば

、特定のアドレス範囲への分岐命令が頻発する場合には、そのアドレス範囲を第 1の上位アドレス情報で識別するように構成することで、効果的に、そのアドレス範囲に対応する上位ビット部分を生成することができる。

[0020] 前記アドレス制御部は、前記分岐命令が前記第 2の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合に、分岐命令の種類を識別する信号を前記実行部から受信する分岐種別情報受信部と、前記分岐命令が前記下位ビット部分の範囲を限界として分岐元アドレス力相対分岐する相対分岐命令である場合に、前記実行部における前記分岐命令の処理にぉ、て前記下位ビット部分の範囲力も正方向または負方向に桁あふれが発生したことを示す桁あふれ情報を受信する桁あふれ情報受信部と、前記桁あふれが発生した場合に、分岐元アドレスの上位ビット部分への加減算によって分岐先アドレスの上位ビット部分を取得する算術部とを有するちのでちょい。

[0021] 本発明によれば、分岐命令が前記第 2の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合で、かつ、分岐命令が前記下位ビット部分の範囲を限界として分岐元アドレス力相対分岐する相対分岐命令である場合に、分岐元アドレスの上位ビット部分への加減算によって分岐先アドレスの上位ビット部分を取得することができる。すなわち、下位ビット部分の範囲から正方向または負方向への桁あふれを検知し、その桁あふれ分を上位ビット部分に加減算すればよ!、。

[0022] 前記アドレス制御部は、分岐種別情報受信部が前記相対分岐命令でな!、場合に、分岐命令の分岐先を算出した演算部力分岐先アドレスの上位ビット部分を取得する上位ビット取得部を有するものでもよ!/、。

[0023] 本発明によれば、分岐命令が前記第 2の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合で、分岐命令が上記の相対分岐命令でな、場合には、もはやあふれ分を上位ビット部分への加減算によっては上位ビット部分を取得できない。この場合には、分岐先を算出した演算部から分岐先アドレスの上位ビット部分を取得することができる。

発明の効果 [0024] アドレス空間が拡張された場合に、その拡張されたアドレス空間で使用される上位ビットに偏りがある場合には、効率的に分岐予測を実現できる。

図面の簡単な説明

[0025] [図 1]64ビットのアドレス空間に割り付けられるプロセスのイメージを示す図である。

[図 2]上位 32ビット定義コードの定義を示す図である。

[図 3]本発明の実施形態に係る処理装置のシステム構成図である。

[図 4]分岐履歴記憶装置のセットを構成する各ウェイの構成を説明するための図である。

[図 5]処理装置の詳細構成を示す図である。

[図 6]上位ビットデコーダの回路構成を示す図である。

[図 7]上位ビットエンコーダの構成を示す図である。

[図 8]上位ビットエンコーダの処理シーケンスを示す図である。

[図 9]上位ビットデコーダの処理シーケンスを示す図である。

[図 10]分岐先復元処理を示す図である。

[図 11]PC相対分岐命令の分岐先復元処理を示す図である。

符号の説明

[0026] 100 分岐予測装置

122A プログラムカウンタ制御装置

123 命令フェッチ制御ユニット

126 分岐リザべーシヨンステーション

130 分岐履歴記憶装置

150Aゝ 150B 上位ビットデコーダ

153A、 15B 上位ビットエンコーダ

167 演算器

168 相対アドレス演算器

発明を実施するための最良の形態

[0027] 以下、図面を参照して本発明を実施するための最良の形態 (以下、実施形態という )に係る処理装置について説明する。以下の実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。

[0028] 《発明の骨子》

64ビットアドレス空間は、データ空間の 64ビット拡張の都合に合わせて行われたものであるため、現状では空間内で実際に命令列が配置されるアドレスには偏りがある。そこで、これらの偏りを利用して、上位 32ビットを擬似的に少数のビットで表現する。つまり、頻出の上位アドレスを見込んでおき、少数ビットを用いたコードで頻出する上位アドレスを表現する。

[0029] その少数ビットを下位 32ビットに加えてアドレスとして取り扱!/、、分岐予測などを行うようにすれば、従来の装置に少しの拡張を加えるだけで、プログラムの 64ビットァドレス空間への割り付け（以下、このような OSによるプロセスのアドレス空間への割り付けを 64ビットアドレスモードという）に対応することができるようになる。すなわち、例えば、 OSが 64ビットのアドレス空間を利用する制御を行ったとしても、参照されるアドレスの偏りを利用し、効率的な分岐予測ができる。

[0030] 頻出の上位アドレスは、 OSの仕様力も予測して固定的に決定してもよいし、またァドレスの頻度カウンタなどを設けて動的に設定することも考えられる。

[0031] 近年の OSでは、図 1のような 64ビットアドレス空間が定義されている（例えば、参考文献「solarisインターナルカーネル構造のすべて」（ピアソン 'エデュケーション） p. 13 8参照)。

[0032] 図 1は、 64ビットのアドレス空間に割り付けられるプロセスのイメージを示す図である。図 1で、斜線部分は、いずれのプロセスも使用できないアドレスの領域を示している。図 1のように、一般的な OSの制御では、アドレス空間（仮想ドレレス空間）は、カーネルとユーザプロセスとで、別々に用意されている。

[0033] 例えば、 OSのアドレス空間は、カーネルモードのアドレス空間で、 0000000 : 000 00001から 0000000 :FFFFFFFFの範囲である（ここで、 0、 1、 F等は 16進数である。以下同様である。ここで、 32ビットごとに：（コロン)で区切って示している）。また、 0000001 : 00000000以降の領域は、ヒープ領域およびキャッシュ領域である。

[0034] また、ユーザの空間のうち、実行形式が格納されるテキストの空間は、 00000001： 0000000力ら開始する。また、 FFFFFFFF: 7FFFC000力ら FFFFFFFF: 7F7F 000までは、スタックの領域が設けられる。さらに、 FFFFFFFF: 7F7F000力ら、アドレスが小さくなる方向にラリブラリが格納される。

[0035] この図力以下のことが理解される。

(1) OSカーネルの領域は、上位 32ビッ卜力 0x00000000である。

(2)テキスト（実行形式のプログラム）の領域は、上位 32ビット力 OxOOOOOOOlである

(3)ライブラリが上位 32ビットが OxFFFFFFFF力も始まり、順番に下がっていく。

[0036] 一般的なアプリケーションで使用されるライブラリの数はせいぜい 10程度までであり

、かつライブラリ単体のサイズは小さ!/、のであるプログラムで使用されるライブラリをすベて合わせても普通は上位 32ビットの変化しない範囲で収まる。

[0037] よって、頻出する上位 32ビットのアドレスは、以下の 3種類であると考えられる。

[0038] 0x00000000 (16進数で、 0カ）

0x00000001 (16進数で、 0力 7個と 1力個）

0xFFFFFFFF (16進数で、 Fが 8個;）

そこで、上位の 32ビットアドレスに代えて、これら 3種類の上位アドレスと「それ以外の上位アドレス」とをそれぞれ識別するコードを導入する。分岐予測装置には、これまでの下位 32ビットアドレスとともに該コードを登録する。予測された分岐先アドレスの命令フェッチ時には該コード力も元の上位 32ビットアドレスを生成し、使用する。該コードが頻出する 3種類ではなく「それ以外の上位アドレス」であった場合は、上位ビットは不明だ力上位ビットを正しく計算するところ力もやり直せばよい。こうすることでこれまでは「4G越え =投機フェッチ失敗」であったのが、少なくとも上記 3種類の上位アドレスについては、従来の 32ビット範囲内と同じように投機フェッチ成功の可能性が出てくる。

[0039] ほとんどの命令が上記 3種類のアドレスに含まれること、かつ、それら 3つの領域の行き来はそれなりに多くそれ以外に行くことがほとんどないことを考えれば、 64ビットアドレスモードにおいて、性能は飛躍的に向上することが見込まれる。また、従来の 3 2ビットアプリケーションで性能が損なわれることもない。

[0040] 図 2に、コード（以下、上位 32ビット定義コードという）の定義を示す。図 2のように、上位 32ビッ卜アドレス力， 0x00000000，，の場合、上位 32ビッ卜定義コードを 00 (b) ( ビットデータであることを (b)で示す。以下、同様）とする。また、上位 32ビットアドレス力 ^，0x00000001"の場合、上位 32ビット定義コードを 01 (b)とする。また、上位 32ビットアドレスが" OxFFFFFFFF"の場合、上位 32ビット定義コードを 11 (b)とする。さらに、上位 32ビットアドレスが"上記以外の場合に、上位 32ビット定義コードを 10 (b) とする。

[0041] このようにして、本処理装置は、分岐予測処理を下位 32ビットアドレス + 2ビットの上位 32ビット定義コードで処理する。本処理装置では、 32ビットを越える分岐命令が発生しなければ、合計 34ビットの擬似的なアドレスで分岐予測を実行する。

[0042] さらに、上記上位 32ビット定義コードが 00 (b)、 01 (b)または 11 (b)の場合には、上位 32ビッ卜力 Sそれぞれ 0x00000000、 0x00000001および OxFFFFFFFFに固定されたものとなる。したがって、この場合の分岐予測は、従来の 32ビットの範囲での分岐予測の手法がそのまま適用され、、わば 34ビットアドレスでの分岐予測が実施される。

[0043] 一方、上位 32ビット定義コードが 10 (b)の場合には、分岐先が 32ビットアドレスの範囲を越え、かつ、上位 32ビットが上記 3種類のいずれでもないものであることを意味する。その場合には、上位 32ビットアドレスは、不明になる。そこで、分岐予測による上位 32ビット定義コードが 10となったときに現在の PCの上位 32ビットをそのまま使うと仮定した動作、つまり 32ビット予測そのものをする。

[0044] このようにして、本処理装置は、上記 3つの領域それぞれの範囲内（上位 32ビットァドレスが上位 32ビット定義コード 00 (b)、 01 (b) , 11 (b)によって規定されるアドレスの範囲）、および、上記 3つの領域相互間の分岐については、従来の 32ビットでの分岐予測手段を 34ビットアドレス（上位 32ビット定義コード +下位 32ビットアドレス）に変換して適用することができる。

[0045] 一方、上記 3つの領域を越える領域、すなわち、上位 32ビット定義コード 10 (b)で規定される上位 32ビットの範囲への分岐が発生した場合には、従来の技術を適用して上位 32ビットを正確に求め直す必要が発生する。

[0046] し力しながら、プログラム領域 (OS域、テキスト領域、およびライブラリ領域のそれぞれ）力 ¾2ビットアドレスの範囲（4GB)を越えて使用されることはまれであるので、大半の処理にぉ、て、 34ビットの範囲で分岐予測を実行できる。

[0047] 図 3は、本処理装置のシステム構成図である。本処理装置は、例えば、主記憶装置 121に格納された命令を読み出して実行する、いわゆるプログラム内蔵方式のコンビユータである。

[0048] 図 3のように、この処理装置は、命令を実行する演算ユニット 120と、演算ユニット 1 20で実行される命令および演算ユニット 120が処理するデータ等を格納する主記憶装置 121と、演算ユニット 120が実行すべき命令の主記憶装置 121上のアドレスを指定するプログラムカウンタ 122とを有している。このようなプログラムカウンタ 122の制御に基づく処理装置の制御は周知である。

[0049] 図 3では、さらに具体的に、プログラムカウンタ 122の生成するアドレスに基づいて命令のフツチを制御する命令フツチ制御ユニット 123と、命令キャッシュ 102を管理し命令フェッチ制御ユニット 123からの命令フェッチ要求にしたがって命令をフェツチする命令キャッシュ制御ユニット 124と、命令キャッシュ 102からフェッチされた命令を保持する命令バッファ 125と、命令バッファ 125の命令をデコードするデコーダ 10 3と、デコードされた命令の実行タイミングを制御するリザべーシヨンステーション (分岐命令の実行を制御する分岐リザべーシヨンステーション 126およびレジスタ演算命令、アドレス演算命令の実行を制御するその他リザべーシヨンステーション 127)と、命令の実行完了を監視する命令完了管理ユニット 128と、演算ユニット 120で実行される命令のオペランドを高速に演算ユニット 120に供給するオペランドキャッシュ 129 と、主記憶装置 121とオペランドキャッシュ 129との間でデータの授受を管理するデータキャッシュ制御ユニット 131とを有して!/、る。

[0050] このうち、分岐予測装置 100は、分岐命令の分岐履歴を記憶する分岐履歴記憶装置 130を有している（図 5参照）。分岐履歴記憶装置 130は、 4ウェイセットァソァシァティブ方式の記憶装置である。

[0051] 図 4は、分岐履歴記憶装置 130のセットを構成する各ウェイの構成を説明するための図である。分岐履歴記憶装置 130は、 SRAM等の比較的高速にアクセス可能な記憶装置である。 4ウェイの分岐履歴記憶装置 130は、 1つのセット内に 4つのウェイに対応するエントリを有する。図 4に示すように、各エントリは、タグ部 TGとデータ部 D Tを含む。タグ部 TGは、命令アドレス（の一部) TG1、ノリツドフラグ V、リプレースフラグ尺、および、その他のフラグ TG2からなる。データ部 DTは、所定データとしての分岐先アドレス DT1からなる。

[0052] 1つのセットは、アドレス生成ユニット 101から出力される命令アドレスの一部（例えばく 15 : 5 >)によって決定される。本実施形態では 4ウェイなので、セットの決定により 4つのエントリが指定されることになる。さらに、その 4つのエントリのうち、命令アドレスの他の一部によって 1つのエントリが決定される。

[0053] 本処理装置では、この 1つのエントリを決定するために、命令アドレス TG1には、上位 32ビット定義コードく 1 : 0>と命令アドレスの一部（例えばく 31： 16 >)が格納されている。例えば、登録時に、命令アドレスの一部く 15 : 5 >を使ってセットが決定され、残りの部分がセット内のいずれかのエントリ（4つのウェイに対応する 4つのェントリのいずれか）のタグ部 (命令アドレス TG1を含む）にデータとして格納されるようになつている。なお、命令アドレスく 31 : 16 >との記載は、命令アドレス TG1が命令アドレス (例えば 32ビット）の一部 31ビット目力 16ビット目であることを意味する。

[0054] したがって、本処理装置では、 1つのセット内の 4つのエントリを検索するときに使用するタグとして、上位 32ビット定義コード（00 (b)、 01 (b)、 11 (b) ,および 10 (b)のいずれか 1つ）と下位 32ビットアドレスの一部く 31： 16 >が使用される。

[0055] ノリツドフラグは、エントリの有効又は無効を示すフラグである。例えば、ノリツドフラダカであればそのノリツドフラグを含むエントリが有効であること、ノリツドフラグが "0"であればそのバリッドフラグを含むエントリが無効であることを示す。エントリが有効とは、ウェイに登録されたデータである分岐先アドレスが抹消されて、な、と、う意味である。ノリツドフラグは、置換対象のウェイを選択するためにも用いられる。

[0056] リプレースフラグは、置換対象のウェイを選択するために用いられるフラグである。

分岐先アドレスには、キャッシュメモリ 102 (または主記憶装置)からフェッチされた分岐命令の分岐先アドレスが格納される。本実施形態では、リプレースフラグおよびバリツドフラグの処理にっ、ては、詳細を省略する。

[0057] 以下、本処理装置の制御手順を説明する。まず、プログラムカウンタ 122からの命令アドレス (命令が格納された主記憶装置 121上のアドレス）が命令フツチ制御ュニット 123に送出される。

[0058] 命令フェッチユニット 123は、命令キャッシュ制御ユニット 124にその命令アドレスの命令取得を指示するとともに、分岐予測装置 100に対して、分岐予測を指示する。すると命令キャッシュ 102での命令取得処理と並行して、分岐予測装置 100での分岐履歴記憶装置 130の検索がなされる。

[0059] そして、分岐予測装置 100は、現在の命令アドレスで分岐命令がヒットした場合には、その分岐先アドレスを命令フェッチ制御ユニット 123に送出する。

[0060] 命令フツチ制御ユニット 123は、分岐予測装置 100でヒットした分岐命令の分岐先アドレスによって、さらに、次の命令取得を命令キャッシュ制御ユニット 124に指示する（このような処理は、通常、パイプラインのステージを形成する）。なお、分岐予測力 Sヒットしな力つた場合には、分岐しな、次の命令アドレスを命令フェッチ制御ュ-ット 123の内部に含まれるアドレス加算器 184で生成し、次の命令取得を命令キヤッシュ制御ユニット 124に指示する。

[0061] フェッチされ、デコードされた命令は、それが分岐命令でな力つた場合には、その他リザべーシヨンステーション 127によってオペランドの処理等に基づいて、実行の待ち合わせを受ける。そして、オペランドが揃った時点で、各命令が演算ユニット 120 で実行される。

[0062] 一方、分岐命令については、分岐リザべーシヨンステーション 126によって命令の待ち合わせがなされる。そして、分岐命令の分岐実行によって分岐先アドレスが確定したときに、完了報告が分岐リザべーシヨンステーション 126から、命令完了管理ュ- ット 128および分岐予測装置 100に送出される。

[0063] このとき、分岐リザべーシヨンステーション 126は分岐予測が正しかったか否かを判定する。すなわち、（al)その命令アドレスにて分岐予測装置 100によって分岐予測力 Sヒットし (分岐履歴記憶装置 130に分岐先アドレスが格納されていた）、（a2)フェツチされた分岐命令がその分岐先アドレスに分岐した場合に、分岐予測が正し力つたことが分かる。あるいは、（bl)その命令アドレスにて分岐予測装置 100がヒットせず、 (b2)フェッチされた命令が分岐命令ではな力つた力もしくは分岐命令であっても分岐しな力つた場合に、分岐予測が正し力つたことがわかる。

[0064] この場合、すでにキャッシュ制御ユニット 124に依頼済みの命令フェッチは、そのまま続行されること〖こなる。

[0065] また、分岐予測が正しくな力つた場合には、すでに、キャッシュ制御ユニット 124に依頼済みの命令フェッチおよびその後に続く一連の処理はは、処理が中断されることになる。同時に分岐リザべーシヨンステーション 126からは、正しい分岐先からの再命令フェッチを行うよう、命令フェッチ制御ユニット 123に指示が出される。

[0066] 分岐予測装置 100は、セレクタ 132を介して実行された分岐命令をウェイに格納する。

[0067] なお、分岐命令は、命令の実行によって分岐先に分岐する場合と、分岐せずに次のアドレスにプログラムカウンタが移動する場合がある。そこで、本実施形態では、命令を実行することを"命令を処理する"と呼ぶ。すなわち、命令を処理するとは、命令にしたがった所定の処理を実行することをいい、例えば、条件付き分岐命令の場合には、条件の判定と判定結果に基づく分岐先への分岐または分岐しな、処理を含む

《実施例》

図 5から図 11に図面に基づいて本発明の一実施例に係る処理装置を説明する。図 5は、実施例に係る処理装置の詳細構成を示す図である。図 5では、本処理装置のうち、特に、プログラムカウンタ制御装置 122A (本発明のアドレス制御部に相当）、命令フツチ制御ユニット 123 (本発明の取得部に相当）、分岐リザべーシヨンステーシヨン 126、分岐予測装置 100 (本発明の分岐予測部に相当）、および演算器湘対アドレス演算器 168、演算器 167、本発明の実行部に相当）が明示されている。以下、本処理装置の各部の構成要素を説明する。

[0068] (プログラムカウンタ制御装置 122A)

プログラムカウンタ制御装置 122Aは、プログラムカウンタの現在値 PC152 (または分岐命令の実行結果）に基づいてプログラムカウンタの次の値 NPC151の算出を制御する。

[0069] 図 5では、プログラムカウンタの現在値 PC152は、上位 32ビット PCく 63 : 32 >と、下位 32ビット PCく 31 : 0>とに分けて示されている。ただし、 PC152というときは、プログラムカウンタの現在値そのもの（全部のビット）を、うこととする。

[0070] 同様に、プログラムカウンタの次の値 NPC151は、上位 32ビット NPCく 63 : 32>と、下位 32ビット NPCく 31 : 0>とに分けて示されている。ただし、 NPC152というときは、プログラムカウンタの次の値そのもの（全部のビット）を、うこととする。

[0071] 図 5のように、分岐命令が処理され、分岐先アドレスが確定した場合、分岐リザべ一シヨンステーション 126からプログラムカウンタ制御装置 122Aへ、上位 32ビット定義コード、分岐先アドレスの桁あふれ情報、および下位 32ビットアドレスが送出される。ここで、分岐先アドレスの桁あふれ情報（以下、単に桁あふれ情報という）とは、 PC相対分岐命令が分岐した場合に、分岐先までの相対アドレスが下位 32ビットの範囲を超える力否かを示す情報である。

[0072] 以下、この桁あふれ情報について説明する。本処理装置では、分岐命令は、 PC相対アドレス分岐命令と、レジスタ間接分岐命令とに分類することができる。

[0073] PC相対アドレス分岐命令とは、現在のプログラムカウンタの値に対する相対分岐ァドレスをオペランドとする分岐命令である。 PC相対アドレス分岐命令の分岐先は、現在のプログラムカウンタの値に相対分岐アドレスが加算されたアドレスとなる。本実施形態の場合、オペランドである相対分岐アドレスは、最大 32ビットで記述できる範囲である。このため、 PC相対アドレス分岐命令が分岐したときの分岐先の上位 32ビットは、最大で + 1 (正方向に桁あふれした状態）、最小で 1 (負方向に桁あふれした状態)となる。

[0074] 本実施形態では、分岐リザべーシヨンステーション 126は、正方向に桁あふれした状態を示すビット ( + 1ビット）、負方向に桁あふれした状態を示すビット（ 1ビット)をプログラムカウンタ制御装置 122Aに通知する。この信号を受信するプログラムカウンタ制御装置 122Aが本発明の桁あふれ情報受信部に相当する。

[0075] さらに、 PC相対分岐命令が実行された場合には、その実行を示す信号が相対アドレス演算器 168からプログラムカウンタ制御装置 122Aに通知される（ライン 191)。この信号を受信するプログラムカウンタ制御装置 122Aが本発明の分岐種別情報受信部に相当する。 [0076] 一方、レジスタ間接分岐命令とは、レジスタの番号をオペランドとして指定し、指定したレジスタに格納されたアドレスを分岐先アドレスとする分岐命令である。レジスタ間接分岐命令は、レジスタのビット幅、すなわち、 64ビットの範囲で分岐先アドレスを指定できる。

[0077] 図 5のように、プログラムカウンタ制御装置 122Aは、上位ビットデコーダ 150Aを有している。上位ビットデコーダ 150Aは、上位 32ビット定義コードを本来の上位 32ビットアドレスに戻す機能を有する（上位ビットデコーダ 150Bも同様である）。

[0078] 上位ビット定義コードは、分岐リザべーシヨンステーション 126から入力される。これは、分岐リザべーシヨンステーション 126において、最終的に次の分岐先が確定するためである。すなわち、分岐リザべーシヨンステーション 126に示されているバッファ T GT— PC171には、命令がデコードされ、分岐が確定した分岐先アドレスの上位 32 ビット定義コードと、下位 32ビットアドレスが格納されている。上位ビットデコーダ 150 Aには、この確定した分岐先アドレスの上位 32ビット定義コードが入力される。

[0079] 本実施形態のデコーダ 150Aは、常時、この上位 2ビット定義コードを上位 32ビットアドレスに変換している。さらに、プログラムカウンタの次の値 NPC151には、命令完了管理ユニット 128 (図 3参照)から分岐命令の実行完了が確認されたとの通知を受け取ったとき、確定した分岐先アドレスの上位 32ビットが設定される。

[0080] したがって、分岐命令が発生しても、分岐先アドレスの上位 32ビット定義コードが 0 0 (b) , 01 (b)、または 11 (b)の場合には、プログラムカウンタ制御装置 122Aは、そのまま上位ビットデコーダ 150Aによって上位 32ビット定義コードから上位 32ビットァドレスを生成する。上位 32ビットが上位 32ビット定義コードから一意に確定可能だからである。。

[0081] また、下位 32ビットアドレスについては、プログラムカウンタ制御装置 122Aは、分岐リザべーシヨンステーション 126から確定した分岐先アドレスの下位 32ビット TGT —PCく 31 : 0>を受け取り、プログラムカウンタの次の値の下位 32ビット NPCく 31 : 0>に設定する。このようにして、分岐命令が発生しても、分岐先アドレス上位 32ビットが上位 32ビット定義コードで一意に確定可能な場合、プログラムカウンタは、上位 3 2ビット定義コードからアドレスを復元することで、正、分岐先アドレスを設定されることになる。

[0082] 一方、上位 32ビット定義コードが 10 (b) (その他）の場合には、プログラムカウンタ制御装置 122Aは、分岐命令による分岐先が上位 32ビット定義コードで一意に定義されたアドレスの範囲を超えたと仮に判定する（この判定を実行するプログラムカウンタ制御装置 122Aが本発明の判定部に相当する）。この場合分岐先アドレスは上位 3 2ビット定義コードで復元不可能である。本実施形態では、分岐命令の種類に応じて、分岐先アドレスを復元する方法を選択する。

[0083] 以下で、上位 32ビット定義コード力も分岐先アドレス上位 32ビットが生成不可能な場合の分岐先アドレス生成方法を記述する。

[0084] まず、分岐命令が PC相対分岐命令であった場合には、ライン 191を通じて相対分岐演算器 168からその旨の信号 (例えば HI信号)がプログラムカウンタ制御装置 122 Aに通知される。その場合、プログラムカウンタ制御装置 122Aは、分岐リザべーションステーション 126から、桁あふれ情報を読み取る。そして、桁あふれ情報を元にプログラムカウンタの現在値 PC152の上位 32ビットに変更をカ卩え、分岐先アドレスの上位 32ビットを生成する。

[0085] 図 11に PC相対分岐命令の分岐先復元処理の流れを示す。

[0086] 桁あふれ情報が + 1であった場合には（S192)、プログラムカウンタ制御装置 122 Aは、プログラムカウンタの現在値の上位 32ビット PCく 63 : 32〉を加減算器 154を通して 1加算した値を分岐先アドレスの上位 32ビットとする（S193)。また、桁あふれ情報が— 1であった場合には（S194)、プログラムカウンタ制御装置 122Aは、プログラムカウンタの現在値の上位 32ビット PC< 63 : 32 >を加減算器を通して 1減算した値を分岐先アドレスの上位 32ビットとする（S195)。また、桁あふれ情報が + 1および —1のいずれでもない場合には、プログラムカウンタ制御装置 122Aは、プログラム力ゥンタの現在値の上位 32ビット PCく 63： 32 >をそのまま分岐先アドレスの上位 32ビットとする（S196)。この処理を実行する加減算器 155が本発明の算術部に相当する

[0087] 一方、分岐先アドレスの下位 32ビットには、分岐リザべーシヨンステーション 126力ら送出された値 TGT_PCく 31： 0 >をそのまま設定する。 [0088] 次に、分岐命令がレジスタ間接分岐命令であった場合には、ライン 191を通じて相対分岐演算器 168からその旨の信号 (例えば LO信号)がプログラムカウンタ制御装置 122Aに通知される。その場合には、プログラムカウンタ制御装置 122Aは、プログラムカウンタの現在値 PC上位 32ビットく 63 : 32 >からは、分岐先アドレス上位 32ビットを特定できない。

[0089] この場合には、プログラムカウンタ制御装置 122Aには、演算器 167から、レジスタ間接分岐命令の分岐先アドレスが入力される。ここで、演算器 167は、レジスタ間接分岐命令の分岐先アドレスを計算する演算器である。そして、プログラムカウンタ制御装置 122Aは、レジスタ間接分岐命令の分岐先アドレスを計算した演算器 167の出力から、そのまま上位 32ビットアドレスを読み取り、分岐先アドレス上位 32ビットとする

[0090] 一方、分岐先アドレス下位 32ビットには、分岐リザべーシヨンステーション 126から送出された値 TGT_PCく 31： 0 >をそのまま設定する。

[0091] プログラムカウンタ制御装置 122Aは、上記方法により設定した分岐アドレス力も選択回路 155により 1つを選択し、選択した分岐先アドレスをプログラムカウンタの次の値 NPC151に設定する。

[0092] 図 10に分岐先アドレス復元処理の流れを示す。上位 32ビット定義コードが 00 (b)、 01 (b)、または 11 (b)の場合（S20)、上位 32ビットは分岐リザべーシヨンステーション 126から入力された上位 32ビット定義コードを上位ビットデコーダ 150Aによって復元された値をプログラムカウンタの次の値 NPC151の上位 32ビットに設定する（S18 ) o上位 32ビット定義コードが 10 (b)かつ、分岐命令が PC相対分岐命令である旨の信号が通知された場合（S21)、上位 32ビットはプログラムカウンタの現在値 PCの上位 32ビットを加減算器 154を通して加減算した値をプログラムカウンタの次の値 NPC 151の上位 32ビットに設定する（S19)。上位 32ビット定義コードが 10 (b)かつ、分岐命令がレジスタ間接分岐命令である旨の信号が通知された場合、レジスタ間接分岐命令の分岐先アドレスを計算した演算器 167から入力された値をプログラムカウンタの次の値 NPC151の上位 32ビットに設定する（S22)。

[0093] プログラムカウンタの次の値 NPC151の下位 32ビットは分岐命令が実行される場合常に、分岐リザべーシヨンステーション 126から入力された TGT— PCく 31 : 0>が設定される。

[0094] なお、分岐命令が実行されない場合には、プログラムカウンタ制御装置 122Aは、プログラムカウンタの次の値 NPC151く 63 : 0>を、同時に完了した命令数分 (各命令長の合計)だけ進める。例えば、 4命令同時完了でかつ一命令の長さが各々すべて 4バイトであれば、 4バイト X 4命令 = 16バイトである。

[0095] (命令フツチ制御ユニット）

命令フェッチ制御ユニット 123は、アドレスの上位 32ビットを上位 32ビット定義コードに変換する上位ビットエンコーダ 153A (本発明の符号ィ匕部に相当）と、上位ビットェンコーダ 153Aの出力と分岐リザべーシヨンステーション 126からの上位 32ビット定義コードとを選択する選択回路 161と、選択回路 161からの信号を保持するバッファ IA RX162と、フェッチ中の命令アドレスが入力されるアドレス加算器 184と、アドレスカロ算器 184の出力を保持するバッファ SEQ163と、分岐予測装置 100において予測された次の分岐先アドレスを格納するバッファ TIAR164と、ノッファ IARX162、バッファ SEQ163およびバッファ TIAR164等に保持された複数の命令アドレスデータ（上位 32ビット定義コードおよび下位 32ビットアドレス）の、ずれかを選択する選択回路 165と、選択回路 165によって選択された命令アドレスデータを保持する命令フェツチアドレス保持回路 166と、命令フェッチのために上位 32ビット定義コード力も上位 3 2ビットアドレスを生成する上位ビットデコーダ 150Bと、を有して!/、る。

[0096] 図 5のように、プログラムカウンタの現在値 PC152の上位 32ビット PCく 63 : 32>が上位ビットエンコーダ 153Aにて、上位 32ビット定義コードにエンコードされる。ェンコードされた上位 32ビット定義コードは、選択回路 161によって選択され、ノッファ IAR X162に設定される。バッファ IARX162は、プログラムカウンタからのフェッチ要求によって命令フェッチを実行する場合に使用するノッファである。

[0097] プログラムカウンタからのフェッチ要求があった場合には、選択回路 165は、バッファ IARX162から出力される命令アドレスデータ（上位 32ビット定義コードおよび下位 32ビットアドレス）を選択し、その上位 32ビット定義コードを上位ビットデコーダ 150B 、および分岐予測装置 100に送出する。また、その場合に、選択回路 165は、ノッファ IARX162から出力される下位 32ビットアドレスを命令フェッチアドレス保持回路 16 6、および分岐予測装置 100に送出する。

[0098] 上位ビットデコーダ 150Bは、上位 32ビット定義コードを上位 32ビットアドレスに変換する。この上位 32ビットアドレスは、分岐予測装置 100内を通過した下位 32ビットアドレス（分岐予測装置 100内に、 IF— EAGく 31 : 0>で明示された線）に付加され、 64ビットの命令アドレス IF— EAGく 63 : 0>として命令フェッチに使用される（矢印 190)。

[0099] また、この命令アドレスの下位 32ビット IF— EAGく 31 : 0>は、アドレス加算器 184 に入力され、アドレスが 1単位インクリメントされてバッファ SEQ163に格納される。ここで 1単位とは、 1回のフェッチにおいてメモリ（主記憶装置 121または命令キャッシュ 102)力も取得される命令数分だけ主記憶装置 121上のアドレスを進める数である。例えば、 32バイト 8命令を 1フェッチステージでフェッチする場合には、 1単位は 32バイトである。また、現在の上位 32ビット定義コードは、そのままバッファ SEQ163の上位 32ビット定義コードとして設定される。

[0100] したがって、分岐命令が実行されな力つたことを条件に、選択回路 165は、バッファ SEQ163から出力される命令アドレスデータ（上位 32ビット定義コードおよび下位 32 ビットアドレス）を選択する。選択されたバッファ SEQ163からの命令アドレスデータは、上記バッファ IARX162からの命令アドレスデータと同様に処理される。

[0101] また、分岐予測装置において、現在フェッチ中の命令アドレスにおいて分岐命令がヒットし、その分岐先アドレスへの分岐が予測される場合に、分岐予測装置 100から分岐先の命令アドレスデータ（上位 32ビット定義コードおよび下位 32ビットアドレス）力バッファ TIAR164に送出される。

[0102] この場合、分岐予測装置 100が分岐予測を送出したことを条件に、選択回路 165 は、バッファ TIAR164から出力される命令アドレスデータを選択する。バッファ TIAR 164からの命令アドレスデータは、上記バッファ IARX162からの命令アドレスデータと同様に処理される。

[0103] (演算器）

演算器 167は、命令フェッチ制御ユニット 123の制御によってフェッチされた命令がレジスタ間接分岐命令であった場合に、その分岐先アドレスを計算する。計算された分岐先アドレスは、分岐リザべーシヨンステーション 126に送出される。このうち、上位 32ビットアドレスは、上位ビットエンコーダ 153Bによって上位 32ビット定義コードに変換される。なお、演算器 167によって計算された分岐先アドレスの上位 32ビットは、選択回路 169を介してプログラムカウンタ制御装置 122Aに送出される。

[0104] 相対アドレス演算器 168は、命令フェッチ制御ユニット 123の制御によってフェッチされた命令が相対アドレス分岐命令であった場合に、分岐命令の命令アドレスに相当するアドレスを保持する命令フェッチアドレス保持回路 166の下位 32ビット PCく 3 1 : 0 >を基準にして相対アドレス分だけ変位したアドレスを計算する。計算された分岐先アドレスは、選択回路 169を通じて分岐リザべーシヨンステーション 126に送出される。

[0105] また、相対アドレス演算器 168は、プログラムカウンタ値 (現在の命令フェツチアドレス)から上記相対アドレスだけ変位したアドレスを計算するときの桁あふれの発生 (正方向の桁あふれ： + 1、負方向の桁あふれ： 1)を検知する。検知された桁あふれは、桁あふれ情報（ + 1、— 1)として、分岐リザべーシヨンステーション 126を通じて、プログラムカウンタ制御装置 122Aに通知される。

[0106] さらに、相対アドレス演算器 168には、命令フェッチアドレス保持回路 166から現在の上位 32ビット定義コードが入力されている。上記桁あふれが検知されない場合には、命令フェッチアドレス保持回路 166から入力された上位 32ビット定義コードがそのままバッファ 171に設定される。また、上記桁あふれが検知された場合には、命令フェッチアドレス保持回路 166から入力された上位 32ビット定義コードから分岐先ァドレスの上位 32ビット定義コードを算出する。正方向の桁あふれが発生した場合は、上位 32ビット定義コードは正の方向に移行し、 00 (b) - >01 (b)、 01 (b)— > 10 (b )、 10 (b)— > 10 (b)、 11 (b)— >00 (b)となる。このとき、 01 (b)、 10 (b)は共に 10 (b)へと移行する。負方向の桁あふれが発生した場合は、上位 32ビット定義コードは負の方向に移行し、 00 (b)— > 11 (b)、 01 (b)— >00 (b)、 10 (b)— > 10 (b)、 11 (b)—〉 10 (b)へと移行する。このとき、 l l (b)、 10 (b)は共に 10 (b)へと移行する。

[0107] 選択回路 169は、分岐命令が相対アドレス分岐命令か、レジスタ間接分岐命令かに応じて、相対アドレス演算器 168または演算器 167のいずれのアドレス計算の結果を選択する。

[0108] (分岐リザべーシヨンステーション）

分岐リザべーシヨンステーション 126は、選択回路 169、バッファ 170および、ノッファ 171を有する。分岐リザべーシヨンステーション 126は、相対アドレス演算器 168または演算器 167において算出された分岐先アドレスをバッファ 170、 171に保持するとともに、分岐実行のタイミングを調整する。

[0109] バッファ 170には、命令フェッチアドレス保持回路 166から供給される現在のフェツチ中の命令アドレスデータ (フツチされる命令が分岐命令の場合には、分岐元アドレス）が格納される。この分岐先アドレスデータは、上位 32ビット定義コードと、下位 3 2ビットアドレスを含む。

[0110] また、ノッファ 171には、選択回路 169によって選択された分岐先アドレスデータ（演算器 167によって計算されたアドレスまたは相対アドレス演算器 168によって計算されたアドレス）が格納される。この分岐先アドレスデータは、上位 32ビット定義コードと、下位 32ビットアドレスを含む。

[0111] 分岐命令 (レジスタ間接分岐命令または PC相対分岐命令）が演算器 167または相対アドレス演算器 168で処理され、分岐先アドレスが確定すると、分岐元アドレスが、ノッファ 170から分岐予測装置 100に送出される。また、このとき、分岐先アドレスがノッファ 171から分岐予測装置 100に送出される。

[0112] (分岐予測装置）

分岐予測装置 100は、分岐リザべーシヨンステーション 126において分岐実行が確定された分岐命令 (PC相対分岐命令、または、レジスタ間接分岐命令)の分岐先ァドレスを分岐履歴として格納する。分岐予測装置装置 100は、分岐履歴記憶装置 13 0 (本発明の履歴記憶部に相当）と、マッチ回路 180と、選択回路 183とを含む。なお、分岐予測装置装置 100は、単に分岐実行が確定された分岐命令を格納する他、複数回の分岐履歴 (いわゆるグローバルヒストリ）に基づいて、次回分岐が予測される分岐命令の分岐先アドレスを格納するようにしてもよ!、。

[0113] 分岐履歴記憶装置 130は、セットァソシァティブ方式の記憶装置である。分岐履歴記憶装置 130のセットは、分岐命令の分岐元アドレスの一部（例えば、 < 15 : 5 > (第 15ビット目力も第 5ビット目まで) )によって指定される。

[0114] セット内のウェイは、タグ部 130Aに格納されたタグによって決定される。タグ部 130 Aには、分岐元アドレスの上位 32ビット定義コードおよび下位 32ビットアドレスの一部 (例えば、く 31： 16 > (第 31ビット目力ら第 16ビット目まで)が格納される。

[0115] 一方、そのタグ部に対応するデータ部 130Bには、分岐先アドレスの上位 32ビット定義コードおよび下位 32ビットアドレスが格納される。

[0116] また、分岐予測装置 100は、分岐履歴記憶装置 130の読み出しにおいては、選択回路 165を通じて現在フェッチ中の命令アドレス (分岐元アドレス）を取得する。そして、分岐予測装置 100は、その命令アドレスによって、該当するセットを決定し、さらにセット内のタグ部 130Aを検索する。そして、分岐予測装置 100は、タグ部 130Aに格納された上位 32ビット定義コードおよび下位アドレスの一部（例えば、く 31： 16 > ) 1S 選択回路 165から取得されたものと一致する力否かをマッチ回路 180によって確認する。

[0117] マッチ回路 180の一方の入力には、 FF182を通じて、上位 32ビット定義コードおよび下位アドレスの一部（例えば、く 31 : 16 >)が、入力されている。マッチ回路 180の他方の入力には、タグ部 130Aに記憶されて、たタグ (過去にお、て次回分岐すると予測された分岐命令の分岐元の上位 32ビット定義コードおよび下位アドレスの一部く 31 : 16 »が入力される。

[0118] したがって、現在フェッチ中の命令アドレスに対応する上位 32ビット定義コードおよび下位アドレスの一部く 31： 16 >がタグ部 130Aの内容と一致した場合に、分岐予柳』がヒッ卜すること〖こなる。

[0119] 分岐予測がヒットしたことがマッチ回路で検知されると、そのヒットを示した信号が選択回路 183に送出される。選択回路 183は、タグ部 130Aのヒットしたエントリに対応するデータ部 130B力も分岐先の命令アドレスデータ（上位 32ビット定義コードおよび下位 32ビットアドレス）を命令フェッチ制御ユニットのバッファ TIAR164に送出する。これによつて、分岐予測に基づいて次の命令フェッチが実行されることになる。

[0120] (上位ビットデコーダ）図 6に、上位ビットデコーダ 150A (および 150B)の回路構成を示す。上位ビットデコーダ 150A (および 150B)は、それぞれ、上位 32ビット定義コードが 00 (b)、 01 (b)、および 11 (b)の場合の上位 32ビットアドレスを復元する。

[0121] 上位ビットデコーダ 150A、 150Bは、セレクタ 300と、 4つの ANDゲートと、インバータの組合せで構成することができる。なお、図 6では、インバータは、 ANDゲートの入力端子側の丸印で示されている。ここでは、このような入力側にインバータが組み込まれたものについても、 ANDゲートと呼ぶことにする。

[0122] それぞれの ANDゲートには、上位 32ビット定義コード（図 6では、 HIGH— 32BIT —CODE < 1 >およびく 0>で表示）が入力される。 "11 "のラベルが付された AND は、上位 32ビット定義コードく 1 : 0> = 11 (b)の場合に、 HI出力となる。

[0123] 同様に、 "10"のラベルが付された ANDは、上位 32ビット定義コードく 1 : 0> = 10

(b)の場合に、 HI出力となる。また、 ' 01 'のラベルが付された ANDは、上位 32ビット定義コードく l : 0 > =01 (b)の場合に、 HI出力となる。また、 "00"のラベルが付された ANDは、上位 32ビット定義コードく l : 0> =00 (b)の場合に、 HI出力となる。

[0124] 一方、セレクタ 300は、それぞれの ANDゲートがオンになると、対応する箇所の入力信号を出力する。セレクタ 300の入力側には、 3つの固定のデータのレジスタ（Ox FFFFFFFF、 0x00000001、および 0x00000000)と、上位 32ビットアドレスそのもの（ADDRESS— INく 63： 32 >)を格納したレジスタが接続される。

[0125] すなわち、 "11"のラベルが付された ANDがオンになることによって、上位 32ビットすべてが 1のビットパターン（OxFFFFFFFF)が出力される。また、 "01"のラベルが付された ANDがオンになることによって、上位 32ビットのうち最下位ビットが 1で、残りのビットが 0のビットパターン（0x00000001)が出力される。また、 "00"のラベルが付された ANDがオンになることによって、上位 32ビットすべてが 0のビットパターン（0 xOOOOOOOO)力出力される。また、 "10"のラベルが付された ANDがオンになることによって、上位 32ビットアドレスそのものが出力される。

[0126] (上位ビットエンコーダ）

図 7に、上位ビットエンコーダ 153A(153B)の構成を示す。上位ビットエンコーダは、上位 32ビットアドレス（図 7に、 ADDRESS INく 63 : 32 >と表示）が入力され、上位 32ビット定義コード（図 7に、 HIGH— 32BITCODEく 1 : 0>と表示）を出力する。

[0127] 図 7のように、上位ビットエンコーダ 153A (153B)は、ビットパターン 32ビットのビッ卜ノターン，， 111. . . 11" (全ビット 1、すなわち、 OxFFFFFFFF)、 "000. . . 01" ( 最下位ビッ卜力 Sl、残り力 Sすべて 0、すなわち、 0x00000001)、 "000. . . 00" (全ビッ卜 0、すなわち、 0x00000000)〖こ、人力データ力 Sマッチする力否力を半 IJ定する 3つのマッチ回路と、入力データとマッチしたマッチ回路の出力に応じて、 "11"、 "10"、 " 01"、または" 00"の 2ビットを出力するセレクタ 301とを有している。

[0128] (処理シーケンス）

図 8から図 11のフローチャートにより、上述の構成要素によって実行される処理シーケンスを説明する。ここでは、処理シーケンスをフローチャートで示すが、この処理シ一ケンスは、基本的には、ハードウェアの論理回路で実現される。

[0129] 図 8は、上位ビットエンコーダの処理シーケンスを示す。上位ビットエンコーダは、上位 32ビッ卜アドレス力 OxFFFFFFFF、 0x00000001、また ίま 0x00000000の!ヽずかにマッチするか否かを判定する（Sl、 S3、 S5)。

[0130] 上位 32ビットアドレス力 OxFFFFFFFFにマッチする場合、上位ビットエンコーダは、 2ビット 11 (b)を出力する（S2)。

[0131] また、上位 32ビットアドレス力 OxOOOOOOOlにマッチする場合、上位ビットェンコ一ダは、 2ビット 01 (b)を出力する（S4)。

[0132] また、上位 32ビットアドレス力 0x00000000にマッチする場合、上位ビットェンコ一ダは、 2ビット 00 (b)を出力する（S6)。

[0133] そして、上位 32ビッ卜アドレス力 0xFFFFFFFF、 0x00000001、または 0x00000 000のいずかにもマッチしない場合、上位ビットエンコーダは、 2ビット 10 (b)を出力する。

[0134] 図 9に上位ビットデコーダの処理シーケンスを示す。上位ビットデコーダは、上位 32 ビット定義コード（2ビット）が 11 (b)、 01 (b)、または 00 (b)のいずかにマッチするか否力を判定する（S 11、 S13、 S15)。

[0135] 上位 32ビット定義コード力 11 (b)である場合、上位ビットデコーダは、 1. . . 11 ( 全ビット 1、すなわち、 OxFFFFFFFF)を出力する（S12)。 [0136] 上位 32ビット定義コード力 01 (b)である場合、上位ビットデコーダは、 0. . . 01 ( 最下位ビット以外 0、すなわち、 OxOOOOOOOl)を出力する（S 14)。

[0137] 上位 32ビット定義コード力 00 (b)である場合、上位ビットデコーダは、 0. . . 00 ( 全ビット 0、すなわち、 0x00000000)を出力する（S 16)。

[0138] 上位 32ビット定義コードが、以上のいずれでもない場合、上位 32ビット定義コードは、 10 (b)となる。この場合、上位ビットデコーダは、入力された 32ビットアドレス、本実施形態ではプログラムカウンタの現在値 PC152の上位 32ビットを出力する（S17)

[0139] 以上述べたように、本実施形態の処理装置によれば、 64ビットアドレス空間のうち、上位 32ビットアドレスを 2ビットの上位 32ビット定義コード 00 (b)、 01 (b)、 11 (b)、および 01 (b)のコードで分類する。そして、上位 32ビット定義コードと下位 32ビットアドレスの組合せによって、分岐命令の履歴を記憶し、分岐予測を実行する。

[0140] したがって、 64ビットアドレス空間に、カーネル、ユーザプロセスの実行形式、および、スタック Zライブラリを分散配置する OSの制御に対して、上位 32ビットアドレスの使用に偏りがある場合、効率的に分岐予測を実現できる。

[0141] すなわち、上位 32ビット定義コードのうち、 00 (b)、 01 (b)、 11 (b)を頻繁するアドレスの範囲に割り付け、 10 (b)をまれにしか発生しないアドレスの範囲に割り付ける。このような上位 32ビット定義コードの定義により、分岐先アドレスが、下位 32ビットの範囲で収まる場合は、もちろん、分岐先の上位 32ビットが 00 (b)、 01 (b)、 11 (b)で分類されるアドレス空間相互で分岐が発生する場合にも、正し、分岐予測結果を得ることができる。したがって、分岐先の上位 32ビットが 10 (b) (その他の場合)を除外して、分岐履歴を有効に使用することができる。

[0142] また、 PC相対分岐の場合に、プログラムカウンタの現在の値 PC152から分岐先ァドレスを復元することにより、相対アドレス演算器 168の演算結果が確定する前に桁あふれが検知された段階で、分岐先アドレスを算出できる。

Claims

請求の範囲

[1] 少なくとも命令の記憶元から命令を取得する取得段階と前記命令を処理する実行段階とを含む実行サイクルを繰り返す、そのようなコンピュータの前記取得段階で命令を取得する取得部と、

前記取得部が取得する命令の記憶元である命令アドレスを決定するアドレス制御部と、

前記コンピュータによって次の命令実行段階で処理される命令が分岐命令であるか否かを過去に処理された命令の履歴情報にしたがって予測する分岐命令予測部と、

前記取得された命令の少なくとも 1つを前記実行段階で処理する実行部と、を備え前記アドレス制御部は、前記命令アドレスに含まれる所定の上位ビット部分と下位ビット部分のうち、前記上位ビット部分を圧縮した上位アドレス情報を生成する符号ィ匕部と、

前記上位アドレス情報力上位ビット部分を復元する復元部とを有し、

前記分岐命令予測部は、

前記処理された分岐命令の分岐先アドレスに対応する上位アドレス情報と下位ビット部分とを、前記分岐命令の記憶元の命令アドレスに対応する上位アドレス情報と下位ビット部分力決定される複数の格納先のいずれかに前記履歴情報として記憶する履歴記憶部を有する処理装置。

[2] 前記符号化部は、前記上位ビット部分を複数のアドレス範囲ごとに区分し、区分された第 1のアドレス範囲を識別する第 1の上位アドレス情報と前記第 1のアドレス範囲以外のアドレス範囲を識別する第 2の上位アドレス情報とを生成し、

前記アドレス制御部は、前記分岐命令の分岐先アドレスが、前記第 1の上位アドレス情報で識別される前記第 1のアドレス範囲に分岐する分岐命令である場合に、前記復元部を通じて前記第 1のアドレス範囲に対応する上位ビット部分を生成し、前記分岐命令が前記第 2の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合に前記分岐命令の種類に応じて上位ビット部分を復元する請求項 1に記載の処理装置。

[3] 前記アドレス制御部は、

前記分岐命令が前記第 2の上位アドレス情報で識別されるアドレス範囲に分岐する分岐命令である場合に、分岐命令の種類を識別する信号を前記実行部から受信する分岐種別情報受信部と、

前記分岐命令が前記下位ビット部分の範囲を限界として分岐元アドレス力相対分岐する相対分岐命令である場合に、前記実行部における前記分岐命令の処理にぉ、て前記下位ビット部分の範囲から正方向または負方向に桁あふれが発生したことを示す桁あふれ情報を受信する桁あふれ情報受信部と、

前記桁あふれが発生した場合に、分岐元アドレスの上位ビット部分への加減算によって分岐先アドレスの上位ビット部分を取得する算術部とを有する請求項 3に記載の処理装置。

[4] 前記アドレス制御部は、分岐種別情報受信部が前記相対分岐命令でな!ヽ場合に、分岐命令の分岐先を算出した前記実行部力分岐先アドレスの上位ビット部分を取得する上位ビット取得部を有する請求項 3に記載の処理装置。