JPH0785223B2

JPH0785223B2 - デジタル・コンピュータ及び分岐命令実行方法

Info

Publication number: JPH0785223B2
Application number: JP4092541A
Authority: JP
Inventors: バーソロミュー・ブランナー; トーマス・レオ・ジェレマイア; スタマティム・ヴァシリアディス; フィリップ・ジーン・ウィリアムズ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1991-04-18
Filing date: 1992-04-13
Publication date: 1995-09-13
Anticipated expiration: 2010-09-13
Also published as: EP0509245A3; JPH05143336A; DE69229198T2; DE69229198D1; EP0509245A2; US5287467A; EP0509245B1; US5377336A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はデジタル・コンピュータ
のオペレーションに関し、特にパイプライン方式の命令
処理を使用するデジタル・コンピュータにおける分岐命
令処理に関する。

【０００２】

【従来の技術】分岐命令はパイプライン方式の命令処理
のスピード及び効率を減じる。この有害な影響は、単一
命令ストリームにつき多重パイプライン処理を行うプロ
セッサの性能に、非常に大きな影響を及ぼす。こうした
プロセッサはいわゆる“スケーラブル複合命令セットマ
シン”（ＳＣＩＳＭ）を含む。ＳＣＩＳＭアーキテクチ
ャを有するマシンは米国特許出願第５１９３８２号にお
いて詳細に説明されている。

【０００３】従来、分岐予測案が分岐命令の実行による
性能劣化を緩和するために提案されてきた。こうしたも
のの中において、２つの案が注目に値する。第１は、命
令キャッシュ内の分岐命令にその結果に関する予測情報
をタグ付けすることにより、分岐結果のダイナミックな
予測をする。例えば、１９８１年３月の第８回コンピュ
ータ・アーキテクチャ・シンポジウム会報におけるJ.E.
Smithによる“A Studyof Branch PredictionStrategie
s”が参考になる。命令ストリームに予備情報分の容量
を提供するＳＣＩＳＭアーキテクチャは、特にこの案に
適合する。この点に関し、“複合（Compounding）ビッ
ト”或いは“Ｃビット”と称されるビットが、ＳＣＩＳ
Ｍ命令ストリームの各ハーフワードごとに提供される。
これらのビットの１つが、後続の命令と並列に（複合的
に）実行される命令に続くときは、第１の命令の第１の
ハーフワード内のＣビットがセットされる。命令が２分
の１ワードよりも長い場合は、複合は余分のハーフワー
ドに対し未使用ビットを提供する。複合案において未使
用の１つ或いは複数のＣビットは、交互に使用可能であ
る。分岐命令にとって、こうした１つの利用は分岐命令
の結果の予測である。

【０００４】第２の分岐予測戦略は、実行される分岐命
令の結果の履歴を含む分岐目的バッファ（ＢＴＢ）を使
用する方法である。分岐命令が最初に実行されると、そ
の結果はＢＴＢ内に記憶される。２度目に分岐命令が実
行されると、その予測結果はＢＴＢ内に記憶される結果
となる。このようなメカニズムは１９８４年１月発行の
IEEE COMPUTERにおけるJ.K.F.LEE等による“分岐目的バ
ッファ設計における分岐予測戦略”（Branch Predictio
n Strategies in Branch Target BufferDesign）で詳細
に述べられている。

【０００５】ダイナミック予測及び分岐目的バッファ・
メカニズムの両者とも、分岐命令を含む命令ストリーム
を実行するパイプラインをスピードアップするが、各々
に含まれる技術は、ＳＣＩＳＭアーキテクチャにおける
アプリケーションに実際には適合されなかった。更に、
多重パイプライン・アーキテクチャにおいて使用される
並列性の利点が、分岐命令の処理において未だ実現され
ていない。

【０００６】

【発明が解決しようとする課題】本発明は発明者の臨界
的所見に基づくものであり、実行ユニット・オペレーシ
ョンを必要としない分岐命令が実行命令ストリームから
抽出され、実行ストリームの実行と同期して分岐条件の
テストために保持される。。

【０００７】従って、本発明の重要な目的は、多重実行
パイプラインを有するデジタル・コンピュータの並列性
を増進することである。

【０００８】

【課題を解決するための手段】この目的及び他の重要な
目的及び利点が、命令ソース、命令ストリームを実行す
るための実行パイプライン、及び条件コード決定メカニ
ズムを含むデジタル・コンピュータにおいて達成され
る。この条件コード決定メカニズムは命令パイプライン
に接続され、実行命令の結果を示す条件信号を提供す
る。本詳細説明において、本発明は分岐命令条件を処理
するための組合わせであり、以下に示す組み合わせを含
む。すなわち、命令ソース、及びパイプライン式実行の
ための命令シーケンスを提供する実行パイプラインに結
合される命令発行メカニズムと、分岐条件プロセッサと
の組合わせであり、後者は命令シーケンスから分岐命令
を除去し、また条件指示信号に応答して、実行パイプラ
インによる命令の実行と実質的に並列に、除去した分岐
命令を実行する。

【０００９】

【実施例】図１は、マイクロプログラミングを使用し、
マシン・レベルの命令の実行を単独或いは対で実施及び
制御するＳＣＩＳＭアーキテクチャを示す。特に、マシ
ン・レベル命令ストリームは複合プリプロセッサ１０に
提供される。命令ストリームは、典型的にはソース・プ
ログラムからコンパイルされた個々の命令のシーケンス
である。このストリームはＳＣＩＳＭコンピュータのＣ
ＰＵに提供されて実行される。従来、マシン・レベル命
令はキャッシュ（複合命令キャッシュ）１２を通じてＣ
ＰＵにステージされる。キャッシュへの入力以前に、命
令ストリームは複合プリプロセッサ１０により検査さ
れ、隣接する命令が同時に実行可能かどうかが決定され
る。複合プリプロセッサ１０は、米国特許出願第５２２
２９１号で詳細に述べられており、またこの出願におい
ては、図１のキャッシュ１２として機能する複合命令キ
ャッシュ構造についても説明されている。

【００１０】複合プリプロセッサ１０のオペレーション
は複合情報を生成し、この情報は１２でキャッシュされ
るコンパイル済み命令ストリームの近傍の命令が、同時
に実行可能かを示す。こうして、各命令に対し、複合プ
リプロセッサ１０は、命令及び近傍の命令が並列に実行
可能かを示す複合情報を生成する。

【００１１】複合プリプロセッサ１０による処理に続
き、分析された命令及び複合情報は複合命令キャッシュ
１２に記憶される。複合情報を記憶するための余分の空
間の用意は別として、キャッシュ１２は従来通りにオペ
レートされる。特に、キャッシュ１２の入力は、典型的
には、このキャッシュへ入力される隣接する命令（“ラ
イン”）のグループであり、これらは実行プログラムに
より要求されると迅速に獲得される。

【００１２】キャッシュ１２に命令と共に複合情報を提
供する際に、ＳＣＩＳＭアーキテクチャは、コンピュー
タよりもより完全な並列処理の利点を達成する。コンピ
ュータは、命令が即刻に実行されるためにキャッシュか
ら読み出される（“issued”）時点で、並列実行の決定
を行う。これに関連して、キャッシュ１２内の命令は、
例えばループ或いは分岐などにおいて複数回使用され
る。命令がキャッシュ内に存在する限りは、再度実行の
ために獲得されても、もはや再分析される必要はない。
なぜなら、キャッシュ内に命令と共に記憶されるこの命
令のための複合情報が再使用可能だからである。

【００１３】複合プリプロセッサ１０は参照される特許
出願の中で述べられるタイプであるものと仮定し、各命
令に対し、少なくともＣビットを生成する。これらのＣ
ビットは、どの対の命令が並列に処理されるかを識別す
るために使用される。命令及びＣビットは複合命令キャ
ッシュ１２に供給され記憶される。命令フェッチ及び発
行ユニット１４は、必要な際に命令及びＣビットを複合
命令キャッシュ１２からフェッチし、複数の実行ユニッ
ト３４、３６の中の適切な１つ或いは複数により、これ
らが実行されるように配置する。

【００１４】キャッシュ１２からフェッチされる情報
は、命令テキスト及び関連する複合情報を含む。各フェ
ッチは参照番号１３ａで示されるカッドワード（quadwo
rd）形式（すなわち４ワード・ライン）を取り、０、
１、‥‥７と番号付けされた８個のハーフワードを含
む。命令テキストの各カッドワードに関連して、複合プ
リプロセッサ１０により生成される複合情報を構成する
１ｘ８配列のＣビットがある。このビットは“Ｃベクト
ル”として参照される。

【００１５】図２は複合プリプロセッサ１０のオペレー
ション結果を更に詳しく示す。図１の構成がＩＢＭ社の
Ｓｙｓｔｅｍ／３７０タイプのデジタル・コンピュータ
に含まれるものと仮定すると、命令ストリームは１ハー
フワードから３ハーフワードの範囲で変化可能な命令を
含むことができる。オペレーションの効率化のために、
プロセッサ１０はキャッシュ内に記憶される各ハーフワ
ードに対し、Ｃビットを生成する。命令の第１のハーフ
ワードに対するＣビットは、続く命令がこの命令と並列
に実行されるかを示すように規定される。命令の第１の
ハーフワードに関連してＣビットがセットされると、こ
れはこの命令が続く命令と“複合”されたことを示し、
これらの２つの命令が並列に実行されることを示す。セ
ットされない場合は、これらの命令は単独に実行され
る。

【００１６】命令及び関連する複合情報は、命令フェッ
チ及び発行ユニット１４によりキャッシュ１２からフェ
ッチされる。ユニット１４は分岐処理ユニット１５を含
む。命令フェッチのための制御情報が信号ＦＥＴＣＨの
形式で与えられ、これにより命令テキストのカッドワー
ドがキャッシュ１２から獲得されて、命令フェッチ及び
発行ユニット１４に提供されるべきことを示すように規
定される。この信号がフェッチを指示するように規定さ
れると、次の命令のフェッチ・アドレスがこれに伴い、
これはその命令の実行のために命令フェッチ及び発行ユ
ニット１４により処理される。この点に関し、このフェ
ッチ・アドレスは、フェッチ及び発行ユニット１４内の
命令に続く、命令シーケンス部分における次の命令のア
ドレスである。フェッチ・アドレスはまた、実行される
分岐命令により指示される命令シーケンスにおけるアド
レスも取得する。何れの場合も、ＦＥＴＣＨ信号及びフ
ェッチ・アドレスがキャッシュ管理メカニズム１６に提
供される。キャッシュ管理メカニズム１６は、命令がキ
ャッシュ内に存在する場合はフェッチ・アドレスをキャ
ッシュ・アドレスにマップし、また命令がキャッシュ内
に存在しない場合は、このアドレスをミス指示と共に実
メモリ管理メカニズムに提供する。

【００１７】以降の説明では、ＳＣＩＳＭアーキテクチ
ャは、マシン・レベル命令のシーケンスにおいて、プリ
プロセッサ１０及びキャッシュ１２を経由し、命令フェ
ッチ及び発行ユニット１４を通じて提供される対の命令
の同時実行を支援する。これに関連して、左右の部分を
含む複合命令レジスタが発行された命令を受け取り、こ
れらを単独或いは並列実行のために配置する。次に実行
される予定の命令は、命令フェッチ及び発行ユニット１
４により左側の複合命令レジスタ（ＣＩＲＬ）２０に入
力され、このレジスタはレジスタ部分２２をＣビット、
すなわち命令の複合を示すビットの記憶のために含む。
Ｃビットにより、ＣＩＲＬ２０内の命令が直後に続く命
令と共に実行されるように規定されると、その命令がフ
ェッチ及び発行ユニットにより右側の複合命令レジスタ
（ＣＩＲＲ）２１に配置される。一方、Ｃビットが、Ｃ
ＩＲＬ２０内の命令が続く命令と複合されないことを示
す場合は、ＣＩＲＲ２１の内容は無視される。

【００１８】マイクロコード生成器２４は複合命令レジ
スタの内容をマイクロコードに変換し、このマイクロコ
ードはアドレス生成命令レジスタ（ＡＩＲ）２５、実行
命令レジスタ（ＥＩＲ）２６、及びプット・アウェイ
（put-away）命令レジスタ（ＰＩＲ）２７で構成される
実行パイプラインを通じてステージされる。命令フェッ
チ及び発行ユニット１４、複合命令レジスタ２０及び２
１、マイクロコード生成器２４、及び低パイプライン・
ステージ２５−２７は、パイプライン・クロック発生器
２８により提供されるパイプライン・クロックにより同
期される命令実行パイプラインを形成する。

【００１９】マシン・レベル命令を実行するためのＳＣ
ＩＳＭアーキテクチャにおいて使用されるオペレーショ
ン・シーケンスは、５つのパイプライン・ステージに分
割され、パイプライン・クロックの各サイクルにおいて
パイプラインに後続の命令を供給する。第１のステージ
は命令のフェッチ（ＩＦ）であり、命令がキャッシュ１
２から、或いはフェッチ及び発行ユニット１４に在中す
る命令バッファからフェッチされるときに発生する。Ｉ
Ｆサイクルの終わりでは、命令が複合命令レジスタにロ
ードされる準備が整い、ここで命令は命令実行を開始す
るためにデコードされる。命令のＣビットが次に続く命
令が現命令と並列に実行されるべきことを示す場合は、
両者の命令はＩＦサイクルの終了時に使用可能となり、
第１の命令及びＣビットはＣＩＲＬ２０にロードされ、
また続く命令はＣＩＲＲ２１にロードされる。命令デコ
ード（ＩＤ）サイクルは、それぞれＣＩＲＬ２０及びＣ
ＩＲＲ２１を論理デコードすることにより制御される。
パイプラインの続くステージを制御するために必要な第
１のマイクロワードの生成は、このサイクルにおいて発
生し、これは命令オペコードをマイクロワード・アドレ
スとして使用し、マイクロワード生成器２４に含まれる
制御記憶をアクセスすることにより行われる。アドレス
生成（ＡＧ）サイクルは、記憶装置から要求されるオペ
ランドの有効アドレスを計算するために使用される。実
行（ＥＸ）サイクルは、１つ或いはそれ以上のユニット
においてオペレーションを実行するために使用される。
プット・アウェイ（ＰＡ）サイクルは、ＥＸサイクルか
らの結果を汎用目的レジスタ（ＧＰＲ）３７に記憶する
ために使用される。

【００２０】米国特許出願第６５３００６号では、マイ
クロコード生成器２４が主制御記憶装置（ＭＣＳ）及び
第２制御記憶装置（ＳＣＳ）により構成され、組合わせ
マイクロ命令を形成することを教示している。ＩＤサイ
クル中に、ＣＩＲＬ２０の内容がＭＣＳをアドレスする
ために使用される。レジスタ・フィールド２２内のＣビ
ットが、ＣＩＲＲ２１がＣＩＲＬ２０内に含まれる命令
と複合される命令を含むことを示す場合は、ＣＩＲＲ内
の命令のオペコードがＣビットによりゲートされ、ＳＣ
Ｓをアドレスする。マイクロコード生成器２４によるマ
イクロ命令出力は、２命令の実行を並列に制御するため
に必要な全てのフィールドを含む。マイクロ命令のフィ
ールドのいくつかは第１の命令の実行用に確保され、他
のいくつかのフィールドは第２の命令の実行用に確保さ
れる。単一の命令がマイクロコード生成器２４に提供さ
れる場合は、この命令はＣＩＲＬ２０に存在し、マイク
ロ命令シーケンスが生成され、ここでは第２の命令の実
行用フィールドはデフォルト値にセットされる。一方、
第１の命令用のフィールドはこの命令を実行するために
適切にセットされる。命令がＣＩＲＬ２０及びＣＩＲＲ
２１に含まれる場合は、ＳＣＳの出力はＭＣＳの出力と
組合わされる。これはＳＣＳからの情報出力を第２フィ
ールドに入力することにより行われる。

【００２１】マイクロコード生成器２４によるマイクロ
命令シーケンス出力は、最終である３つのパイプライン
・ステージ２５−２７に供給される。パイプラインにお
いては、従来の水平マイクロコード実行がパイプライン
の各ステージにおける制御信号の生成により保証され
る。これは実行ユニット３４、或いは実行ユニット３４
及び３６をオペレートして、オペランドを有する従来の
命令を実行する。その結果は実行ユニット及びＧＰＲ３
７の間で転送される。更に、マイクロ命令シーケンスの
終了を示すＥＮＤＯＰビットを含むパイプライン・シ
ーケンス制御信号が命令フェッチ及び発行ユニットに戻
され、複合命令レジスタに供給される命令のシーケンス
を維持する。

【００２２】本発明のオペレーションにおいては、２つ
の追加の制御信号（“token” とも称される）、ＢＣ及
びＢＲが以下で述べるオペレーションの制御のために、
実行パイプライン２５−２７から分岐プロセッサ１５に
戻される。

【００２３】命令実行の結果は、単一の命令が実行され
る場合は実行ユニット３４から、また命令対の場合は実
行ユニット３４及び３６から分岐条件生成器３９に提供
される。分岐条件生成器は従来通りにオペレートして、
分岐命令の実行の結果生じる条件コード（ＣＣ）及び他
の分岐条件を生成する。これらの条件信号は分岐条件生
成器３９からパス４１を介して分岐プロセッサ１５に転
送され、以降で述べるように使用される。

【００２４】分岐命令の影響パイプライン式命令処理の技術は広範に知られており、
コンピュータ設計に取り入れられることにより、パイプ
ライン方式に通づる条件が適合し且つ支援される場合
は、種々の性能の向上を達成する。この利点は図１に示
すＳＣＩＳＭアーキテクチャにおいて、２つの命令が並
列に実行されるべき場合に、対のパイプラインをオペレ
ートするパイプライン構造が提供されることにより調合
される。しかしながら、不運にも、プログラムの動作の
特徴は、パイプライン処理のための条件が一致しないこ
とが時折あり、パイプライン方式が使用された際の実際
に得られるスピードアップを低下させる。

【００２５】主な抑制的な特徴としては、プログラム中
に見い出される分岐命令の比較的高い頻度が挙げられ
る。任意のプログラムにおいて実行される全ての命令の
最大２５％或いはそれ以上の命令は、分岐命令で構成さ
れる。分岐命令は未使用サイクルをパイプラインに導入
することによりパイプライン・オペレーションを中断す
る。これは以前の或いは同時発生の実行結果に基づき、
新たな（目的）命令ストリームをフェッチするか、或い
は現命令ストリームを順次継続するかを決定する際に発
生する。決定を行い適切なストリームをフェッチする際
の遅延は、更に未使用なサイクルを導入し、パイプライ
ンにより達成される性能を更に低下させる。

【００２６】分岐命令の性能低下の影響は、図１に示さ
れるＳＣＩＳＭアーキテクチャにおいては更に著しいも
のとなる。単一命令ストリームからの多重命令の並列的
実行は、実行マシンにとって、分岐命令による反作用を
特に受け易いものとする。なぜなら、分岐命令は多重パ
イプラインを遅くさせるだけでなく、ＳＣＩＳＭアーキ
テクチャは分岐間において、どの瞬間においてもより高
い割合で命令を浪費するので、パイプラインに入力され
る分岐命令の可能性は他の場合よりも大きなものとな
る。

【００２７】更に詳しくは、パイプライン内における分
岐命令の存在は、分岐命令に続く命令のアドレスを不確
実なものとする。理想的には、命令が連続的なシーケン
スで実行されることが好適であり、この場合は次の命令
のアドレスは、現命令のアドレスにその命令長を加算す
ることにより単純に求まる。これは“順次アドレッシン
グ”と称される。分岐命令に続く次の命令のアドレス
は、“順次アドレッシング”と称される可能性がある一
方、分岐命令の実行によりプログラム実行が“非順次命
令アドレス”に移行する可能性もある。分岐命令の後に
順次アドレス或いは分岐目的アドレスのどちらが続くか
に関しては、テスト結果に依存する。これは分岐命令に
おいては明白ではない。テスト条件が一致すると、命令
ストリームは分岐目的命令に分岐する。分岐条件が一致
しない場合は、分岐命令に続く次のアドレスは順次アド
レスとなる。

【００２８】パイプライン式命令実行においては、分岐
テストに固有の不確実性に関し、分岐テストが完了する
まで、何れの命令の発行も阻止することに直面し、この
テストにおいて初めて正確なアドレスが決定され、対応
する命令がフェッチされる。しかし、これにより各分岐
命令に続き、パイプラインにおける遅延が生ずる。しか
し一方では、分岐結果を予測することが可能であり、分
岐命令の直後に予測される命令をフェッチしパイプライ
ン内に配置することが可能である。

【００２９】分岐命令の予測結果が分岐が発生しないこ
とを示す場合は、単に分岐命令のアドレスをその長さ相
当分だけ加算し、次に続く命令を発行することにより、
命令フェッチが通常に行われる。命令フェッチ及び発行
ユニット内に命令バッファを設け、更新されたアドレス
によりこのバッファの順次内容を有効化する。このバッ
ファにはストリーム内における分岐命令に続く命令シー
ケンスが含まれる。一方、分岐目的アドレスが結果とし
て予測される場合は、バッファはクリアされ、予測され
る分岐目的アドレスより始まる命令シーケンスがキャッ
シュより“プリフェッチ”され、命令フェッチ及び発行
ユニットの命令バッファ内に配置されねばならない。

【００３０】分岐命令の実行の後、分岐テスト結果によ
り不正な予測が行われたことが示される場合は、命令バ
ッファの内容はクリアされ、正当な命令シーケンスの
“再フェッチ”がバッファに取り込まれねばならない。

【００３１】上述の背景で述べたビット予測及び分岐目
的バッファ・メカニズムは、ダイナミックに分岐命令の
結果を予測するための２つの主要メカニズムである。

【００３２】第１のメカニズムでは、いずれの分岐命令
も、キャッシュ内において、命令の結果を予測するため
に使用される１つ或いはそれ以上のビットに伴われる。
この点に関し、この情報は分岐命令の最終結果を示すよ
うに規定される。

【００３３】第２のメカニズムでは、表（“分岐目的バ
ッファ”）が命令キャッシュとは別に維持される。命令
キャッシュ内には最近実行された分岐命令の履歴が維持
される。好適には、キャッシュ内の分岐命令のアドレス
は分岐目的バッファをアドレスするために使用される。
分岐目的バッファは各キャッシュされる分岐命令に対
し、その最後の結果の記録及び分岐目的アドレスを有す
る。実行されてはいないがキャッシュされる分岐に対し
ては、それが最初に命令の発行によりキャッシュから取
り込まれる時点で、同一或いは類似のプログラムにおけ
る分岐命令の統計的プロファイルに基づき、所定の結果
がその命令に対して獲得される。これらのメカニズム及
びそれを実行するための方法等は、前に参照したSmith
及びLee等による文献で詳細に説明されている。

【００３４】命令が１つ或いはそれ以上の未使用複合ビ
ットを含むＳＣＩＳＭアーキテクチャにおいて、この未
使用ビットは分岐命令の結果を予測するために有利に使
用される可能性がある。こうして、２つ或いはそれ以上
のハーフワードを含む分岐命令にとって、複合プリプロ
セッサにより生成される余分のビット（単数または複
数）は命令及びキャッシュと共に記憶され、命令の結果
を予測するために使用される。好適には、命令が複合さ
れるかどうかを決定するために複合プリプロセッサによ
り実行される規則は、単一ハーフワードの分岐命令を複
合せず、それによりサービス用の単一のＣビットを分岐
結果の予測において解放する。

【００３５】図３の表は、System/370デジタル・コンピ
ュータ製品の拡張システム・アーキテクチャ（ＥＳＡ）
バージョン用の分岐命令リストである。これらの命令、
フォーマット、機能、及びテストは全て、C.J.Kacmarに
よるIBM 370 ASSEMBLYLANGUAGE WITH ASSIST、Prentis
Hall、1988 の特に第６章などを参照することにより理
解される。また、図３の表は代表的な命令トレースに関
する、全ての命令に関するSystem/370分岐命令の頻度、
分岐命令だけに関する頻度、実施される分岐及び未実施
の分岐の頻度、及びハーフワード内の長さを示す。例え
ば、ＢＣ命令は代表的トレース命令の１７．２３％を構
成し、トレースにおける全ての分岐命令の６８．６％を
構成する。

【００３６】分岐命令発行処理本発明は、命令を単独に或いは並列に実行するための多
重並列パイプラインを含むコンピュータの中央処理装置
（ＣＰＵ）における分岐命令の処理に関する。発明者は
こうしたＣＰＵの並列性は、パイプラインから次に示す
分岐命令を除去することにより拡張できるという重要な
見解を示すものである。すなわち、この分岐命令は実行
ユニット・オペレーションを要求しないが、前の命令の
実行により作成されるテスト条件だけを要求するもので
ある。これらの命令に対する条件テストは、他の命令の
実行に正確に同期して達成される。これは実行パイプラ
インにおけるＣＰＵの指示信号を拡張して行われる。全
ての他の分岐命令はパイプラインに入力され、そこでこ
れらのロケーションは同様の指示信号によりトラックさ
れる。多重パイプラインの提供により、複数の分岐命令
の条件を、同じパイプライン・サイクル内でテストでき
る可能性が生じる。これにより、多重パイプライン・ア
ーキテクチャに固有の並列性を拡張することが可能とな
り、並列命令実行を支援する。

【００３７】本発明は図１の環境において表される命令
フェッチ及び発行ユニットの分岐処理ユニット１５で実
施される。これは図４で実行パイプライン部分と共に更
に詳細に表される。レジスタ、ポインタ、及びステート
・マシンを含む、これらユニットの全ての記憶要素は、
パイプライン・クロックに応じてその出力を変化する。

【００３８】図４では、命令フェッチ及び発行ユニット
１４はパイプライン式実行回路に対し、処理すべき命令
ストリームを提供する。ストリームの中断は、分岐命令
の結果の予測、及び予測されるストリームの命令バッフ
ァ（ＩＢ）へのプリフェッチにより減少される。プリフ
ェッチされた命令は、分岐命令の真の結果が決定される
まで、実行のために実行パイプラインに供給される。こ
の点に関し、分岐方向が誤って予測された場合は、プリ
フェッチされたストリームの実行はキャンセルできる。
予測ミス或いは不正な分岐目的アドレスの場合は、正し
い命令が実行パイプラインのデコード・ステージにフェ
ッチされ、続く命令がＩＢにフェッチされる。

【００３９】図４の参照番号１４で示される命令フェッ
チ及び発行ユニットは、アライン（位置合わせ）・ユニ
ット５０、命令バッファ５２、命令バッファ出力アライ
ナ５５、及び複合命令レジスタに命令を配置するために
マルチプレクス及びフォーマットするマルチプレクサ／
フォーマッタ・ユニット６０により構成される。

【００４０】命令フェッチ及び発行ユニット１４はキャ
ッシュ管理ユニット１６に命令フェッチを発行し、ＦＥ
ＴＣＨ信号及びフェッチ・アドレスを提供する。各フェ
ッチ・アドレスは４つの連続するワード（“カッドワー
ド”）及びそれらに関連するＣビットをアドレスする。
カッドワード及び関連するＣビットはアライン・ユニッ
ト５０に提供され、ここでテキストは回転され、左境界
にフェッチされる第１ハーフワードを位置合わせする。
このアライナ出力は直接ＣＩＲフォーマッタ６０に送ら
れ、ＣＩＲレジスタ２０及び２１の内の可能な宛先に送
られる。次に、同じテキストが現ＩＢロード・ポインタ
５３値に基づき、右に回転される。これによりテキスト
位置合わせ機能が完了し、フェッチからの第１ハーフワ
ードが、最初に使用可能なＩＢレジスタ５２ロケーショ
ンにゲートされる。残りのハーフワードは残りの使用可
能なロケーションに入力される。既知のように、IBMSys
tem/370命令セットにおいては、命令フォーマットは命
令オペコードの最初の２ビットにより、ハーフワードに
おける命令長を提供する。従って、最初の命令が参照ポ
イントに位置合わせされると、その長さコードが続く命
令の開始ロケーションを与える。

【００４１】命令バッファ５２のレジスタは図４には示
されていないが、命令バッファは従来設計に従い、ロー
ド・ポインタ５３の制御下でロードされるものと仮定す
る。ロード・ポインタはサイクル式カウンタであり、次
に使用可能なレジスタを指示するために、命令がＩＢレ
ジスタにロードされる度にインクリメントされる。

【００４２】ＩＢレジスタ５２のアンロードは、アンロ
ーダ５７の制御により、命令バッファ出力アライナ５５
を介して行われる。出力アライナ５５は、出力ポインタ
５７により指示されるＩＢ命令テキストを境界の左方へ
回転する。境界から始まり、命令テキストの５ハーフワ
ードが対応するＣビットと共にＣＩＲマルチプレクサ／
フォーマッタ６０に送られフォーマットされ、最終的宛
先は複合命令レジスタ２０及び２１となる。

【００４３】ＣＩＲマルチプレクサ／フォーマッタ６０
は５ハーフワードの命令テキストを受け取り、位置決め
のために最大２つまでの命令を、複合命令レジスタ２０
及び２１に生成する。命令テキストに加え、マルチプレ
クサ／フォーマッタは各ハーフワードに対しＣビットも
受け取る。このユニットのフォーマット部は、次に制御
Ｃビットと共に第１の命令の長さを調査する。命令の制
御Ｃビットが、命令は次に続く命令と複合されているこ
とを示すと、続く命令がＣＩＲＲ２１にロードされる。
好適には命令の“制御”Ｃビットは、命令の第１のハー
フワードに関連するＣビットである。

【００４４】ＣＩＲマルチプレクサ／フォーマッタ６０
はアライン・ユニット５０或いは出力アライナ５５の何
れかをソースとし、これは命令バッファが空かそうでな
いかに依存する。空の場合は、フェッチされるカッドワ
ードの最初の５ハーフワードは、アライン・ユニット５
０から直接マルチプレクサ／フォーマッタに転送され、
残りのハーフワードはＩＢに供給される。これは命令の
最初のフェッチ期間或いはパイプラインをクリアする再
フェッチ期間内における、パイプラインの充填による遅
延を回避する。

【００４５】好適には、ＩＢ５２は１．５カッドワード
長であり、プリフェッチされた命令テキストを含む。こ
のテキストは順次記憶ロケーションからのものではない
であろう。なぜなら、分岐プロセッサは実施されると予
測される分岐のための命令の目的ストリームをプリフェ
ッチするからである。これらの分岐目的ストリームはＩ
Ｂの論理実行ポイントにロードされ、そこにこれまで存
在していた順次命令ストリームをオーバライトする。２
つのポインタ、すなわちロード・ポインタ５３及びアン
ロード・ポインタ５７がＩＢ５２と関連する。

【００４６】ロード・ポインタ５３は循環カウンタであ
り、その値は新たなテキストがＩＢ５２にロードされる
度にインクリメントされる。ＩＢ５２の分岐目的ロード
のために、ロード・ポインタ値は、目的フェッチを開始
した分岐命令に続く命令テキストのハーフワードを指示
するようにセットされる。ロード・ポインタ５３の計数
はＩＢＬＰＴＲ信号により実施される。

【００４７】アンロード・ポインタ５７は常時ＩＢ５５
の命令境界を指示し、複合命令レジスタにロードされる
命令テキスト長だけ進められる。このポインタ値の前進
は複合命令レジスタにロードされるテキスト長を計算
し、それを現値に加算することにより達成される。アン
ロード・ポインタの現在値はＩＢＵＬＰＴＲ信号により
与えられる。

【００４８】オペレーションの際、命令シーケンスの連
続するハーフワード部分はマルチプレクサ／フォーマッ
タ６０に供給され、これらは調査され複合命令レジスタ
にロードされる。但し、ここで２つの例外が存在する。
マルチプレクサ／フォーマッタがＢＣ或いはＢＣＲ命令
に遭遇すると、それにより次の命令の境界にインクリメ
ントされる。その際、ＢＣ或いはＢＣＲ命令を複合命令
レジスタへの入力として有効化しない。これはデコーダ
６４及び６５のデコーダ対により達成される。デコーダ
６４はマルチプレクサ／フォーマッタの現左方境界上の
命令のオペコードを受け取り、デコーダ６５はその直後
の命令のオペコードを受け取る。どちらかのデコーダが
ＢＣ或いはＢＣＲ命令を検出すると、その出力を活動化
する。出力はマルチプレクサ／フォーマッタ・ユニット
にフィードバックされ、複合命令レジスタへのデコード
された分岐命令のロードを阻止する。他の全ての分岐命
令は複合命令レジスタへロードされる。このように、未
使用サイクルを導入すること無く、ＢＣ及びＢＣＲ命令
が命令パイプラインから除去される。しかし、命令スト
リームにおけるＢＣ或いはＢＣＲ命令の存在は、２つの
ラッチ６６及び６７の何れかの出力により告げられる。
ラッチ６６はデコーダ６４の出力を受け取り、一方ラッ
チ６７はデコーダ６５の出力を受け取る。ラッチ６６及
び６７はパイプライン・クロックによりクロックされ、
この信号の１周期間だけセット状態を維持する。同じパ
イプライン・クロック・サイクルにより命令テキストが
複合命令レジスタに入力される。従って、ラッチ６６及
び６７の内容はパイプラインの命令デコード（ＩＤ）ス
テージに対応する。

【００４９】複合命令レジスタ２０及び２１に入力され
る分岐命令は、命令デコード・サイクル期間に７０及び
７２でデコードされる。パイプラインのアドレス生成
（AGEN）ステージにおいて、４つのラッチ７３、７４、
７５及び７６が提供され、それぞれはラッチ６６、デコ
ーダ７０、デコーダ７２及びラッチ６７から出力を受け
取る。最後に対のラッチ７９及び８０がパイプラインの
実行ステージにおいて提供され、アドレス生成ステージ
においてラッチ７４及び７５の内容を受け取る。

【００５０】ラッチ・シーケンス６６、７３は、パイプ
ラインのＩＤ及びＡＧＥＮステージを通じ、パイプライ
ンの“左”側におけるＢＣ或いはＢＣＲ命令の存在を示
すトークン（token）を進める。これはＣＩＲＬ２０を
通じて制御されるパイプライン部分に相当する。“ＢＣ
Ｌ”トークンと称されるトークンが、これらの２つのパ
イプライン・ステージを通じ、パイプラインのオペレー
ションに同期して進められる。同様に、ラッチ６７及び
７６はパイプラインの右側の“ＢＣＲ”トークンをＢＣ
及びＢＣＲ命令に対応して進める。これらは除去される
ために、ＣＩＲＲ２１を通じてパイプラインに供給され
る。一般的に、ＢＣＲ及びＢＣＬトークンは“ＢＣ”ト
ークンと称され、ＢＣ或いはＢＣＲ命令のデコードを表
す。

【００５１】ＣＩＲＬ２０を通じてパイプラインに入力
される全ての分岐命令に対し、トークンはパイプライン
のＡＧＥＮ及びＥＸステージを通じ、ラッチ７４及び７
９により進められる。こうしたトークンはＢＲＬトーク
ンと称される。同様に、ＢＲＲトークンは、ＣＩＲＲ２
１を通じてパイプラインに入力される分岐命令に対応
し、パイプラインの右側のＡＧＥＮ及びＥＸステージを
通じて転送される。一般に、ＢＲＲ及びＢＲＬトークン
は“ＢＲ”トークンと称され、ＢＣ及びＢＣＲ命令以外
の分岐命令のデコードを表す。

【００５２】実行ユニット３４及び３６は従来式にパイ
プラインにより制御され、パイプライン内の命令により
要求される計算及び論理オペレーションを実行する。命
令の実行結果は条件コード・ユニット８３に供給され、
これは命令実行結果に従い、条件コード（ＣＣ）をセッ
トする。分岐条件（ＢＣ）ユニット８５は、実行ユニッ
ト３４及び３６の出力に応じて、分岐条件信号を提供す
る。

【００５３】パイプライン・オペレーションはＡＮＤゲ
ート８８により命令発行と同期される。ゲート８８はＭ
ＣＳの出力であるＥＮＤ＿ＯＰビットを受け取り、これ
はパイプライン条件センサ８７の出力と結合される。セ
ンサ８７はパイプライン・オペレーションの中断を要求
する条件を検出するために、実行パイプラインのＡＧＥ
Ｎ及びＥＸステージをモニタする。阻止条件が存在しな
い限り、現在アクセスされるマイクロ命令のＥＮＤ＿Ｏ
Ｐビットがセットされていれば、ゲート８８は信号ＮＥ
ＸＴを活動化する。ＥＮＤ＿ＯＰビットはＣＩＲの現内
容に対応するマイクロ命令シーケンスの終了を示す。Ｎ
ＥＸＴが活動化されると、マルチプレクサ／フォーマッ
タは次の命令或いは命令対を複合命令レジスタに入力す
ることを許可され、デコーダ６４、６５、７０及び７２
が活動許可される。

【００５４】分岐条件処理本説明では、分岐条件処理は、現命令ストリームにおけ
る分岐命令の検出、分岐が実行されるかどうかの予測、
分岐が実施されるものと予測される分岐に対する命令テ
キストのプリフェッチ、分岐命令に固有の分岐テストの
実行、及び必要に応じて実行される訂正命令の“再フェ
ッチ”（refetch）の発行により構成される。

【００５５】第１ステップは、実行パイプラインの第１
ステージへのロード以前に、全ての命令テキストを検索
して行われる。この検出はＩＢ５２の入力において、プ
リフェッチ或いは再フェッチされるカッドワードの最初
の５ハーフワードに対して実行され、またＩＢ５２の出
力では他の全ての命令テキストに対して実行される。各
分岐命令が検出されると、命令シーケンス内におけるそ
のテキスト及びロケーションが分岐処理ユニット１５に
提供される。分岐命令のデコードに基づき、分岐処理ユ
ニットは分岐命令が実行されるかどうかを予測し、その
予測に従い必要なフェッチ或いはプリフェッチを開始す
る。分岐命令ロケーション情報は、キャッシュ内におけ
る分岐命令のアドレスを生成するために使用される。分
岐目的アドレス（ＢＴＡ）が生成され、次に、分岐命令
テキスト、そのアドレス、及びプリフェッチ（ＰＦ）標
識が分岐キューに入力される。分岐キューはＦＩＦＯキ
ューとして動作する。ＰＦ標識は分岐目的アドレスにお
けるプリフェッチが実行されたかどうかを示すように規
定される。この点に関し、ＰＦ標識は、分岐が実行され
る（ＰＦ＝１）、或いは実行されない（ＰＦ＝０）と予
測されたことを表すトークンである。実行される場合
は、もちろん、プリフェッチが発生しており、非実行の
場合は、順次フェッチが継続する。

【００５６】分岐命令は、実行パイプラインにおけるＢ
Ｃ及びＢＲトークンに応じて、ＢＱからデキューされ
る。最大２命令が同時にデキュー可能である。デキュー
された命令は、分岐テスト・ユニットでテストされる。
このユニットは実行ユニット・オペレーションに応じて
生成されるＣＣ及び分岐条件を使用し、分岐が実行され
るかどうかを決定する。その結果はデキューされた命令
のＰＦ標識と比較され、再フェッチを行うかどうかを決
定する。再フェッチが要求されると、正しい再フェッチ
・アドレスが生成され、キャッシュ１２により使用され
る。ここで実行パイプラインは再フェッチの際にクリア
されるように構成される点を強調しておく。これは従来
技術の範中に帰属する。

【００５７】分岐処理ユニットはデコード及び境界検出
ユニット９２を含み、このユニットは命令テキスト及び
命令ロケーション情報を、命令フェッチ及び発行ユニッ
ト１４のアライン・ユニット５０もしくはＩＢ５２の一
方から受け取る。ソースは順次（Ｓ）信号或いはプリフ
ェッチ（ＰＦ）信号に応じ、マルチプレクサ（MUX）９
０を通じて選択される。ＰＦ信号はプリフェッチが行わ
れるときは活動状態であり、この場合、ＩＢ５２の内容
はプリフェッチされる命令によりオーバライトされる。
これにより５ハーフワードの命令テキストと関連するＣ
ビットが、アラインメント・ユニット５０から提供され
る。それに続き、ＰＦ信号は非活動化し、Ｓ信号がＩＢ
５２からアライン・ユニット５５により現在選択されて
いる５ハーフワードを選択し、マルチプレクスして複合
命令レジスタ内にフォーマットする。アラインメント・
ユニット５０の出力はプリフェッチ・サイクル期間中は
検索される。なぜなら、キャッシュ・インタフェース・
テキストが命令境界上の最初に提供されるからである。
命令デコードを実行するためには、命令境界を知る必要
があるため、この検索は何れの検出においても要求され
る。順次フェッチ期間中は、命令テキストはＩＢ５２か
ら獲得される。ＩＢ５２では分岐命令はアライン・ユニ
ット５０の場合と同様な方法により検出される。分岐命
令が検出されると、これは制御信号（ＢＲＤＥＣ）に
より分岐命令レジスタ（ＢＩＲ）９８にゲートされる。
分岐命令を検索するにおいて、デコード／境界検出回路
９２は、命令処理ユニットに転送される各命令を検査す
る。ここで改めて、各命令は自身の命令長の指示を有す
ることを思い出してみたい。検査する各命令に対し、デ
コード／境界検出ユニット９２は分析すべき次の命令の
命令長に相当する更新値を生成する。この値はレジスタ
９３に保持される。ユニット９２による分岐命令の検出
は、信号（ＢＲＤＥＣ）により示され、この信号は命
令を分岐命令レジスタ９８にゲートする。レジスタ９８
における分岐命令のアドレスは分岐命令アドレス生成
（ＢＩＡＧ）ユニット９９により提供され、このユニッ
トは最後のプリフェッチ或いは再フェッチ・アドレスか
ら、９３に保持されるストリームの更新値分だけ連続的
に更新する。

【００５８】予測デコード回路９６は分岐命令のデコー
ドに応じて、信号（PREDICT）を発する。この信号は、
分岐命令が実行される時には、予測される結果を示すよ
うに規定される。この場合は、分岐目的アドレス（ＢＴ
Ａ）がプリフェッチのために提供されねばならない。ま
た、実行されない場合には、次の順次アドレスが提供さ
れねばならない。PREDICT 信号は予測アドレスを生成す
るアドレス予測回路９４に供給される。予測アドレスは
マルチプレクサ（ＭＵＸ）９５を介して、命令フェッチ
・アドレス・レジスタ（ＩＦＡＲ）９７に供給される。
このレジスタは命令フェッチのために、キャッシュ管理
メカニズムによって使用される。分岐結果が実行或いは
非実行と予測されるかに関しては、アドレス予測回路９
４はまた分岐目的アドレス（ＢＴＡ）を生成し、これは
分岐命令アドレス（ＢＩＡ）及びＰＦトークンと共に、
分岐命令テキストがＢＩＲ９８から得られる時点で有効
となる。

【００５９】命令ストリームにおいて識別され、分岐処
理ユニット１５によりデコードされた分岐命令は、ＦＩ
ＦＯ分岐キュー（ＢＱ）１０２に待機される。分岐命令
が９８に登録される度に、ＢＴＡ、ＢＩＡ及びＰＦトー
クンと共に、命令テキストは分岐キュー１０２に入力さ
れる。

【００６０】分岐キュー入力は実行パイプラインにおい
て伝搬されるＢＣ及びＢＲ信号に応じてデキューされ
る。図４で示すように、ＢＱ１０２は２出力１０２ａ及
び１０２ｂを有し、これらは最大２つの分岐命令までが
同時にデキューされることを許可する。

【００６１】デキューされた命令は分岐テスト・ユニッ
ト１０３に供給される。このユニットはＣＣ及び分岐条
件信号を実行ユニットから受け取る。分岐テスト・ユニ
ットはこれらの条件を使用して、デキューされた命令に
対する適切な結果を決定し、その決定結果を予測結果と
比較し、必要に応じて、分岐結果が不正に予測されたこ
とを示すREFETCH信号を生成する。

【００６２】パイプライン・クロック周期の間、REFETC
H 信号が活動状態の場合に、分岐キュー１０２は、不正
に予測された分岐命令と共に記憶される分岐命令アドレ
ス及び分岐目的アドレス情報を再フェッチ・アドレス回
路１０５に提供する。再フェッチ・アドレス回路１０５
は、不正に予測された分岐命令と共に記憶されるアドレ
ス情報を使用し、正しい命令フェッチ・アドレスを生成
する。REFETCH 信号が活動状態の場合、マルチプレクサ
９５は再フェッチ・アドレス・ユニット１０５の出力を
選択し、命令フェッチ・アドレス・レジスタ９７におい
て訂正アドレスのレジストレーションが行われる。

【００６３】分岐処理ユニット内の命令フェッチ・シー
ケンサ１０６は、命令発行ユニット内のロード及びアン
ロード・ポインタ５３及び５７の出力、予測デコード・
ユニット９６からのPREDICT信号、及び分岐テスト・ユ
ニットからのREFETCH信号を受け取る。シーケンサ１０
６はPREDICT信号の状態に応答し、ＦＥＴＣＨ或いはPRE
FETCH信号をセットする。ＦＥＴＣＨ信号は、もちろん
命令フェッチ及び発行ユニットに対し、順次フェッチが
進行中であることを指示し、その結果、ユニット内の全
てのポインタ及びアライナの順次インクリメンテーショ
ンが行われる。PREFETCH信号が活動状態の場合は、命令
フェッチ及び発行ユニット内のポインタ及びアライナ
は、命令フェッチ・アドレス・レジスタ９７で使用可能
なプリフェッチ・アドレスより開始される。REFETCH 信
号が活動状態の場合は、分岐命令の不正な予測が行われ
たことを示し、シーケンサ１０６は命令フェッチ及び発
行ユニット内のレジスタ、アライナ、及びポインタの現
内容と命令パイプラインの内容を無効とする信号（INVA
LID）（図４では図示せず）を生成する。

【００６４】順次フェッチの間、シーケンサ１０６は、
ＩＢ５２が命令テキストを受容する領域を有する限り、
ＦＥＴＣＨ信号を活動状態に維持する。しかし、ロード
・ポインタ５３がアンロード・ポインタ５７の値と等し
い値まで進むと、ＩＢ５２は充填状態と見なされ、ＦＥ
ＴＣＨ信号は非活動状態となる。

【００６５】ＯＲ回路１０７はREFETCH、FETCH及びPREF
ETCH信号をキャッシュ・フェッチ（CFETCH）信号とし
て、キャッシュにゲートする。CFETCH信号が活動化され
ると、命令フェッチ・アドレス・レジスタ９７の内容は
有効化され、キャッシュ管理はキャッシュからレジスタ
９７のアドレスよりフェッチを開始する。

【００６６】分岐処理ユニットの第１の実施例図５は分岐処理ユニット１５の第１の実施例を示し、こ
こでは分岐予測が複合プリプロセッサ１０（図１）によ
り生成されるＣビットを通じて行われる。この実施例で
は、分岐命令は、少なくともその制御Ｃビットと共に、
分岐命令レジスタ９８に記憶される。分岐目的アドレス
は無条件に生成され、デコードされる分岐命令のＣビッ
トは、分岐目的アドレスがキャッシュに送られるかどう
かを決定するために使用される。分岐が実行されるもの
と予測されると、分岐目的アドレスがキャッシュに送ら
れ、プリフェッチが開始される。プリフェッチされた命
令テキストは前述のように命令境界上に分割され、正に
デコードされた分岐命令に続いて命令バッファ内に配置
される。分岐命令に順次続く命令のアドレスは、分岐が
不正に予測された場合は、ＢＱに保管される。

【００６７】分岐が非実施であると予測されると、分岐
目的アドレスが無条件に生成されるが、ＢＱ内にのみ保
管される。分岐処理ユニットは、次のサイクルにおいて
ＩＢ内でロケーションが有効になれば、ＩＢ内の最後に
有効な命令テキストに続く命令テキストのアドレスを送
り、順次フェッチを開始する。換言すれば、分岐処理ユ
ニットは、実行されると予測される分岐に遭遇しない限
り、命令バッファを順次命令で充填しようとする。この
ようにして、分岐処理ユニット１５は予測される分岐パ
スに基づき、実行ユニット及び自身により処理される単
一の命令ストリームを作成する。

【００６８】本実施例及び次に示す実施例を理解するに
当たり、命令バッファ５２はポインタの制御によりロー
ド及びアンロードされることを強調しておく。こうし
て、命令バッファが１度に複数の分岐命令を含む間に、
これはシリアルにアンロードされ、何れの時にも単一の
命令だけがＢＩＲ９８及び分岐処理ユニットに提供され
て処理及び待機される。こうして、図５では、ＢＩＲ９
８に現在、存在する分岐命令がデコーダ２０４に供給さ
れ、これが命令のオペコードを検査し、そのフォーマッ
トを決定する。例えば、命令がＲＲタイプの場合は、オ
ペランドに２つのレジスタ指定を含み、その１つは分岐
目的アドレスである。一方、レジスタがＲＸタイプの場
合は、Ｄ（ＸＢ）により与えられるアドレスを含む。デ
コードされた命令タイプは３対１の加算器２０２を制御
し、この加算器は命令のレジスタ・フィールドによりア
ドレス指定されるGPRのCOPY200から入力を受け取る。命
令がＲＲタイプの場合は、GPR COPY200からの１つのオ
ペランド出力が暗黙のゼロに加算される。命令がＲＸタ
イプの場合は、命令のＸ及びＢフィールドに示されるGP
R COPYオペランドは、命令のＤフィールド内の変位に加
算される。加算器２０２はデコーダ２０４の出力により
同様に制御されて、ＲＳタイプの命令の関連フィールド
を正確に加算し、分岐目的アドレスを生成する。

【００６９】分岐処理ユニットはまた、プリフェッチ・
アドレス・レジスタ（ＰＦＡＲ）２０６及び分岐命令ア
ドレス・レジスタ（ＢＩＡＲ）２０９を含む。命令シー
ケンスが最初に命令フェッチ及び発行ユニットにロード
されるか、或いはプリフェッチもしくは再フェッチ・オ
ペレーションが取られると、ＰＦＡＲ２０６及びＢＩＡ
Ｒ２０９の内容はフェッチされる命令のアドレスに初期
化される。その後、カッドワードが順次フェッチされる
度に、ＰＦＡＲ２０６の内容は２０７でハーフワード単
位でフェッチの長さ分だけ更新される。こうして、ＰＦ
ＡＲは常にキャッシュから現在フェッチされたカッドワ
ードの開始アドレスを指示する。ＢＩＡＲ２０９は２１
０において、レジスタＵＰＤ９３の内容分だけ更新され
る。これは分岐命令間の長さに相当する。従って、ＢＩ
ＡＲ２０９は常に現在アンロードされた分岐命令のアド
レスを指示する。

【００７０】分岐キューは第１の実施例において１０２
ａにより表される。図５では、分岐キュー１０２ａは４
つのレジスタ２２０−２２３で構成され、これらはロー
ド及びアンロード・ポインタ２３４及び２３２の制御に
より、それぞれロード及びアンロードされる。分岐命令
が２０４でデコードされる度に、そのオペコードがロー
ド・ポインタ２３４から出力されるロード制御（LD CNT
RL）信号により指示されるレジスタのＯＰフィールドに
配置される。分岐命令のオペコードは分岐キュー１０２
ａの指示されるレジスタにロードされ、その命令アドレ
ス及び分岐目的アドレスは、それぞれそのレジスタのＢ
ＩＡ及びＴＧＴフィールドにロードされる。ＢＩＡフィ
ールド値はインクリメンタ２１０の出力から得られ、一
方、ＴＧＴフィールド値は加算器２０２の出力から得ら
れる。また、Ｃビットが現在アンロードされる分岐命令
のオペコードと共にロードされ、分岐結果を予測するた
めに使用される。レジスタのロードに続き、ロード・ポ
インタが次のレジスタにインクリメントされる。

【００７１】分岐キュー・レジスタ２２０を参照する
と、これは４つのフィールド、C、OP、BIA、及びTGTを
有し、それぞれ待機される分岐命令の、予測Ｃビット、
オペコード、命令アドレス、分岐目的アドレスを示す。
このレジスタのＣ及びＯＰフィールドの出力は、マルチ
プレクサ（OPMUX）２２８に供給され、他のキュー・レ
ジスタ２２１、２２２及び２２３の対応するフィールド
についても同様である。更に、Ｃフィールドの内容は２
２２で反転され、この反転信号は２対１のマルチプレク
サ２２４をオペレートするために使用される。ここでＣ
ビットは、実施される分岐を予測するためにセットさ
れ、非実施の分岐を予測するためにリセットされるもの
と仮定すると、Ｃビットの値の反転により、マルチプレ
クサ２２４は予測とは反対の結果ためのアドレスを選択
する。この結果は再フェッチ・マルチプレクサ（ＲＦＡ
ＭＵＸ）２２６を通じて使用可能となる。残りの各レジ
スタ２２１、２２２及び２２３に関しても、同様にＲＦ
ＡＭＵＸ２２６に結合され、それぞれのレジスタにおけ
る分岐命令の非予測シーケンスを提供する。

【００７２】ＢＣＬ或いはＢＣＲトークンが実行パイプ
ラインのＡＧＥＮステージに到来すると、関連する分岐
トークンがラッチ７３或いは７６からそれぞれ得られ
る。同様に、ＢＲＬ及びＢＲＲトークンはパイプライン
の実行ステージにおいて、それぞれラッチ７９及び８０
より得られる。ＢＣＬ、ＢＣＲ、ＢＲＬ及びＢＲＲトー
クンは、アンロード・ポインタ２３２をインクリメント
するために使用される。アンロード・ポインタ２３２は
ＯＰＭＵＸ２２８及びＲＦＡＭＵＸ２２６をセットし、
次の１つ或いは２つの分岐キュー・レジスタを選択し、
その内容を分岐テスト回路１０３ａに提供する。

【００７３】分岐テスト回路１０３ａは１０２ａからデ
キューされる分岐命令のオペコードにより指示される分
岐テストを実施する。このテストは、仕組まれた分岐テ
ストを実行し、その結果をこの分岐命令のＣビットのセ
ットにより指示される予測結果と比較する。実際の結果
が予測結果と一致すると、入力が分岐キュー１０２ａか
ら除去され、命令が完了する。予測が実際の分岐判断と
一致しない場合は、分岐テスト・ユニット１０３ａはＲ
ＥＦＥＴＣＨ信号を活動化する。ＲＥＦＥＴＣＨ信号が
セットされると、現在アンロードされる分岐キュー・レ
ジスタ内の選択された命令アドレスがＲＦＭＵＸ２２６
を通じて提供される。これはＲＥＦＥＴＣＨアドレスと
呼ばれる。ＲＥＦＥＴＣＨアドレスが順次アドレスの場
合は、アンロード・ポインタ２３２により指示されるレ
ジスタのＢＩＡフィールド値がＲＦＡＭＵＸ２２６によ
り出力される。この場合、分岐オペコードにおける分岐
命令長コード（ＩＬＣ）がＢＩＡと共に、インクリメン
タ２３５に提供される。２３５はこれら２つの値を加算
し、ＲＥＦＥＴＣＨアドレスとして命令ストリーム内の
テストされた分岐命令に続く命令のアドレスを提供す
る。ＲＥＦＥＴＣＨ信号の活動化により、命令アドレス
・マルチプレクサ（ＩＡＭＵＸ）２１５がセットされ、
インクリメンタ２３５の出力を選択し、この値をＰＦＡ
Ｒ２０６及びＢＩＡＲ２０９と同様に、命令フェッチ・
レジスタ（図４の参照番号９７）に提供する。ＲＥＦＥ
ＴＣＨアドレスが順次アドレス以外の場合は、分岐目的
アドレスが選択され、分岐ＩＬＣ値がゼロにセットさ
れ、インクリメンタ２３５は単にＲＥＦＥＴＣＨアドレ
スとして分岐目的アドレスをパスする。ＲＥＦＥＴＣＨ
信号が非活動状態の場合は、ＩＡＭＵＸ２１５はＢＩＲ
９８内のデコードされる分岐命令のＣビットにより規定
される。分岐が非実施と予測されると、ＰＦＡＲ２０６
の内容が前回のフェッチ長によりインクリメントされ、
ＩＦＡＲ９７、ＰＦＡＲ２０６及びＢＩＡＲ２０９に提
供される。そうでない場合は、加算器２０２の出力がＩ
ＡＭＵＸ２１５により選択される。

【００７４】ここでＲＥＦＥＴＣＨ信号の活動化は分岐
結果の予測ミスを示す点に注意を要する。従って、この
信号は、予測ミスされた分岐命令に対応するＣビットの
キャッシュされたバージョンを規定するために使用され
る。この命令アドレスは現在アンロードされる分岐キュ
ー・レジスタのＢＩＡフィールド内で得られる。

【００７５】ＢＣ及びＢＣＲ命令に対して分岐テスト・
ユニット１０３ａにより実施される分岐テストは、単に
命令内のマスク・フィールドに対して、条件コード（Ｃ
Ｃ）をテストして行われる。従って、分岐キュー・レジ
スタのＯＰフィールドは、これらの命令に対応するオペ
コード及びマスク・フィールドを記憶するのに十分広く
なければならない。更に、これらの命令には実行サイク
ルは必要なく、少なくとも実行パイプラインで見受けら
れるように実行に時間を要さない。他の全ての分岐命令
はＧＰＲ値を変更するのに実行サイクルを必要とする。
ＥＸ命令は汎用目的レジスタを読み出し、フェッチされ
る命令テキストを変更する。これは概念的には実行サイ
クルを要する。分岐処理ユニット１５は、この命令（Ｂ
ＲＬ或いはＢＲＲトークンを生成するＢＲ命令としてデ
コードされる）の実行サイクルに続いて、分岐テストを
実施する。その後は、上述したＢＣ及びＢＣＲ命令の場
合と同様にオペレートする。

【００７６】好適には、ＢＣ及びＢＣＲ命令は他の命令
と複合されない。なぜなら、これらは実行サイクルを要
せず、それ以外に可能な複合を阻止するからである。既
述したように、命令フェッチ及び発行ユニットはこれら
の命令をデコードするが、ＩＢ内でこれらに遭遇すると
これらをスキップし、次のＢＣ／ＢＣＲ以外の命令をロ
ードする。他の分岐命令は（一定の制約条件の下で）複
合され、実行パイプラインに入力される。こうして、分
岐ユニットにとって、単一サイクルにおいて２つの分岐
テストを実施することが可能となる。

【００７７】次に、ＢＣＴ命令がＡＲ命令に続き、これ
らが複合される場合について考察する。ここでＢＣ命令
がＢＣＴ命令に続き、ＡＲ命令の実行により生じる条件
コードをテストするものと仮定する。この場合、ＡＲ命
令はＢＣＴ命令がＣＩＲＲ２１に存在するとき、ＣＩＲ
Ｌ２０の出力で検出されよう。これらのレジスタへの入
力が行われると、ＢＣが検出され、６４でデコードさ
れ、ＡＲ及びＢＣＴのそれぞれ２０及び２１へのラッチ
に続くパイプライン・クロックの周期の間に６６にラッ
チされる。ＢＣＴが２１にラッチされると、それは７２
で検出され、ＢＲトークンがＢＲＲ７５に入力される。
続くサイクルでは、ＢＣトークンが７３にラッチされ、
ＢＲＲトークンは８０にラッチされる。従って、両方の
トークンはパイプラインにおいて、分岐キューをアンロ
ードするために同時に使用可能となる。これにより、両
方の分岐テストが同時に実施されることになり、その結
果は正しい順序で提供される。すなわち、ＢＣＴが誤っ
て予測されると、分岐キュー内のＢＣＴ命令に対応する
正しい入力を使用することにより、命令ストリームが再
フェッチされる。ＢＣＴ予測が正しく、ＢＣ予測が誤り
の場合は、分岐キュー内のＢＣ入力から抽出される正し
いアドレスが命令ストリームを再フェッチするために使
用される。これら両方の分岐が正しく予測されると、両
方の入力は同一のサイクルにおいて分岐キューから効果
的に除去される。

【００７８】分岐処理ユニットの第２の実施例図６−図９は、分岐処理ユニット１５の第２の実施例を
示す。第２の実施例では、分岐目的バッファ（ＢＴＢ）
が最近実施された分岐命令の分岐結果の履歴を記録する
ために使用される。

【００７９】図６では、Ｓｙｓｔｅｍ／３７０タイプに
おける１２種類の分岐命令が示されている。分岐処理ユ
ニットの第２の実施例では、ＢＩＲ９８において分岐命
令を検出することにより、図６に示される命令を処理す
る。次に分岐の方向が予測され、（分岐が実施されると
予測される場合は）分岐目的がプリフェッチされ、命令
テキスト及び関連するアドレス及び予測情報が分岐キュ
ーに入力される。分岐命令は、（分岐が実施されると予
測される場合は）分岐予測及び目的アドレスのテストが
適切なシーケンスで達成されるまで、このキュー内に保
持される。分岐方向或いは目的アドレスが予測ミスされ
た場合は、訂正処理が次に行われる。これらの訂正処理
には、命令バッファ、分岐キュー及び実行パイプライン
の現内容の無効化、真の目的命令ストリームのフェッ
チ、及び必要に応じたＢＴＢ入力の作成或いは変更が含
まれる。

【００８０】ＢＩＲ９８の現内容は分岐デコード回路に
よりデコードされる。デコード回路において、分岐命令
は図６に従い分類される。図６では、分岐命令は３つに
類別され、それぞれは異なる予測方法を有する。第１分
類の命令はプリフェッチを生じないが分岐キューに入力
され、分岐テストにおいて他の分岐命令の処理と同様に
アンロードされる。第２分類の命令は実行されることが
知られており、キャッシュに対してプリフェッチを発生
する。これらの命令に対し、ＢＴＢアクセスと並列に分
岐目的アドレスが生成される。この命令に対するＢＴＢ
入力が見い出されない場合は、分岐目的アドレスが生成
され、分岐目的プリフェッチのためのフェッチ・アドレ
スとして使用される。有効なＢＴＢ入力がこの分岐命令
に対し見い出される場合は、これが代用される。どちら
の場合も、ＢＩＡＲ３０８及びＰＦＡＲ３０５の値はプ
リフェッチ・アドレスにセットされ、新たな命令ストリ
ームを示す。第３分類の命令は無条件分岐か、或いは条
件付き分岐である。どちらの場合も、有効なＢＴＢ入力
が、ＢＴＢで指示される記憶ロケーションから、分岐目
的のプリフェッチを開始する。有効なＢＴＢ入力が存在
しない場合は、この時点ではプリフェッチ或いは目的ア
ドレスの生成は発生しない。３つのどの分類からの命令
に対しても、分岐デコードに続き分岐キュー入力が生成
される。

【００８１】図７は前述の分岐デコード・オペレーショ
ンに応じて作用する、予測メカニズムのブロック図を示
す。ＢＩＲ９８内の分岐命令は、図６の３つの分類に対
応してリストされる条件に従い、３００でデコードされ
る。分岐命令が第２分類に属する場合、そのプリフェッ
チ・アドレスが生成され、デコーダ３００は分類を示す
プリフェッチ・レジスタ（ＰＦＲ）信号を生成する。分
岐命令が第３分類に属する場合は、デコーダ３００は第
３分類を示すプリフェッチ分岐目的バッファ（ＰＢＦ）
信号を生成する。これらのどちらの信号もプリフェッチ
を要求し、ＯＲ回路３０２はこれらの信号を結合し、ど
ちらかが活動状態の場合には、ＰＲＥＦＥＴＣＨ信号を
活動化する。

【００８２】図７のアドレス予測メカニズムはまた、プ
リフェッチ・アドレス生成回路３０５及び３０６を含
む。これらは図５のＰＦＡＲ回路と同様に作用し、キャ
ッシュ１２内にシーケンス上の次のカッドワードのため
のアドレスを生成する。エレメント３０８及び３０９を
含む分岐命令アドレス生成器は、図５で説明したＢＩＡ
Ｒ回路と同様に作用し、ＢＩＲ９８内の現分岐命令のア
ドレスを生成する。汎用目的レジスタ（ＧＰＲ）３１０
のコピーが、ＢＩＲ９８内の分岐命令の関連フィールド
によりアドレスされる。当業者には理解されるように、
分岐命令がレジスタ参照により分岐目的アドレスを生成
するタイプの場合、このアドレスは３１０によりデコー
ド・オペレーション中に出力される。

【００８３】ＢＴＢ３１２はアドレス可能ロケーション
に複数の入力を含む。各入力は分岐命令アドレスの再上
位部（ＢＩＡｈ）、有効ビット、及び分岐目的アドレス
（ＢＴＡ）により構成される。分岐テストの誤りは目的
命令ストリームのフェッチを発生し、その結果ＲＥＦＥ
ＴＣＨが発生し、ＢＴＢに入力が生じる。一般的には、
実行される分岐に遭遇すると、ＢＴＢに入力が介在しな
いために分岐は目的プリフェッチを生じない。その代わ
りに、分岐テストが目的プリフェッチの必要性を検出
し、フェッチを要求し、ＢＴＢ入力を生成する。このよ
うにして、実行される分岐はＢＴＢをソースとする目的
プリフェッチを生じ、次回それは実行される。反対に、
ＢＴＢ内の入力は分岐テストの誤りの結果無効となり、
この場合は次の順次命令がフェッチされる。これは分岐
が実施されることを示すＢＴＢ入力が、分岐命令のテス
ト中に不正であると判明したとき発生する。ＢＴＢ３１
２の入力は、分岐アドレスの最下位ビット部ＢＩＡｌに
よりアドレスされる。前述のように、分類２或いは３の
分岐命令は３００においてデコードされるものとする。
どちらの場合も、ＯＲ回路３０２の出力はＰＲＥＦＥＴ
ＣＨ信号を活動化し、ＢＴＢ３１２の読み出しを可能と
する。再フェッチは行われず、マルチプレクサ３１３は
インクリメンタ３０９により現分岐命令アドレス出力を
選択するように規定される。ＢＩＡｌがマルチプレクサ
３１３を介してＢＴＢ３１２アドレス・ポートに供給さ
れ、一方、ＢＩＡｈは比較器３１４に供給される。ＢＴ
Ｂ３１２の現アドレスに入力が存在すると、入力のＢＩ
Ａの最上位部が比較器３１４に供給される。これらの最
上位部が等しいと、比較器３１４の出力は活動化され、
ＢＴＢ３１２にデコードされた分岐命令に対応する入力
が存在することを示し、この入力のＢＴＡフィールドが
目的アドレスとして使用されることを示す。

【００８４】ＩＡＭＵＸ（命令アドレス・マルチプレク
サ）３１７はＰＲＥＦＥＴＣＨ及びＲＥＦＥＴＣＨ信号
により制御される。ＲＥＦＥＴＣＨ信号が非活動状態の
場合、マルチプレクサ３１７はＰＲＥＦＥＴＣＨ信号の
状態によりその入力を選択する。ＰＲＥＦＥＴＣＨ信号
が活動状態であれば、これはデコーダ３００が目的プリ
フェッチ分類１或いは２の分岐命令を検出したことを示
し、BDAGEN ３１０の出力が選択される。ＰＲＥＦＥＴ
ＣＨ信号が非活動状態の場合は、デコードされた分岐信
号は第１の予測分類に属することを示し、従って、PFAR
INC３０６回路の出力が選択される。

【００８５】次のフェッチのためのプリフェッチ・アド
レスは、プリフェッチ・マルチプレクサ（ＰＦＭＵＸ）
３１８より命令フェッチ・アドレス・レジスタ（ＩＦＡ
Ｒ）９７に供給される。ＰＦＭＵＸ３１８は、ＩＡＭＵ
Ｘ３１７の出力或いは現在アドレスされるＢＴＢ入力の
ＢＴＡフィールドの一方から命令フェッチ・アドレスを
選択する。ＰＦＭＵＸ３１８はＲＥＦＥＴＣＨ信号及び
比較器３１４の出力により制御される。ＲＥＦＥＴＣＨ
信号が非活動状態の場合、比較器３１４の出力はＩＡＭ
ＵＸ３１７の出力及び現在アドレスされるＢＴＢ入力の
ＢＴＡフィールドの内から選択する。

【００８６】再フェッチが生じない条件の下では、ＩＦ
ＡＲ９７に入力される次のフェッチ・アドレスはＩＡＭ
ＵＸ３１７及びＰＦＭＵＸ３１８を通じて選択される。
デコーダ３００が図６の第２或いは第３分類に含まれる
命令を検出すると、ＰＲＥＦＥＴＣＨ信号が活動状態と
なり、ＧＰＲ３１０の出力を選択する。デコードされる
分岐命令が図６の第２分類に属し、この命令の前回の実
行に関する履歴がＢＴＢ３１２に入力されていない場
合、比較器３１４の出力が非活動状態となり、ＧＰＲの
内容をＩＦＡＲ９７へ入力する結果となる。ＰＲＥＦＥ
ＴＣＨ信号が活動状態でデコードされる分岐命令に対応
するＢＴＢ入力が存在する場合は、現在アドレスされる
ＢＴＢ入力のＢＴＡフィールドの内容がＩＦＡＲ９７へ
入力される。また、現分岐命令が分類１の命令であり、
ＲＥＦＥＴＣＨ信号が非活動状態の場合は、ＰＲＥＦＥ
ＴＣＨ信号もまた非活動状態となり、この命令に対応す
る入力がＢＴＢ内で見い出されることはない。従って、
順次アドレスが３０６、３１７、３１８を介してＩＦＡ
Ｒ９７に登録される。

【００８７】ＰＦＡＲ３０５及びＢＩＡＲ３０８の両者
は、ＯＲ回路３２１の出力に応じてＰＦＭＵＸ３１８か
ら初期化される。ＯＲ回路３２１はＲＥＦＥＴＣＨ及び
ＰＲＥＦＥＴＣＨ信号を、ＰＦＡＲ及びＢＩＡＲのロー
ド制御入力に伝える。これらの信号のどちらかが活動状
態であれば、レジスタ内容はＰＦＭＵＸにより出力され
る値に変更される。

【００８８】分岐キューのロードは図７及び図８を参照
することにより理解される。ここで分岐命令が丁度ＢＩ
Ｒ９８に提供され、３００でデコードされ、プリフェッ
チ命令アドレスがＩＦＡＲ９７に入力されたものと仮定
する。同時にＩＦＡＲ９７がロードされ、ＢＱはＢＩＲ
９８から命令テキストを、またインクリメンタ３０９の
出力から分岐命令アドレスを、マルチプレクサ３２０の
出力から分岐目的アドレスを、更にＯＲゲート３０２か
らＰＲＥＦＥＴＣＨ信号を受け取る。マルチプレクサ３
２０は、３１０内の現在アドレスされるＧＰＲ、或いは
ＢＴＢ３１２内の現在アドレスされる入力のＢＴＡフィ
ールドの一方から入力を受け取る。ここでデコードされ
る命令に対応するＢＴＢ入力であると仮定すると、比較
器３１４の出力が活動化され、マルチプレクサ３２０に
ＢＴＡ値を選択させる。入力が存在しないものと仮定す
ると、ＢＤＡＧＥＮ３１０の出力がマルチプレクサ３
２０を通じてＢＴＡフィールドＢＱへ提供される。プリ
フェッチに相当するＰＦＥＴＣＨ信号が分岐キューに転
送され、分岐が実行或いは非実行のどちらと予測された
かを記録する。分岐命令が無条件順次フェッチ（図６の
分類１）とデコードされると、ＰＲＥＦＥＴＣＨ信号が
非活動状態となる。

【００８９】図８は分岐キューの第２の実施例を示す。
分岐キューはレジスタ配列３３０、３３１、３３２及び
び３３３で構成される。各レジスタ配列は、分岐命令テ
キスト、分岐命令アドレス、分岐目的アドレス、及びＰ
ＦＥＴＣＨ予測信号のそれぞれの部分を含む。レジスタ
配列は分岐キュー・ロード・ポインタ（BQ LD PTR）の
制御によりロードされる。ロード・ポインタは従来式で
あり、現配列のロードの後、次のレジスタ配列を指示す
るようにインクリメントされ、次に使用可能なレジスタ
配列が分岐キュー・アンロード・ポインタ（BQ UNLOAD
PTR）により指示されると休止する。分岐キュー配列の
内容は、図７の予測回路から受信される。分岐命令テキ
ストはＢＩＲ９８から受信され、分岐命令アドレスはイ
ンクリメンタ３０９から、分岐目的アドレスはマルチプ
レクサ３２０から、またＰＲＥＦＥＴＣＨビットはＯＲ
ゲート３０２から受信される。

【００９０】分岐キューは４つのマルチプレクサを通じ
てアンロードされ、これらのそれぞれは４対２のマルチ
プレクサであり、４入力から１或いは２出力を提供す
る。第１のマルチプレクサ（ＢＱＢＩＭＵＸ）３４０
は、分岐テストへ移行するための分岐命令テキストを選
択する。マルチプレクサ３４２（BQ NSEQ MUX）は分岐
テストへ移行するための分岐命令アドレス情報を、マル
チプレクサ３４３（BQBTA MUX）は分岐テストのための
分岐目的アドレス情報を、またマルチプレクサ３４４
（BQ PFETCH MUX）は分岐テストのためのＰＲＥＦＥＴ
ＣＨビットを選択する。マルチプレクサ３４０、３４
２、３４３及び３４４はロック・ステップ（lock ste
p）でオペレートし、各々は他と同じ入力対出力構成を
提供する。このように、１つのレジスタ配列の内容或い
は２つの隣接するレジスタ配列の内容が、分岐テストの
ために提供される。

【００９１】４つの分岐キュー・レジスタ配列のロード
及びアンロードは、５つのポインタの制御により行われ
る。ローディング・ポインタは BQ_LD_PTRである。２つ
のアンロード・ポインタ（BQ_AG_ULPTR１及び２）はア
ドレス生成アンロード用に提供され、２つのアンロード
・ポインタ（BQ_BT_ULPTR１及び２）は分岐テスト・ア
ンロード用に提供される。アドレス生成及び分岐テスト
処理はそれぞれ２つのポインタを要する。なぜなら、あ
る任意のサイクルにおいて、２つの分岐命令が処理され
る可能性があるからである。ロード・ポインタは、分岐
キュー入力がエンキュー（enqueued）されるとインクリ
メントされる。アンロード・ポインタは、分岐キュー入
力がデキュー（dequeued）されるとインクリメントされ
る。

【００９２】図８の参照番号３５０で示される分岐キュ
ー・ロード・ポインタは、次にロードされる分岐入力を
表す。ロード・ポインタは全ての点で従来方式であり、
特定のアプリケーションのニーズにより実行される。一
般的に、このポインタは再フェッチ或いはプリフェッチ
によりゼロに初期化され、各分岐キュー入力のロードに
よりインクリメントされる。

【００９３】各分岐デコード・オペレーションが開始さ
れると、分岐キュー入力がエンキューされるために使用
可能となる場合に限り、このオペレーションの終了が許
可される。それ以外は、オペレーションはキュー空間が
使用可能となるまで延期される。

【００９４】ローディング処理と並列に、分岐キューは
また、分岐テストのためにアンロードされ、入力のデキ
ューを生ずる。

【００９５】分岐キュー・アンロード・ポインタは図８
の３５２で生成される。アンロード・ポインタは、実行
パイプラインにおいて進められ、ＢＣＲ、ＢＣＬ、ＢＲ
Ｒ及びＢＲＬトークンに応答してインクリメントされ
る。第１及び第２の両方の実施例において、複合規則は
２つのＢＲタイプの命令の並列実行を阻止し、ＢＲ命令
とＢＣ命令、及びＢＣ命令とＢＣ命令の並列実行を許可
する。このように、パイプライン・クロックの任意の周
期において、単一のＢＲトークンが、或いは単一のＢＣ
トークンが、或いはＢＲ及びＢＣトークンが、或いは２
つのＢＣトークンが活動状態となることが可能である。
アンロード・ポインタは次に示すように進められる。す
なわち、１つのトークン、例えばＢＣＲ、ＢＣＬ、ＢＲ
Ｒ或いはＢＲＬが活動状態となると、アンロード・ポイ
ンタは１カウントだけ進められ、分岐キュー内の最も古
い入力が各マルチプレクサ３４０、３４２、３４３及び
３４４の第１のポートを通じてアンロードされる。同一
のパイプライン・クロック周期内で２つの分岐トークン
が活動状態であれば、分岐アンロード・ポインタは２カ
ウント進められ、最も古い分岐キュー入力はマルチプレ
クサの第１のポートを通じて、また次に古い分岐キュー
入力はマルチプレクサの第２のポートを通じてアンロー
ドされる。

【００９６】ポインタ対は図９のアンロード・ポインタ
表示３５２により示されるように、パイプライン・クロ
ックの１周期によりオフセットされる。この点に関し、
現パイプライン・クロック周期内において、１つのトー
クンが活動状態の時、BQ_AGN_ULPTR1が進められ、次の
分岐キュー・レジスタ配列を指示する。この直後のパイ
プライン・クロック周期において、BQ_BT_ULPTR1が進め
られ、同じＢＱレジスタ配列を指示する。

【００９７】これに関連して、ＢＱアンロード・ポイン
タが“指示する”（point）と述べるときには、“指示
された”（pointed to）レジスタ部分を、このポインタ
により制御されるマルチプレクサ出力に接続するよう
に、マルチプレクサを構成することを意味する。

【００９８】図９を参照すると、第２の実施例におい
て、２相アンロード・ポインタが必要な理由が理解され
る。第２の実施例では、最も最近のＧＰＲのコピーを使
用して分岐目的アドレスの計算を行うことを許可するた
めに、次にデキューされる分岐命令の命令テキストが、
それぞれのBQ_AGN_UNPTRによりゲートされる。こうし
て、この命令の分岐目的アドレスの最後の計算以来、Ｇ
ＰＲの内容が更新されたとすると、ＢＴＢに記憶される
この命令の分岐目的アドレスは無効となり、有効なアド
レスがもはや遅延を伴わずにパイプラインに提供され
る。図９において、分岐目的アドレス生成回路３５４
は、ＧＰＲｓのコピー、及び分岐目的アドレスを計算す
るための３対１の加算器を含む。後者はSystem/370分岐
命令形式に基づくよく知られる方法による。３５４で計
算される分岐目的命令はレジスタ３５５に保持される。
同時に２つの分岐命令がデキューされると、第２の分岐
目的命令計算回路３５６が、分岐キューに存在する２番
目に古い命令の分岐目的アドレスを生成し、こうして生
成されたアドレスはレジスタ３５７に保持される。

【００９９】マルチプレクサ３４０の構造、及びＡＧＥ
Ｎ及びＢＴアンロード・ポインタによるその制御が、図
９に表されている。マルチプレクサ３４０は、BQ_BT_UN
PTR_1により制御される第１のゲート３５９、及びゲー
ト３５９に関連し、BQ_AGEN_UNPTR_1により制御される
第２のゲート３６０を含む。ここで単一の分岐トークン
が、パイプライン・クロックの現サイクルにおいて活動
状態であると仮定する。このトークンはBQ_AGEN_UNPTR_
1を、ゲート３６０をアンロックする値に進める。これ
により命令テキストは、ＢＱ１０２からＡＧＥＮ１ポー
トを通じて、分岐目的アドレス生成回路３５４にゲート
される。ここでアドレスが計算され、レジスタ３５５に
保持される。ここで計算される分岐目的アドレスは、パ
イプライン・クロックの立ち上がりエッジで保持される
ものと仮定する。同じエッジがBQ_BT_UNPTR_1をBQ_AGEN
_UNPTR_1と同じ値にインクリメントし、それによりゲー
ト３５９を活動化し、ＢＴ１ポートを通じ分岐テスト回
路１０３に分岐キュー内の最も古い命令の命令テキスト
を提供する。２つの分岐トークンがパイプライン・クロ
ックの同一サイクルにおいて活動状態であれば、上述し
た２つのステップの処理が、分岐キュー内の次に古い命
令に対しても実行され、ゲート３６１及び３６２を介
し、ＡＧＥＮ２及びＢＴ２ポートを通じて次段に転送さ
れる。

【０１００】アドレス・レジスタ３５５の出力が最初に
使用可能となると、BQ_BT_UNPTR_1がマルチプレクサ３
４０、３４２、３４３及び３４４に対し、それぞれ分岐
命令テキスト、分岐命令アドレス、分岐目的アドレス、
及びポインタが指示する分岐キュー・レジスタ配列のＰ
ＦＥＴＣＨビットをアンロードさせる。これにより分岐
キュー内に記憶されるＢＴＡが比較器３６３に提供さ
れ、比較器は分岐キュー内のＢＴＡ値を、今計算された
値と比較する。これらの値が不一致の場合、比較器の出
力は活動化され、分岐が行われる場合に今計算されたＢ
ＴＡが使用されるべきことを示す。比較器３６４も同様
に、分岐目的アドレス・レジスタ３５７の値を、分岐キ
ューに存在する次に古い分岐目的アドレスと比較する。

【０１０１】分岐キュー内の最も古い分岐命令がデキュ
ーされると、そのアドレスはマルチプレクサ３４２を通
じて加算器３４５に供給される。加算器３４５はまた、
最も古い分岐命令の命令テキストから命令長コードを受
け取り、分岐が実施されない場合に使用される次の順次
アドレスを生成する。加算器３４６も同様に、分岐キュ
ー内の次に古い分岐命令が最も古い命令と共にデキュー
されると、それに対応する次の順次アドレスを計算す
る。

【０１０２】分岐テスト図１０、図１１及び以降の説明は、第２の実施例に基づ
く分岐テストに関する。しかしながら、当業者はここで
述べられる概念は、第１の実施例においても、簡単な変
更により応用可能であることが理解されよう。

【０１０３】図１０において、分岐テスト回路１０３は
最も古い分岐命令の分岐条件をテストする第１の分岐テ
スト機構（ＢＴ１）１０３ａを含む。もしも、２つのレ
ジスタ配列が同時に分岐からアンロードされると、第２
の分岐テスト機構（ＢＴ２）１０３ｂが２番目に古いデ
キュー命令の分岐条件をテストする。各場合とも、分岐
テストは、分岐命令テキスト、ＰＦＥＴＣＨビット及び
分岐目的アドレス比較の結果と共に、条件コード（Ｃ
Ｃ）及び実行ユニットからの分岐テスト結果の提供を要
求する。各分岐テスト機構は２つの信号を提供する。第
１の信号（BTFAIL）は、予測された分岐結果が実際の結
果と一致するかどうかを示し、第２の信号（TAKEN）
は、実行ユニットの状態に基づき、分岐が実施されるか
どうかを示す。例えば、BT_FAIL_1 信号が活動状態であ
れば、分岐の予測結果は不正であり、TAKEN_1 信号は分
岐テストの実際の結果が実施か或いは非実施かを示す。
好適には、分岐が実施される場合は、ＴＡＫＥＮ信号は
活動状態であり、分岐が実施されない場合は、この信号
は非活動状態である。２つのデキュー分岐命令の内の次
に古い命令のための分岐テスト機構１０３ｂは、BT_FAI
L_2及びTAKEN_2信号を提供し、これらの信号は分岐テス
ト機構１０３ａにより出力される信号と同様にして規定
される。

【０１０４】“first-to-fail” （最初の予測ミス検
出）回路３６８は分岐テスト・ユニット１０３の出力を
受け、BT FAIL 信号を検査する。どちらかの信号が活動
状態であると、回路３６８はＲＥＦＥＴＣＨ信号を活動
化する。更に、回路３６８は２つの分岐命令の内のどち
らが最初に不正に予測されたかを決定する。この点に関
し、単一の分岐命令だけがデキューされ、回路３６８が
BT FAIL を検出すると、その命令が“first-to-fail”
と見なされる。２つの分岐命令がデキューされ、BT_FAI
L_1 が活動状態であれば、デキュー命令対の最も古い分
岐命令が予測ミスされたものと見なされ、一方、BT_FAI
L_1が非活動状態であり、BT_FAIL_2が活動状態の場合
は、２番目の命令が最初に予測ミスされたものと見なさ
れる。

【０１０５】“first-to-fail” 回路３６８は、現テス
トの結果、最初に予測ミスされたと見なされる分岐命令
に従い、BT_IA_SEL信号を規定する。BT_FAIL_1が活動状
態であり、ＴＡＫＥＮ＿１が活動状態であれば、BT_IA_
SEL信号は分岐目的アドレス・レジスタ３５５の内容を
選択するように規定され、ＴＡＫＥＮ＿１が非活動状態
であれば、加算器３４５の出力が選択される。また、２
つの分岐命令がテストされ、その結果ＢＴ＿ＦＡＩＬ＿
２だけが活動状態であり、その時ＴＡＫＥＮ＿２が活動
状態であれば、BT_IA_SEL 信号はレジスタ３５７の内容
を選択するように規定され、ＴＡＫＥＮ＿２が非活動状
態であれば、加算器３４６の出力が選択される。このよ
うに、分岐テスト命令アドレス・マルチプレクサ（BT_I
A_MUX）３６２はBT_IA_SEL 信号により規定され、最初
に予測ミスされた分岐命令に対し、分岐が実施されない
ものと予測された場合には分岐目的アドレスを、また分
岐が実施されると予測された場合には順次アドレスを、
それぞれ選択する。

【０１０６】ここで図７の予測機構において、ＲＥＦＥ
ＴＣＨ信号を活動化する効果について考察する。ＲＥＦ
ＥＴＣＨ信号が活動化されると、ＩＡＭＵＸ３１７はマ
ルチプレクサ３６２の出力を選択するように規定され
る。活動状態のＲＥＦＥＴＣＨ信号はＰＦＭＵＸ３１８
にＩＡＭＵＸ３１７の出力を選択させ、その結果、前述
のBT_IA_MUX362により選択される再フェッチ・アドレス
が入力される。このアドレスはレジスタ９７に保持され
る。更に、ＯＲゲート３２１が再フェッチの活動化に応
じ、ＰＦＡＲ３０５及びＢＩＡＲ３０８の内容を、ＰＦ
ＭＵＸ３１８の出力として得られる再フェッチ・アドレ
ス値に置換する。

【０１０７】図１１は、図１０の参照番号１０３ａ及び
１０３ｂで示される機構において要求されるＢＴ＿ＦＡ
ＩＬ及びＴＡＫＥＮ信号を生成する、分岐テスト機構の
構造を表す論理ブロック図である。分岐テスト機構は命
令デコーダ４００を含み、これは分岐命令テキストのオ
ペコードを、分岐命令の５クラスの内の１つに分析す
る。デコーダのオペレーションは、分岐命令がIBM Syst
em/370命令セットから得られるものと仮定する。この場
合、デコーダのＢＣ、ＢＣＴ、ＢＸＨ及びＢＸＬＥ出力
は、この命令セットにおける命令のニューモニックであ
る。デコーダは、他の全ての分岐命令は無条件に実行さ
れるものと仮定する。ＢＣ命令がデコードされると、命
令テキストのマスク部分がＡＮＤ／ＯＲ（ＡＯ）回路４
０２に提供され、４０２はこのマスクを条件コード（Ｃ
Ｃ）と比較する。マスクと条件コードが一致すると仮定
すると、回路４０２の出力が活動化され、命令がＢＣの
場合は、ＡＮＤゲート４０３の出力が活動化され、これ
によって分岐が実施されることを示す。命令がＢＣＴと
デコードされる場合は、実行ユニットにより生成される
Ｒ＝０分岐条件の反転がＡＮＤゲート４０４に活動化さ
れる。ＡＮＤゲート４０５はＢＸＨ命令を活動化し、実
行ユニットからのＲ＞０分岐条件をテストする。一方、
ＡＮＤゲート４０６はＢＸＬＥ命令条件を、Ｒ＞０分岐
条件の反転に対してテストする。全ての無条件に実行さ
れる分岐は、デコーダ４００によりUNCOND_TAKEN信号を
活動化する。ＡＮＤゲート４０３−４０６の何れかの出
力が活動状態であるか、或いは無条件に実施される分岐
が検出されると、ＯＲゲート４０９の出力が活動化され
る。このゲートの出力の活動化は、指示される分岐がテ
ストされる分岐命令のために実施されねばならないこと
を示す。この出力は分岐テスト機構のＴＡＫＥＮ信号と
して提供される。排他的ＯＲゲート４１０はＯＲゲート
の出力を、テストされる分岐命令のためのＰＦＥＴＣＨ
信号と比較する。ＴＡＫＥＮとＰＦＥＴＣＨ信号が不一
致の場合は、ＸＯＲゲート４１０の出力が活動化され、
分岐に関する誤った結果が予測されたことを示し、再フ
ェッチが要求される。ＡＮＤゲート４１２は、分岐目的
アドレスがプリフェッチされた場合に（ＰＦＥＴＣＨ信
号の活動化により示される）、プリフェッチ以後の条件
の変化により、分岐目的アドレスが変更されたかどうか
をテストする。この場合、関係する比較器の出力によ
り、ＡＮＤゲート４１２の出力において、分岐目的アド
レスの不一致が活動化される。ＯＲゲート４１３は排他
的ＯＲ及びＡＮＤゲート４１０及び４１２の出力をゲー
トし、これらのどちらかが活動状態であれば、ＢＴ＿Ｆ
ＡＩＬ信号を生成する。この信号は信号線４１５上にこ
の機構のＢＴ＿ＦＡＩＬ信号として提供され、一方、信
号線４１６上のＴＡＫＥＮ信号はこの機構のＴＡＫＥＮ
信号として提供される。

【０１０８】ＢＴＢの更新分岐目的を得るために再フェッチが要求されると、再フ
ェッチを生ずる分岐命令のためのＢＴＢ３１２への入力
が必要になる。この点に関し、その命令のための入力
は、フェッチされる分岐目的アドレス及び分岐命令アド
レスの最上位部を含む必要がある。この入力は分岐命令
アドレスの最下位部に相当するアドレスに記憶されねば
ならない。再フェッチが行われる時、オペレーションを
引き起こす分岐命令のアドレスは、図８のマルチプレク
サ３４２の第１或いは第２の出力を通じて使用可能とな
る。first-to-fail 分岐命令の命令テキストは、図７の
マルチプレクサ４２５により選択される。これはＲＥＦ
ＥＴＣＨ信号により活動化され、制御回路４２７により
出力される選択信号に応じて選択する。回路４２７はBT
_FAIL_1 及び２信号とＴＡＫＥＮ＿１及び２信号を組み
合わせ、マルチプレクサ３４２から前述のごとくfirst-
to-fail と判断される分岐命令を選択する。これに関
し、BT_FAIL_1及びTAKEN_1信号が同時オンであれば、２
つのデキューされる分岐命令の内の最も古い命令が再フ
ェッチを発生したことになり、そのアドレスがマルチプ
レクサ３４２の第１の出力から選択される。ＢＴ＿ＦＡ
ＩＬ＿１がオフで、ＢＴ＿ＦＡＩＬ＿２及びＴＡＫＥＮ
＿２が同時オンであれば、マルチプレクサ３４２の第２
の出力からの命令アドレスが選択される。マルチプレク
サ４２５により選択される命令アドレスはＢＴＢ３１２
に提供され、このアドレスの最上位部はＢＩＡｈ値用の
ポートに提供され、最下位部はマルチプレクサ３１３を
通じてＢＴＢ３１２のアドレス・ポートに提供される。
マルチプレクサ３１３はＲＥＦＥＴＣＨ信号が活動状態
である間は、この出力を選択する。分岐目的再フェッチ
の間に、アドレスされる入力のＢＴＡフィールドがＢＩ
ＡＲの内容から提供され、現在アドレスされるＢＴロケ
ーションのＢＴＡフィールドに配置される。ＢＴＢ３１
２は、実施される分岐のためのＲＥＦＥＴＣＨ信号の活
動化により、書き込み可能となる。

【０１０９】ポインタ・オペレーション図１３はパイプライン・クロックの１１周期間のタイミ
ング図を示し、本発明による１つ或いは２つのキューに
入力される分岐命令の分岐条件のテストの様子を表す。
図１３を説明するに際し、図１１及び図１２が参照され
る。図１１は分岐テスト・ユニットの第１及び第２の部
分の両者において使用される分岐テスト機構を表す。し
かしながら、ユニットを正常に動作させるために、実施
される分岐テストの数に関してのみ表されている。ここ
で図１１に関する前述の説明は、共通要素を完全に網羅
しているものと仮定すると、図１１のデコード回路４１
９が次に参照され、これは第２の分岐テスト機構内にの
み存在する。デコード回路４１９の入力はＬＡＭＴ信号
である。これは２ビットの信号であり、‘０１’或いは
‘１０’とセットされる。前者は１つの分岐命令がデキ
ューされていることを示し、後者は２つの分岐命令がデ
キューされていることを示す。１分岐命令がデキューさ
れているものとすると、分岐テスト・ユニットの第２の
部分の動作は抑制される。一方、２分岐命令がデキュー
されると、分岐テスト・ユニットの第２の部分の動作は
活動化される。デコード回路４１９はＬＡＭＴ＝１０の
時にその出力を活動化し、第２の部分を活動化する。こ
れによりゲート４０３−４０６が活動化される。付加的
なＡＮＤゲート４２０が第２の部分に提供され、デコー
ド・ユニット４１９の出力に応じて、命令のＵＮＣＯＮ
Ｄ＿ＴＡＫＥＮ出力をゲートする。

【０１１０】図１２は分岐命令が分岐キューに対して入
出力される様子を更に詳しく表したブロック図である。
ＢＩＲ９８における分岐命令のデコードは、デコーダ３
００の出力により示される。ＡＮＤゲート４９９はデコ
ーダ出力をＲＥＦＥＴＣＨ信号の反転と組み合わせる。
再フェッチ処理が生じない状態で分岐命令がＢＩＲ９８
内で検出されると、ＡＮＤゲートの出力は分岐デコード
が有効であることを示す信号（BR_DEC_VALID）を活動化
する。この信号は分岐キュー・ロード・ポインタ回路３
５０に提供される。同信号はまた、ＢＩＲ９８内の命令
テキストと共に、セレクト回路（ＳＥＬ）５００にも提
供される。分岐キュー・ロード・ポインタ回路３５０は
２ビットのレジスタとして構成され、ロードすべき次の
ＢＱ入力を示す２進値（BQ_LPTR）を保持する。ゼロに
初期化されると、このポインタの値は各ＢＱ入力のロー
ドと共にインクリメントする。ポインタ値はゼロを通じ
て循環し、唯一フリーＢＱレジスタ配列の可用性により
制限される。ＢＱレジスタ配列の可用性は、対応するＢ
Ｑ有効ビットの欠如により検出される。図１２で示され
るように、各レジスタ配列は図８で示されるフィールド
に加え、有効ビット・フィールドＶを有する。各入力が
エンキューされる時に、このフィールドのビットはセッ
トされ、また入力がデキューされる時には、このビット
はリセットされる。分岐キュー・ロード・ポインタ回路
３５０もまた、有効ビット・フィールド３３０ａ、３３
１ａ、３３２ａ及び３３３ａの状態をレジスタ配列から
受け取る必要がある。分岐命令がデコードされる時、ロ
ード・ポインタは最後に充填されたレジスタ配列から次
の配列へとインクリメントされる。ＢＩＲの内容を受け
取るレジスタ配列は、分岐キュー・ロード・ポインタの
２ビット出力信号（BQ_LPTR）により指示される。すな
わち、この信号がエンコードされて、命令テキストを受
け取るレジスタ配列を指示する。この選択はセレクト回
路５００において従来通りに行われる。選択されるレジ
スタ配列のＶフィールドは、ＡＮＤゲート４９９の出力
によりセレクト回路５００を介して規定される。こうし
て命令テキストが次の分岐キュー・レジスタ配列に入力
され、有効ビットがセットされる。

【０１１１】有効ビット・フィールド３３０ａ、３３１
ａ、３３２ａ及び３３３ａは、それぞれのセレクト回路
５３０、５３１、５３２及び５３３により制御される。
これらの回路の各々は２対１のマルチプレクサであり、
その状態は制御回路５３６により規定される。各々の回
路のデフォルト状態は、セレクト回路５００からのＶビ
ット出力に対応する。しかしながら、ＲＥＦＥＴＣＨ信
号が活動化されているか、或いは２つの分岐キュー・ア
ンロード・ポインタBQ_BT_ULPT_1または２の一方により
指示され、レジスタ配列の内容が分岐テストのためにア
ンロードされていると、セレクタ入力はパイプライン・
クロックの１周期の間にハード的に結線される“ゼロ”
に接続される。これは再フェッチ・オペレーションの開
始の際に、分岐キュー入力を無効化し、またテストのた
めの分岐キュー入力のデキュー作用を、ＢＩＲ９８内の
デコードされた分岐命令のエンキュー作用と同期させ
る。

【０１１２】分岐キュー・ロード・ポインタ回路３５０
は、再フェッチ或いはプリフェッチ・オペレーションの
発生に際し、ゼロに初期化される。ＢＱ＿ＬＰＴＲをイ
ンクリメントするロジックは表１に示す従来のブール形
式で与えられる。ＢＩＲ９８から命令がデコードされる
と、エンキューが達成され、前に分岐キューのところで
述べたように、完全な入力を形成する。分岐キュー・ロ
ード回路３５０はキューが充足されるまで、順次、使用
可能なＢＱ入力をロードする。ここで、この動作と並列
に、キューもまた分岐テストのためにアンロードされる
ことを述べておく。すなわち、入力のデキュー作用が行
われる。これにより、キューにおける位置が再ロードの
ために解放される（Ｖビットのリセットにより示され
る）。４つの分岐キュー・アンロード・ポインタ信号が
分岐キュー・アンロード・ポインタ３５２により生成さ
れる。各ポインタは２ビット信号で構成され、これらの
セットにより対応する番号の分岐キュー・レジスタ配列
が指定される。これらのポインタの内の２つ、BQ_AG_UL
PTR_1及び2は、図９に示すＢＱからＢＩマルチプレクサ
３４０のＡＧＥＮ１及び２ポートを通じ、命令テキスト
をアンロードするために使用される。他の２つのアンロ
ード・ポインタ、BQ_BT_ULPTR_1及び2は、ＢＩマルチプ
レクサ３４０のＢＴ１及びＢＴ２ポートを通じ、命令テ
キストをアンロードするために使用される。アンロード
・ポインタ３５２により出力される信号ＬＡＭＴは、そ
れぞれアドレス生成及び分岐テストのためにデキューさ
れる分岐キュー入力の数を示す。この信号は２ビット値
であり、‘０１’或いは‘１０’とセットされる。前者
は１命令がデキューされることを示し、後者は２命令が
デキューされることを示す。信号ＬＡＭＴは、アンロー
ド・ポインタ回路３５２の内部で生成される信号ＡＭＴ
のラッチ信号を表す。この信号はパイプライン・クロッ
クの１周期分だけ遅延させるためにラッチされるもので
ある。

【０１１３】

【表１】

【０１１４】アンロード・ポインタ回路３５２は実行パ
イプラインにおける分岐トークンに応じて、アンロード
・ポインタ信号をインクリメントする。ＢＣトークンは
ポインタのインクリメントのためにパイプラインのアド
レス生成ステージから提供され、ＢＣＬ＿ＡＧ及びＢＣ
Ｒ＿ＡＧと表される。他の全ての分岐トークンはパイプ
ラインの実行ステージにおいて提供され、ＢＲＬ＿ＥＸ
及びＢＲＲ＿ＥＸと表される。アンロード・ポインタ回
路３５２はまた、ＲＥＦＥＴＣＨ信号及びＰＩＰＥＬＩ
ＮＥ＿ＣＬＯＣＫ信号を受け取る。

【０１１５】ＢＱ＿ＢＴ＿ＵＬＰＴＲ＿１ポインタは分
岐キュー内の最も古い命令を指示し、ＢＱ＿ＢＴ＿ＵＬ
ＰＴＲ＿２信号は常に次に古い分岐キューの命令を示
す。各ＢＱ＿ＡＧ＿ＵＬＰＴＲは対応するＢＱ＿ＢＴ＿
ＵＬＰＴＲに先行する１パイプライン・クロック周期で
更新されて命令テキストをアクセスし、従って、現在に
最も近い分岐目的アドレスが計算される。

【０１１６】ＢＱアンロード・ポインタＢＱ＿ＡＧ＿Ｕ
ＬＰＴＲ＿１及びＢＱ＿ＢａQＵＬＰＴＲ＿１は２ビッ
トのレジスタとして構成される。ポインタＢＱ＿ＡＧ＿
ＵＬＰＴＲ＿２及びＢＱ＿ＢＴ＿ＵＬＰＴＲ＿２は対応
するレジスタ・ポインタからデコードされる。全てのポ
インタは２進値を保持し、この値はＢＩマルチプレクサ
３４０の適切なＡＧＥＮ及びＢＴ出力にゲートされる分
岐キュー入力を示す。ＡＧアンロード・ポインタは絶え
ず分岐目的アドレス生成機構に分岐命令テキストを提供
する。２つの分岐目的アドレスの計算結果は対応するＡ
ＧＥＮ＿ＡＲレジスタ３５５及び３５７に、パイプライ
ン・クロックの終了時にラッチされる。続くパイプライ
ン・クロック周期において、ＢＱ＿ＡＧ＿ＵＬＰＴＲ値
はデキューされる分岐命令の数だけインクリメントされ
る。

【０１１７】２つのＢＴアンロード・ポインタはＡＧア
ンロード・ポインタの後段に存在する１入力のポインタ
である。ＢＴポインタはＡＧＥＮポインタを更新するこ
とにより生成される結果を使用して、分岐方向のテスト
を達成する。ＡＧＥＮポインタと同様、ＢＴポインタ
は、分岐トークンの制御により、各分岐テストの完了と
共に進められる。

【０１１８】分岐キュー・アンロード・ポインタ有限ス
テート・マシンの内部ロジックを表２及び表３に示す。
これはよく知られるブール形式である。ブール値ＡＧ＿
ＩＮＣＲ＿ＡＭＴ（０：１）はＰＩＰＥＬＩＮＥ＿ＣＬ
ＯＣＫによりラッチされて、ＬＡＭＴとなる。

【０１１９】

【表２】

【０１２０】

【表３】

【０１２１】図１２で示すように、ＡＧＥＮアンロード
・ポインタ及びＡＭＴ信号はＢＩマルチプレクサに供給
されて、ＡＧＥＮ出力を制御する。こうして、現パイプ
ライン・クロック周期の間に、ＡＧＥＮアンロード・ポ
インタにより指示されるレジスタ配列が、マルチプレク
サ３４０のＡＧＥＮ１出力を通じて提供される。ＡＭＴ
＝１０の場合、ＡＧＥＮアンロード・ポインタ２により
指示されるレジスタ内の命令テキストが、マルチプレク
サ３４０のＡＧＥＮ２出力を通じて供給される。マルチ
プレクサ３４０のＢＴ出力は同様にして、ＢＴアンロー
ド・ポインタ１及び２及びＬＡＭＴ信号の値により制御
される。

【０１２２】制御ロジック５３６は、Ｖビット、及びＢ
Ｔアンロード・ポインタ１により指示されるレジスタ配
列をリセットすることにより、ＢＴアンロード・ポイン
タの更新及びＬＡＭＴ信号に応じる。ＬＡＭＴ＝０の場
合、ＢＴアンロード・ポインタ２により指示されるレジ
スタ配列のＶビットもまたリセットされる。

【０１２３】分岐処理ユニットのオペレーション図１３は１１パイプライン・クロック周期の間の分岐処
理ユニット１４の動作のタイミング図を示す。クロック
周期１では、フェッチが発生するものと仮定し、３つの
連続する分岐命令を命令フェッチ及び発行ユニットにフ
ェッチする。最初の分岐命令、Ｂｒａ、は直ちに分岐
処理ユニットに供給され、ＢＩＲ９８内にラッチされ
る。同時にＣＩＲマルチプレクサがこの命令をＣＩＲＬ
２０に供給する。続く周期、すなわちサイクル周期２で
は、この分岐命令は実行パイプライン内のデコード回路
７０及び分岐処理ユニット内のデコード回路３００によ
りデコードされる。分岐デコードは“ＢＤ”で示されて
いる。ここで分岐命令は単一サイクルのマイクロ命令シ
ーケンスを生成するものと仮定すると、このサイクルに
おけるＭＣＳの出力時にＥＮＤ＿ＯＰビットが使用可能
となり、サイクル周期３において、ＡＧＥＮラッチ７４
にＢＲＬトークンが入力される（これはＢＲ＿ＡＧで示
される）。最初の分岐命令に続いて、２番目の分岐命
令、Ｂｒｂ、がサイクル周期２においてＣＩＲＬ及び
ＢＩＲ内に登録され、サイクル周期３において７０及び
３００でデコードされる。サイクル周期３においては、
３番目の分岐命令ＢＣ instrがＣＩＲＬ２０及びＢＩＲ
９８に登録され、サイクル周期４において７０及び３０
０でデコードされる。

【０１２４】サイクル周期４では、分岐命令、Ｂｒ
ａ、のＢＲＬトークンが、図１３のＢＲ＿ＥＸのライ
ンにより示されるように、パイプラインの実行ステージ
に進められる。これによりＤＥＱＵＥ＿ＡＧ＿ＵＬＰＴ
Ｒ信号が活動化される。更に、実行パイプラインの実行
ステージに１つのＢＲトークンしか存在せず、アドレス
生成ステージにはＢＣトークンが存在しないために、Ａ
Ｇ＿ＩＮＣＲ＿ＡＭＴ信号が‘０１’にセットされる。
サイクル周期５では、ＡＧＥＮアンロード・ポインタは
両者共に１だけインクリメントされ、一方で、ＤＥＱＵ
Ｅ＿ＢＴ＿ＵＬＰＴＲ信号が活動化される。ＬＡＭＴは
‘０１’にセットされるため、第１の分岐キュー・レジ
スタ配列の内容だけが、マルチプレクサ３４０のＢＴ１
を通じて分岐テスト回路に提供される。

【０１２５】パイプライン・クロックの周期５では、分
岐命令、ＢＲｂ、のＢＲトークンが実行パイプライン
の実行ステージに達し、一方、ＢＣ命令のＢＣトークン
はパイプラインのアドレス生成ステージに達する。この
時点においては、ＤＥＱＵＥ＿ＡＧ＿ＵＬＰＴＲ信号は
まだ活動状態であり、ＡＧ＿ＩＮＣＲ＿ＡＭＴ信号は
‘１０’にセットされる。これにより分岐キューからの
分岐命令Ｂｒｂ及びＢＣ命令のデキューが、クロック
周期４の間に、ＢＩマルチプレクサ３４０のＡＧＥＮ１
及びＡＧＥＮ２出力を通じて発生する。クロック周期５
では、ＡＧＥＮアンロード・ポインタは両者共にデジタ
ル値（１０）によりインクリメントされ、一方、ＤＥＱ
ＵＥ＿ＢＴ＿ＵＬＰＴＲ信号はセット状態を維持する。
その結果、キュー位置‘００’及び‘０１’の分岐命令
情報が、サイクル周期６において、分岐テストのために
デキューされる。サイクル周期７では、ＢＴアンロード
・ポインタはそれぞれデジタル値‘１０’により更新さ
れる。

【０１２６】ここで図１３のＥＮＤ＿ＯＰの活動化は、
分岐命令がキュー内に留まるパイプライン・クロック周
期の長さを決定することを述べておく。分岐命令が２マ
イクロ命令シーケンスでデコードされると、ＥＮＤ＿Ｏ
Ｐビットはその分岐命令がデコードされる１周期後に発
生する。同時に、命令のトークンが１クロック周期分遅
延され、キューにおける時間を２クロック周期引き延ば
す。

【０１２７】図１３は更に、ＢＣ命令のデコードの結果
生ずる２つの分岐命令、Ｂｒｄ及びＢｒｅのフェッチ
を示す。このフェッチはクロック周期５で発生し、分岐
命令Ｂｒｄはクロック周期６でデコードされ、クロッ
ク周期７においてはキュー上で待機し、クロック周期８
でアドレス生成のためにデキューされ、クロック周期９
で分岐テストのためにデキューされる。分岐命令Ｂｒ
ｅは分岐命令Ｂｒｄから１クロック周期だけ遅延され、
同様のシーケンスを示す。

【０１２８】

【発明の効果】以上説明したように、本発明によれば、
多重実行パイプラインを有するデジタル・コンピュータ
における並列性を増進することができる。

【図面の簡単な説明】

【図１】多重パイプライン、スケーラブル複合命令セッ
トマシン（ＳＣＩＳＭ）のブロック図である。

【図２】複合情報に複合命令を提供するための２つのア
レンジメントを示す複合命令フォーマット図である。

【図３】モデル命令トレースにおけるブランチ命令の統
計を示す図である。

【図４】図１のＳＣＩＳＭアーキテクチャにおける命令
フェッチ及び発行ユニット及び分岐処理ユニットの一般
的ブロック図である。

【図５】分岐処理ユニットの第１の実施例の更に詳細な
ブロック図である。

【図６】分岐命令セットの３つの予測分類を示す表であ
る。

【図７】本発明による分岐処理ユニットの第２の実施例
を表すブロック図である。

【図８】本発明による分岐処理ユニットの第２の実施例
を表すブロック図である。

【図９】本発明による分岐処理ユニットの第２の実施例
を表すブロック図である。

【図１０】本発明による分岐処理ユニットの第２の実施
例を表すブロック図である。

【図１１】本発明による分岐処理ユニットの第２の実施
例を表すブロック図である。

【図１２】本発明による分岐処理ユニットの第２の実施
例を表すブロック図である。

【図１３】本発明のオペレーションのタイミング図であ
る。

───────────────────────────────────────────────────── フロントページの続き (72)発明者トーマス・レオ・ジェレマイアアメリカ合衆国ニューヨーク州、エンドウェル、リッキー・ドライブ 2926番地 (72)発明者スタマティム・ヴァシリアディスアメリカ合衆国ニューヨーク州、ヴェスタル、ヴェスタル・ドライブ 717番地 (72)発明者フィリップ・ジーン・ウィリアムズアメリカ合衆国ニューヨーク州、ヴェスタル、トレイシー・クリーク・ロード、ボックス75 （番地なし) (56)参考文献特開昭62−221036（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】実行される命令を提供する命令ソース、命
令ストリームを実行する実行パイプライン、前記実行パ
イプラインに接続され命令の実行結果を示す条件信号を
提供する条件決定手段、及び分岐命令処理をする結合装
置を含むデジタル・コンピュータにおいて、前記結合装置は、前記命令ソース及び前記実行パイプラインに接続され、
実行される命令ストリームを提供する命令発行手段と、前記命令ストリームの現行の命令シーケンスの全ての命
令テキストを検索し、前記命令シーケンスから全ての分
岐命令を検出し、前記テキストと前記検出された分岐命
令の各々のロケーションを決定し、該命令シーケンスが
前記実行パイプラインに読み出される前に該命令シーケ
ンスから前記実行パイプラインに実行を要求しない前記
検出された分岐命令を移動し、分岐ヒストリ・キャッシ
ュに分岐するアドレスとして分岐命令ロケーションを使
用することによって分岐が得られるかどうかをデコード
して予測し、前記予測によって必要な取り出し又は事前
取り出しを初期化し、前記実行パイプラインで実行され
る前記命令シーケンスの他の命令と実質的に並列化され
複数の前記移動された分岐命令を同時に実行する分岐命
令処理手段と、を具備する、デジタル・コンピュータ。
【請求項２】前記デジタル・コンピュータは、更に、前
記命令の各々に対する複合情報を生成する複合手段を含
み、前記複合情報は命令が他の命令と並列に実行される
かどうかを示し、前記複合手段は前記分岐命令の各々に
対する前記複合情報を規定して、前記分岐命令の実行の
結果生ずる予測命令シーケンスを指示し、前記結合装置は、前記分岐命令処理手段に含まれ、前記
命令ソースに接続される予測手段を含み、該予測手段
は、その分岐命令の実行により目的シーケンスに分岐す
る命令シーケンスが発生するかを示す複合情報に応じ
て、命令の目的シーケンスを前記命令発行手段にフェッ
チする、請求項１記載のデジタル・コンピュータ。
【請求項３】前記命令ソースは命令識別信号に応じて命
令を提供し、前記分岐命令処理手段は、前記命令発行手段に接続され、命令ストリーム内の前記
各分岐命令に対し、該分岐命令の実行予測結果を示す予
測信号を生成する手段と、前記予測手段及び前記命令発行手段に接続され、前記分
岐命令及び予測信号を待機する手段と、予測信号及び命令ストリームに応じ、予測結果として実
行される命令を識別する識別信号を生成する手段と、前記待機手段及び前記予測手段に接続され、前記待機さ
れる分岐命令の１つを実行し、該分岐命令の実行により
生成される結果が、分岐命令と共に待機される予測信号
により示される結果が不正であることを示す場合に、識
別信号を変更するテスト手段と、を具備する、請求項１記載のデジタル・コンピュータ。
【請求項４】フェッチ・アドレス信号に応じ該フェッチ
・アドレス信号により識別される命令を提供する命令ソ
ース、命令ストリームを実行する実行パイプライン、該
実行パイプラインに接続され命令の実行結果を示す条件
信号を提供する条件手段、及び前記命令ソース及び前記
実行パイプラインに接続され、フェッチ・アドレス信号
シーケンスを前記命令ソースに提供し、該フェッチ・ア
ドレス信号シーケンスに応じ前記実行パイプラインに前
記命令ソースにより提供される前記命令ストリームの命
令シーケンスを結合する命令シーケンス手段を含むデジ
タル・コンピュータにおいて、前記実行パイプラインに
よる命令実行と並列に分岐命令を実行する方法であっ
て、（ａ）命令シーケンスにおける前記分岐命令の全てを検
出するステップと、（ｂ）前記実行パイプラインで実行要求のない前記検出
された分岐命令を移動するステップと、（ｃ）前記移動された分岐命令の各々に対する予測結果
を示す予測信号を生成するステップと、（ｄ）前記分岐命令の１つに対する予測信号に応じ、予
測信号の条件によって示される予測結果に相当する予測
シーケンスにフェッチ・アドレス信号を規定するステッ
プと、（ｅ）実行パイプラインにおける他の命令の実行に同期
して、命令シーケンス手段における複数の前記移動され
た分岐命令を同時に実行し、条件信号に応じて実際の結
果を決定するステップと、（ｆ）複数の各分岐命令の実際の結果を、その分岐命令
の予測信号によって示される予測結果と比較するステッ
プと、（ｇ）複数の各分岐命令の内の１つに対する予測結果が
正しくない場合には、そのアドレス信号をその分岐命令
の正しい結果に相当する再フェッチ・シーケンスに規定
するステップと、正しい場合は、（ｈ）フェッチ・アドレスのシーケンスを継続し、ステ
ップ（ａ）乃至（ｇ）を実施するステップとを含む前記
方法。
【請求項５】前記ステップ（ｃ）において更に、前記分岐命令に対する命令アドレスを生成し、前記分岐命令に対する分岐目標アドレスを生成し、前記分岐命令、前記分岐命令アドレス、前記分岐目標ア
ドレス、及び前記分岐命令に対する前記予測信号を待機
させ、前記ステップ（ｄ）において更に、実行に先立って、複
数の分岐命令を解放することを含む請求項４記載の方
法。
【請求項６】前記ステップ（ｅ）以前に、命令シーケン
ス内の前記分岐命令の各々に対するトークンを生成し、
生成されるトークンを実行パイプラインに伝搬し、前記ステップ（ｅ）が所定のパイプライン・ステージに
伝搬するトークンに応じて実行されることを特徴とする
請求項４記載の方法。
【請求項７】フェッチ・アドレス信号に応じ、該フェッ
チ・アドレス信号により識別される命令を提供する命令
ソース、命令ストリームを実行する実行パイプライン、
該実行パイプラインに接続され命令の実行結果を示す条
件信号を提供する条件手段、及び前記命令ソース及び前
記実行パイプラインに接続され、フェッチ・アドレス信
号シーケンスを前記命令ソースに提供し、該フェッチ・
アドレス信号シーケンスに応じ、前記実行パイプライン
に前記命令ソースにより提供される命令シーケンスを結
合する命令シーケンス手段を含むデジタル・コンピュー
タにおいて、前記実行パイプラインによる命令実行と並
列に分岐命令を実行する方法であって、（ａ）前記分岐命令の各々をデコードすることによって
命令シーケンスにおける全ての前記分岐命令を検出し、
前記デコードされた分岐命令の各々に対して予測信号を
発し、前記デコードされた分岐命令に対して予測結果を
示すステップと、（ｂ）実行パイプラインで実行要求のない、前記命令の
直前の命令の実行によって生成された条件を単にテスト
する前記検出された分岐命令を前記命令シーケンスから
移動するステップと、（ｃ）前記移動された分岐命令に対する予測信号に応
じ、予測信号により示される予測結果に相当する予測シ
ーケンスにフェッチ・アドレス信号を規定するステップ
と、（ｄ）実行パイプラインにおける前記命令シーケンスの
他の命令の実行に同期して、分岐命令による条件信号の
テストにより少なくとも２つ以上の前記移動された分岐
命令を同時に実行し、その分岐命令の実際の結果を決定
するステップと、（ｅ）分岐命令の実際の結果を、その分岐命令の予測信
号により示される予測結果と比較するステップと、（ｆ）予測結果が正しくない場合には、そのアドレス信
号をその分岐命令の正しい結果に相当する再フェッチ・
シーケンスに規定するステップと、正しい場合は、（ｇ）フェッチ・アドレスのシーケンスを継続し、ステ
ップ（ａ）乃至（ｆ）を実施するステップと、を含む前記方法。
【請求項８】前記ステップ（ｃ）において更に、前記分岐命令に対する命令アドレスを生成し、前記分岐命令に対する分岐目標アドレスを生成し、前記分岐命令、前記分岐命令アドレス、前記分岐目標ア
ドレス、及び前記分岐命令に対する前記予測信号を待機
させ、前記ステップ（ｄ）において、更に、実行に先立って、
複数の分岐命令を解放することを含む請求項７記載の方
法。
【請求項９】前記ステップ（ｄ）以前に、命令シーケン
ス内の前記各分岐命令に対するトークンを生成し、生成
されたトークンを実行パイプラインに伝搬し、前記ステップ（ｄ）が前記実行パイプライン内で予め決
められたパイプライン・ステージに伝搬するトークンに
応じて実行される請求項７記載の方法。