JP2846406B2

JP2846406B2 - 分岐処理方法及び分岐処理装置

Info

Publication number: JP2846406B2
Application number: JP2132425A
Authority: JP
Inventors: エルジャーディーンロバート; ジェイリンチシャノン; アールマネラフィリップ; ダブリューホーストロバート
Original assignee: TANDEMU KONPYUUTAAZU Inc
Current assignee: TANDEMU KONPYUUTAAZU Inc
Priority date: 1989-05-23
Filing date: 1990-05-22
Publication date: 1999-01-13
Anticipated expiration: 2014-01-13
Also published as: EP0399760B1; US5072364A; JPH03116235A; EP0939364A3; EP0939364A2; AU5504790A; EP0399760A3; DE69033443D1; DE69033443T2; CA2016254A1; AU631874B2; EP0399760A2

Description

【発明の詳細な説明】産業上の利用分野本発明はデジタルコンピュータ、殊にデジタルコンピ
ュータの分岐処理の方法及び装置に関する。

従来の技術デジタルコンピュータの設計における第１の目標はプ
ロセッサの処理能力、即ち単位時間あたりに処理される
命令数を高めることである。そのため一つアプローチ
は、プロセッサのハードウェア設計を改良してマシンサ
イクルタイムを少なくすることであった。もう一つのア
プローチはマシンサイクルあたり一命令を処理するよう
に設計されたアーキテクチャと命令集合を開発すること
であった。以上のアプローチは共に順次サイクルあたり
せいぜい１命令した発しないという基本的な処理方法の
ために、マシンサイクルあたりの最大処理能力が１命令
という論理的処理能力に限定されている。

サイクルあたり１命令以上の命令を発する方式が、
「CRISPマイクロプロセッサのハードウェアアーキテク
チャ」と題するディーツェル（Ditzal）他の論文（1908
ACM 0084−7495 87,309−319ページ）、及び「多重機
能ユニットプロセッサの性能を改善させるための命令発
行のアプローチ」と題するアコスタ（Acosta）他の論文
（IEEE Transactions on Computers,Vol.C−35,No.9,19
86年９月,815−828ページ）中に記述されている。

命令を並行して発することに対する制約は、命令群が
同一のマシンサイクル中に同一機能のプロセッサ装置の
使用を要求してはならないという点である。この制約は
プロセッサアーキテクチャー内に含まれる資源に関係し
て、頻繁に使用される機能単位の追加的なコピーを設け
ることによって幾分除去することができる。

上記のアコスタ他による論文は、多重機能単位の存在
を利用するための並行命令発行のアプローチを提示して
いる。更に、上記論文中に述べられたCRISPアーキテク
チャによれば、もう一つの命令と並行して分岐命令を実
行することができる。更に、メインフレームにより、整
数の浮動小数点命令を種図の機能単位に並行して発送す
ることが可能であった。

然しながら、これら方式では全て、同時に発行された
命令が互いに依存関係にないことが必要である。依存関
係の種類は以下に詳説するが、一対の命令間の基本的依
存関係は、その対命令中の第２の命令が対命令中の第１
の命令の実行によって生するデータを処理することであ
る。従って、第１の命令は第２の命令に先立って処理す
る必要がある。

かくして、これら現存のプロセッサはすこぶる少数の
命令の組合せしか同時に発することはできず、また実行
することもできない。分岐命令はメモリ照会が不要で新
たな１アドレスだけした計算する必要のない特殊なケー
スである。同様にして、浮動小数点と整数命令はALU資
源しか必要とせず、メモリ照会を要しない。かくして、
命令相互間のデータ依存関係は存在しない。

上記制約に鑑みて、これらシステム中で並行に発行さ
れる命令の種類は極度に制限され、一定の限定された状
況では２個の命令を１クロックで発することが可能だと
はいえ、その平均処理能力は１命令あたり１クロックを
大きく上廻ることは不可能である。

本書において『命令ファミリー』とは、１プログラム
内における順次命令のグループであって且つ１つのクロ
ックの中で並行して発行することの可能な命令グループ
をいう。本発明において、その１ファミリー内に含ませ
ることの可能な命令の種類の数は、従来技術によるプロ
セッサ内に可能なものよりも相応に大きい。

本発明の場合、１クロック中に、例えばALUとメモリ
に照会する形式の命令を含む命令のファミリーを発する
ことができる。特定のパイプラインは、発行された命令
ファミリーの受領と処理を容易にする資源を含む。従っ
て、本発明は、１クロックあたり１命令を越える命令の
処理能力を提供するものである。

本発明によれば、分岐予測の誤りから回復するための
分岐復帰機構は、分岐予測ビットと分岐条件ビットを比
較することによって予測の誤りをテストする。予測が誤
りの場合には、ファミリー内の分岐命令の位置に応じて
上記の分岐復帰機構は異なる。もし分岐命令がファミリ
ー内の最後の命令であれば、パイプラインはフラッシュ
され、正確な次の命令がパイプライン内に取出される。
もし分岐命令がファミリー内の最後の命令でなくて、分
岐に続くファミリー内の全命令と関連するデータの書込
みは禁止される必要がある場合には、パイプラインはフ
ラッシュされ、正確な次の命令がパイプライン内に取出
される。

本発明のその他の特徴と利点は図面と以下の詳細な解
説により明らかとなる。

実施例本発明の実施例となるプロセッサは、１サイクルあた
り２つ以上の命令を発するようには設計されていない現
存のプロセッサによって使用できるターゲット命令のセ
ットを実行できる。従って、本実施例のプロセッサは、
現存システムと下位互換性をもち、現存システム用に書
込まれたプログラムを実行することができる。然しなが
ら、以下に示すように、本発明のプロセッサシステムの
命令ファミリー（前記したように、１プログラム内にお
ける順次命令のグループであって且つ１つのクロックの
中で並行して発行することの可能な命令のグループ）の
並行処理能力によって、処理能力は劇的に向上する。

本発明の好ましい実施例では、マイクロプログラミン
グされたマシーンが用いられており、各オブジェクトコ
ードもしくはマクロ命令を実行する制御信号が、その命
令にとって固有のマイクロコードルーチンによって提供
される。

ターゲット命令のセットから、対候補（PC）となる命
令の小セットが選択されて、２個の対候補（PC）の命令
ファミリーを並行実行するための特殊マイクロコードル
ーチンが制御メモリ内にストアされる。ここで、対候補
（以下、PCと略称する）とは、上記したように、ターゲ
ット命令セットから並行して実行できる対としてグルー
プ分けされた命令の小セットをいう。何れの命令がPCの
小セット内に含まれるかの選択は、アプリケーションプ
ログラム中の命令の発生頻度、命令の並行処理の困難
さ、命令の並行処理に必要とされる資源を含む種々の要
素に依存する。これら特殊ルーチンは以下に述べる如
く、プロセッサ内の特殊資源に依存する。

然しながら、ただPC（対候補）のみから成るファミリ
ーの場合でさえ、もし資源の競合が発生する場合には、
並行処理は可能でない。従って、システムはこれらの場
合には並行処理を取消すことになる。実行装置はかかる
場合が頻繁に発生せず、また処理能力を大きく低下させ
ないように構成される。

本実施例に係るシステムは、ターゲット命令セットを
実行する非対動作プロセッサ（従来のプロセッサ）とオ
ブジェクトコード互換性がある。このため、非対動作マ
シーンにより実行される整列順のオブジェクトコードか
ら成るオブジェクトコードプログラムが、そのプログラ
ムへ何ら変更を加えないでも、本発明の対動作マシーン
によって実行できる必要がある。

従って、本実施例のシステムでは、プログラム内に整
列順の対の命令グループが、所定の条件が満たされる
と、同時に発行させる。好ましい実施例において、これ
らの条件の発生は、命令のデコード時に発生されるステ
ータスビットにより指示される。

さて、図面について述べると、第１図は実施例のハイ
レベルブロックダイアグラムである。同じ符号は図面を
通じて同じ部分又は対応する部分を示す。

第１図において、フェッチ装置（FU）10は命令キャッ
シュ（IC）12と接続される。FU12は、アドレス状態マシ
ーンにより制御されるアドレス計算ハードウェアを含ん
でおり、通常のシーケンス動作中にアドレスを増分し、
条件分岐及びジャンプ命令についての分岐ターゲット
（BRANCH−TARG）アドレスを計算する。IC12の出力は、
命令待ち行列レジスタ（IQR）14、16に接続される。IQR
14及び16と、ランク０の第１及び第２のパイプラインレ
ジスタ（ROFとROS）20及び18は、直列に接続されて命令
待ち行列21を形成する。ROS18及びROF20の出力は、それ
ぞれ、ランク１の第２及び第１のパイプラインレジスタ
に接続され、また、第２デコード装置（DCS）24の入力
及び第１デコード装置（DCF）22の入力に接続されてい
る。２つのデコード装置DCS、DCFの出力は、それぞれ第
１デコード出力（DCO）バス28及び第２デコード出力（D
CO）バス30によって対化論理装置（PLU）26のデータ入
力に接続されている。対化論理装置（以下、PLU）は、
一対のデコードした命令からのデコードの結果を調べ
て、その２つの命令が一対として並行に発行されて実行
され得るかどうかを判定する機能を有する。上記デコー
ド出力バス28、30のステータスビットは、第１ステータ
スバス32及び第２ステータスバス34によってPLU26の制
御入力に接続されている。PLU26は、併合デコードバス
（MDB）38によって実行装置（EU）36に接続されるデー
タ入力と、フェッチ装置制御（FUC）バス40によってFU1
0に接続されるフェッチ装置（FU）制御出力と、パイプ
ライン制御装置（PUC）バス42によってパイプライン装
置（PU）に接続されたパイプライン装置（PU）制御出力
とを有する。実行装置（EU）36は、後述のFIssue信号を
アサートする。

さて、以下に第１図のシステムの動作を説明する。命
令ファミリー内の第１命令及び第２命令はそれぞれROF2
0とROS18内にストアされる。これらの命令はそれぞれの
デコード装置22、24でデコードされ、デコード結果はそ
れぞれのDCOバス28、30上に出力される。第１のデコー
ド結果は第１の入口点フィールド（EPT F）と第１のス
テータスビットのセットを含み、第２のデコード結果
は、第２の入口点フィールド（EPT S）と第２のステー
タスビットのセットを含む。各デコード結果におけるス
テータスビットは、それぞれの命令がPCであるかどう
か、またどの資源が命令を実行するに必要であるかを示
す。両方のデコード結果からのステータス情報はステー
タスバス32と34上のPLU制御ポートに送られる。

第１のステータスビットは、PCと呼ばれて、その命令
が対候補であるかどうかを示す。第２のステータスビッ
トは、EPTIssueと命名されて、マクロ命令が１個のクロ
ックだけしか必要としないか、多数のクロックを必要と
するかを示す。多数のクロックが必要な場合、次のクロ
ック間に、後続の命令が発せられる。１個のクロックだ
けした必要としない場合、ROF20とROS18のデータは、信
号FIssueが生ずるまで、変化しない。この信号はFU10に
より受信され先読取り（プリフェッチ）が再開される。
その他のステータスビットは、命令がALUもしくはメモ
リアドレス指定論理に対して実行を要求するかどうかを
示す。

PLU26の出力はステータス情報に依存し、次の３つの
可能性のうちの一つを出力する。先ず、もし第１の命令
がPCでなければ、第１の命令のデコード結果は併合デコ
ードバス（MDB）38上に出力されマイクロコードルーチ
ンをアクセスし第１の命令だけを単独に実行する。更
に、FUCライン40とPUCライン42上に発せされた信号によ
って次の単独の命令がIC12から読出され第１の命令（RO
F20内にストア）だけがPU25の次段に発せられる。その
ため、プロセッサの並行発行能力は使用されない。

第２に、もし第１命令と第２命令がPC（対候補）であ
って対化可能（並行発行及び実行が可能）であれば（即
ち、資源の競合が存在しなければ）第１命令と第２命令
のデコード結果は併合されてMDB38上に出力される。併
合されたデコード結果は、第１命令と第２命令を対にし
て実行するようにマイクロコードにアクセスする。更
に、FUCライン40とPUCライン42上に発せされた信号によ
ってプログラム内の次の２つの命令がIC12から読出さ
れ、ランク０のレジスタ18、20内にストアされた一対の
命令がPU25の次のランク（ランク１）に発行される。

第３に、もし、第１命令がPC（対候補）であるが第１
命令と第２命令は対化不可能である場合（例えば資源競
合の場合）には、第１命令のデコード結果のサブフィー
ルドがMCB38上に出力され、第１命令を単独に実行する
ようにマイクロコードルーチンにアクセスする。更に、
FUCライン40及びPUCライン42上に発行された信号によっ
て次の単独命令がIC12から読取られ、第１命令のみがRO
Fレジスタ20からPC25の次段のレジスタに発せられる。
従って、プロセッサの並行発行能力は使用されない。

本システムの動作は具体例を考察することによって最
もよく理解することができる。これらの具体例は、１つ
のスタックを、ALU動作のためのデータソース及びデー
タシンクとし利用するプロセッサについてのものであ
る。データは、メモリとスタックとの間でロード及びス
トア動作によって転送される。そのスタックは、８個の
物理レジスタ（ランクR0−ランクR7）を含み、また、こ
の物理レジスタを指示する、スタックの上部に論理的に
割りふられたレジスタポインタ（RP）を含む。スタック
レジスタには、論理指示名Ａ〜Ｈが付与され、これら
は、スタックの上部のレジスタをＡとする、RP値によっ
て定められる。このタイプのプロセッサでは、データの
依存性が、スタックレジスタの競合によって特徴付けら
れる。もう一つのタイプの依存関係はPR競合である。命
令は全体としてRPを増分したり減分したりする。かくし
て、命令のファミリーはRPの変化に対して競合する要求
をもつことになる。

第２図と第３図は、２個（一対）の命令ファミリーを
標準的なやり方で実行する間に生ずるスタックの構成と
本発明に従って並行に命令を実行するための１つのルー
チンを掲げた図式的な図である。

第２図について述べると、２個の命令のLDI−LOADフ
ァミリーを順次単独実行する際のスタック形が示されて
いる。ここでLDIは、命令内に含まれる即値データを指
定の場所にロードする命令であり、LOADは、データを指
定のソースからレジスタへ転送する命令である。これら
命令は共にRPに対して定義されるＨレジスタにデータを
書込む。LDI実行中に、即値データがレジスタＨ（ラン
ク０すなわちR0）に書込まれ、RPは増分されてレジスタ
ＨがR1（ランク１）に変化する。その後、LOADの実行中
にキャッシュデータがレジスタＨに書込まれ、RPは再び
増分されてレジスタＨはR2に変化する。

第４図に示す標準的な３段のパイプライン12について
述べると、R3（ランク３）のパイプライン段中には、こ
れら命令はそれぞれデータをＨレジスタに書込み、RPを
増分する。従って、並行処理は、これらレジスタとRPの
競合の影響を除去するための何ら特別の資源や手法なし
には、可能にならない。

第５図に示す実施例で使用される比較的深度の高い６
段のパイプラインについて対の並行処理方法を解説す
る。対命令を並行処理するには、ロード命令のデータキ
ャッシュアドレスがランク２中に発生させられ、オペラ
ンドが取出され、キャッシュデータがレジスタＧ（R1）
に書込まれ、ランク３中において即値データがレジスタ
Ｈ（R0）に書込まれる。ランク４中においてRPは２だけ
増分されることによってR1はＡと、R2はＨと定義され
る。かくして、本発明のマイクロコードと資源によって
一対の命令が並行して発行され実行することが可能にな
る。

第３図について述べると、２個の命令のLDD−DADDフ
ァミリーを順次単独実行するためのスタック構成が描か
れている。ここで、LDDは、指定の場所の２ワード（ダ
ブルワード）をレジスタへロードする命令であり、DADD
は、２つのダブルワードを加算してその合計を得る命令
である。更に、第４図の３段パイプラインについて述べ
ると、LDDの実行中に、RPは増分されてレジスタＡはR2
と定義されてOP2データの高次フィールド（Ｈ）がレジ
スタＡに書込まれ、OR2データの低次フィールド（Ｌ）
がランク２中にレジスタＨ（R3）に書込まれる。最後
に、RPは再び増分されて、ランク３中にレジスタＡはR3
と定義される。その後、DADDの実行中、レジスタＣ（R
1）及びレジスタＡ（R3）中のデータは合計されてＣ（R
1）に書込まれ、レジスタＤ（R0）レジスタＢ（R2）中
のデータはランク２中に合計されてレジスタＤ（R0）に
書込まれ、RPはランク３中に２だけ減分される。

第４図の３段パイプラインについて述べると、もし対
命令が並行して実行される場合には、データの書込みと
合計はランク３中に行われるため、解決不能なデータの
競合が生ずることになる。RPの変更に対する要求条件が
競合するため、ランク３中に更なる競合が生ずることに
なろう。

第５図の６段パイプラインについて述べると、対命令
を並行実行するために、ランク３中にOP2データが、ラ
ンク３中にデータキャッシュから読出され、ランク４中
にレジスタＡ（R1）とＢ（R0）の内容が合計され、ラン
ク５中にその合計がレジスタＡ（R1）とＢ（R0）に書込
まれるとともに最初のOP2データがレジスタＨ（R2）と
Ｇ（R3）に書込まれる。かくして、解決不能なレジスタ
もしくはRPの競合は何ら生じない。

上記より，並行処理は、データをスタック内のレジス
タに書き込む前に、データへのアクセスを要求すること
が分かる。第６図は、その要求されるアクセスを容易に
するレジスタの構成を示した図である。第６図におい
て、レジスタファイル60は、４個の書き込みポートと４
個の読み出しポートを備え、ダブルワードを同時に転送
することができるようになっている。更に、バイパス回
路62と、バイパスパス64と、キャッシュデータ65a及び
即値データ65b間のワイドマルチプレクサ及び相互接続6
5と、ALU入力バス65cと、SBus65dとが、データのレジス
タファイル60へ書き込みの前に、データへの直接のアク
セスを可能にしている。従って、深いパイプライン構成
のマルチポートレジスタファイル60によって、マイクロ
コードは命令の多くの組合せをファミリーとして実行す
ることができる。

例えば、第３図に示す、LDD−DADDの対を実行する
際、ランク３においては、キャッシュデータは、レジス
タファイルへ書き込まれる前に、直接、データキャッシ
ュ66からCDHi 67aと CDLo 67bへ転送される一方、OP1
−Ｈは、RegAからKHReg67cへ転送され、OP1−Ｌは、Reg
BからKLReg67dへ転送される。転送されたデータの和
は、ランク４において、ALU68によって計算され、ラン
ク５において、RegA及びRegBへ書き込まれる。更に、CD
Hi 67aとCDLo 67b内のデータは、ランク５において、Re
gHとRegGへ書き込まれる。

例えば、ロード命令とロード即値命令を含むファミリ
ーは、１クロック中に発せられ処理することが可能であ
る。同様にロードと加算命令を含むファミリーが１クロ
ック中に発せられ処理することが可能である。

第７図は本発明の実施例の対化論理装置26のアーキテ
クチャを示す詳細なブロックダイアグラムである。デコ
ード装置（DCF:DCS）の入口は、ROF20とROS18の命令に
応答して第１入口点EPF及び第２入口点EPSを発生する第
１入口点テーブル（EPTF22）及び第２入口点テーブル
（EPTS24）である。

EPTF22及びEPTS24の出力は、それぞれ、第1DCOバス28
及び第2DCOバス30に接続されている。第１入口点（EP
F）ビットフィールドＦ＜0:15＞は、EPTF22から第1DCO
バス28へ転送され、第１入口点（EPS）ビットフィール
ドＳ＜4:15＞は、EPT24から第2DCOバス30へ転送され
る。ビットフィールドＦ＜1,2,14,15＞は、第１ステー
タバス32により対化論理部72に転送され、また、ビット
フィールドＳ＜5,6,7,8＞は、第２ステータスバス34に
より対化論理部72に転送される。

ビットフィールドＦ＜9:15＞は、FLSBバス76によって
マルチプレクサ／論理装置（MLU）74の０側の入力へ転
送され、ピットフィールドＳ＜9:15＞は、SLSBバス78に
よりMLU74の１側の入力へ転送される。

ビットフィールドＦ＜2:8＞はMMSBバス80上に転送さ
れ、MLU74出力はMLSBバス82に転送される。MMSBとMLSB
バス80、82は併合されて併合EPT（MEPT）バス38のMSBと
LSB部分を形成する。MEPTはマイクロメモリ39からのマ
イクロコードをアクセスするために使用される。

対化論理部72は、FUCバス40上を転送されパイプライ
ンに対命令もしくは単一命令を発するように指令するPC
及びEPC信号を発生する。更に、非対のPC信号が、MLU74
の09入力に接続されたPCNPライン84上に転送され、ビッ
トＦ＜２＞は多重制御ライン86上をMLU74の制御入力へ
転送される。

第８図は、MEPT＜2:15＞によりアドレス指定されるマ
イクロメモリ39のメモリアップである。MEPTのMSBフィ
ールドは、Ｆ＜２＞がMSBである場合、常にＦ＜2:8＞に
等しい。MEPTのLSBフィールドは、MLU74の出力に等し
く、NPPCライン84及び多重制御ライン86上の信号に依存
する。全対候補PCのMSB,F＜２＞は、１の値を有し、非
対のPC全体について０の値を有する。

対候補ではない第１の命令の場合、MSB、Ｆ＜２＞は
０であり、マイクロコードアドレス（MEPT）はアドレス
空間92の上半分90内に配置される。対候補の第１の命令
の場合、MSB,F＜２＞は１である。マイクロコードアド
レス（MEPT）はアドレス空間の下半分94である。

MEPTを発生させるための第７図に示すシステムの動作
を、３つの場合、すなわち、第１の命令が対候補でない
場合、第１命令が対候補であるが第２命令と対化されて
いない場合、および第１命令が対候補であって第２命令
と対化されている場合について次に説明する。

第１の命令が対候補でない場合、Ｆ＜２＞は０であ
り、MLU74の０入力はMLSBバス82に接続されるため、フ
ィールドＦ＜9:15＞はMLSBバス82上を転送され、MFPT
は、下式１のようになる。

MEPT＜2:15＞＝Ｆ＜2:8＞:F＜9:15＞式１そのため;MEPTはEPTFフィールドに等しくなる。このア
ドレスは第８図に示すアドレス空間92の上半分90内にあ
る。かくして、MEPTはこの場合マイクロコードにアクセ
スし、第１の命令を単独命令として実行する。

第１命令が対候補であるが第２の命令と対化可能でな
い場合には、Ｆ＜２＞は１で、NPPCライン84上の信号が
セットされる。この場合、MLU74はフィールド＜0000000
＞をMLSBバス82に転送し、MEPTは、 MEPT＜2:15＞＝Ｆ＜2:8＞；＜0000000＞式２となる。そのため、MEPTはゼロ７個のストリングによっ
て伴われるEPTFのMSBフィールドに等しくなる。かくし
て、非対化対候補を実行するためのマイクロコードのア
ドレスは第８図に示すアドレス空間92の下半分94内に配
置される。

もし第１の命令が対候補であって対化される場合に
は、Ｆ＜２＞は１で、NPPCライン84上の信号はセットさ
れない。この場合、MLU74フィールドＳ＜9:15＞をMLSB
バス82に転送し、MEPTは、 MEPT＜2:15＞＝Ｆ＜2:8＞:S＜9:15＞式３となり、そのためMEPTはEPTSのLSBフィールドとEPTFのM
SBフィールドに等しくなる。第８図に示すように、これ
らのアドレスはアドレス空間内の非対化指令のアドレス
の後に来る。

対命令が発行された後、その発行された対命令の首尾
良い実行やリタイアを阻止する例外や分岐予測の誤りの
如き事実が発生することがある。以下はこれら事実の発
生と効率良く取組むためのユニークな例外処理と分岐手
段を説明したものである。

先ず、例外処理について参照すると、例外は、命令の
実行を阻害するプロセッサ内部の条件によって惹起され
る。かかる条件の例は、ALUタイプの命令についての演
算オーバフローやメモリ参照形式の命令についてページ
フォルトを含むものである。

例外に遭遇する各命令について、ソフトウェア及び／
又はマイクロコードを含む特定の例外処理プロシージャ
が、単独で発行される命令のために開発されていた。一
般に、例外処理マイクロコードは、例外が存在しない場
合に同じ命令を実行するに必要とされるマイクロコード
と対比すると、とても複雑である。

第５図の６段パイプラインについて説明すると、例外
条件が、パイプラインのランク４中で発生している。例
外は命令が対化される時に発生しているために、例外処
理に対するアプローチの一つは、それぞれの可能な対命
令ごとに、例外を処理するための特定のマイクロコード
をストアすることであろう。

然しながら、かかるアプローチは幾つかの欠点をもっ
ている。例外に遭遇した命令より前の命令は完了さねば
ならないために、第１の命令と関連するストア作業を完
了させるために複雑な調整コードが必要となり、その一
方で第２命令に関連するストア作業を阻止することが必
要とされるであろう。更に、２つ以上の例外に遭遇する
こともあり得る。例えば、対命令（LOADとADD）は、LOA
Dに対してページフォルトに、ADDに対してオーバフロー
例外に遭遇することもあろう。更に、例外の組合せの数
は非常に多くなり、対の例外プロシージャをデバックす
ることが極めて困難である。

本発明の解決手段は、単独で発せられる命令の例外処
理について既に存在する例外処理プロシージャを活用す
るものである。対命令を実行するためのマイクロコード
は、パイプラインのランク４中に例外条件の存在をテス
トすることによって例外を発見する。このプロシージャ
は、第９図のフローチャート内に示されている。もし例
外が発見された場合には、非対化再始動プロシージャが
呼出され対命令を打切り内の第１命令を単独で発行しな
おす。

利用される現存の例外処理プロシージャにとっては、
プログラムが非対化命令マシーンにより実行中の場合に
発生したであろう内部マクロ状態を、該内部マクロ状態
に一致する単一の命令例外処理プロシージャに提示する
必要があった。

この一致したマクロ状態は、第10図のフローチャート
に示される非対化再始動プロシージャによって提供さ
れ、そのプロシージャは、例外がランク４内で発見され
ると、ランク５において生ずるロードとストアを禁止す
る段階を含んでいる。かくして、スタックレジスタの内
容は変化しないし、内部マクロ状態は、打切った対命令
の直前に位置する命令の実行から得られた状態である。
このマクロ状態は、プログラムが非対化命令マシーンに
より実行される場合に例外処理プロシージャに提示され
る状態と一致する。

ランク５のロードとストアを禁止する他に、非対化再
始動はパイプラインのレジスタをフラッシュし、その対
の第１命令を単独命令として再発行する。もし例外が第
１命令と関連したものであれば、その単独マイクロコー
ドは再び同じ例外に遭遇して、非対化命令マシーンの場
合の如く例外を処理することができる。

もしその例外が第２の命令と関連したものであれば、
第１の命令は事件なしに完了し、また第２の命令は再び
例外に遭遇することになろう。もし第２の命令がこの時
対になっていなければ、単独のマイクロコードが例外を
処理することになろう。もし対になっていれば、もう一
つの非対化再始動が行われることになる。

対になっていない再始動プロシージャは処理能力を低
めるが、例外発生の頻度が比較的少ないため、この不利
益は複雑度が著しく軽減されることに鑑みて受け入れる
ことができる。

第11A〜11G図は一対の命令が実行中に例外を処理する
ための種々のパイプライン段とプロシージャを示すもの
である。

第11A図において、パイプライン25は、命令サイドと
アドレスサイドとに分割されており、命令待ち行列21I
及びアドレス待ち行列21Aと、命令ランクレジスタセッ
ト25I及びアドレスランクレジスタセット25Aとを備えて
いる。更に、命令マルチプレクサ90Iとアドレスマルチ
プレクサ90Aとは、命令サイドのIQ2レジスタIQ3レジス
タと、アドレスサイドのPQ2レジスタ及びPQ3レジスタ
と、ランク５のレジスタ出力を、それぞれ、FU10のアド
レス計算ハードウェアに選択的に接続する。第11B〜11G
図において、イネーブルとなったバスとレジスタは太線
で示してある。

第11B図において、対の命令Ａ＋Ｂが発行可能態勢に
あり、命令サイドのランク０のレジスタ181と201とから
出力され、ＡとＢのアドレスＰ（Ａ）,P（Ｂ）は、アド
レスサイドのランク０のレジス18Aと20Aとから出力され
る。命令のビットはDCOバス28、30上のEPTへ転送され
る。

第11C〜11F図はランク１からランク４の対命令の進行
を描いたものである。ランク４で、マイクロコードは、
演算オーバーフロービットもしくはページフォルトの設
定等の例外をテストする。もし何ら例外が検出されなけ
れば、対命令はランク５を通って、その後リタイアす
る。このテストは、例外ステータスビットを分岐条件ビ
ットとし利用するマイクロコード内の条件分岐によって
実行することができる。例えば、例外を示ビットは、条
件コードレジスタ内にストアされた演算オーバーフロー
ビットとすることができる。

第11G図は対化されていない再始動プロシージャを示
す。マイクロコードはアドレスマルチプレクサ90Aを制
御して命令Ａのアドレスをアドレス計算ハードウェアに
転送する。更に、対Ａ＋Ｂとそれらのアドレスは、命令
サイド及びアドレスサイドのランク１〜５のレジスタ
に、それぞれロードされて、パイプラインのフラッシュ
を開始する。

第11H図において、命令計算ハードウェアは、1C12か
ら命令Ａをアクセスし、マイクロコードは、命令を命令
R0レジスタ20Iに、命令アドレスをアドレスR0レジスタ2
0Aに送るように、IQマルチプレクサを制御する。

第11I図は、命令Ａとそのアドレスは、それぞれ、命
令ROF20IとアドレスROF20Aとに転送されたところを示
す。

第11J図は、命令Ａが、単独のものとして、再発行さ
れたところを示す。

第11K図は、非対化再始動プロシージャを実行するた
めの制御システムのブロックダイヤグラムである。第11
K図について述べると、制御メモリの出力はMCR3レジス
タ100に接続され、MCR3レジスタ100は、MCR4レジスタ10
2とMCR5レジスタ104と組合せて、命令パイプライン25と
同期して動作するマイクロコードパイプラインを形成
し、そのパイプライン内の命令ファミリーを実行するの
に必要な制御信号を提供する。ランク４のマイクロコー
ドは、ｍビットのフィールドを含んでおり、ANDゲート1
06の第１の入力ボートに接続される。EU（実行装置）36
のALU108により発生された例外表示テストビットフィー
ルドは、ラッチ可能なMUX110の入力に接続されている。
MUX110の制御ボートは、ランク４のマイクロコードの制
御フィールド（ｎビット）に接続されており、MUX110の
出力は、ANDゲート106の第２入力ポートへ接続されてい
る。ANDゲート106の出力は、第１デコーダ（DECI）112
の入力へ接続される。DECIの出力は、例外条件が発見さ
れた場合、パイプラインをフラッシさせランク５の書込
み操作を禁止する制御信号である。

さて、第11K図に示すシステムの動作を説明する。ラ
ンク５のマイクロコードの制御フィールドによって、MU
X110は実行中の命令ファミリーについてテストされる特
定の例外表示テストビットを転送することになる。もし
例外条件が発生したならば、伝送されたテストビットは
論理“1"となり、ANDゲート106は開き、ｍビットのラン
ク５のマイクロコードフィールドがデコードされて非対
化再始動プロシージャ実行のための制御信号が発生す
る。もし例外条件が発生していなければ、伝送されたテ
ストビットは論理“0"であり、ANDゲート106は閉じ、デ
コーダの出力は、非対化再始動プロシージャを実行させ
ることはない。

分岐命令処理のプロシージャが、以下に第12図と第13
図のフローチャートを参照して説明される。多くのパイ
プライン化されたシステムの如く、分岐予測RAM（Branc
h Prediction RAM:BPR）が含まれている。それぞれの分
岐命令について、BPR内の分岐予測ビット（BPB）の状態
は、それと関連する分岐命令が実行された最終時におけ
る分岐条件の値を示す。分岐条件ビットは、再び同一値
を有するものと仮定する。第12図について述べると、も
し分岐が行われないであろうとBPBが予測すると、アド
レスの昇順に先読出しが続けられる。分岐が行われると
予測されると、先読出しは、ターゲットアドレスのアド
レスが形成される間、停止される。このターゲットアド
レスが形成されると、先読出しはターゲットロケーショ
ンにおいて再開する。

第７図について上記したように、MEPT（Merged Entry
Point Table）は、対を成す第１命令と第２命令のビッ
トにより一義的に決定され、命令の順序を反映する、即
ち、MSBフィールドは第１命令のEPからのビットを含
み、LSBフィールドは第２命令のEPからのビットを含
む。この一義的なMEPTは、第１命令もしくは第２命令が
分岐命令であるかどうかを表示するマイクロコードにア
クセスする。

分岐条件はランク４で評価される。BPBは、一対の命
令と共にパイプIDビットとしてパイプライン内を移動
し、先に実行された命令によって設定された分岐条件ビ
ット（BCB）と比較される。もしBPBとBCB（分岐条件ビ
ット）がマッチすれば、パイプラインの内容は正しく、
正規の処理が続けられて、対命令はリタイアする。もし
BPBとBCBがマッチしなければ、パイプライン中のその後
の命令は正しくなく分岐回復が起こらなければならな
い。

さて、第13図について述べると、分岐回復の第１ステ
ップは、分岐命令が対内の第１命令であるか第２命令で
あるかどうかに依存する。上述の如く、マイクロコード
ルーチンは２つの場合について異なっている。もし予測
誤りした分岐命令が対の第１命令であれば、第２命令の
ランク５の蓄積は当該命令が第１の命令に次いで実行さ
れるべき命令ではないから禁止されるべきである。更
に、その後続く命令は全てパイプラインからフラッシさ
れ、分岐に必要とされる更新は全てやり直される。

もし予測を誤った分岐命令が対の第２命令である場合
には、ランク５の対命令と関連する記憶が完了する。パ
イプラインの残りの段と先読出し待ち行列は以前通りフ
ラッシされる。

分岐の予測誤りの場合には、新たなアドレスを形成し
てプログラム内の分岐命令に続く正確な次の命令のロケ
ーションで先読出しを再開する。

アドレスの計算し直しはBPBがBCBとマッチしない場合
だけ必要である。分岐予測は不正確であったため、分岐
命令に続くパイプライン内の命令は不正確である。その
ため、もしBPBが分岐が行われたということを表示すれ
ば、分岐命令に続くパイプライン内の命令のアドレスは
BRANCH−TARGである。然しながら、次の命令アドレスは
BRANCH＋１でなければならない。同様にして、もしBPB
が分岐が行われないことを示せば、分岐命令に続くパイ
プライン内の命令のアドレスはBRANCH＋１となる。然し
ながら、次の命令アドレスはBRANCH−TARGとなるべきで
ある。

テーブル１について述べると、第１列において、マイ
クロコードは、現在、パイプラインのレジスタR5I−Ｆ
内に常駐する対内の第１命令が分岐命令であることを示
す。BPBが分岐で行われるであろうと予測誤りしたた
め、次の命令のアドレスは、BRANCH−TARGの代わりにBR
ANCH＋１となるはずである。

第11A図に戻ると、今、R5P−Ｆ内に常駐する分岐命令
のアドレスは、アドレス側MUX90Aを介してFU10のアドレ
ス計算ハードウェアへ転送される。このアドレスは増分
されて読出される次の命令のアドレス、BRANCH＋１を形
成する。

テーブル１に戻って、このテーブル１の第２列では、
マイクロコードは、第１命令が分岐命令であることを示
す。BPBは分岐が行われないであろうと予測誤りしたた
めに、次の命令のアドレスはBRANCH＋１の代わりにBRAN
CH−TARGとならなければならない。

第11A図について述べると、現在、レジスタR5I−Ｆと
R5P−Ｆ内に常駐する分岐命令とそのアドレスは、それ
ぞれ命令サイドとアドレスサイドのMUX90Iと90Bを介し
てFU10のアドレス計算ハードウェアへ回送される。その
後、アドレス計算ハードウェアは、読み出されるべき次
の命令のアドレス、BRANCH＋TARGを計算する。

第14図は、分岐予測のメカニズムを実施する制御シス
テムのブロックタイヤグラムである。第11K図について
説明した如く、制御メモリ39とMCR3レジスタ100とMCR4
レジスタ102とMCR5レジスタ104とが、接続される。制御
パイプラインの各ランクは、実行されている命令に関す
る一定の情報をストアするパイプID（PID）レジスタ120
を含んでいる。分岐予測RAM（BPR）122は、出力がPIDレ
ジスタ120に接続されて、分岐予測ビット（BPB）がパイ
プライン内を伝播し分岐命令が実行されるようになって
いる。ランク４のPIDレジスタア120内にストアされたBP
Bは、コンパレータ124の第１入力に接続されており、条
件コードレジスタ（CCR）126内にストされる分岐条件ビ
ット（BCB）またはALUから転送される分岐条件ビット
（BCB）が、マルチプレクサ（MUX）127を経由して、コ
ンパレータ124の第２入力に接続される。ランク４のマ
イクロコードのｎビットフィールドは、ANDゲート128の
第１入力に接続され、コンパレータ124の出力はANDゲー
ト128の第２入力へ接続される。MUX127は、ランク４の
マイクロコードの制御フィールドにより制御される。AN
Dゲート128の出力はデコーダ（DECA）130の入力に接続
される。DECA130の出力は分岐予測機構を実行させる制
御信号である。

次に第14図に示すシステムの動作を４つの別々のケー
スについて説明する。最初の２つのケースは、BCBが、
先に実行された命令によって条件コードレジスタ126内
にセットされたビットである場合の条件分岐命令に関す
るものである。この２つのケースは、前記の先に実行さ
れた命令が、先に実行されたファミリーに含まれるか、
もしくは分岐命令を含む現在のファミリー内に含まれる
かどうかによって区別される。

第２の２つのケースは、BCBが、先に実行された命令
によりレジスタファイル（例えばRegA）内にストアされ
たデータを用いてALUによって計算される場合の条件分
岐命令に関する。これら２つのケースは、先の命令が現
在ファミリー内に含まれるかどうかによって識別され
る。第１のケースは、条件コードレジスタ126内のBCB
は、既に、先の命令の実行中にセットされている。もし
BCBとPID120からのBPBがマッチしなければ、分岐は予測
誤りされたものであり、コンパレータ124の出力がANDゲ
ート128を開く。その後、ｎビットのランク４のマイク
ロコードフィールドが、DECA130へ移され、分岐予測メ
カニズムを実行するのに必要な制御信号を発生する。上
記の如く、ｎビットフィールドは、ファミリー内の分岐
命令の位置を示し、従って、デコーダの出力は、その位
置に依存して異なることになろう。

もしBCBとBPBがマッチすれば、コンパレータ124の出
力はANDゲート128を閉じ、分岐回復メカニズムを実行さ
せる制御信号は、パイプラインの内容は正確であるの
で、発生されない。

もし、BCBが、現在ファミリー内の命令により書込ま
れる条件コードレジスタ126からのビットであれば、BCB
ビットは、レジスタファイルに書込まれる前に、コンパ
レータ124に提供されなければならない。MUX127は、ラ
ンク４中に、ALUの出力を直接コンパレータ124へ提供す
るように制御されて、その後、BCBCが、ランク４中に条
件コードレジスタに書込まれる。

もしBCBがALUにより計算され且つレジスタデータが先
のファミリー内の命令によって書込まれたならば、レジ
スタデータはALUに転送され、ALU出力はMUX127を介して
コンパレータ124へ転送される。

もしレジスタデータが現在ファミリー内の命令によっ
て発生させられたら、データは、レジスタファイルに書
込まれる前に、第６図について述べたハードウェアを利
用してALUに提供され、また、ALU出力は、ランク４中に
MUXを介してコンパレータ124へ転送される。その後同デ
ータはランク５中にレジスタファイルに書込まれる。

以上、本発明を２個の命令を並行実行するシステムに
ついて述べてきたが、本発明の原理は２個以上の命令フ
ァミリーについても等しく適用可能である。その場合、
対化論理は２個以上のステータスフィールドに応ずるよ
うに修正され、そのファミリを並行実行するための特別
のマイクロコードルーチンが書込まれることになろう。

更に、マイクロコードプロセッサについて説明してき
たが、本発明に係るシステムは、論理アレイを用いて制
御信号を発生させるマシーンにも適用することができ
る。両システムとも一定状況において利点をもち、その
選択は本発明の実施にとって重要な問題ではない。更
に、レジスタタック以外の形のレジスタ構成を使用する
こともできる。

第７図を参照して説明したステータスビットは、対化
論理によって、命令ファミリーのEP（エントリポイン
ト）を併合すべきかどうかを定めるのに使用される。代
替例として、EPは常に併合されるものとすることもで
き、その場合、アクセスしたマイクロコードが、命令フ
ァミリーが並行して発行されることを制御することにな
ろう。

更に、並行に発行され得るターゲット命令の小セット
の選択は必須ではない。マイクロコードルーチンは、タ
ーゲット命令のセットからあらゆる可能な対の命令のた
めに、提供され得る。

かくして、本発明は望ましい実施例について説明した
が、その置換、変形は当業者にとって明らかであろう。
従ってそれは特許請求の範囲に提示されるものを除いて
は本発明を限定するものと考えるべきではない。

【図面の簡単な説明】

第１図は、本発明のハイレベルのブロック図である。第２図は、第１の対命令を順次並行処理する特殊例を示
す図である。第３図は、第２の対命令を順次並行処理する特殊例を示
す図である。第４図は、従来技術による３段パイプラインのブロック
線図である。第５図は、本発明の実施例に係る６段パイプラインの線
図である。第６図は、バイパス回路を備えるマルチポートレジスタ
ファイルのブロック図である。第７図は、本発明の実施例に係る対化論理装置のブロッ
ク図である。第８図は、本発明の実施例に使用されるマイクロメモリ
のメモリマップを示す図である。第９図は、本発明の例外処理プロシージャのフローチャ
ートである。第10図は、本発明の非対再開始プロシージャのフローチ
ャートである。第11A図〜11J図は、本発明の例外・分岐処理プロシージ
ャに関するパイプライン段を示すブロック図である。第11K図は、例外処理制御システムのブロック図であ
る。第12図は、本発明の分岐プロシージャのフローチャート
である。第13図は、分岐予測誤りを処理するプロシージャのフロ
ーチャートである。第14図は、分岐予測制御システムのブロック図である。 10……読出し（フェッチ）装置、 12……内部キャッシュ（IC） 14,16……命令待ち行列レジスタ 18,19……パイプラインレジスタ、 22,24……デコード装置、 26……対化論理装置（PLU）、 28,30……デコード出力バス、 32、34……ステータスバス、 36……実行装置、 38……併合デコードバス。

フロントページの続き (72)発明者フィリップアールマネラアメリカ合衆国カリフォルニア州 94062 レッドウッドシティアイリスストリート 406 (72)発明者ロバートダブリューホーストアメリカ合衆国イリノイ州 61821 シャンペインロブソンパークドライヴ 2804 (56)参考文献特開平２−47725（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 9/38

Claims

(57)【特許請求の範囲】

【請求項１】１クロックの間に１プログラムに含まれる
順序付け命令グループを発するように構成されたデータ
プロセッサであって、メモリ基準値を計算してALU動作
を行う第１ステージとデータを書き込む第２ステージと
を含むいくつかのステージで命令を実行するパイプライ
ンを有し、且つ、分岐条件ビットの状態を予測し且つ分
岐命令が実行された直後にその分岐が行われたかどうか
に依存して後続の命令か又は分岐ターゲット命令をフェ
ッチする分岐予測プロシージャを含んでいるデータプロ
セッサにおいて、１クロックの間に発した命令グループ
中に含まれる分岐命令を処理する分岐処理プロシージャ
が、次のステップ：前記命令グループ内の１個だけの命令が分岐命令である
場合にのみ命令グループを発し、前記命令グループ中のどの命令が分岐命令であるかどう
かを判定し、前記パイプラインの第１ステージにおいて前記分岐予測
が正しかったかどうかを判定し、もし分岐予測が誤っていて且つ分岐命令が命令グループ
の第１命令であるならば、前記パイプラインの第２ステ
ージの間において、命令グループの前命令の実行に関連
するデータの書き込みを禁止し、前記パイプラインの全ステージから命令をフラッシュ
し、プログラムにおいて前記分岐命令に続く正しい次の命令
をフェッチすることを含むことを特徴とする分岐処理方法。
【請求項２】１クロックの間に１プログラムに含まれる
順序付け命令グループを発するように構成されたデータ
プロセッサであって、メモリ基準値を計算してALU動作
を行う第１ステージとデータを書き込む第２ステージと
を含むいくつかのステージで命令を実するパイプライン
を有し、且つ、分岐条件ビットの状態を予測し且つ分岐
命令が実行された直後にその分岐が行われたかどうかに
依存して後続の命令か又は分岐ターゲット命令をフェッ
チする分岐予測プロシージャを含んでいるデータプロセ
ッサにおいて、１クロックの間に発した命令グループ中
に含まれる分岐命令を処理する分岐処理プロシージャ
が、次のステップ：前記命令グループ内の１個だけの命令が分岐命令である
場合にのみ命令グループを発し、前記命令グループ中のどの命令が分岐命令であるかどう
かを判定し、前記パイプラインの第１ステージにおいて前記分岐予測
が正しかったかどうかを判定し、もし分岐予測が誤っていて且つ分岐命令が命令グループ
の第１命令でないならば、前記パイプラインの第２ステ
ージの間において、前記分岐命令に続く命令グループ内
の全命令の実行に関連するデータの書き込みを禁止し、前記命令グループの前記分岐命令に先行する全命令に関
連するデータの書き込みを完了し、前記パイプラインの全ステージから命令をフラッシュ
し、プログラムにおいて前記分岐命令に続く正しい次の命令
をフェッチすることを含むことを特徴とする分岐処理方法。
【請求項３】請求項１に記載の方法において、前記フェ
ッチのステップは、更に、前記命令グループに含まれる分岐命令のアドレスを格納
し、該格納した分岐命令アドレスと前記パイプラインの前記
分岐命令を使用して前記プログラム中の分岐命令に続く
次の命令のアドレスを計算し、該計算したアドレスによって、前記命令グループの前記
正しい次の命令にアクセスすることを特徴とする方法。
【請求項４】１クロックの間に１プログラムに含まれる
順序付け命令グループを発するように構成されたデータ
処理装置であって、メモリ基準値を計算してALU動作を
行う第１ステージとデータを書き込む第２ステージとを
含むいくつかのステージで命令を実行するパイプライン
を有し、且つ、分岐条件ビットの状態を予測し且つ分岐
命令が実行された直後にその分岐が行われたかどうかに
依存して後続の命令か又は分岐ターゲット命令をフェッ
チする分岐予測プロシージャを含んでいるデータ処理装
置において、１クロックの間に発した命令グループ中に
含まれる分岐命令を処理する分岐処理装置が、前記命令グループ内の１個だけの命令が分岐命令である
場合にのみ命令グループを発する手段と、前記命令グループ中のどの命令が分岐命令であるかどう
かを判定する手段と、前記パイプラインの第１ステージにおいて前記分岐予測
が正しかったかどうかを判定する手段と、もし分岐予測が誤っていて且つ分岐命令が命令グループ
の第１命令であるならば、前記パイプラインの第２ステ
ージの間において、命令グループの全命令の実行に関連
するデータの書き込みを禁止する手段と、前記パイプラインの全ステージから命令をフラッシュす
る手段と、プログラムにおいて前記分岐命令に続く正しい、次の命
令をフェッチする手段とを含むことを特徴とする分岐処理装置。
【請求項５】１クロックの間に１プログラムに含まれる
順序付け命令グループを発するように構成されたデータ
処理装置であって、メモリ基準値を計算してALU動作を
行う第１ステージとデータを書き込む第２ステージとを
含むいくつかのステージで命令を実行するパイプライン
を有し、且つ、分岐条件ビットの状態を予測し且つ分岐
命令が実行された直後にその分岐が行われたかどうかに
依存して後続の命令か又は分岐ターゲット命令をフェッ
チする分岐予測プロシージャを含んでいるデータ処理装
置において、１クロックの間に発した命令グループ中に
含まれる分岐命令を処理する分岐処理装置が、前記命令グループ内の１個だけの命令が分岐命令である
場合にのみ命令グループを発する手段と、前記命令グループ中のどの命令が分岐命令であるかどう
かを判定する手段と、前記パイプラインの第１ステージにおいて前記分岐予測
が正しかったかどうかを判定する手段と、もし分岐予測が誤っていて且つ分岐命令が命令グループ
の第１命令でないならば、前記パイプラインの第２ステ
ージの間において、前記分岐命令に続く命令グループ内
の全命令の実行に関連するデータの書き込みを禁止する
手段と、前記命令グループの前記分岐命令に先行する全命令に関
連するデータの書き込みを完了する手段と、前記パイプラインの全ステージから命令をフラッシュす
る手段と、プログラムにおいて前記分岐命令に続く正しい次の命令
をフェッチする手段とを有することを特徴とする分岐処理装置。
【請求項６】請求項４に記載の装置において、前記フェ
ッチ手段は、更に、前記命令グループに含まれる分岐命令のアドレスを格納
する手段と、該格納した分岐命令アドレスと前記パイプライン中の前
記分岐命令を使用してプログラム中の前記分岐命令に続
く次の命令のアドレスを計算する手段と、該計算したアドレスを用いて、前記命令グループの前記
正しい次の命令にアクセスする手段とを含むことを特徴とする装置。