JPH03212736A - データ処理装置 - Google Patents

データ処理装置

Info

Publication number
JPH03212736A
JPH03212736A JP939290A JP939290A JPH03212736A JP H03212736 A JPH03212736 A JP H03212736A JP 939290 A JP939290 A JP 939290A JP 939290 A JP939290 A JP 939290A JP H03212736 A JPH03212736 A JP H03212736A
Authority
JP
Japan
Prior art keywords
instruction
branch
stage
address
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP939290A
Other languages
English (en)
Inventor
Tatsuya Ueda
達也 上田
Masahito Matsuo
雅仁 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP939290A priority Critical patent/JPH03212736A/ja
Publication of JPH03212736A publication Critical patent/JPH03212736A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はデータ処理装置に関し、更に詳述すれば、分岐
命令処理機構によりパイプライン処理の乱れを抑制して
多段パイプライン処理機構を効率的に動作させて高度の
処理能力を発揮し得るデータ処理装置に関する。
〔従来の技術] 第6図は従来のデータ処理装置において一般的に採用さ
れているパイプライン処理機構の概略の構成例を示す模
式図である。
図中11は命令フェッチステージ(IPステージ)】2
は命令デコードステージ(Dステージ)、13はオペラ
ンドアドレス計算ステージ(Aステージ)、14はオペ
ランドフェッチステージ(Fステージ)、15は命令実
行ステージ(Eステージ)である。
1Fステージ11は図示しないメモリから命令コートを
フェッチしてDステージ12へ出力する。Dステージ1
2はIFステージ11がフェッチした命令コードをデコ
ートし、そのデコード結果をAステージ13へ出力する
。Aステージ13は命令コート中で指定されたオペラン
ドの実効アドレスを計算し、その結果をFステージ14
へ出力する。Fステージ14はAステージ13から人力
されたオペランドアドレスに従ってメモリからオペラン
ドアドレスをフェッチし、Eステージ15へ出力する。
Eステージ15はFステージ14から入力されたオペラ
ンドを対象として命令コード中で指定された演算を実行
し、更に必要な場合はその演算結果をメモリにストアす
る。
上述のよう′に、従来のデータ処理装置ではパイプライ
ン処理機構により各命令で指定される処理は一例として
5つに分解されて順次処理される。
それぞれの5つの処理は異なる命令に対しては並列動作
させることが可能であり、理想的には5段のパイプライ
ン処理機構により5個の命令を同時並列的に処理して、
パイプライン処理を採用しない場合に比して最大で5倍
の処理能力を有するデータ処理装置が得られる。
パイプライン処理の手法は上述の如く、データ処理装置
の処理能力を大幅に向上させ得るため、処理速度が高い
データ処理装置では広く採用されている。
しかし、パイプライン処理は常に理想的な状態で動作す
るという保証はない。パイプライン処理における問題の
一つとして、分岐命令の処理が挙げられる。
たとえば、第6図に示す如き構成のパイプライン処理機
構により分岐命令をEステージ15において処理した後
、別の分岐命令をIFステージ11が処理する場合には
、パイプライン処理が大きく乱れる。その様子を第7図
の従来のデータ処理装置における分岐命令の処理手順を
示す模式図を参照して説明する。
第7図Gこおいては、命令IN3及び命令lNl2が分
岐命令である。命令IN3が実行されると、既にパイプ
ライン処理が開始されている命令IN4.  命令IN
S、  命令IN6.  命令IN7はキャンセルされ
、命令IN3の分岐先命令である命令INIIの処理が
新たにIFステージ11から開始される。
命令IN3がEステージ15で実行されてから命令IN
IIがEステージ15で実行されるまでには4命令分の
処理時間が無駄になる。
命令lNl2についても同様に4命令分の処理時間が無
駄になる。
この無駄時間は分岐命令の実行後に処理されるべき命令
のフェッチが分岐命令に対する全パイプライン処理が終
了した後に行われるために生じる。
従って、パイプライン処理の段数が多ければ多い程、無
駄時間も長くなる。
このような、分岐命令の実行に際するパイプライン処理
の乱れを抑制する目的で、IFステージ11において命
令をフェッチする時点で分岐命令の分岐先を予測し、そ
の分岐命令がEステージ15において実行される以前に
命令のフェンチ先を予め分岐先へ変更する先行分岐処理
が採用されている。
このような先行分岐処理をブリブランチ処理と称する。
第8図は上述のようなブリブランチ処理に使用される従
来のデータ処理装置のブランチターゲットバッファ(B
TB)の構成例を示す模式図である。
なお、この第8図に示す構成は本願発明者らが先に特願
平1−213557号として出願している発明である。
BTB160は、複数のエントリにて構成され、それぞ
れのエントリは分岐命令アドレスフィールドエントリが
有効であるか否かを示す有効ビットフィールド、分岐先
アドレスフィールド及びプリブランチ時の命令フェッチ
先切換えタイミングを制御するシーケンス制御フィール
ドにて構成されている。
分岐命令アドレスフィールドには、分岐命令のアドレス
が登録される。分岐先アドレスフィールドにはそれぞれ
の分岐命令が分岐した場合の分岐先アドレスが登録され
る。
Eステージ15において分岐命令が分岐を発生すると、
その命令のアドレスと分岐先アドレスとが対になってそ
れぞれBTB160の分岐命令アドレスフィールドと分
岐先アドレスフィールドとに登録され、対応する有効ビ
ットフィールドのビットが“ビにセットされる。
IPステージ11による命令のフェッチは、フェッチす
べき命令のアドレスをカウンタQINPC115にセッ
トすることにより行われる。
IFステージIfが命令をフェッチすると、カウンタQ
[NPC115の値であるその命令のアドレスがデコー
ダ190によりデコードされ、デコード結果に従ってB
TB160の対応するエントリが指定される。指定され
たBTB160中の分岐命令アドレスフィールドの値は
比較器191へ出力されるが、比較器191にはカウン
タQINPC115の値も与えられており、両者は比較
器191で比較される。
この比較器191による比較結果が一致し、且つ対応す
る有効ビットフィールドのビットが“1”であれば、プ
リブランチが発生する。即ち、比較器191の比較結果
が一致したことを示す信号°1″と有効ビットフィール
ドの値“1″とが共にANDゲー目92へ入力されるの
で、その“1″出力がプリブランチ発生信号として分岐
先アドレスレジスタ161及びシーケンス制御機構16
2に与えられる。
これにより、分岐先アドレスレジスタ161 はBTB
160中の分岐先アドレスフィールドからの出力をラッ
チし、またシーケンス制御機構162はBTB160中
のシーケンス制御フィールドからの出力をラッチする。
ンーケンス嗜11211 fil 4J 162にラッ
チされた値がカウンタQINPCII5に与えられるこ
とにより、命令フェッチシーケンスが分岐先アドレスレ
ジスタ161にラッチされている値、即ちBTB160
中の分岐先アドレスフィールドの値に変更される。換言
すれば、BTB160のシーケンス制御フィールドから
出力される値により、カウンタQ[NPC115にセッ
トされる値が次のアドレスであるか、分岐先アドレスで
あるかが決定される。
以上により、IPステージ11は分岐命令をフェッチし
た場合、その分岐命令の分岐先の命令を次に直ちにフェ
ッチすることが出来る。即ち、命令キュー112には分
岐命令とこの分岐命令からの分岐先命令とが連続して格
納されている。従って、Dステージ12以降の各ステー
ジにおける処理を乱すことなく命令シーケンスを変更す
ることが可能である。
〔発明が解決しようとする課題〕
上述の如く、プリブランチ処理の採用により、命令フェ
ッチステージにおいて命令フェッチシーケンスを予め分
岐先へ切換えれば、パイプライン処理の効率は一般的に
向上する。
しかし、従来のデータ処理装置に採用されているプリブ
ランチ処理では、プリブランチが発生した際に後段のパ
イプラインステージがメモリアクセスを行っていると、
そのメモリアクセスが完了した後にプ」ノブランチ先の
命令フェッチが行われることになるので、ブリブランチ
先の命令データの取込みが遅れる。
本発明はこのような事情に鑑みてなされたものであり、
プリブランチが発生した直後に分岐先の命令データを供
給することが可能なデータ処理装置の提供を目的とする
6 〔課題を解決するための手段〕 本発明のデータ処理装置では、分岐命令がフェッチされ
た場合に予めその分岐先命令を次にフェッチするために
使用されるテーブルに、各分岐命令それぞれの分岐先命
令データそのものを格納するための分岐先命令データフ
ィールドを備えている。
〔作用〕
本発明のデータ処理装置では、分岐命令のフェッチに際
して予めその分岐命令の分岐先命令へ分岐する場合に、
分岐先命令データそのものがチーフルの分岐先命令デー
タフィールドに格納されているので、分岐が発生した際
にパイプラインの後段のステージでメモリアクセスが行
われている場合にも、分岐先命令データフィールドがら
分岐先〔発明の実施例〕 以下、本発明をその実施例を示す図面に基づいて詳述す
る。
(llra能ブロノブロック」 第4図は本発明のデータ処理装置の一構成例を示すプロ
ンク図である。
本発明のデータ処理装置の内部を機能的に大きく分ける
と、命令フェッチ部51.命令デコード部52、 PC
計算部538 オペランドアドレス計算部54マイクロ
ROM部55.データ演算部56.外部ハスインターフ
ェイス部57に分かれる。
第4図では、その他にCPU外部ヘアドレスを出力する
ためのアドレス出力回路58と、CPU外部とデータを
入出力するためのデータ入出力回路59とを他の機能ブ
ロック部と分けて示した。
(1,1)  r命令フェッチ部」 命令フェッチ部51には、命令キュー112(第1図参
照)とその制御部等があり、次にフェッチすべき命令の
アドレスを決定してCPU外部のメモリから命令をフェ
ッチする。
次にフェッチすべき命令のアドレスは、後述する命令キ
ュー112(第1図参照)へ入力すべき命令のアドレス
として専用のカウンタにて計算される。
分岐あるいはジャンプが発生した場合には、新たな命令
のアドレスがPC計算部53またはデータ演算部56か
ら転送されてくる。
CPU外部のメモリから命令をフェッチする場合は、外
部バスインターフェイス部57を通して、フェッチすべ
き命令のアドレスがアドレス出力回路58からCP[I
外部へ出力されることにより、データ入出力回路59か
ら命令コードがフェッチされる。
そして、バッファリングした命令コードの内、次にデコ
ードすべき命令コードが命令デコード部52へ出力され
る。
(1,2)  r命令デコード部」 命令デコード部52においては、基本的には16ビツト
(ハーフワード)単位で命令コードがデコードされる。
このブロックには命令コードの第1ハーフワードに含ま
れるオペレーションコードをデコートするFHWデコー
ダ、第2.第3ハーフワードに含まれるオペレージタン
コードをデコートするNFH−デコーダ、アドレッシン
グモードをデコードするアドレッシングモードデコーダ
が含まれる。
これらFH−デコーダ、NFHWデコーダ、アドレッシ
ングモードデコーダを一括して第1デコーダと称する。
FFIWデコーダあるいはNFH−デコーダの出力を更
にデコードしてマイクロROMのエントリアドレスを計
算する第2デコーダ及びオペランドアドレス計算の際の
パイプラインコンフリクトをチエツクするアドレス計算
コンフリクトチエツク機構も命令デコード部52に含ま
れる。
命令デコード部52は命令フェッチ部51から入力され
た命令コードを2クロツク(1ステツプ)につき0〜6
ハイトずつデコードする。デコード結果の内、データ演
算部56での演算に関係する情報がマイクロROM部5
5へ、オペランドアドレス計算に関係する情報がオペラ
ンドアドレス計算部54へ、pc計算に関係する情報が
pc計算部53へそれぞれ出力される。
(1,3)  rマイクロRAM部」 マイクロROM部55には、主にデータ演算部56を制
御するマイクロプログラムが格納されているマイクロR
OM、  マイクロシーケンサ、マイクロ命令デコーダ
等が含まれる。
マイクロ命令はマイクロROMから2クロツク(lステ
ップ)に1度読出される。マイクロシーケンサはマイク
ロプログラムで示されるシーケンス処理の他に、例外1
割込及びトラップ(この3つを合わせてEITと称する
)の処理をハードウェア的に受付ける。またマイクロR
OM部55はストアバッファの管理も行う。
マイクロROM部55には命令コードに依存しない割込
みあるいは演算実行結果によるフラッグ情報と、第2デ
コーダの出力等の命令デコード部の出力が入力される。
マイクロデコーダの出力は主にデータ演算部56に対し
て出力されるが、ジャンプ命令の実行による他の先行処
理中止情報等の一部の情報は他のブロックへも出力され
る。
(1,4)  rオペランドアドレス計算部」オペラン
ドアドレス計算部54は命令デコード部52のアドレス
デコーダ等から出力されたオペランドアドレス計算に関
係する情報によりハードワイヤード制御される。このブ
ロックではオペランドのアドレス計算に関するほとんど
の処理が行われる。メモリ間接アドレッシングのための
メモリアクセスのアドレス及びオペランドアドレスがメ
モリにマツプされたI10領域に入るか否かのチエツク
もこのオペランドアドレス計算部54で行われる。
アドレス計算結果は外部バスインターフェイス部57へ
送られる。アドレス計算に必要な汎用レジスタ及びプロ
グラムカウンタの値はデータ演算部から入力される。
メモリ間接アドレッシングを行う際は外部ハスインター
フェイス部57を通してアドレス出力回路58からCP
U外部へ参照すべきメモリアドレスが出力されることに
より、データ入出力部59から入力された間接アドレス
値が命令デコード部52をそのまま通過してフェノ°チ
される。
(1,5)  rPc計算部」 PC計算部53は命令デコート部52から出力されるP
C計算に関係する情報によりハートワイヤードに制御さ
れ、命令のpc値を計算する。
本発明のデータ処理装置は可変長命令セットを有してお
り、命令をデコードしなければその命令の長さが判らな
い。このため、PC計算部53は命令デコード部52か
ら出力される命令長をデコード中の命令のpc値に加算
することにより次の命令のpc値を作り出す。
pc計算部53の計算結果は各命令のpc値として命令
のデコード結果と共に出力される。
(1,6)  rデータ演算部」 データ演算部56はマイクロプログラムにより制御され
、マイクロRAM部55の出力情報に従って各命令の機
能を実現するに必要な演算をレジスタと演算器とで実行
する。
演算対象となるオペランドがアドレスあるいは即値であ
る場合は、データ演算部56はオペランドアドレス計算
部54で計算されたアドレスあるいは即値を外部ハスイ
ンクフェイス部57を通して得る。
また、演算対象となるオペランドがCPU外部のメモリ
にある場合は、アドレス計算部54で計算されたアドレ
スをハスインクフェイス部57がアドレス出力回路58
から出力することにより、データ演算部56はCPU外
部のメモリからフェッチしたオペランドをデータ入出力
回路59から得る。
演算器としてはALU、  バレルシフタ、プライオリ
ティエンコーダあるいはカウンタ シフトレジスタなど
がある。レジスタと主な演算器との間は3バスで結合さ
れており、1つのレジスタ間演算を指示する1マイクロ
命令は2クロツク(1ステツプ)で処理される。
データ演算時にCPII外部のメモリをアクセスする必
要がある場合は、マイクロプログラムの指示により外部
バスインターフェイス部57を通してアドレス出力回路
58からアドレスがCPU外部へ出力されることにより
、データ入出力回路59を通して目的のデータがデータ
演算部56ヘフエ、チされる。
データ演算部56がCPU外部のメモリからデータをリ
ートする場合は、リートすべきデータのアトレス力くへ
Alレジスタ76にセットされ、そのアドレスが外部ハ
スインターフェイス部57を通してアドレス出力回路5
8から出力されることにより、デクがデータ入出力回路
59から後述するDDハス10B(第1図参照)を通し
てDDRIレジスタ77(第11参照)へ取込まれる。
データ演算部56がCPU外部のメモリへデータをライ
トする場合は、ライトすべきデータのアドレスがAAI
レジスタ76にセットされ、そのアドレスが外部ハスイ
ンターフェイス部57を通してアドレス出力回路58か
ら出力されることにより、後述するDDR2レジスタ7
8(第1図参照)にセットされているデータがDDハス
108を通してデータ入出力回路59からCPU外部へ
出力される。
ジャンプ命令の処理あるいは例外処理等を行って新たな
命令アドレスをデータ演算部56が得た場合は、これを
命令フェッチ部11とPC計算部13とへ出力する。
(1,7)  rlL9Bハスインターフェイス部」外
部バスインターフェイス部57は本発明のデータ処理装
置の外部バスでの通信を制御する。メモリのアクセスは
すべてクロック同量で行われ、最小2クロックサイクル
(1ステツプ)で行うことかできる。
メモリに対するアクセス要求は命令フェッチ部51、オ
ペランドアドレス計算部54及びデータ演算部56から
独立に生じる。更ムこ、オペランドプリフェッチを行う
ためのアクセス要求も生じる。
外部ハスインターフェイス部57はこれらのメモリアク
セス要求を調停する。更に、メモリとCPUとを結ぶデ
ータバスサイズである32ビツト(1ワード)の整置境
界を跨ぐメモリ番地にあるデータのアクセスは、このブ
ロック内で自動的にワード境界を跨くことが検知されて
2回のメモリアクセスに分解されて行われる。
プリフェッチされるオペランドとストアされるオペラン
ドとが重なる場合のコンフリクト防止処理及びストアオ
ペランドからフェッチオペランドへのバイパス処理もこ
の外部ハスインク−フェイス部57で行われる。
命令フェッチ部51からのアクセス要求がある場合は、
後述するCAMレジスタ■42(第1圀参照)にアクセ
ス対象のアドレスがセットされる。アドレス計算部54
からのアクセス要求がある場合は、IAレジスタ125
にアクセス対象のアドレスがセットされる。データ演算
部56からのアクセス要求がある場合は、AAIレジス
タ76にアクセス対象のアドレスがセットされる。
オペランドのプリフェッチのためのアクセス要求がある
場合は、FAレジスタ127にセットされたアクセス対
象のアドレスがAAババス07へ出力されることにより
、CPU外部のメモリから外部バスインターフェイス部
57ヘオペランドデータがフェッチされる。フェッチさ
れたオペランドデータはDOハス108を通じて5DA
TA80へ入力される。また、アクセスに使用されたA
Aハス107上のアドレスがSC1M79へ入力される
SCAM79!: 5DATA80ト+! −it指示
vA90ニより相互に接続されている。5DAT^80
には整置された4バイトのデータが2個まで入る。SC
AM79には5DATA80中のデータに対応するアド
レスが入る。5DATA80へのデータの入力は整置さ
れた上で行われるが、そのデータをデータ演算部56が
取出して使用する際には、任意のアドレスから任意のデ
ータ長(但し、4バイト以内)を取出すことが可能であ
る。
(2)「パイプライン機構」 本発明のデータ処理装置のパイプライン処理機構は第5
図に模式的に示される如く構成されている。
命令のブリフェッチを行う命令フェッチステージ(IP
ステージ)31.  命令のデコードを行うデコードス
テージ(Dステージ)32.  オペランドのアドレス
計算を行うオペランドアドレス計算ステージ(^ステー
ジ)33.  マイクロROMアクセス(特にRステー
ジ36と称す)を行う部分とオペランドのブリフェッチ
(特に叶ステージ37と称す)を行う部分とからなるオ
ペランドフェッチステージ(Fステージ)34.  命
令を実行する実行ステージ(Eステージ)35の5段構
成を本発明のデータ処理装置のパイプライン処理の基本
とする。
Eステージ35では1段のストアバッファがある他、高
機能命令の一部は命令の実行自体をパイプライン化する
ため、実際には5段以上のパイプライン処理効果がある
各ステージは他のステージとは独立に動作し、理論上は
5つのステージが完全に独立して動作する。各ステージ
は1回の処理を最小2クロック(1ステツプ)で行うこ
とができる。従って、理想的には2クロツク(lステッ
プ)毎に次々とパイプライン処理が進行する。
本発明のデータ処理装置には、メモリーメモリ間演算あ
るいはメモリ間接アドレッシング等の如く1回の基本パ
イプライン処理のみでは処理し得ない命令もあるが、本
発明のデータ処理装置はこれらの処理に対してもなるべ
く均衡のとれたパイプライン処理が行えるように設計さ
れている。また、本発明のデータ処理装置では複数のメ
モリオペランドを持つ命令に対しては、メモリオペラン
ドの数に基づいてデコード段階で複数のパイプライン処
理単位(ステップコード)に分解してパイプライン処理
を行う。
パイプライン処理単位の分解方法に関しては特開昭63
−89932号公報に詳しく開示されている。
IFステージ31からDステージ32へ渡される情報は
命令コード40そのものである。Dステージ32からA
ステージ33へ渡される情報は命令で指定された演算に
関するもの(Dコード41と称す)と、オペランドのア
ドレス計算に関係するもの(^コード42と称す)との
2つがある。
Aステージ33からFステージ34へ渡される情報はマ
イクロプログラムルーチンのエントリアドレスあるいは
マイクロプログラムのパラメータ等を含むRコード43
と、オペランドのアドレスとアクセス方法指示情報等を
含むFコード44との2つである。
Fステージ34からEステージ35へ渡される情報は演
算制御情報とリテラル等を含むEコード45と、オペラ
ンドあるいはオペランドアドレス等を含むSコード46
との2つである。
Eステージ35以外のステージで検出されたEITは、
そのコードがEステージ35へ到達する迄はBIT処理
を起動しない。Eステージ35で処理されている命令の
みが実行段階の命令であり、IFステージ31からFス
テージ34までの間で処理されている命令はまだ実行段
階に至っていないからである。従って、Eステージ35
以外で検出されたEITは、それが検出されたことがス
テップコード中に記録されて次のステージへ伝えられる
のみである。
(2,1)  rパイプライン処理単位」(2,1,1
)  rステップコードへの命令の分解」本発明のデー
タ処理装置では、上述のパイプライン機構の特徴を生か
したパイプライン処理を行う。
Dステージ32では“2バイトの命令基本部子〇〜4バ
イトのアドレッシング拡張部”、′多段間接モード指定
部十アドレフシング拡張部”又は命令固有の拡張部を1
つのデコード単位として処理する。
各回のデコード結果をステップコードと称し、Aステー
ジ33以降ではこのステップコードをパイプライン処理
の単位としている。ステップコードの数は命令毎に固有
であり、多段間接モード指定を行わない場合は、1つの
命令は最小1個、最大3個のステップコードに分かれる
。多段間接モード指定が行われた場合はそれだけステッ
プコードが増加する。
(2,1,2)  rプログラムカウンタの管理」本発
明のデータ処理装置のパイプライン上に存在するステッ
プコードは全て別命令に対するものである可能性があり
、このためプログラムカウンタの値はステップコード毎
に管理される。全てのステップコードは、そのステップ
コードを発生した命令のプログラムカウンタ値を存する
ステップコードに付属してパイプラインの各ステージを
流れるプログラムカウンタ値はステッププログラムカウ
ンタ(SPC)と称する。SPCはパイプラインの各ス
テージ間を次々と受渡されていく。
(2,2)  r各パイプラインステージの処理」各パ
イプラインステージの人出カステップコードには第5図
に示したように便宜玉名′前が付けられている。
tた、ステップコードはオペレーションコードに関する
処理を行い、マイクロプログラムのエントリアドレス及
びEステージ35に対するパラメータ等になる系列と、
Eステージ35のマイクロ命令に対するオペランドにな
る系列との2系列がある。
(2,2,1)  r命令フェッチステージ」命令フェ
ッチステージ(IPステージ)31は命令をメモリある
いはブランチバッファからフェッチして命令キュー11
2(第1図参照)へ入力し、Dステージ32に対して命
令コードを出力する。命令キュー112への入力は整置
された4ハイド単位で行われる。
メモリから命令をフェッチする場合は、整置された4バ
イトにつき最小2クロック(1ステツプ)を要する。ブ
ランチターゲットバッファ160(BTB:第1図及び
第2図参照)がヒツトした場合は、整置された4バイト
につき1クロフクでフェッチ可能である。命令キュー1
12の出力単位は2ハイド毎に可変であり、2クロツク
の間に最大6バイトまで出力できる。また、分岐の直後
には命令キュー112をバイパスして命令基本部2バイ
トを直接命令デコーダへ転送することも可能である。
ブランチターゲットバッファ160への命令の登録及び
クリア等の制御、ブリフェッチ先の命令のアドレスの管
理及び命令キュー112の制御もIFステージ31で行
う。
1Fステージ31で検出するFATには、命令をメモ、
りからフェッチする際のバスアクセス例外あるいはメモ
リ保護違反などによるアドレス変換例外がある。
(2,2,2)  r命令デコードステージ」命令デコ
ードステージ(Dステージ)32はIFステージ31か
ら入力された命令コードをデコードする。
デコードは命令デコード部520FIIWデコーダ、j
iFH−デコーダ及びアドレッシングモードデコーダを
合わせた第1デコーダを使用して、2クロツク(lステ
ップ)単位に1度行ない、1回のデコード処理で0〜6
バイトの命令コードを消費する(RET命令の復帰先ア
ドレスを含むステンプコーどの出力処理などでは命令コ
ードを消費しない)。Dステージ32は1回のデコード
でAステージ33に対してアドレス計算情報としてのA
コード42である約35ピントの制御コードと最大32
ビ/トのアドレス修飾情報と、オペレーションコードの
中間デコード結果としてのDコード41である約50ビ
ツトの制御コードと、8ビツトのリテラル情報とを出力
する。
Dステージ32では、各命令のpc計算部53の制御命
令キュー112からの命令コードの出力処理をも行う。
Dステージ32で検出するEITには予約命令例外があ
る。また、IFステージ31から転送されてきた各種B
ITはステップコード内にエンコードする処理をしてA
ステージ33へ転送する。
(2,2,3)  rオペランドアドレス計算ステージ
」オペランドアドレス計算ステージ(Aステージ)33
は処理機能が大きく2つに分かれる。1つは命令デコー
ド部52の第2デコーダを使用してオペレーションコー
ドの後段デコードを行う処理で、他方はオペランドアド
レス計算部54でオペランドアドレスの計算を行う処理
である。
オペレーションコードの後段デコード処理はDコード4
1を入力とし、レジスク、メモリの書込み予約及びマイ
クロプログラムのエントリアドレスとマイクロプログラ
ムに対するパラメータなどを含むRコート43の出力を
行う。なお、レジスタあるいはメモリの書込み予約は、
アドレス計算で参照したレジスタやメモリの内容がパイ
プライン上を先行する命令で書換えられることにより誤
ったアドレス計算が行われるのを防ぐためのものである
。レジスタあるいはメモリの書込み予約はデッドロック
を避けるため、ステップコード毎ではなく命令毎に行う
レジスタ及びメモリへの書込み予約については特願昭6
2−144394号に詳細に開示されている。
オペランドアドレス計算処理はAコード42を入力とし
、Aコード42に従いオペランドアドレス計算部54で
加算あるいはメモリ間接参照を組合わせてアドレス計算
を行い、その計算結果をFコード44として出力する。
この際、アドレス計算に伴うレジスタ及びメモリの読出
し時にコンフリクトチエツクが行われ、先行命令がレジ
スタあるいはメモリへの書込み処理を終了していないた
めコンフリクトが指示されれば、先行命令がEステージ
35で書込み処理を終了するまで待機する。また、オペ
ランドアドレス及びメモリ間接参照のアドレスがメモリ
にマツプされたl10tii域に入るか否かのチエツク
も行われる。
Aステージ33で検出するEITには予約命令例外。
特権命令例外、バスアクセス例外、アドレス変換例外、
メモリ間接アドレッシング時のオペランドブレイクポイ
ントヒントによるデバッグトラップがある。Dコード4
1又はAコード42自体がEITを発生したことを示し
ていれば、Aステージ33はそのコードに対してアドレ
ス計算処理をせず、そのEITをRコード43及びFコ
ード44へ伝える。
(2,2,4)  rマイクロROMアクセスステージ
」オペランドフェッチステージ(Fステージ)34も処
理が大きく2つに分かれる。一方はマイクロROMのア
クセス処理であり、特にRステージ36と称する。他方
はオペランドプリフェッチ処理であり、特にOFステー
ジ37と称する。Rステージ36とOFステージ37と
は必ずしも同時に動作するわけではなく、メモリアクセ
ス櫓が獲得できるか否か等に依存して独立に動作する。
Rステージ36の処理であるマイクロROMアクセス処
理は、Rコード43に対して次のEステージ35での実
行に使用する実行制御コートであるEコード45を生成
するためのマイクロRO)lアクセスとマイクロ命令デ
コード処理とである。1つのRコード43に対する処理
が2つ以上のマイクロプログラムステップに分解される
場合、マイクロROMはEステージ35で使用され、次
のRコード43はマイクロROMアクセス待ちになる。
Rコード43に対するマイクロROMアクセスが行われ
るのは、その前のEステージ35での最後のマイクロ命
令実行の時である。本発明のデータ処理装置では、はと
んどの基本命令は1マイクロプログラムステツプで行わ
れるため、実際にはRコード43に対するマイクロRO
Mアクセスが次々と行われることが多い。
Rステージ36で新たに検出するEITはない。Rコー
ド43が命令処理再実行型のETTを示している場合は
そのEIT処理に対するマイクロプログラムが実行され
るので、Rステージ36はそのRコード43に従ったマ
イクロ命令をフェッチする。
Rコード43が奇数アドレスジャンプトランプを示して
いる場合、Rステージ36はそれをEコード45によっ
て伝える。これはプリブランチに対するもので、Eステ
ージ35ではそのEコード45で分岐が生じなければそ
のプリブランチを有効として奇数アドレスジャンプトラ
ンプを発生する。
(2,2,5)  rオペランドフェッチステージ」オ
ペランドフェッチステージ(OFステージ)37はFス
テージ34で行う上記の2つの処理の内のオペランドプ
リフェッチ処理を行う。
オペランドプリフェッチはFコード44を入力とし、フ
ェッチしたオペランドとそのアドレスとをSコード46
として出力する。1つのFコード44ではワード境界を
跨いでもよいが、4バイト以下のオペランドフェッチを
指定する。Fコード44にはオペランドのアクセスを行
うか否かの指定も含まれており、Aステージ33で計算
したオペランドアドレス自体あるいは即値をEステージ
35に転送する場合にはオペランドプリフェッチは行わ
ず、Fコード44の内容をSコード46として転送する
プリフェッチしようとするオペランドと、Eステージ3
5が書込み処理を行おうとするオペランドとが一致する
場合は、オペランドプリフェッチはメモリからは行われ
ずにバイパスして行われる。
また、l108i域に対してはオペランドプリフェッチ
を遅延させ、先行命令の処理が全て完了するまで待って
オペランドフェッチを行う。
OFステージ37で検出されるBITには、ハスアクセ
ス例外、アドレス変換例外、オペランドプリフェッチに
対するブレイクポイントヒツトによるデバッグトラップ
がある。
Fコード44がデバッグトラップ以外のEITを示して
いる場合はそれをSコード46へ転送し、オペランドプ
リフェッチは行われない。Fコード44がデバッグトラ
ンプを示している場合はそのFコード44に対してEI
Tを示していない場合と同し処理をすると共にデバッグ
トラップがSコード46へ伝えられる。
(2,2,6)  r実行ステージ」 実行ステージ(Eステージ)35はEコード45及びS
コード46を入力として動作する。このEステージ35
が命令を実行するステージであり、Fステージ34以前
のステージで行われた処理は全てEステージ35のため
の前処理である。Eステージ35でジャンプ命令が実行
されたり、あるいはEIT処理が起動されたりした場合
は、IFステージ31からFステージ34までの間に行
われた処理は全て無効化される。Eステージ35はマイ
クロプログラムにより制御され、Rコード43に示され
たマイクロプログラムのエントリアドレスからの一連の
マイクロプログラムを実行することにより命令を実行す
る。
マイクロROMの読出しとマイクロ命令の実行とはパイ
プライン化されて行われる。従って、マイクロプログラ
ムで分岐が起きた場合は、1マイクロステツプの空きが
できる。また、Eステージ35はデータ演算部56にあ
るストアバッファを利用して、4バイト以内のオペラン
ドストアと次のマイクロ命令実行とをパイプライン処理
することもできる。
Eステージ35では、Aステージ33で行われたレジス
タ及びメモリに対する書込み予約をオペランドの書込み
後に解除される。
また、条件分岐命令がEステージ35で分岐を発生した
場合は、その条件分岐命令に対する分岐予測が誤ってい
たのであるから、分岐「歴の書換えが行われる。
Eステージ35で検出されるEITには、ハスアクセス
例外、アドレス変換例外、デバッグトラップ。
奇数アドレスジャンプトラップ、予約機能例外。
不正オペランド例外、予約スタックフォーマット例外、
ゼロ除算トラップ、無条件トラップ、条件トラップ3遅
延コンテキストトラツプ、外部割込。
遅延割込、リセット割込、システム障害がある。
Eステージ35で検出されたEFTは全てEIT処理さ
れるが、Eステージ以前のIFステージ31からFステ
ージ34の間で検出され且つRコード43あるいはSコ
ード46に反映されているEITは必ずしもBIT処理
されるとは限らない。IFステージ31からFステージ
34の間で検出されたが、先行の命令がEステージ35
でジャンプ命令が実行されたなどの原因でEステージ3
5まで到達しなかったEITは全てキャンセルされる。
そのEITを起こした命令はそもそも実行されなかった
ことになる。
外部割込及び遅延割込は命令の切目でEステージ35に
直接受付けられ、マイクロプログラムにより必要な処理
が実行される。その他の各種BITの処理はマイクロプ
ログラムにより実行される。
(2,3)  r各パイプラインステージの状態制御」
パイプラインの各ステージは入力ランチと出力ラソチと
を有し、他のステージとは独立して動作することを基本
とする。各ステージは1つ前に行った処理が終わり、そ
の処理結果を出力ラッチから次のステージの入力ランチ
へ転送し、自身のステージの入力ランチに次の処理に必
要な入力信号が総て揃えば次の処理を開始する。
つまり各ステージは、1つ前段のステージから出力され
てくる次の処理に対する人力信号が全て有効となり、今
の処理結果を後段のステージの入力ランチに転送して出
力ランチが空になると次の処理を開始する。
各ステージが動作を開始する1つ前のクロ、クタイミン
グで入力信号が全て揃っている必要がある。入力信号が
揃っていない場合、そのステージは待ち状態(入力待ち
)になる。出力う・ノチから次のステージの入力ランチ
への転送を行う場合には次のステージの大カラ、チが空
き状態になっている必要があり、次のステージの入力ラ
ンチが空きでない場合もパイプラインステージは待ち状
態(出力待ち)になる。必要なメモリアクセス権が獲得
できなかったり、処理しているメモリアクセスにウェイ
トが挿入されたり、その他のパイプラインコンフリクト
が生じると各ステージの処理自(3)「分岐命令の処理
」 本発明のデータ処理装置においては、上述のように多段
構成のパイプライン処理を採用しているため、分岐命令
を実行した際のオーバヘッドが大きい。このオーバヘッ
ドを小さくするためにIFステージ11においてブリブ
ランチ処理を行っている。
プリブランチ処理はEステージ15において分岐する代
わりにIFステージ11において予め分岐することによ
り、可及的早期において分岐先命令をパイプライン処理
機構へ取込むことを目的としている。
また、本発明のデータ処理装置のプリブランチ処理は可
変長の分岐命令にも対応可能であり、従来の固定長の分
岐命令にのみ対応可能であったプリブランチ処理に比し
て、処理可能な分岐命令の数が大幅に増加する。
本発明のデータ処理装置に限らず、−船釣にデータ処理
装置では分岐命令が実行される開度は非常に高く、この
ためプリブランチ処理による性能向上の効果は大きい。
(3,1)  r分岐命令の種類」 本発明のデータ処理装置では、命令フェッチステージに
おいてブリブランチを行う命令をブリブランチ命令と称
す。このプリブランチ命令には、無条件分岐命令のよう
に、必ず分岐する命令も含まれる。
本発明のデータ処理装置が有する分岐命令は、分岐条件
がスタティックであるかグイナミソクであるか及び分岐
先がスタティックであるかグイナミソクであるかにより
計4種類に分類される。しかし、本発明のデータ処理装
置においては以下の2種類の命令をプリブランチ命令と
して扱う。
第1は、分岐条件及び分岐先共にスタティックな命令で
ある。この種の命令には無条件分岐命令(BRA)とサ
ブルーチン呼出し命令(BSR)とがある。
第2は、分岐条件がグイナミソクで分岐先がスタティッ
クな命令である。この種の命令には、条件分岐命令(B
cc)とループ制御命令(ACB)とがある。
(3,2)  r分岐命令処理回路の機能構成」第1図
は本発明のデータ処理装置の全体の構成を示すブロック
図である。
第1図には、命令フェッチ部51.命令デコード部52
.’PC計算部53.オペランドアドレス計算部54゜
データ演算部56.外部バスインターフェイス部57の
それぞれに含まれる内部回路の構成と、アドレス出力回
路58.データ入出力回路59等が示されている。
命令デコーダ111 とpc加算器132の入力側及び
アドレス加算器124の入力側とは、ディスプレースメ
ント値5分岐命令の変位値を転送するDISPバス10
0にて接続されている。
命令デコーダ111 とアドレス加算器124の入力側
とは、ステップコード生成に使用された命令コード長、
スタックブツシュモード時のブリデクリメント値等を転
送する補正値バス102とでも接続されている。
命令デコーダ111 とpc加算器132の入力側とは
、ステップコード生成に使用した命令コード長を転送す
る命令長ハス101 とでも接続されている。
レジスタファイル144とアドレス加算器124の入力
側とは、レジスタファイル144に蓄えられているアド
レス値を転送するAバス103で接続されている。
命令デコーダ111には命令キュー112から命令コー
ドが入力される。命令デコーダ111の出力部には、プ
リブランチ処理により条件分岐命令の分岐条件指定フィ
ールドをEステージ15へそのまま出力するか、条件指
定を反転して出力するかを選択する分岐条件生成回路1
14が備えられている。
命令長ハス101の値とDISPバス100の値とを入
力とし、いずれかを選択して出力する被加算値選択回路
131の出力と、Dステージ12においてデコードされ
た命令のpc値を保持するDPC135の値またはステ
ップコードの切目毎の作業用pc値を保持するTPC1
34の値のいずれかとはPC加算器132へ入力される
pc加算器132の出力はpc加算器出力ラうチ133
にランチされた後、POババス05へ出力される。
POハス105は、ラッチTPC134,ランチDPC
135Aステージ13において処理中の命令のpc値を
保持するラッチAPC136とに接続している。
TPC134にはEステージ15で分岐あるいはジャン
プが生じた際に新たな命令アドレスを入力するためのC
Aババス04からの入力経路もある。
補正値バス102の出力とDISPバス100の出力と
はディスプレースメント選択回路122へ人力され、い
ずれか一方がアドレス加算器124へ入力される。
DISPハス100の出力とAバス103の出力とはベ
ースアドレス選択回路123へ入力され、いずれか−方
がアドレス加算器124へ入力される。
アドレス加算器124は、ディスプレースメント選択回
路122の出力、ベースアドレス選択回路123の出力
及びAバス103から入力された値をシフトすることに
より、1倍、2倍、4倍、8倍の値をとるインデックス
値生成回路121の出力の3つ値を入力として3値加算
を行う。
アドレス加算器124の出力値はアドレス加算器出力ラ
ッチ125を通してAOSバス106出力される。
AOハス106は、メモリ間接アドレッシング時に、A
Aハス107を通じてアドレス出力回路58からCPU
外部ヘアドレス値を出力する際にそのアドレス値を保持
するランチlAl26と、Fステージ14におけるオペ
ランドフェッチ時に、AAババス07を通してアドレス
出力回路58からCPU外部へオペランドアドレス値を
出力する際にそのオペランドアドレス値を保持するラン
チFA127とに接続されている。
ランチFA127は、アドレス加算器124により計算
されたオペランドアドレスをEステージ15で使用する
ためにオペランドアドレス値を保持するラッチ5A14
1への出力経路を有する。
ランチ5A141は、データ演算部5Gの汎用データバ
スであるSバス109への出力経路を有する。
命令のアドレスを転送するCAババス04はPC加算器
出力ララッチ33と、ラッチTPC134と、命令フェ
ッチ部51がブリフェッチする命令コードのアドレスを
管理するカウンタ口INPC115と、命令フェッチの
ためのアドレスをAAババス07を通してアドレス出力
回路58からCPU外部へ出力する際にその値を保持す
るラッチCAA142と、Eステージ15において分岐
あるいはジャンプが生じた際に新たな命令アドレスをS
ハス109から入力するEBレジスタ143とに接続さ
れている。
ラッチAPC136は、Aバス103と、Fステージ1
4において処理中の命令のpc値を保持するためのラッ
チFPC137とへの出力経路を有する。
ラッチFPC137は、Eステージ15において処理中
の命令のpc値を保持するラッチCPCl38への出力
経路を有する。
ラッチCPCl38は、Sバス109と、BTB160
の分岐命令アドレスフィールドとに出力経路を有する。
レジスタファイル144は汎用レジスタあるいは作業用
レジスタ等にて構成されており、Sバス109とAバス
103とへの出力経路を有し、Dバス110からの入力
経路を有する。
データ演算部56の演算機構であるデータ演算器145
は、Sハス109からの入力経路を有し、Dハス110
への出力経路を有している。
BTB (ブランチターゲットバッファ)160は詳細
は後述するが64エントリで構成されており、各エント
リは分岐命令アドレスフィールド (25ビツト)有効
ビットフィールド(1ビツト)、 次フェッチアドレス
フィールド(31ビツト)、 シーケンス制御フィール
ド(2ビツト)及び分岐先命令データフィールド (3
2ビツト)で構成されている (第2図参照)。
有効ビットフィールドは対応するエントリが有効か否か
を示すフィールドであり、シーケンス制御フィールドは
、プリブランチが生した際の命令フェッチシーケンスを
切換えるタイミングを制御するフィールドである。
分岐命令アドレスをBTB160に登録するために、ラ
ッチCPCI3BからBTB160への経路が設けられ
ている。また、プリブランチが発生した際にフェッチす
る命令のアドレスを登録するために、CAハス104か
らBTB160への経路が設けられている。
次フェッチアドレスレジスタ161 は、BTB160
から出力される次フェッチアドレススフイールドの上位
30ビツトをラッチしておき、命令フェッチシーケンス
が切換わるタイミングでカウンタQINPC115へ値
を出力する。
シーケンス制御機構162はダウンカウンタにて構成さ
れており、BTB160のシーケンス制御フィールドの
値を取込み、命令フェッチが行われる都度値をカウント
ダウンする。そして、シーケンス制御機l1162は計
数値が“O”になると命令シーケンスを切換える制御信
号を出力する。
(3,3)  rプリブランチの処理方法」第1図に示
した本発明のデータ処理装置の構成の内の、プリブラン
チ処理に特に関係が深い部分の詳細な構成を第2図のブ
ロック図に示す。
BTB160は64エントリで構成され、各エントリは
分岐命令アドレスフィールド(25ビツト)、 有効ビ
ットフィールド(2ビツト)1次フェッチアドレスフィ
ールド(31ビツト)、 シーケンス制御フィルド(2
ビツト)及び分岐先命令データフィールド (32ビツ
ト)にて構成される。
分岐命令アドレスフィールドには、分岐命令アドレスの
上位24ビツトと、最下位から2番目の1ビツトとが登
録される。
次フェッチアドレスフィールドには、分岐先の命令アド
レスに“4”を加えた値の上位31ビツトが登録される
分岐先命令データフィールドには、それぞれに対応する
分岐命令が分岐した場合の分岐先命令データが登録され
る。
次フェッチアドレスレジスタ161 は30ビツトであ
り、BTB160の次フェッチアドレスフィールドの出
力の上位30ビツトをラッチする。
シーケンス制御機構162は、BTB160のシーケン
ス制御フィールドの出力値を取込み、命令フェッチが行
われる都度、その値をカウントダウンする。
シーケンス制御機構162はカウント値が0″になると
、命令フェッチシーケンスを次フェッチアドレスに切換
える制御信号を出力する。
163はプリブランチ時に使用されるPOO値をラッチ
するブリブランチ出力ポインタレジスタPBRAPOで
あり、プリブランチが発生した際の命令キュ112の出
力ポインタレジスタPO165を調整する。
190はデコーダであり、カウンタQINPC115の
下位6ビノトをデコートしてBTB160の一致すエン
トリを選択する。即ち、デコーダ190はBTB160
のエントリ検索手段として機能する。
191は比較器であり、分岐命令アドレスフィールドの
上位24ビ、トの出力値とカウンタQrNPC115の
上位24ビツトとを比較し、一致すれば一致信号179
を2人力のANDゲー目92の一方の入力として出力す
る。
ANDゲート192の他方の入力には有効ピントフィー
ルドの1ビツトの出力値180が与えられている。  
ANDゲート192は両人力が共に“1”であれば、プ
リブランチ発生信号171(“1″)を出力して次フェ
ッチアドレスレジスタ161及びシーケンス制御機構1
62へ与える。即ち、このANDゲート192はBTB
160の有効ビットフィールドの有効性を判断する手段
として機能する。
その他に、カウンタQINPC115,命令キュー11
2命令キューの入力ポインタレジスタP1164.  
命令デコーダ111等が備えられている。
入力ポインタレジスタP1164.  出力ポインタレ
ジスタPO165,プリブランチ出力ポインタレジスタ
PBRAPO163はそれぞれ3ビツト構成であり、カ
ウンタQINPC115の値は下位側に2ビツトのデー
タ“002を付加して命令フェッチのアドレスとして使
用される。
命令キュー112には、命令コードを人力するフィール
ド(16ビツト)の他に、ブリブランチが生したことを
示すフィールド(1ビツト)がある。
命令キュー112の各エントリは16ビツトで8エント
リで構成されている。
なお、本実施例では、内部キャッシュを有していないも
のとする。
以下、第1図及び第2図を参照して、分岐命令のブリブ
ランチ処理の手順を以下の4通りの場合に分けて説明す
る。
・プリブランチが発生せず、Eステージ15で分岐が発
生しない場合。
・プリブランチが発生せず、Eステージ15で分岐が発
生する場合。
・プリブランチが発生し、Eステージ15で分岐が発生
しない場合。
・プリブランチが発生し、Eステージ15で分岐が発生
する場合。
(3,3,1)  rプリブランチが発生せず、Eステ
ージで分岐が発生しない場合」 カウンタQINPC115の値で外部メモリに対して命
令フェッチが行われると同時に、カウンタQINPC1
15の下位6ビツトがデコーダ190でデコードされて
BTB160の一つのエントリを選択する。
選択されたエントリの分岐命令アドレスフィールドの上
位24ビツトとカウンタQINPC115の上位24ビ
ツトとが比較器191で比較される。比較結果が一致し
なければ、プリブランチは発生しない。また、比較結果
が一致する場合でも、選択されたエントリの有効ビット
ビットフィールドの値が“0”であれば、プリブランチ
は発生しない。プリブランチが発生しない場合、カウン
タQINPC115の値は“1″だけインクリメントさ
れる。即ち、以降の命令のフェッチはシーケンシャルに
行われる。
外部メモリから取込まれた命令データは命令キ二一11
2へ人力され、人力ポインタレジスタP1164は“2
”だけインクリメントされる。命令キュー112に入力
された命令データは出力ポインタレジスタPO165に
従って命令バス170を経由し、命令デコーダ111へ
送られる。
命令デコーダ111が命令をデコードした結果、POイ
ンクリメント信号172が出力され、これに従ってPO
±0(166L PO+1(167)、 PO+2(1
68)のいずれかの出力ポインタインクリメンタが選択
され、出力ポインタレジスタPO165にセットされる
命令デコーダ111は命令をデコードする際にその命令
の命令長も計数し、計数結果の情報をPOインクリメン
ト信号172として出力すると共に、後段のパイプライ
ンステージへも伝送する。
次のAステージ13では分岐先のアドレスが計算される
。また、命令の先頭アドレスはラッチDPC135、ラ
ッチAPC136,ラッチFPC137を経由してEス
テージ15が使用するランチCPCl38へ伝えられる
命令デコーダ111でデコードされたプリブランチ命令
がEステージ15で分岐しない場合には、命令処理シー
ケンスは変更されない。
(3,3,2)  rブリブランチが発生せず、Eステ
ージで分岐が発生する場合」 プリブランチしないブリブランチ命令がパイプライン処
理され、Eステージ15に到達するまでの処理は(3,
3,1)の場合と同様である。
プリブランチしなかったプリブランチ命令がEステージ
I5で分岐すると、そのプリブランチ命令はBTB16
0に登録される。
プリブランチ命令のアドレスがラッチCPCl38から
BTB160へ人力され、分岐先アドレスがεBレジス
タ143からCAババス04を経由し、更にインクリメ
ンタ193により“■”インクリメントされた後にBT
8160へ入力される。
ランチCPCl38の最下位2ビツトを除く下位6ビノ
トがデコーダ190によりデコードされ、BTB160
の一つのエントリが選択される。選択されたエントリの
分岐命令アドレスフィールドには、ランチCPCl38
の上位24ビツトと最下位から2番目の1ビツトとが登
録される。
il1尺されたエントリの次フェッチアドレスフィール
ドには、インクリメンタ193の出力の上位31ビツト
が登録される。また、ブリブランチ命令のアドレスとそ
の命令長とからその命令をフェッチするに必要なメモリ
アクセスの回数が計算され、その値がシーケンス制御の
値として選択されたエントリのシーケンス制御フィール
ドに登録される。
また、選択されたエントリの有効ビットフィールドは“
17 にセットされる。更に、Eステージ35において
分岐が発生した後、最初にフェッチされた命令データが
DDババス08を経由してBTB160の分岐命令デー
タフィールドに登録される。
Eステージ15におけるBTB160の登録動作と、I
Fステージ11におけるBTB160の参照動作とが同
時に起こった場合には登録動作が優先される。
(3,3,3)  rブリブランチが発生し、Eステー
ジで分岐が発生しない場合」 カウンタQINPC115の値で外部メモリに対して命
令フェッチが行われると同時に、カウンタQINPC1
15の下位6ビノトがデコーダ190でデコードされて
BTB160の1エントリが選択される。
選択されたエントリの分岐命令アドレスフィールドの上
位24ビツトとカウンタΩINPC115の上位24ビ
ツトとが比較器191で比較され、比較結果が−致し且
つ選択されたエントリの有効ビットフィールドの値が“
ビであればプリブランチが発生する。
この際、プリブランチ発生信号177が次フエ。
チアドレスレジスタ161 とシーケンス制御機構16
2とへ出力される。
プリブランチ発生信号177により次フェッチアドレス
レジスタ161はBTB160の次フェッチアドレスフ
ィールドからの出力の上位30ビツトをラッチし、ラッ
チ174はBTB160の次フェッチアドレスフィール
ドの下位1ビツトをランチする。シーケンス制御機構1
62はBTB160のシーケンス制御フィールドからの
出力(2ビ、ト)をラッチする。
シーケンス制御フィールドには分岐命令全体が取込まれ
るのに必要な命令フェッチの回数がセットされている。
シーケンス制御機構162中の値が“0″になると命令
シーケンス切換え信号178が出力される。
この命令ンーケンス切換え信号178の出力により、次
フェッチアドレスレジスタ161の値がカウンタQIN
PC115にセットされる。また、インクリメント後の
入力ポインタレジスタP1164の上位2ビツトがプリ
ブランチ出力ポインタレジスタPBRAPO163の上
位2ビツトに、ラッチ174の値がプリフランチ出力ポ
インタレジスタPBRAPO163の下位lビットにそ
れぞれセットされる。更に、分岐先命令データフィール
ドの値32ビットが命令キュー112に供給される。
分岐命令の最後がワード境界で終わっていない場合及び
分岐先の命令の先頭がワード境界から始まっていない場
合には、命令キュー112の中で分岐命令と分岐先命令
との間に無効なコードが挿入される。プリブランチ出力
ポインタレジスタPBRAPO163はこの無効なコー
ドを補正するために使用される。
第3図にプリブランチが発生した場合の命令キュー11
2内での分岐命令と分岐先命令との関係を示す。
第3図(alに示されているのは、分岐命令(ハツチン
グを付して示す)の最後がワード境界で終わっており、
分岐先命令(クロスハツチングを付して示す)の先頭が
ワード境界から始まっていない場合、 第3図(blに示されているのは、分岐命令の最後がワ
ード境界で終わっておらず、分岐先命令の先頭がワード
境界から始まっている場合、第3図tc+に示されてい
るのは、分岐命令の最後がワード境界で終わっておらず
、分岐先命令の先頭がワード境界から始まっていない場
合である。
第3図(al、 (bl及び(C1のいずれの場合も、
分岐命令と分岐先命令との間に無効なコードが介在して
おり、これを調整するためにプリブランチ出力ポインタ
レジスタPBRAPO163が使用される。
プリブランチを発生した分岐命令が命令キュー112へ
取込まれる際に、BTB160の分岐先アドレスフィー
ルドの最下位ビットを参照することにより、その先頭の
ハーフワードに対応するエントリのプリブランチ発生フ
ィールドが“11にセットされる。
プリブランチを発生した分岐命令が命令デコーダ111
へ送られる際には、命令データと同時にプリブランチ命
令信号171が送られ、プリブランチを発生した命令で
あることが伝達される。
命令デコーダ111がプリブランチを発生した命令のデ
コードを完了すると、POインクリメント信号172の
代わりにプリブランチ命令デコード完了信号173が出
力される。
セレクタ176はプリブランチ命令デコード完了信号1
73を受取ると、プリブランチ出力ポインタレジスタP
BRAPO163の出力を選択して出力ポインタレジス
タPO165にセットする。これによって、分岐命令と
分岐先命令との間に介在する無効なコートは無視される
命令デコーダ111はデコードした命令がプリブランチ
した命令であることを示す情報を後段のパイプラインス
テージへ伝達する。また、PC計算部53において分岐
先のアドレスが計算され、次の命令のpc値とされる。
更に、分岐条件生成回路114によりプリブランチした
命令の分岐条件を反転する。
また、プリブランチの予測が外れた場合には命令シーケ
ンスを分岐命令の次の命令に戻す必要がある。このため
、Aステージ13においてプリブランチ命令のアドレス
とプリブランチ命令の命令長とを加算して次の命令のア
ドレスを計算する。
これは、ランチAPC136の値をAバス103及びベ
ースアドレス選択回路123を通じてアドレス加算器1
24へ送り、プリブランチ命令の命令長を補正値ハス1
02及びディスプレースメント選択回路122を通じて
アドレス加算器124へ送り、インデックス値生成回路
121から“0”を出力することで、アドレス加算器1
24により計算されてアドレス加算器出力ラッチ125
にセットされる。
このアドレスはAOババス06及びランチFAI27を
通してラッチS A 144へ伝送され、Eステージ1
5で使用される。
プリブランチしたプリブランチ命令がEステージ15で
分岐しない場合には、Eステージ15では命令シーケン
スは変更されない。
(3,3,4)  rブリブランチが発生し、Eステー
ジで分岐が発生する場合」 プリブランチを発生したプリブランチ命令が命令デコー
ダ111でデコードされ、Eステージ15に到達するま
での処理は(3,3,3)と同様である。
プリブランチを発生したプリブランチ命令がEステージ
15で分岐するということは、プリブランチが誤ってい
たことを意味する。そこで、プリブランチ命令の次の命
令にシーケンスを戻す必要がある。プリブランチ命令の
次の命令のアドレスはラッチ5A141にセットされて
いるので、ランチ5A141の値をSバス109を通じ
てEBレジスタ143にセットし、Eステージ15にお
いて分岐を発生する。
またEステージ15において分岐が発生した後、次に同
一のプリブランチ命令が実行される際にプリブランチを
発生しないようにするために、BTB160中の対応す
るエントリのをビットフィールドを“01にする。
以上に説明したプリブランチ処理においては、BTB1
60はダイレ′クトマノピング方式を採っているが、そ
れ以外の方式でも勿論よい。
また本実施例では、分岐先がスタティックに決定される
分岐命令のみをプリブランチ命令としているが、分岐先
がグイナミノクな分岐命令に関してもプリブランチした
分岐先が適当であるか否かをチエツクする機構を備えれ
ば、プリブランチ命令として処理することが出来る。
【発明の効果〕
以上に詳述した如く本発明によれば、分岐命令とその分
岐先命令との関係を登録しであるテーブルに分岐先命令
データフィールドを設けてそれぞれの分岐命令の分岐先
命令データそのものを予め登録しておくことにより、分
岐発生後に、パイプラインの後段におけるメモリアクセ
スの状況とは関係なく、即座に分岐先命令データが命令
キューに供給されるので、パイプライン処理機構がより
効率的に動作し、高いデータ処理能力を発揮する。
【図面の簡単な説明】
第1図は本発明のデータ処理装置の全体の構成例を示す
ブロック図、第2図はそのブリブランチ処理に関係する
部分のより詳細な構成を示すブロック図、第3図は本発
明のデータ処理装置の命令キュー内の分岐命令と分岐先
命令との関係を示す模式図、第4図は本発明のデータ処
理装置の全体の概略構成を示すブロック図、第5図は本
発明のデータ処理装置のパイプライン処理機構の概略構
成を示す模式図、第6図は従来のデータ処理装置のパイ
プライン処理機構の概略構成を示す模式図、第7図は従
来のデータ処理装置における分岐命令の処理手順を示す
模式図、第8図は従来のデータ処理装置のブランチター
ゲソトハ・2フアの構成を示す模式図である。 112・・・命令キュー 160・・・BTB (ブランチターゲットバッファ)
161・・・次フェッチアドレスレジスタ162・・・
シーケンス制御機構 190・・・デコーダ(エントリ検索手段)192・・
・ANDゲート (有効性判断手段)なお、 図中、 同一符号は同一、 又は相当部分を 示す。 代 理 人 大台 増 雄 1 12 3 4 5 第 図 弔 図

Claims (1)

    【特許請求の範囲】
  1. (1)フェッチすべき命令のアドレスがセットされる命
    令アドレスレジスタと、 フェッチされた命令データを格納する命令キューと、 複数のエントリにて構成され、各エントリが命令アドレ
    スを格納する分岐命令アドレスフィールドと、エントリ
    の有効性を示す情報を格納する有効エントリフィールド
    と、次にフェッチすべき命令のアドレスを格納する次フ
    ェッチアドレスフィールドと、前記命令アドレスレジス
    タにセットされるアドレスを切換えるタイミングを制御
    する情報を格納するシーケンス制御フィールドと、分岐
    先の命令データを格納する分岐先命令データフィールド
    とを含むテーブルと、 前記命令アドレスレジスタの記憶値で前記テーブルの命
    令アドレスフィールドを検索して双方の記憶値が一致す
    るエントリを検出するエントリ検索手段と、 該エントリ検索手段により検出されたエントリの有効性
    をそのエントリの有効エントリフィールドの情報により
    判断する有効性判断手段と、 該有効性判断手段が有効と判断した場合にそのエントリ
    の分岐先命令データフィールドのデータを前記命令キュ
    ーに出力するタイミング及びそのエントリの次フェッチ
    アドレスフィールドの値を前記命令アドレスレジスタに
    セットするタイミングをそのエントリのシーケンス制御
    フィールドの情報に従って制御するシーケンス制御手段
    と を備えたことを特徴とするデータ処理装置。
JP939290A 1990-01-17 1990-01-17 データ処理装置 Pending JPH03212736A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP939290A JPH03212736A (ja) 1990-01-17 1990-01-17 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP939290A JPH03212736A (ja) 1990-01-17 1990-01-17 データ処理装置

Publications (1)

Publication Number Publication Date
JPH03212736A true JPH03212736A (ja) 1991-09-18

Family

ID=11719164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP939290A Pending JPH03212736A (ja) 1990-01-17 1990-01-17 データ処理装置

Country Status (1)

Country Link
JP (1) JPH03212736A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263286A (ja) * 1995-03-22 1996-10-11 Kofu Nippon Denki Kk 緩衝記憶装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263286A (ja) * 1995-03-22 1996-10-11 Kofu Nippon Denki Kk 緩衝記憶装置

Similar Documents

Publication Publication Date Title
US6499123B1 (en) Method and apparatus for debugging an integrated circuit
US5481751A (en) Apparatus and method for storing partially-decoded instructions in the instruction cache of a CPU having multiple execution units
JPH05224928A (ja) データ処理装置
JPH081599B2 (ja) データ処理装置
JP2507638B2 (ja) デ―タ処理装置
JPH04260950A (ja) キャッシュメモリ装置
JPH02173823A (ja) データ処理装置
JPH01214932A (ja) データ処理装置
JPH03158928A (ja) データ処理装置
JPH0215331A (ja) データ処理装置
JPH10232821A (ja) データ処理装置
JPH0391029A (ja) データ処理装置
JP2710994B2 (ja) データ処理装置
US20050144427A1 (en) Processor including branch prediction mechanism for far jump and far call instructions
JPH03212736A (ja) データ処理装置
JPH0377138A (ja) データ処理装置
JPH02105937A (ja) データ処理装置
JP2532560B2 (ja) 高機能な例外処理を行うデ―タ処理装置
JPH03212734A (ja) データ処理装置
JPH03158929A (ja) データ処理装置
JPH0254336A (ja) データ処理装置
JPH01281534A (ja) データ処理装置
JP2928879B2 (ja) データ処理装置
JPH0225932A (ja) データ処理装置
JPH0298734A (ja) データ処理装置