JP2001243071A - 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 - Google Patents
1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法Info
- Publication number
- JP2001243071A JP2001243071A JP2001025765A JP2001025765A JP2001243071A JP 2001243071 A JP2001243071 A JP 2001243071A JP 2001025765 A JP2001025765 A JP 2001025765A JP 2001025765 A JP2001025765 A JP 2001025765A JP 2001243071 A JP2001243071 A JP 2001243071A
- Authority
- JP
- Japan
- Prior art keywords
- speculative
- instruction
- hazard
- detection circuit
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000001514 detection method Methods 0.000 claims description 68
- 239000000872 buffer Substances 0.000 claims description 46
- 230000004044 response Effects 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 13
- 238000013461 design Methods 0.000 description 4
- 101001009517 Homo sapiens Probable G-protein coupled receptor 32 Proteins 0.000 description 3
- 102100030321 Probable G-protein coupled receptor 32 Human genes 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3861—Recovery, e.g. branch miss-prediction, exception handling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3838—Dependency mechanisms, e.g. register scoreboarding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3842—Speculative instruction execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3867—Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Advance Control (AREA)
Abstract
イン・プロセッサを提供すること。 【解決手段】 プロセッサは複数の命令を順次に処理す
る。動作に複数のクロック・サイクルを必要とする投機
的検出回路により、依存性が存在するかどうかを判定す
る。投機的検出回路は、投機的依存性が存在するとの判
定に応答したときのみ、1サイクルのパイプライン・ス
トールを挿入する。
Description
イン・プロセッサに関し、特に、1サイクルのパイプラ
イン・ストールを生成するパイプライン・プロセッサ、
中でも、依存性の検出に応答して1サイクルのパイプラ
イン・ストールを生成するために命令を処理するパイプ
ライン・プロセッサに関する。
1クロック・サイクルに複数の命令を実行できるマイク
ロプロセッサ・アーキテクチャを含むデータ処理システ
ムである。1サイクルで複数の命令を実行するには、同
時に実行できる複数の独立した機能ユニットが必要であ
る。順次パイプライン・プロセッサの場合、それら複数
の命令がそれぞれの元のシーケンスで実行される。
り、1クロック・サイクルで処理が完了する。他の命令
は、処理を完了するのに2クロック・サイクル以上を必
要とする。
ジスタが別の、後の命令により読取る必要のある値をレ
ジスタに書込むとき、あるタイプの依存性が生じる。値
をレジスタに書込む命令が、実行に2サイクル以上かか
るとき、レジスタに格納された値を読取る後の命令は、
最初の命令がその実行を完了するまで停止(stall)し
なければならない。従って、命令を正しく実行するため
には、命令ストリームにパイプライン・ストールを挿入
する必要がある。
イプライン・ストールを挿入するかどうかの決定は、1
サイクルのストールを生成する場合には1サイクルで行
う必要がある。命令をディスパッチできるかどうか、ま
たは命令を停止する必要があるかどうかを決定するため
複数のサイクルを使用するメカニズムは、複数のサイク
ルのストールを引き起こす。ストール条件の判定に複数
のサイクルを必要とすることは、プロセッサ周波数を改
良するには有益だが、複数のストール・サイクルは、C
PI(1命令のサイクル数)で測ったプロセッサ性能に
はマイナスになる。
ルのパイプライン・ストールを生成するためのパイプラ
イン・プロセッサ処理命令が求められる。ここで検出メ
カニズムは、複数のサイクルにより命令のディスパッチ
を制御する。
的に判定する方法及びそのパイプライン・プロセッサを
提供することを目的とする。
を順次に処理する。動作に複数のクロック・サイクルを
必要とする投機的検出回路により、依存性の存在が確認
される。投機的依存性が存在することの確認に応答した
ときのみ、投機的検出回路が1サイクルのパイプライン
・ストールを挿入する。
は、図1乃至図4を参照すれば理解しやすい。同様な参
照符号は、対応する同様な部分を示す。
イプライン・プロセッサを開示する。依存性は、データ
依存性と構造依存性を含む。プロセッサは、複数の命令
を順次に処理することができる。投機的判定は、依存性
が存在するかどうかに関して行われる。投機的依存性が
存在するとの判定に応答したときのみ、1サイクルのパ
イプライン・ストールが生成される。
ドレス・キューが追加され、実際に依存性ハザードが存
在するかどうかが判定される。また、投機的ハザード検
出回路と投機的レジスタ・アドレス・キューが追加さ
れ、投機的依存性ハザードが存在するかどうか判定され
る。投機的ハザードが存在する場合、パイプは、1つの
NOP命令がパイプに挿入されることにより1サイクル
のみ停止される。
機的に完了するので、1サイクルのストールのみ挿入す
ることができる。従って、依存性ハザードは、ハザード
の原因となり、ディスパッチされている命令よりも前に
検出される。
るプロセッサ10のシステムを示す。好適実施例のプロ
セッサ10は単一の集積回路マイクロプロセッサであ
る。よって、後述するように、プロセッサ10は、レジ
スタ、バッファ、メモリ等、様々なユニットを含み、こ
れらは全て集積回路により形成される。また好適実施例
のプロセッサ10は、RISC(縮小命令セット・コン
ピュータ)方式に従って動作する。図1に示すように、
プロセッサ10のバス・インタフェース・ユニット(B
IU)12にシステム・バス11が接続される。BIU
12はプロセッサとシステム・バス11間の情報転送を
制御する。
ッシュ14及びデータ・キャッシュ16に接続される。
命令キャッシュ14は命令をシーケンサ・ユニット18
に出力する。シーケンサ・ユニット18は、命令キャッ
シュ14からのこの命令に応答して、プロセッサ10の
他の実行回路に命令を選択的に出力する。
例のプロセッサ10の実行回路は、複数の実行ユニット
(分岐ユニット20)、具体的には固定小数点ユニット
A(FXUA)22、固定小数点ユニットB(FXU
B)24、複合固定小数点ユニット(CFXU)26、
ロード/ストア・ユニット(LSU)28、及び浮動小
数点ユニット(FPU)30を含む。FXUA22、F
XUB24、CFXU26、及びLSU28は、それぞ
れのソース・オペランド情報を汎用設計レジスタ(GP
R)から入力する。好適実施例のGPRは、他のユニッ
トからの結果を、最初にレジスタに格納することなく"
転送"(または"バイパス")することができる。更にF
XUA22とFXUB24は繰り上りビット(CA)・
レジスタ42から"繰り上りビット"を入力する。FXU
A22、FXUB24、CFXU26、及びLSU28
は、それぞれの操作の結果(宛先オペランド情報)をG
PR32に格納するため出力する。またCFXU26
は、ソース・オペランド情報と宛先オペランド情報を特
殊レジスタ(SPR)40との間で入出力する。
を浮動小数点設計レジスタ(FPR)36から入力す
る。好適実施例のFPRは、他の実行ユニットからの結
果を、最初にレジスタに格納することなく"転送"(また
は"バイパス")することができる。FPU30は、その
操作の結果(宛先オペランド情報)をFPR36に格納
するため出力する。
ータ・キャッシュ16から情報を入力し、その情報をG
PR32にコピーする。情報がデータ・キャッシュ16
に格納されない場合、データ・キャッシュ16は(BI
U12とシステム・バス11を通して)情報をシステム
・バス11に接続されたシステム・メモリ39から入力
する。更にデータ・キャッシュ16は、データ・キャッ
シュ16からの情報を(BIU12とシステム・バス1
1を通して)システム・バス11に接続されたシステム
・メモリ39へ出力することができる。LSU28は、
ストア命令に応答して、GPR32とFPR36のうち
選択された1つから情報を入力し、その情報をデータ・
キャッシュ16にコピーする。
とFPR36との間で情報を入出力する。分岐ユニット
20は、シーケンサ・ユニット18から命令及びプロセ
ッサ10の現在状態を示す信号を入力する。この命令及
び信号に応答して、分岐ユニット20が、プロセッサ1
0により実行するため、命令シーケンスを格納するのに
適したメモリ・アドレスを示す信号を(シーケンサ・ユ
ニット18に)出力する。シーケンサ・ユニット18
は、分岐ユニット20からのこの信号に応答して、指定
された命令シーケンスを命令キャッシュ14から入力す
る。命令シーケンスが命令キャッシュ14に格納されて
いない場合、命令キャッシュ14は(BIU12とシス
テム・バス11を通して)その命令をシステム・バス1
1に接続されたシステム・メモリ39から入力する。
シュ14からの命令入力に応答して、命令を実行ユニッ
ト20、22、24、26、28、及び30のうち選択
された1つに選択的にディスパッチする。実行ユニット
はそれぞれ特定の命令クラスの命令を少なくとも1つ実
行する。例えばFXUA22とFXUB24は、ソース
・オペランドに対して、加算、減算、AND、OR、及
びXOR等、第1クラスの固定小数点算術演算を実行す
る。CFXU26は、固定小数点乗算、除算等、第2ク
ラスの固定小数点演算をソース・オペランドに対して実
行する。FPU30は、浮動小数点乗算、除算等、浮動
小数点演算をソース・オペランドに対して実行する。
め、実行ユニット20、22、24、26、28、及び
30で複数の命令を同時に処理する。よって各命令はス
テージ・シーケンスとして処理され、それぞれの命令を
他の命令のステージと並列に実行できる。この方式を"
パイプライン方式"という。好適実施例の重要な側面と
して、命令は通常、フェッチ、ディスパッチ、実行、再
書込み、及び完了の5ステージとして処理される。
ニット18が、ここで分岐ユニット20、シーケンサ・
ユニット18とともに説明している命令シーケンスを格
納する少なくとも1つのメモリ・アドレスから少なくと
も1つの命令を(命令キャッシュ14から)選択的に入
力する。
チ/デコード/発行ステージで、最初の命令をデコード
して実行ユニット20、22、24、26、28、及び
30の1つにディスパッチする。ディスパッチ・ステー
ジでは、ディスパッチされる命令に対して、選択された
実行ユニットにオペランド情報が与えられる。プロセッ
サ10は命令を、プログラムされたシーケンスの順序で
ディスパッチする。
スパッチされたそれぞれの命令を実行し、それぞれの操
作の結果(宛先オペランド情報)をGPR32、FPR
36、SPR40、及び繰り上りビット・レジスタ42
に格納するため出力する。
らの出力結果が対応するレジスタに書込まれる。命令が
異なると、結果を生成するため必要なサイクル数も異な
ることがあるので、再書込みは、プログラムされた命令
シーケンスに関して"順不同"に行われることがある。
ユニットから情報を累算し、命令が例外条件なしに終了
したかどうかを確認する。現在の命令を含めて現在の命
令の前の全命令が例外条件なしに"終了した"場合、現在
の命令により上書きされたレジスタの前の設計値は、履
歴ファイルに格納する必要がなくなり、命令は"完了す
る"。プロセッサ10は従って、命令をそのプログラム
されたシーケンスで"完了する"。例外条件が発生した場
合、シーケンサ・ユニットはGPRに、例外発生の原因
になった命令の前の設計値を復元することを指示する。
シーケンサ・ユニットは、次に有効な命令アドレスから
命令を"再フェッチ"する。
図1のシーケンサ・ユニットに含まれるストール生成回
路を示す。ストール生成回路(依存性検出回路)200
は、基本ハザード検出回路202と基本レジスタ・アド
レス・キュー204を含む基本検出回路203、及び投
機的ハザード検出回路206と投機的レジスタ・アドレ
ス・キュー208を含む投機的検出回路205を含む。
基本ハザード検出回路202と基本レジスタ・アドレス
・キュー204は、依存性により実際にハザードが存在
するとき基本ハザード信号を生成するため使用される。
検出される依存性は、データ依存性または構造リソース
依存性のいずれかと考えられる。投機的ハザード検出回
路206と投機的レジスタ・アドレス・キュー208
は、依存性による投機的ハザードが存在するとき投機的
ハザード信号を生成するため使用される。ここでも、検
出される依存性はデータ依存性または構造依存性のいず
れかと考えられる。
0、212、214、216、及び218が追加され
る。バッファ212は、次にディスパッチ/発行される
命令を格納するため使用される。バッファ214、21
6、及び218は投機的命令を格納する。これらのバッ
ファに格納された命令は、命令フェッチ・ユニット22
0により、バッファ212の命令とともに、キャッシュ
・ラインから順次にフェッチされた命令である。命令バ
ッファ210は、最近ディスパッチされた命令を格納す
るためのものである。
ットに発行される。命令バッファ214、216、及び
218は、バッファ212の命令の次に続く順次命令を
表す。どのサイクルでも状態機械222が命令バッファ
を制御して、図の上方へシフトさせて次の順次命令セッ
トをロードするか、命令キャッシュ(図示せず)から新
しい命令セットをロードするか、または発行キューを保
留する。命令バッファ212の命令と、前に発行されて
いても終了しておらず、まだマシンのリソースを占有し
ている命令の間にリソース・コンフリクトがある場合
は、発行キューを保留する必要がある。
01、事前命令情報ストア204、及びハザード検出回
路202を含む。デコード回路201は、現在発行され
ている命令を命令ディスパッチ・バッファ21から受信
するとともに、状態機械222から"発行有効"信号を受
信する。デコード回路201は、事前命令情報ストア2
04とハザード検出回路202に、ターゲット・レジス
タ・アドレス、機能ユニットやバス等の構造リソース
等、命令がどのリソースを使用しているかを示すデコー
ド済み情報を与える。デコード回路201はまた、リソ
ースが必要とされる命令パイプライン・ステージを示す
情報を提供する。
路201から新しく発行された命令に関する情報、状態
機械222からの"発行有効"信号、及び機能ユニットか
らの命令進行状況信号に応答して、どのリソースが前の
命令により使用されているかに関する情報を更新する。
パイプラインが保留されない順次パイプライン・マシン
の場合、事前命令情報ストア204は、ターゲット・ア
ドレス・レジスタの一連のキューとして効率よく実装す
ることができ、レジスタをシフトさせ、レジスタや構造
リソースが使用されているパイプライン・ステージを示
す"ワン・ホット(one-hot)"情報を維持することがで
きる。
212の命令と"飛行中"の命令(そのリソースはストア
204により維持される)との間にリソース・コンフリ
クトが存在するかどうかを判定する。回路202は、命
令バッファ212からのソース・オペランド・レジスタ
・アドレスを飛行中の命令のターゲットと比較する比較
器のアレイを含む。また回路202は、構造リソースの
いずれかが、使用されているかまたは使用される予定の
サイクルで、飛行中の命令とバッファ212の命令の両
方に必要かどうかを判定するロジックを含む。
ードが存在する場合、ハザード信号がアサートされ、状
態機械222が、"発行有効"信号をアサート解除し、命
令の進行状況を示す機能ユニットからの"サイクル情報"
信号に応答して事前命令情報ストア204が更新される
間、命令バッファの命令を保留する必要がある
ァにシフトされる。例えば現在バッファ218にある命
令は、前の命令が引き続き順次に実行される限り、次の
クロック・サイクルの間にバッファ216にシフトされ
る。例外が発生するか、分岐命令が実行された場合、命
令フェッチ220により、新しい命令がフェッチされ、
これら命令バッファに格納される。
機的ハザード信号をその入力の2つとして受信するため
のものである。状態機械222は、命令のディスパッチ
と命令の命令バッファから次のバッファへのシフトを制
御するため使用される。
飛行中で、命令バッファ212に格納された命令を含む
命令のターゲット・レジスタのアドレスを含む。基本事
前命令情報ストア204は、現在飛行中の命令のターゲ
ット・レジスタのアドレスを含む。飛行中の命令は、デ
ィスパッチされているが、完了ステージに達していない
命令である。
出回路241は、ハザード検出回路240と事前命令情
報ストア242を含む。第3検出回路241は命令バッ
ファ212に接続され、検出回路203が受信する信号
と同じ信号を受信する。第3検出回路241は、基本検
出回路203と同様に動作するが、回路203のように
ディスパッチ・ステージ(Dステージ)で動作するので
はなく、実行ステージ(Xステージ)で動作する。従っ
て事前命令情報ストア242は、パイプのC、Wの各ス
テージに命令のターゲットを含む。第3検出回路241
は、依存性が検出されたとき第2レベル基本ハザード信
号を生成する。
本レジスタ・アドレス・キューと投機的レジスタ・アド
レス・キューを示す。投機的レジスタ・アドレス・キュ
ーは、現在使用中の命令のターゲットと、現在ディスパ
ッチされている命令のターゲットを保持する。従って2
08内の投機的レジスタ・アドレス・キューは、現在D
ステージつまり命令が現在バッファ212にあるディス
パッチ・ステージ、Dステージに続き、実行ステージの
最初の部分であるXステージ、Xステージに続き、実行
ステージの第2の部分であるCステージ、及びCステー
ジに続き、再書込みステージであるWステージにある命
令のターゲットを保持する。基本レジスタ・アドレス・
キュー204は、現在Xステージ、Cステージ、及びW
ステージにある命令のターゲットを保持する。
ドレス・キューは、現在飛行中で、リソースをまだ占有
しているか、または結果を生成する可能性のある全命令
を保持するのに十分深くする必要がある。
フトされると、各レジスタ・アドレス・キューのエント
リもシフトされる。
それぞれに関連したレジスタ・アドレス・キューととも
にサイクル情報信号も利用し、ハザードが存在するかど
うかを判定する。ハザードが存在するのは、ハザード検
出回路に関連付けられた命令バッファのターゲットが、
関連するレジスタ・アドレス・キューのターゲットの1
つと一致することをハザード検出回路が確認したときで
あり、その命令の実行は適時には完了しない。ハザード
検出回路は、サイクル情報信号を利用して関連する命令
バッファの命令に有効な値をレジスタに保持できるよ
う、飛行中の命令が実行を適時に完了するかどうか判定
する。
てプロセッサの動作を記述する状態変換テーブルを示
す。状態変換テーブルは、様々なハザード信号が現在ア
サートされているかどうかに応答してプロセッサの動作
を記述する。
行を制御するメカニズムが記述されているが、同じメカ
ニズムによりスーパースカラ・マイクロプロセッサの複
数の機能ユニットに関連付けられた発行キューから命令
を発行することができる。
式や詳細については、当業者には明らかなように、本発
明の主旨と範囲から逸脱することなく様々な変更が可能
である。
の事項を開示する。
み、複数の命令を順次に処理するパイプライン・プロセ
ッサの方法であって、依存性が存在するかどうかを投機
的に判定するステップと、依存性が存在することの投機
的判定に応答して、前記依存性の原因となる命令を前記
少なくとも1つの実行ユニットにディスパッチする前に
1クロック・サイクルのみのパイプライン・ストールを
生成するステップと、を含む、方法。 (2)複数の命令を順次に処理するパイプライン・プロ
セッサの方法であって、複数のクロック・サイクルを利
用して依存性が存在するかどうかを投機的に判定するス
テップと、投機的依存性が存在することの判定に応答し
て、1クロック・サイクルのみのパイプライン・ストー
ルを生成するステップと、を含む、方法。 (3)前記投機的依存性が存在するかどうかを判定する
ため、投機的命令バッファに接続された第1依存性ハザ
ード検出回路を設定するステップを含む、前記(2)記
載の方法。 (4)前記投機的依存性が存在するかどうかの判定に応
答して、投機的ハザード信号をアサートするステップを
含む、前記(3)記載の方法。 (5)前記投機的ハザード信号のアサートに応答して、
1クロック・サイクルのパイプライン・ストールを挿入
するステップを含む、前記(4)記載の方法。 (6)実際に依存性が存在するかどうかを判定するた
め、投機的命令バッファに接続された第2依存性ハザー
ド検出回路を設定するステップを含む、前記(5)記載
の方法。 (7)前記現実のハザードが存在することの判定に応答
して基本ハザード信号をアサートするステップを含む、
前記(6)記載の方法。 (8)前記投機的ハザード信号がアサートされないと
き、前記基本ハザード信号のアサートに応答して複数ク
ロック・サイクルのパイプライン・ストールを挿入する
ステップを含む、前記(7)記載の方法。 (9)複数の命令を順次に処理するパイプライン・プロ
セッサであって、複数のクロック・サイクルにより命令
バッファの制御を実装し、投機的デコード回路、投機的
事前命令情報ストア、及び投機的ハザード検出回路を含
み、投機的依存性の検出に応答して1クロック・サイク
ルのパイプライン・ストールを挿入する、投機的検出回
路と、複数のクロック・サイクルにより命令バッファの
制御を実装し、基本デコード回路、基本事前命令情報ス
トア、及び基本ハザード検出回路を含み、現実の依存性
の検出に応答して複数クロック・サイクルのパイプライ
ン・ストールを挿入する、基本検出回路と、を含む、プ
ロセッサ。 (10)投機的ハザードが存在することの判定に応答し
て投機的ハザード信号を生成する前記投機的検出回路を
含む、前記(9)記載のプロセッサ。 (11)現在飛行中の命令により使用されているリソー
スを格納する、命令ディスパッチ・バッファに格納され
た命令のための前記投機的事前命令情報ストアと、前記
投機的事前命令情報ストアの使用中の投機的命令リソー
スに必要なリソースを比較する前記投機的ハザード検出
回路であって、該投機的命令は、前記ディスパッチ・バ
ッファに格納された前記命令の後、次にフェッチされた
命令である、該検出回路と、を含む、前記(9)記載の
プロセッサ。 (12)投機的ハザードの検出に応答して投機的ハザー
ド信号をアサートする前記投機的検出回路を含む、前記
(11)記載のプロセッサ。 (13)実際のハザードの検出に応答して基本ハザード
信号をアサートする前記基本検出回路を含む、前記(1
1)記載のプロセッサ。 (14)前記投機的ハザードの原因となり、前記ディス
パッチ・バッファに格納されている前記投機的命令の前
に、前記投機的ハザード信号をアサートする前記投機的
検出回路を含む、前記(13)記載のプロセッサ。
パッチのパイプライン・プロセッサを示す図である。
ーケンサ・ユニットに含まれるストール生成回路を示す
図である。
タ・システムの基本レジスタ・アドレス・キューと投機
的レジスタ・アドレス・キューを示す図である。
サの動作を記述する状態変換テーブルを示す図である。
報ストア 205 投機的検出回路 206 投機的ハザード検出回路 208 投機的レジスタ・アドレス・キュー 210、212、214、216、218 命令バッフ
ァ 220 命令フェッチ・ユニット 222 状態機械 240 ハザード検出回路 241 第3検出回路 242 事前命令情報ストア
Claims (14)
- 【請求項1】少なくとも1つの実行ユニットを含み、複
数の命令を順次に処理するパイプライン・プロセッサの
方法であって、 依存性が存在するかどうかを投機的に判定するステップ
と、 依存性が存在することの投機的判定に応答して、前記依
存性の原因となる命令を前記少なくとも1つの実行ユニ
ットにディスパッチする前に1クロック・サイクルのみ
のパイプライン・ストールを生成するステップと、 を含む、方法。 - 【請求項2】複数の命令を順次に処理するパイプライン
・プロセッサの方法であって、 複数のクロック・サイクルを利用して依存性が存在する
かどうかを投機的に判定するステップと、 投機的依存性が存在することの判定に応答して、1クロ
ック・サイクルのみのパイプライン・ストールを生成す
るステップと、 を含む、方法。 - 【請求項3】前記投機的依存性が存在するかどうかを判
定するため、投機的命令バッファに接続された第1依存
性ハザード検出回路を設定するステップを含む、請求項
2記載の方法。 - 【請求項4】前記投機的依存性が存在するかどうかの判
定に応答して、投機的ハザード信号をアサートするステ
ップを含む、請求項3記載の方法。 - 【請求項5】前記投機的ハザード信号のアサートに応答
して、1クロック・サイクルのパイプライン・ストール
を挿入するステップを含む、請求項4記載の方法。 - 【請求項6】実際に依存性が存在するかどうかを判定す
るため、投機的命令バッファに接続された第2依存性ハ
ザード検出回路を設定するステップを含む、請求項5記
載の方法。 - 【請求項7】前記現実のハザードが存在することの判定
に応答して基本ハザード信号をアサートするステップを
含む、請求項6記載の方法。 - 【請求項8】前記投機的ハザード信号がアサートされな
いとき、前記基本ハザード信号のアサートに応答して複
数クロック・サイクルのパイプライン・ストールを挿入
するステップを含む、請求項7記載の方法。 - 【請求項9】複数の命令を順次に処理するパイプライン
・プロセッサであって、 複数のクロック・サイクルにより命令バッファの制御を
実装し、投機的デコード回路、投機的事前命令情報スト
ア、及び投機的ハザード検出回路を含み、投機的依存性
の検出に応答して1クロック・サイクルのパイプライン
・ストールを挿入する、投機的検出回路と、 複数のクロック・サイクルにより命令バッファの制御を
実装し、基本デコード回路、基本事前命令情報ストア、
及び基本ハザード検出回路を含み、現実の依存性の検出
に応答して複数クロック・サイクルのパイプライン・ス
トールを挿入する、基本検出回路と、 を含む、プロセッサ。 - 【請求項10】投機的ハザードが存在することの判定に
応答して投機的ハザード信号を生成する前記投機的検出
回路を含む、 請求項9記載のプロセッサ。 - 【請求項11】現在飛行中の命令により使用されている
リソースを格納する、命令ディスパッチ・バッファに格
納された命令のための前記投機的事前命令情報ストア
と、 前記投機的事前命令情報ストアの使用中の投機的命令リ
ソースに必要なリソースを比較する前記投機的ハザード
検出回路であって、該投機的命令は、前記ディスパッチ
・バッファに格納された前記命令の後、次にフェッチさ
れた命令である、該検出回路と、 を含む、請求項9記載のプロセッサ。 - 【請求項12】投機的ハザードの検出に応答して投機的
ハザード信号をアサートする前記投機的検出回路を含
む、 請求項11記載のプロセッサ。 - 【請求項13】実際のハザードの検出に応答して基本ハ
ザード信号をアサートする前記基本検出回路を含む、 請求項11記載のプロセッサ。 - 【請求項14】前記投機的ハザードの原因となり、前記
ディスパッチ・バッファに格納されている前記投機的命
令の前に、前記投機的ハザード信号をアサートする前記
投機的検出回路を含む、 請求項13記載のプロセッサ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/498,088 US6708267B1 (en) | 2000-02-04 | 2000-02-04 | System and method in a pipelined processor for generating a single cycle pipeline stall |
US09/498088 | 2000-02-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001243071A true JP2001243071A (ja) | 2001-09-07 |
JP3611304B2 JP3611304B2 (ja) | 2005-01-19 |
Family
ID=23979556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001025765A Expired - Fee Related JP3611304B2 (ja) | 2000-02-04 | 2001-02-01 | 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6708267B1 (ja) |
EP (1) | EP1152328A3 (ja) |
JP (1) | JP3611304B2 (ja) |
KR (1) | KR100523706B1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7401205B1 (en) * | 1999-08-13 | 2008-07-15 | Mips Technologies, Inc. | High performance RISC instruction set digital signal processor having circular buffer and looping controls |
US7363467B2 (en) * | 2002-01-03 | 2008-04-22 | Intel Corporation | Dependence-chain processing using trace descriptors having dependency descriptors |
JP3816845B2 (ja) * | 2002-07-05 | 2006-08-30 | 富士通株式会社 | プロセッサ及び命令制御方法 |
US7185182B2 (en) * | 2003-02-04 | 2007-02-27 | Via Technologies, Inc. | Pipelined microprocessor, apparatus, and method for generating early instruction results |
US20040158694A1 (en) * | 2003-02-10 | 2004-08-12 | Tomazin Thomas J. | Method and apparatus for hazard detection and management in a pipelined digital processor |
US8966230B2 (en) * | 2009-09-30 | 2015-02-24 | Intel Corporation | Dynamic selection of execution stage |
KR101669989B1 (ko) | 2010-05-27 | 2016-10-28 | 삼성전자주식회사 | 파이프라인 프로세서 및 이퀄 모델 보존 방법 |
US10282205B2 (en) * | 2015-10-14 | 2019-05-07 | International Business Machines Corporation | Method and apparatus for execution of threads on processing slices using a history buffer for restoring architected register data via issued instructions |
US10289415B2 (en) | 2015-10-14 | 2019-05-14 | International Business Machines Corporation | Method and apparatus for execution of threads on processing slices using a history buffer for recording architected register data |
US10740269B2 (en) * | 2018-07-17 | 2020-08-11 | Arm Limited | Arbitration circuitry |
US10824468B2 (en) * | 2019-02-12 | 2020-11-03 | Arm Limited | Control of instruction execution in a data processor |
CN110209426B (zh) * | 2019-06-19 | 2021-05-28 | 上海兆芯集成电路有限公司 | 指令执行方法及指令执行装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1985000453A1 (en) * | 1983-07-11 | 1985-01-31 | Prime Computer, Inc. | Data processing system |
JPH04275628A (ja) * | 1991-03-01 | 1992-10-01 | Mitsubishi Electric Corp | 演算処理装置 |
KR100309566B1 (ko) | 1992-04-29 | 2001-12-15 | 리패치 | 파이프라인프로세서에서다중명령어를무리짓고,그룹화된명령어를동시에발행하고,그룹화된명령어를실행시키는방법및장치 |
EP0717359A3 (en) * | 1994-12-15 | 1997-02-05 | Sun Microsystems Inc | Register cache memory for a computer processor |
US5699536A (en) | 1995-04-13 | 1997-12-16 | International Business Machines Corporation | Computer processing system employing dynamic instruction formatting |
US5812812A (en) * | 1996-11-04 | 1998-09-22 | International Business Machines Corporation | Method and system of implementing an early data dependency resolution mechanism in a high-performance data processing system utilizing out-of-order instruction issue |
US5870580A (en) * | 1996-12-13 | 1999-02-09 | Advanced Micro Devices, Inc. | Decoupled forwarding reorder buffer configured to allocate storage in chunks for instructions having unresolved dependencies |
US5781752A (en) * | 1996-12-26 | 1998-07-14 | Wisconsin Alumni Research Foundation | Table based data speculation circuit for parallel processing computer |
-
2000
- 2000-02-04 US US09/498,088 patent/US6708267B1/en not_active Expired - Fee Related
-
2001
- 2001-01-17 KR KR10-2001-0002598A patent/KR100523706B1/ko not_active IP Right Cessation
- 2001-01-22 EP EP01101336A patent/EP1152328A3/en not_active Withdrawn
- 2001-02-01 JP JP2001025765A patent/JP3611304B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1152328A3 (en) | 2008-04-16 |
EP1152328A2 (en) | 2001-11-07 |
KR100523706B1 (ko) | 2005-10-26 |
KR20010077997A (ko) | 2001-08-20 |
US6708267B1 (en) | 2004-03-16 |
JP3611304B2 (ja) | 2005-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5611063A (en) | Method for executing speculative load instructions in high-performance processors | |
US5546597A (en) | Ready selection of data dependent instructions using multi-cycle cams in a processor performing out-of-order instruction execution | |
US5761476A (en) | Non-clocked early read for back-to-back scheduling of instructions | |
US6728866B1 (en) | Partitioned issue queue and allocation strategy | |
EP0762270B1 (en) | Microprocessor with load/store operation to/from multiple registers | |
JPH10133873A (ja) | 複数の分岐予測方式のうちの選択された1つを使用して条件分岐命令を投機的に実行するためのプロセッサおよび方法 | |
JP2010532063A (ja) | 条件命令を無条件命令および選択命令へと拡張する方法およびシステム | |
JPH09185506A (ja) | プロセッサ内で命令を実行する方法およびシステム | |
US5898864A (en) | Method and system for executing a context-altering instruction without performing a context-synchronization operation within high-performance processors | |
EP0675433A2 (en) | Processing system and method of operation | |
EP0675434A2 (en) | Processing system and method of operation | |
US5872948A (en) | Processor and method for out-of-order execution of instructions based upon an instruction parameter | |
JP3611304B2 (ja) | 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 | |
CZ9602771A3 (cs) | Způsob operace systému zpracování | |
JP3207124B2 (ja) | カウント/リンク・レジスタ変更命令の投機実行をサポートする方法及び装置 | |
US6587941B1 (en) | Processor with improved history file mechanism for restoring processor state after an exception | |
US5850563A (en) | Processor and method for out-of-order completion of floating-point operations during load/store multiple operations | |
EP0753173B1 (en) | Processing system and method of operation | |
US5784606A (en) | Method and system in a superscalar data processing system for the efficient handling of exceptions | |
US5913050A (en) | Method and apparatus for providing address-size backward compatibility in a processor using segmented memory | |
JP3721002B2 (ja) | メモリ要求を形成するために並列に生成される複数の取出アドレスのうちの1つを選択する、プロセッサおよび命令取出方法 | |
US6560695B1 (en) | Dynamic pipe staging adder | |
US20230315446A1 (en) | Arithmetic processing apparatus and method for arithmetic processing | |
US6266761B1 (en) | Method and system in an information processing system for efficient maintenance of copies of values stored within registers | |
US7991816B2 (en) | Inverting data on result bus to prepare for instruction in the next cycle for high frequency execution units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040511 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040730 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040730 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20040730 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040730 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040929 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20040929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041018 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071029 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081029 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |