JP3611304B2 - 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 - Google Patents

1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 Download PDF

Info

Publication number
JP3611304B2
JP3611304B2 JP2001025765A JP2001025765A JP3611304B2 JP 3611304 B2 JP3611304 B2 JP 3611304B2 JP 2001025765 A JP2001025765 A JP 2001025765A JP 2001025765 A JP2001025765 A JP 2001025765A JP 3611304 B2 JP3611304 B2 JP 3611304B2
Authority
JP
Japan
Prior art keywords
instruction
speculative
information
basic
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001025765A
Other languages
English (en)
Other versions
JP2001243071A (ja
Inventor
ブライアン・キング・フラッチス
ハーム・ピーター・ホフスティー
オサム・タカハシ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2001243071A publication Critical patent/JP2001243071A/ja
Application granted granted Critical
Publication of JP3611304B2 publication Critical patent/JP3611304B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3861Recovery, e.g. branch miss-prediction, exception handling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3838Dependency mechanisms, e.g. register scoreboarding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3842Speculative instruction execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3867Concurrent instruction execution, e.g. pipeline, look ahead using instruction pipelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般にはパイプライン・プロセッサに関し、特に、1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサ、中でも、依存性の検出に応答して1サイクルのパイプライン・ストールを生成するために命令を処理するパイプライン・プロセッサに関する。
【0002】
【従来の技術】
パイプライン・データ処理システムは、1クロック・サイクルに複数の命令を実行できるマイクロプロセッサ・アーキテクチャを含むデータ処理システムである。1サイクルで複数の命令を実行するには、同時に実行できる複数の独立した機能ユニットが必要である。順次パイプライン・プロセッサの場合、それら複数の命令がそれぞれの元のシーケンスで実行される。
【0003】
命令のいくつかは、1サイクル命令であり、1クロック・サイクルで処理が完了する。他の命令は、処理を完了するのに2クロック・サイクル以上を必要とする。
【0004】
命令処理時にはよく依存性が生じる。1レジスタが別の、後の命令により読取る必要のある値をレジスタに書込むとき、あるタイプの依存性が生じる。値をレジスタに書込む命令が、実行に2サイクル以上かかるとき、レジスタに格納された値を読取る後の命令は、最初の命令がその実行を完了するまで停止(stall)しなければならない。従って、命令を正しく実行するためには、命令ストリームにパイプライン・ストールを挿入する必要がある。
【0005】
これまでのシステムでは、依存性によるパイプライン・ストールを挿入するかどうかの決定は、1サイクルのストールを生成する場合には1サイクルで行う必要がある。命令をディスパッチできるかどうか、または命令を停止する必要があるかどうかを決定するため複数のサイクルを使用するメカニズムは、複数のサイクルのストールを引き起こす。ストール条件の判定に複数のサイクルを必要とすることは、プロセッサ周波数を改良するには有益だが、複数のストール・サイクルは、CPI(1命令のサイクル数)で測ったプロセッサ性能にはマイナスになる。
【0006】
従って、依存性の検出に応答して1サイクルのパイプライン・ストールを生成するためのパイプライン・プロセッサ処理命令が求められる。ここで検出メカニズムは、複数のサイクルにより命令のディスパッチを制御する。
【0007】
【発明が解決しようとする課題】
本願は、依存性を投機的に判定する方法及びそのパイプライン・プロセッサを提供することを目的とする。
【0008】
【課題を解決するための手段】
プロセッサは複数の命令を順次に処理する。動作に複数のクロック・サイクルを必要とする投機的検出回路により、依存性の存在が確認される。投機的依存性が存在することの確認に応答したときのみ、投機的検出回路が1サイクルのパイプライン・ストールを挿入する。
【0009】
【発明の実施の形態】
本発明の好適実施例とその利点は、図1乃至図4を参照すれば理解しやすい。同様な参照符号は、対応する同様な部分を示す。
【0010】
依存性を投機的に判定する方法及びそのパイプライン・プロセッサを開示する。依存性は、データ依存性と構造依存性を含む。プロセッサは、複数の命令を順次に処理することができる。投機的判定は、依存性が存在するかどうかに関して行われる。投機的依存性が存在するとの判定に応答したときのみ、1サイクルのパイプライン・ストールが生成される。
【0011】
基本ハザード検出回路と基本レジスタ・アドレス・キューが追加され、実際に依存性ハザードが存在するかどうかが判定される。また、投機的ハザード検出回路と投機的レジスタ・アドレス・キューが追加され、投機的依存性ハザードが存在するかどうか判定される。投機的ハザードが存在する場合、パイプは、1つのNOP命令がパイプに挿入されることにより1サイクルのみ停止される。
【0012】
ここで開示する発明は、依存性の検出が投機的に完了するので、1サイクルのストールのみ挿入することができる。従って、依存性ハザードは、ハザードの原因となり、ディスパッチされている命令よりも前に検出される。
【0013】
図1は、好適実施例に従って情報を処理するプロセッサ10のシステムを示す。好適実施例のプロセッサ10は単一の集積回路マイクロプロセッサである。よって、後述するように、プロセッサ10は、レジスタ、バッファ、メモリ等、様々なユニットを含み、これらは全て集積回路により形成される。また好適実施例のプロセッサ10は、RISC(縮小命令セット・コンピュータ)方式に従って動作する。図1に示すように、プロセッサ10のバス・インタフェース・ユニット(BIU)12にシステム・バス11が接続される。BIU12はプロセッサとシステム・バス11間の情報転送を制御する。
【0014】
BIU12は、プロセッサ10の命令キャッシュ14及びデータ・キャッシュ16に接続される。命令キャッシュ14は命令をシーケンサ・ユニット18に出力する。シーケンサ・ユニット18は、命令キャッシュ14からのこの命令に応答して、プロセッサ10の他の実行回路に命令を選択的に出力する。
【0015】
シーケンサ・ユニット18の他、好適実施例のプロセッサ10の実行回路は、複数の実行ユニット(分岐ユニット20)、具体的には固定小数点ユニットA(FXUA)22、固定小数点ユニットB(FXUB)24、複合固定小数点ユニット(CFXU)26、ロード/ストア・ユニット(LSU)28、及び浮動小数点ユニット(FPU)30を含む。FXUA22、FXUB24、CFXU26、及びLSU28は、それぞれのソース・オペランド情報を汎用設計レジスタ(GPR)から入力する。好適実施例のGPRは、他のユニットからの結果を、最初にレジスタに格納することなく”転送”(または”バイパス”)することができる。更にFXUA22とFXUB24は繰り上りビット(CA)・レジスタ42から”繰り上りビット”を入力する。FXUA22、FXUB24、CFXU26、及びLSU28は、それぞれの操作の結果(宛先オペランド情報)をGPR32に格納するため出力する。またCFXU26は、ソース・オペランド情報と宛先オペランド情報を特殊レジスタ(SPR)40との間で入出力する。
【0016】
FPU30はそのソース・オペランド情報を浮動小数点設計レジスタ(FPR)36から入力する。好適実施例のFPRは、他の実行ユニットからの結果を、最初にレジスタに格納することなく”転送”(または”バイパス”)することができる。FPU30は、その操作の結果(宛先オペランド情報)をFPR36に格納するため出力する。
【0017】
LSU28は、ロード命令に応答して、データ・キャッシュ16から情報を入力し、その情報をGPR32にコピーする。情報がデータ・キャッシュ16に格納されない場合、データ・キャッシュ16は(BIU12とシステム・バス11を通して)情報をシステム・バス11に接続されたシステム・メモリ39から入力する。更にデータ・キャッシュ16は、データ・キャッシュ16からの情報を(BIU12とシステム・バス11を通して)システム・バス11に接続されたシステム・メモリ39へ出力することができる。LSU28は、ストア命令に応答して、GPR32とFPR36のうち選択された1つから情報を入力し、その情報をデータ・キャッシュ16にコピーする。
【0018】
シーケンサ・ユニット18は、GPR32とFPR36との間で情報を入出力する。分岐ユニット20は、シーケンサ・ユニット18から命令及びプロセッサ10の現在状態を示す信号を入力する。この命令及び信号に応答して、分岐ユニット20が、プロセッサ10により実行するため、命令シーケンスを格納するのに適したメモリ・アドレスを示す信号を(シーケンサ・ユニット18に)出力する。シーケンサ・ユニット18は、分岐ユニット20からのこの信号に応答して、指定された命令シーケンスを命令キャッシュ14から入力する。命令シーケンスが命令キャッシュ14に格納されていない場合、命令キャッシュ14は(BIU12とシステム・バス11を通して)その命令をシステム・バス11に接続されたシステム・メモリ39から入力する。
【0019】
シーケンサ・ユニット18は、命令キャッシュ14からの命令入力に応答して、命令を実行ユニット20、22、24、26、28、及び30のうち選択された1つに選択的にディスパッチする。実行ユニットはそれぞれ特定の命令クラスの命令を少なくとも1つ実行する。例えばFXUA22とFXUB24は、ソース・オペランドに対して、加算、減算、AND、OR、及びXOR等、第1クラスの固定小数点算術演算を実行する。CFXU26は、固定小数点乗算、除算等、第2クラスの固定小数点演算をソース・オペランドに対して実行する。FPU30は、浮動小数点乗算、除算等、浮動小数点演算をソース・オペランドに対して実行する。
【0020】
プロセッサ10は、高性能を達成するため、実行ユニット20、22、24、26、28、及び30で複数の命令を同時に処理する。よって各命令はステージ・シーケンスとして処理され、それぞれの命令を他の命令のステージと並列に実行できる。この方式を”パイプライン方式”という。好適実施例の重要な側面として、命令は通常、フェッチ、ディスパッチ、実行、再書込み、及び完了の5ステージとして処理される。
【0021】
フェッチ・ステージでは、シーケンサ・ユニット18が、ここで分岐ユニット20、シーケンサ・ユニット18とともに説明している命令シーケンスを格納する少なくとも1つのメモリ・アドレスから少なくとも1つの命令を(命令キャッシュ14から)選択的に入力する。
【0022】
シーケンサ・ユニット18は、ディスパッチ/デコード/発行ステージで、最初の命令をデコードして実行ユニット20、22、24、26、28、及び30の1つにディスパッチする。ディスパッチ・ステージでは、ディスパッチされる命令に対して、選択された実行ユニットにオペランド情報が与えられる。プロセッサ10は命令を、プログラムされたシーケンスの順序でディスパッチする。
【0023】
実行ステージでは、実行ユニットが、ディスパッチされたそれぞれの命令を実行し、それぞれの操作の結果(宛先オペランド情報)をGPR32、FPR36、SPR40、及び繰り上りビット・レジスタ42に格納するため出力する。
【0024】
再書込みステージでは、別々のユニットからの出力結果が対応するレジスタに書込まれる。命令が異なると、結果を生成するため必要なサイクル数も異なることがあるので、再書込みは、プログラムされた命令シーケンスに関して”順不同”に行われることがある。
【0025】
シーケンサ・ユニット18は、様々な実行ユニットから情報を累算し、命令が例外条件なしに終了したかどうかを確認する。現在の命令を含めて現在の命令の前の全命令が例外条件なしに”終了した”場合、現在の命令により上書きされたレジスタの前の設計値は、履歴ファイルに格納する必要がなくなり、命令は”完了する”。プロセッサ10は従って、命令をそのプログラムされたシーケンスで”完了する”。例外条件が発生した場合、シーケンサ・ユニットはGPRに、例外発生の原因になった命令の前の設計値を復元することを指示する。シーケンサ・ユニットは、次に有効な命令アドレスから命令を”再フェッチ”する。
【0026】
図2は、本発明の方法及び装置に従った、図1のシーケンサ・ユニットに含まれるストール生成回路を示す。ストール生成回路(依存性検出回路)200は、基本ハザード検出回路202と基本レジスタ・アドレス・キュー204を含む基本検出回路203、及び投機的ハザード検出回路206と投機的レジスタ・アドレス・キュー208を含む投機的検出回路205を含む。基本ハザード検出回路202と基本レジスタ・アドレス・キュー204は、依存性により実際にハザードが存在するとき基本ハザード信号を生成するため使用される。検出される依存性は、データ依存性または構造リソース依存性のいずれかと考えられる。投機的ハザード検出回路206と投機的レジスタ・アドレス・キュー208は、依存性による投機的ハザードが存在するとき投機的ハザード信号を生成するため使用される。ここでも、検出される依存性はデータ依存性または構造依存性のいずれかと考えられる。
【0027】
命令を格納するため、命令バッファ210、212、214、216、及び218が追加される。バッファ212は、次にディスパッチ/発行される命令を格納するため使用される。バッファ214、216、及び218は投機的命令を格納する。これらのバッファに格納された命令は、命令フェッチ・ユニット220により、バッファ212の命令とともに、キャッシュ・ラインから順次にフェッチされた命令である。命令バッファ210は、最近ディスパッチされた命令を格納するためのものである。
【0028】
命令は、命令バッファ212から機能ユニットに発行される。命令バッファ214、216、及び218は、バッファ212の命令の次に続く順次命令を表す。どのサイクルでも状態機械222が命令バッファを制御して、図の上方へシフトさせて次の順次命令セットをロードするか、命令キャッシュ(図示せず)から新しい命令セットをロードするか、または発行キューを保留する。命令バッファ212の命令と、前に発行されていても終了しておらず、まだマシンのリソースを占有している命令の間にリソース・コンフリクトがある場合は、発行キューを保留する必要がある。
【0029】
依存性検出回路200は、デコード回路201、事前命令情報ストア204、及びハザード検出回路202を含む。デコード回路201は、現在発行されている命令を命令ディスパッチ・バッファ21から受信するとともに、状態機械222から”発行有効”信号を受信する。デコード回路201は、事前命令情報ストア204とハザード検出回路202に、ターゲット・レジスタ・アドレス、機能ユニットやバス等の構造リソース等、命令がどのリソースを使用しているかを示すデコード済み情報を与える。デコード回路201はまた、リソースが必要とされる命令パイプライン・ステージを示す情報を提供する。
【0030】
事前命令情報ストア204は、デコード回路201から新しく発行された命令に関する情報、状態機械222からの”発行有効”信号、及び機能ユニットからの命令進行状況信号に応答して、どのリソースが前の命令により使用されているかに関する情報を更新する。パイプラインが保留されない順次パイプライン・マシンの場合、事前命令情報ストア204は、ターゲット・アドレス・レジスタの一連のキューとして効率よく実装することができ、レジスタをシフトさせ、レジスタや構造リソースが使用されているパイプライン・ステージを示す”ワン・ホット(one−hot)”情報を維持することができる。
【0031】
ハザード検出回路202は、命令バッファ212の命令と”飛行中”の命令(そのリソースはストア204により維持される)との間にリソース・コンフリクトが存在するかどうかを判定する。回路202は、命令バッファ212からのソース・オペランド・レジスタ・アドレスを飛行中の命令のターゲットと比較する比較器のアレイを含む。また回路202は、構造リソースのいずれかが、使用されているかまたは使用される予定のサイクルで、飛行中の命令とバッファ212の命令の両方に必要かどうかを判定するロジックを含む。
【0032】
オペランド依存性ハザードまたは構造ハザードが存在する場合、ハザード信号がアサートされ、状態機械222が、”発行有効”信号をアサート解除し、命令の進行状況を示す機能ユニットからの”サイクル情報”信号に応答して事前命令情報ストア204が更新される間、命令バッファの命令を保留する必要がある
【0033】
命令は、サイクル毎にバッファからバッファにシフトされる。例えば現在バッファ218にある命令は、前の命令が引き続き順次に実行される限り、次のクロック・サイクルの間にバッファ216にシフトされる。例外が発生するか、分岐命令が実行された場合、命令フェッチ220により、新しい命令がフェッチされ、これら命令バッファに格納される。
【0034】
状態機械222は、基本ハザード信号と投機的ハザード信号をその入力の2つとして受信するためのものである。状態機械222は、命令のディスパッチと命令の命令バッファから次のバッファへのシフトを制御するため使用される。
【0035】
投機的事前命令情報ストア208は、現在飛行中で、命令バッファ212に格納された命令を含む命令のターゲット・レジスタのアドレスを含む。基本事前命令情報ストア204は、現在飛行中の命令のターゲット・レジスタのアドレスを含む。飛行中の命令は、ディスパッチされているが、完了ステージに達していない命令である。
【0036】
第3検出回路241も追加される。第3検出回路241は、ハザード検出回路240と事前命令情報ストア242を含む。第3検出回路241は命令バッファ212に接続され、検出回路203が受信する信号と同じ信号を受信する。第3検出回路241は、基本検出回路203と同様に動作するが、回路203のようにディスパッチ・ステージ(Dステージ)で動作するのではなく、実行ステージ(Xステージ)で動作する。従って事前命令情報ストア242は、パイプのC、Wの各ステージに命令のターゲットを含む。第3検出回路241は、依存性が検出されたとき第2レベル基本ハザード信号を生成する。
【0037】
図3に、本発明の方法及び装置に従った基本レジスタ・アドレス・キューと投機的レジスタ・アドレス・キューを示す。投機的レジスタ・アドレス・キューは、現在使用中の命令のターゲットと、現在ディスパッチされている命令のターゲットを保持する。従って208内の投機的レジスタ・アドレス・キューは、現在Dステージつまり命令が現在バッファ212にあるディスパッチ・ステージ、Dステージに続き、実行ステージの最初の部分であるXステージ、Xステージに続き、実行ステージの第2の部分であるCステージ、及びCステージに続き、再書込みステージであるWステージにある命令のターゲットを保持する。基本レジスタ・アドレス・キュー204は、現在Xステージ、Cステージ、及びWステージにある命令のターゲットを保持する。
【0038】
当業者には明らかなように、レジスタ・アドレス・キューは、現在飛行中で、リソースをまだ占有しているか、または結果を生成する可能性のある全命令を保持するのに十分深くする必要がある。
【0039】
命令が命令バッファから命令バッファにシフトされると、各レジスタ・アドレス・キューのエントリもシフトされる。
【0040】
ハザード検出回路202、及び206は、それぞれに関連したレジスタ・アドレス・キューとともにサイクル情報信号も利用し、ハザードが存在するかどうかを判定する。ハザードが存在するのは、ハザード検出回路に関連付けられた命令バッファのターゲットが、関連するレジスタ・アドレス・キューのターゲットの1つと一致することをハザード検出回路が確認したときであり、その命令の実行は適時には完了しない。ハザード検出回路は、サイクル情報信号を利用して関連する命令バッファの命令に有効な値をレジスタに保持できるよう、飛行中の命令が実行を適時に完了するかどうか判定する。
【0041】
図4は、本発明の方法及びシステムに従ってプロセッサの動作を記述する状態変換テーブルを示す。状態変換テーブルは、様々なハザード信号が現在アサートされているかどうかに応答してプロセッサの動作を記述する。
【0042】
ここでは、スカラ・プロセッサで命令の発行を制御するメカニズムが記述されているが、同じメカニズムによりスーパースカラ・マイクロプロセッサの複数の機能ユニットに関連付けられた発行キューから命令を発行することができる。
【0043】
好適実施例について詳しく説明したが、形式や詳細については、当業者には明らかなように、本発明の主旨と範囲から逸脱することなく様々な変更が可能である。
【0044】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0045】
(1)少なくとも1つの実行ユニットを含み、複数の命令を順次に処理するパイプライン・プロセッサの方法であって、
依存性が存在するかどうかを投機的に判定するステップと、
依存性が存在することの投機的判定に応答して、前記依存性の原因となる命令を前記少なくとも1つの実行ユニットにディスパッチする前に1クロック・サイクルのみのパイプライン・ストールを生成するステップと、
を含む、方法。
(2)複数の命令を順次に処理するパイプライン・プロセッサの方法であって、
複数のクロック・サイクルを利用して依存性が存在するかどうかを投機的に判定するステップと、
投機的依存性が存在することの判定に応答して、1クロック・サイクルのみのパイプライン・ストールを生成するステップと、
を含む、方法。
(3)前記投機的依存性が存在するかどうかを判定するため、投機的命令バッファに接続された第1依存性ハザード検出回路を設定するステップを含む、前記(2)記載の方法。
(4)前記投機的依存性が存在するかどうかの判定に応答して、投機的ハザード信号をアサートするステップを含む、前記(3)記載の方法。
(5)前記投機的ハザード信号のアサートに応答して、1クロック・サイクルのパイプライン・ストールを挿入するステップを含む、前記(4)記載の方法。
(6)実際に依存性が存在するかどうかを判定するため、投機的命令バッファに接続された第2依存性ハザード検出回路を設定するステップを含む、前記(5)記載の方法。
(7)前記現実のハザードが存在することの判定に応答して基本ハザード信号をアサートするステップを含む、前記(6)記載の方法。
(8)前記投機的ハザード信号がアサートされないとき、前記基本ハザード信号のアサートに応答して複数クロック・サイクルのパイプライン・ストールを挿入するステップを含む、前記(7)記載の方法。
(9)複数の命令を順次に処理するパイプライン・プロセッサであって、
複数のクロック・サイクルにより命令バッファの制御を実装し、投機的デコード回路、投機的事前命令情報ストア、及び投機的ハザード検出回路を含み、投機的依存性の検出に応答して1クロック・サイクルのパイプライン・ストールを挿入する、投機的検出回路と、
複数のクロック・サイクルにより命令バッファの制御を実装し、基本デコード回路、基本事前命令情報ストア、及び基本ハザード検出回路を含み、現実の依存性の検出に応答して複数クロック・サイクルのパイプライン・ストールを挿入する、基本検出回路と、
を含む、プロセッサ。
(10)投機的ハザードが存在することの判定に応答して投機的ハザード信号を生成する前記投機的検出回路を含む、
前記(9)記載のプロセッサ。
(11)現在飛行中の命令により使用されているリソースを格納する、命令ディスパッチ・バッファに格納された命令のための前記投機的事前命令情報ストアと、
前記投機的事前命令情報ストアの使用中の投機的命令リソースに必要なリソースを比較する前記投機的ハザード検出回路であって、該投機的命令は、前記ディスパッチ・バッファに格納された前記命令の後、次にフェッチされた命令である、該検出回路と、
を含む、前記(9)記載のプロセッサ。
(12)投機的ハザードの検出に応答して投機的ハザード信号をアサートする前記投機的検出回路を含む、
前記(11)記載のプロセッサ。
(13)実際のハザードの検出に応答して基本ハザード信号をアサートする前記基本検出回路を含む、
前記(11)記載のプロセッサ。
(14)前記投機的ハザードの原因となり、前記ディスパッチ・バッファに格納されている前記投機的命令の前に、前記投機的ハザード信号をアサートする前記投機的検出回路を含む、
前記(13)記載のプロセッサ。
【図面の簡単な説明】
【図1】本発明の方法及びシステムに従った順次ディスパッチのパイプライン・プロセッサを示す図である。
【図2】本発明の方法及びシステムに従った、図1のシーケンサ・ユニットに含まれるストール生成回路を示す図である。
【図3】本発明の方法及びシステムに従ったコンピュータ・システムの基本レジスタ・アドレス・キューと投機的レジスタ・アドレス・キューを示す図である。
【図4】本発明の方法及びシステムに従った、プロセッサの動作を記述する状態変換テーブルを示す図である。
【符号の説明】
10 プロセッサ
11 システム・バス
12 バス・インタフェース・ユニット(BIU)
14 命令キャッシュ
16 データ・キャッシュ
18 シーケンサ・ユニット
20 分岐ユニット
22 固定小数点ユニットA(FXUA)
24 固定小数点ユニットB(FXUB)
26 複合固定小数点ユニット(CFXU)
28 ロード/ストア・ユニット(LSU)
30 及び浮動小数点ユニット(FPU)
32 GPR
36 浮動小数点設計レジスタ(FPR)
39 システム・メモリ
40 特殊レジスタ(SPR)
42 繰り上りビット(CA)・レジスタ
200 ストール生成回路(依存性検出回路)
201 デコード回路
202 基本ハザード検出回路
203 基本検出回路
204 基本レジスタ・アドレス・キュー、事前命令情報ストア
205 投機的検出回路
206 投機的ハザード検出回路
208 投機的レジスタ・アドレス・キュー
210、212、214、216、218 命令バッファ
220 命令フェッチ・ユニット
222 状態機械
240 ハザード検出回路
241 第3検出回路
242 事前命令情報ストア

Claims (7)

  1. 複数の命令を順次に処理するパイプライン・プロセッサであって、
    命令を格納する複数の命令バッファと
    前記命令バッファ内の命令のシフトを制御する制御手段と、
    次に発行される命令の次の命令である投機的命令を受信し、該命令がどのリソースを使用するかを示すデコード済み情報を出力する投機的デコード回路と、
    現在発行されているが完了ステージに達していない命令、及び、次に発行される命令のリソースに関する情報を格納する投機的事前命令情報ストアと
    前記投機的デコード回路からの前記デコード済み情報と、前記投機的事前命令情報ストア内のリソースに関する情報とによって投機的依存性を検出する投機的ハザード検出回路と、
    を含み、投機的依存性の検出に応答して1クロック・サイクルのパイプライン・ストールを挿入する投機的検出回路と、
    次に発行されている命令を受信し、該命令がどのリソースを使用するかを示すデコード済み情報を出力する基本デコード回路と、
    現在発行されているが完了ステージに達していない命令のリソースに関する情報を格納する基本事前命令情報ストアと、
    前記基本デコード回路からの前記デコード済み情報と、前記基本事前命令情報ストア内のリソースに関する情報とによって現実の依存性を検出する基本ハザード検出回路と、
    を含み、現実の依存性の検出に応答して複数クロック・サイクルのパイプライン・ストールを挿入する基本検出回路と、
    を含む、プロセッサ。
  2. 前記投機的ハザード検出回路及び前記基本ハザード検出回路は、依存性が検出された場合に投機的ハザード信号及び基本ハザード信号を夫々アサートする、請求項1記載のプロセッサ。
  3. 前記基本事前命令情報ストアは、前記基本デコード回路からのデコード済み情報と、前記制御手段からの「発行有効」信号と、機能ユニットからの命令進行状況信号とに応答して、どのリソースが前の命令により使用されているかに関する情報を更新する、請求項1または2記載のプロセッサ。
  4. 前記基本ハザード検出回路は、前記デコード済み情報と、前記基本事前命令情報ストア内のリソースに関する情報とを比較する比較器のアレイを含む、請求項1〜3のいずれか1項記載のプロセッサ。
  5. 前記シフトを制御する制御手段は、基本ハザード信号と投機的ハザード信号とを受信して、命令のシフトを制御するために使用する、請求項2〜4のいずれか1項記載のプロセッサ。
  6. 前記現在発行されているが完了ステージに達していない命令が、実行ステージの最初の部分であるXステージの命令、実行ステージの第2の部分であるCステージの命令、及び、再書込みステージであるWステージにある命令からなる、請求項1〜5のいずれか1項記載のプロセッサ。
  7. 実行ステージの第2の部分であるCステージの命令、及び、再書込みステージであるWステージにある命令を格納する事前命令情報ストアと、
    前記基本デコード回路からの前記デコード済み情報と、前記事前命令情報ストア内のリソースに関する情報の1つとから実行ステージにおける依存性を検出するハザード検出回 路とを含み、
    実行ステージにおける依存性の検出に応答して第2レベル基本ハザード信号を生成する第3の検出回路をさらに含む、請求項1〜6のいずれか1項記載のプロセッサ。
JP2001025765A 2000-02-04 2001-02-01 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法 Expired - Fee Related JP3611304B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/498088 2000-02-04
US09/498,088 US6708267B1 (en) 2000-02-04 2000-02-04 System and method in a pipelined processor for generating a single cycle pipeline stall

Publications (2)

Publication Number Publication Date
JP2001243071A JP2001243071A (ja) 2001-09-07
JP3611304B2 true JP3611304B2 (ja) 2005-01-19

Family

ID=23979556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001025765A Expired - Fee Related JP3611304B2 (ja) 2000-02-04 2001-02-01 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法

Country Status (4)

Country Link
US (1) US6708267B1 (ja)
EP (1) EP1152328A3 (ja)
JP (1) JP3611304B2 (ja)
KR (1) KR100523706B1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7401205B1 (en) * 1999-08-13 2008-07-15 Mips Technologies, Inc. High performance RISC instruction set digital signal processor having circular buffer and looping controls
US7363467B2 (en) * 2002-01-03 2008-04-22 Intel Corporation Dependence-chain processing using trace descriptors having dependency descriptors
JP3816845B2 (ja) * 2002-07-05 2006-08-30 富士通株式会社 プロセッサ及び命令制御方法
US7185182B2 (en) * 2003-02-04 2007-02-27 Via Technologies, Inc. Pipelined microprocessor, apparatus, and method for generating early instruction results
US20040158694A1 (en) * 2003-02-10 2004-08-12 Tomazin Thomas J. Method and apparatus for hazard detection and management in a pipelined digital processor
US8966230B2 (en) * 2009-09-30 2015-02-24 Intel Corporation Dynamic selection of execution stage
KR101669989B1 (ko) 2010-05-27 2016-10-28 삼성전자주식회사 파이프라인 프로세서 및 이퀄 모델 보존 방법
US10289415B2 (en) 2015-10-14 2019-05-14 International Business Machines Corporation Method and apparatus for execution of threads on processing slices using a history buffer for recording architected register data
US10282205B2 (en) * 2015-10-14 2019-05-07 International Business Machines Corporation Method and apparatus for execution of threads on processing slices using a history buffer for restoring architected register data via issued instructions
US10740269B2 (en) * 2018-07-17 2020-08-11 Arm Limited Arbitration circuitry
US10824468B2 (en) * 2019-02-12 2020-11-03 Arm Limited Control of instruction execution in a data processor
CN110209426B (zh) * 2019-06-19 2021-05-28 上海兆芯集成电路有限公司 指令执行方法及指令执行装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0150177A1 (en) * 1983-07-11 1985-08-07 Prime Computer, Inc. Data processing system
JPH04275628A (ja) * 1991-03-01 1992-10-01 Mitsubishi Electric Corp 演算処理装置
KR100309566B1 (ko) 1992-04-29 2001-12-15 리패치 파이프라인프로세서에서다중명령어를무리짓고,그룹화된명령어를동시에발행하고,그룹화된명령어를실행시키는방법및장치
EP0717359A3 (en) * 1994-12-15 1997-02-05 Sun Microsystems Inc Register cache memory for a computer processor
US5699536A (en) 1995-04-13 1997-12-16 International Business Machines Corporation Computer processing system employing dynamic instruction formatting
US5812812A (en) * 1996-11-04 1998-09-22 International Business Machines Corporation Method and system of implementing an early data dependency resolution mechanism in a high-performance data processing system utilizing out-of-order instruction issue
US5870580A (en) * 1996-12-13 1999-02-09 Advanced Micro Devices, Inc. Decoupled forwarding reorder buffer configured to allocate storage in chunks for instructions having unresolved dependencies
US5781752A (en) * 1996-12-26 1998-07-14 Wisconsin Alumni Research Foundation Table based data speculation circuit for parallel processing computer

Also Published As

Publication number Publication date
US6708267B1 (en) 2004-03-16
EP1152328A2 (en) 2001-11-07
EP1152328A3 (en) 2008-04-16
JP2001243071A (ja) 2001-09-07
KR100523706B1 (ko) 2005-10-26
KR20010077997A (ko) 2001-08-20

Similar Documents

Publication Publication Date Title
US5611063A (en) Method for executing speculative load instructions in high-performance processors
US5546597A (en) Ready selection of data dependent instructions using multi-cycle cams in a processor performing out-of-order instruction execution
US5752014A (en) Automatic selection of branch prediction methodology for subsequent branch instruction based on outcome of previous branch prediction
US5694565A (en) Method and device for early deallocation of resources during load/store multiple operations to allow simultaneous dispatch/execution of subsequent instructions
US6279105B1 (en) Pipelined two-cycle branch target address cache
JP2839075B2 (ja) 処理システムを動作させる方法及び処理システム
US20060184772A1 (en) Lookahead mode sequencer
EP0675433A2 (en) Processing system and method of operation
EP0675434A2 (en) Processing system and method of operation
JP3611304B2 (ja) 1サイクルのパイプライン・ストールを生成するパイプライン・プロセッサのシステム及び方法
US5872948A (en) Processor and method for out-of-order execution of instructions based upon an instruction parameter
JPH096611A (ja) データ処理システムにおけるデータをバッファリングする方法およびシステム
EP0753172A1 (en) Processing system and method of operation
JP3207124B2 (ja) カウント/リンク・レジスタ変更命令の投機実行をサポートする方法及び装置
US6587941B1 (en) Processor with improved history file mechanism for restoring processor state after an exception
KR100305487B1 (ko) 특정유형의인스트럭션을동시에처리할수있는방법및데이터프로세싱시스템
US5850563A (en) Processor and method for out-of-order completion of floating-point operations during load/store multiple operations
EP0753173B1 (en) Processing system and method of operation
US5784606A (en) Method and system in a superscalar data processing system for the efficient handling of exceptions
US6298436B1 (en) Method and system for performing atomic memory accesses in a processor system
KR100237989B1 (ko) 슈퍼스칼라 프로세서에서 리네임 버퍼를 효율적으로 사용하기 위한 방법 및 시스템
JP3721002B2 (ja) メモリ要求を形成するために並列に生成される複数の取出アドレスのうちの1つを選択する、プロセッサおよび命令取出方法
US6266761B1 (en) Method and system in an information processing system for efficient maintenance of copies of values stored within registers
US5764940A (en) Processor and method for executing a branch instruction and an associated target instruction utilizing a single instruction fetch
US20230315446A1 (en) Arithmetic processing apparatus and method for arithmetic processing

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040730

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040730

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20040730

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040929

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20040929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071029

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees