JP5104861B2 - 演算処理装置 - Google Patents
演算処理装置 Download PDFInfo
- Publication number
- JP5104861B2 JP5104861B2 JP2009520135A JP2009520135A JP5104861B2 JP 5104861 B2 JP5104861 B2 JP 5104861B2 JP 2009520135 A JP2009520135 A JP 2009520135A JP 2009520135 A JP2009520135 A JP 2009520135A JP 5104861 B2 JP5104861 B2 JP 5104861B2
- Authority
- JP
- Japan
- Prior art keywords
- branch
- instruction
- entries
- entry
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003111 delayed effect Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000001934 delay Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 102100023817 26S proteasome complex subunit SEM1 Human genes 0.000 description 1
- 101000684297 Homo sapiens 26S proteasome complex subunit SEM1 Proteins 0.000 description 1
- 101000873438 Homo sapiens Putative protein SEM1, isoform 2 Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30072—Arrangements for executing specific machine instructions to perform conditional operations, e.g. using predicates or guards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3802—Instruction prefetching
- G06F9/3804—Instruction prefetching for branches, e.g. hedging, branch folding
- G06F9/3806—Instruction prefetching for branches, e.g. hedging, branch folding using address prediction, e.g. return stack, branch history buffer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3854—Instruction completion, e.g. retiring, committing or graduating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3854—Instruction completion, e.g. retiring, committing or graduating
- G06F9/3858—Result writeback, i.e. updating the architectural state or memory
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
Description
本発明の第1の命令制御装置は、単一のスレッド、あるいは、同時に複数のスレッドが実行可能な演算処理装置の命令制御装置において、実行しているスレッドの数を検出するスレッド数検出手段と、実行しているスレッドの数に応じてエントリをスレッド数分にグループ分けし、各エントリ群を各スレッドに対応させ、スレッドごとに独立してアウトオブオーダーでエントリに格納されている分岐命令の処理を行い、各スレッド内でエントリの開放がインオーダーとなるように、エントリ群を選択してエントリの開放を行なう分岐リザベーションステーション手段とを備えることを特徴とする。
命令制御装置は、分岐予測機構として分岐予測回路(branch history : BRHIS)10を保有し、分岐命令を制御するための回路として分岐命令制御回路(branch control : BRCTL)11を保有する。分岐命令制御回路11は、分岐命令を制御するための分岐リザベーションステーション(reservation station for branch : RSBR)と分岐遅延命令(instruction in the delay slot 若しくは delay instruction)を制御するための遅延命令スタック(delay slot stack : DSS)とを有する。分岐命令制御回路11では、分岐判定、分岐先アドレスの管理、分岐予測の成否判定、分岐予測失敗時の再命令フェッチ要求、分岐予測失敗時の分岐遅延命令の命令デコーダ12への再投入といった処理が行われる。分岐先アドレスの管理は分岐命令制御回路11内での制御と分岐命令制御回路11の制御下から離れ分岐命令完了までの間の制御とに分けられる。後者の制御のために分岐先アドレスバッファ(target address buffer)13を保有する。
図2では、7個の分岐リザベーションステーション(RSBR)が示されている。RSBR0からRSBR6に向かって、順次新しい命令がセットされる。すなわち、RSBR0に最も古い命令がセットされる。新しいエントリは、命令デコードサイクルでRSBRにセットされる。新しいエントリの作成は、最大2命令が可能である。RSBR内のエントリは、インオーダーで制御され、分岐判定、分岐予測の成否判定・命令再フェッチ要求の制御が行なわれる。制御終了後のエントリ開放は、インオーダーで行なわれ、古いほうから最大2命令が可能となっている。なお、命令再フェッチは、古いほうから最大3命令可能となっている。図2では、エントリをバブルアップ方式で管理しており、開放されたエントリ分だけエントリがバブルアップする。バブルアップ順はRSBR6->RSBR5->RSBR4->RSBR3->RSBR2->RSBR1->RSBR0となる。したがって、RSBR2以降にエントリが存在した場合は、RSBR0,RSBR1のVALIDはそのままとなる場合もある。エントリデータは、バブルアップ処理によって書き換えられる。新しいエントリは、命令でコードサイクル(Dサイクル)でリザベーションステーションのエントリに格納される。命令再フェッチ要求は、分岐予測が失敗した場合に、リザベーションステーションに対して発行され、エントリの開放は、命令コミット制御回路18において、命令の完了処理が終了した場合に、行なわれる。
1)分岐命令制御回路への命令投入および分岐命令制御回路でのエントリ作成について
命令バッファ17から命令デコーダ(以降デコーダ)12に対して命令データが供給されると、デコーダ12で命令がデコードされ、命令バッファ17から供給された命令種別が判別される。デコーダ12は、命令バッファ17から供給された命令の中に分岐命令をみつけると、分岐命令の制御を分岐命令制御回路11に割り振る。実行パイプラインに投入されたすべての命令は、命令コミット制御回路18で命令完了まで制御される。命令コミット制御回路18では、命令順序保障およびレジスタ更新制御が行われる。デコーダ12は最大4命令の同時デコードが可能であるが、分岐命令制御回路11では回路の制限により最大2命令の分岐命令が投入される。デコーダ12から分岐命令制御回路11へは、制御に必要なデータやタグと共に+D_RSBR_USE, +D_IID[5:0], +D_STRAND_ID, +D_RELという信号が送られる。これらの信号は分岐命令1命令につき1セット送られる。
図3に示す例では、RSBRは合計14エントリで構成されている。これらのエントリは7エントリずつ二つのグループに分けられる。ここでは第一のグループをRSBRL(RSBR0,RSBR1,…,RSBR6、ストランド0),第二のグループをRSBRH(RSBR10,RSBR11,…,RSBR16、ストランド1)とする。
図7は、遅延命令スタックを説明する図である。
2)分岐命令制御回路のエントリ消去について
分岐命令制御回路のエントリは、その分岐命令の分岐制御が終了するとエントリから開放される。分岐制御とは、分岐判定・分岐先アドレス確定・分岐予測の成否判定・命令再フェッチ要求とそのアドレス確定の各制御である。エントリから開放されるとは、その分岐命令が分岐命令制御回路の制御下から離れるということであり、そのときエントリは消去される。エントリが消去される条件として、このほかに割り込み処理や、先行命令が命令再フェッチ要求を出した時などがある。
3)分岐先アドレスの管理について
分岐命令は、分岐先アドレスの計算方法で2種類に分けることができる。分岐命令アドレスからオペコードで指定された命令数分のアドレスを計算して分岐先アドレスとする命令相対分岐、オペコードで指定されたレジスタを参照して分岐先アドレスを計算するレジスタ相対分岐である。本実施形態では、命令相対分岐は命令相対分岐アドレス生成回路、レジスタ相対分岐は演算ユニットで分岐先アドレスが計算される。命令相対分岐はデコードサイクルでアドレス計算され、デコーダから分岐命令が投入されると同時に分岐先アドレスが分岐命令制御回路に渡される。この時、分岐予測が行われていた場合は、分岐予測アドレスと計算された分岐先アドレスとが比較され、その結果が分岐命令制御回路に通知される。レジスタ相対分岐はデコード後の演算サイクルで計算され、分岐先アドレスが分岐命令制御回路に渡される。分岐予測が行われていた場合は、分岐予測アドレスと計算された分岐先アドレスとが分岐命令制御回路で比較される。分岐命令が分岐命令制御回路下にいる間、分岐先アドレスはエントリ毎にエントリデータとして管理される。
本実施形態では実装配線量、トランジスタ数を節約するため、分岐先アドレスバッファへ渡されるデータは1命令分としている。分岐先アドレスバッファへは、分岐先アドレスのほかに+COMPLETE_RSBR_IID[5:0],+COMPLETE_RSBR_STRAND_IDが渡される。ここで、+COMPLETE_RSBR_IIDは、分岐先アドレスバッファに渡されるアドレスの命令IDを示す信号である。+COMPLETE_RSBR_STRAND_IDは、分岐先アドレスバッファに渡されるアドレスのストランドIDを示す信号である。
具体的には、RSBR,DSS,TGT_BUFFのエントリ数に制限をかけることができる。RSBR,DSSは+PLID_RSBR、TGT_BUFFは+RSBR_TGT_BUFF_BUSYを1にするエントリのフル状態の条件を変えることが可能である。通常は命令処理装置の性能確保のためすべてのエントリを使い切ることを前提としているが、特定条件下において、使用するエントリ数を削減したい場合に使用できる。イベントはどのようなものでも構わないが、例として性能削減したい場合や電力削減したい場合などが考えられる。
図10は、ストランドが2個で、RSBRの使用エントリ数をそれぞれ4つずつに限定した図である。RSBR0〜RSBR3はストランド0(1)が使用し、RSBR10〜RSBR13はストランド1(0)が使用している。RSBR4〜RSBR6とRSBR14〜RSBR16は、未使用のエントリである。図11は、RSBRの全てのエントリを使用した場合の図である。RSBR0〜RSBR6がストランド0(1)によって使用され、RSBR10〜RSBR16がストランド1(0)によって使用されている。図12は、ストランドが1つで、RSBRの使用エントリ数を7個に制限した場合の図である。RSBR0〜RSBR6が使用されているが、RSBR10〜RSBR16は使用されていない。図13は、ストランドが1個で、RSBRの使用エントリ数を制限していない場合を示す。14個の全てのエントリが使用される。
これらの回路は、分岐命令制御回路11内に設けられる回路である。ストランドが2個の場合の回路(図14、15)とストランドが1個の場合の回路(図16)は、並列して設けられ、ストランドの数にしたがって、どちらかが動作する。
以下は、図14〜図16において現れる信号名とその説明である。
+RSBR0_VALID:RSBR0のエントリ有効であることを示す。
+RSBR0_RESOLVED:RSBR0の分岐判定が確定していることを示す。
+RSBR0_TAV:RSBR0の分岐先アドレスが確定していることを示す。
+TWO_STRAND_MODE:プロセスマシンチェック回路からの指示信号で実行パイプラインが2スレッド実行(マルチスレッド実行)していることを示す
+RSBR0_TAKEN:RSBR0の分岐判定が確定し、分岐することを示す。
+RSBR0_TGT_BUFF_BUSY:RSBR0が使用する分岐先アドレスバッファに空きエントリが存在していないことを示す。
+RSBR0_COMPLETE:RSBR0のエントリ開放が発生していることを示す。
+RESET_RSBR0_VALID:RSBR0のエントリをリセットしなければならないことを示す。リセット条件は実行パイプラインクリア指示(プロセスマシンチェック回路が指示)、エントリ開放である。RSBR10の信号についても同様である。
図14において、
・2ストランド実行中で、RSBR0エントリの分岐命令の開放条件が揃っていない。
・2ストランド実行中で、RSBR0エントリが分岐する命令であり、且つRSBR0(RSBRL側)が使用できる分岐先アドレスバッファに空きエントリが存在しておらず、エントリ開放ができない。
・2ストランド実行中で、RSBR0エントリの分岐命令が開放された。この条件によりストランド0,1ともに開放条件が揃っているときに、0,1交互に開放することが可能となる。
・RSBR0エントリのリセット要求がきている。
上記いずれかの条件が成立した時に+RSBR10_COMP_PRIO_TERM=1となる。
・2ストランド実行中で、RSBR10エントリの分岐命令の開放条件が揃っている。
・+RSBR10_COMP_PRIO_TERM=1である。
上記、全ての条件が揃ったときに+SET_RSBR10_COMPLETE_PRIORITY=1となる。
この信号は、前述の+RSBR10_COMPLETE_PRIORITY(priority信号)のセット信号である。RSBRのストランドを選択する信号である+RSBR10_COMPLETE_PRIORITYは、+SET_RSBR10_COMPLETE_PRIORITYの値をラッチ(フリップフロップ)でラッチして、出力したものである。
+ONE_STRAND_MODE:プロセスマシンチェック回路からの指示信号で実行パイプラインがシングルスレッド実行していることを示す。
・シングルスレッド実行中で、RSBR0にエントリが存在していない。
・シングルスレッド実行中で、+RSBR10_COMPLETE_PRIORITYがすでに1である。
・RSBR0エントリのリセット要求がきている。
上記いずれかの条件が揃い、且つRSBR10にエントリが存在しているときに、前述の+SET_RSBR10_COMPLETE_PRIORITY=1となる。
この信号は+RSBR10_COMPLETE_PRIORITY(priority信号)のセット信号である。+RSBR10_COMPLETE_PRIORITYは、+SET_RSBR10_COMPLETE_PRIORITYの値をラッチ(フリップフロップ)でラッチして、出力したものである。
RSBR_COMPLETE_PRIORITY[x:0]は、どのストランドの分岐命令を優先的に開放するかを指示するポインタである。xは2^(x+1)≧nにより決まる。分岐命令をリザベーションステーションから開放する場合は、分岐命令制御が完了しており、ポインタの示すストランドから優先的に選択され開放される。命令デコーダから命令が投入されると、DサイクルでストランドIDがセレクト回路に与えられ、ストランドIDに対応したストランドのエントリに命令が格納される。命令コミット制御回路から、RSBR0〜RSBRn0のいずれかについて分岐命令制御が完了したと通知された場合には、RSBR_COMPLETE_PRIORITY[x:0](セレクト信号)によって、セレクト回路が開放するストランドのエントリを選択し、開放されたエントリをBR_COMPとして出力する。図17では、スレッド数をn個としている。
Claims (6)
- 一又は複数のスレッドを実行可能な演算処理装置において、
前記一又は複数のスレッドに含まれる命令をデコードする命令デコード部と、
前記命令デコード部がデコードした命令が属する前記一又は複数のスレッドを実行する命令実行部と、
前記命令デコード部がデコードした命令のうち分岐命令を、それぞれ保持する分岐命令エントリを複数有する分岐リザベーションステーション部と、
前記命令デコード部がデコードした命令のうち分岐遅延命令を、前記分岐命令エントリに対応してそれぞれ保持する分岐遅延命令エントリを複数有する遅延命令スタック部と、
前記命令実行部が実行しているスレッドの数である実行スレッド数を検出するスレッド数検出部と、
検出された前記実行スレッド数に応じて、前記分岐リザベーションステーション部が有する複数の分岐命令エントリと前記遅延命令スタック部が有する複数の分岐遅延命令エントリを、前記命令実行部が実行している各スレッドに対応するようにグループ分けし、各分岐命令エントリが保持する分岐命令と各分岐遅延命令エントリが保持する分岐遅延命令の処理を、各スレッドに対応してグループ分けされた分岐命令エントリ群毎及び分岐遅延命令エントリ群毎にアウトオブオーダーで行い、各スレッドに対応する前記分岐命令エントリ群内及び前記分岐遅延命令エントリ群内で分岐命令エントリ又は分岐遅延命令エントリの開放がインオーダーとなるように、選択されたスレッドに対応する分岐命令エントリ群に含まれる分岐命令エントリ又は選択されたスレッドに対応する分岐遅延命令エントリ群に含まれる遅延分岐命令エントリの開放を行なう分岐命令制御部と、
を備えることを特徴とする演算処理装置。 - 前記分岐命令制御部は、
前記分岐リザベーションステーション部が有する前記複数の分岐命令エントリのうち、一部の分岐命令エントリを使用不可にするとともに、前記遅延命令スタック部が有する前記複数の遅延分岐命令エントリのうち、一部の遅延分岐命令エントリを使用不可にすることを特徴とする請求項1記載の演算処理装置。 - 前記分岐命令制御部は、
検出された前記実行スレッド数の変化に応じて、前記分岐リザベーションステーション部が有する複数の分岐命令エントリと前記遅延命令スタック部が有する複数の分岐遅延命令エントリのグループ分けを、動的に行なうことを特徴とする請求項1記載の演算処理装置。 - 前記演算処理装置はさらに、
開放された前記分岐リザベーションステーションの分岐命令エントリに保持された分岐命令の分岐先アドレスを、それぞれ保持する分岐先アドレスエントリを複数有する分岐先アドレスバッファ部を有し、
前記分岐命令制御部は、
検出された前記実行スレッド数に応じて、前記分岐アドレスバッファ部が有する複数の分岐先アドレスエントリを、前記命令実行部が実行している各スレッドに対応するようにグループ分けし、各スレッドに対応してグループ分けされた分岐先アドレスエントリ群に分岐先アドレスをそれぞれ格納し、選択されたスレッドに対応する分岐先アドレスエントリ群に含まれる分岐先アドレスエントリの開放を行なうことを特徴とする請求項1記載の演算処理装置。 - 前記分岐命令制御部は、
前記分岐先アドレスバッファ部が有する前記複数の分岐先アドレスエントリのうち、一部の分岐先アドレスエントリを使用不可にすることを特徴とする請求項4に記載の演算処理装置。 - 前記分岐命令制御部は、
検出された前記実行スレッド数の変化に応じて、前記分岐先アドレスバッファ部が有する複数の分岐先アドレスエントリのグループ分けを、動的に行なうことを特徴とする請求項5に記載の演算処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/000646 WO2008155794A1 (ja) | 2007-06-19 | 2007-06-19 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008155794A1 JPWO2008155794A1 (ja) | 2010-08-26 |
JP5104861B2 true JP5104861B2 (ja) | 2012-12-19 |
Family
ID=40155959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009520135A Expired - Fee Related JP5104861B2 (ja) | 2007-06-19 | 2007-06-19 | 演算処理装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8151097B2 (ja) |
EP (1) | EP2159686B1 (ja) |
JP (1) | JP5104861B2 (ja) |
KR (1) | KR101100144B1 (ja) |
CN (1) | CN101715576B (ja) |
WO (1) | WO2008155794A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5861354B2 (ja) * | 2011-09-22 | 2016-02-16 | 富士通株式会社 | 演算処理装置及び演算処理装置の制御方法 |
US9280398B2 (en) | 2012-01-31 | 2016-03-08 | International Business Machines Corporation | Major branch instructions |
US9229722B2 (en) | 2012-01-31 | 2016-01-05 | International Business Machines Corporation | Major branch instructions with transactional memory |
JP2014137732A (ja) * | 2013-01-17 | 2014-07-28 | Fujitsu Ltd | 情報処理システム及び情報処理システムの制御方法 |
EP3304291A1 (en) * | 2015-06-01 | 2018-04-11 | Intel Corporation | Multi-core processor for execution of strands of instructions grouped according to criticality |
US10175985B2 (en) | 2016-03-28 | 2019-01-08 | International Business Machines Corporation | Mechanism for using a reservation station as a scratch register |
US10831607B2 (en) * | 2018-07-30 | 2020-11-10 | International Business Machines Corporation | Dynamic transaction throttling in a data processing system supporting transactional memory |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005514698A (ja) * | 2001-12-31 | 2005-05-19 | インテル コーポレイション | マルチスレッドプロセッサのスレッドの実行のサスペンド処理 |
JP2005309762A (ja) * | 2004-04-21 | 2005-11-04 | Fujitsu Ltd | スレッド切替制御装置。 |
JP3716415B2 (ja) * | 2003-04-28 | 2005-11-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 同時マルチスレッドのための分割分岐履歴テーブルおよびカウント・キャッシュ |
WO2006114874A1 (ja) * | 2005-04-21 | 2006-11-02 | Fujitsu Limited | プロセッサ装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6441530A (en) | 1987-08-07 | 1989-02-13 | Sumitomo Electric Industries | Mobile communication system |
US5778243A (en) | 1996-07-03 | 1998-07-07 | International Business Machines Corporation | Multi-threaded cell for a memory |
US6233599B1 (en) * | 1997-07-10 | 2001-05-15 | International Business Machines Corporation | Apparatus and method for retrofitting multi-threaded operations on a computer by partitioning and overlapping registers |
US6889319B1 (en) | 1999-12-09 | 2005-05-03 | Intel Corporation | Method and apparatus for entering and exiting multiple threads within a multithreaded processor |
US7051329B1 (en) * | 1999-12-28 | 2006-05-23 | Intel Corporation | Method and apparatus for managing resources in a multithreaded processor |
US20010037447A1 (en) * | 2000-04-19 | 2001-11-01 | Mukherjee Shubhendu S. | Simultaneous and redundantly threaded processor branch outcome queue |
US6681345B1 (en) * | 2000-08-15 | 2004-01-20 | International Business Machines Corporation | Field protection against thread loss in a multithreaded computer processor |
US6748556B1 (en) * | 2000-08-15 | 2004-06-08 | International Business Machines Corporation | Changing the thread capacity of a multithreaded computer processor |
US6988186B2 (en) * | 2001-06-28 | 2006-01-17 | International Business Machines Corporation | Shared resource queue for simultaneous multithreading processing wherein entries allocated to different threads are capable of being interspersed among each other and a head pointer for one thread is capable of wrapping around its own tail in order to access a free entry |
JP3839755B2 (ja) * | 2002-06-28 | 2006-11-01 | 富士通株式会社 | 命令制御方法及びプロセッサ |
JP3926809B2 (ja) * | 2004-07-27 | 2007-06-06 | 富士通株式会社 | 分岐命令制御装置、および制御方法。 |
US20060168571A1 (en) * | 2005-01-27 | 2006-07-27 | International Business Machines Corporation | System and method for optimized task scheduling in a heterogeneous data processing system |
US7882505B2 (en) * | 2005-03-25 | 2011-02-01 | Oracle America, Inc. | Method and apparatus for switching between per-thread and per-processor resource pools in multi-threaded programs |
US7577826B2 (en) * | 2006-01-30 | 2009-08-18 | Sony Computer Entertainment Inc. | Stall prediction thread management |
-
2007
- 2007-06-19 CN CN2007800533663A patent/CN101715576B/zh not_active Expired - Fee Related
- 2007-06-19 EP EP07790172.6A patent/EP2159686B1/en not_active Not-in-force
- 2007-06-19 KR KR1020097025988A patent/KR101100144B1/ko active IP Right Grant
- 2007-06-19 JP JP2009520135A patent/JP5104861B2/ja not_active Expired - Fee Related
- 2007-06-19 WO PCT/JP2007/000646 patent/WO2008155794A1/ja active Application Filing
-
2009
- 2009-12-04 US US12/631,143 patent/US8151097B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005514698A (ja) * | 2001-12-31 | 2005-05-19 | インテル コーポレイション | マルチスレッドプロセッサのスレッドの実行のサスペンド処理 |
JP3716415B2 (ja) * | 2003-04-28 | 2005-11-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 同時マルチスレッドのための分割分岐履歴テーブルおよびカウント・キャッシュ |
JP2005309762A (ja) * | 2004-04-21 | 2005-11-04 | Fujitsu Ltd | スレッド切替制御装置。 |
WO2006114874A1 (ja) * | 2005-04-21 | 2006-11-02 | Fujitsu Limited | プロセッサ装置 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2008155794A1 (ja) | 2010-08-26 |
CN101715576A (zh) | 2010-05-26 |
US20100082952A1 (en) | 2010-04-01 |
US8151097B2 (en) | 2012-04-03 |
CN101715576B (zh) | 2013-04-17 |
KR101100144B1 (ko) | 2011-12-29 |
KR20100007996A (ko) | 2010-01-22 |
EP2159686A1 (en) | 2010-03-03 |
EP2159686A4 (en) | 2011-11-30 |
EP2159686B1 (en) | 2019-01-09 |
WO2008155794A1 (ja) | 2008-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5104861B2 (ja) | 演算処理装置 | |
US7051329B1 (en) | Method and apparatus for managing resources in a multithreaded processor | |
US7035997B1 (en) | Methods and apparatus for improving fetching and dispatch of instructions in multithreaded processors | |
EP2453350B1 (en) | Processing device | |
US7707391B2 (en) | Methods and apparatus for improving fetching and dispatch of instructions in multithreaded processors | |
WO2011155097A1 (ja) | 命令発行制御装置及び方法 | |
US8386753B2 (en) | Completion arbitration for more than two threads based on resource limitations | |
CN105242963B (zh) | 执行机构间的切换控制 | |
WO2009006607A1 (en) | Dynamically composing processor cores to form logical processors | |
JP2009053861A (ja) | プログラム実行制御装置 | |
EP2573673B1 (en) | Multithreaded processor and instruction fetch control method of multithreaded processor | |
JP4327008B2 (ja) | 演算処理装置及び演算処理装置の制御方法 | |
EP2159691B1 (en) | Simultaneous multithreaded instruction completion controller | |
US7237093B1 (en) | Instruction fetching system in a multithreaded processor utilizing cache miss predictions to fetch instructions from multiple hardware streams | |
US7328327B2 (en) | Technique for reducing traffic in an instruction fetch unit of a chip multiprocessor | |
CN100377076C (zh) | 一种应用于同时多线程处理器的取指控制装置及其方法 | |
JP5104862B2 (ja) | 命令実行制御装置及び命令実行制御方法 | |
US20040128488A1 (en) | Strand switching algorithm to avoid strand starvation | |
Wu et al. | A dynamically clustered chip multiprocessor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5104861 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |