JP2010079362A - プロセッサ、プロセッサの制御方法及び情報処理装置 - Google Patents

プロセッサ、プロセッサの制御方法及び情報処理装置 Download PDF

Info

Publication number
JP2010079362A
JP2010079362A JP2008243823A JP2008243823A JP2010079362A JP 2010079362 A JP2010079362 A JP 2010079362A JP 2008243823 A JP2008243823 A JP 2008243823A JP 2008243823 A JP2008243823 A JP 2008243823A JP 2010079362 A JP2010079362 A JP 2010079362A
Authority
JP
Japan
Prior art keywords
register file
renaming
processor
contents
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008243823A
Other languages
English (en)
Other versions
JP4868255B2 (ja
Inventor
Yasuo Ishii
康雄 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008243823A priority Critical patent/JP4868255B2/ja
Publication of JP2010079362A publication Critical patent/JP2010079362A/ja
Application granted granted Critical
Publication of JP4868255B2 publication Critical patent/JP4868255B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3838Dependency mechanisms, e.g. register scoreboarding
    • G06F9/384Register renaming

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】 SIMD型アクセラレータにおいてレジスタ・リネーミングによる性能向上が困難であるという課題を解決する。
【解決手段】 SIMD型アクセラレータを有するプロセッサであって、演算器102と、演算器102にクロスバースイッチ104を介して接続するレジスタファイル101と、演算器の演算結果を格納し、クロスバースイッチを介して演算結果をレジスタファイル101に書き戻すと共に、クロスバースイッチをバイパスするパスを介して演算器に格納データを出力するリネーミングレジスタファイル103を備え、レジスタファイル101の複数のエントリを、リネーミングレジスタファイル103の1つのエントリに同時に割り当て可能とした。
【選択図】 図2

Description

本発明は、SIMD(Single
Instruction/Multiple Data)型アクセラレータを有するプロセッサに関し、特に依存制約を緩和するリネーミングレジスタの管理を効率よく実現したプロセッサ、プロセッサの制御方法及び情報処理装置に関する。
関連技術によるSIMD型アクセラレータを有するプロセッサにおけるレジスタ・リネーミングについて説明する。
SIMD型アクセラレータ向けのアーキテクチャレジスタファイルは大容量であることから、1つの仕掛かり中の命令に対して1つの論理的なリネーミングレジスタをアサインする(割り付ける)方式では、十分な数の仕掛かり中命令を割り当てることができない。
例えば、図6はSIMD型アクセラレータを有するプロセッサにおけるレジスタ・リネーミングを説明する概念図であるが、アーキテクチャレジスタファイル301をリネーミングレジスタファイル302に対してアサインする場合に、各命令に対して最大ベクトル長のレジスタをアサインする必要があるため、高々2命令しか同時にアサインすることができない。
すなわち、図6に示す構成の場合、リネーミングレジスタの容量が8ワード分しか存在しないため、ベクトル長4の命令については高々2命令しか同時に発行できないことになる。
また、アーキテクチャレジスタファイル301をリネーミングレジスタファイル302に対してアサインする場合に、リネーミングレジスタに対してデータを格納する演算がマスク付きであった場合、リネーミングレジスタに格納された値だけでは、その後続の演算を実行することができない。
また、SIMD型アクセラレータが利用する演算の同時命令実行数は常に均一ではないため、割り当てた物理レジスタで利用されない領域が発生する場合があった(例えば、図6のリネーミングレジスタファイル302のエントリp7)。
上記のように、1つの仕掛かり中の命令に対して1つの論理的なリネーミングレジスタをアサインする技術が、例えば特許文献1や特許文献2に開示されている。
特開平9−179737号公報 特開平10−040102号公報
上述のように、関連技術によるSIMD型アクセラレータを有するプロセッサにおけるレジスタ・リネーミングでは、十分な数の仕掛かり中命令を割り当てることができないと共に、マスク付き演算の場合、リネーミングレジスタに格納された値だけでは、その後続の演算を実行することができないという問題があった。
また、SIMD型アクセラレータが利用する演算の同時命令実行数は常に均一ではないため、割り当てた物理レジスタで利用されない領域が発生する可能性もあった。
このため、SIMD型アクセラレータのレジスタ管理ではレジスタ・リネーミングによる性能向上が困難で、投機実行やアウトオブオーダー実行による性能向上が得られなかった。
SIMD型アクセラレータの特徴は、大容量のアーキテクチャレジスファイルとマスク演算による効率的な演算手法にあるが、上述した問題点を有しているために、SIMDアクセラレータにおける効率的な演算を実現できなかった。
(発明の目的)
本発明の目的は、上述したSIMD型アクセラレータにおいてレジスタ・リネーミングによる性能向上が困難であるという課題を解決するプロセッサ、プロセッサの制御方法及び情報処理装置を提供することにある。
本発明によるプロセッサは、SIMD型アクセラレータを有するプロセッサであって、演算手段と、演算手段にクロスバースイッチを介して接続するレジスタファイルと、演算手段の演算結果を格納し、クロスバースイッチを介して演算結果をレジスタファイルに書き戻すと共に、クロスバースイッチをバイパスするパスを介して演算手段に格納データを出力するリネーミングレジスタファイルを含み、レジスタファイルの複数のエントリを、リネーミングレジスタファイルの1つのエントリに同時に割り当て可能とした。
本発明によるプロセッサの制御方法は、SIMD型アクセラレータを有するプロセッサの制御方法であって、レジスタファイルからクロスバースイッチを介して演算手段に対してデータを提供し、演算手段に接続するリネーミングレジスタファイルに、演算手段の演算結果を格納し、リネーミングレジスタファイルからクロスバースイッチを介して演算結果をレジスタファイルに書き戻すと共に、クロスバースイッチをバイパスするパスを介して演算手段に格納データを出力すると共に、レジスタファイルの複数のエントリを、リネーミングレジスタファイルの1つのエントリに同時に割り当て可能とする。
本発明による情報処理装置は、SIMD型アクセラレータを有するプロセッサを備える情報処理装置であって、プロセッサが、演算手段と、演算手段にクロスバースイッチを介して接続するレジスタファイルと、演算手段の演算結果を格納し、クロスバースイッチを介して演算結果をレジスタファイルに書き戻すと共に、クロスバースイッチをバイパスするパスを介して演算手段に格納データを出力するリネーミングレジスタファイルを備え、レジスタファイルの複数のエントリを、リネーミングレジスタファイルの1つのエントリに同時に割り当て可能とした。
本発明によれば、アーキテクチャレジスタに比べて小容量なリネーミングレジスタに対して、複数のSIMD命令を割り当てることが出来るため、少ない資源でリネーミングによる性能の向上を実現することができる。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
(第1の実施の形態の構成)
図1は、本発明の第1の実施の形態によるベクトルプロセッサの構成を示すブロック図である。本実施の形態によるベクトルプロセッサは、SIMD(Single Instruction/Multiple Data)型アクセラレータを有するベクトルプロセッサ(中央演算処理装置)において、依存制約を緩和してテンポラリーレジスタであるSIMDリネーミングレジスタの管理を効率よく行うレジスタ・リネーミング方法を実現したこと特徴としている。
図1において、第1の実施の形態によるベクトルプロセッサは、SIMDレジスタファイル101(ベクトルレジスタファイル)と、演算器102(ベクトル向け演算器)と、リネーミングレジスタファイル103と、クロスバースイッチ104(オンチップネットワーク)、セレクタ105を含む。
リネーミングレジスタファイル103は、SIMDレジスタファイル101に書き込まれる予定の仕掛中のデータを保持することが可能である。SIMD演算結果をテンポラリーレジスタであるリネーミングレジスタファイル103に保存してSIMDレジスタファイル102に書き込まない期間を設けることによって、投機実行をサポートすることが可能となる。
図2に示すように、リネーミングレジスタファイル103にはSIMDレジスタファイル101の複数の論理レジスタを割り当てることができる。
リネーミングレジスタファイル103の1つのリネーミングレジスタをSIMDレジスタファイル101の複数のレジスタ(エントリ)と関連付けることにより、余計な資源を導入することなくアウトオブオーダー実行の可能性を大きくすることができる。
このように、本実施の形態では、大規模なSIMD型アクセラレータ向けのベクトルレジスタファイルであるSIMDレジスタファイル101を少ない物理レジスタであるリネーミングレジスタファイル103に対して割り当てる方式を実現ししているので、SIMDアクセラレータにおける効率的な演算を実現することができる。
SIMDレジスタファイル101は、演算器102に対してデータを供給する機能を有している。SIMDレジスタファイル101には、例えば、少ポート大容量のRAMが用いられており、この実施の形態では、複数のSIMDレジスタファイル101をバンクインタリーブ化することにより階層化し、擬似的に多ポートRAMとして機能するように構成している。
演算器202は、2入力1出力を有する演算器で実現されている。SIMDレジスタファイル101と演算器102は、クロスバースイッチ104を介して互いに接続されている。
演算器102の演算結果である出力データは、リネーミングレジスタファイル103に出力される。
リネーミングレジスタファイル103は、演算器102からの出力データを全て受け取って格納する。リネーミングレジスタファイル103への書き込みはライトスルー制御され、書き込まれたデータがSIMDレジスタファイル101に書き戻される。
また、リネーミングレジスタファイル103へ書き込まれたデータは、演算器102に対して供給することが可能である。
リネーミングレジスタファイル103から演算器102に対するパスにはクロスバースイッチ104が介在しないため、演算器102に対して高速にデータを供給することができる。
SIMDレジスタファイル101とリネーミングレジスタファイル103から同時にデータを読み出し、演算器102の直前でセレクタ105によって読み出したデータをセレクトし、演算器102に供給する。
図1の本実施の形態によるベクトルプロセッサにおいて、SIMDレジスタファイル101からのデータは、可変のベクトル長(1、2、4、8、16ワード等)で読み出される。
リネーミングレジスタファイル103のリネーミングレジスタ(エントリ)には、SIMDレジスタファイルの1部を上記のベクトル長(1、2、4、8、16ワード等)単位でアサインする。
リネーミングレジスタファイル103の内容は、そのデータが保証された際にSIMDレジスタファイル101に対して書き戻される。もしも、分岐予測の失敗などにより演算の実行がキャンセルされた場合にはリネーミングレジスタファイル103の内容を破棄する。
リネーミングレジスタファイル103の内容は、SIMDレジスタファイル101への書き戻しを実施するまで、上書きされないことを命令発行制御で保証する。
リネーミングレジスタファイル103の内容は、SIMDレジスタファイル101に書き戻す前でも次の演算のオペランドとして利用することが可能である。
リネーミングレジスタファイル103の内容とSIMDレジスタファイル101の内容をセレクタ105で選択することで、SIMD演算でのマスク機能を効率的にサポートすることができる。
リネーミングレジスタファイル103の管理は、図3に示すようなリネーム表を用いることにより実施される。
リネーム表は、リネーム先401とベクトル長402の欄を有しており、そのSIMDレジスタファイル101がリネーミングレジスタファイル103のどのエントリにアサインされているかを記憶している。リネーミング後の結果は、リネーミングレジスタの先頭のアドレスとなる(詳細は動作において説明する)
命令発行制御部106は、演算器102による演算の実施指示を発行する機能を有し、データパス制御部107は、クロスバースイッチ104によるパスを制御する機能を有する。
(第1の実施の形態の動作)
次に、上記のように構成される第1の実施の形態によるベクトルプロセッサにおけるリネーミング制御の動作について、図4を参照して説明する。
図4では、命令501(VR0←VR1+VR3(マスク有り))と命令502(VR4←VR0+VR2)を実施した際のリネーム表の変化を示している。
プロセッサ(SIMD型アクセラレータ)が命令を読み出すと、図3に示したリネーム表の内容からSIMDレジスタファイル101のリネーミングを実施する。
命令501では、レジスタVR1についてリネーム表に有効なレジスタが登録されているので、リネーミングレジスタファイル103のエントリP2にリネーミングされる。レジスタVR3は登録されていないので、SIMDレジスタファイル101から読み出すようにリネーミングされる(図4で該当なし)。書き込み先(出力先)は、レジスタVR0がレジスタP0に有効なリネーミングデータを保持しているため、そのレジスタP0にリネーミングされる。この場合、マスク付き演算であるので「マスク有り」の情報がリネーム表(P0)に併記される。
命令502では、上記の命令のリネーミング結果を反映した内容によってリネーミングされる。レジスタVR0はマスク付き演算であるので、下敷きデータを読み出すため、SIMDレジスタファイル101のレジスタVR0とリネーミングレジスタファイル103のリネーミングレジスタP0の両方から平行して読み出すように指示される。また、書き込み先は、空きレジスタが存在しないため、レジスタP4をリプレースする。この際、もともとレジスタP4を利用していたレジスタVR2は以降ではリネーム対象から除外される。
上記リネーミングはインオーダーで実施される。
この際に、利用するレジスタファイルのベクトル長からその命令の利用するリネーミングレジスタファイル103のリネーミングレジスタの中の利用する部分のビットマップを取得し、依存解決に利用する。
また、既にSIMDレジスタファイル101のレジスタがアサインされているリネーミングレジスタが存在する場合には、そのレジスタを優先的に割り付ける。また、読み出された命令がマスク付き演算であった場合にはその情報を併記しておく。
次に、図5を参照して本実施の形態のプロセッサの命令発行制御部106による命令発行制御の動作について説明する。
命令発行制御部106は、リネーミングされた命令について、利用するリネーミングレジスタファイル103のレジスタのビットマップとSIMDレジスタファイル101のレジスタのビットマップをセットにして、書き込みから読み出し(RAW)への依存関係と、読み出しから書き込み(WAR)への依存関係と、書き込みから書き込み(WAW)への依存関係を抽出する。そして、依存関係を命令間の関係としてRAW依存の依存関係表と、WAR依存の依存関係表と、WAW依存の依存関係表とを作成する(図5)。
図5に依存関係表示の例を示す。依存関係表においては、1行に1命令ずつ挿入される。各行はそれぞれ命令間のRAW、WAR、WAWの依存関係を示す情報を保持している。
図5に示す依存関係表中で「1」が設定されている場合、その行の命令が、その列の命令に依存していることを示している。例えば、図5において、命令4は命令1に対してRAW依存を持ち、命令3に対してWAR依存を持ち、命令1、2、3へのWAW依存を持つことが示されている。依存の解決は各行が全て「0」になったときに完了する。
各演算命令は、発行される際にリネーミングレジスタファイル103のレジスタの依存関係の解決をするため、自命令の書きこむリネーミングレジスタのビットマップをブロードキャストする。
この命令に対して依存関係を有する命令は、ブロードキャストされた信号を取得して、発行済み命令への依存関係を解決して発行可否の情報をアップデートする。各演算命令はリネーミングレジスタに値が書きこまれた後に、書き込み可能であればSIMDレジスタファイル101のレジスタに対して書き戻しを実施する。この際にも、各種依存関係の解決を実施する。
レジスタの依存関係が解決した命令は演算器102へのアサインをした後に発行される。
次に、図1のプロセッサによる命令実行制御について説明する。
発行された命令は、リネーミング時に指定されたSIMDレジスタファイル101とリネーミングレジスタファイル103に対してアクセスを実施する。
このとき、リネーミングレジスタファイル103から読み出す値がマスク演算で書かれていた場合には、両方のレジスタからデータを読み出す。
読み出されたデータはタイミングを合わせて演算器102に入力され、演算器102からの出力結果は全てリネーミングレジスタファイル103に書き込まれる。
リネーミングレジスタファイル103に書き込まれた出力結果のデータは、書き込みの依存解析を実施した後にSIMDレジスタファイル101に対して書き戻しされる。
(第1の実施の形態による効果)
第1の実施の形態の効果について以下に説明する。
第1に、SIMDレジスタファイル101に比べて小容量なリネーミングレジスタファイル103に対して、複数のSIMD命令を割り当てることができるため、少ない資源でリネーミングの実現による性能の向上が得られる。
第2に、上記手法により、自然にデータの時間的局所性を利用したデータパスを構成することができる。
第3に、SIMD型アクセラレータの特徴であるマスク演算をサポートし、余計な資源を使うことなくマスク演算のためのリネーミングを実現することができる。
以上好ましい実施の形態と実施例をあげて本発明を説明したが、本発明は必ずしも、上記実施の形態及び実施例に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。
例えば、図1に示したリネーミングレジスタファイル103を、SIMDレジスタファイル101よりも小規模のRAMで構成することが可能である。このように、小容量RAMでリネーミングレジスタファイル103を構成すれば、リネーミングレジスタファイル103を多ポート化することで、大容量のSIMDレジスタファイル101のポート数を減らすことができるため、演算の平均のレイテンシを短縮できるという効果が得られる。
また、上記実施の形態では、SIMD型アクセラレータを有するベクトルプロセッサについて説明したが、スカラープロセッサが採用するSIMD演算器のためのレジスタファイルとリネーミングレジスタファイルについて本発明を適用することが可能である。さらに、ベクトルプロセッサ又はスカラープロセッサを備える情報処理装置についても本発明による技術を適用することが可能である。
本発明の第1の実施の形態によるベクトルプロセッサの構成を示すブロック図である。 第1の実施の形態によるベクトルプロセッサにおけるレジスタ・リネーミングを説明する概念図である。 リネーミングレジスタファイルの管理に用いるリネーム表の構成例を示す図である。 第1の実施の形態によるベクトルプロセッサにおけるリネーミング制御の動作を説明する図である。 第1の実施の形態によるプロセッサにおける命令発行制御の動作を説明する図である。 関連技術によるSIMD型アクセラレータを有するプロセッサにおけるレジスタ・リネーミングを説明する概念図である。
符号の説明
101:SIMDレジスタファイル
102:演算器
103:リネーミングレジスタファイル103
104:クロスバースイッチ
105:セレクタ

Claims (18)

  1. SIMD型アクセラレータを有するプロセッサであって、
    演算手段と、
    前記演算手段にクロスバースイッチを介して接続するレジスタファイルと、
    前記演算手段の演算結果を格納し、前記クロスバースイッチを介して前記演算結果を前記レジスタファイルに書き戻すと共に、前記クロスバースイッチをバイパスするパスを介して前記演算手段に格納データを出力するリネーミングレジスタファイルを備え、
    前記レジスタファイルの複数のエントリを、前記リネーミングレジスタファイルの1つのエントリに同時に割り当て可能としたことを特徴とするプロセッサ。
  2. 前記リネーミングレジスタファイルの内容は、当該内容の書き込みが保証された際に前記レジスタファイルに対して書き戻されることを特徴とする請求項1に記載のプロセッサ。
  3. 前記リネーミングレジスタファイルの内容は、前記レジスタファイルへの書き戻しを実施するまで、上書きされないように命令発行を制御して保証することを特徴とする請求項2に記載のプロセッサ。
  4. 複数の命令が前記リネーミングレジスタファイルの単一のエントリを利用している場合、命令発行制御で前記リネーミングレジスタ上にあるデータの内容を保証するべきか否かを判断して命令の発行制御を行うことを特徴とする請求項1から請求項3の何れかに記載のプロセッサ。
  5. 前記演算手段が、ベクトル向け演算器であり、前記レジスタファイルが、ベクトルレジスタファイルであることを特徴とする請求項1から請求項4の何れかに記載のプロセッサ。
  6. 前記演算手段の直前に、前記レジスタファイルと前記リネーミングレジスタファイルからのデータを選択して前記演算手段に入力するセレクタを備えることを特徴とする請求項1から請求項5の何れかに記載のプロセッサ。
  7. 前記リネーミングレジスタファイルを、前記レジスタファイルよりも小規模のRAMで構成したことを特徴とする請求項1から請求項6の何れかに記載のプロセッサ。
  8. SIMD型アクセラレータを有するプロセッサの制御方法であって、
    レジスタファイルからクロスバースイッチを介して演算手段に対してデータを提供し、
    前記演算手段に接続するリネーミングレジスタファイルに、前記演算手段の演算結果を格納し、
    前記リネーミングレジスタファイルから前記クロスバースイッチを介して前記演算結果を前記レジスタファイルに書き戻すと共に、前記クロスバースイッチをバイパスするパスを介して前記演算手段に格納データを出力すると共に、
    前記レジスタファイルの複数のエントリを、前記リネーミングレジスタファイルの1つのエントリに同時に割り当て可能とすることを特徴とするプロセッサの制御方法。
  9. 前記リネーミングレジスタファイルに内容を、当該内容の書き込みが保証された際に前記レジスタファイルに対して書き戻すことを特徴とする請求項8に記載のプロセッサの制御方法。
  10. 前記リネーミングレジスタファイルの内容を、前記レジスタファイルへの書き戻しを実施するまで、上書きされないように命令発行を制御して保証することを特徴とする請求項9に記載のプロセッサの制御方法。
  11. 複数の命令が前記リネーミングレジスタファイルの単一のエントリを利用している場合、命令発行制御で前記リネーミングレジスタ上にあるデータの内容を保証するべきか否かを判断して命令の発行を制御することを特徴とする請求項8から請求項10の何れかに記載のプロセッサの制御方法。
  12. 前記演算手段が、ベクトル向け演算器であり、前記レジスタファイルが、ベクトルレジスタファイルであることを特徴とする請求項8から請求項11の何れかに記載のプロセッサの制御方法。
  13. 前記演算手段の直前に備えるセレクタによって、前記レジスタファイルと前記リネーミングレジスタファイルからのデータを選択して前記演算手段に入力することを特徴とする請求項8から請求項12の何れかに記載のプロセッサの制御方法。
  14. 前記リネーミングレジスタファイルを、前記レジスタファイルよりも小規模のRAMで構成したことを特徴とする請求項8から請求項13の何れかに記載のプロセッサの制御方法。
  15. SIMD型アクセラレータを有するプロセッサを備える情報処理装置であって、
    前記プロセッサが、
    演算手段と、
    前記演算手段にクロスバースイッチを介して接続するレジスタファイルと、
    前記演算手段の演算結果を格納し、前記クロスバースイッチを介して前記演算結果を前記レジスタファイルに書き戻すと共に、前記クロスバースイッチをバイパスするパスを介して前記演算手段に格納データを出力するリネーミングレジスタファイルを備え、
    前記レジスタファイルの複数のエントリを、前記リネーミングレジスタファイルの1つのエントリに同時に割り当て可能としたことを特徴とする情報処理装置。
  16. 前記リネーミングレジスタファイルの内容は、当該内容の書き込みが保証された際に前記レジスタファイルに対して書き戻されることを特徴とする請求項15に記載の情報処理装置。
  17. 前記リネーミングレジスタファイルの内容は、前記レジスタファイルへの書き戻しを実施するまで、上書きされないように命令発行を制御して保証することを特徴とする請求項16に記載の情報処理装置。
  18. 複数の命令が前記リネーミングレジスタファイルの単一のエントリを利用している場合、命令発行制御で前記リネーミングレジスタ上にあるデータの内容を保証するべきか否かを判断して命令の発行制御を行うことを特徴とする請求項15から請求項17の何れかに記載の情報処理装置。
JP2008243823A 2008-09-24 2008-09-24 プロセッサ、プロセッサの制御方法及び情報処理装置 Expired - Fee Related JP4868255B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008243823A JP4868255B2 (ja) 2008-09-24 2008-09-24 プロセッサ、プロセッサの制御方法及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008243823A JP4868255B2 (ja) 2008-09-24 2008-09-24 プロセッサ、プロセッサの制御方法及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2010079362A true JP2010079362A (ja) 2010-04-08
JP4868255B2 JP4868255B2 (ja) 2012-02-01

Family

ID=42209775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008243823A Expired - Fee Related JP4868255B2 (ja) 2008-09-24 2008-09-24 プロセッサ、プロセッサの制御方法及び情報処理装置

Country Status (1)

Country Link
JP (1) JP4868255B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035530A1 (en) * 2009-08-10 2011-02-10 Fujitsu Limited Network system, information processing apparatus, and control method for network system
JP2012083937A (ja) * 2010-10-12 2012-04-26 Nec Corp プロセッサ及びベクトルロード命令の実行方法
KR20180015176A (ko) * 2015-07-07 2018-02-12 삼성전자주식회사 신호 처리 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268168A (ja) * 2005-03-22 2006-10-05 Nec Computertechno Ltd ベクトル命令管理回路、ベクトル処理装置、ベクトル命令管理方法、ベクトル処理方法、ベクトル命令管理プログラム、および、ベクトル処理プログラム
WO2006126449A1 (ja) * 2005-05-26 2006-11-30 Nec Corporation 情報処理装置および命令実行方法
JP2008083947A (ja) * 2006-09-27 2008-04-10 Nec Computertechno Ltd 情報処理装置、記憶領域制御方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268168A (ja) * 2005-03-22 2006-10-05 Nec Computertechno Ltd ベクトル命令管理回路、ベクトル処理装置、ベクトル命令管理方法、ベクトル処理方法、ベクトル命令管理プログラム、および、ベクトル処理プログラム
WO2006126449A1 (ja) * 2005-05-26 2006-11-30 Nec Corporation 情報処理装置および命令実行方法
JP2008083947A (ja) * 2006-09-27 2008-04-10 Nec Computertechno Ltd 情報処理装置、記憶領域制御方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035530A1 (en) * 2009-08-10 2011-02-10 Fujitsu Limited Network system, information processing apparatus, and control method for network system
US8589614B2 (en) * 2009-08-10 2013-11-19 Fujitsu Limited Network system with crossbar switch and bypass route directly coupling crossbar interfaces
JP2012083937A (ja) * 2010-10-12 2012-04-26 Nec Corp プロセッサ及びベクトルロード命令の実行方法
US8850167B2 (en) 2010-10-12 2014-09-30 Nec Corporation Loading/discarding acquired data for vector load instruction upon determination of prediction success of multiple preceding branch instructions
KR20180015176A (ko) * 2015-07-07 2018-02-12 삼성전자주식회사 신호 처리 장치 및 방법
KR102001222B1 (ko) 2015-07-07 2019-07-17 삼성전자주식회사 신호 처리 장치 및 방법
US10956154B2 (en) 2015-07-07 2021-03-23 Samsung Electronics Co., Ltd. Signal processing device and method

Also Published As

Publication number Publication date
JP4868255B2 (ja) 2012-02-01

Similar Documents

Publication Publication Date Title
JP6628801B2 (ja) プロセッサ・コアのための実行ユニット回路、プロセッサ・コア、およびプロセッサ・コア内のプログラム命令を実行する方法
US9830156B2 (en) Temporal SIMT execution optimization through elimination of redundant operations
US9798548B2 (en) Methods and apparatus for scheduling instructions using pre-decode data
CN108376097B (zh) 用于通过使用由可分割引擎实例化的虚拟核来支持代码块执行的寄存器文件段
CN108108188B (zh) 用于通过使用由可分区引擎实例化的虚拟核来支持代码块执行的存储器片段
TWI490782B (zh) 來源運算元收集器快取的方法和裝置
US8751771B2 (en) Efficient implementation of arrays of structures on SIMT and SIMD architectures
JP2016528641A5 (ja)
KR101594502B1 (ko) 바이패스 멀티플 인스턴스화 테이블을 갖는 이동 제거 시스템 및 방법
US9213677B2 (en) Reconfigurable processor architecture
US9069664B2 (en) Unified streaming multiprocessor memory
KR20180021812A (ko) 연속하는 블록을 병렬 실행하는 블록 기반의 아키텍쳐
KR102524565B1 (ko) 로드 스토어 유닛들을 바이패싱하여 스토어 및 로드 추적
JP2018501563A (ja) プロセッサ・コア内で使用するための実行スライス回路、プロセッサ・コア、およびプロセッサ・コアによりプログラム命令を実行する方法
US20130166882A1 (en) Methods and apparatus for scheduling instructions without instruction decode
KR20160031503A (ko) 마이크로프로세서에서의 선택적 리네이밍을 위한 방법 및 장치
US9886278B2 (en) Computing architecture and method for processing data
JP4868255B2 (ja) プロセッサ、プロセッサの制御方法及び情報処理装置
US20150082007A1 (en) Register mapping with multiple instruction sets
US7315935B1 (en) Apparatus and method for port arbitration in a register file on the basis of functional unit issue slots
TWI613589B (zh) 處理器流水線中的靈活的指令執行
US9690600B2 (en) Reconfigurable processor and method of operating the same
US11321088B2 (en) Tracking load and store instructions and addresses in an out-of-order processor
JP7325437B2 (ja) リソースインデックス置換を実施するデバイス及びプロセッサ
JP2007334819A (ja) ベクトルリネーミング方式およびベクトル型計算機

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111020

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111102

R150 Certificate of patent or registration of utility model

Ref document number: 4868255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees