JP5710833B2 - レジスタファイル間におけるデータ伝送の実現方法及び実現装置 - Google Patents

レジスタファイル間におけるデータ伝送の実現方法及び実現装置 Download PDF

Info

Publication number
JP5710833B2
JP5710833B2 JP2014502973A JP2014502973A JP5710833B2 JP 5710833 B2 JP5710833 B2 JP 5710833B2 JP 2014502973 A JP2014502973 A JP 2014502973A JP 2014502973 A JP2014502973 A JP 2014502973A JP 5710833 B2 JP5710833 B2 JP 5710833B2
Authority
JP
Japan
Prior art keywords
data
instruction pipeline
phase
register file
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014502973A
Other languages
English (en)
Other versions
JP2014513343A (ja
Inventor
リフアン リ
リフアン リ
フイ レン
フイ レン
チュンユ ティエン
チュンユ ティエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2014513343A publication Critical patent/JP2014513343A/ja
Application granted granted Critical
Publication of JP5710833B2 publication Critical patent/JP5710833B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30076Arrangements for executing specific machine instructions to perform miscellaneous control operations, e.g. NOP
    • G06F9/30079Pipeline control instructions, e.g. multicycle NOP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30032Movement instructions, e.g. MOVE, SHIFT, ROTATE, SHUFFLE
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30098Register arrangements
    • G06F9/3012Organisation of register space, e.g. banked or distributed register file
    • G06F9/3013Organisation of register space, e.g. banked or distributed register file according to data content, e.g. floating-point registers, address registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3867Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Executing Machine-Instructions (AREA)
  • Advance Control (AREA)
  • Information Transfer Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データ伝送技術に関し、特にレジスタファイル間におけるデータ伝送の実現方法及び実現装置に関する。
大抵のプロセッサは、パイプラインアーキテクチャを採用している。パイプラインでは、各フェイズにいくつかの固定的な動作があり、例えば、あるレジスタファイルからデータを読み取って演算したり、演算結果をレジスタファイルに書き戻したりする処理が実行される。プロセッサ内には、複数のレジスタファイルが存在する場合もある。
従来の集積回路(IC:integrated circuit)設計では、レジスタファイル間のデータ伝送は、通常、データバスを介して実現される。データは、ソースレジスタファイルから読み出されて、関連する制御ロジックにより、データバスを介してターゲットレジスタファイルに書き込まれる。例えば、あるプロセッサは、データをパイプラインのフェイズi目にレジスタファイルAから読み出し、命令パイプラインにおけるJフェイズの遅延の後、パイプラインのフェイズ(i+j)目にレジスタファイルBに書き戻す必要がある。
データ伝送プロセスにおいて、データバスを介する方式では、レジスタを増加してデータと制御信号を一時的に記憶する必要があり、これにより資源の消費量が増加してしまう。
これに鑑みて、本発明の主要な目的は、ロジックの消費量を減少しつつ、リソースの利用率を向上させることができる、レジスタファイル間におけるデータ伝送の実現方法及び実現装置を提供することにある。
前記目的を達成するために、本発明の技術的スキームは、以下のように実現される。
レジスタファイル間におけるデータ伝送の実現方法は、
命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取るステップと、
アイドル命令パイプラインを利用して、読み取られたデータをターゲットレジスタファイルに伝送するステップとを含む。
命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取る前記ステップは、
前記読み取られたデータを一時レジスタxに書き込み、予め設定されたマスクを一時レジスタyに書き込むことを含む。
アイドル命令パイプラインを利用して、読み取られたデータをターゲットレジスタファイルに伝送する前記ステップは、
フェイズ(i+1)目に、前記一時レジスタy及び前記一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)に書き込み、
データをアイドル命令パイプラインに沿って徐々に流動させて次のステージに伝送し、
j個のクロック周期が経過した後、フェイズ(i+j)目に、アイドル命令パイプラインからデータをターゲットレジスタファイルに取り込むことを含む。
フェイズ(i+j)目に、アイドル命令パイプラインからデータをターゲットレジスタファイルに取り込む前記ステップは、
前記{y,x}のx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込み、前記{y,x}のy部分をマスクとし、
一時レジスタjにおける、マスクの有効ビットに対応するセクションにおけるデータユニットを、前記ターゲットレジスタファイルの対応セクションに書き込むことを含む。
前記ソースレジスタファイルは32ビットであり、前記ターゲットレジスタファイルは1024ビットであり、前記nは32である。
前記アイドル命令パイプラインは64ビットの命令パイプラインである。
レジスタファイル間におけるデータ伝送の実現装置は、
命令パイプラインのフェイズi目にその中のデータを読み取り、アイドル命令パイプラインを利用して、読み取られたデータをターゲット記憶ユニットに伝送することに用いられるソース記憶ユニットと、
j個のクロック周期が経過した後、フェイズ(i+j)目に、アイドル命令パイプラインからデータを読み取ることに用いられるターゲット記憶ユニットとを備える。
前記ソース記憶ユニットはソースレジスタファイルであり、前記ターゲット記憶ユニットはターゲットレジスタファイルである。
前記ソース記憶ユニットは、フェイズ(i+1)目に、前記一時レジスタy及び前記一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)に書き込み、
データをアイドル命令パイプラインに沿って徐々に流動させて次のフェイズに伝送し、j個のクロック周期が経過した後、フェイズ(i+j)目に、アイドル命令パイプラインからデータをターゲットレジスタファイルに取り込むことに用いられる。
前記ターゲット記憶ユニットは、j個のクロック周期が経過した後、前記{y,x}のx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込み、前記{y,x}のy部分をマスクとし、
一時レジスタjにおける、マスクの有効ビットに対応するセクションにおけるデータユニットを、前記ターゲットレジスタファイルの対応セクションに書き込むことに用いられる。
前記ソースレジストファイルは32ビットであり、前記ターゲットレジスタファイルは1024ビットであり、前記nは32である。
前記アイドル命令パイプラインは64ビットの命令パイプラインである。
上記の本発明に係る技術的スキームから理解されるように、本発明は、パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取り、アイドル命令パイプラインを利用して、読み取られたデータをターゲットレジスタファイルに伝送することを含む。本発明のスキームは、データ及び制御情報を一時的に記憶するための余計なレジスタを増加させずに、アイドル命令パイプラインを利用してデータ及びマスク情報を伝送する。これにより、ロジックの消費量を減少しつつ、既存の機能ユニットの利用率を向上させることができる。
本発明のスキームは、プロセッサに複数本の命令パイプラインがあり、データが命令パイプラインのフェイズi目にソースレジスタファイルから読み出され、フェイズjのクロック遅延を経て、最終的にデータがターゲットレジスタファイルに書き込まれる場合のプロセッサ設計に応用される。
本発明に係るレジスタファイル間におけるデータ伝送の実現方法のフローチャートである。 本発明に係るレジスタファイル間におけるデータ伝送の実現方法に係る実施形態における伝送を示す図である。 本発明に係るレジスタファイル間におけるデータ伝送の実現装置の構成を示す図である。
図1は、本発明に係るレジスタファイル間におけるデータ伝送の実現方法のフローチャートである。図1に示すように、この方法は、以下のステップを含む。
ステップ100:命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取る。
本ステップは、具体的に、読み出されたデータを一時レジスタxに書き込み、予め設定されたマスクを一時レジスタyに書き込むことを含む。マスクの利用については、当業者の慣用技術手段に属する。例えば、16ビット(bit)のデータを64ビットのレジスタに書き込む場合、データの4つのコピーを使用して64ビットのデータを構成し、その後、1つの4ビットのマスクを利用する。即ち値が1(高い)であるマスクビット対応する、64ビットデータのセクションにおけるコピーをレジスタに書き込むことができる。これについては、ここでは詳細な説明は省略する。
ステップ101:アイドル命令パイプラインを利用して、読み取られたデータをターゲットレジスタファイルに伝送する。
本ステップにおいて、フェイズ(i+1)目に、一時レジスタy及び一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)に書き込み、その後、データをアイドル命令パイプラインに沿って徐々に流動させて次のフェイズに伝送する。本発明の方法において、アイドル命令パイプラインがデータバスとして機能する。j個のクロック周期が経過した後、フェイズ(i+j)目にアイドル命令パイプラインからデータを取り込む。一時的に記憶されたx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込む。y部分をマスクとして、一時レジスタjにおける、マスクの有効ビット(値が1であるビット)に対応するセクションにおけるデータユニットを、指向性ターゲットレジスタファイルの対応セクションに書き込む。対応して、ターゲットレジスタファイルにおける、マスクの無効ビットに対応するセクションにおけるデータを変更せずに維持する。
ここで、nは、ターゲットレジスタファイルのサイズとソースレジスタファイルのサイズの比、即ち倍数である。例えばソースレジスタファイルが32ビットであり、ターゲットレジスタファイルが1024ビットである場合、n=32となる。
本発明の方法は、データ及び制御情報を一時的に記憶するための余計なレジスタを増加させずに、アイドル命令パイプラインを利用してデータとマスク情報を伝送する。これにより、ロジックの消費量を減少しつつ、既存の機能ユニットの利用率を向上させることができる。
以下、実施形態を参照しながら本発明の方法を詳細に説明する。
本実施形態において、レジスタファイルA、レジスタファイルBという2つのレジスタファイルがあると仮定し、ここで、レジスタファイルAでのレジスタペアは1つのユニットのデータを記憶することができ、レジスタファイルBでのレジスタペアはn個のユニットのデータを記憶することができる。本実施形態において、レジスタファイルAが32ビットであり、レジスタファイルBが1024ビットであり、n=32であると仮定する。システムにおいては、32ビットの命令パイプラインと64ビットの命令パイプラインという2本の命令パイプラインが存在する。
本実施形態において、レジスタファイルAにおけるデータをレジスタファイルBに伝送することが要求される。即ち、レジスタファイルAにおけるデータをパイプラインのフェイズi目に読み出し、jフェイズのクロック遅延が経過した後、フェイズ(i+j)目にレジスタファイルBに書き込むことが要求される。図2は、本発明に係るレジスタファイル間におけるデータ伝送の実現方法に係る実施形態における伝送を示す図である。図2に示すように、この方法は、具体的に以下のように実現される。
データ伝送命令が有効である場合、フェイズi目に、レジスタファイルAから読み出されたソースデータを一時レジスタxに書き込み、読み出されたマスクを一時レジスタyに書き込む。フェイズi+1目に、一時レジスタy及び一時レジスタxのデータを{y,x}に結合してアイドルの64ビットの命令パイプラインに書き込む。この場合、64ビットの命令パイプラインがデータバスとして機能する。j個のクロック遅延が経過した後、フェイズ(i+j)に、64ビットの命令パイプラインからデータ{y,x}を取り込み、その中のxドメイン部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍(32倍)である拡張データを取得し、拡張データを一時レジスタjに書き込む。64ビットの命令パイプラインからデータ{y,x}内のyドメイン部分をマスク信号として取り込む。本実施形態において、一時レジスタjにおける、値が1(高い)であるマスクビットに対応するセクションにおけるデータユニットが、指向性レジスタファイルBのレジスタペアの対応セクションに書き込まれると仮定する。図2に示すように、このようにして、データのマスク書き込みを実現する。
図3は、本発明に係るレジスタファイル間におけるデータ伝送の実現装置の構成を示す図である。図3に示すように、この装置は、ソース記憶ユニット、ターゲット記憶ユニットを備える。
ソース記憶ユニットは、命令パイプラインのフェイズi目にその中(ソース記憶ユニットの中)のデータを読み取り、アイドル命令パイプラインを利用して、読み取られたデータをターゲット記憶ユニットに伝送することに用いられる。ソース記憶ユニットは、ソースレジスタファイルである。
ターゲット記憶ユニットは、j個のクロック周期が経過した後、フェイズ(i+j)目にアイドル命令パイプラインからデータを読み取ることに用いられる。ターゲット記憶ユニットは、ターゲットレジスタファイルである。
ソース記憶ユニットは、具体的に、フェイズ(i+1)目に、前記一時レジスタy及び一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)目に書き込む。そして、データをアイドル命令パイプラインに沿って徐々に流動させて次のフェイズに伝送し、j個のクロック周期が経過した後、フェイズ(i+j)目にアイドル命令パイプラインからデータをターゲットレジスタファイルに取り込む。
ターゲット記憶ユニットは、具体的に、j個のクロック周期が経過した後、前記{y,x}のx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込む。そして、前記{y,x}のy部分をマスクとし、一時レジスタjにおける、マスクの有効ビットに対応するセクションにおけるデータユニットを前記ターゲットレジスタファイルの対応セクションに書き込む。
ソースレジスタファイルが32ビットで、ターゲットレジスタファイルが1024ビットである場合、nの値は32である。また、アイドル命令パイプラインは64ビットの命令パイプラインである。
以上の説明は、本発明の好適な実施例に過ぎず、本発明を制限するものでではない。本分野の当業者であれば、本発明に基づく種々の変更と変化が可能である。本発明の主旨及び原則を逸脱することなく実施されたあらゆる改修、均等的置換、改良等は、すべて本発明の保護範囲以内に含まれるべきである。

Claims (4)

  1. 命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取るステップと、
    命令パイプラインのアイドルとなったフェイズを利用して、読み取られたデータをターゲットレジスタファイルに伝送するステップと
    含み、
    命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取る前記ステップは、
    前記読み取られたデータを一時レジスタxに書き込み、予め設定されたマスクを一時レジスタyに書き込むことを含み、
    命令パイプラインのアイドルとなったフェイズを利用して、読み取られたデータをターゲットレジスタファイルに伝送する前記ステップは、
    フェイズ(i+1)目に、前記一時レジスタy及び前記一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)に書き込み、
    データをアイドル命令パイプラインに沿って徐々に流動させて次のフェイズに伝送し、
    j個のクロック周期が経過した後、フェイズ(i+j)目に、アイドル命令パイプラインからデータをターゲットレジスタファイルに取り込むことを含み、
    フェイズ(i+j)目にアイドル命令パイプラインからデータをターゲットレジスタファイルに取り込む前記ステップは、
    前記{y,x}のx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込み、前記{y,x}のy部分をマスクとし、
    一時レジスタjにおける、マスクの有効ビットに対応するセクションにおけるデータユニットを、前記ターゲットレジスタファイルの対応セクションに書き込むことを含む
    ことを特徴とするレジスタファイル間におけるデータ伝送の実現方法。
  2. 前記ソースレジスタファイルは32ビットであり、前記ターゲットレジスタファイルは1024ビットであり、前記nは32であり、
    前記アイドル命令パイプラインは64ビットの命令パイプラインである
    ことを特徴とする請求項に記載のデータ伝送の実現方法。
  3. 命令パイプラインのフェイズi目にソースレジスタファイルにおけるデータを読み取ることに用いられる読取ユニットと、
    命令パイプラインのアイドルとなったフェイズを利用して、読み取られたデータをターゲットレジスタファイルに伝送することに用いられる伝送ユニットと
    を備え、
    前記読取ユニットは、前記読み取られたデータを一時レジスタxに書き込み、予め設定されたマスクを一時レジスタyに書き込むことに用いられ、
    前記伝送ユニットは、
    フェイズ(i+1)目に、一時レジスタy及び一時レジスタxのデータを{y,x}に結合し、{y,x}をアイドル命令パイプラインのフェイズ(i+1)に書き込み、
    データをアイドル命令パイプラインに沿って徐々に流動させて次のフェイズに伝送し、j個のクロック周期が経過した後、フェイズ(i+j)目に、アイドル命令パイプラインからデータをターゲットレジスタファイルに取り込み、
    前記{y,x}のx部分をデータユニットとし、n個のデータユニットのコピーを結合して、長さがデータユニットの長さのn倍である拡張データを取得し、拡張データを一時レジスタjに書き込み、前記{y,x}のy部分をマスクとし、
    一時レジスタjにおける、マスクの有効ビットに対応するセクションにおけるデータユニットを、前記ターゲットレジスタファイルの対応セクションに書き込むことに用いられる
    ことを特徴とするレジスタファイル間におけるデータ伝送の実現装置。
  4. 前記ソースレジストファイルは32ビットであり、前記ターゲットレジスタファイルは1024ビットであり、前記nは32であり、
    前記アイドル命令パイプラインは64ビットの命令パイプラインである
    ことを特徴とする請求項に記載のデータ伝送の実現装置。
JP2014502973A 2011-04-07 2011-08-22 レジスタファイル間におけるデータ伝送の実現方法及び実現装置 Expired - Fee Related JP5710833B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110086342.6 2011-04-07
CN201110086342.6A CN102736895B (zh) 2011-04-07 2011-04-07 一种实现寄存器文件间的数据传输方法及装置
PCT/CN2011/078721 WO2012136037A1 (zh) 2011-04-07 2011-08-22 一种实现寄存器文件间的数据传输方法及装置

Publications (2)

Publication Number Publication Date
JP2014513343A JP2014513343A (ja) 2014-05-29
JP5710833B2 true JP5710833B2 (ja) 2015-04-30

Family

ID=46968551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014502973A Expired - Fee Related JP5710833B2 (ja) 2011-04-07 2011-08-22 レジスタファイル間におけるデータ伝送の実現方法及び実現装置

Country Status (6)

Country Link
US (1) US9501278B2 (ja)
EP (1) EP2696280B1 (ja)
JP (1) JP5710833B2 (ja)
KR (1) KR101596423B1 (ja)
CN (1) CN102736895B (ja)
WO (1) WO2012136037A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933652A (zh) * 2017-03-16 2017-07-07 浙江大学 一种基于延迟槽补偿的dsp流水线模拟方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036768A (ja) * 1989-06-05 1991-01-14 Sharp Corp リング状階層化マルチプロセッサ
US5799163A (en) * 1997-03-04 1998-08-25 Samsung Electronics Co., Ltd. Opportunistic operand forwarding to minimize register file read ports
US6505290B1 (en) 1997-09-05 2003-01-07 Motorola, Inc. Method and apparatus for interfacing a processor to a coprocessor
AU2001226324A1 (en) * 2000-01-18 2001-07-31 Clearwater Networks, Inc. Method and apparatus for improved computer load and store operations
US6728870B1 (en) * 2000-10-06 2004-04-27 Intel Corporation Register move operations
EP1199629A1 (en) * 2000-10-17 2002-04-24 STMicroelectronics S.r.l. Processor architecture with variable-stage pipeline
US20060095723A1 (en) 2001-11-05 2006-05-04 Moyer William C Method and apparatus for interfacing a processor to a coprocessor
GB2390700B (en) * 2002-04-15 2006-03-15 Alphamosaic Ltd Narrow/wide cache
JPWO2004023291A1 (ja) * 2002-08-30 2005-12-22 株式会社ルネサステクノロジ 情報処理装置
JP2005284749A (ja) * 2004-03-30 2005-10-13 Kyushu Univ 並列処理コンピュータ
US9557994B2 (en) * 2004-07-13 2017-01-31 Arm Limited Data processing apparatus and method for performing N-way interleaving and de-interleaving operations where N is an odd plural number
US8255884B2 (en) * 2008-06-06 2012-08-28 International Business Machines Corporation Optimized scalar promotion with load and splat SIMD instructions
CN101876892B (zh) * 2010-05-20 2013-07-31 复旦大学 面向通信和多媒体应用的单指令多数据处理器电路结构

Also Published As

Publication number Publication date
JP2014513343A (ja) 2014-05-29
US9501278B2 (en) 2016-11-22
EP2696280A4 (en) 2017-01-25
CN102736895B (zh) 2015-06-10
EP2696280B1 (en) 2018-11-14
EP2696280A1 (en) 2014-02-12
CN102736895A (zh) 2012-10-17
US20140019730A1 (en) 2014-01-16
KR20130137676A (ko) 2013-12-17
WO2012136037A1 (zh) 2012-10-11
KR101596423B1 (ko) 2016-02-22

Similar Documents

Publication Publication Date Title
US10170165B2 (en) Multiple register memory access instructions, processors, methods, and systems
JP6351682B2 (ja) 装置および方法
CN108351830B (zh) 用于存储器损坏检测的硬件装置和方法
CN109062608B (zh) 用于独立数据上递归计算的向量化的读和写掩码更新指令
JP6466388B2 (ja) 方法及び装置
TWI514275B (zh) 用於以自發載入延遲與轉換至預提取來消除管線阻塞之系統及方法
JP2018502362A (ja) ノンブロッキング高性能トランザクションクレジットシステムを備えるマルチコアバスアーキテクチャ
RU2636669C2 (ru) Устройство и способ реверсирования и перестановки битов в регистре маски
TW201732589A (zh) 用於容錯及錯誤偵測之系統、方法和裝置
TW201432564A (zh) 萬用邏輯運算之方法及裝置
JP2014182796A (ja) 書き込みマスク・レジスタの末尾の最下位マスキング・ビットを判定するためのシステム、装置、および方法
US9418024B2 (en) Apparatus and method for efficient handling of critical chunks
JP5710833B2 (ja) レジスタファイル間におけるデータ伝送の実現方法及び実現装置
US20140365751A1 (en) Operand generation in at least one processing pipeline
JP6344022B2 (ja) 演算処理装置および演算処理装置の制御方法
EP4034991A1 (en) Bit width reconfiguration using a shadow-latch configured register file

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150304

R150 Certificate of patent or registration of utility model

Ref document number: 5710833

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees