JP2011096254A - 乗累算演算を実行するための装置および方法 - Google Patents
乗累算演算を実行するための装置および方法 Download PDFInfo
- Publication number
- JP2011096254A JP2011096254A JP2010242079A JP2010242079A JP2011096254A JP 2011096254 A JP2011096254 A JP 2011096254A JP 2010242079 A JP2010242079 A JP 2010242079A JP 2010242079 A JP2010242079 A JP 2010242079A JP 2011096254 A JP2011096254 A JP 2011096254A
- Authority
- JP
- Japan
- Prior art keywords
- data element
- multiply
- input
- data processing
- accumulate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009825 accumulation Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 149
- 230000004044 response Effects 0.000 claims abstract description 24
- 239000013598 vector Substances 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000005265 energy consumption Methods 0.000 abstract description 2
- 238000007792 addition Methods 0.000 description 16
- 238000013459 approach Methods 0.000 description 13
- 230000008901 benefit Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30072—Arrangements for executing specific machine instructions to perform conditional operations, e.g. using predicates or guards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30098—Register arrangements
- G06F9/30101—Special purpose registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3893—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled in tandem, e.g. multiplier-accumulator
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Complex Calculations (AREA)
- Executing Machine-Instructions (AREA)
Abstract
【解決手段】該データ処理装置は、制御信号に応答して、入力データ要素において、データ処理演算を実行するデータ処理回路を含む。命令デコーダ回路は、入力オペランドとして、第1入力データ要素、第2入力データ要素及び述語値を指定する述語化された乗累算命令に応答して、データ処理回路を制御するように制御信号を生成し、第1入力データ要素および前記第2入力データ要素を乗算し、乗算データ要素を生成し、該述語値が第1の値を有する場合、該乗算データ要素を初期累算データ要素に加算して結果累算データ要素を生成し、該述語値が第2の値を有する場合、該初期累算データ要素から該乗算データ要素を減算して、該結果累算データ要素を生成することで、乗累算演算を実行する。本発明は、パフォーマンス、エネルギー消費及びコード密度を改善する。
【選択図】図2
Description
vacc[i]=vacc[i]−va[i]*vb[i] if vp[i]=false
{
VNEW_s32L(res);
uint_t i;
for (i=0; i<n; i++) {
int_32L tmp;
if (VGET_p16(vp,i) == true) {
tmp = mlal_s16(VGET_s32L(vacc,i),VGET_s16(va,i), VGET_s16(vb,i));
} else {
tmp = mlsl_s16(VGET_s32L(vacc,i),VGET_s16(va,i), VGET_s16(vb,i));
}
VSET_s32L(res,i,tmp);
}
return res;
}
{
VNEW_s32L(res);
uint_t i;
for (i=0; i<n; i++) {
int_32L tmp;
if (VGET_p16(vp,i) == true) {
tmp = mull_s16(VGET_s16(va,i), VGET_s16(vb,i));
} else {
tmp = neg_s32(mull_s16(VGET_s16(va,i), VGET_s16(vb,i)));
}
VSET_s32L(res,i,tmp);
}
return res;
}
Multiply imaginary part result=vbR[i]*vaI[i]+vbI[i]*vaR[i]
(ここで、「R」は、実数部を示し、「I」は、虚数部を示す)。
internal_vbI[k]=0
vaccI[i]=vaccI[i]+(vbR[i]*vaI[i]+vbI[i]*vaR[i])
vaccR[i]=vaccR[i]−(vbR[i]*vaR[i]−vbI[i]*vaI[i]) if vp[i]=false
vaccI[i]=vaccI[i]−(vbR[i]*vaI[i]+vbI[i]*vaR[i]) if vp[i]=false
vaccR[i]=vaccR[i]−(vbR[i]*vaR[i]−vbI[i]*vaI[i]) if vpR[i]=false
vaccI[i]=vaccI[i]−(vbR[i]*vaI[i]+vbI[i]*vaR[i]) if vpI[i]=false
vaccR[i]=vaccR[i]+(vbR[i]*vaR[i])+(vbI[i]*vaI[i])if vpR[i]==true and vpI[i]==false
vaccR[i]=vaccR[i]−(vbR[i]*vaR[i])−(vbI[i]*vaI[i])if vpR[i]==false and vpI[i]==true
vaccI[i]=vaccI[i]+(vbR[i]*vaI[i])−(vbI[i]*vaR[i])if vpR[i]==true and vpI[i]==false
vaccI[i]=vaccI[i]−(vbR[i]*vaI[i])+(vbI[i]*vaR[i])if vpR[i]==false and vpI[i]==true
vaccI[i]=vaccI[i]−(vbR[i]*vaI[i])−(vbI[i]*vaR[i])if vpR[i]==false and vpI[i]==false
135 述語レジスタバンク
140 ベクトルレジスタバンク
160 コントローラ
210 加算器制御ブロック
215 レーン
217 乗算器回路
219 加算/減算回路
220 レーン
Claims (27)
- データ処理装置であって、
制御信号に応答して、少なくとも1つの入力データ要素において、データ処理演算を実行する、データ処理回路と、
前記データ処理回路に連結し、前記制御信号を生成するようにプログラム命令に応答する、命令デコーダ回路と、を含み、
前記命令デコーダ回路は、入力オペランドとして、第1の入力データ要素と、第2の入力データ要素と、述語値を指定する、述語化された乗累算命令に応答し、前記データ処理回路を制御するように制御信号を生成し、
前記第1の入力データ要素および前記第2の入力データ要素を乗算し、乗算データ要素を生成するステップと、
前記述語値が、第1の値を有する場合、初期累算データ要素に前記乗算データ要素を加算することによって、結果累算データ要素を生成するステップと、
前記述語値が、第2の値を有する場合、前記初期累算データ要素から前記乗算データ要素を減算することによって、前記結果累算データ要素を生成するステップと、により、乗累算演算を実行する、データ処理装置。 - 前記入力オペランドを記憶するための少なくとも1つのレジスタバンクを更に含み、前記述語化された乗累算命令は、前記述語値を含む少なくとも1つのレジスタバンクのレジスタを識別する、請求項1に記載のデータ処理装置。
- 前記データ処理回路は、N行の並行処理を提供する、SIMDデータ処理回路であり、Nは、1を超える整数であり、前記SIMDデータ処理回路は、前記制御信号に応答し、N行の並行処理の各々において、データ処理演算を並行して実行し、
前記述語化された乗累算命令は、入力オペランドとして、第1のベクトルを形成する複数の前記第1の入力データ要素を指定し、
前記命令デコーダ回路は、前記乗累算演算への入力に対して選択される前記第1のベクトルからの前記第1の入力データ要素が、該乗累算演算が実行される並行処理のレーンに依存するように、前記述語化された乗累算命令に応答して、前記データ処理回路を制御するように制御信号を生成し、前記N行の並行処理の各々において、前記乗累算演算を並行して実行する、請求項1に記載のデータ処理装置。 - 前記述語化された乗累算命令は、入力オペランドとして、第2のベクトルを形成する複数の前記第2の入力データ要素を指定し、
乗累算演算への入力に対して選択される前記第2のベクトルからの前記第2の入力データ要素は、該乗累算演算が実行される並行処理のレーンに依存する、請求項3に記載のデータ処理装置。 - 前記述語化された乗累算命令は、入力オペランドとして、スカラの第2の入力データ要素を指定し、これは、次いで、第2のベクトルを形成する前記データ処理回路内で複製され、
それによって、前記同一の第2の入力データ要素は、前記乗累算演算が実行される並行処理の各レーンにおいて使用される、請求項3に記載のデータ処理装置。 - 前記述語化された乗累算命令は、入力オペランドとして、第3のベクトルを形成する複数の前記述語値を指定し、
前記乗累算演算への入力に対して選択される前記第3のベクトルからの前記述語値は、該乗累算演算が実行される並行処理のレーンに依存する、請求項3に記載のデータ処理装置。 - 前記第3のベクトルは、前記N行の並行処理の各々内で、前記乗累算演算が独立して、乗加算または乗減算演算を実行するよう構成されるように、Nの述語値を指定する、請求項6に記載のデータ処理装置。
- 前記述語化された乗累算命令は、入力オペランドとして、前記初期累算データ要素を更に指定する、請求項1に記載のデータ処理装置。
- 前記初期累算データ要素は、既定値である、請求項1に記載のデータ処理装置。
- 前記既定値は、ゼロである、請求項9に記載のデータ処理装置。
- 前記述語化された乗累算命令は、入力オペランドとして、第4のベクトルを形成する複数の前記初期累算データ要素を指定し、
前記乗累算演算への入力に対して選択される前記第4のベクトルからの前記初期累算データ要素は、該乗累算演算が実行される並行処理のレーンに依存する、請求項3に記載のデータ処理装置。 - 前記データ処理回路は、N行の並行処理を提供する、SIMDデータ処理回路であり、Nは、1を超える整数であり、前記SIMDデータ処理回路は、前記制御信号に応答し、前記N行の並行処理の各々において、データ処理演算を並行して実行し、
前記述語化された乗累算命令は、入力オペランドとして、第1のベクトルを形成する複数の前記第1の入力データ要素を指定し、
前記命令デコーダ回路は、前記乗累算演算への入力に対して選択される前記第1のベクトルからの前記第1の入力データ要素が、該乗累算演算が実行される並行処理のレーンに依存するように、前記述語化された乗累算命令に応答して、前記データ処理回路を制御するように制御信号を生成し、前記N行の並行処理の各々において、前記乗累算演算を並行して実行し、
前記述語化された乗累算命令は、入力オペランドとして、第2のベクトルを形成する複数の前記第2の入力データ要素を指定し、
前記乗累算演算への入力に対して選択される前記第2のベクトルからの前記第2の入力データ要素は、該乗累算演算が実行される並行処理のレーンに依存し、
ここで、前記第1、第2、および第4のベクトルの各々は、N行のデータ要素を有する、請求項11に記載のデータ処理装置。 - 各第1の入力データ要素は、Xビットを含み、各第2の入力データ要素は、Yビットを含み、各初期累算データ要素は、少なくともX+Yビットの大きさである、請求項1に記載のデータ処理装置。
- X=Yである、請求項13に記載のデータ処理装置。
- 前記少なくとも1つのレジスタバンクは、前記第1および第2の入力データ要素を記憶するための入力レジスタを含む入力データ要素のレジスタバンクと、各初期累算データ要素および結果累算データ要素を記憶するための累算レジスタを有する累算レジスタバンクと、を含む、請求項2に記載のデータ処理装置。
- 前記第1の入力データ要素および前記第2の入力データ要素のうちの少なくとも1つは、実数部および虚数部を含む複素数であり、
データ処理回路によって実行される前記乗累算演算は、前記結果累算データ要素として、実数部および虚数部を有する複素数を生成する複素乗累算演算である、請求項1に記載のデータ処理装置。 - 前記第1の入力データ要素および前記第2の入力データ要素は共に、実数部および虚数部を含む複素数である、請求項16に記載のデータ処理装置。
- 前記複素乗累算演算は、前記対応する複素結果累算データ要素の実数部および虚数部を生成するために、乗算、加算、および減算演算シーケンスの実行を含む、請求項16に記載のデータ処理装置。
- 前記述語値は、複素乗累算演算の異なる部分を制御するために使用される、少なくとも2つの述語値を含む、請求項16に記載のデータ処理装置。
- 前記述語値は、前記複素結果累算データ要素の前記実数部を生成するために実行される乗累算演算に対する第1の述語値、および前記複素結果累算データ要素の前記虚数部を生成するために実行される乗累算演算に対する第2の述語値を含む、請求項19に記載のデータ処理装置。
- 前記複素結果累算データ要素の前記実数部を生成するために実行される前記乗累算演算、および前記複素結果累算データ要素の前記虚数部を生成するために実行される前記乗累算演算は共に、第1および第2の乗算演算を含み、前記述語値は、前記第1の乗算演算に対する第1の述語値、および前記第2の乗算演算に対する第2の述語値を含む、請求項19に記載のデータ処理装置。
- 前記第1の入力データ要素および前記第2の入力データ要素のうちの少なくとも1つは、浮動小数点数であり、
前記データ処理回路によって実行される前記乗累算演算は、前記結果累算データ要素として、浮動小数点数を生成する、浮動小数点乗累算演算である、請求項1に記載のデータ処理装置。 - 前記第1の入力データ要素および前記第2の入力データ要素は共に、浮動小数点数である、請求項22に記載のデータ処理装置。
- 制御信号に応答して、少なくとも1つの入力データ要素において、データ処理演算を実行するデータ処理回路と、前記データ処理回路に連結され、かつプログラム命令に応答して前記制御信号を生成する命令デコーダ回路と、を使用してデータを処理する方法であって、
制御信号を生成するために、入力オペランドとして、第1の入力データ要素、第2の入力データ要素、および述語値を指定する述語化された乗累算命令をデコードするステップと、
前記制御信号を使用して前記データ処理回路を制御し、
前記第1の入力データ要素および前記第2の入力データ要素を乗算し、乗算データ要素を生成するステップ、
前記述語値が、第1の値を有する場合、前記乗算データ要素を初期累算データ要素に加算することによって、結果累算データ要素を生成するステップ、および
前記述語値が、第2の値を有する場合、前記初期累算データ要素から前記乗算データ要素を減算することによって、前記結果累算データ要素を生成するステップにより、乗累算演算を実行するステップと、を含む、方法。 - データプロセッサ上での実行時、前記データプロセッサを制御し、請求項24に記載の方法のステップを実行する、少なくとも1つの述語化された乗累算命令を含む、コンピュータプログラム製品。
- データ処理装置の仮想機械実装であって、入力オペランドとして、第1の入力データ要素、第2の入力データ要素、および述語値を指定する述語化された乗累算命令に応答して、
前記第1の入力データ要素および前記第2の入力データ要素を乗算し、乗算データ要素を生成するステップと、
前記述語値が、第1の値を有する場合、前記乗算データ要素を初期累算データ要素に加算することによって、結果累算データ要素を生成するステップと、
前記述語値が、第2の値を有する場合、前記初期累算データ要素から前記乗算データ要素を減算することによって、前記結果累算データ要素を生成するステップと、により、乗累算演算を実行する、仮想機械実装。 - データ処理装置であって、
制御信号に応答して、少なくとも1つの入力データ要素において、データ処理演算を実行するためのデータ処理手段と、
前記データ処理手段に連結され、プログラム命令に応答して、前記制御信号を生成するための命令デコーダ手段と、を含み、
前記命令デコーダ手段は、入力オペランドとして、第1の入力データ要素、第2の入力データ要素、および述語値を指定する述語化された乗累算命令に応答して、
前記第1の入力データ要素および前記第2の入力データ要素を乗算し、乗算データ要素を生成するステップ、
前記述語値が、第1の値を有する場合、前記乗算データ要素を初期累算データ要素に加算することによって、結果累算データ要素を生成するステップ、および
前記述語値が、第2の値を有する場合、前記初期累算データ要素から前記乗算データ要素を減算することによって、前記結果累算データ要素を生成するステップにより、乗累算演算を実行するために前記データ処理手段を制御する、制御信号を生成する、データ処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0919120.6A GB2474901B (en) | 2009-10-30 | 2009-10-30 | Apparatus and method for performing multiply-accumulate operations |
GB0919120.6 | 2009-10-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011096254A true JP2011096254A (ja) | 2011-05-12 |
JP5647859B2 JP5647859B2 (ja) | 2015-01-07 |
Family
ID=41434978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010242079A Expired - Fee Related JP5647859B2 (ja) | 2009-10-30 | 2010-10-28 | 乗累算演算を実行するための装置および方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8595280B2 (ja) |
JP (1) | JP5647859B2 (ja) |
CN (1) | CN102053817B (ja) |
GB (1) | GB2474901B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015518610A (ja) * | 2012-04-20 | 2015-07-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | デジタルシグナルプロセッサにおける信号処理のためのシステムおよび方法 |
KR20180034471A (ko) * | 2015-07-31 | 2018-04-04 | 에이알엠 리미티드 | 벡터 피연산자 비트 크기 제어 |
JP2019526866A (ja) * | 2016-09-13 | 2019-09-19 | エイアールエム リミテッド | ベクトル積和命令 |
KR20190129240A (ko) * | 2018-05-10 | 2019-11-20 | 서울대학교산학협력단 | 행 단위 연산 뉴럴 프로세서 및 이를 이용한 데이터 처리 방법 |
JP2020508513A (ja) * | 2017-02-23 | 2020-03-19 | エイアールエム リミテッド | データ処理装置における拡大算術計算 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8831133B2 (en) * | 2011-10-27 | 2014-09-09 | Lsi Corporation | Recursive digital pre-distortion (DPD) |
CN104011664B (zh) * | 2011-12-23 | 2016-12-28 | 英特尔公司 | 使用三个标量项的超级乘加(超级madd)指令 |
CN104011665B (zh) * | 2011-12-23 | 2017-05-31 | 英特尔公司 | 超级乘加(超级madd)指令 |
US8909687B2 (en) * | 2012-01-19 | 2014-12-09 | Mediatek Singapore Pte. Ltd. | Efficient FIR filters |
US9355068B2 (en) * | 2012-06-29 | 2016-05-31 | Intel Corporation | Vector multiplication with operand base system conversion and re-conversion |
CN103268223B (zh) * | 2013-04-26 | 2016-06-29 | 深圳中微电科技有限公司 | 在编译过程中改善乘加类指令执行性能的方法 |
CN104866461B (zh) * | 2014-02-21 | 2018-03-02 | 北京国睿中数科技股份有限公司 | 用于浮点复数乘i加减的装置和方法 |
US9916130B2 (en) * | 2014-11-03 | 2018-03-13 | Arm Limited | Apparatus and method for vector processing |
US10275247B2 (en) * | 2015-03-28 | 2019-04-30 | Intel Corporation | Apparatuses and methods to accelerate vector multiplication of vector elements having matching indices |
GB2540943B (en) | 2015-07-31 | 2018-04-11 | Advanced Risc Mach Ltd | Vector arithmetic instruction |
US9733899B2 (en) * | 2015-11-12 | 2017-08-15 | Arm Limited | Lane position information for processing of vector |
CN106980600B (zh) * | 2016-01-18 | 2019-09-06 | 普天信息技术有限公司 | 一种lte接收系统中fpga处理复数矩阵乘法的方法及系统 |
US11507761B2 (en) | 2016-02-25 | 2022-11-22 | Hewlett Packard Enterprise Development Lp | Performing complex multiply-accumulate operations |
GB2548908B (en) * | 2016-04-01 | 2019-01-30 | Advanced Risc Mach Ltd | Complex multiply instruction |
US10824934B2 (en) * | 2017-01-12 | 2020-11-03 | Texas Instruments Incorporated | Methods and apparatus for matrix processing in a convolutional neural network |
KR102425668B1 (ko) * | 2017-02-23 | 2022-07-28 | 에이알엠 리미티드 | 데이터 처리장치에서의 곱셈-누적 |
JP7148526B2 (ja) * | 2017-02-23 | 2022-10-05 | アーム・リミテッド | データ処理装置におけるベクトルによる要素演算 |
US10162633B2 (en) * | 2017-04-24 | 2018-12-25 | Arm Limited | Shift instruction |
US10409592B2 (en) * | 2017-04-24 | 2019-09-10 | Arm Limited | Multiply-and-accumulate-products instructions |
DE102017207876A1 (de) * | 2017-05-10 | 2018-11-15 | Robert Bosch Gmbh | Parallelisierte Verarbeitung |
US10503507B2 (en) | 2017-08-31 | 2019-12-10 | Nvidia Corporation | Inline data inspection for workload simplification |
KR102356708B1 (ko) * | 2017-09-28 | 2022-01-27 | 삼성전자주식회사 | 컨볼루션 연산을 수행하는 연산 장치 및 연산 방법 |
US10795677B2 (en) * | 2017-09-29 | 2020-10-06 | Intel Corporation | Systems, apparatuses, and methods for multiplication, negation, and accumulation of vector packed signed values |
US10795676B2 (en) * | 2017-09-29 | 2020-10-06 | Intel Corporation | Apparatus and method for multiplication and accumulation of complex and real packed data elements |
US11243765B2 (en) | 2017-09-29 | 2022-02-08 | Intel Corporation | Apparatus and method for scaling pre-scaled results of complex multiply-accumulate operations on packed real and imaginary data elements |
US10802826B2 (en) | 2017-09-29 | 2020-10-13 | Intel Corporation | Apparatus and method for performing dual signed and unsigned multiplication of packed data elements |
US10514924B2 (en) | 2017-09-29 | 2019-12-24 | Intel Corporation | Apparatus and method for performing dual signed and unsigned multiplication of packed data elements |
US10664277B2 (en) | 2017-09-29 | 2020-05-26 | Intel Corporation | Systems, apparatuses and methods for dual complex by complex conjugate multiply of signed words |
US10534838B2 (en) | 2017-09-29 | 2020-01-14 | Intel Corporation | Bit matrix multiplication |
US11074073B2 (en) * | 2017-09-29 | 2021-07-27 | Intel Corporation | Apparatus and method for multiply, add/subtract, and accumulate of packed data elements |
US10552154B2 (en) | 2017-09-29 | 2020-02-04 | Intel Corporation | Apparatus and method for multiplication and accumulation of complex and real packed data elements |
US11256504B2 (en) | 2017-09-29 | 2022-02-22 | Intel Corporation | Apparatus and method for complex by complex conjugate multiplication |
GB2568085B (en) * | 2017-11-03 | 2020-01-01 | Imagination Tech Ltd | Hardware unit for performing matrix multiplication with clock gating |
EP3499362B1 (en) * | 2017-12-13 | 2022-11-30 | ARM Limited | Vector add-with-carry instruction |
US10678507B2 (en) * | 2017-12-22 | 2020-06-09 | Alibaba Group Holding Limited | Programmable multiply-add array hardware |
US10977001B2 (en) * | 2018-02-05 | 2021-04-13 | Mediatek Inc. | Asymmetric quantization of multiple-and-accumulate operations in deep learning processing |
US10528346B2 (en) | 2018-03-29 | 2020-01-07 | Intel Corporation | Instructions for fused multiply-add operations with variable precision input operands |
GB2576180B (en) * | 2018-08-08 | 2022-08-10 | Temporal Computing Ltd | Temporal computing |
JP7296574B2 (ja) * | 2019-03-04 | 2023-06-23 | パナソニックIpマネジメント株式会社 | プロセッサ及びプロセッサの制御方法 |
US20210173662A1 (en) * | 2019-12-05 | 2021-06-10 | International Business Machines Corporation | Processor unit for multiply and accumulate operations |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0298777A (ja) * | 1988-10-05 | 1990-04-11 | Nec Corp | 並列積和演算回路及びベクトル行列積演算方法 |
JPH04271431A (ja) * | 1991-02-27 | 1992-09-28 | Fujitsu Ltd | 演算制御方式 |
JPH07200543A (ja) * | 1993-12-20 | 1995-08-04 | Motorola Inc | 算術エンジン |
JPH1040235A (ja) * | 1996-07-22 | 1998-02-13 | Sharp Corp | 行列乗算器 |
JPH1069372A (ja) * | 1996-08-29 | 1998-03-10 | Fujitsu Ltd | 演算実行方法及び演算装置 |
JP2000322408A (ja) * | 1998-10-06 | 2000-11-24 | Texas Instr Inc <Ti> | 線形ベクトル計算 |
JP2001092636A (ja) * | 1999-07-28 | 2001-04-06 | Arm Ltd | 第1、第2、第3オペランドに浮動小数点演算を適用するためのデータ処理装置および方法 |
JP2002503370A (ja) * | 1997-06-10 | 2002-01-29 | エイアールエム リミテッド | コプロセッサ・データ・アクセス制御 |
JP2004118470A (ja) * | 2002-09-25 | 2004-04-15 | Matsushita Electric Ind Co Ltd | プロセッサ |
JP2006338215A (ja) * | 2005-06-01 | 2006-12-14 | Nec Computertechno Ltd | ベクトル積和演算回路 |
JP2007004542A (ja) * | 2005-06-24 | 2007-01-11 | Renesas Technology Corp | 半導体信号処理装置 |
JP2008507039A (ja) * | 2004-07-13 | 2008-03-06 | スリープラスワン テクノロジー, インコーポレイテッド | プログラム可能なプロセッサのアーキテクチャ |
JP2009048532A (ja) * | 2007-08-22 | 2009-03-05 | Nec Electronics Corp | マイクロプロセッサ |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2291515B (en) * | 1994-07-14 | 1998-11-18 | Advanced Risc Mach Ltd | Data processing using multiply-accumulate instructions |
US5598362A (en) * | 1994-12-22 | 1997-01-28 | Motorola Inc. | Apparatus and method for performing both 24 bit and 16 bit arithmetic |
US5796645A (en) * | 1996-08-27 | 1998-08-18 | Tritech Microelectronics International Ltd. | Multiply accumulate computation unit |
US7437401B2 (en) * | 2004-02-20 | 2008-10-14 | Altera Corporation | Multiplier-accumulator block mode splitting |
US7660841B2 (en) * | 2004-02-20 | 2010-02-09 | Altera Corporation | Flexible accumulator in digital signal processing circuitry |
CN1658152B (zh) * | 2004-02-20 | 2012-06-13 | 阿尔特拉公司 | 乘法器-累加器块模式划分 |
EP1710691A1 (en) * | 2005-04-07 | 2006-10-11 | STMicroelectronics (Research & Development) Limited | MAC/MUL unit |
-
2009
- 2009-10-30 GB GB0919120.6A patent/GB2474901B/en active Active
-
2010
- 2010-10-28 JP JP2010242079A patent/JP5647859B2/ja not_active Expired - Fee Related
- 2010-10-29 CN CN201010530682.9A patent/CN102053817B/zh active Active
- 2010-10-29 US US12/926,171 patent/US8595280B2/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0298777A (ja) * | 1988-10-05 | 1990-04-11 | Nec Corp | 並列積和演算回路及びベクトル行列積演算方法 |
JPH04271431A (ja) * | 1991-02-27 | 1992-09-28 | Fujitsu Ltd | 演算制御方式 |
JPH07200543A (ja) * | 1993-12-20 | 1995-08-04 | Motorola Inc | 算術エンジン |
JPH1040235A (ja) * | 1996-07-22 | 1998-02-13 | Sharp Corp | 行列乗算器 |
JPH1069372A (ja) * | 1996-08-29 | 1998-03-10 | Fujitsu Ltd | 演算実行方法及び演算装置 |
JP2002503370A (ja) * | 1997-06-10 | 2002-01-29 | エイアールエム リミテッド | コプロセッサ・データ・アクセス制御 |
JP2000322408A (ja) * | 1998-10-06 | 2000-11-24 | Texas Instr Inc <Ti> | 線形ベクトル計算 |
JP2001092636A (ja) * | 1999-07-28 | 2001-04-06 | Arm Ltd | 第1、第2、第3オペランドに浮動小数点演算を適用するためのデータ処理装置および方法 |
JP2004118470A (ja) * | 2002-09-25 | 2004-04-15 | Matsushita Electric Ind Co Ltd | プロセッサ |
JP2008507039A (ja) * | 2004-07-13 | 2008-03-06 | スリープラスワン テクノロジー, インコーポレイテッド | プログラム可能なプロセッサのアーキテクチャ |
JP2006338215A (ja) * | 2005-06-01 | 2006-12-14 | Nec Computertechno Ltd | ベクトル積和演算回路 |
JP2007004542A (ja) * | 2005-06-24 | 2007-01-11 | Renesas Technology Corp | 半導体信号処理装置 |
JP2009048532A (ja) * | 2007-08-22 | 2009-03-05 | Nec Electronics Corp | マイクロプロセッサ |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015518610A (ja) * | 2012-04-20 | 2015-07-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | デジタルシグナルプロセッサにおける信号処理のためのシステムおよび方法 |
US9274750B2 (en) | 2012-04-20 | 2016-03-01 | Futurewei Technologies, Inc. | System and method for signal processing in digital signal processors |
KR20180034471A (ko) * | 2015-07-31 | 2018-04-04 | 에이알엠 리미티드 | 벡터 피연산자 비트 크기 제어 |
KR102581576B1 (ko) | 2015-07-31 | 2023-09-22 | 에이알엠 리미티드 | 벡터 피연산자 비트 크기 제어 |
JP2019526866A (ja) * | 2016-09-13 | 2019-09-19 | エイアールエム リミテッド | ベクトル積和命令 |
US11188330B2 (en) | 2016-09-13 | 2021-11-30 | Arm Limited | Vector multiply-add instruction |
JP7203016B2 (ja) | 2016-09-13 | 2023-01-12 | アーム・リミテッド | ベクトル積和命令 |
JP2020508513A (ja) * | 2017-02-23 | 2020-03-19 | エイアールエム リミテッド | データ処理装置における拡大算術計算 |
US11567763B2 (en) | 2017-02-23 | 2023-01-31 | Arm Limited | Widening arithmetic in a data processing apparatus |
KR20190129240A (ko) * | 2018-05-10 | 2019-11-20 | 서울대학교산학협력단 | 행 단위 연산 뉴럴 프로세서 및 이를 이용한 데이터 처리 방법 |
KR102126857B1 (ko) | 2018-05-10 | 2020-06-25 | 서울대학교산학협력단 | 행 단위 연산 뉴럴 프로세서 및 이를 이용한 데이터 처리 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20110106871A1 (en) | 2011-05-05 |
CN102053817B (zh) | 2015-09-09 |
US8595280B2 (en) | 2013-11-26 |
GB0919120D0 (en) | 2009-12-16 |
JP5647859B2 (ja) | 2015-01-07 |
GB2474901B (en) | 2015-01-07 |
GB2474901A (en) | 2011-05-04 |
CN102053817A (zh) | 2011-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5647859B2 (ja) | 乗累算演算を実行するための装置および方法 | |
US10445451B2 (en) | Processors, methods, and systems for a configurable spatial accelerator with performance, correctness, and power reduction features | |
US10445098B2 (en) | Processors and methods for privileged configuration in a spatial array | |
JP5619751B2 (ja) | Simd積和演算動作を行うための装置及び方法 | |
CN109661647B (zh) | 数据处理装置和方法 | |
EP3343388A1 (en) | Processors, methods, and systems with a configurable spatial accelerator | |
JP2007519052A (ja) | 命令制御式データ処理装置 | |
CN108319559B (zh) | 用于控制矢量内存存取的数据处理装置及方法 | |
WO2015114305A1 (en) | A data processing apparatus and method for executing a vector scan instruction | |
TWI502490B (zh) | 用以處理加法指令之方法、及用以執行加法指令之裝置與系統 | |
JP2012252374A (ja) | 情報処理装置 | |
US11106465B2 (en) | Vector add-with-carry instruction | |
CN101615113A (zh) | 一条指令完成一次蝶形运算的微处理器实现方法 | |
JP2874351B2 (ja) | 並列パイプライン命令処理装置 | |
TWI770079B (zh) | 向量產生指令 | |
KR102025694B1 (ko) | 재구성 가능한 프로세서의 검증 방법 | |
JPH07110769A (ja) | Vliw型計算機 | |
JP2020201659A (ja) | 演算装置、演算方法、および演算プログラム | |
Le-Huu et al. | A micro-architecture design for the 32-bit VLIW DSP processor core | |
JP2004303058A (ja) | ベクトルプロセッサおよびそのデータ処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140203 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140430 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141014 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5647859 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |