CN1439126A - 带有耦合的乘法一累加单元的数字信号处理器 - Google Patents
带有耦合的乘法一累加单元的数字信号处理器 Download PDFInfo
- Publication number
- CN1439126A CN1439126A CN01805294A CN01805294A CN1439126A CN 1439126 A CN1439126 A CN 1439126A CN 01805294 A CN01805294 A CN 01805294A CN 01805294 A CN01805294 A CN 01805294A CN 1439126 A CN1439126 A CN 1439126A
- Authority
- CN
- China
- Prior art keywords
- output
- totalizer
- input
- multiplier
- register file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 7
- 230000008676 import Effects 0.000 claims 1
- 101100244969 Arabidopsis thaliana PRL1 gene Proteins 0.000 description 6
- 102100039558 Galectin-3 Human genes 0.000 description 6
- 101100454448 Homo sapiens LGALS3 gene Proteins 0.000 description 6
- 101150051246 MAC2 gene Proteins 0.000 description 6
- 101100059544 Arabidopsis thaliana CDC5 gene Proteins 0.000 description 4
- 101150115300 MAC1 gene Proteins 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Complex Calculations (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
将两个乘法-累加单元耦合在一起以在一个周期内完成计算(B*C)+/-(D*E)。加法器(216)将两个乘法器(206)、(208)的乘积加在一起。其和被施加到第1累加器(220)。最好是将第2乘积施加到第2累加器(222),并且多路复用器(218)将0或者第2乘积施加到加法器(216)。如果要同时地执行两个不相关的计算,那么就应用0,并且第2累加器的输出就被反馈回寄存器堆(PI2)。如果要执行单个(B*C)+(D*E)计算,那么第2乘积就被施加到加法器,并且不予处理第2累加器的输出。
Description
发明背景
技术领域
本发明涉及数字信号处理器,并且尤其涉及乘法-累加(MAC)单元。
背景技术
数字信号处理器(DSP)是专门类型的微处理器,特别适合非常快速地执行数学计算。可以在包括光盘播放器、PC磁盘驱动器、电信调制解调器组以及蜂窝式电话机的多种应用中找到DSP。
在蜂窝式电话机范围内,对于DSP计算能力的需求持续增长,受诸如GPS定位、语音识别、低比特率语音和音频编码、图像和视频处理以及第3代蜂窝网调制解调器处理的应用的逐渐增长的需求驱动。为了满足这些处理需求,就需要能更有效地处理计算的改进的数字信号处理器结构。
在这些领域内,已经做了相当多的工作。申请人Sih也是下面美国专利申请的申请人:
“Multiple Bus Architecture in a Digital Signal Processor”,序列号为09/044,087,1998年3月18日申请;
“Digital Signal Processor Having Multiple Access Register”,序列号为09/044,088,1998年3月18日申请;
“Memory Efficient Instruction Storage”,序列号为09/044,089,1998年3月18日申请;
“Highly Parallel Variable Length Instructions for Controlling aDigital Signal Processor”,序列号为09/044,104,1998年3月18日申请;
“Variable Length Instruction Decoder”,序列号为09/044,086,1998年3月18日申请;以及
“Digital Signal Processor with Shiftable Multiply AccumulateUnit”,序列号为09/044,108,1998年3月18日申请;在这里引用这些申请的揭示作为参考。
在许多信号处理算法中,计算(B*C)+/-(D*E)是突出的,其中B、C、D和E是16-比特整数。当进行单极IIR滤波,计算复数的大小、两个矢量的标量积和矢量积、以及插值时将调用该计算。它还被用于扩展精度运算(如32×32乘法)中。由于此运算是如此普遍存在的,就希望数字信号处理器在一周期内完成该运算。
虽然可利用带有两个乘法-累加(MAC)单元(如Lucent DSP16000、TI C6x)的DSP,由于它们的MAC单元是分开的,它们就不能在一周期内计算所希望的量。如果我们假设R1、R2、R3和R4是分别包含B、C、D和E的通用16-比特寄存器,并且假设L1、L2和L3是40-比特结果寄存器,那么计算
(B*C)+(D*E)
的单次调用可以在这些现存的处理器上以伪码写为:
L1=R1*R2,L2=R3*R4;
L3=L1+L2;
应该注意到此计算在这些处理器中占据两个周期。
图1是常规MAC单元(100)的方块图。寄存器堆(102)具有输入端口PI1,以及3个输出端口PO1、PO2和PO3。该寄存器堆与存储器(104)相连接。输出端口PO2和PO3被施加到乘法器(106),该乘法器将信号相乘并将它们应用为加法器(108)的一个输入。该加法器从寄存器堆的PO1接收它的另一输入。其和就反馈回寄存器堆的PI1。
在第1时钟周期中,没有什么被施加到PO1,并且R1和R2分别被应用于端口PO2和PO3。乘积L1被反馈回寄存器堆并被放置在附属于PO1的临时寄存器中。在第2时钟周期,R3和R4被分别施加到端口PO2和PO3,并且由乘法器求出L2。加法器使来自乘法器的L2与来自PO1的L1相加,产生L3,并且通过PI1将它反馈回寄存器组。一旦L3存在寄存器组之中,它就能用于存储器。
显示了40-比特加法器和17×17比特乘法器。这是通用的,但是可以使用任何适宜的比特数。
发明概述
将两个乘法-累加单元耦合在一起,以便能在一周期内完成计算(B*C)+(D*E)。一个加法器将两个乘法器的乘积加在一起。其和被施加到第1累加器。较佳的是,第2乘积还被施加到第2累加器,并且乘法器将0或第2乘积施加到加法器。如果要同时执行两个不相关的计算,那么应用0,并且第2累加器的输出被反馈回寄存器堆。如果要执行单个(B*C)+(D*E)计算,那么就将第2乘积施加到加法器,并且第2累加器的输出就不予处理。
附图简述
图1是常规MAC单元的方块图。
图2是本发明的方块图。
图3显示了为独立的MAC单元配置的图1的装置。
图4显示了为耦合的MAC单元配置的图1的装置。
图5显示了图2所示的装置的备择加法器结构。
较佳实施例的详细说明
图1是常规MAC单元的方块图。已在“背景”部分描述了,不需要进一步讨论。
图2是本发明(200)的方块图。寄存器堆(202)具有第1和第2输入(PI1,PI2)以及第1至第6输出(PO1-PO6)。输入和输出有时被称为输入端口和输出端口;在此可交替地使用该术语。第1移位器(204)接收寄存器堆的第1输出,并且第1乘法器(206)接收寄存器堆的第2和第3输出。同样地,第2乘法器(208)接收寄存器堆的第4和第5输出。第2移位器(210)接收第1乘法器的输出,并且第3移位器(212)接收第2乘法器的输出。舍入法多路复用器(214)接收第1移位器的输出。
第1加法器(216)在第1输入接收第2移位器(210)的输出,并且多路复用器(218)接收0或者第3移位器(212)的输出,并且将输出施加到第1加法器(216)的第2输入。
第2加法器(220)接收舍入乘法器和第1加法器的输出。它的输出被反馈回寄存器堆的第1输入(PI1)。第3加法器(222)接收第3移位器(212)和第6寄存器输出端口(PO6)的输出。它的输出被反馈回寄存器堆的第2输入(PI2)。
图2所示的结构有两个MAC单元(MAC1和MAC2),它们从包含一组通用寄存器的寄存器堆接收操作数。MAC1从寄存器堆的输出端口PO2和PO3取它的乘法器操作数。乘法器(206)的输出被传送到可以将结果左移0、1、2或3比特的移位器(210)。移位器的输出被传送到可以加上0或者加上来自MAC2的被移位的乘积结果的加法器(216)。加法器的输出被传送进可以加上从寄存器堆的输出端口PO1取出的另一个40-比特操作数的40-比特加法器(220)。该40-比特加法器的输出通过输入端口PI1被存储于寄存器堆中。MAC2从寄存器堆的输出端口PO4和PO5取乘法器操作数,把它们相乘(208),将结果左移0、1、2或3比特(212)并将结果传送到可以加上从输出端口PO6取出的额外寄存器堆操作数的40-比特加法器(222)。该40-比特加法器的输出通过寄存器堆输入端口PI2被存储于寄存器堆中。然后存储器(224)能够从寄存器堆(202)的适当寄存器中提取这些加法器的输出。该存储器(224)或某些类似设备,首先将被乘数和加数放入寄存器堆(202)。
如在先有技术中,加法器是40-比特器件以及乘法器将16-比特被乘数相乘的事实是合乎需要的但并不是必须的。
注意到来自MAC2的被移位后的乘积同样被馈入多路复用器(218),该多路复用器馈给MAC1中的第1加法器(216)。该多路复用器大小允许用户以两个可能的配置之一设置双-MAC单元。
图3显示了为独立的MAC单元配置的图2的装置。当用户指定(通过指令)多路复用器(218)应该以0作为其输入,双-MAC单元采取此配置。在此配置中,两个MAC单元完全独立地操作,该配置保留了现有设计的全部优点。该配置可用于同时地执行两个不相关的MAC计算。
图4显示了为耦合的MAC单元配置的图2的装置。当上述的多路复用器(218)被设置成将来自MAC2的乘数结果传送到MAC1中的第1加法器(216)时,双-MAC单元采取此配置。在此配置中,MAC单元被耦合在一起并且MAC2中的40-比特加法器(222)的输出被禁止写入寄存器堆。可以立刻看出这使双-MAC单元能够通过执行诸如L1=R1*R2+/-R3*R4的指令,在一周期内计算(B*C)+/-(D*E)的值。而且,该配置还能够在一周期内计算
A+/-(B*C)+/-(D*E)
的值,其中数值A通过输出端口PO1取自寄存器堆。该计算对于复数乘法累加运算以及扩展精度运算是及其有用的。
本发明在其最宽泛的实施例中不需要所有上述部件。实际上,该电子电路仅包括第1(206)和第2乘法器(208)(每个乘法器具有至少两个输入和一个输出)、至少具有两个输入和一个输出的加法器(216)、包括至少一个输入的寄存器堆(202)就足够了。本发明的有效部分是每个乘法器的输出被连接到加法器的输入并且加法器的输出被连接到寄存器堆的输入。正是这种特性使得乘法器、加法器和寄存器堆在一个时钟周期内一起操作。接收加法器输出的寄存器堆最好也是向乘法器输出被乘数的寄存器堆。寄存器堆最好有6个输出而不是4个,并且最好提供额外的加法器把来自这些额外输出的数加到由乘法器产生的乘积中去。最好提供移位器,以处理不同数量级的数,并且舍入法多路复用器最好提供额外的精度。这些是本发明的较详细实施例的全部特性,但不是为本发明的最宽泛的实施例所必须。
加法器最好是第1加法器(216)并且电子电路进一步包括第2加法器(220)。在此实施例中,第2加法器的一个输入是寄存器堆的输出(PO1),第2加法器(220)的另一输入是第1加法器(216)的输出,并且第2加法器(220)的输出是寄存器堆的输入(PI1)。
在另一实施例中,电子电路除了第2加法器(220)之外,进一步包括第3加法器(222)。在该实施例中,第3加法器的一个输入是寄存器堆的另一输出(PO6),并且第3加法器的另一输入是第2乘法器(208)的输出。
图5显示了图2所示的装置的备择加法器结构。在该实施例中,省略第2加法器(220)。在该实施例中,第1加法器(216)具有第3输入,该输入被连接到寄存器堆的输出(PO1)。
在另一实施例中,电子电路进一步包括受外部控制的多路复用器(218)。该多路复用器的一个输入是第2乘法器(208)的输出,多路复用器的另一输入是0,并且该多路复用器的输出是加法器(216)的输入。
在另一实施例中,在每个乘法器(206)、(208)和加法器(216)的输入之间插入移位器(210)、(212)。工业应用
只要希望在一周期内进行多个乘法-累加运算,本发明能够利用于工业中,并且能够被制造和使用。在此所示的彼此间分开或无关的装置的独立部件和方法可以完全是常规的,正是它们的组合被要求为本发明。
虽然已经描述了装置和方法的各种模式,但本发明的真正精神和范围并不局限于此,仅受本发明所要求的下列权利要求及其等价要求限制。
Claims (7)
1.一种电子电路,其特征在于包括:
(a)具有第1和第2输入以及第1至第6输出的寄存器堆;
(b)接收寄存器堆的第1输出的第1移位器;
(c)接收寄存器堆的第2和第3输出并有输出的第1乘法器;
(d)接收寄存器堆的第4和第5输出并有输出的第2乘法器;
(e)接收第1乘法器的输出并有输出的第2移位器;
(f)接收第2乘法器的输出并有输出的第3移位器;
(g)接收第1移位器的输出并有输出的舍入法多路复用器;
(h)在第1输入接收第2移位器的输出并有输出的第1加法器;
(i)接收0或者第3移位器的输出并将输出施加到第1加法器的第2输入的多路复用器;
(j)接收舍入法多路复用器和第1加法器的输出并将输出反馈回寄存器堆的第1输入的第2加法器;以及
(k)接收第3移位器输出和第6寄存器输出并将输出反馈回寄存器堆的第2输入的第3加法器。
2.一种电子电路,其中:
(a)该电子电路包括:
(1)第1和第2乘法器,每个乘法器具有至少两个输入和一个输出;
(2)具有至少两个输入和一个输出的加法器;
(3)包括至少一个输入的寄存器堆;以及
(b)该电子电路的特征在于:
(1)每个乘法器的输出被连接到该加法器的输入;以及
(2)该加法器的输出被连接到寄存器堆的输入;
其中乘法器、加法器以及寄存器堆在一个时钟周期内一起运行。
3.如权利要求2所述的电子电路,其特征在于:
(a)所述加法器是第1加法器;
(b)该电子电路进一步包括第2加法器;
(1)其一个输入是所述寄存器堆的输出;
(2)其另一输入是第1加法器的输出;以及
(3)其输出是所述寄存器堆的输入。
4.如权利要求3所述的电子电路,其特征在于该电子电路进一步包括第3加法器:
(a)其一个输入是所述寄存器堆的另一输出;以及
(b)其另一输入是第2乘法器的输出。
5.如权利要求2所述的电子电路,其特征在于所述加法器具有被连接到所述寄存器堆的输出的第3输入。
6.如权利要求2所述的电子电路,其特征在于进一步包括受外部控制的多路复用器,其中:
(a)该多路复用器的一个输入是第2乘法器的输出;
(b)该多路复用器的另一输入是0;以及
(c)该多路复用器的输出是所述加法器的输入。
7.如权利要求2所述的电子电路,其特征在于进一步包括每个乘法器的输出与所述加法器的输入之间的移位器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/513,980 | 2000-02-26 | ||
US09/513,980 US6557022B1 (en) | 2000-02-26 | 2000-02-26 | Digital signal processor with coupled multiply-accumulate units |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1439126A true CN1439126A (zh) | 2003-08-27 |
Family
ID=24045331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN01805294A Pending CN1439126A (zh) | 2000-02-26 | 2001-02-23 | 带有耦合的乘法一累加单元的数字信号处理器 |
Country Status (11)
Country | Link |
---|---|
US (1) | US6557022B1 (zh) |
EP (1) | EP1259876B1 (zh) |
JP (1) | JP4477279B2 (zh) |
KR (1) | KR20030011071A (zh) |
CN (1) | CN1439126A (zh) |
AT (1) | ATE316264T1 (zh) |
AU (1) | AU2001239844A1 (zh) |
CA (1) | CA2400647C (zh) |
DE (1) | DE60116742T2 (zh) |
ES (1) | ES2259322T3 (zh) |
WO (1) | WO2001063398A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100440192C (zh) * | 2006-12-28 | 2008-12-03 | 北京时代民芯科技有限公司 | 粗粒度可重配置计算结构中算术单元结构 |
CN112602054A (zh) * | 2018-08-31 | 2021-04-02 | 弗莱克斯-罗技克斯技术公司 | 乘法器累加器电路、用于乘法累加的逻辑瓦片架构和包括逻辑瓦片阵列的ic |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891538B1 (en) * | 1999-07-01 | 2005-05-10 | Microsoft Corporation | Dual mode device and method for generating vector cross products or dot products |
US7072929B2 (en) * | 2000-11-01 | 2006-07-04 | Pts Corporation | Methods and apparatus for efficient complex long multiplication and covariance matrix implementation |
JP3338043B2 (ja) * | 2000-11-02 | 2002-10-28 | 株式会社ソニー・コンピュータエンタテインメント | 並列演算装置、エンタテインメント装置、演算処理方法、コンピュータプログラム、半導体デバイス |
JP2003016051A (ja) * | 2001-06-29 | 2003-01-17 | Nec Corp | 複素ベクトル演算プロセッサ |
US20030145030A1 (en) * | 2002-01-31 | 2003-07-31 | Sheaffer Gad S. | Multiply-accumulate accelerator with data re-use |
US7793072B2 (en) * | 2003-10-31 | 2010-09-07 | International Business Machines Corporation | Vector execution unit to process a vector instruction by executing a first operation on a first set of operands and a second operation on a second set of operands |
US7769797B2 (en) * | 2004-01-20 | 2010-08-03 | Samsung Electronics Co., Ltd. | Apparatus and method of multiplication using a plurality of identical partial multiplication modules |
JP4408712B2 (ja) * | 2004-01-26 | 2010-02-03 | 富士通マイクロエレクトロニクス株式会社 | 多倍長データ積和演算処理回路及びモンゴメリ積和剰余演算回路 |
US7873815B2 (en) | 2004-03-04 | 2011-01-18 | Qualcomm Incorporated | Digital signal processors with configurable dual-MAC and dual-ALU |
US8074051B2 (en) * | 2004-04-07 | 2011-12-06 | Aspen Acquisition Corporation | Multithreaded processor with multiple concurrent pipelines per thread |
US8736620B2 (en) * | 2004-05-14 | 2014-05-27 | Nvidia Corporation | Kill bit graphics processing system and method |
US8711155B2 (en) * | 2004-05-14 | 2014-04-29 | Nvidia Corporation | Early kill removal graphics processing system and method |
US8743142B1 (en) | 2004-05-14 | 2014-06-03 | Nvidia Corporation | Unified data fetch graphics processing system and method |
US8860722B2 (en) * | 2004-05-14 | 2014-10-14 | Nvidia Corporation | Early Z scoreboard tracking system and method |
US8736628B1 (en) | 2004-05-14 | 2014-05-27 | Nvidia Corporation | Single thread graphics processing system and method |
US8687010B1 (en) | 2004-05-14 | 2014-04-01 | Nvidia Corporation | Arbitrary size texture palettes for use in graphics systems |
US8190669B1 (en) | 2004-10-20 | 2012-05-29 | Nvidia Corporation | Multipurpose arithmetic functional unit |
US7640285B1 (en) * | 2004-10-20 | 2009-12-29 | Nvidia Corporation | Multipurpose arithmetic functional unit |
CN100363885C (zh) * | 2004-11-19 | 2008-01-23 | 浙江大学 | 乘累加装置 |
US20060149804A1 (en) * | 2004-11-30 | 2006-07-06 | International Business Machines Corporation | Multiply-sum dot product instruction with mask and splat |
US20070106720A1 (en) * | 2005-11-10 | 2007-05-10 | Samsung Electronics Co., Ltd. | Reconfigurable signal processor architecture using multiple complex multiply-accumulate units |
US8037119B1 (en) | 2006-02-21 | 2011-10-11 | Nvidia Corporation | Multipurpose functional unit with single-precision and double-precision operations |
KR100835173B1 (ko) * | 2006-09-20 | 2008-06-05 | 한국전자통신연구원 | 곱셈 누적 연산을 위한 디지털 신호처리 장치 및 방법 |
US20080071851A1 (en) * | 2006-09-20 | 2008-03-20 | Ronen Zohar | Instruction and logic for performing a dot-product operation |
US8122078B2 (en) * | 2006-10-06 | 2012-02-21 | Calos Fund, LLC | Processor with enhanced combined-arithmetic capability |
US9495724B2 (en) * | 2006-10-31 | 2016-11-15 | International Business Machines Corporation | Single precision vector permute immediate with “word” vector write mask |
US8332452B2 (en) * | 2006-10-31 | 2012-12-11 | International Business Machines Corporation | Single precision vector dot product with “word” vector write mask |
US8537168B1 (en) | 2006-11-02 | 2013-09-17 | Nvidia Corporation | Method and system for deferred coverage mask generation in a raster stage |
US8051123B1 (en) | 2006-12-15 | 2011-11-01 | Nvidia Corporation | Multipurpose functional unit with double-precision and filtering operations |
US8599208B2 (en) * | 2007-08-15 | 2013-12-03 | Nvidia Corporation | Shared readable and writeable global values in a graphics processor unit pipeline |
US9183607B1 (en) | 2007-08-15 | 2015-11-10 | Nvidia Corporation | Scoreboard cache coherence in a graphics pipeline |
US8736624B1 (en) | 2007-08-15 | 2014-05-27 | Nvidia Corporation | Conditional execution flag in graphics applications |
US8521800B1 (en) | 2007-08-15 | 2013-08-27 | Nvidia Corporation | Interconnected arithmetic logic units |
US8775777B2 (en) * | 2007-08-15 | 2014-07-08 | Nvidia Corporation | Techniques for sourcing immediate values from a VLIW |
US8314803B2 (en) | 2007-08-15 | 2012-11-20 | Nvidia Corporation | Buffering deserialized pixel data in a graphics processor unit pipeline |
US20090046105A1 (en) * | 2007-08-15 | 2009-02-19 | Bergland Tyson J | Conditional execute bit in a graphics processor unit pipeline |
US8106914B2 (en) * | 2007-12-07 | 2012-01-31 | Nvidia Corporation | Fused multiply-add functional unit |
US9411595B2 (en) | 2012-05-31 | 2016-08-09 | Nvidia Corporation | Multi-threaded transactional memory coherence |
US9824009B2 (en) | 2012-12-21 | 2017-11-21 | Nvidia Corporation | Information coherency maintenance systems and methods |
US10102142B2 (en) | 2012-12-26 | 2018-10-16 | Nvidia Corporation | Virtual address based memory reordering |
US9317251B2 (en) | 2012-12-31 | 2016-04-19 | Nvidia Corporation | Efficient correction of normalizer shift amount errors in fused multiply add operations |
US9569385B2 (en) | 2013-09-09 | 2017-02-14 | Nvidia Corporation | Memory transaction ordering |
US20160188327A1 (en) * | 2014-12-24 | 2016-06-30 | Elmoustapha Ould-Ahmed-Vall | Apparatus and method for fused multiply-multiply instructions |
KR20170137761A (ko) * | 2015-04-16 | 2017-12-13 | 휴렛 팩커드 엔터프라이즈 디벨롭먼트 엘피 | 곱셈 누적 연산을 수행하는 저항성 메모리 어레이 |
US11635958B1 (en) | 2022-01-03 | 2023-04-25 | Globalfoundries U.S. Inc. | Multi-port register file for partial-sum accumulation |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58501794A (ja) * | 1981-10-26 | 1983-10-20 | ボルカー・インコーポレイテッド | 絶縁抵抗の高い樹脂組成物及びそれを被覆した難燃性ケーブル |
JPS6297060A (ja) * | 1985-10-23 | 1987-05-06 | Mitsubishi Electric Corp | デイジタルシグナルプロセツサ |
US4996661A (en) * | 1988-10-05 | 1991-02-26 | United Technologies Corporation | Single chip complex floating point numeric processor |
FI88843C (fi) | 1990-05-21 | 1993-07-12 | Nokia Mobile Phones Ltd | Multifunktionstelefonanordning |
JP2756392B2 (ja) | 1992-08-27 | 1998-05-25 | 富士通株式会社 | 電子メールと電話の連携機能を備えたコンピュータ |
US5764943A (en) * | 1995-12-28 | 1998-06-09 | Intel Corporation | Data path circuitry for processor having multiple instruction pipelines |
US5966652A (en) | 1996-08-29 | 1999-10-12 | Qualcomm Incorporated | System and method for the insertion and extraction of telephone numbers from a wireless text message |
US5933797A (en) | 1997-02-28 | 1999-08-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive dual filter echo cancellation |
US6870828B1 (en) | 1997-06-03 | 2005-03-22 | Cisco Technology, Inc. | Method and apparatus for iconifying and automatically dialing telephone numbers which appear on a Web page |
US5941940A (en) * | 1997-06-30 | 1999-08-24 | Lucent Technologies Inc. | Digital signal processor architecture optimized for performing fast Fourier Transforms |
US5991785A (en) * | 1997-11-13 | 1999-11-23 | Lucent Technologies Inc. | Determining an extremum value and its index in an array using a dual-accumulation processor |
CN1189003C (zh) | 1999-09-21 | 2005-02-09 | 艾利森电话股份有限公司 | 从短消息服务消息中的嵌入指示器启动应用 |
EP1299983A2 (en) | 2000-01-24 | 2003-04-09 | QUALCOMM Incorporated | Find and dial |
-
2000
- 2000-02-26 US US09/513,980 patent/US6557022B1/en not_active Expired - Lifetime
-
2001
- 2001-02-23 DE DE60116742T patent/DE60116742T2/de not_active Expired - Lifetime
- 2001-02-23 CN CN01805294A patent/CN1439126A/zh active Pending
- 2001-02-23 AU AU2001239844A patent/AU2001239844A1/en not_active Abandoned
- 2001-02-23 WO PCT/US2001/005869 patent/WO2001063398A2/en active IP Right Grant
- 2001-02-23 EP EP01914457A patent/EP1259876B1/en not_active Expired - Lifetime
- 2001-02-23 ES ES01914457T patent/ES2259322T3/es not_active Expired - Lifetime
- 2001-02-23 AT AT01914457T patent/ATE316264T1/de not_active IP Right Cessation
- 2001-02-23 CA CA2400647A patent/CA2400647C/en not_active Expired - Fee Related
- 2001-02-23 KR KR1020027011065A patent/KR20030011071A/ko not_active Application Discontinuation
- 2001-02-23 JP JP2001562296A patent/JP4477279B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100440192C (zh) * | 2006-12-28 | 2008-12-03 | 北京时代民芯科技有限公司 | 粗粒度可重配置计算结构中算术单元结构 |
CN112602054A (zh) * | 2018-08-31 | 2021-04-02 | 弗莱克斯-罗技克斯技术公司 | 乘法器累加器电路、用于乘法累加的逻辑瓦片架构和包括逻辑瓦片阵列的ic |
Also Published As
Publication number | Publication date |
---|---|
DE60116742T2 (de) | 2006-10-26 |
US6557022B1 (en) | 2003-04-29 |
WO2001063398A3 (en) | 2002-02-21 |
DE60116742D1 (de) | 2006-04-06 |
ES2259322T3 (es) | 2006-10-01 |
CA2400647A1 (en) | 2001-08-30 |
ATE316264T1 (de) | 2006-02-15 |
JP4477279B2 (ja) | 2010-06-09 |
CA2400647C (en) | 2010-06-29 |
JP2004501416A (ja) | 2004-01-15 |
KR20030011071A (ko) | 2003-02-06 |
WO2001063398A2 (en) | 2001-08-30 |
AU2001239844A1 (en) | 2001-09-03 |
EP1259876A2 (en) | 2002-11-27 |
EP1259876B1 (en) | 2006-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1439126A (zh) | 带有耦合的乘法一累加单元的数字信号处理器 | |
US8626814B2 (en) | Method and apparatus for performing multiply-add operations on packed data | |
US7395298B2 (en) | Method and apparatus for performing multiply-add operations on packed data | |
US7774400B2 (en) | Method and system for performing calculation operations and a device | |
US7430578B2 (en) | Method and apparatus for performing multiply-add operations on packed byte data | |
US5793661A (en) | Method and apparatus for performing multiply and accumulate operations on packed data | |
US5721892A (en) | Method and apparatus for performing multiply-subtract operations on packed data | |
KR100310584B1 (ko) | 승산-가산연산을이용한신호처리시스템 | |
JP3750820B2 (ja) | パック・データの乗加算演算を実行する装置 | |
EP1576494A1 (en) | Method and system for performing calculation operations and a device | |
KR19980041798A (ko) | 영상처리를 위한 명령을 지원하는 모듈 계산구조 | |
CN1489728A (zh) | 采用双乘法累加(mac)处理机和双乘法累加(mac)协同处理机的数字信号处理机 | |
US5931892A (en) | Enhanced adaptive filtering technique | |
US4823297A (en) | Digit-reversal method and apparatus for computer transforms | |
CN1220935C (zh) | 提高半规模双精度浮点乘法流水线效率的部件 | |
Poornaiah et al. | Novel VLSI multi-bit coded multiplier and multiplier-accumulator architectures for DSP applications | |
JPH0298777A (ja) | 並列積和演算回路及びベクトル行列積演算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
C20 | Patent right or utility model deemed to be abandoned or is abandoned | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1056411 Country of ref document: HK |