CN105512724A

CN105512724A - 加法器装置、数据累加方法及数据处理装置

Info

Publication number: CN105512724A
Application number: CN201510863726.2A
Authority: CN
Inventors: 李震; 刘少礼; 张士锦; 罗韬; 钱诚; 陈云霁; 陈天石
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2015-12-01
Filing date: 2015-12-01
Publication date: 2016-04-20
Anticipated expiration: 2035-12-01
Also published as: CN105512724B; US20180321911A1; US10416964B2; WO2017092284A1

Abstract

本发明公开一种加法器装置、数据累加方法及数据处理装置，所述加法器装置包括：第一加法器模块，具有由多级加法器阵列构成的加法树单元和第一控制单元，加法树单元基于第一控制单元的控制信号采用逐级累加的方式累加数据；第二加法器模块，包括两输入加减操作单元和第二控制单元，对输入数据进行加法或减法运算；移位操作模块，用于对第一加法器模块的输出数据进行左移位操作；与操作模块，用于对移位操作模块的输出数据和第二加法器模块的输出数据进行与操作；控制器模块，用于控制第一加法器模块及第二加法器模块的数据输入，控制移位操作模块的移位操作，以及控制第一控制单元及第二控制单元的控制信号的发射。由此，实现数据快速累加。

Description

加法器装置、数据累加方法及数据处理装置

技术领域

本发明属于数据数据处理系统的领域，涉及加法器装置的数据处理，特别涉及一种加法器装置、数据累加方法及包括该加法器装置的数据处理装置。

背景技术

近年来，基于M-P神经元模型的神经网络算法广泛用于产品推荐、图像识别等领域。M-P神经元模型是一种加型神经元模型，神经元输出值等于神经元输入的加权和值再累加偏置值后经过非线性变换的结果。即，神经网络算法中需要大量的累加运算以及加法运算。同时，在神经网络算大的训练过程中，不仅包含大量累加运算，还包含减法运算。

采用传统通用处理处理器运算神经网络算法或者是对一个神经网络训练时，每次只能对两个数据相加，这种方法效率较低。而且若是采用定点数据进行运算时还需处理加法溢出的情况。

发明内容

本发明的目的在于，解决上述传统处理器在运行神经网络算法或训练神经网络时存在的缺陷，提供一种加法器装置、数据累加方法及包括该加法器装置的数据处理装置，能够进行快速累加以及对批量数据向量进行加/减操作。从而使程序员可快速实现神经网络算法中的累加运算以及加/减法运算，同时能够同一时钟周期内实现加法溢出判断以及溢出处理从而既不影响神经网络算法执行速度又提高神经网络算法的预测结果的正确率。

本发明提供的加法器装置，用于对输入数据流进行快速累加，包括：

第一加法器模块，包括至少一个由多级加法器阵列构成的加法树单元和第一控制单元，所述多级加法器阵列的每一级加法器阵列包含多个加法器构成的加法器组，每一所述加法器组对输入数据进行累加而构成一组部分和数据并作为下一级加法器阵列的输入数据，所述加法树单元基于来自所述第一控制单元的控制信号采用逐级累加的方式将每一级的输入数据累加为一个累加和数据作为所述第一加法器模块的输出数据；

第二加法器模块，包括两输入加减操作单元和第二控制单元，所述两输入加减操作单元基于第二控制单元的控制信号选择性地对输入数据进行加法或减法运算，并将加减运算结果作为所述第二加法器模块的输出数据；

连接于所述第一加法器模块的移位操作模块，用于对所述第一加法器模块的输出数据进行左移位操作，从而使所述第一加法器模块的输出数据具有与所述第二加法器模块的输出数据相同的位宽度并将移位后的结果作为所述移位操作模块的输出数据；

与操作模块，连接于所述移位操作模块和所述第二加法器模块，用于对所述移位操作模块的输出数据和所述第二加法器模块的输出数据进行与操作，并将所述与操作结果作为所述加法器装置的输出数据；

控制器模块，用于控制所述第一加法器模块及所述第二加法器模块的数据输入，控制所述移位操作模块的移位操作，以及控制所述第一控制单元及所述第二控制单元的控制信号的发射。

本发明的加法器装置，其中，在所述加法树单元中，在所述多级加法器阵列中的位于中间级位置的加法器阵列的输出端设置一寄存器，用于对来自所述位于中间级位置的加法器阵列的输出端的输出数据进行缓存。

本发明的加法器装置，其中，所述第一加法器模块还具有多个用于寄存所述加法器组算出的部分和数据的寄存器，根据所述第一控制单元的控制信号确定所述部分和数据寄存在哪一个寄存器中，并确定从所述多个寄存器中选择一个部分和数据与所述加法树单元的所述累加和数据相加并作为所述第一加法器模块的输出数据。

本发明的加法器装置，其中，还包括溢出检测及溢出处理的电路，用于检测定点数的累加结果是否发生向上溢出或向下溢出，若发生向上溢出，则将运算结果置为该定点数格式能表达的最大正数，若发生向下溢出，则将运算结果置为该定点数格式能表达的最小负数；

其中，所述向上溢出是指，对多个定点正数进行加法运算时，运算结果超出了该定点数格式的正数表达范围；所述向下溢出是指，对多个定点复数进行加法运算时，运算结果超出了该定点数格式的复数表达范围。

本发明的加法器装置，其中，所述控制器模块进一步包括：

操作码控制单元，用于控制所述第一加法器模块及所述第二加法器模块的数据输入；

设备号控制单元，用于确定所述移位操作模块的移位值；

累加源操作数序号控制单元，用于确定从多个部分和寄存器选择一个与加法树输出结果相加；

使能信号控制单元，用于使所述加法器装置在当前有效；

标志信号控制单元，用于将所述第一加法器模块的输出数据作为所述加法器装置的输出数据。

另外，本发明还提供一种使用上述加法器装置对输出数据流进行快速累加的方法，包括以下步骤：

步骤1，控制器模块向第一加法器模块及第二加法器模块发送控制信号，确定所述第一加法器模块及所述第二加法器模块的输入数据的取值、控制移位操作模块的移位操作，以及控制第一控制单元及第二控制单元的控制信号的发射；

步骤2，所述第一加法器模块及所述第二加法器模块分别接收到来自所述控制器模块的控制信号后，基于该控制信号，所述第一加法器模块的加法树单元采用逐级累加的方式将每一级的输入数据累加为一个累加和数据作为该第一加法器模块的输出数据，其中所述第一加法器模块由多级加法器阵列构成；所述第二加法器模块选择性地对输入数据进行加法或减法运算，并将加减运算结果作为该第二加法器模块的输出数据；

步骤3，移位操作模块基于所述控制信号对所述第一加法器模块的输出数据进行左移位操作，从而使所述第一加法器模块的输出数据具有与所述第二加法器模块的输出数据相同的位宽度并将移位后的结果作为所述移位操作模块的输出数据；

步骤4，与操作模块对所述移位操作模块的输出数据和所述第二加法器模块的输出数据进行与操作，并将所述与操作结果作为所述加法器装置的输出数据。

本发明的累加方法，其中，所述步骤2还包括，在所述加法树单元中，使用设置于所述多级加法器阵列中的位于中间级位置的加法器阵列的输出端的寄存器来对来自所述位于中间级位置的加法器阵列的输出端的输出数据进行缓存的步骤。

本发明的累加方法，其中，所述步骤2还包括如下步骤，所述第一加法器模块的用于寄存部分和数据的寄存器，根据所述第一控制单元的控制信号确定所述部分和数据寄存在哪一个寄存器中，并确定从所述多个寄存器中选择一个部分和数据与所述加法树单元的所述累加和数据相加并作为所述第一加法器模块的输出数据。

本发明的累加方法，其中，还包括如下步骤，使用溢出检测及溢出处理的电路检测定点数的累加结果是否发生向上溢出或向下溢出，若发生向上溢出，则将运算结果置为该定点数格式能表达的最大正数，若发生向下溢出，则将运算结果置为该定点数格式能表达的最小负数；其中，所述向上溢出是指，对多个定点正数进行加法运算时，运算结果超出了该定点数格式的正数表达范围；所述向下溢出是指，对多个定点复数进行加法运算时，运算结果超出了该定点数格式的复数表达范围。

另外，本发明还提供一种包括上述加法器装置的数据处理装置。

本发明至少包括以下效果或收益：

本装置及方法可快速实现神经网络算法中的累加运算以及加/减法运算；支持不同精度的定点数据的加/减法运算，提高运算结果的精度；同时能够同一时钟周期内实现加法溢出判断以及溢出处理从而既不影响神经网络算法执行速度又提高神经网络算法的预测结果的正确率。

附图说明

图1示出了本发明的加法器装置的概要构成图。

图2示出了本发明的一实施方式的加法器装置的结构图。

图3示出了本发明的一实施方式的第一加法器模块的结构图。

图4示出了本发明的一实施方式的第二加法器模块的结构图。

图5示出了本发明的一实施方式的加法树单元的结构图。

图6示出了本发明的累加方法的流程图。

图7示出本发明的实施方式的数据处理装置的结构图。

附图标记说明

100、200...加法器装置；110、210...第一加法器模块；120、220...第二加法器模块；130...移位操作模块；140...与操作模块；150...控制器模块；1...加法器装置200的时钟信号输入端口(clock)；2...加法器装置200的复位信号输入端口(reset)；3...操作码控制信号端口(adds_op)；4...设备号控制信号端口(tile_id)；5...累加源操作数序号控制信号端口(addend_id)；6...标志信号控制信号端口(flag)；7...使能信号控制信号端口(pipeline_en)；8...加法器装置200的输出端口(results)；9...加法器装置200的输入数据a(inputa)；10...加法器装置200的输入数据b(inputb)；11...第一加法器模块210的时钟信号输入端口(clock)；12...第一加法器模块210的复位信号输入端口(reset)；13...第一加法器模块210的输入数据端口(partial_sum)；14...第一加法器模块210的输出数据端口(results_0)；15...复位标志信号端口(reset_flag)；16...被累加数序号端口(addend_id_0)；17...(累加结果序号端口result_id_0)；18...使能信号端口(en_0)；19...第二加法器模块220的输入数据端口a(inputa_1)；20...第二加法器模块220的输入数据端口b(inputb_1)；21...加减判断标志信号端口(sub_flag)；22...第二加法器模块220的输出数据端口results_1)；300...一级加法树流水；400...二级加法树流水；500...加法器。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图对本发明的加法器装置、数据累加方法及包括该加法器装置的数据处理装置进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明的加法器装置100，支持不同精度的定点数据的加/减法运算，包括：第一加法器模块110，包括一个由多级加法器阵列构成的加法树单元和第一控制单元，每一级所述加法器阵列包含多个加法器构成的加法器组，每一所述加法器组对输入数据进行累加而构成一组部分和数据并作为下一级所述加法器阵列的输入数据，所述加法树单元基于来自所述第一控制单元的控制信号采用逐级累加的方式将每一级的输入数据累加为一个累加和数据作为所述第一加法器模块的输出数据115；第二加法器模块120，包括两输入加减操作单元和第二控制单元，所述两输入加减操作单元基于第二控制单元的控制信号选择性地对输入数据113、114进行加法或减法运算，并将加减运算结果作为所述第二加法器模块的输出数据116；连接于所述第一加法器模块的移位操作模块130，用于对所述第一加法器模块的输出数据115进行左移位操作，从而使所述第一加法器模块的输出数据具有与所述第二加法器模块的输出数据相同的位宽度并将移位后的结果作为所述移位操作模块的输出数据117；与操作模块140，连接于所述移位操作模块和所述第二加法器模块，用于对所述移位操作模块的输出数据117和所述第二加法器模块的输出数据116进行与操作，并将所述与操作结果作为所述加法器装置的输出数据118；控制器模块150，用于控制所述第一加法器模块及所述第二加法器模块的数据输入112、113、114(即能够选择性地将输入数据流111分配为第一加法器模块110及第二加法器模块120的数据输入112、113、114而分别输入到第一加法器模块110及第二加法器模块120)，控制所述移位操作模块的移位操作，以及控制所述第一控制单元及所述第二控制单元的控制信号的发射。

图2示出本发明的一实施方式的加法器装置200的结构图。该加法器装置1包含若干个输入与1个输出。该加法器模块由图3中的子模块adds_0(相当于第一加法器模块)与图4中的子模块adds_1(相当于第二加法器模块)组成，两个子模块相互协调共同完成输入数据的加法操作。所述的加法器装置主要输入输出接口设有，时钟信号输入端口1(clock)、复位信号输入端口2(reset)、主要数据输入端口9(inputa)和10(inputb)，主要数据输出端口8(results)，控制信号端口主要包括：操作码3(adds_op)、设备号4(tile_id)、累加源操作数序号5(addend_id)、标志位6(flag)、使能信号7(pipeline_en)，上述控制信号端口主要对若干组输入数据进行处理的控制，并输出对应的处理结果，这些控制信号来自上述的控制器模块。所述的数据输入端口9(inputa)和10(inputb)，它们由若干个若干位的数据组成，得到若干位的输出数据8(results)。所述的数据输入端口9(inputa)和10(inputb)，输入数据9(inputa)为向量化的输入数据数据，输入数据10(inputb)则根据操作码设定为外界输入的向量化输入数据或者选择上一周期寄存上一周期向量化数据作为输入。所述的加法器装置控制信号3(adds_op)的作用为：选择向量化的部分和值13(partial_sum)、19(inputa_1)、20(inputb_1)的数据输入源，控制信号4(tile_id)的作用为：确定模块210(adds_0)输出结果14(results_0)的移位值以便和其它设备协同处理，控制信号5(addend_id)的作用为：确定从多个部分和寄存器选择一个与加法树输出结果相加，控制信号6(flag)的作用为：将adds_0模块210的输出结果result_0作为整个adds模块(即加法器装置220)的结果8(result)，控制信号7(pipeline_en)的作用为，使整个adds模块在当前有效。

此外，应当说明的是，本发明的加法器装置的若干级加法树都是由相同的加法矩阵构成，每个加法矩阵为一个全加器。加法矩阵的输入为两队输入为若干位宽的数据，输出为一组若干位宽的数据。且本发明的加法器芯片能够基于任一普通的加法器芯片进行改进，例如市面上较为常见的74、74HC、74LS系列加法器芯片。

图3示出了本发明的一实施方式的第一加法器模块的结构图。子模块adds_0(相当于第一加法器模块)含有若干输入与1个输出，输入接口主要设有：时钟信号输入端口11(clock)、复位信号输入端口12(reset)、以及控制信号端口，其中控制信号端口包括输入数据端口13(partial_sum)、输出数据端口14(results_0)，控制信号15(reset_flag)、被累加数序号16(addend_id_0)、累加结果序号17(result_id_0)、使能信号18(en_0)，这些控制信号来自上述的第一控制单元。其中，输入数据13(partial_sum)由若干个若干位的数据组成，表示若干个若干位宽数据的部分和，来自加法器输入信号9(inputa)。15(reset_flag)、18(en_0)、16(addend_id_0)、17(result_id_0)为子模块adds_0的控制信号，其中18(en_0)为使能信号，16(addend_id_0)用于选择加法数结果累计的寄存器索引，17(result_id_0)为结果寄存器索引。

第一加法器模块的主要结构为一个若干级加法器500组成的加法树，如图5所示，每一级中每一加法阵列将两组输入部分和值数据相加构成一组部分和数据，加法树采用逐级累加的方式最终将包含多个部分和的输入数据(partial_sum)累加为一个累加和数据输出。对于加法树的构成，现以5级加法器矩阵进行说明，如：第一级加法器可由16个加法阵列构成，能对32个若干位宽的输入数据进行加法操作，输出16个若干位宽的数据。第二级加法树由8个加法整列构成，对第一级加法树的16个若干位数据进行加法操作输出8个若干位宽的数据。第三级加法树由4个加法阵列构成，对第二级加法树的8个若干位宽数据进行加法操作，输出4个若干位宽数据，并将4个若干位宽的数据缓存在一个寄存器(reg)中。第四级加法树由2个加法整列，对寄存器(reg)中若干个若干位宽数据进行加法操作，输出若干个若干位宽数据，第五级加法树由一个加法阵列构成，对第四级加法树的2个若干位宽数据进行加法操作，输出1位若干位宽数据。另外，在第若干级加法器位置设有一寄存器(reg)用以缓存输出数据，在此位置切若干级流水，减小了加法树的路径延迟。采用上述方案能够很好的解决现有技术中运算频率不高以及运算吞吐量不大等问题。第一加法器模块中设有若干个用于寄存部分和结果的寄存器，如上所述，18(en_0)为使能信号，根据使能信号18(en_0)与控制信号17(result_id_0)确定运算结果14(result_0)寄存在哪一个寄存器中，18(en_0)无效则不能将运算结果寄存。控制信号15(reset_flag)与16(addend_id_0)用于确定从若干个寄存中选择一个和加法树的结果相加并作为模块(adds_0)的结果输出。

如图4所示，第二加法器模块主要含有两组向量化数据输入与1个向量化数据输出组成，其主要信号为若干位宽输入数据19(inputa_1)、20(inputb_1)，控制信号21(sub_flag)，若干位宽输出数据22(results_1)。控制信号21(sub_flag)来自上述的第二控制单元，用于控制输入数据进行何种操作，即根据控制信号21(sub_flag)选择需要进行的是19(inputa_1)和20(inputb_1)进行向量加法或者减法。例如，若控制信号21(sub_flag)有效(例如值为1)，则模块输入19(inputa_1)减去模块输出20(inputb_1)，并作为子模块adds_1的输出结果22(results_1)。反之，将模块输入19(inputa_1)加上模块输入20(inputb_1)，并作为子模块adds_1的输出结果22(rsults_1)。

以下介绍加法器模块的具体实施过程。

在时钟信号1(clock)、复位信号2(reset)与3(adds_op)、4(tile_id)、5(addend_id)、6(flag)、7(pipeline_en)等控制信号的协同下，加法器模块进行如下的操作：由控制信号3(adds_op)确定子模块adds_0与子模块adds_1输入信号的取值。

对于第一加法器模块adds_0控制流程，当控制信号3(adds_op)取1或2，信号13(partial_sum)的值取自信号9(adds_inputa)，其他情况则13(partial_sum)为0。当信号3(adds_op)取2时则信号6(flag)为1，其它情况为0。当信号3(adds_op)取1或2时且信号7(pipeline_en)有效，信号18(en_0)取1否则取0。

对于第一加法器模块(adds_0)控制流程，第一加法器模块(adds_0)主要由若干级加法树构成，考虑到加法树路径太长与造成的时延和加法器工作频率的要求。将前若干级加法树构成一级流水，并将加法树计算的若干位宽数据进行缓存，将缓存结果寄存在一个若干位宽寄存器，下一级流水由加法数的后若干加法阵列构成，对若干位宽寄存器里面的数据继续进行处理，最后的到一个若干位宽的数据输出。

对于第一加法器模块(adds_0)控制流程，在模块内部设有若干个若干位宽寄存器，现以3个寄存器的情况为例进行说明：reg0、reg1、reg2，这三个寄存器主要用于缓存部分和结果，对于部分和的缓存作如下的处理操作。输入信号18(en_0)有效且17(result_id_0)为0时，部分和赋值给reg0，输入信号18(en_0)有效且17(result_id_0)为1时，部分和赋值给reg1。输入信号18(en_0)有效且17(result_id_0)为2时，部分和赋值给reg2。对于结果的输出，adds_0模块根据信号16(addend_id_0)，16(addend_id_0)用于选择从三个若干位宽数据的寄存器选择一个数与加法树若干位宽输出结果相加。若信号15(reset_flag)无效，则不能选择3个若干位宽的寄存器中任一个与加法树输出的若干位宽数据相加。

对于第二加法器模块(adds_1)控制流程，当控制信号3(adds_op)取3或4或5或6时，信号19(inputa_1)取值来自信号9(inputa)，其它情况下信号19(inputa_1)取值为0。当信号3(adds_op)的取值3或4或6时，信号20(inputb_1)取值来自信号10(inputb)其它情况下信号20(inputb_1)为0。

根据输入数据与控制信号，通过加法器子模块adds_0得到一个若干位宽输出数据14(result_0)。子模块adds_1输出若干位宽数据22(results_1)。将子模块adds_0的若干位宽数据14(result_0)进行左移移位操作使其具有与子模块(adds_1)的输出数据相同的位宽度后，并与子模块adds_1的若干位宽输出数据22(results_1)进行与操作，最后得到若干位宽输出数据8(results)。

另外，本发明的加法器装置还包括溢出检测及溢出处理的电路，用于检测定点数的累加结果是否发生向上溢出或向下溢出，若发生向上溢出，则将运算结果置为该定点数格式能表达的最大正数，若发生向下溢出，则将运算结果置为该定点数格式能表达的最小负数；其中，所述向上溢出是指，向上溢出：两个定点正数(符号位为“0”)相加，结果超出了此定点数格式的正数表达范围，因而发生了对符号位的进位，使得结果定点数的符号位变为“1”。所述向下溢出是指，两个定点负数(符号位为“1”)相加，结果超出了此定点数据个数的负数表达范围，因而发生了符号位的翻转，结果定点数的符号位变为“0”。通过采用这种溢出处理模式能使得神经网络算法的训练更快收敛以及获得更好的预测结果。

此外，本发明还提供一种使用上述加法器装置对输出数据流进行快速累加的方法，其流程图如图6所示，包括以下步骤：

本发明的累加方法，其中，所述步骤2还包括，

在所述加法树单元中，使用设置于所述多级加法器阵列中的位于中间级位置的加法器阵列的输出端的寄存器来对来自所述位于中间级位置的加法器阵列的输出端的输出数据进行缓存的步骤。

本发明的累加方法，其中，所述步骤2还包括如下步骤，

所述第一加法器模块的用于寄存部分和数据的寄存器，根据所述第一控制单元的控制信号确定所述部分和数据寄存在哪一个寄存器中，并确定从所述多个寄存器中选择一个部分和数据作为所述第一加法器模块的输出数据。

本发明的累加方法，其中，还包括如下步骤，

使用溢出检测及溢出处理的电路检测定点数的累加结果是否发生向上溢出或向下溢出，若发生向上溢出，则将运算结果置为该定点数格式能表达的最大正数，若发生向下溢出，则将运算结果置为该定点数格式能表达的最小负数；

其中，所述向上溢出是指，对多个定点正数进行加法运算时，运算结果超出了该定点数格式的正数表达范围；

所述向下溢出是指，对多个定点复数进行加法运算时，运算结果超出了该定点数格式的复数表达范围。

另外，如图7所示，本发明还提供一种包括上述加法器装置100的数据处理装置600。该数据处理装置600可以为例如信号处理器、信号处理芯片、图形处理器等，应用于图形处理、多媒体播放、网络交易处理、模式识别等领域。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

以上对本发明所提供的一种加法器装置及使用该加法器装置进行累加的方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限值。

Claims

1.一种加法器装置，用于对输入数据流进行快速累加，其特征在于，包括：

2.根据权利要求1所述的加法器装置，其特征在于，

在所述加法树单元中，在所述多级加法器阵列中的位于中间级位置的加法器阵列的输出端设置一寄存器，用于对来自所述位于中间级位置的加法器阵列的输出端的输出数据进行缓存。

3.根据权利要求1所述的加法器装置，其特征在于，

所述第一加法器模块还具有多个用于寄存所述加法器组算出的部分和数据的寄存器，根据所述第一控制单元的控制信号确定所述部分和数据寄存在哪一个寄存器中，并确定从所述多个寄存器中选择一个部分和数据与所述加法树单元的所述累加和数据相加并作为所述第一加法器模块的输出数据。

4.根据权利要求1～3任一项所述的加法器装置，其特征在于，

还包括溢出检测及溢出处理的电路，用于检测定点数的累加结果是否发生向上溢出或向下溢出，若发生向上溢出，则将运算结果置为该定点数格式能表达的最大正数，若发生向下溢出，则将运算结果置为该定点数格式能表达的最小负数；

5.根据权利要求1～3任一项所述的加法器装置，其特征在于，所述控制器模块进一步包括：

设备号控制单元，用于确定所述移位操作模块的移位值；

使能信号控制单元，用于使所述加法器装置在当前有效；

6.一种使用上述权利要求1～5任一项所述的加法器装置对输出数据流进行快速累加的方法，其特征在于，包括以下步骤：

7.根据权利要求6所述的累加方法，其特征在于，所述步骤2还包括，

8.根据权利要求6所述的累加方法，其特征在于，所述步骤2还包括如下步骤，

所述第一加法器模块的用于寄存部分和数据的寄存器，根据所述第一控制单元的控制信号确定所述部分和数据寄存在哪一个寄存器中，并确定从所述多个寄存器中选择一个部分和数据与所述加法树单元的所述累加和数据相加并作为所述第一加法器模块的输出数据。

9.根据权利要求6～8任一项所述的加法器装置，其特征在于，还包括如下步骤，

10.一种包括权利要求1～5任一项所述加法器装置的数据处理装置。