WO2023004783A1

WO2023004783A1 - 一种累加器、乘法器及算子电路

Info

Publication number: WO2023004783A1
Application number: PCT/CN2021/109751
Authority: WO
Inventors: 范团宝; 时小山; 蒋越星; 蒋明峰
Original assignee: 华为技术有限公司
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2023-02-02
Also published as: EP4336345A1; CN115917499A; US20240168714A1

Abstract

本申请提供一种累加器、乘法器及算子电路，涉及电子技术领域，用于降低累加器的面积和功耗。该累加器包括：W个压缩器层，W为大于或等于1的整数；其中，该W个压缩器层包括至少一个第一压缩器层，在每个第一压缩器层的输入阵列中，第一阵列包括多个正相的比特位，第二阵列包括多个反相的比特位，每个第一压缩器层包括用于压缩第一阵列的第一压缩电路、用于压缩第二阵列的第二压缩电路，即每个第一压缩器层的输入阵列中不同相位的比特位由不同的压缩电路来压缩。

Description

一种累加器、乘法器及算子电路

技术领域

本申请涉及电子技术领域，尤其涉及一种累加器、乘法器及算子电路。

背景技术

累加器是数字电路设计中很常用的一种计算电路，可用于实现多个二进制数的相加(或称为累加)，比如，用于实现图1中的(a)所示的“y＝x0[7:0]+x1[7:0]+x2[7:0]+…”的相加。累加器还可以应用中乘法器中，用于实现乘法运算中的多个二进制数的累加，比如，用于实现图1中的(b)所示的“y＝x0[7:0]×x1[7:0]”中的多个二进制数的累加。图1中B0至B7对应表示不同的数位(即2 ⁰至2 ⁷)。

现有技术中，累加器都是基于华莱士树(Wallace tree)的压缩方式实现的，且使用多个标准加法器(包括全加器和半加器)分别将多个数位中每个数位上的比特位进行逐层压缩，经过多层压缩后得到两个累加值，最后再将这两个累加值相加得到最终的结果。示例性的，如图2所示，对于一个8bits×8bits的乘法器中的累加计算，可以通过4个压缩器层将待累加的多个二进制数压缩为两行(每行表示一个累加值)，每个压缩器层中包括多个标准加法器。华莱士树是一种现有的完成高效累加的方法，同一层的不同数位上的比特位可以并行压缩，且每一层的延迟都是一个标准全加器的延迟，从而具有计算速度快的特点。

但是，基于上述华莱士树方式实现的累加器中，使用了大量的标准加法器(主要是全加器)，而标准加法器在进行多比特位压缩时要求输入的比特位和输出的比特位都是正相，从而导致标准加法器中需要包括用于执行相位统一的功能电路，这样会导致该累加器存在面积大、功耗高的问题。

发明内容

本申请提供一种累加器、乘法器及算子电路，用于降低累加器的实现难度，从而降低面积和功耗。为达到上述目的，本申请采用如下技术方案：

第一方面，提供一种累加器，包括W个压缩器层，W为大于或等于1的整数；该W个压缩器层，用于压缩多个二进制数，以得到多个累加值，该多个累加值之和为该多个二进制数的累加和；其中，该W个压缩器层包括至少一个第一压缩器层，每个第一压缩器层用于压缩输入阵列以得到输出阵列，该输入阵列包括第一阵列和第二阵列，第一阵列包括多个正相的比特位，第二阵列包括多个反相的比特位，该输出阵列包括第一压缩阵列和第二压缩阵列；其中，该每个第一压缩器层包括：第一压缩电路，用于压缩第一阵列，以得到第一压缩阵列；第二压缩电路，用于压缩第二阵列，以得到第二压缩阵列。

上述技术方案中，该W个压缩器层包括至少一个第一压缩器层，在每个第一压缩器层的输入阵列中，第一阵列包括多个正相的比特位，第二阵列包括多个反相的比特位，从而第一阵列可以认为是一个包括多个正相的比特位的华莱士树，第二阵列可以认为是一个包括多个反相的比特位的华莱士树。也即是，每个第一压缩器层的输入阵列包括两个华莱士树，这两个华莱士树中包括的比特位的相位相反。对于每个第一压缩器层的输入阵列包括的第一阵列和第二阵列，第一压缩电路用于压缩第一阵列，第二压缩电路用于压缩第二阵列，从而该输入阵列中不同相位的比特位可以由不同的压缩电路来压缩，从而无需将每个第一压缩器层的输入阵列中的比特位都统一为同一相位，因此无需添加执行相位统一处理的功能电路，从而使得该累加器相对于传统设计实现简单，且能够降低面积和功耗。

在第一方面的一种可能的实现方式中，第一压缩电路包括一个或多个第一压缩器，该一个或多个第一压缩器中的每个第一压缩器用于压缩第一阵列中位于同一数位上的三个比特位；第二压缩电路包括一个或多个第二压缩器，该一个或多个第二压缩器中的每个第二压缩器用于压缩第二阵列中位于同一数位上的三个比特位。上述可能的实现方式中，第一压缩电路中的一个或多个第一压缩器、以及第二压缩电路中的一个或多个第二压缩器可并行用于压缩对应数位上的比特位，从而提高，每个第一压缩器层的压缩效率。

在第一方面的一种可能的实现方式中，该每个第一压缩器和该每个第二压缩器均为反相求和加法器；该反相求和加法器，用于压缩该三个比特位，得到一个进位输出位和一个求和输出位，该进位输出位的相位与该三个比特位的相位相同，该求和输出位的相位与该三个比特位的相位相反。上述可能的实现方式中，提供了一种反相求和加法器，该反相求和加法器的实现方案比较简单，例如面积小、功耗低。

在第一方面的一种可能的实现方式中，该反相求和加法器用于进行以下压缩：若该三个比特位均为0，则该进位输出位为0，该求和输出位为1；若该三个比特位均为1，则该进位输出位为1，该求和输出位为0；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为0，该求和输出位为0；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则该进位输出位为1，该求和输出位为1。上述可能的实现方式中，提供了一种简单有效的反相求和加法器的压缩方式。

在第一方面的一种可能的实现方式中，该每个第一压缩器和该每个第二压缩器均为反相进位加法器；该反相进位加法器，用于压缩该三个比特位，得到一个进位输出位和一个求和输出位，该进位输出位的相位与该三个比特位的相位相反，该求和输出位的相位与该三个比特位的相位相同。上述可能的实现方式中，提供了一种反相进位加法器，该反相进位加法器的实现方案比较简单，例如面积小、功耗低。

在第一方面的一种可能的实现方式中，该反相进位加法器用于进行以下压缩：若该三个比特位均为0，则该进位输出位为1，该求和输出位为0；若该三个比特位均为1，则该进位输出位为0，该求和输出位为1；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为1，该求和输出位为1；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则进位输出位为0，该求和输出位为0。上述可能的实现方式中，提供了一种简单有效的反相进位加法器的压缩方式。

在第一方面的一种可能的实现方式中，该每个第一压缩器和该每个第二压缩器均为双反相加法器；该双反相加法器，用于压缩该三个比特位，得到一个进位输出位和一个求和输出位，该进位输出位和该求和输出位的相位均与该三个比特位的相位相反。上述可能的实现方式中，提供了一种双反相加法器，该双反相加法器的实现方案比较简单，例如面积小、功耗低。

在第一方面的一种可能的实现方式中，该双反相加法器用于进行以下压缩：若该三个比特位均为0，则该进位输出位为1，该求和输出位为1；若该三个比特位均为1，则该进位输出位为0，该求和输出位为0；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为1，该求和输出位为0；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则进位输出位为0，该求和输出位为1。上述可能的实现方式中，提供了一种简单有效的双反相加法器的压缩方式。

在第一方面的一种可能的实现方式中，该累加器还包括：求和电路，用于接收该多个累加值，并对该多个累加值求和以得到该累加和。

在第一方面的一种可能的实现方式中，该累加器还包括：一个或多个反相器，用于对该W个压缩器层中的一个或多个第一压缩器或第二压缩器所输出的求和输出位和进位输出位中的至少一个取反、或对输入该一个或多个第一压缩器或第二压缩器的该三个比特位取反。上述可能的实现方式中，能够在保证压缩结果准确的情况下，提高该W个压缩器层的压缩效率。

第二方面，提供一种乘法器，该乘法器包括编码器和累加器，该累加器为上述第一方面或者第一方面的任一种可能的实现方式所提供的的累加器。

第三方面，提供一种算子电路，该算子电路在应用于累加器时，能够作为累加器的压缩器层中的加法器，且该加法器为反相求和加法器，包括：第一晶体管、第二晶体管、第三晶体管、第四晶体管、第五晶体管、第六晶体管、第七晶体管、第八晶体管、第九晶体管、第十晶体管、第十一晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管、第二十三晶体管和第二十四晶体管；其中，第一晶体管和第二晶体管并联耦合在电源端和第一节点之间；第三晶体管耦合在第一节点和第二节点之间；第四晶体管耦合在第二节点和第三节点之间；第五晶体管和第六晶体管并联耦合在第三节点和接地端之间；第七晶体管耦合在该电源端和第四节点之间；第八晶体管耦合在第二节点和第四节点之间；第九晶体管耦合在第二节点和第五节点之间；第十晶体管和第十一晶体管串联耦合在第四节点和第一输出端之间；第十二晶体管和第十三晶体管串联耦合在第五节点和第一输出端之间；第十四晶体管耦合在第五节点和该接地端之间；第十五晶体管、第十六晶体管和第十七晶体管并联耦合在该电源端和第六节点之间；第十八晶体管耦合在第一输出端和第六节点之间；第十九晶体管耦合在第一输出端和第七节点之间；第二十晶体管、第二十一晶体管和第二十二晶体管并联耦合在第七节点和该接地端之间；第三晶体管、第四晶体管、第十一晶体管、第十二晶体管、第十五晶体管和第二十晶体管的控制端均用于接收第一输入；第一晶体管、第五晶体管、第七晶体管、第十四晶体管、第十六晶体管和第二十一晶体管的控制端均用于接收第二输入；第二晶体管、第六晶体管、第八晶体管、第九晶体管、第十晶体管、第十三晶体管、第十七晶体管和第二十二晶体管的控制端均用于接收第三输入；第十八晶体管和第十九晶体管的控制端均耦合于第二节点；第二十三晶体管和第二十四晶体管串联耦合在该电源端和该接地端之间，第二十三晶体管和第二十四晶体管的耦合点为第二输出端；第二十三晶体管和第二十四晶体管的控制端均耦合于第二节点。上述技术方案中，提供了一种算子电路，该算子电路中晶体管的数量少、占用面积小，实现简单，从而将该算子电路应用于累加器中时可以减小累加的面积。

在第三方面的一种可能的实现方式中，第一晶体管、第二晶体管、第三晶体管、第七晶体管、第八晶体管、第十晶体管、第十一晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管和第二十三晶体管是PMOS晶体管；第四晶体管、第五晶体管、第六晶体管、第九晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管和第二十四晶体管是NMOS晶体管。上述可能的实现方式中，提供的算子电路压缩数据时晶体管的翻转率较小，从而将该算子电路应用于累加器中时可以减小累加器的功耗。

第四方面，提供一种算子电路，该算子电路在应用于累加器时，能够作为累加器的压缩器层中的加法器，且该加法器为反相进位加法器，包括：第一晶体管、第二晶体管、第三晶体管、第四晶体管、第五晶体管、第六晶体管、第七晶体管、第八晶体管、第九晶体管、第十晶体管、第十一晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管、第二十三晶体管和第二十四晶体管；其中，第一晶体管和第二晶体管并联耦合在电源端和第一节点之间；第三晶体管耦合在第一节点和第一输出端之间；第四晶体管耦合在第一输出端和第二节点之间；第五晶体管和第六晶体管并联耦合在第二节点和接地端之间；第七晶体管耦合在该电源端和第三节点之间；第八晶体管耦合在第三节点和该第一输出端之间；第九晶体管耦合在第一输出端和第四节点之间；第十晶体管和第十一晶体管串联耦合在第三节点和第五节点之间；第十二晶体管和第十三晶体管串联耦合在第四节点和第五节点之间；第十四晶体管耦合在第四节点和该接地端之间；第十五晶体管、第十六晶体管和第十七晶体管并联耦合在该电源端和第六节点之间；第十八晶体管耦合在第五节点和第六节点之间；第十九晶体管耦合在第五节点和第七节点之间；第二十晶体管、第二十一晶体管和第二十二晶体管并联耦合在第七节点和该接地端之间；第三晶体管、第四晶体管、第十一晶体管、第十二晶体管、第十五晶体管和第二十晶体管的控制端均用于接收第一输入；第一晶体管、第五晶体管、第七晶体管、第十四晶体管、第十六晶体管和第二十一晶体管的控制端均用于接收第二输入；第二晶体管、第六晶体管、第八晶体管、第九晶体管、第十晶体管、第十三晶体管、第十七晶体管和第二十二晶体管的控制端均用于接收第三输入；第十八晶体管和第十九晶体管的控制端均耦合于第一输出端；第二十三晶体管和第二十四晶体管串联耦合在该电源端和该接地端之间，第二十三晶体管和第二十四晶体管的耦合点为第二输出端；第二十三晶体管和第二十四晶体管的控制端均耦合于第五节点。上述技术方案中，提供了一种算子电路，该算子电路中晶体管的数量少、占用面积小，实现简单，从而将该算子电路应用于累加器中时可以减小累加的面积。

在第四方面的一种可能的实现方式中，第一晶体管、第二晶体管、第三晶体管、第七晶体管、第八晶体管、第十晶体管、第十一晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管和第二十三晶体管是PMOS晶体管；第四晶体管、第五晶体管、第六晶体管、第九晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管和第二十四晶体管是NMOS晶体管。上述可能的实现方式中，提供的算子电路压缩数据时晶体管的翻转率较小，从而将该算子电路应用于累加器中时可以减小累加器的功耗。

第五方面，提供一种处理器，包括累加器、乘法器或算子电路；其中，该累加器为上述第一方面或者第一方面的任一种可能的实现方式所提供的累加器，该乘法器为上述第二方面所提供的乘法器，该算子电路为上述第三方面至第四方面、或者第三方面至第四方面的任一种可能的实现方式所提供的算子电路。

第六方面，提供一种芯片，包括累加器、乘法器或算子电路；其中，该累加器为上述第一方面或者第一方面的任一种可能的实现方式所提供的累加器，该乘法器为上述第二方面所提供的乘法器，该算子电路为上述第三方面至第四方面、或者第三方面至第四方面的任一种可能的实现方式所提供的算子电路。

可以理解地，上述提供的任一种累加器、处理器或芯片均包括上文所提供的累加器或算子电路，因此，其所能达到的有益效果可参考上文所提供的累加器或算子电路中的有益效果，此处不再赘述。

附图说明

图1为本申请实施例提供的一种多个二进制数累加的示意图；

图2为本申请实施例提供的一种乘法器中作累加计算的示意图；

图3为一种基于标准加法器的累加器对多个二进制数作累加的示意图；

图4为本申请实施例提供的一种通信设备的结构示意图；

图5为本申请实施例提供的一种累加器的结构示意图；

图6为本申请实施例提供的一种反相求和加法器的结构示意图；

图7为本申请实施例提供的另一种累加器的结构示意图；

图8为本申请实施例提供的一种反相进位加法器的结构示意图；

图9为本申请实施例提供的又一种累加器的结构示意图；

图10为本申请实施例提供的一种双反相加法器的结构示意图；

图11为本申请实施例提供的另一种累加器的结构示意图；

图12为本申请实施例提供的一种累加器中反相器的示意图；

图13为本申请实施例提供的另一种累加器中反相器的示意图；

图14为本申请实施例提供的一种反相求和加法器的结构示意图；

图15为本申请实施例提供的一种反相进位加法器的结构示意图；

图16为本申请实施例提供的一种双反相加法器的结构示意图；

图17为本申请实施例提供的一种乘法器的结构示意图；

图18为本申请实施例提供的一种乘法器中累加计算的性能对比图。

具体实施方式

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a和b，a和c，b和c，或a、b和c，其中a，b，c可以是单个，也可以是多个。另外，本申请的实施例采用了“第一”、“第二”等字样对名称或功能或作用类似的对象进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。“耦合”一词用于表示电性连接，包括通过导线或连接端直接相连或通过其他器件间接相连。因此“耦合”应被视为是一种广义上的电子通信连接。

在介绍本申请实施例之前，首先对现有技术中基于华莱士树实现的累加器的相关技术进行介绍说明。当前基于华莱士树实现的累加器中通常包括多个压缩器层，在利用该累加器实现多个二进制数的累加时，需要每一个压缩器层的输入阵列和输出阵列中的每个比特位均为正相。同时，对于同一个压缩器层中正相的多个比特位，分别采用多个标准加法器进行并行压缩，每三个比特位经过一个标准加法器压缩后，输出一个正相的进位输出位和一个正相的求和输出位。

示例性的，如图3所示，当利用该累加器对27个6比特(bits)的二进制数作累加计算时，该累加器可以包括多个压缩器层，该多个压缩器层的每个压缩器层中的每个标准加法器用于对正相的三个比特位(图3中表示为IN0、IN1和IN2)进行压缩，输出的正相的进位输出位表示为C、正相的求和输出位表示为S。图3中仅示出了该多个压缩器层中的第1个压缩器层至第3个压缩器层，B0至B5对应表示不同的数位(即2 ⁰至2 ⁵)，该数位也可以称为权位，该数位是针对二进制中不同位置上的比特位而言的，类似于十进制中的个位、十位和百位等。

上述累加器采用了大量的标准加法器，而标准加法器在进行多比特位压缩时要求输入的比特位和输出的比特位都是正相，从而该标准加法器中需要包括用于执行相位统一的功能电路。目前，通常使用更多数量的金属-氧化物-半导体(metal–oxide–semiconductor，MOS)管来实现比特位的相位的统一，这样会导致该标准加法器存在MOS管的数量多、以及在平均单位比特计算内MOS管翻转次数多的问题。上述累加器中的标准加法器基本都是标准全加器，以标准全加器为例，每个标准全加器包括的MOS管的数量高达28个，且在7nm工艺下占用面积为0.2736um ²，从而使得该累加器的面积大。此外，标准全加器中MOS管的数量多，会导致在平均单位比特计算内MOS管的翻转次数多，从而使得该累加器的功耗大。因此，当前基于华莱士树实现的累加器存在面积大、功耗高的问题。基于此，本申请实施例提供一种累加器，通过对同一压缩器层中不同相位的比特位分别进行压缩，来降低该累加器的功耗和面积，该累加器可用于通信设备中，关于该通信设备和该累加器的具体描述可以参见下文。

本申请实施例提供的累加计算过程中，比特位(也可以称为比特位对应的信号)的相位具有正相和反相两种相位状态，这两种相位状态是相对的，比如一个比特位的正相为G，则该比特位的反相为/G，即反相信号是正相信号的逻辑取反。

图4为本申请实施例提供的一种通信设备的结构示意图，该通信设备可以是终端、或者服务器等，或者可以是终端或者服务器内置的芯片、芯片组、电路板或模组等。参见图3，该通信设备可以包括存储器101、处理器102、通信接口103和总线104。其中，存储器101、处理器102以及通信接口103通过总线104相互连接。存储器101可用于存储数据、软件程序以及模块，主要包括存储程序区和存储数据区，存储程序区可存储操作系统、至少一个功能所需的应用程序等，存储数据区可存储该设备的使用时所创建的数据等。处理器102用于对该通信设备的动作进行控制管理，比如通过运行或执行存储在存储器101内的软件程序和/或模块，以及调用存储在存储器101内的数据，执行该设备的各种功能和处理数据。通信接口103用于支持该通信设备进行通信。

其中，处理器102包括但不限于中央处理单元(central processing unit，CPU)、网络处理单元(network processing unit，NPU)、图形处理器(graphics processing unit，GPU)、或数字信号处理器(digital Signal processor，DSP)或者通用处理器等。在本申请实施例中，处理器102中包括一个或多个累加器，或者包括一个或者多个乘法器，例如处理器102中包括乘法器阵列，该乘法器是在处理器102中实现乘法运算的器件。

总线104可以是外设部件互连标准(peripheral component interconnect，PCI)总线，或者扩展工业标准结构(extended industry standard architecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

为了进一步描述技术方案，图5为本申请实施例提供的一种累加器的结构示意图，该累加器可用于实现多个二进制数的累加。参见图5，该累加器包括：W个压缩器层，用于压缩多个二进制数，以得到多个累加值，该多个累加值之和为该多个二进制数的累加和，W为大于或等于1的整数。

其中，该W个压缩器层压缩该多个二进制数后，可得到多行(每行包括一个或者多个比特位)，每行表示一个累加值，即该多行表示该多个累加值。该多个累加值可以为两个累加值或者两个以上的累加值，本申请实施例对此不作具体限制。

另外，该W个压缩器层可以包括一个压缩器层或者多个压缩器层，比如，该W可以等于1、4或者6等，具体数值可以由本领域人员根据经验或者实际需求进行设置，本申请实施例对此不作具体限制。图5中以W个压缩器层包括多个压缩器层、且该多个压缩器层分别表示为L1至LW为例进行说明。

在本申请方案中，该W个压缩器层包括至少一个第一压缩器层，至少一个第一压缩器层中的每个第一压缩器层用于压缩输入阵列，以得到输出阵列。该输入阵列包括第一阵列和第二阵列，第一阵列包括多个正相的比特位，第二阵列包括多个反相的比特位，该输出阵列包括第一压缩阵列和第二压缩阵列。每个第一压缩器层包括：第一压缩电路21，用于压缩该第一压缩器层的输入阵列中的第一阵列，以得到第一压缩阵列；第二压缩电路22，用于压缩该第一压缩器层的输入阵列中的第二阵列，以得到第二压缩阵列。

其中，该W个压缩器层中的每个压缩器层都有一个输入阵列和一个输出阵列。该W个压缩器层中第1个压缩器层(即L1)的输入阵列可以为该多个二进制数按照数位从高到低的顺序依次排列得到的矩阵。该W个压缩器层中第2个至第W个压缩器层(即L2至LW)中每个压缩器层的输入矩阵可以为该压缩器层的上一个压缩器层的输出矩阵或者该输出矩阵经过其他变形或预处理后的矩阵，即第i个压缩器层的输入矩阵为第(i-1)个压缩器层的输出矩阵或者该输出矩阵经过其他变形或预处理后的矩阵，i的取值依次为2至W。

另外，该至少一个第一压缩器层可以包括一个或者多个第一压缩器层，该一个或者多个第一压缩器层的层数可以表示为N，N为正整数且小于或等于W。当N小于W时，该至少一个第一压缩器层可以是该W个压缩器层中的任意一个或者多个压缩器层。图5中以该至少一个第一压缩器层包括(W-1)个第一压缩器层，且该(W-1)个第一压缩器层为该W个压缩器层中的第2个至第W个压缩器层(即L2至LW)为例进行说明。需要说明的是，当N小于W时，该W个压缩器层中除该至少一个第一压缩器层之外的其他压缩器层可以采用现有技术来实现，本申请实施例对此不作具体限制。

本申请实施例中，在每个第一压缩器层的输入阵列中，第一阵列包括多个正相的比特位，第二阵列包括多个反相的比特位，从而第一阵列可以认为是一个包括多个正相的比特位的华莱士树，第二阵列可以认为是一个包括多个反相的比特位的华莱士树。也即是，每个第一压缩器层的输入阵列包括两个华莱士树，这两个华莱士树中包括的比特位的相位相反。对于每个第一压缩器层的输入阵列包括的第一阵列和第二阵列，第一压缩电路21用于压缩第一阵列，第二压缩电路22用于压缩第二阵列，从而该输入阵列中不同相位的比特位可以由不同的压缩电路来压缩，从而无需将每个第一压缩器层的输入阵列中的比特位都统一为同一相位，从而使得该累加器相对于传统设计实现简单，且能够降低面积和功耗。

进一步的，该W个压缩器层中的每个压缩器层可以包括一个或者多个压缩器，每个压缩器可用于对该压缩器层的输入阵列中同一数位上的三个比特位进行压缩。对于每个第一压缩器层中的第一压缩电路21，该第一压缩电路21可以包括一个或多个第一压缩器211，该一个或多个第一压缩器211中的每个第一压缩器211用于压缩第一阵列中位于同一数位上的三个比特位。对于每个第一压缩器层中的第二压缩电路22，该第二压缩电路22可以包括一个或多个第二压缩器221，该一个或多个第二压缩器221中的每个第二压缩器221用于压缩第二阵列中位于同一数位上的三个比特位。

上述第一压缩器211和第二压缩器221可以为以下三种加法器中的任一种，该三种加法器包括反相求和加法器、反相进位加法器和双反相加法器，下面分别对这三种加法器进行介绍说明。

第一种、反相求和加法器，用于压缩三个比特位，以得到一个求和输出位和一个进位输出位，该求和输出位的相位与该三个比特位的相位相反，该进位输出位的相位与该三个比特位的相位相同。

示例性的，如图6所示，假设输入该反相求和加法器的三个比特位分别为IN0、IN1和IN2，该反相求和加法器压缩该三个比特位IN0、IN1和IN2后，输出一个进位比特位C和一个求和比特位/S，C与IN0、IN1和IN2的相位相同，/S与IN0、IN1和IN2的相位相反。在一种示例中，该反相求和加法器可以满足如下公式(1-1)和(1-2)所示的逻辑功能，NOT表示取反运算，XOR表示或非运算，AND表示与运算，OR表示或运算。

/S＝NOT(IN0 XOR IN1 XOR IN2) (1-1)

C＝(IN0 AND IN1)OR(IN1 AND IN2)OR(IN0 AND IN2) (1-2)

当该三个比特位为不同的数值(比如，0或1)时，该反相求和加法器用于执行以下压缩：若该三个比特位均为0，则该进位输出位为0，该求和输出位为1；若该三个比特位均为1，则该进位输出位为1，该求和输出位为0；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为0，该求和输出位为0；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则该进位输出位为1，该求和输出位为1。也即是，该反相求和加法器可以根据如下表1所示的逻辑表进行压缩。

表1

IN0	IN1	IN2	C	/S
0	0	0	0	1
0	0	1	0	0
0	1	0	0	0
1	0	0	0	0

1	1	0	1	1
1	0	1	1	1
1	1	0	1	1
1	1	1	1	0

当第一压缩器211为该反相求和加法器时，该第一压缩器211用于：压缩正相的三个比特位，以得到一个正相的进位输出位和一个反相的求和输出位。当第二压缩器221为该反相求和加法器时，该第二压缩器221用于：压缩反相的三个比特位，以得到一个反相的进位输出位和一个正相的求和输出位。

在一种可能的实施例中，假设该W个压缩器层中的每个压缩器层均包括多个反相求和加法器，且第1个压缩器层(即L1)的输入阵列仅包括多个正相的比特位，第2个至第W个压缩器(即L2至LW)的输入阵列均包括多个正相的比特位(即第一阵列)和多个反相的比特位(即第二阵列)。上述描述也可以理解为：第1个压缩器层(即L1)中仅包括一个第一压缩电路21，该第一压缩电路21包括多个第一压缩器211；第2个至第W个压缩器层(即L2至LW)中的每个压缩器层均包括一个第一压缩电路21和一个第二压缩电路22，该第一压缩电路21包括多个第一压缩器211，该第二压缩电路22包括多个第二压缩器221。

示例性的，如图7所示，当利用该累加器对27个6bits的二进制数作累加计算时，第1个压缩器层(即L1)中包括54个第一压缩器211，每个第一压缩器211用于对同一数位上的三个正相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。第2个压缩器层(即L2)的输入矩阵包括该54个第一压缩器211输出的输出位。其中，该输入矩阵中的第一矩阵包括该54个第一压缩器211输出的正相的进位输出位C，第二矩阵包括该54个第一压缩器211输出的反相的求和输出位/S。

第2个压缩器层(即L2)中的第一压缩电路21包括18个第一压缩器211，第二压缩电路22包括18个第二压缩器221。该18个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。该18个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。第3个压缩器层(即L3)的输入矩阵包括该18个第一压缩器211和该18个第二压缩器221输出的输出位。其中，该输入矩阵中的第一矩阵包括该18个第一压缩器211输出的正相的进位输出位C和该18个第二压缩器221输出的正相的求和输出位S，第二矩阵包括该18个第一压缩器211输出的反相的求和输出位/S和该18个第二压缩器221输出的反相的进位输出位/C。

第3个压缩器层(即L3)中的第一压缩电路21包括12个第一压缩器211，第二压缩电路22包括12个第二压缩器221。该12个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。该12个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。第4个压缩器层(即L4)的输入矩阵包括该12个第一压缩器211和该12个第二压缩器221输出的输出位。其中，该输入矩阵中的第一矩阵包括该12个第一压缩器211输出的正相的进位输出位C和该12个第二压缩器221输出的正相的求和输出位S，第二矩阵包括该12个第一压缩器211输出的反相的求和输出位/S和该12个第二压缩器221输出的反相的进位输出位/C。

第4个压缩器层(即L4)中的第一压缩电路21包括6个第一压缩器211，第二压缩电路22包括6个第二压缩器221。该6个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。该6个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。第4个压缩器层(即L4)的输出矩阵包括：该6个第一压缩器211输出的正相的进位输出位C和反相的求和输出位/S，该6个第二压缩器221输出的反相的进位输出位/C和正相的求和输出位S，以及上述第一阵列未被压缩的正相的比特位和上述第二阵列中未被压缩的反相的比特位。

需要说明的是，图7中仅示出了该累加器中的第1个至第4个压缩器层(即L1至L4)，第4个压缩器层之后的其他压缩器层的压缩方式可以采用上述第2个至第4个压缩器层类似的方式进行压缩，或者将第4个压缩器层的输出矩阵中不同相位的比特位通过取反运算转换为同一相位的比特位，再通过现有的压缩方式进行压缩，也本申请实施例在此不再赘述。

第二种、反相进位加法器，用于压缩三个比特位，以得到一个求和输出位和一个进位输出位，该求和输出位的相位与该三个比特位的相位相同，该进位输出位的相位与该三个比特位的相位相反。

示例性的，如图8所示，假设输入该反相进位加法器的三个比特位分别为IN0、IN1和IN2，该反相进位加法器压缩该三个比特位IN0、IN1和IN2后，输出一个进位比特位/C和一个求和比特位S，/C与IN0、IN1和IN2的相位相反，S与IN0、IN1和IN2的相位相同。在一种示例中，该反相进位加法器可以满足如下公式(2-1)和(2-2)所示的逻辑功能，NOT表示取反运算，XOR表示或非运算，AND表示与运算，OR表示或运算。

S＝IN0 XOR IN1 XOR IN2 (2-1)

/C＝NOT((IN0 AND IN1)OR(IN1 AND IN2)OR(IN0 AND IN2)) (2-2)

当该三个比特位为不同的数值(比如，0或1)时，该反相进位加法器用于执行以下压缩：若该三个比特位均为0，则该进位输出位为1，该求和输出位为0；若该三个比特位均为1，则该进位输出位为0，该求和输出位为1；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为1，该求和输出位为1；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则该进位输出位为0，该求和输出位为0。也即是，该反相进位加法器可以根据如下表2所示的逻辑表进行压缩。

表2

IN0	IN1	IN2	/C	S
0	0	0	1	0
0	0	1	1	1
0	1	0	1	1
1	0	0	1	1

1	1	0	0
1	0	1	0
1	1	0	0
1	1	1	1

当第一压缩器211为该反相进位加法器时，该第一压缩器211用于：压缩正相的三个比特位，以得到一个反相的进位输出位和一个正相的求和输出位。当第二压缩器221为该反相进位加法器时，该第二压缩器221用于：压缩反相的三个比特位，以得到一个正相的进位输出位和一个反相的求和输出位。

在一种可能的实施例中，假设该W个压缩器层中的每个压缩器层均包括多个反相进位加法器，且第1个压缩器层(即L1)的输入阵列仅包括多个正相的比特位，第2个至第W个压缩器(即L2至LW)的输入阵列均包括多个正相的比特位(即第一阵列)和多个反相的比特位(即第二阵列)。上述描述可以理解为：第1个压缩器层(即L1)中仅包括一个第一压缩电路21，该第一压缩电路21包括多个第一压缩器211；第2个至第W个压缩器层(即L2至LW)中的每个压缩器层均包括一个第一压缩电路21和一个第二压缩电路22，该第一压缩电路21包括多个第一压缩器211，该第二压缩电路22包括多个第二压缩器221。

示例性的，如图9所示，当利用该累加器对27个6bits的二进制数作累加计算时，第1个压缩器层(即L1)中包括54个第一压缩器211，每个第一压缩器211用于对同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。第2个压缩器层(即L2)的输入矩阵包括该54个第一压缩器211输出的输出位。其中，该输入矩阵中的第一矩阵包括该54个第一压缩器211输出的反相的进位输出位/C，第二矩阵包括该54个第一压缩器211输出的正相的求和输出位S。

第2个压缩器层(即L2)中的第一压缩电路21包括18个第一压缩器211，第二压缩电路22包括18个第二压缩器221。该18个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。该18个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。第3个压缩器层(即L3)的输入矩阵包括该18个第一压缩器211和该18个第二压缩器221输出的输出位。其中，该输入矩阵中的第一矩阵包括该18个第一压缩器211输出的正相的求和输出位S和该18个第二压缩器221输出的正相的进位输出位C，第二矩阵包括该18个第一压缩器211输出的反相的进位输出位/C和该18个第二压缩器221输出的反相的求和输出位/S。

第3个压缩器层(即L3)中的第一压缩电路21包括12个第一压缩器211，第二压缩电路22包括12个第二压缩器221。该12个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。该12个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。第4个压缩器层(即L4)的输入矩阵包括包括该12个第一压缩器211和该12个第二压缩器221输出的输出位。其中，该输入矩阵中的第一矩阵包括该12个第一压缩器211输出的正相的求和输出位S和该12个第二压缩器221输出的正相的进位输出位S，第二矩阵包括该12个第一压缩器211输出的反相的进位输出位/C和该12个第二压缩器221输出的反相的求和输出位/S。

第4个压缩器层(即L4)中的第一压缩电路21包括6个第一压缩器211，第二压缩电路22包括6个第二压缩器221。该6个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个正相的求和输出位S。该6个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个正相的进位输出位C和一个反相的求和输出位/S。第4个压缩器层(即L4)的输出矩阵包括：该6个第一压缩器211输出的反相的进位输出位/C和正相的求和输出位S，该6个第二压缩器221输出的反相的求和输出位/S和正相的进位输出位C，以及上述第一阵列未被压缩的正相的比特位和上述第二阵列中未被压缩的反相的比特位。

需要说明的是，图9中仅示出了该累加器中的第1个至第4个压缩器层(即L1至L4)，第4个压缩器层之后的其他压缩器层的压缩方式可以采用上述第2个至第4个压缩器层类似的方式进行压缩，或者将第4个压缩器层的输出矩阵中不同相位的比特位通过取反运算转换为同一相位的比特位，再通过现有的压缩方式进行压缩，也本申请实施例在此不再赘述。

另外，上述第一种和第二种的示例中均以第1个压缩器层(即L1)的输入矩阵仅包括多个正相的比特位为例进行说明，并不对本申请实施例构成限制。在实际应用中，第1个压缩器层(即L1)的输入矩阵也可以仅包括多个反相的比特位，或者同时包括正相的比特位和反相的比特位。

第三种、双反相加法器，用于压缩三个比特位，以得到一个求和输出位和一个进位输出位，该求和输出位的相位和该进位输出位的相位均与该三个比特位的相位相反。

示例性的，如图10所示，假设输入该双反相加法器的三个比特位分别为IN0、IN1和IN2，该双反相加法器压缩该三个比特位IN0、IN1和IN2后，输出一个进位比特位/C和一个求和比特位/S，/C和/S的相位与IN0、IN1和IN2的相位均相反。在一种示例中，该双反相加法器可以满足如下公式(3-1)和(3-2)所示的逻辑功能，NOT表示取反运算，XOR表示或非运算，AND表示与运算，OR表示或运算。

S＝NOT(IN0 XOR IN1 XOR IN2) (3-1)

/C＝NOT((IN0 AND IN1)OR(IN1 AND IN2)OR(IN0 AND IN2)) (3-2)

当该三个比特位为不同的数值(比如，0或1)时，该双反相加法器用于执行以下压缩：若该三个比特位均为0，则该进位输出位为1，该求和输出位为1；若该三个比特位均为1，则该进位输出位为0，该求和输出位为0；若该三个比特位中存在一个比特位为1、另外两个比特位为0，则该进位输出位为1，该求和输出位为0；若该三个比特位中存在两个比特位为1、另外一个比特位为0，则该进位输出位为0，该求和输出位为1。也即是，该双反相加法器可以根据如下表3所示的逻辑表进行压缩。

表3

IN0	IN1	IN2	/C	S
0	0	0	1	1
1	1	1	0	0

0	0	1	1	0
0	1	0	1	0
1	0	0	1	0
1	1	0	0	1
1	0	1	0	1
1	1	0	0	1

当第一压缩器211为该双反相加法器时，该第一压缩器211用于：压缩正相的三个比特位，以得到一个反相的进位输出位和一个反相的求和输出位。当第二压缩器221为该双反相加法器时，该第二压缩器221用于：压缩反相的三个比特位，以得到一个正相的进位输出位和一个正相的求和输出位。

在一种可能的实施例中，假设该W个压缩器层中的每个压缩器层均包括多个双反相加法器，且第1个至第W个压缩器(即L1至LW)的输入阵列均包括一个第一阵列和一个第二阵列。上述描述可以理解为：第1个至第W个压缩器层(即L1至LW)中的每个压缩器层均包括一个第一压缩电路21和一个第二压缩电路22，该第一压缩电路21包括多个第一压缩器211，该第二压缩电路22包括多个第二压缩器221。

示例性的，如图11所示，当利用该累加器对18个6bits的二进制数作累加计算时，若该18个二进制数中的前9个二进制数为正相的比特位(即第一矩阵)、后9个二进制数为反相的比特位(即第二矩阵)，则第1个压缩器层(即L1)中的第一压缩电路21包括18个第一压缩器211，第二压缩电路22包括18个第二压缩器221。该18个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个反相的求和输出位/S。该18个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个正相的进位输出位C和一个正相的求和输出位S。第2个压缩器层(即L2)的输入矩阵中的第一矩阵包括该18个第二压缩器221输出的正相的进位输出位C和正相的求和输出位S，第二矩阵包括该18个第一压缩器211输出的反相进位输出位/C和反相的求和输出位/S。

第2个压缩器层(即L2)中的第一压缩电路21包括12个第一压缩器211，第二压缩电路22包括12个第二压缩器221。该12个第一压缩器211中的每个第一压缩器211用于对第一矩阵中同一数位上的三个正相的比特位进行压缩，以输出一个反相的进位输出位/C和一个反相的求和输出位/S。该12个第二压缩器221中的每个第二压缩器221用于对第二矩阵中同一数位上的三个反相的比特位进行压缩，以输出一个正相的进位输出位C和一个正相的求和输出位S。第2个压缩器层(即L2)的输出矩阵包括：该12个第一压缩器211输出的反相的求和输出位/S和反相的进位输出位/C，以及该12个第二压缩器221输出的正相的求和输出位S和正相的进位输出位C。

需要说明的是，图11中仅示出了该累加器中的第1个至第2个压缩器层(即L1至L2)，第2个压缩器层之后的其他压缩器层的压缩方式可以采用上述第1个至第2个压缩器层类似的方式进行压缩，或者将第2个压缩器层的输出矩阵中不同相位的比特位通过取反运算转换为同一相位的比特位，再通过现有的压缩方式进行压缩，也本申请实施例在此不再赘述。

可选的，当该W个压缩器层中的至少一个第一压缩器层包括多个第一压缩器层时，该多个第一压缩器层中位于不同层级上的第一压缩器层的压缩方式可以是相同的，也可以是不同的。比如，该多个第一压缩器层包括至少两个第一压缩器层，该至少两个第一压缩器层中的每个第一压缩器和每个第二压缩器可以均采用上述三种加法器中一种。或者，该至少两个第一压缩器层中的一部分第一压缩器层中的每个第一压缩器和每个第二压缩器均采用上述三种加法器中一种，另一部分第一压缩器层中的每个第一压缩器和每个第二压缩器均采用上述上述三种加法器中的另外两种中的一种或两种。

进一步的，该累加器还可以包括：求和电路23，用于接收该多个累加值，并对该多个累加值求和以得到该累加和。具体的，在该W个压缩器层压缩该多个二进制数得到该多个累加值后，该W个压缩器层中的第W个压缩器层(即LW)可以将该多个累加值发送给求和电路23，求和电路23在接收到该多个累加值时，对该多个累加值求和即可得到该多个二进制数的累加和。可选的，该多个累加值为两个累加值，此时该求和电路23为加法器，该加法器对该两个累加值求和得到该多个二进制数的累加和。

进一步的，该累加器还可以包括：一个或多个反相器，用于对该W个压缩器层中的一个或多个第一压缩器或第二压缩器所输出的求和输出位和进位输出位中的至少一个取反、或对输入该一个或多个第一压缩器或第二压缩器的三个比特位取反。在一种可能的实施例中，该一个或多个反相器用于：对该W个压缩器层中的一个或多个第一压缩器或第二压缩器所输出的求和输出位和进位输出位中的至少一个取反。

示例性的，如图12所示，以该W个压缩器层中的第i个压缩器层(即1≤i≤W)为例，假设第i个压缩器层的输入矩阵包括3行6列的正相比特位，第i个压缩器层包括6个第一压缩器，且该6个第一压缩器均为反相求和加法器。该6个第一压缩器用于对该输入矩阵进行压缩以输出两行，该两行中的第一行包括6个反相的求和输出位/S、第二行包括6个正相的进位输出位C。此时，该一个或多个反相器可以包括6个反相器，该6个反相器可用于分别对第一行的6个反相的求和输出位/S进行取反，以得到6个正相的求和输出位S。经过取反之后，第i个压缩器层输出的这两行被转换为正相的两行。

在另一种可能的实施例中，该一个或多个反相器用于：对输入该W个压缩器层中的一个或多个第一压缩器或第二压缩器的三个比特位取反。示例性的，如图13所示，以该W个压缩器层中的第i个压缩器层(即1≤i≤W)为例，假设第i个压缩器层的输入矩阵包括6行3列的比特位，其中第1行至第3行为正相的比特位、第4行至第6行为反相的比特位，第i个压缩器层包括6个第一压缩器，且该6个第一压缩器均为反相求和加法器。此时，该一个或多个反相器可以包括9个反相器，该9个反相器可用于分别对第4行至第6行中反相的9个比特位进行取反，以得到9个正相的比特位(即将第4行至第6行中的比特位转换为正相)，即该9个反相器可用于对输入第二行中的3个第一压缩器的比特位取反。经过取反之后，第1个压缩器层中的6个第一压缩器可分别用于对同一数据上正相的三个比特位进行压缩以输出四行，这四行中包括两行反相的求和输出位/S和两行正相的进位输出位C。

需要说明的是，上述图12和图13所示的第i个压缩器层的输入矩阵、以及所包括的第一压缩器仅为示例性的，并不构成对本申请实施例的限制。在本申请实施例中，通过该一个或者多个反相器对一个或多个第一压缩器或第二压缩器所输出的求和输出位和进位输出位中的至少一个取反、或对输入该一个或多个第一压缩器或第二压缩器的三个比特位取反，能够在保证压缩结果准确的情况下，提高该W个压缩器层的压缩效率，进而提高该累加器的计算效率。

图14为本申请实施例提供的一种反相求和压缩算子电路的结构示意图，该反相求和算子电路也可以称为反相求和加法器。该反相求和加法器包括：第一晶体管M1、第二晶体管M2、第三晶体管M3、第四晶体管M4、第五晶体管M5、第六晶体管M6、第七晶体管M7、第八晶体管M8、第九晶体管M9、第十晶体管M10、第十一晶体管M11、第十二晶体管M12、第十三晶体管M13、第十四晶体管M14、第十五晶体管M15、第十六晶体管M16、第十七晶体管M17、第十八晶体管M18、第十九晶体管M19、第二十晶体管M20、第二十一晶体管M21、第二十二晶体管M22、第二十三晶体管M23和第二十四晶体管M24。

其中，第一晶体管M1和第二晶体管M2并联耦合在电源端和第一节点①之间；第三晶体管M3耦合在第一节点①和第二节点②之间；第四晶体管M4耦合在第二节点②和第三节点③之间；第五晶体管M5和第六晶体管M6并联耦合在第三节点③和接地端之间；第七晶体管M7耦合在电源端和第四节点④之间；第八晶体管M8耦合在第二节点②和第四节点④之间；第九晶体管M9耦合在第二节点②和第五节点⑤之间；第十晶体管M10和第十一晶体管M11串联耦合在第四节点④和第一输出端/C之间；第十二晶体管M12和第十三晶体管M13串联耦合在第五节点⑤和第一输出端/C之间；第十四晶体管M14耦合在第五节点⑤和接地端之间；第十五晶体管M15、第十六晶体管M16和第十七晶体管M17并联耦合在电源端和第六节点⑥之间；第十八晶体管M18耦合在第一输出端/C与第六节点⑥之间；第十九晶体管M19耦合在第一输出端/C与第七节点⑦之间；第二十晶体管M20、第二十一晶体管M21和第二十二晶体管M22并联耦合在第七节点⑦与接地端之间。

第三晶体管M3、第四晶体管M4、第十一晶体管M11、第十二晶体管M12、第十五晶体管M15和第二十晶体管M20的控制端用于接收第一输入IN0；第一晶体管M1、第五晶体管M5、第七晶体管M7、第十四晶体管M14、第十六晶体管M16和第二十一晶体管M21的控制端用于接收第二输入IN2；第二晶体管M2、第六晶体管M6、第八晶体管M8、第九晶体管M9、第十晶体管M10、第十三晶体管M13、第十七晶体管M17和第二十二晶体管M22的控制端用于接收第三输入IN3。

第十八晶体管M18和第十九晶体管M19的控制端均耦合于第二节点②；第二十三晶体管M23和第二十四晶体管M24串联耦合在电源端和接地端之间，第二十三晶体管M23和第二十四晶体管M24的耦合点为第二输出端S；第二十三晶体管M23和第二十四晶体管M24的控制端均耦合于第二节点②。

在本申请实施例中，上述第一输入IN0、第二输入IN2和第三输入IN3可以是上述累加器实施例中关于反相求和加法器的相关描述中的所述三个比特位，第一输出端/S可以用于输出所述反相求和加法器的求和输出位，第二输出端C可以用于输出所述反相求和加法器的进位输出位。

可选的，第一晶体管M1、第二晶体管M2、第三晶体管M3、第七晶体管M7、第八晶体管M8、第十晶体管M10、第十一晶体管M11、第十五晶体管M15、第十六晶体管M16、第十七晶体管M17、第十八晶体管M18和第二十三晶体管M23是PMOS晶体管；第四晶体管M4、第五晶体管M5、第六晶体管M6、第九晶体管M9、第十二晶体管M12、第十三晶体管M13、第十四晶体管M14、第十九晶体管M19、第二十晶体管M20、第二十一晶体管M21、第二十二晶体管M22和第二十四晶体管M24是NMOS晶体管。相应的，上述控制端具体可以是指相应的PMOS晶体管或者NMOS晶体管的栅极。

需要说明的是，上述举例的第一晶体管M1至第二十四晶体管M24可以是MOS晶体管，也可以用双极型晶体管代替，图14中所示的各晶体管的类型仅为示例性的，并不对本申请实施例构成限制。另外，图14仅是一种电路实例，对于任何在此电路基础上增加晶体管，而使多个晶体管所起的作用等同于图14中的一个或者多个晶体管作用的，也视为同种电路。

图15为本申请实施例提供的一种反相进位压缩算子电路的结构示意图，该反相进位算子电路也可以称为反相进位加法器。该反相进位加法器包括：第一晶体管M1、第二晶体管M2、第三晶体管M3、第四晶体管M4、第五晶体管M5、第六晶体管M6、第七晶体管M7、第八晶体管M8、第九晶体管M9、第十晶体管M10、第十一晶体管M11、第十二晶体管M12、第十三晶体管M13、第十四晶体管M14、第十五晶体管M15、第十六晶体管M16、第十七晶体管M17、第十八晶体管M18、第十九晶体管M19、第二十晶体管M20、第二十一晶体管M21、第二十二晶体管M22、第二十三晶体管M23和第二十四晶体管M24。

其中，第一晶体管M1和第二晶体管M2并联耦合在电源端和第一节点①之间；第三晶体管M3耦合在第一节点①和第一输出端/C之间；第四晶体管M4耦合在第一输出端/C和第二节点②之间；第五晶体管M5和第六晶体管M6并联耦合在第二节点②和接地端之间；第七晶体管M7耦合在电源端和第三节点③之间；第八晶体管M8耦合在第三节点③和第一输出端/C之间；第九晶体管M9耦合在第一输出端/C和第四节点④之间；第十晶体管M10和第十一晶体管M11串联耦合在第三节点③和第五节点⑤之间；第十二晶体管M12和第十三晶体管M13串联耦合在第四节点④和第五节点⑤之间；第十四晶体管M14耦合在第四节点④和接地端之间；第十五晶体管M15、第十六晶体管M16和第十七晶体管M17并联耦合在电源端和第六节点⑥之间；第十八晶体管M18耦合在第五节点⑤与第六节点⑥之间；第十九晶体管M19耦合在第五节点⑤与第七节点⑦之间；第二十晶体管M20、第二十一晶体管M21和第二十二晶体管M22并联耦合在第七节点⑦与接地端之间。

第十八晶体管M18和第十九晶体管M19的控制端均耦合于第一输出端/C；第二十三晶体管M23和第二十四晶体管M24串联耦合在电源端和接地端之间，第二十三晶体管M23和第二十四晶体管M24的耦合点为第二输出端S；第二十三晶体管M23和第二十四晶体管M24的控制端均耦合于第五节点⑤。

在本申请实施例中，上述第一输入IN0、第二输入IN2和第三输入IN3可以是上述累加器实施例中关于反相进位求和加法器的相关描述中的所述三个比特位，第一输出端/C可以用于输出所述反相进位加法器的求和输出位，第二输出端S可以用于输出所述反相进位加法器的进位输出位。

需要说明的是，上述举例的第一晶体管M1至第二十四晶体管M24可以是MOS晶体管，也可以用双极型晶体管代替，图15中所示的各晶体管的类型仅为示例性的，并不对本申请实施例构成限制。另外，图15仅是一种电路实例，对于任何在此电路基础上增加晶体管，而使多个晶体管所起的作用等同于图15中的一个或者多个晶体管作用的，也视为同种电路。

图16为本申请实施例提供的一种双反相压缩算子电路的结构示意图，该双反相算子电路也可以称为双反相加法器。该双反相加法器包括：第一晶体管M1、第二晶体管M2、第三晶体管M3、第四晶体管M4、第五晶体管M5、第六晶体管M6、第七晶体管M7、第八晶体管M8、第九晶体管M9、第十晶体管M10、第十一晶体管M11、第十二晶体管M12、第十三晶体管M13、第十四晶体管M14、第十五晶体管M15、第十六晶体管M16、第十七晶体管M17、第十八晶体管M18、第十九晶体管M19、第二十晶体管M20、第二十一晶体管M21和第二十二晶体管M22。

其中，第一晶体管M1和第二晶体管M2并联耦合在电源端和第一节点①之间；第三晶体管M3耦合在第一节点①和第一输出端/C之间；第四晶体管M4耦合在第一输出端/C和第二节点②之间；第五晶体管M5和第六晶体管M6并联耦合在第二节点②和接地端之间；第七晶体管M7耦合在电源端和第三节点③之间；第八晶体管M8耦合在第三节点③和第一输出端/C之间；第九晶体管M9耦合在第一输出端/C和第四节点④之间；第十晶体管M10耦合在第四节点④和接地端之间；第十一晶体管M11和第十二晶体管M12串联耦合在第三节点③和第二输出端/S之间；第十三晶体管M13和第十四晶体管M14串联耦合在第二输出端/S和第四节点④之间；第十五晶体管M15、第十六晶体管M16和第十七晶体管M17并联耦合在电源端和第五节点⑤之间；第十八晶体管M18耦合在第五节点⑤与第二输出端/S；第十九晶体管M19耦合在第二输出端/S和第六节点⑥之间；第二十晶体管M20、第二十一晶体管M21和第二十二晶体管M22并联耦合在第六节点⑥接地端之间。

第三晶体管M3、第四晶体管M4、第十二晶体管M12、第十三晶体管M13、第十五晶体管M15和第二十晶体管M20的控制端用于接收第一输入IN0；第一晶体管M1、第五晶体管M5、第七晶体管M7、第十晶体管M10、第十六晶体管M16和第二十一晶体管M21的控制端用于接收第二输入IN2；第二晶体管M2、第六晶体管M6、第八晶体管M8、第九晶体管M9、第十一晶体管M11、第十四晶体管M14、第十七晶体管M17和第二十二晶体管M22的控制端用于接收第三输入IN3。第十八晶体管M18和第十九晶体管M19的控制端均耦合于第一输出端/C。

在本申请实施例中，上述第一输入IN0、第二输入IN2和第三输入IN3可以是上述累加器实施例中关于双反相加法器的相关描述中的所述三个比特位，第一输出端/C可以用于输出所述双反相加法器的求和输出位，第二输出端S可以用于输出所述双反相加法器的进位输出位。

可选的，第一晶体管M1、第二晶体管M2、第三晶体管M3、第七晶体管M7、第八晶体管M8、第十一晶体管M11、第十二晶体管M12、第十五晶体管M15、第十六晶体管M16、第十七晶体管M17和第十八晶体管M18是PMOS晶体管；第四晶体管M4、第五晶体管M5、第六晶体管M6、第九晶体管M9、第十晶体管M10、第十三晶体管M13、第十四晶体管M14、第十九晶体管M19、第二十晶体管M20、第二十一晶体管M21和第二十二晶体管M22是NMOS晶体管。相应的，上述控制端具体可以是指相应的PMOS晶体管或者NMOS晶体管的栅极。

需要说明的是，上述举例的第一晶体管M1至第二十二晶体管M22可以是MOS晶体管，也可以用双极型晶体管代替，图16中所示的各晶体管的类型仅为示例性的，并不对本申请实施例构成限制。另外，图16仅是一种电路实例，对于任何在此电路基础上增加晶体管，而使多个晶体管所起的作用等同于图16中的一个或者多个晶体管作用的，也视为同种电路。

基于此，本申请实施例还提供一种乘法器，如图17所示，该乘法器可以包括：多组编码器301和累加器302，该多组编码器301可用于对二进制数表示的第一数值和第二数值作编码，以得到多个部分积项，该累加器302可用于对该多个部分积项作累加，以得到第一数值和第二数值的乘积。其中，该累加器302可以为上述上文所提供的任意一种累加器，该多个部分积项可以作为上述累加器的W个压缩器层中的第1个压缩器层的输入阵列。

可选的，该乘法器还可以包括：多个预编码器303。该多个预编码器303可用于对第一数值作预编码，以得到预编码结果；相应的，该多组编码器301可用于对该预编码结果和第二数值作编码，以得到上述多个部分积项。关于图17所示的乘法器的更具体描述可进一步参照国际专利PCT/CN2019/119993。

本申请实施例将采用上文所提供的累加器的乘法器(下文中称为反相累加乘法器)，与现有基于标准加法器实现的累加器的乘法器(下文中称为传统累加乘法器)进行了比较，具体在7nm工艺下的功耗和面积如图18所示，作为本申请的一个实施例，其不限定于以下具体参数值。图18中的(a)示出了利用该反相累加乘法器和该传统累加乘法器分别在两个8bits至32bits的二进制数做乘法运算时，其对应的累加器中的功耗大小。图18中的(b)示出了利用该反相累加乘法器和该传统累加乘法器分别在两个8bits至32bits的二进制数做乘法运算时，其对应的累加器中的面积大小。由图18可以看出，该反相累加乘法器的功耗和面积均小于该传统累加乘法器的功耗和面积。

本申请实施例中，由于在该反相累加乘法器的累加器中，至少一个第一压缩器层中的每个第一压缩器层的输入阵列包括第一阵列和第二阵列，第一阵列可以认为是一个包括多个正相的比特位的华莱士树，第二阵列可以认为是一个包括多个反相的比特位的华莱士树。也即是，该输入阵列包括两个华莱士树，这两个华莱士树中包括的比特位的相位相反。对于第一阵列和第二阵列，第一压缩电路21用于压缩第一阵列，第二压缩电路22用于压缩第二阵列，从而该输入阵列中不同相位的比特位可以由不同的压缩电路来压缩，从而无需将每个第一压缩器层的输入阵列中的比特位都统一为同一相位，从而使得该累加器相对于传统设计实现简单，且能够降低面积和功耗。因此，采用该累加器的乘法器的面积和功耗也较小。

在本申请的另一个实施例中，还提供一种处理器，包括累加器、乘法器或算子电路；其中，该累加器为包括上文所提供的累加器，该乘法器为上文所提供的包括该累加器的乘法器，该算子电路包括上文所提供的任意一种或者多个算子电路。

在本申请的的另一个实施例中，提供一种芯片，包括累加器、乘法器或算子电路；其中，该累加器为包括上文所提供的累加器，该乘法器为上文所提供的包括该累加器的乘法器，该算子电路包括上文所提供的任意一种或者多个算子电路。

在本申请的另一个实施例中，还提供一种通信设备，该通信设备的结构可以如图4所示，即该通信设备可以包括存储器101、处理器102、通信接口103和总线104。其中，该处理器102中可以包括上文所提供的累加器，或者上文所提供的包括该累加器的乘法器。

需要说明的是，上文中关于该累加器和算子电路的相关描述，均可以对应援引到图16所示的乘法器、处理器、芯片和该通信设备中所包括的累加器和算子电路中，本申请实施例在此不再赘述。

最后应说明的是：以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种累加器，其特征在于，包括W个压缩器层，W为大于或等于1的整数；

所述W个压缩器层，用于压缩多个二进制数，以得到多个累加值，所述多个累加值之和为所述多个二进制数的累加和；

其中，所述W个压缩器层包括至少一个第一压缩器层，每个第一压缩器层用于压缩输入阵列以得到输出阵列，所述输入阵列包括第一阵列和第二阵列，所述第一阵列包括多个正相的比特位，所述第二阵列包括多个反相的比特位，所述输出阵列包括第一压缩阵列和第二压缩阵列；

其中，所述每个第一压缩器层包括：

第一压缩电路，用于压缩所述第一阵列，以得到所述第一压缩阵列；

第二压缩电路，用于压缩所述第二阵列，以得到所述第二压缩阵列。
根据权利要求1所述的累加器，其特征在于，所述第一压缩电路包括一个或多个第一压缩器，所述一个或多个第一压缩器中的每个第一压缩器用于压缩所述第一阵列中位于同一数位上的三个比特位；

所述第二压缩电路包括一个或多个第二压缩器，所述一个或多个第二压缩器中的每个第二压缩器用于压缩所述第二阵列中位于同一数位上的三个比特位。
根据权利要求2所述的累加器，其特征在于，所述每个第一压缩器和所述每个第二压缩器均为反相求和加法器；

所述反相求和加法器，用于压缩所述三个比特位，得到一个进位输出位和一个求和输出位，所述进位输出位的相位与所述三个比特位的相位相同，所述求和输出位的相位与所述三个比特位的相位相反。
根据权利要求3所述的累加器，其特征在于，所述反相求和加法器用于进行以下压缩：

若所述三个比特位均为0，则所述进位输出位为0，所述求和输出位为1；

若所述三个比特位均为1，则所述进位输出位为1，所述求和输出位为0；

若所述三个比特位中存在一个比特位为1、另外两个比特位为0，则所述进位输出位为0，所述求和输出位为0；

若所述三个比特位中存在两个比特位为1、另外一个比特位为0，则所述进位输出位为1，所述求和输出位为1。
根据权利要求2所述的累加器，其特征在于，所述每个第一压缩器和所述每个第二压缩器均为反相进位加法器；

所述反相进位加法器，用于压缩所述三个比特位，得到一个进位输出位和一个求和输出位，所述进位输出位的相位与所述三个比特位的相位相反，所述求和输出位的相位与所述三个比特位的相位相同。
根据权利要求5所述的累加器，其特征在于，所述反相进位加法器用于进行以下压缩：

若所述三个比特位均为0，则所述进位输出位为1，所述求和输出位为0；

若所述三个比特位均为1，则所述进位输出位为0，所述求和输出位为1；

若所述三个比特位中存在一个比特位为1、另外两个比特位为0，则所述进位输出位为1，所述求和输出位为1；

若所述三个比特位中存在两个比特位为1、另外一个比特位为0，则进位输出位为0，所述求和输出位为0。
根据权利要求2所述的累加器，其特征在于，所述每个第一压缩器和所述每个第二压缩器均为双反相加法器；

所述双反相加法器，用于压缩所述三个比特位，得到一个进位输出位和一个求和输出位，所述进位输出位和所述求和输出位的相位均与所述三个比特位的相位相反。
根据权利要求7所述的累加器，其特征在于，所述双反相加法器用于进行以下压缩：

若所述三个比特位均为0，则所述进位输出位为1，所述求和输出位为1；

若所述三个比特位均为1，则所述进位输出位为0，所述求和输出位为0；

若所述三个比特位中存在一个比特位为1、另外两个比特位为0，则所述进位输出位为1，所述求和输出位为0；

若所述三个比特位中存在两个比特位为1、另外一个比特位为0，则进位输出位为0，所述求和输出位为1。
根据权利要求1-8任一项所述的累加器，其特征在于，所述累加器还包括：

求和电路，用于接收所述多个累加值，并对所述多个累加值求和以得到所述累加和。
根据权利要求3-9任一项所述的累加器，其特征在于，所述累加器还包括：

一个或多个反相器，用于对所述W个压缩器层中的一个或多个第一压缩器或第二压缩器所输出的求和输出位和进位输出位中的至少一个取反、或对输入所述一个或多个第一压缩器或第二压缩器的所述三个比特位取反。
一种乘法器，其特征在于，所述乘法器包括编码器、以及如权利要求1-10任一项所述的累加器。
一种算子电路，其特征在于，包括：第一晶体管、第二晶体管、第三晶体管、第四晶体管、第五晶体管、第六晶体管、第七晶体管、第八晶体管、第九晶体管、第十晶体管、第十一晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管、第二十三晶体管和第二十四晶体管；其中，

所述第一晶体管和所述第二晶体管并联耦合在电源端和第一节点之间；

所述第三晶体管耦合在所述第一节点和第二节点之间；

所述第四晶体管耦合在所述第二节点和第三节点之间；

所述第五晶体管和所述第六晶体管并联耦合在所述第三节点和接地端之间；

所述第七晶体管耦合在所述电源端和第四节点之间；

所述第八晶体管耦合在所述第二节点和所述第四节点之间；

所述第九晶体管耦合在所述第二节点和第五节点之间；

所述第十晶体管和所述第十一晶体管串联耦合在所述第四节点和第一输出端之间；

所述第十二晶体管和所述第十三晶体管串联耦合在所述第五节点和所述第一输出端之间；

所述第十四晶体管耦合在所述第五节点和所述接地端之间；

所述第十五晶体管、所述第十六晶体管和所述第十七晶体管并联耦合在所述电源端和第六节点之间；

所述第十八晶体管耦合在所述第一输出端和所述第六节点之间；

所述第十九晶体管耦合在所述第一输出端和第七节点之间；

所述第二十晶体管、所述第二十一晶体管和所述第二十二晶体管并联耦合在所述第七节点和所述接地端之间；

所述第三晶体管、所述第四晶体管、所述第十一晶体管、所述第十二晶体管、所述第十五晶体管和所述第二十晶体管的控制端均用于接收第一输入；

所述第一晶体管、所述第五晶体管、所述第七晶体管、所述第十四晶体管、所述第十六晶体管和所述第二十一晶体管的控制端均用于接收第二输入；

所述第二晶体管、所述第六晶体管、所述第八晶体管、所述第九晶体管、所述第十晶体管、所述第十三晶体管、所述第十七晶体管和所述第二十二晶体管的控制端均用于接收第三输入；

所述第十八晶体管和所述第十九晶体管的控制端均耦合于所述第二节点；

所述第二十三晶体管和所述第二十四晶体管串联耦合在所述电源端和所述接地端之间，所述第二十三晶体管和所述第二十四晶体管的耦合点为第二输出端；

所述第二十三晶体管和所述第二十四晶体管的控制端均耦合于所述第二节点。
根据权利要求12所述的算子电路，其特征在于，所述第一晶体管、所述第二晶体管、所述第三晶体管、所述第七晶体管、所述第八晶体管、所述第十晶体管、所述第十一晶体管、所述第十五晶体管、所述第十六晶体管、所述第十七晶体管、所述第十八晶体管和所述第二十三晶体管是PMOS晶体管；

所述第四晶体管、所述第五晶体管、所述第六晶体管、所述第九晶体管、所述第十二晶体管、所述第十三晶体管、所述第十四晶体管、所述第十九晶体管、所述第二十晶体管、所述第二十一晶体管、所述第二十二晶体管和所述第二十四晶体管是NMOS晶体管。
一种算子电路，其特征在于，包括：第一晶体管、第二晶体管、第三晶体管、第四晶体管、第五晶体管、第六晶体管、第七晶体管、第八晶体管、第九晶体管、第十晶体管、第十一晶体管、第十二晶体管、第十三晶体管、第十四晶体管、第十五晶体管、第十六晶体管、第十七晶体管、第十八晶体管、第十九晶体管、第二十晶体管、第二十一晶体管、第二十二晶体管、第二十三晶体管和第二十四晶体管；其中，

所述第一晶体管和所述第二晶体管并联耦合在电源端和第一节点之间；

所述第三晶体管耦合在所述第一节点和第一输出端之间；

所述第四晶体管耦合在所述第一输出端和第二节点之间；

所述第五晶体管和所述第六晶体管并联耦合在所述第二节点和接地端之间；

所述第七晶体管耦合在所述电源端和第三节点之间；

所述第八晶体管耦合在所述第三节点和所述第一输出端之间；

所述第九晶体管耦合在所述第一输出端和第四节点之间；

所述第十晶体管和所述第十一晶体管串联耦合在所述第三节点和第五节点之间；

所述第十二晶体管和所述第十三晶体管串联耦合在所述第四节点和所述第五节点之间；

所述第十四晶体管耦合在所述第四节点和所述接地端之间；

所述第十五晶体管、所述第十六晶体管和所述第十七晶体管并联耦合在所述电源端和第六节点之间；

所述第十八晶体管耦合在所述第五节点和所述第六节点之间；

所述第十九晶体管耦合在所述第五节点和第七节点之间；

所述第二十晶体管、所述第二十一晶体管和所述第二十二晶体管并联耦合在所述第七节点和所述接地端之间；

所述第三晶体管、所述第四晶体管、所述第十一晶体管、所述第十二晶体管、所述第十五晶体管和所述第二十晶体管的控制端均用于接收第一输入；

所述第一晶体管、所述第五晶体管、所述第七晶体管、所述第十四晶体管、所述第十六晶体管和所述第二十一晶体管的控制端均用于接收第二输入；

所述第二晶体管、所述第六晶体管、所述第八晶体管、所述第九晶体管、所述第十晶体管、所述第十三晶体管、所述第十七晶体管和所述第二十二晶体管的控制端均用于接收第三输入；

所述第十八晶体管和所述第十九晶体管的控制端均耦合于所述第一输出端；

所述第二十三晶体管和所述第二十四晶体管串联耦合在所述电源端和所述接地端之间，所述第二十三晶体管和所述第二十四晶体管的耦合点为第二输出端；

所述第二十三晶体管和所述第二十四晶体管的控制端均耦合于所述第五节点。
根据权利要求14所述的算子电路，其特征在于，所述第一晶体管、所述第二晶体管、所述第三晶体管、所述第七晶体管、所述第八晶体管、所述第十晶体管、所述第十一晶体管、所述第十五晶体管、所述第十六晶体管、所述第十七晶体管、所述第十八晶体管和所述第二十三晶体管是PMOS晶体管；

所述第四晶体管、所述第五晶体管、所述第六晶体管、所述第九晶体管、所述第十二晶体管、所述第十三晶体管、所述第十四晶体管、所述第十九晶体管、所述第二十晶体管、所述第二十一晶体管、所述第二十二晶体管和所述第二十四晶体管是NMOS晶体管。