WO2022017179A1

WO2022017179A1 - 加法器、运算电路、芯片和计算装置

Info

Publication number: WO2022017179A1
Application number: PCT/CN2021/104880
Authority: WO
Inventors: 刘建波; 范志军; 李楠; 郭海丰
Original assignee: 深圳比特微电子科技有限公司
Priority date: 2020-07-22
Filing date: 2021-07-07
Publication date: 2022-01-27
Also published as: TW202143024A; TWI776580B; CN111708512A

Abstract

一种加法器（100）、运算电路（3000）、芯片和计算装置。所述加法器（100）用于计算输入的两个数字之和，加法器（100）具有分别表示两个数字的两个输入（111,112），每个输入被彼此对应地划分为多个子部分，多个子部分由低位到高位依次表示输入的部分位，加法器（100）包括：多个第一级加法模块（120-1,120-2,…,120-N），每一个用于对两个输入（111,112）的对应子部分进行求和；多个中间寄存器（130-1,130-2,…,130-N），每一个耦接到对应的第一级加法模块，用于存储两个输入（111、112）的对应子部分的和数；一个或多个进位寄存器（140-1,140-2,…,140-N），每一个耦接到对应的第一级加法模块，用于存储两个输入（111,112）的对应子部分的进位；以及第二级加法模块（150），耦接到多个中间寄存器（130-1,130-2,…,130-N）和一个或多个进位寄存器（140-1,140-2,…,140-N），用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。

Description

加法器、运算电路、芯片和计算装置

相关申请的交叉引用

本申请是以CN申请号为202010711949.8，申请日为2020年7月22日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开总体而言涉及数字电路。具体来说，涉及一种加法器，一种包括加法器的运算电路，以及芯片和计算装置。

背景技术

用于进行加法运算的加法器是许多运算电路的重要组成部分。在相关技术中，如果需要提高加法器的运算速度，通常会采用高速器件来实现加法器。

发明内容

根据本公开的一个方面，提供了一种加法器，其用于计算输入的两个数字之和，所述加法器具有分别表示所述两个数字的两个输入，其中每个输入被彼此对应地划分为多个子部分，所述多个子部分由低位到高位依次表示所述输入的部分位，并且所述加法器包括：多个第一级加法模块，每个第一级加法模块用于对所述两个输入的对应子部分进行求和；多个中间寄存器，每个中间寄存器耦接到对应的第一级加法模块，用于存储所述两个输入的对应子部分的和数；一个或多个进位寄存器，每个进位寄存器耦接到对应的第一级加法模块，用于存储所述两个输入的对应子部分的进位；以及第二级加法模块，耦接到所述多个中间寄存器和所述一个或多个进位寄存器，用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。

根据本公开的另一个方面，提供了一种加法器，其用于计算输入的一个数字与预定的常数之和，所述加法器具有表示所述数字的一个输入，所述输入被划分为多个子部分，所述多个子部分由低位到高位依次表示所述输入的部分位，并且所述加法器包括：一个或多个第一级加法模块，每个第一级加法模块用于对所述输入的对应子部分与所述常数的对应位进行求和；多个中间寄存器，每个中间寄存器耦接到对应的第一级加法模块，用于存储所述输入的对应子部分与所述常数的对应位的和数；一个或多个进位寄存器，每个进位寄存器耦接到对应的第一级加法模块，用于存储所述输入的对应子部分与所述常数的对应位的进位；以及第二级加法模块，耦接到所述多个中间寄存器和所述一个或多个进位寄存器，用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。

根据本公开的另一个方面，提供了一种运算电路，其包括如上所述的加法器；以及耦接到所述加法器的输入的前置组合逻辑模块和耦接到所述加法器的输出的后置组合逻辑模块中的至少一者。

根据本公开的另一个方面，提供了一种芯片，其包括如上所述的运算电路。

根据本公开的又一个方面，提供了一种计算装置，其包括如上所述的芯片。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得更为清楚。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1示出了根据本公开一个或多个示例性实施例的用于计算输入的两个数字之和的加法器的示意图。

图2示出了根据本公开一个或多个示例性实施例的用于计算输入的一个数字与预定的常数之和的加法器的示意图。

图3示出了包括根据本公开一个或多个示例性实施例的加法器的运算电路的一部分。

图4示出了包括根据相关技术的加法器的运算电路的一部分。

注意，在以下说明的实施方式中，有时在不同的附图之间共同使用同一附图标记来表示相同部分或具有相同功能的部分，而省略其重复说明。在一些情况中，使用相似的标号和字母表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

为了便于理解，在附图等中所示的各结构的位置、尺寸及范围等有时不表示实际的位置、尺寸及范围等。因此，本公开并不限于附图等所公开的位置、尺寸及范围等。

具体实施方式

下面将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。也就是说，本文中的结构及方法是以示例性的方式示出，来说明本公开中的结构和方法的不同实施例。然而，本领域技术人员将会理解，它们仅仅说明可以用来实施的本公开的示例性方式，而不是穷尽的方式。此外，附图不必按比例绘制，一些特征可能被放大以示出具体组件的细节。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

在相关技术中，如果需要提高加法器的运算速度，通常会采用高速器件来实现加法器。但是，高速器件的面积较大、功耗较高，这导致加法器以及包括加法器的运算电路的面积和功耗相应增大，使得芯片的制造成本和功耗显著增大。因此，期望以较低的制造成本和功耗来提高加法器的运算速度，因而需要一种改进的加法器。

图1示出了根据本公开一个或多个示例性实施例的加法器100的示意图。加法器100用于计算输入的两个数字之和。

如图1所示，加法器100具有两个输入111、112和两个输出161、162。其中，两个输入111、112分别表示输入的两个数字，并且输出161、162分别表示这两个数字的求和结果的和数及进位。

本领域技术人员应当理解，加法器100的输入和输出的配置不限于图1所示的实施例。可以根据加法器的功能和运算电路的需要而适当地调整加法器100的输入和输出的配置，并相应地调整加法器100的各个模块的配置。例如，在一些实施例中，加法器也可以仅具有一个输出，即仅输出求和结果的和数，而不输出进位。

如图1所示，每个输入111、112被彼此对应地划分为N个子部分，这N个子部分由低位到高位依次表示该输入的部分位。例如，输入111由低位到高位被划分为子部分111-1,111-2,…,111-N，输入112由低位到高位被划分为子部分112-1,112-2,…,112-N。

具体而言，第一个子部分111-1和112-1分别表示输入111和112的最低一位或多位，并且111-1和112-1所表示的位相同。相应地，第二个子部分111-2和112-2分别表示输入111和112的比111-1和112-1高的一位或多位，并且111-2和112-2所表示的位相同。依此类推，第N个子部分111-N和112-N分别表示输入111和112的最高一位或多位，并且111-N和112-N所表示的位相同。

其中，N应为大于或等于2的整数。即，每个输入111、112至少具有两个子部分。

在一些实施例中，如图1所示，表示输入111和112的和数的输出161被划分为两个子部分161-1、161-2。其中，161-1与输入111和112的第一个子部分111-1和112-1对应，表示输出161的最低一位或多位；161-2则与输入111和112的其他子部分对应，表示输出161的其他一位或多位。

本领域技术人员应当理解，本文中将输入和输出划分为多个子部分只是为了便于描述各个子部分的不同的耦接关系，并不意指或暗示各个子部分之间必然被物理地分隔或隔断。特别地，本领域技术人员应当理解，将输入和输出划分为耦接关系不同的多个子部分并不需要在数字电路中引入额外的部件或产生额外的成本。

如图1所示，加法器100包括第一级加法模块组120、中间寄存器组130、进位寄存器组140以及第二级加法模块150。

第一级加法模块组120耦接到输入111、112，包括多个第一级加法模块120-1,120-2,…,120-N。每个第一级加法模块120-1,120-2,…,120-N用于对两个输入111、112的对应子部分进行求和。

例如，第一个第一级加法模块120-1耦接到两个输入111、112的第一个子部分111-1和112-1，用于对111-1和112-1进行求和。

第一级加法模块的数量与输入的子部分的数量相等，并且每个第一级加法模块的配置可以根据输入的对应子部分的位数来确定。

第一级加法模块组120的输出耦接到中间寄存器组130和进位寄存器组140，将求和结果的和数与进位分别输出到中间寄存器组130和进位寄存器组140。

中间寄存器组130包括多个中间寄存器130-1,130-2,…,130-N。每个中间寄存器130-1,130-2,…,130-N耦接到对应的第一级加法模块120-1,120-2,…,120-N，用于存储两个输入111、112的对应子部分的求和结果的和数。

例如，第一个中间寄存器130-1耦接到第一个第一级加法模块120-1，用于存储 111-1和112-1的求和结果的和数。即，第一个中间寄存器130-1与两个输入111、112的第一个子部分111-1和112-1对应，用于存储两个输入111、112的由111-1和112-1所表示的最低一位或多位的求和结果的和数。

中间寄存器的数量与输入的子部分的数量相等，并且每个中间寄存器的配置可以根据输入的对应子部分的位数来确定。

进位寄存器组140包括多个进位寄存器140-1,140-2,…,140-N。每个进位寄存器140-1,140-2,…,140-N耦接到对应的第一级加法模块120-1,120-2,…,120-N，用于存储两个输入111、112的对应子部分的求和结果的进位。

例如，第一个进位寄存器140-1耦接到第一个第一级加法模块120-1，用于存储111-1和112-1的求和结果的进位。即，第一个进位寄存器140-1用于存储两个输入111、112的由111-1和112-1所表示的最低一位或多位的求和结果的进位。

进位寄存器的数量可以根据输入的子部分的数量来确定。在图1所示的实施例中，进位寄存器的数量与输入的子部分的数量相等。在其他实施例中，进位寄存器的数量可以比输入的子部分的数量少1。即，进位寄存器组140中可以不存在第N个进位寄存器140-N，不存储两个输入111、112的由111-N和112-N所表示的最高一位或多位的求和结果的进位。

进位寄存器的数量可以根据需要来确定。在加法器100需要输出两个输入111、112的求和结果的进位(即，加法器100包括输出162)的实施例中，可以将进位寄存器的数量确定为与输入的子部分的数量相等。在加法器100不需要输出两个输入111、112的求和结果的进位(即，加法器100不包括输出162)的实施例中，可以将进位寄存器的数量确定为比输入的子部分的数量少1，从而使加法器100的额外成本减少。例如，在两个输入111、112分别具有两个子部分的实施例中，加法器100可以仅包括一个进位寄存器。

进位寄存器仅用于存储进位，因此每个进位寄存器可以由1比特寄存器来实现。

中间寄存器组130和进位寄存器组140的输出耦接到第二级加法模块150，将两个输入111、112的各个对应的子部分分别求和的结果(包括和数与进位)输出到第二级加法模块150。

第二级加法模块150用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和，从而得到两个输入111、112之和。

具体而言，第二级加法模块150可以将从第一个中间寄存器130-1输出的两个输入111、112的由111-1和112-1所表示的最低一位或多位的求和结果的和数输出为两个输入111、112的求和结果的和数的对应最低一位或多位(即输出161的子部分161-1)。

进一步地，第二级加法模块150可以将从第二个中间寄存器130-2输出的两个输入111、112的由111-2和112-2所表示的一位或多位的求和结果的和数与从第一个进位寄存器140-1输出的两个输入111、112的由111-1和112-1所表示的最低一位或多位的求和结果的进位进行求和，而后将求和结果的和数输出为两个输入111、112的和数的对应一位或多位，并且将求和结果的进位用于第二级加法模块150中的进一步的运算。

依此类推，第二级加法模块150可以将从第N个中间寄存器130-N输出的两个输入111、112的由111-N和112-N所表示的最高一位或多位的求和结果的和数与从第N-1个进位寄存器140-N-1输出的两个输入111、112的由111-N-1和112-N-1所表示的一位或多位的求和结果的进位进行求和，而后将求和结果的和数输出为两个输入111、112的和数的对应最高一位或多位。

进一步地，第二级加法模块150可以将上述求和结果的进位与从第N个进位寄存器140-N输出的两个输入111、112的由111-N和112-N所表示的最高一位或多位的求和结果的进位进行求和，而后将求和结果输出为两个输入111、112的求和结果的进位，即输出162。

本领域技术人员应当理解，第二级加法模块150所执行的处理不限于以上所述的处理。可以根据加法器100的功能来确定第二级加法模块150的配置。例如，在不需要输出两个输入111、112的求和结果的进位(即加法器不包括输出162)的实施例中，第二级加法模块150可以不执行用于计算并输出两个输入111、112的求和结果的进位的处理。

第二级加法模块150的输出耦接到输出161和162，输出161和162分别表示两个输入111、112的求和结果的和数及进位。

在一些实施例中，输出161可以被划分为两个子部分：第一个子部分161-1，表示两个输入111、112的求和结果的和数的与111-1和112-1对应的最低一位或多位；以及第二个子部分161-2，表示两个输入111、112的求和结果的和数的其他一位或多位。

如图1所示，在一些实施例中，第二级加法模块150可以将第一个中间寄存器130-1的输出直接耦接到输出161的第一个子部分161-1。

本领域技术人员应理解，本文中提到的寄存器可以是边沿触发寄存器(例如D类型触发器)或电平触发寄存器(例如锁存器)。

加法器100的计算速度主要依赖于第一级加法模块组120和第二级加法模块150的计算速度，而第一级加法模块组120和第二级加法模块150的计算速度与两个输入111、112的子部分的数量和位数有关。因此，可以适当地确定两个输入111、112的子部分的数量和位数，从而使加法器100的计算速度提高。

第一级加法模块组120的整体计算延时由多个第一级加法模块120-1,120-2,…,120-N中的计算延时最长的一个第一级加法模块的计算延时来决定。每个第一级加法模块120-1,120-2,…,120-N用于对两个输入111、112的对应子部分进行求和，该子部分的位数越多，则对应的第一级加法模块的计算延时越长。

因此，第一级加法模块组120的整体计算延时依赖于输入111、112的多个子部分的位数中的最大位数。该最大位数越大，则第一级加法模块组120的整体计算延时越长。

第二级加法模块150用于对来自多个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。其中，第一个中间寄存器130-1的输出即表示求和结果的和数的对应最低一位或多位。因此，第二级加法模块150可以不对第一个中间寄存器130-1的输出进行额外的处理。特别地，在一些实施例中，第二级加法模块150也可以根据需要对第一个中间寄存器130-1的输出进行一定的处理，但这种处理的耗时将远少于第二级加法模块150需要对其他中间寄存器和进位寄存器的输出进行的如上所述的求和处理。也就是说，第二级加法模块150的计算延时由如上所述的求和处理的计算延时来决定。

因此，第二级加法模块150的计算延时可依赖于输入111、112的多个子部分中的除了第一个子部分111-1、112-1之外的其他子部分的数量以及其位数之和。该其他子部分的数量越多，或者其位数之和越大，则第二级加法模块150的计算延时越长。换言之，输入111、112的子部分的数量越少，或者第一个子部分111-1、112-1的位数越大，则第二级加法模块150的计算延时越短。

因此，期望减少两个输入111、112的多个子部分的位数中的最大位数。同时，期望减少输入111、112的子部分的数量，并且期望增加第一个子部分的位数。

在一些实施例中，输入111、112的第一个子部分111-1、112-1的位数大于或等于其他子部分的位数。在另一些实施例中，输入111、112的多个子部分的位数基本相等。这有利于降低第一级加法模块组120和第二级加法模块150的计算延时，从而提高加法器100的计算速度，进而降低芯片的功耗算力比。

在一些实施例中，输入111、112具有两个子部分，并且第一个子部分111-1、112-1的位数大于或等于输入111、112的位数的一半。这有利于在提高加法器100的计算速度的同时使得额外成本减少。

需要说明的是，本文中的“基本相等”的表述意指二者大致相等，但不必然严格地、精确地相等。本领域技术人员应当理解，这符合技术原理和工程实践。例如，二者可以相差约5％或10％。在一些语境中，二者可以相差约15％或20％。

图2示出了根据本公开一个或多个示例性实施例的加法器200的示意图。加法器200用于计算输入的一个数字与预定的常数之和。

如图2所示，加法器200具有一个输入210和两个输出261、262。其中，输入210表示输入的数字，并且输出261、262分别表示这个数字与预定的常数的求和结果的和数及进位。

类似地，在一些实施例中，加法器200也可以仅具有一个输出261，即仅输出求和结果的和数，而不输出进位。

加法器200的配置与加法器100类似，并且可以根据该预定的常数而进行适当的调整。

如图2所示，输入210被划分为N个子部分，这N个子部分由低位到高位依次表示该输入的部分位。即，输入210由低位到高位被划分为子部分210-1,210-2,…,210-N。其中，N应为大于或等于2的整数。即，输入210至少具有两个子部分。

在一些实施例中，如图2所示，表示输入210与该常数的和数的输出261被划分为两个子部分261-1、261-2。其中，261-1与输入210的第一个子部分210-1对应，表示输出261的最低一位或多位；261-2则与输入210的其他子部分210-2,…,210-N对应，表示输出261的其他一位或多位。

如图2所示，加法器200包括第一级加法模块组220、中间寄存器组230、进位寄存器组240以及第二级加法模块250。

第一级加法模块组220耦接到输入210，包括多个第一级加法模块220-1,220-2,…,220-N。每个第一级加法模块220-1,220-2,…,220-N用于对输入210的对应子部分与该常数的对应位进行求和。

每个第一级加法模块220-1,220-2,…,220-N的配置可以与该常数的对应位相关。在一些实施例中，第一级加法模块220-1,220-2,…,220-N的数量和配置可以至少部分地根据该常数来确定或调整。例如，对于输入210的任一子部分，如果已知该预定常数的对应位全部为零，则可以不对该子部分与该常数的对应位进行求和，因此第一级加法模块组220中可以不包括对应的第一级加法模块。这有利于降低加法器200的制造成本。

例如，在一些实施例中，如果该常数较小(即较高位全部为零)，则第一级加法模块组220中可以仅包括一个第一级加法模块，即仅包括与输入210的第一个子部分210-1对应的第一个第一级加法模块220-1。特别地，当该常数为1时，加法器200为自加1加法器，并且可以仅包括一个第一级加法模块。

第一级加法模块组220的输出耦接到中间寄存器组230和进位寄存器组240，将求和结果(包括和数与进位)分别输出到中间寄存器组230和进位寄存器组240。

中间寄存器组230包括多个中间寄存器230-1,230-2,…,230-N。如图2所示，每个中间寄存器230-1,230-2,…,230-N耦接到对应的第一级加法模块220-1,220-2,…,220-N，用于存储输入210的对应子部分与该常数的对应位的求和结果的和数。

进位寄存器组240包括多个进位寄存器240-1,240-2,…,240-N。每个进位寄存器240-1,240-2,…,240-N耦接到对应的第一级加法模块220-1,220-2,…,220-N，用于存储输入210的对应子部分与该常数的对应位的求和结果的进位。

中间寄存器组230和进位寄存器组240的配置可以根据第一级加法模块组220的配置进行适当的调整。例如，当第一级加法模块组220中不包括与输入210的任一子部分对应的第一级加法模块时，中间寄存器组230中的对应的中间寄存器可以直接耦接到输入210的该子部分，并且进位寄存器组240中可以不包括对应的进位寄存器。

在图2所示的实施例中，进位寄存器的数量与输入的子部分的数量相等。在其他实施例中，进位寄存器的数量可以比输入的子部分的数量少1，即不存在第N个进位寄存器240-N。

中间寄存器组230和进位寄存器组240的输出耦接到第二级加法模块250，将输入210的各个子部分与所述常数的对应位分别求和的结果(包括和数与进位)输出到第二级加法模块250。

第二级加法模块250用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和，即对输入210的各个子部分与该常数的对应位分别求和的结果(包括和数与进位)进行求和，从而得到输入210与该常数之和。

具体而言，第二级加法模块250可以将从第一个中间寄存器230-1输出的输入210的由210-1所表示的最低一位或多位与该常数的对应最低一位或多位的和数输出为输入210与该常数的和数的对应最低一位或多位(即输出261的子部分261-1)。

进一步地，第二级加法模块250可以将从第二个中间寄存器230-2输出的输入210的由210-2所表示的一位或多位与该常数的对应一位或多位的和数与从第一个进位寄存器240-1输出的进位进行求和，而后将求和结果的和数输出为输入210与该常数的和数的对应一位或多位，并且将求和结果的进位用于第二级加法模块250中的进一步的运算。

依此类推，第二级加法模块250可以将从第N个中间寄存器230-N输出的输入210的由210-N所表示的最高一位或多位与该常数的对应最高一位或多位的和数与从第N-1个进位寄存器240-N-1输出的进位进行求和，而后将求和结果的和数输出为输入210与该常数的和数的对应最高一位或多位。

进一步地，第二级加法模块250可以将上述求和结果的进位与从第N个进位寄存器240-N输出的进位进行求和，而后将求和结果输出为输入210与该常数的求和结果的进位(即输出262)。

本领域技术人员应当理解，第二级加法模块250所执行的处理不限于以上所述。可以根据加法器的功能来确定第二级加法模块250的配置。例如，在加法器200不包括输出262的实施例中，可以对第二级加法模块250的配置及其所执行的处理进行相应的调整。

第二级加法模块250的输出耦接到输出261和262，输出261和262分别表示输入210与该常数的求和结果的和数及进位。

在一些实施例中，输出261可以被划分为两个子部分：第一个子部分261-1，表示输入210与该常数的求和结果的和数的与210-1对应的最低一位或多位；以及第二个子部分261-2，表示输入210与该常数的求和结果的和数的其他一位或多位。如图2所示，在一些实施例中，第二级加法模块250可以将第一个中间寄存器230-1的输出直接耦接到输出261的第一个子部分261-1。

加法器200的计算速度主要依赖于第一级加法模块组220和第二级加法模块250的计算速度。

关于第二级加法模块250，类似地，输入210的子部分的数量越少，或者第一个子部分210-1的位数越大，则第二级加法模块250的计算延时越短。因此，期望减少输入210的子部分的数量，并且增加第一个子部分210-1的位数。

另一方面，与加法器100不同的是，在加法器200中，第一级加法模块220-1,220-2,…,220-N的配置可以与该常数相关。如上所述，如果对于输入210的某一子部分，该常数的对应位全部为零，则第一级加法模块组220中可以不包括对应的第一级加法模块。因此，第一级加法模块组220的计算延时与这样的子部分的位数无关，而仅依赖于输入210的其他子部分(即，对于这些子部分，该常数的对应位不全部为零)的位数。具体而言，期望适当地增加对应于常数的全部为零的位的子部分的位数，并且期望减少其他子部分的位数中的最大位数。

在一些实施例中，输入210的子部分的数量和每个子部分的位数至少部分地根据该常数来确定。例如，如果该常数较小(即该常数的较高位全部为零，例如该常数为1)，则输入210可以具有两个子部分，使得该常数的与第二个子部分对应的位全部为零。例如，如果该常数中包括全部为零的连续多个位，则可以与这连续多个位的至少一部分对应地划分出输入210的一个子部分。

图3示出了包括根据本公开一个或多个示例性实施例的加法器300的运算电路3000的一部分。

仅作为示例，在图3中，加法器300示出为如图1所示的用于计算输入的两个数字之和的加法器。但是，本领域技术人员应当理解，可以将加法器300替换为如图2所示的用于计算输入的一个数字与预定的常数之和的加法器，只需对运算电路3000进行适当的调整。

运算电路3000包括前一级寄存器3101、3102，加法器300，以及后一级寄存器3200。此外，在一些实施例中，运算电路3000还可以包括前置组合逻辑模块3110和后置组合逻辑模块3120。

在一些实施例中，前一级寄存器3101、3102可以直接耦接到加法器300。在一些实施例中，前一级寄存器3101、3102可以经由前置组合逻辑模块3110耦接到加法器300。在一些实施例中，加法器300可以直接耦接到后一级寄存器3200。在一些实施例中，加法器300可以经由后置组合逻辑模块3120耦接到后一级寄存器3200。

本领域技术人员应当理解，前一级寄存器3101、3102和后一级寄存器3200的数量和配置不限于图3中的实施例。例如，在一些实施例中，运算电路3000可以仅包括一个前一级寄存器3101，该前一级寄存器3101经由前置组合逻辑模块3110来向加法器300提供两个输入311、312。

仅作为示例，图3示出了运算电路3000包括前置组合逻辑模块3110和后置组合逻辑模块3120的实施例。本领域技术人员应当理解，以下描述同样可以适用于运算电路3000不包括前置组合逻辑模块3110或后置组合逻辑模块3120的实施例，只需进行适当的调整。

加法器300与图1所示的加法器100的配置类似。

加法器300具有分别表示输入的两个数字的两个输入311、312，以及分别表示这两个数字的求和结果的和数及进位两个输出361、362。其中，输出361具有两个子部分361-1、361-2。

加法器300包括：第一级加法模块组320，包括多个中间寄存器330-1,330-2,…,330-N的中间寄存器组330，进位寄存器组340，以及第二级加法模块350。其中，在一些实施例中，第二级加法模块350将第一个中间寄存器330-1的输出直接耦接到输出361的第一个子部分361-1。

在运算电路3000中，用于前一级寄存器3101和3102、中间寄存器组330以及后一级寄存器3200的时钟的频率相同。因此，期望前置组合逻辑模块3110和第一级加法模块组320的运算能够在一个时钟周期内完成，并且第二级加法模块350和后置组合逻辑模块3120的运算能够在一个时钟周期内完成。

因此，期望第一级加法模块组320的计算延时小于时钟周期与前置组合逻辑模块3110的计算延时之差，并且第二级加法模块350的计算延时小于时钟周期与后置组合逻辑模块3120的计算延时之差。

关于第一级加法模块组320，如上所述，在加法器300中，输入311、312的多个子部分的位数中的最大位数越大，则第一级加法模块组320的计算延时越长。因此，输入311、312的多个子部分的位数中的最大位数的上限可以至少部分地根据时钟周期与前置组合逻辑模块3110的计算延时之差来确定。

在一些实施例中，可以至少部分地根据时钟周期与前置组合逻辑模块3110的计算延时之差来确定加法器300的输入311、312的多个子部分的位数中的最大位数。具体而言，可以将该最大位数确定为：使得第一级加法模块组320的计算延时小于时钟周期与前置组合逻辑模块3110的计算延时之差。在一些实施例中，可以将该最大位数确定为：使得第一级加法模块组320的计算延时基本等于时钟周期与前置组合逻辑模块3110的计算延时之差。

此外，在运算电路3000不包括前置组合逻辑模块3110的实施例中，在一些示例中，至少部分地根据时钟周期来确定加法器300的输入311、312的多个子部分的位数中的最大位数。

另一方面，在加法器300为图2所示的用于计算输入的一个数字与预定的常数之和的加法器的情况下，第一级加法模块组320的计算延时还与该常数有关。如上所述，可以根据该常数来调整多个子部分的位数。

因此，在一些实施例中，可以首先根据时钟周期与前置组合逻辑模块3110的计算延时之差来确定加法器300的输入的多个子部分的位数中的最大位数，进而根据该常数来调整多个子部分的位数。例如，如果该常数包括全部为零的连续多个位，则可以与这连续多个位对应地划分出输入的一个子部分，不管该子部分的位数是否大于该确定的最大位数。在一些实施例中，可以调整输入的多个子部分的位数，使得不对应于该常数的全部为零的位的子部分中的最大位数基本等于该确定的最大位数。

关于第二级加法模块350，如上所述，在加法器300中，输入311、312的子部分的数量越多，或者第一个子部分的位数越小，则第二级加法模块350的计算延时越长。因此，加法器300的输入311、312的第一个子部分的位数的下限可以至少部分地根据时钟周期与后置组合逻辑模块3120的计算延时之差来确定。

在一些实施例中，至少部分地根据时钟周期与后置组合逻辑模块3120的计算延时之差来确定加法器300的输入311、312的第一个子部分的位数。具体而言，可以将该第一个子部分的位数确定为：使得第二级加法模块350的计算延时小于时钟周期与后置组合逻辑模块3120的计算延时之差。在一些实施例中，可以将该第一个子部分的位数确定为：使得第二级加法模块350的计算延时基本等于时钟周期与后置组合逻辑模块3120的计算延时之差。

此外，在运算电路3000不包括后置组合逻辑模块3120的实施例中，在一些示例中，至少部分地根据时钟周期来确定加法器300的输入311、312的第一个子部分的位数。

另一方面，如上面所提到的，在一些实施例中，将输入311、312的第一个子部分的位数确定为大于或等于其他子部分的位数。在一些实施例中，将输入311、312的多个子部分的位数确定为基本相等。

在一些实施例中，可以将以上所述的策略结合起来以确定加法器300的输入311、312的子部分的数量和位数。

例如，在一些实施例中，首先可以根据时钟周期与前置组合逻辑模块3110的计算延时之差以及时钟周期与后置组合逻辑模块3120的计算延时之差来确定加法器300的输入311、312的第一个子部分的位数。例如，可以根据时钟周期与前置组合逻辑模块3110的计算延时之差来确定该第一个子部分的位数的上限，并且根据时钟周期与后置组合逻辑模块3120的计算延时之差来确定该第一个子部分的位数的下限。

而后，如果确定的第一个子部分的位数大于或等于输入311、312的位数的一半，则可以将输入311、312的其他位划分为第二个子部分。这样，输入311、312被划分为两个子部分，其中第一个子部分的位数大于或等于第二个子部分的位数。

如果确定的第一个子部分的位数小于输入311、312的位数的一半，则可以将输入311、312的其他位划分为若干个子部分，使得这些子部分的数量尽可能少，并且每个子部分的位数均小于或等于确定的第一个子部分的位数。例如，可以将这些子部分的位数确定为与第一个子部分的位数基本相等。

在加法器300为图2所示的用于计算输入的一个数字与预定的常数之和的加法器200的情况下，可以进而根据该常数来调整子部分的数量和位数。例如，如果该常数包括全部为零的连续多个位，则可以与这连续多个位对应地划分出输入的一个子部分，不管该子部分的位数是否大于确定的第一个子部分的位数。

本领域技术人员应当理解，加法器的输入的子部分的数量和位数的确定方式不限于以上所描述的具体实施例。可以独立地或结合地采用本文所描述的各种策略，综合考虑加法器和运算电路的功能、配置、面积、成本、速度、功耗等各种因素，来确定加法器的输入的子部分的数量和位数。

与需要使用高速器件的相关技术相比，本公开以较低的成本和较低的功耗实现了加法器的运算速度的提升。

作为对比，图4示出了包括根据相关技术的加法器4120的运算电路4000的一部分。

运算电路4000包括第一级寄存器4101、4102，前置组合逻辑模块4110，加法器4120，第二级寄存器4200，后置组合逻辑模块4210，以及第三级寄存器4300。

其中，第一级寄存器4101、4102经由前置组合逻辑模块4110和加法器4120耦接到第二级寄存器4200。第二级寄存器4200经由后置组合逻辑模块4210耦接到第三级寄存器4300。

可以看出，图4所示的运算电路4000中的第一级寄存器4101和4102、第二级寄存器4200及第三级寄存器4300分别对应于图3所示的运算电路3000中的前一级寄存器3101和3102、中间寄存器组330及后一级寄存器3200。相应地，运算电路4000中的前置组合逻辑模块4110和后置组合逻辑模块4210分别对应于运算电路3000中的前置组合逻辑模块3110和后置组合逻辑模块3120。

本公开和相关技术的重要区别在于，图4所示的相关技术的运算电路4000中的加法器4120耦接在第一级寄存器4101、4102和第二级寄存器4200之间，而图3所示的本公开的运算电路3000中的加法器300跨中间寄存器组330耦接在前一级寄存器3101、3102和后一级寄存器3200之间。

在图4所示的相关技术中，加法器4120仅能够与前置组合逻辑模块4110一起利用第一级寄存器4101、4102和第二级寄存器4200之间的时钟周期进行运算。而在图3所示的本公开的技术方案中，加法器300能够与前置组合逻辑模块3110和后置组合逻辑模块3120一起利用前一级寄存器3101、3102和中间寄存器组330之间以及中间寄存器组330和后一级寄存器3200之间的两个时钟周期进行运算。在本公开的技术方案中，可以根据前置组合逻辑模块3110和后置组合逻辑模块3120的配置来对加法器300的配置进行适当的调整，从而更充分、更灵活地利用两个时钟周期的时间来完成加法运算。

此外，本领域技术人员应当理解，图3所示的加法器300中的第一级加法模块组320和第二级加法模块350所执行的运算与图4所示的加法器4120执行的运算实质上是等同的。换言之，加法器4120中也具有与加法器300中的第一级加法模块组320和第二级加法模块350等同或对应的模块或单元。因此，与相关技术相比，加法器300中的第一级加法模块组320和第二级加法模块350的配置并未引入额外的成本。

也就是说，与图4所示的相关技术相比，实现图3所示的运算电路3000中的加法器300所需要的额外模块或单元仅是进位寄存器组340。如上所述，进位寄存器组340中的每个进位寄存器均由1比特寄存器来实现，其制造成本较低。换言之，与图4所示的相关技术相比，实现本公开的加法器的额外成本基本上仅仅是若干个1比特寄存器的制造成本。

因此，与相关技术相比，本公开所提出的加法器创造性地利用相邻一级的时钟周期来完成部分运算，从而以较低的成本有效地提高了加法器及包括加法器的运算电路的运算速度。

根据本公开的加法器及运算电路可以以软件、硬件、软件与硬件的结合等各种适当的方式实现。在一种实现方式中，一种芯片可以包括如上所述的运算电路，该芯片还可以包括在一种计算装置中。

在说明书及权利要求中的词语“前”、“后”、“顶”、“底”、“之上”、“之下”等，如果存在的话，用于描述性的目的而并不一定用于描述不变的相对位置。应当理解，这样使用的词语在适当的情况下是可互换的，使得在此所描述的本公开的实施例，例如，能够在与在此所示出的或另外描述的那些取向不同的其他取向上操作。

如在此所使用的，词语“示例性的”意指“用作示例、实例或说明”，而不是作为将被精确复制的“模型”。在此示例性描述的任意实现方式并不一定要被解释为比其它实现方式优选的或有利的。而且，本公开不受在上述技术领域、背景技术、发明内容或具体实施方式中所给出的任何所表述的或所暗示的理论所限定。

如在此所使用的，词语“基本上”意指包含由设计或制造的缺陷、器件或元件的容差、环境影响和/或其它因素所致的任意微小的变化。词语“基本上”还允许由寄生效应、噪声以及可能存在于实际的实现方式中的其它实际考虑因素所致的与完美的或理想的情形之间的差异。

另外，前面的描述可能提及了被“连接”或“耦接”在一起的元件或节点或特征。如在此所使用的，除非另外明确说明，“连接”意指一个元件/节点/特征与另一种元件/节点/特征在电学上、机械上、逻辑上或以其它方式直接地连接(或者直接通信)。类似地，除非另外明确说明，“耦接”意指一个元件/节点/特征可以与另一元件/节点/特征以直接的或间接的方式在机械上、电学上、逻辑上或以其它方式连结以允许相互作用，即使这两个特征可能并没有直接连接也是如此。也就是说，“耦接”意图包含元件或其它特征的直接连结和间接连结，包括利用一个或多个中间元件的连接。

另外，仅仅为了参考的目的，还可以在本文中使用“第一”、“第二”等类似术语，并且因而并非意图限定。例如，除非上下文明确指出，否则涉及结构或元件的词语“第一”、“第二”和其它此类数字词语并没有暗示顺序或次序。

还应理解，“包括/包含”一词在本文中使用时，说明存在所指出的特征、整体、步骤、操作、单元和/或组件，但是并不排除存在或增加一个或多个其它特征、整体、步骤、操作、单元和/或组件以及/或者它们的组合。

在本公开中，术语“提供”从广义上用于涵盖获得对象的所有方式，因此“提供某对象”包括但不限于“购买”、“制备/制造”、“布置/设置”、“安装/装配”、和/或“订购”对象等。

本领域技术人员应当意识到，在上述操作之间的边界仅仅是说明性的。多个操作可以结合成单个操作，单个操作可以分布于附加的操作中，并且操作可以在时间上至少部分重叠地执行。而且，另选的实施例可以包括特定操作的多个实例，并且在其他各种实施例中可以改变操作顺序。但是，其它的修改、变化和替换同样是可能的。因此，本说明书和附图应当被看作是说明性的，而非限制性的。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。在此公开的各实施例可以任意组合，而不脱离本公开的精神和范围。本领域的技术人员还应理解，可以对实施例进行多种修改而不脱离本公开的范围和精神。本公开的范围由所附权利要求来限定。

Claims

一种加法器，用于计算输入的两个数字之和，所述加法器具有分别表示所述两个数字的两个输入，其中每个输入被彼此对应地划分为多个子部分，所述多个子部分由低位到高位依次表示所述输入的部分位，并且所述加法器包括：

多个第一级加法模块，每个第一级加法模块用于对所述两个输入的对应子部分进行求和；

多个中间寄存器，每个中间寄存器耦接到对应的第一级加法模块，用于存储所述两个输入的对应子部分的和数；

一个或多个进位寄存器，每个进位寄存器耦接到对应的第一级加法模块，用于存储所述两个输入的对应子部分的进位；以及

第二级加法模块，耦接到所述多个中间寄存器和所述一个或多个进位寄存器，用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。
根据权利要求1所述的加法器，其中，第二级加法模块将所述多个中间寄存器中的与所述输入的第一个子部分对应的第一个中间寄存器的输出直接耦接到加法器的输出，其中所述第一个子部分表示所述输入的最低一位或多位。
根据权利要求1或2所述的加法器，其中，所述两个输入的第一个子部分的位数大于或等于其他子部分的位数。
根据权利要求1或2所述的加法器，其中，每个输入具有两个子部分。
一种加法器，用于计算输入的一个数字与预定的常数之和，所述加法器具有表示所述数字的一个输入，所述输入被划分为多个子部分，所述多个子部分由低位到高位依次表示所述输入的部分位，并且所述加法器包括：

一个或多个第一级加法模块，每个第一级加法模块用于对所述输入的对应子部分与所述常数的对应位进行求和；

多个中间寄存器，每个中间寄存器耦接到对应的第一级加法模块，用于存储所述输入的对应子部分与所述常数的对应位的和数；

一个或多个进位寄存器，每个进位寄存器耦接到对应的第一级加法模块，用于存储所述输入的对应子部分与所述常数的对应位的进位；以及

第二级加法模块，耦接到所述多个中间寄存器和所述一个或多个进位寄存器，用于对来自每个中间寄存器的和数与来自对应的前一个进位寄存器的进位进行求和。
根据权利要求5所述的加法器，其中，第二级加法模块将所述多个中间寄存器中的与所述输入的第一个子部分对应的第一个中间寄存器的输出直接耦接到加法器的输出，其中所述第一个子部分表示所述输入的最低一位或多位。
根据权利要求5或6所述的加法器，其中，所述输入的子部分的数量和每个子部分的位数至少部分地根据所述常数来确定。
根据权利要求5或6所述的加法器，其中，第一级加法模块的数量和配置至少部分地根据所述常数来确定。
根据权利要求8所述的加法器，其中，所述常数为1。
根据权利要求5或6所述的加法器，其中，所述输入具有两个子部分。
一种运算电路，所述运算电路包括：

根据权利要求1-10中任一项所述的加法器；以及

耦接到所述加法器的输入的前置组合逻辑模块和耦接到所述加法器的输出的后置组合逻辑模块中的至少一者。
根据权利要求11所述的运算电路，其中，所述加法器的所述输入的子部分的数量和每个子部分的位数至少部分地根据用于所述运算电路的时钟的周期、前置组合逻辑模块和后置组合逻辑模块中的至少一者的计算延时来确定。
根据权利要求12所述的运算电路，其中，

如果所述运算电路包括前置组合逻辑模块，则所述加法器的所述输入的所述多个子部分的位数中的最大位数至少部分地根据用于所述运算电路的时钟的周期与所述前置组合逻辑模块的计算延时之差来确定，

如果所述运算电路不包括前置组合逻辑模块，则所述加法器的所述输入的所述多个子部分的位数中的最大位数至少部分地根据用于所述运算电路的时钟的周期来确定。
根据权利要求12所述的运算电路，其中，

如果所述运算电路包括后置组合逻辑模块，则所述加法器的所述输入的第一个子部分的位数至少部分地根据用于所述运算电路的时钟的周期与所述后置组合逻辑模块的计算延时之差来确定，

如果所述运算电路不包括后置组合逻辑模块，则所述加法器的所述输入的第一个子部分的位数至少部分地根据用于所述运算电路的时钟的周期来确定。
一种芯片，所述芯片包括根据权利要求11-14中任一项所述的运算电路。
一种计算装置，所述计算装置包括根据权利要求15所述的芯片。