CN116306707A

CN116306707A - 一种计算x&(x-1)的加速电路及计算设备

Info

Publication number: CN116306707A
Application number: CN202310247298.5A
Authority: CN
Inventors: 尚德龙; 孙拓拓; 刘伟佳; 李犇; 乔树山; 周玉梅
Original assignee: Zhongke Nanjing Intelligent Technology Research Institute
Current assignee: Zhongke Nanjing Intelligent Technology Research Institute
Priority date: 2023-03-15
Filing date: 2023-03-15
Publication date: 2023-06-23

Abstract

本发明公开了一种计算x&(x‑1)的加速电路及计算设备，本发明采用依次串联的第一计算模块B₀～B_n‑2和第二计算模块B_n‑1，第二计算模块B_n‑1对应输入二进制的最高位，第一计算模块B₀～B_n‑2对应输入二进制的其余位，各计算模块根据输入二进制对应位的数值和上一级计算模块的一路输出，获得输出二进制对应位的数值和下一级计算模块的输入，实现计算x&(x‑1)的加速电路，可解放ALU的计算资源，降低计算资源的消耗。

Description

一种计算x＆(x-1)的加速电路及计算设备

技术领域

本发明涉及一种计算x&(x-1)的加速电路及计算设备，属于计算机领域。

背景技术

随着计算数据的以指数级增长，计算机的算术逻辑单元(ArithmeticlogicalUnit，ALU)需要承担更多的计算压力，耗费更多的计算资源，ALU在计算过程中是对计算对象逐步进行计算，并且将每一步计算的结果保存到寄存器之后，再进行下一步的计算，会使用大量的处理器资源，调用诸多计算模块和逻辑模块，不仅耗费较多时间同时耗费大量资源。

目前，采用加速电路实现ALU的部分计算功能，使得计算机ALU模块只需要进行数据的传输调度和加速器的调用，而不用参与到数据的计算处理当中，可以极大的降低了功耗，从而释放更多的资源。

x&(x-1)计算是为了将输入的二进制数据最右位的1变为0，使用x&(x-1)进行位运算的一个常见应用是计算一个正整数的二进制表示中1的个数，这个算法被称为BrianKernighan算法。可以通过重复执行x&(x-1)操作，直到x的值变为0，来计算x的二进制表示中1的个数。每次执行x&(x-1)操作都会将最后一个1变成0，所以需要执行的操作次数就是x的二进制表示中1的个数。它可以用于各种需要高速位运算的应用场景，例如计算机网络、图像处理、嵌入式系统、数据压缩等。x&(x-1)若采用ALU进行计算，则需要消耗大量的资源，为了释放资源现在急需计算x&(x-1)的加速电路。

发明内容

本发明提供了一种计算x&(x-1)的加速电路及计算设备，解决了背景技术中披露的问题。

为了解决上述技术问题，本发明所采用的技术方案是：

一种计算x&(x-1)的加速电路，包括依次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1；

第一计算模块B₀～B_n-2分别与x的0位至n-2位对应；其中，x为输入所述加速电路的n位二进制数；

第一计算模块B₀的两路输入分别为A₀和0，两路输出分别为A₀和0；其中，0作为y的0位数值，A₀作为第一计算模块B₁的输入，A₀为x的0位数值；

第一计算模块B_i的两路输入分别为A_i和

两路输出分别为/>

和/>

其中，/>

作为y的i位数值，/>

作为第一计算模块B_i+1的输入，A_i为x的i位数值，y为所述加速电路输出的n位二进制数，i和j均为整数，0<i≤n-2；

第二计算模块B_n-1与x的n-1位对应，第二计算模块B_n-1两路输入分别为A_n-1和

一路输出为/>

其中，A_n-1为x的n-1位数值。

第一计算模块包括与门和或门，第一计算模块的两路输入为与门的输入，也是或门的输入，与门的输出作为对应的y位数值，或门的输出作为下一级第一计算模块或第二计算模块的输入。

第二计算模块为与门。

与门为二输入与门。

或门为二输入或门。

一种计算设备，包括中央处理器和所述的加速电路；中央处理器的算术逻辑单元向所述的加速电路输入x，接收所述的加速电路反馈的y。

本发明所达到的有益效果：本发明采用依次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1，第二计算模块B_n-1对应输入二进制的最高位，第一计算模块B₀～B_n-2对应输入二进制的其余位，各计算模块根据输入二进制对应位的数值和上一级计算模块的一路输出，获得输出二进制对应位的数值和下一级计算模块的输入，实现计算x&(x-1)的加速电路，可解放ALU的计算资源，降低计算资源的消耗。

附图说明

图1为加速电路的示意图；

图2为迭代结构。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，一种计算x&(x-1)的加速电路，包括依次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1。

第一计算模块B₀～B_n-2分别与x的0位至n-2位对应，第二计算模块B_n-1与x的n-1位对应；其中，x为输入所述加速电路的n位二进制数。

第一计算模块B₀的两路输入分别为A₀和0，两路输出分别为A₀和0；其中，0作为y的0位数值，A₀作为第一计算模块B₁的输入，A₀为x的0位数值；第一计算模块B_i的两路输入分别为A_i和

两路输出分别为/>

和/>

其中，/>

作为y的i位数值，/>

作为第一计算模块B_i+1的输入，A_i为x的i位数值，y为所述加速电路输出的n位二进制数，i和j均为整数，0<i≤n-2。

第二计算模块B_n-1两路输入分别为A_n-1和

一路输出为/>

其中，A_n-1为x的n-1位数值。

上述电路采用依次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1，第二计算模块B_n-1对应输入二进制的最高位，第一计算模块B₀～B_n-2对应输入二进制的其余位，各计算模块根据输入二进制对应位的数值和上一级计算模块的一路输出，获得输出二进制对应位的数值和下一级计算模块的输入，实现计算x&(x-1)的加速电路，可解放ALU的计算资源，降低计算资源的消耗。

x&(x-1)计算是为了将输入的二进制数最右位的1变为0，如输入11110010计算后的结果为11110000，即将1位变为0，由于是按位计算，可将x&(x-1)视为x与二进制数-1(即二进制数11111111)相加再与x进行与运算。利用进位加法器的思想，将每位的计算结果作为更高一位的输入之一。

因此可设计一个迭代结构，如图2所示，与门输入为低一位的进位输出和该位的数据输入，与门输出为该位计算后的输出；或门的输入为低一位的进位输出和该位的数据输入，或门的输出为该位计算后向更高一位的进位输出。

定义当前为i位，图中，C_i-1为前一位的进位输入，A_i为输入二进制数(即x)的i位数值，C_i为计算后向高一位的进位，Y_i为每位计算后的输出，即输出二进制数的i位。将x&(x-1)公式为两部分计算，一部分为与运算，另一部分为加减法运算。在加减法运算中引入加法器计算思想，将x-1视为加法器的输出S_i那么根据加法器的计算公式可得：

又C₀＝A₀ Y₀＝0

C₁＝A₁+A₀ Y₁＝A₁·A₀

C₂＝A₂+A₁+A₀ Y₂＝A₂·(A₁+A₀)

因此每位输出和输入之间的关系为

基于上述分析，加速电路包括次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1，以8位二进制数为例，那么就包括7个第一计算模块和1个第二计算模块，其中，第一计算模块为上述的迭代结构，包括与门和或门，具体为二输入与门和二输入或门，第一计算模块的两路输入为与门的输入，也是或门的输入，与门的输出作为对应的y位数值，或门的输出作为下一级第一计算模块或第二计算模块的输入；第二计算模块为去除或门后的迭代结构，即仅保留与门。

假设输入二进制数x为11110100，经过上述加速器处理后的结果应为11110000。在加速器中首先计算最低位，即0位，由于最低位输入为0，即A₀为0，在和0进行与运算之后输出结果Y₀也为0，同时在和0进行或运算之后输出结果C₀为0，并且C₀作为Y₁计算的输入之一与该位输入A₁进行与运算。当计算到最右面1所在位的时候，由于前面低位输入都是0，所以根据进位公式

得进位输入为0，该位的输入1和0进行与运算的情况下会将该位输出变为0，该位输入为1在经过或运算之后得到输出进位为1，由于1与任何数值进行与运算的时候不改变数值结果，所以在之后的更高位的计算中将不改变输入的数值。

从上面的例子可以看出，上述加速电路可以实现将输入最右一位的1计算后变成0，那么如果是二的幂数或者0，如10000000，那么计算后的输入结果为00000000，所以也可以将根据输出从而判断输入是否是二的幂数或0。

上述加速电路可以使用标准单元库电路元件进行设计，设计流程和结果简便，同时只使用简单的与门和或门设计，设计结果面积小。

基于相同的技术方案，本发明还公开了一种计算设备，包括中央处理器和上述的加速电路；中央处理器的算术逻辑单元向所述的加速电路输入x，接收所述的加速电路反馈的y。

该计算设备的算术逻辑单元调用加速电路，在算术逻辑单元无需进行复杂的逻辑计算，只需要调度该加速器，使用传输数据，极大的解放了ALU的计算资源，降低计算资源的消耗。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种计算x&(x-1)的加速电路，其特征在于，包括依次串联的第一计算模块B₀～B_n-2和第二计算模块B_n-1；

第一计算模块B_i的两路输入分别为A_i和

两路输出分别为/>

和/>

其中，/>

作为y的i位数值，/>

一路输出为/>

其中，A_n-1为x的n-1位数值。

2.根据权利要求1所述的计算x&(x-1)的加速电路，其特征在于，第一计算模块包括与门和或门，第一计算模块的两路输入为与门的输入，也是或门的输入，与门的输出作为对应的y位数值，或门的输出作为下一级第一计算模块或第二计算模块的输入。

3.根据权利要求1所述的计算x&(x-1)的加速电路，其特征在于，第二计算模块为与门。

4.根据权利要求2或3所述的计算x&(x-1)的加速电路，其特征在于，与门为二输入与门。

5.根据权利要求2所述的计算x&(x-1)的加速电路，其特征在于，或门为二输入或门。

6.一种计算设备，其特征在于，包括中央处理器和权利要求1～5任一项所述的加速电路；中央处理器的算术逻辑单元向所述的加速电路输入x，接收所述的加速电路反馈的y。