CN105354006B

CN105354006B - 一种非线性函数的快速运算装置及其方法

Info

Publication number: CN105354006B
Application number: CN201510849130.7A
Authority: CN
Inventors: 张士锦; 罗韬; 刘少礼; 陈云霁
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2015-11-27
Filing date: 2015-11-27
Publication date: 2017-11-21
Anticipated expiration: 2035-11-27
Also published as: CN105354006A; US10489113B2; US20180329681A1; WO2017088457A1

Abstract

本发明公开了一种非线性函数的快速运算装置及其方法，其中该装置包括：定义域转换部，用于将输入的自变量转换成查表范围内的对应值；查表部，用于根据输入的自变量或由所述定义域转换部处理后的自变量，查找对应的分段线性拟合的斜率和截距；以及线性拟合部，用于根据所述查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果。本发明解决传统方法带来的运算速度慢，运算装置面积大，功耗高等问题。

Description

一种非线性函数的快速运算装置及其方法

技术领域

本发明涉及计算机应用技术，特别是涉及一种非线性函数的快速运算装置及其方法。

背景技术

算术逻辑单元(arithmetic logic unit，缩写ALU)是进行整数运算的结构。在计算机中，算术逻辑单元(ALU)是专门执行算术和逻辑运算的数字电路。ALU是计算机中央处理器的最重要组成部分，甚至连最小的微处理器也包含ALU作计数功能。在现代CPU(Central Processing Unit，中央处理器)和GPU(Graphics Processing Unit，图形处理器)中已含有功能强大和复杂的ALU；一个单一的元件也可能含有ALU。大部分ALU都可以完成以下运算：整数算术运算(加、减，有时还包括乘和除，不过成本较高)，位逻辑运算(与、或、非、异或)，移位运算(将数据向左或向右移位或浮动特定位)，移位可被认为是乘以2或除以2。算数逻辑单元通常只含有线性运算部件，当算数逻辑单元进行复杂的幂运算等操作时，通常需要好几个运算周期。

为了加快处理器的运算速度，CPU和GPU中通常会集成FPU(Floating-Point Unit，浮点运算单元)。FPU是专门用于浮点运算的处理器，并且可能支持一些超越函数的计算，例如log₂x。FPU的运算速度比ALU快了很多。

现有技术在计算非线性函数时，通常是将复杂的运算拆解成简单的运算，再经过几个运算周期后才能得到结果。这使得运算速度慢，运算装置面积大，功耗高。

发明内容

本发明的目的在于提供一种非线性函数的快速运算装置及其方法，用于解决传统方法带来的运算速度慢，运算装置面积大，功耗高等问题。

为了实现上述目的，本发明提供了一种非线性函数的快速运算装置，包括：

定义域转换部，用于将输入的自变量转换成查表范围内的对应值；

查表部，用于根据输入的自变量或由所述定义域转换部处理后的自变量，查找对应的分段线性拟合的斜率和截距；以及

线性拟合部，用于根据所述查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果。

所述的非线性函数的快速运算装置，其中，所述定义域转换部包括：

第一乘法器，用于对输入的自变量进行缩放；

第一加法器，用于对缩放后的自变量进行偏移。

所述的非线性函数的快速运算装置，其中，所述线性拟合部包括：

第二乘法器，用于根据斜率与输入的自变量或由所述定义域转换部处理后的自变量进行乘法运算，得到运算结果；

第二加法器，用于根据所述运算结果以及截距进行加法运算，得到所述最后结果。

所述的非线性函数的快速运算装置，其中，进一步包括：

第一自变量选择器，用于选择所述查表部进行处理时所使用的自变量。

所述的非线性函数的快速运算装置，其中，进一步包括：

第二自变量选择器，用于选择所述第二乘法器进行乘法运算时所使用的自变量。

为了实现上述目的，本发明还提供了一种非线性函数的快速运算方法，包括：

步骤一，将输入的自变量转换成查表范围内的对应值；

步骤二，根据所述自变量或由所述定义域转换部处理后的自变量，查找对应的分段线性拟合的斜率和截距；以及

步骤三，根据所述查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果。

所述的非线性函数的快速运算方法，其中，所述步骤一中，包括：

对输入的自变量进行缩放；

对缩放后的自变量进行偏移。

所述的非线性函数的快速运算方法，其中，所述步骤二中，包括：

通过设置第一自变量选择器选择所述查表部进行处理时所使用的自变量。

所述的非线性函数的快速运算方法，其中，所述步骤三中，包括：

根据斜率与输入的自变量或由所述定义域转换部处理后的自变量进行乘法运算，得到运算结果；

根据所述运算结果以及截距进行加法运算，得到所述最后结果。

通过设置第二自变量选择器选择进行乘法运算时所使用的自变量。

与现有技术相比，本发明的有益技术效果是：

本发明提供了一种非线性函数的快速运算方法，其采用分段线性拟合的方法来快速计算非线性函数，可以解决传统方法带来的运算速度慢，运算装置面积大，功耗高等问题。具体体现在如下方面：

(1)简化硬件设计，提高运算速度。

(2)降低芯片功耗和面积。

附图说明

图1是本发明的非线性函数的快速运算装置结构图；

图2是本发明的定义域转换部件的内部结构图；

图3是本发明的查表部件的内部结构图；

图4是本发明的线性拟合部件的内部结构图；

图5是本发明的非线性函数的快速运算的第一实施例；

图6是本发明的非线性函数的快速运算的第二实施例；

图7是本发明的非线性函数的快速运算的第三实施例。

图8是本发明的非线性函数的快速运算的第四实施例；

图9是本发明的非线性函数的快速运算的第五实施例。

具体实施方式

以下结合附图和具体实施例对本发明进行详细描述，但不作为对本发明的限定。

如图1所示，是本发明非线性函数的快速运算装置结构图。本装置主要包括三个部分：第一部分、第二部分、第三部分。

其中，第一部分用于定义域变换，由定义域转换部10来实现，定义域转换部10包括乘法器1和加法器2，用于将输入的自变量转换成查表范围内的对应值；第二部分是查表，由查表部3来实现，查表部3用于根据由第一部分输入的自变量的值，查找到对应的分段线性拟合的斜率和截距；第三部分是线性拟合，由线性拟合部20来实现，线性拟合部20包括乘法器4和加法器5，用于根据第二部分查表得到的斜率和截距通过线性拟合的方法得到最后结果。

乘法器1，用于输入定义域的伸缩。

加法器2，用于输入定义域的偏移。

查表部3，用于查找与输入对应的直线的截距和斜率。

乘法器4，用于计算k*x。

加法器4，用于计算k*x+b。

非线性函数的快速运算，可分如下情况进行：

(1)定义域需要转换，并且分段线性拟合的输入定义域是第一部分的输入数据。

(2)定义域需要转换，并且分段线性拟合的输入定义域是第一部分的输出数据。

(3)不需要对定义域做变换。

(4)定义域需要转变，线性拟合可以选择定义域转换之前或者之后的定义域的值。

(5)可以选择是否进行定义域转换，线性拟合可以选择定义域转换之前或者之后的定义域的值。

如图2所示，是本发明的定义域转换部件的内部结构。定义域转换部件的结构如下：

如图所示，定义域转换部10是定义域转换的部件，有三个输入x,i,j，x是非线性函数的自变量，i和j是和非线性函数的定义域范围相关的两个常数，new_x是变换定义域后的输出结果。上述部件实现的运算是：new_x＝x*i+j，做定义域变换的目的是为了便于接下来的查表操作。

如图3所示，是本发明的查表部件的内部结构图。查表部件结构如下：

如图所示，查表部3的输入是非线性函数的自变量，或者经过定义域转变后的自变量。

Table_k和Table_b里存储了非线性函数分段线性拟合的直线斜率和截距，Table_k和Table_b里的值是可以配置的，在开始计算之前，它们的值应该已完成配置。

查表部3根据输入x的某几位，如图中是x的P-Q位作为索引，将查表后的结果k和b输出。查表部3实现的运算是：index＝x[P:Q],k＝Table_k[index],b＝Table_b[index]。

如图4所示，是本发明的线性拟合部件的内部结构图。线性拟合部件结构如下：

如图所示，线性拟合部20这个模块有三个输入，x表示自变量，可能是转换后的也可能是没转换的，k和b是查表得到的截距和斜率，输出是最终的结果f(x)，线性拟合部20实现的运算是：f(x)＝k*x+b。

如图5所示，是本发明的非线性函数的快速运算的第一实施例。

在本实施例中，查表部3的输入是自变量x，查找部件3根据x的值找到对应的斜率k和截距b，并将k和b输出，在乘法器4中计算k*x，并将结果和b输出，在加法器5中计算k*x+b，计算得到最终的结果。

如图6所示，是本发明的非线性函数的快速运算的第二实施例。

在本实施例中，乘法器1对输入自变量x进行缩放，加法器2对x进行偏移，查表部3的输入是加法器2的输出，查找部件3根据加法器2的输出值找到对应的斜率k和截距b，并将k和b输出，在乘法器4中计算k*new_x，并将结果和b输出，在加法器5中计算k*new_x+b，计算得到最终的结果。

如图7所示，是本发明的非线性函数的快速运算的第三实施例。

在本实施例中，乘法器1对输入自变量x进行缩放，加法器2对x的进行偏移，查表部3的输入是加法器2的输出，查找部件3根据加法器2的输出值找到对应的斜率k和截距b，并将k和b输出，在乘法器4中计算k*x，并将结果和b输出，在加法器5中计算k*x+b，计算得到最终的结果。

如图8所示，是本发明的非线性函数的快速运算的第四实施例。

在本实施例中，乘法器1对输入自变量x进行缩放，加法器2对自变量x进行偏移，查表部3的输入是加法器2的输出，查找部件3根据加法器2的输出值找到对应的斜率k和截距b，并将k和b输出，在乘法器4中计算k*x或者k*new_x，并将结果和b输出，在加法器5中计算k*x+b或者k*new_x+b,计算得到最终的结果。

在本实施例中，设置自变量选择器(MUX)来选择乘法器4进行运算所需的自变量为输入的自变量x或是经过加法器2处理后输出的自变量new_x。

如图9所示，是本发明的非线性函数的快速运算的第五实施例。

在本实施例中，乘法器1对输入自变量x进行缩放，加法器2对x进行偏移，查表部3的输入可以选择原始输入x或者经过定义域转换的new_x，查找部3根据输入输出值找到对应的斜率k和截距b，并将k和b输出，在乘法器4中计算k*x或者k*new_x，并将结果和b输出，在加法器5中计算k*x+b或者k*new_x+b，计算得到最终的结果。

在本实施例中，设置自变量选择器(MUX)来选择查表部3的输入是输入的自变量x或是经过加法器2处理后输出的自变量new_x，并设置自变量选择器(MUX)来选择乘法器4进行运算所需的自变量为输入的自变量x或是经过加法器2处理后输出的自变量new_x。

下面通过一具体的例子来进一步说明本案的功效。

由如上所述，可知本发明在计算上面非线性函数，所需要的计算步骤包括查表、乘法、加法。

在FPU中需要的运算步骤是：

1、取反：x＝-x。

2、计算log₂x。

3、计算log₂e。

4、除法运算：第2步的结果除以第3步的结果。

5、1加上第4步的结果。

6、1除以第5步的结果。

由以上的运算可以看出本发明的优势：

(1)加快了计算过程。

(2)避免了复杂的硬件设计，例如log₂x的运算部件，降低了芯片面积和功耗。

当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明做出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种非线性函数的快速运算装置，其特征在于，包括：

线性拟合部，用于根据所述查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果；

所述查表部由Table_k和Table_b存储直线斜率和截距，根据输入自变量x的P-Q位作为索引，将查表后的结果k和b输出，所述查表部实现的运算是：index＝x[P:Q],k＝Table_k[index],b＝Table_b[index]。

2.根据权利要求1所述的非线性函数的快速运算装置，其特征在于，所述定义域转换部包括：

第一乘法器，用于对输入的自变量进行缩放；

第一加法器，用于对缩放后的自变量进行偏移。

3.根据权利要求1所述的非线性函数的快速运算装置，其特征在于，所述线性拟合部包括：

4.根据权利要求1、2或3所述的非线性函数的快速运算装置，其特征在于，进一步包括：

5.根据权利要求3的非线性函数的快速运算装置，其特征在于，进一步包括：

6.一种非线性函数的快速运算方法，其特征在于，包括：

步骤一，将输入的自变量转换成查表范围内的对应值；

步骤二，根据所述自变量或由定义域转换部处理后的自变量，查找对应的分段线性拟合的斜率和截距；以及

步骤三，根据查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果；

所述步骤二中，包括：

所述查表部由Table_k和Table_b存储直线斜率和截距，根据输入自变量x的P-Q位作为索引，将查表后的结果k和b输出，实现的运算是：index＝x[P:Q],k＝Table_k[index],b＝Table_b[index]。

7.根据权利要求6所述的非线性函数的快速运算方法，其特征在于，所述步骤一中，包括：

对输入的自变量进行缩放；

对缩放后的自变量进行偏移。

8.根据权利要求6所述的非线性函数的快速运算方法，其特征在于，所述步骤二中，包括：

9.根据权利要求6所述的非线性函数的快速运算方法，其特征在于，所述步骤三中，包括：

10.根据权利要求6、7、8或9所述的非线性函数的快速运算方法，其特征在于，所述步骤三中，包括：