CN107423026B

CN107423026B - 一种正余弦函数计算的实现方法及装置

Info

Publication number: CN107423026B
Application number: CN201710265266.2A
Authority: CN
Inventors: 雷元武; 朱保周; 彭元喜; 刘宗林; 陈海燕; 陈胜刚; 许邦建; 马胜; 田甜; 彭浩; 徐恩; 王建之; 张榜
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2017-04-21
Filing date: 2017-04-21
Publication date: 2021-07-13
Anticipated expiration: 2037-04-21
Also published as: CN107423026A

Abstract

本发明公开一种正余弦函数计算的实现方法及装置，步骤包括：1)判断输入角度是否在指定范围内，如果是，将输入角度作为目标计算角度输出，否则对输入角度进行压缩，并将输出压缩后角度作为目标计算角度输出；2)对目标计算角度采用TCORDIC算法执行正弦或余弦函数的计算，且当目标计算角度与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC算法完成正余弦函数的计算；该装置包括角度压缩单元以及TCORDIC计算单元。本发明能够实现任意角度的正弦、余弦函数的计算，且具有实现方法简单、计算复杂度低，计算效率以及精度高等优点。

Description

一种正余弦函数计算的实现方法及装置

技术领域

本发明涉及函数计算技术领域，尤其涉及一种正余弦函数计算的实现方法及装置。

背景技术

正余弦函数计算是科学计算和工程应用程序的重要组成部分，此类计算通常要求计算结果的误差能够达到很小，且需要能够适用于任意的输入角度范围。CORDIC(COordinate Rotation DIgital Computer，坐标旋转数字计算机)是一种用于计算多种超越函数的数字迭代算法，CORDIC算法通过简单的加法和移位操作就可以完成三角函数函数的计算，并且该算法规整、结构简单，可以容易的在硬件上实现，表达式如下所示：

其中X₀＝K_n,Y₀＝0,Z₀∈[0,π/2]，迭代结果等于正弦余弦的值。

正余弦函数计算时，输入角度Z_R经过CORDIC算法计算后得到cos(Z_R)和sin(Z_R)，最后由Q和输入角度Z符号S_Z得到cos(Z)和sin(Z)，角度与象限对应关系如表1所示，表中S_Z为正。

表1：角度与象限对应关系表。

Domain	Q[1：0l	sin(Z)	cos(Z)
				[0，π/2]	00	sin(Z<sub>R</sub>)	cos(Z<sub>R</sub>)
[π/2，π]	01	cos(Z<sub>R</sub>)	-sin(Z<sub>R</sub>)
				[π，3π/2]	10	-sin(Z<sub>R</sub>)	-cos(Z<sub>R</sub>)
[3π/2r2π]	II	-cos(Z<sub>R</sub>)	sin(Z<sub>R</sub>)

但是采用CORDIC算法计算正余弦函数时，因为有限的操作数位宽和迭代次数会产生误差，在输入角度属于Z_Rε[0,π/2]时，当输入角度Z_R趋近于0或者π/2，采用CORDIC算法的计算结果浮点相对误差较大，造成最终的计算结果误差较大。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种能够实现任意角度正弦、余弦函数计算，且实现方法简单、计算复杂度低，计算效率以及精度高的正余弦函数计算的实现方法及装置。

为解决上述技术问题，本发明提出的技术方案为：

一种正余弦函数计算的实现方法，步骤包括：

1)角度压缩：判断输入角度是否在指定范围内，如果是，将输入角度作为目标计算角度输出，否则对输入角度进行压缩，并将输出压缩后角度作为目标计算角度输出；

2)TCORDIC计算：对目标计算角度采用TCORDIC算法执行正弦或余弦函数的计算，且当目标计算角度与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC算法完成正余弦函数的计算。

作为本发明方法的进一步改进，所述步骤1)中对输入角度进行压缩的具体步骤为：

1.1)预处理：根据输入角度Z的指数E_Z获取需要参与2/π乘法运算的区间C；

1.2)2/π截断乘法运算：将待压缩角度Z的尾数M_Z与获取到的所述区间C采用截断乘法器执行2/π乘法运算，输出乘法运算结果M₀；

1.3)规格化：获取所述乘法运算结果M₀中整数部分Q以及小数位R，根据所述整数部分Q确定压缩后角度Z_R的象限，并将所述小数位R经过规格化得到指数

和尾数

输出；

1.4)π/2截断乘法运算：将所述尾数

和乘数D采用截断乘法器执行π/2乘法运算，得到压缩后角度输出。

作为本发明方法的进一步改进，所述步骤1.1)的具体步骤为：

1.1)分别获取所述指数E_Z的高位、低位，根据获取到的所述指数E_Z的高位从2/π存储单元中查找出所述区间C所在的所有r个存储单元组；

1.2)将获取的所述指数E_Z的低位作为r个左移位器的移位控制信号，并分别对查找出的所述存储单元组进行移位，由各个所述左移位器输出的高位部分得到所述区间C。

作为本发明方法的进一步改进，所述步骤1.2)中具体采用

位截断乘法器执行2/π乘法运算，其中L_C为所述区间C的长度，

为待压缩角度Z的尾数M_Z的长度；所述采用截断乘法器执行2/π乘法运算时，具体将整数位的高

位和小数位的低

位截断不输出，输出中间

位计算结果。

作为本发明方法的进一步改进：所述步骤4)中具体采用

位截断乘法器执行π/2乘法运算，其中

为所述第一尾数

的长度，L_D为乘数D的长度；所述采用截断乘法器执行π/2乘法运算时，具体将低L_D位截断不输出，输出高L_D位。

作为本发明方法的进一步改进：所述步骤2)中Taylor展开式完成正弦或余弦函数的计算时，具体采用截断乘法器完成Taylor展开式中前两项的计算。

作为本发明方法的进一步改进：所述步骤2)中使用CORDIC计算完成正余弦函数的计算时，将X和Y通路中前半部分采用基于CSA的迭代计算进行计算、后半部分采用基于CSA的并行迭代计算进行计算；所述步骤2)中使用CORDIC算法完成正余弦函数的计算时，Z通路基于符号预测进行计算。

一种正余弦函数计算的实现装置，包括：

角度压缩单元，用于判断输入角度是否在指定范围内，如果是，将输入角度作为目标计算角度Z_R输出，否则对输入角度进行压缩，并将输出压缩后角度作为目标计算角度Z_R输出；

TCORDIC计算单元，用于对目标计算角度Z_R采用TCORDIC算法执行正弦或余弦函数的计算，且当压缩后角度Z_R与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC计算完成正余弦函数的计算。

作为本发明装置的进一步改进，所述角度压缩单元包括：

预处理模块，用于根据输入角度Z的指数E_Z获取需要参与2/π乘法运算的区间C；

2/π截断乘法运算模块，用于将待压缩角度Z的尾数M_Z与获取到的所述区间C采用截断乘法器执行2/π乘法运算，输出乘法运算结果M₀；

规格化模块，用于获取所述乘法运算结果M₀中整数部分Q以及小数位R，根据所述整数部分Q确定压缩后角度Z_R的象限，并将所述小数位R经过规格化得到指数

和尾数

输出；

π/2截断乘法运算模块，用于将所述尾数

作为本发明装置的进一步改进，所述2/π截断乘法运算模块具体采用

位截断乘法器，其中L_C为所述区间C的长度，

为待压缩角度Z的尾数M_Z的长度；所述

位截断乘法器执行2/π乘法运算时，具体将整数位的高

位和小数位的低

位截断不输出，输出中间

位计算结果；

所述π/2截断乘法运算模块中具体采用

位截断乘法器，其中

为所述第一尾数

的长度，L_D为乘数D的长度；所述

位截断乘法器执行π/2乘法运算时，具体将低L_D位截断不输出，输出高L_D位；

所述TCORDIC计算单元包括Taylor展开式模块以及CORDIC计算模块，当目标计算角度Z_R与0度或π/2度之间的差值小于指定阈值时，执行所述Taylor展开式模块，否则执行CORDIC计算模块。

与现有技术相比，本发明的优点在于：

1)本发明通过首先将输入角度压缩至[0,π/2]范围内，再采用TCORDIC算法执行正弦或余弦函数的计算，能够实现任意单精度、双精度角度正余弦函数的高效计算，同时TCORDIC计算过程中结合CORDIC算法和Taylor算法实现，使得当目标计算角度接近0度或π/2度时，利用Taylor展开式计算，同时充分利用CORDIC算法精确计算0度至π/2度范围内其他角度的正余弦函数，从而使得在0度或π/2度以及0度至π/2度整个范围内时均能够实现高精度正弦、余弦函数计算；

2)本发明结合TCORDIC计算，基于硬件流水结构首先实现任意浮点输入角度的压缩，角度压缩过程中通过先确定2/π中需要参与乘法运算的区间，再采用截断乘法器执行2/π乘法运算、以及使用截断乘法器执行π/2乘法运算，以优化乘法器的位宽，能够在保证压缩精度的同时，有效减少参与压缩过程中乘法运算的位数，大大减少了角度压缩阶段所需的乘法器硬件开销，从而能够在保证计算精度的同时，最大限度的减少正余弦函数整个计算过程的复杂度及硬件开销；

3)本发明使用2/π截断乘法器执行2/π乘法运算，以及π/2截断乘法器执行π/2乘法运算的基础上，通过采用

位截断乘法器执行2/π乘法运算，以及采用

位截断乘法器执行π/2乘法运算，优化2/π截断乘法器、π/2截断乘法器的位宽，能够进一步减少压缩的硬件开销，同时提高浮点角度压缩的精度，从而进一步减少正余弦函数计算的开销、提高计算精度；

4)本发明使用CORDIC计算完成正余弦函数的计算时，将X和Y通路中前半部分采用基于CSA的迭代计算进行计算、后半部分采用基于CSA的并行迭代计算进行计算，Z通路基于符号预测进行计算，能够消除数据相关，同时高精度、低延时的函数计算。

附图说明

图1是本实施例正余弦函数计算的实现方法的实现流程示意图。

图2是本实施例步骤1)中对输入角度进行压缩的实现流程示意图。

图3是使用位宽被优化的乘法器执行2/π乘法运算时第一种计算部分的原理示意图。

图4是使用位宽被优化的乘法器执行2/π乘法运算时第二种计算部分的原理示意图。

图5是使用截断乘法器执行π/2乘法运算所需计算部分的原理示意图。

图6是本发明具体实施例中所采用的角度压缩单元的结构示意图。

图7是本发明具体实施例中所采用的TCORDIC计算单元中预处理模块的结构示意图。

图8是本发明具体实施例中所采用的TCORDIC计算单元中Taylor展开式模块结构示意图。

图9是本发明具体实施例中所采用的TCORDIC计算单元中CORDIC计算模块的结构示意图。

图10是本发明具体实施例中所采用的TCORDIC计算单元中后处理模块的结构示意图。

图11是本发明具体实施例中所采用的正余弦函数计算的实现装置的结构示意图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述，但并不因此而限制本发明的保护范围。

如图1所示，本实施例正余弦函数计算的实现方法，步骤包括：

2)TCORDIC计算：对目标计算角度Z_R采用TCORDIC算法执行正弦或余弦函数的计算，且当目标计算角度与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC算法完成正余弦函数的计算。

本实施例通过输入任意的双精度、单精度角度，当输入角度不在[0,π/2]范围内时，首先将输入角度进行压缩，压缩后采用TCORDIC算法执行正弦或余弦函数的计算，否则直接采用TCORDIC算法执行，同时TCORDIC计算过程中结合CORDIC算法和Taylor算法实现，使得当目标计算角度接近0度或π/2度时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC算法完成正余弦函数的计算，即在CORDIC算法精度不高的接近0度、π/2度时利用Taylor展开式计算，并充分利用CORDIC算法精确计算0度至π/2度范围内其他角度的正余弦函数，从而使得在0度或π/2度以及0度至π/2度整个范围内时均能够实现高精度正弦、余弦函数计算。

如图2所示，本实施例步骤1)中对输入角度进行压缩的具体步骤为：

和尾数

输出；

1.4)π/2截断乘法运算：将所述尾数

对于任意IEEE-754双精度格式输入角度Z，首先需要将输入角度压缩至Z_Rε[0,π/2]的范围内，根据正余弦函数的周期性，输入角度压缩前浮点表示

定点表示M；压缩后输入角度浮点表示和定点表示对应为Z_R和M_R。通过mod函数定义角度压缩:

其中Z和

为实数，

且K为整数，其中

首先进行区间映射：

计算出Q和R，Q是整数、R是小数；然后进行象限选择，根据整数最低两位Q[1:0]和输入角度Z符号S_Z确定压缩后输入角度所在象限，假设S_Z为正，象限选择对应表如表1所示；再进行映射角度计算：

得到映射角度M_R；上述角度压缩过程中，本实施例使用2/π截断乘法器执行尾数M_Z与区间C之间的2/π乘法运算、以及使用π/2截断乘法器执行尾数

和乘数D之间的π/2乘法运算，D是π/2的高L_D位，其中对于双精度浮点数D是π/2的高60位。

表1：象限选择对应表。

Domain	Q[1∶0]
		[0，π/2]	00
[π/2，π]	01
		[π，3π/2]	10
[3π/2,2π]	11

在上述区间映射步骤中，执行乘法操作

时，实质是尾数M_Z和2/π进行计算，得到的结果包括整数Q和小数R。当使用完整乘法器执行2/π乘法运算时，参与乘法运算的2/π的位数是

其中L_Q为整数Q的长度，L_RH为小数位高位部分R_H的长度，则根据角度压缩原理，需要计算整数Q指示输入角度所在象限，Q包括E_Z-E_offset+1位；同时为保证压缩后角度满足精度要求，小数高位部分R_H需要包含

有效位，其中

为第一尾数

的长度，从而保证最终的压缩结果R_H×π/2有

有效位，其中

为第二尾数

即R_H需要的位数由R_H中前导零位数L_RLZERO、π/2截断乘法器输入的有效位

2/π截断乘法器的保护位L_RG组成；但是当输入角度越接近π/2的整数倍时，R_H中前导零的位数越多，为保证此时仍然有

有效位，需要计算的R_H位数增多，参与乘法运算的2/π的位数增多，使得乘法器开销也同时增大。

考虑上述压缩过程中开销问题，为了减少参与乘法运算的2/π的位数，本实施例在上述TCORDIC计算上，基于硬件流水结构实现任意浮点输入角度的压缩，角度压缩过程中通过先确定2/π中需要参与乘法运算的区间C，再采用截断乘法器执行2/π乘法运算、以及使用截断乘法器执行π/2乘法运算，以优化乘法器的位宽，能够在保证压缩精度的同时，有效减少参与压缩过程中乘法运算的位数，大大减少了角度压缩阶段所需的乘法器硬件开销，从而能够在保证计算精度的同时，最大限度的减少正余弦函数整个计算过程的复杂度及硬件开销。

本实施例具体通过减少L_Q和

位数优化乘法器位宽，能够保证压缩精度的同时，减少角度压缩所需的硬件开销。对于

位数，本实施例具体通过获取小数位高位部分R_H中前导零位数的最大值L_MAXLZERO，基于最大值L_MAXLZERO减少

位数，小数位R前导零位数的最大值L_MAXLZERO具体可采用W.Kahan搜索算法等方法，其中对于双精度，L_MAXLZERO＝61。对于L_Q的位数，根据三角函数的周期性原理，整数部分Q需要计算的只是低两位Q[1:0]，为计算任意指数的输入角度，2/π中需要存储的位数最少是

但是参与乘法运算的只是2/π的一个区间，本实施例通过确定2/π中需要参与乘法运算的区间C，以减少L_Q的位数。

本实施例中，步骤1.1)的具体步骤为：

1.1)分别获取指数E_Z的高位、低位，根据获取到的指数E_Z的高位从2/π存储单元中查找出区间C所在的所有r个存储单元组；

1.2)将获取的指数E_Z的低位作为r个左移位器的移位控制信号，并分别对查找出的存储单元组进行移位，由各个左移位器输出的高位部分得到区间C。

本实施例具体采用二级查找的方法从2/π中存储的位数中获得区间C，通过E_Z的高位部分查找出区间C所在的所有存储单元组r个，其中

E_Z的低位作为r个桶形左移位器的移位控制信号对查找出的存储单元组进行移位，r个移位器输出拼接的高位部分就是所需区间C。

当

时，如图3所示，矩形框内包围的部分代表位宽被优化的截断乘法器计算的部分，填充部分代表位宽被优化的完整乘法器计算的部分，则2/π中参与乘法运算的区间C应当为：从2/π第

位开始，向低位取

位，区间C的长度为

位；

当

时，如图4所示，矩形框内包围的部分代表位宽被优化的截断乘法器计算的部分，填充部分代表位宽被优化的完整乘法器计算的部分，左侧阴影填充部分是指在2/π之前补充的0位，此时2/π中参与乘法运算的区间C应当为：最高

位是补充的0位，接下来从2/π第0位开始，向低位取

位，区间C的长度为

位。

本实施例2/π存储单元中存储的位数被划分成k个存储单元，每个存储单元有l位，最后一个未存满的存储单元补0，如对于单精度，存储单元l＝32，k＝7，对于双精度，l＝64，k＝19。由上述可知，本实施例采用截断乘法器，相比于传统的完整乘法器，最高

位和最低

位可以不用计算。为保证对任意指数的输入角度都能有统一位数的区间C，本实施例具体使得2/π中需要存储的位数最少是

其中最高

位是补充的0，其余由2/π的高位组成。其中

L_C为区间C的长度，且

本实施例中，步骤1.2)中具体采用

为待压缩角度Z的尾数M_Z的长度；采用截断乘法器执行2/π乘法运算时，具体将整数位的高

位和小数位的低

位截断不输出，输出中间

位计算结果。

本实施例对2/π截断乘法器，输入(

位，L_MZ位)，乘法器的最高

位和最低

位都截断不计算，输出中间的

位，其中最高两位是Q[1:0]，其余是

保护位

位，L_RLZERO是R_H中前导零位数,L_RTCORDIC是基于TCORDIC算法的正余弦函数计算需要的有效位数。当Z最接近π/2的整数倍时，R_H中前导零位数越多L_MAXRLZERO。

当E_offset-E_ZR>N，其中N是TCORDIC算法计算的边界，R_H中前导零个数是最大值L_MAXRLZERO，正弦计算需要的有效位数是

余弦计算L_RTCORDIC＝L_CORDIC,所以

当E_offset-E_ZR<N,R_H中前导零个数是L_RLZERO＝N(N是TCORDIC算法计算的边界)，正余弦计算需要的有效位数都是L_CORDIC，所以L_RH2≥N+L_CORDIC+L_RG。

综上可得，L_RH＝max{L_RH1,L_RH2}。

本实施例中，步骤1.4)中具体采用

位截断乘法器执行π/2乘法运算，其中

为第一尾数

的长度，L_D为D的长度；采用截断乘法器执行π/2乘法运算时，具体将低L_D位截断不输出，输出高L_D位。为保证后续的后处理中M_ZR位宽，同时考虑到压缩后角度

最高位有可能为0的情况，

中至少需要高M_ZR+1精确位。如图5所示，当采用截断乘法器时，图中填充处代表省略不计算，为保证高M_ZR+1位计算结果正确，必须满足：

其中

代入M_ZR，解得

即执行π/2计算时，截断乘法器的输入

位，输出高

位，其中高M_ZR+1位是需要保证的精确位，其余为保护位。

本实施例使用2/π截断乘法器执行2/π乘法运算，以及π/2截断乘法器执行π/2乘法运算的基础上，通过采用上述方式进一步优化2/π截断乘法器、π/2截断乘法器的位宽，压缩后的计算结果误差具体可小于1ulp。

本实施例具体对于正弦函数，当压缩后的输入角度Z_R-E_offset<N时，正弦计算由低延迟的CORDIC算法完成，当Z_R-E_offset≥N时，余弦计算由Taylor展开式完成。对于余弦函数来说，当压缩后的输入角度Z_R'-E_offset<N时，余弦计算由低延迟的CORDIC算法完成，当Z_R'-E_offset≥N时，余弦计算由Taylor展开式计算完成。其中Z_R'是指π/2-Z_R'规格化之后的指数。

本实施例中，步骤2)中Taylor展开式完成正弦或余弦函数的计算时，具体采用截断乘法器完成Taylor展开式中前两项的计算，以直接算Taylor展开式。

由于Taylor算法在其自变量较小时，具有较快的收敛速度，假定展开的项数为c-1，本实施例具体使得展开被省略的项之和小于

为了保证计算结果的精度，被省略的项之和应该小于

可得

本实施例中，步骤2)中使用CORDIC计算完成正余弦函数的计算时，将X和Y通路中前半部分采用基于CSA的迭代计算进行计算、后半部分采用基于CSA的并行迭代计算进行计算；步骤2)中使用CORDIC算法完成正余弦函数的计算时，Z通路基于符号预测进行计算，能够消除第一种数据相关。

本实施例Z通路计算具体步骤为：

Z_j的二进制表达式

其中b_j∈{0,1}。假设Z_j＝b₀.b₁...b_j-1b_j...b_k，其中b₀＝b₁＝...＝b_j-1；

第j位到第k位的转换规则定义如下：如果Z_j为正数，即b_j-1为0，则σ_j为1，反之σ_j为-1；对i>j-1，如果b_i为0，则σ_i+1为-1，否则σ_i+1为1；上述预测规则的每一次迭代都可能产生的角度误差为2^-i-α_i，为保证收敛性，则k-i+1次迭代产生的累积误差必须小于2^-N，因此k和i必须满足k≤3i+1。

当迭代索引

时，2^-i-α_i<2^-N，使用2^-i代替α_i而直接使用转换规则得到后2/3次迭代的旋转方向；当迭代索引

时，根据关系式k≤3i+1在迭代序列中适当的位置加入校正迭代以保证预测正确性。

本实施例在上述符合预测的基础上，X、Y通路中前半部分的压缩迭代利用CSA完成，CSA可以消除每次压缩迭代中随位宽而增加的进位延时，使之与操作字长无关，保证了在高精度计算情况下的低延时，同时避免Z通路计算成为关键路径，通过X和Y通路前半部分采用基于CSA的迭代计算、后半部分采用基于CSA的并行迭代，能够大大降低延迟。本实施例X、Y通路中，相比于传统的使用超前进位加法器，具体采用4:2压缩的进位保留加法器。

本实施例中CORDIC算法中后半部分计算利用并行迭代，将其展开计算，能够消除第二种数据相关，并减少迭代次数。

后

次的迭代可以看成是对旋转角度

即Z_n/2+1的旋转，即：

本实施例将并行迭代进行化简，使用两个乘法器和两个加法器完成即可完成后半部分的迭代计算。

本实施例上述步骤完成后，进一步执行后处理步骤，根据角度是否压缩的指示信号S_R、象限指示信号Q[1:0]、Taylor展开式是否选择信号S_T，选择出最终的正余弦函数计算结果。

如图6～11所示，本发明在具体实施例中实现正余弦函数计算所采用的装置结构，具体包括角度压缩单元、TCORDIC计算单元，TCORDIC计算单元包括Taylor展开式模块以及CORDIC计算模块，当目标计算角度Z_R与0度或π/2度之间的差值小于指定阈值时，执行Taylor展开式模块，否则执行CORDIC计算模块；如图中所示，结构位宽以双精度为例，共包括①～⑤部分，其中①为角度压缩，②为TCORDIC预处理，③为Taylor通路计算，④为CORDIC通路计算，以及⑤为TCORDIC后处理。

如图6所示为本发明具体实施例中所采用的角度压缩单元，具体包括预处理模块、2/π截断乘法运算模块、规格化模块以及π/2截断乘法运算模块。首先输入浮点格式角度Z，当0≤E时，输入角度需要进行角度压缩，此时S_R信号为真；当E<-5时，S_T信号为真，输入角度的正弦值由Taylor算法完成；2/π存储查找表的所有的存储单元都是64位宽，共20个E＝E_Z-E_offset，E[10:6]索引2/π存储表的连续8个存储单元，E[5:0]决定了存储单元位移位数；在移位之后，在通过拼接选择，得到需要参与乘法运算的2/π的175位。2/π的175位和53位的M_Z采用截断乘法器，输出乘法结果高175，175位中有整数位55位，高53整数位舍去，最低2位整数位指示象限，小数部分的高120位是R；再R₁通过规格化得到其有效位的高73位

最后和73位的π/2利用截断乘法器相乘，乘法结果高73位是压缩后的角度，E_R,M_ZR分别对应输入角度的E，M_Z。

如图7所示，本发明具体实施例中TCORDIC计算单元中的用于预处理的预处理模块，目标计算角度Z_R根据指数的E_R和N大小，判断是否需要选择Taylor算法；同时通过移位操作将目标计算角度的尾数从IEEE-754双精度格式转换成定点格式，本实施例取Z₀格式：73(小数位)+1(整数位)+1(符号位)＝75位。

如图8所示，本发明具体实施例中TCORDIC计算单元中的Taylor展开式模块，采用三个截断乘法器完成Taylor展开式前两项，其中前两个截断乘法器分别计算Src×Src和Src×1/6，采用34*34位截断乘法器输出38位，其中保护位6位，得到的精确位32位中间计算结果输入32*32位截断乘法器。

如图9，本发明具体实施例中的TCORDIC计算中CORDIC计算模块，包括Z通路计算通路，XY计算通路，Z计算通路采用符号预测，XY计算通路将前半部分采用基于CSA的迭代计算、后半部分采用基于CSA的并行迭代。CORDIC算法中具体X，Y通路迭代次数及位宽是73，前9级采用初始查找表代替迭代，第9级到第32级采用迭代压缩的方式，最后的32级采用并行迭代的方式，采用截断乘法器完成。Z₃₇在经过36次迭代之后，高36位已经变成了符号位，所以只需输入Z₃₇的低36位参与乘法运算。为得到36位精确结果，乘法器输入39*39位，输出42位，其中精确36位。Z通路采用压缩和求和交替的方法，共有三个符号预测模块，在需要进行符号预测的Z₁,Z₄，Z₁₃采用CLA求和，其余采用CSA压缩迭代的方法。

如图10所示，本发明具体实施例中TCORDIC计算中后处理模块，根据是否需要角度压缩的信号S_R、是否需要选择Taylor展开计算通路的信号S_T，以及象限指示信号Q[1:0]，选择输出最终正余弦的计算结果。

本实施例进一步包括正余弦函数计算的实现装置，包括：

本实施例中，角度压缩单元包括：

2/π截断乘法运算模块，用于将待压缩角度Z的尾数M_Z与获取到的区间C采用截断乘法器执行2/π乘法运算，输出乘法运算结果M₀；

规格化模块，用于获取乘法运算结果M₀中整数部分Q以及小数位R，根据整数部分Q确定压缩后角度Z_R的象限，并将小数位R经过规格化得到指数

和尾数

输出；

π/2截断乘法运算模块，用于将尾数

本实施例中，2/π截断乘法运算模块具体采用

位截断乘法器，其中L_C为区间C的长度，

为待压缩角度Z的尾数M_Z的长度；

位截断乘法器执行2/π乘法运算时，具体将整数位的高

位和小数位的低

位截断不输出，输出中间

位计算结果；

π/2截断乘法运算模块中具体采用

位截断乘法器，其中

为第一尾数

的长度，L_D为乘数D的长度；

本实施例中，TCORDIC计算单元包括Taylor展开式模块以及CORDIC计算模块，当目标计算角度Z_R与0度或π/2度之间的差值小于指定阈值时，执行Taylor展开式模块，否则执行CORDIC计算模块。Taylor展开式模块具体采用截断乘法器完成Taylor展开式中前两项的计算。CORDIC计算模块包括Z通路计算单元、XY通路计算单元，XY通路计算单元将X和Y通路中前半部分采用基于CSA的迭代计算进行计算、后半部分采用基于CSA的并行迭代计算进行计算。

本发明具体实施例中正余弦函数计算的实现装置如图6～11所示。本实施例正余弦函数计算的实现装置与正余弦函数计算的实现方法的原理一致，在此不再赘述。

上述只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

Claims

1.一种正余弦函数计算的实现方法，其特征在于，步骤包括：

2)TCORDIC计算：对目标计算角度采用TCORDIC算法执行正弦或余弦函数的计算，且当目标计算角度与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC算法完成正余弦函数的计算；

所述步骤1)中对输入角度进行压缩的具体步骤为：

和尾数

输出；

1.4)π/2截断乘法运算：将所述尾数

2.根据权利要求1所述的正余弦函数计算的实现方法，其特征在于，所述步骤1.1)的具体步骤为：

1.11)分别获取所述指数E_Z的高位、低位，根据获取到的所述指数E_Z的高位从2/π存储单元中查找出所述区间C所在的所有r个存储单元组；

1.12)将获取的所述指数E_Z的低位作为r个左移位器的移位控制信号，并分别对查找出的所述存储单元组进行移位，由各个所述左移位器输出的高位部分得到所述区间C。

3.根据权利要求2所述的正余弦函数计算的实现方法，其特征在于，所述步骤1.12)中具体采用

位和小数位的低

位截断不输出，输出中间

位计算结果。

4.根据权利要求2或3所述的正余弦函数计算的实现方法，其特征在于：所述步骤1.4)中具体采用

位截断乘法器执行π/2乘法运算，其中

为第一尾数

5.根据权利要求1或2或3所述的正余弦函数计算的实现方法，其特征在于，所述步骤2)中Taylor展开式完成正弦或余弦函数的计算时，具体采用截断乘法器完成Taylor展开式中前两项的计算。

6.根据权利要求1或2或3所述的正余弦函数计算的实现方法，其特征在于，所述步骤2)中使用CORDIC计算完成正余弦函数的计算时，将X和Y通路中前半部分采用基于CSA的迭代计算进行计算、后半部分采用基于CSA的并行迭代计算进行计算；所述步骤2)中使用CORDIC算法完成正余弦函数的计算时，Z通路基于符号预测进行计算。

7.一种正余弦函数计算的实现装置，其特征在于，包括：

TCORDIC计算单元，用于对目标计算角度Z_R采用TCORDIC算法执行正弦或余弦函数的计算，且当压缩后角度Z_R与0度或π/2度之间的差值小于指定阈值时，通过Taylor展开式完成正弦或余弦函数的计算，否则使用CORDIC计算完成正余弦函数的计算；

所述角度压缩单元包括：