CN105022721B

CN105022721B - 一种快速、自动化的定点fft字长配置方法

Info

Publication number: CN105022721B
Application number: CN201510416168.5A
Authority: CN
Inventors: 谢宜壮; 杨晨; 陈禾; 谢愚; 陈亮; 龙腾
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2015-07-15
Filing date: 2015-07-15
Publication date: 2017-10-31
Anticipated expiration: 2035-07-15
Also published as: CN105022721A

Abstract

本发明公开了一种快速、自动的定点FFT各级字长配置方法，具体过程如下：首先针对定点快速傅里叶变换FFT，根据需求设定：输入字长、最终输出信噪比以及FFT运算长度；以FFT每一级加减法运算均进行字长扩展和均不进行字长扩展的情况，计算每一级信噪比衰落的范围的下限和上限；利用最终输出信噪比以及每一级信噪比衰落的范围，计算得到FFT中各级输出信噪比的范围；利用各级信噪比的范围计算出各级截位向量的范围，从而得到各级字长的范围，并确定多组字长配置方案；对各组字长配置方案进行输出信噪比的验证，选取满足要求且存储资源消耗最少的一组作为最终字长配置方案。本发明能够节省存储资源，提高定点化子长配置效率。

Description

一种快速、自动化的定点FFT字长配置方法

技术领域

本发明属于数字信号处理技术领域，涉及一种自动配置定点FFT各级字长的方法。

背景技术

FFT算法是一种实现DFT(离散傅里叶变换)的快速算法，得益于FFT算法的高效，FFT在很多对实时性要求很高的应用中扮演着重要角色。如何进一步降低FFT运算的硬件资源，进一步提升FFT算法的运算速度一直都是数字信号处理领域的重要课题。

FFT算法作为一种运算，可以采用不同的数据格式。传统的通用处理器可以采用浮点格式完成FFT运算，但是浮点加减乘除运算更复杂，占用的硬件资源多，并且运算时间长。如今，随着移动/便携设备逐渐普及，半导体厂商诸如因特尔、高通、德州仪器等都在积极的寻找低功耗、高性能的整体解决方案，而FFT作为这些运算密集型应用的主要部分，定制化的定点数据格式开始被采纳。定点数据格式能够带来低功耗，高实时性等好处，同时，通过优化定点字长的配置，可以满足应用需求的运算精度。如何确定FFT各级的字长一直是采用定点格式进行FFT运算的重点和难点。随着SystemC、System Verilog、Matlab Simulink等定点仿真工具的出现，通过仿真的方式训练FFT字长是一种常用方式，但这种方法效率较低，需要长时间的机械化训练才能得到一组字长配置。在这种基于仿真的方法以外，也可以通过理论建模的方式研究定点字长的配置，但是与仿真方法相比，受限于模型的精确性，理论建模的方式可能会与实际结果有所偏差。

发明内容

有鉴于此，本发明提供了一种快速、自动化的定点FFT字长配置方法，从而达到保证定点FFT输出SQNR的情况下，实现节省存储资源的目标。

为了达到上述目的，本发明的技术方案为：一种快速、自动的定点FFT各级字长配置方法，具体过程如下：

步骤一、针对定点快速傅里叶变换FFT，根据需求设定约束条件：输入字长、最终输出信噪比以及FFT运算长度。

步骤二、以FFT每一级加减法运算均进行字长扩展的情况，计算每一级的信噪比衰落值作为衰落值范围的下限，以每一级加减法运算均不进行字长扩展的情况，计算每一级的信噪比衰落值作为衰落值范围的上限，从而得到FFT中每一级信噪比衰落的范围。

步骤三、利用所述最终输出信噪比以及每一级信噪比衰落的范围，计算得到FFT中各级输出信噪比的范围。

步骤四、利用FFT中各级输出信噪比的范围计算出各级截位向量的范围，从而得到各级字长的范围，并确定多组字长配置方案。

步骤五、对各组字长配置方案进行输出信噪比的验证，剔除未达到最终输出信噪比要求的字长配置方案，并在满足最终信噪比要求的字长配置方案中，选取存储资源消耗最少的一组作为最终字长配置方案。

进一步地，步骤二中计算每一级的信噪比衰落值的具体方法为：利用定点仿真语言SystemC，对每一级加减法运算均进行字长扩展、以及每一级加减法运算均不进行字长扩展的两种情况的定点FFT进行仿真，计算两种情况下每一级输出信噪比，并将当前级的下一级输出信噪比与当前级输出信噪比做差作为当前级衰落值。

进一步地，FFT为基2²FFT，其中输入字长为b₀，最终输出信噪比为SQNR_out，FFT运算长度为N，则FFT运算每一级i的字长为其中T_i为第i级截位向量；

则所述步骤四中，利用FFT中各级输出信噪比的范围计算出各级截位向量的范围的具体方法为：根据对基2²FFT的建模分析，由第1级开始向最后一级逐级计算截位向量，其中对于第v级截位向量T_v，

SQNR_v为第v级输出信噪比。

进一步地，步骤三中，在每一级信噪比衰落范围的区间上根据需要选取多个采样值，其中第i级采样值为Δ_i，则第i级输出信噪比为则每一级获得多个输出信噪比；然后利用每一级每个输出信噪比计算一个字长，在所述步骤五中，形成多组字长配置方案，每个字长配置方案中均包括log₂N+1个字长值分别为则该方案的存储资源消耗为：其中N为FFT运算长度。

有益效果：

1、。为了克服定点仿真方法训练FFT字长耗时长、效率低，建模方法准确度差的缺陷，本发明提出了一种快速且自动化的定点FFT字长配置方法。结合了定点FFT误差模型和SystemC定点仿真，这种方法能够快速并且自动地产生一组合适的FFT字长配置，从而降低FFT运算的存储资源消耗，同时达到要求的信号量化噪声比(SQNR)性能。本发明方法，对比已有技术，能够减少仿真方法确定定点字长所需消耗的时间，能够修正建模方法确定定点字长的准确度，通过快速、自动化的字长配置，达到节省FFT运算存储资源、保证其输出信噪比的目的。

附图说明

图1为输入字长与输入信噪比关系图；

图2为256点FFT为例的信噪比衰落图；

图3为逐级计算各级截位向量流程图。

具体实施方式

下面结合附图并举实施例，对本发明进行详细描述。

一种快速、自动的FFT各级字长配置方法，其具体步骤包括：

步骤一、根据应用需求确定输入字长b_in、输出信噪比SQNR_out、FFT长度N。SQNR_out和N为系统参数，可以根据系统性能要求和数据点数直接得到。一般输入字长b_in也可由系统直接决定，但如果没有确定的输入字长要求，可以如图1所示，按照1bit字长约6dB输入信噪比的标准进行估算，由于定点FFT中间级会有信噪比损失，所以输入信噪比SQNR_in要大于SQNR_out才可行，那么可以大致估算SQNR_in的大小，然后除以6，得到大致的输入字长b_in。

步骤二、利用定点仿真语言SystemC，对中间各级都进行数据位扩展和中间各级都不进行数据位扩展这两种情况下的定点FFT进行仿真，图2所示为以基2²FFT为例的这两种情况下的定点FFT字长配置情况，计算各个中间级的输出信噪比SQNR_i，并逐级做差:Δ_i＝SQNR_i+1-SQNR_i，得到各级之间信噪比的衰落值Δ_i是多少。中间各级都不进行数据位扩展的情况下得到的各级之间的衰落值Δ_li作为衰落值范围的下限，中间各级都进行数据位扩展的情况下得到的各级之间的衰落值Δ_ui作为衰落值范围的上限，这样就得到了衰落值的范围。

步骤三、利用步骤一当中已经确定下来的SQNR_out，估算FFT中间各级的输出信噪比SQNR_i。由于信噪比衰落量Δ_i是Δ_li～Δ_ui范围内的数值，故SQNR_i也是一个范围值，它可以由下式计算得来：

步骤四、对于输入字长b₀，FFT运算各中间级的字长可以表示为其中T_i为各级截位向量，只要得到这组截位向量{T_i}，就可以得到各级FFT运算的字长。根据对基2²FFT的建模分析，可以得到计算T_i的公式如(2)所示，如图3所示，计算当前级截位向量T_i时，需要使用前面各级已经计算得出的截位向量{T₁,T₂,…,T_i-1}，所以需要由第一级向最后一级，逐级计算截位向量。由于SQNR_i是一个范围，故得到的{T_i}以及相应的各级字长{b_i}也有多组。

步骤五、利用SystemC语言对得到的多组字长配置进行仿真，验证其输出信噪比是否达到系统要求，剔除未达到输出信噪比SQNR_out要求的字长配置组，并按照式(3)计算剩余各字长配置组所对应的存储资源消耗M_T，选取所需存储资源最小的一组作为最终的字长配置。

以上工作均可用SystemC语言编程实现，并且全流程不需要反复迭代，节省时间同时降低运算量，全程不需要人为干预，快速、自动化的完成定点FFT字长配置。

综上，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种快速、自动的定点FFT各级字长配置方法，其特征在于，具体过程如下：

步骤一、针对定点快速傅里叶变换FFT，根据需求设定约束条件：输入字长、最终输出信噪比以及FFT运算长度；

步骤二、以FFT每一级加减法运算均进行字长扩展的情况，计算每一级的信噪比衰落值作为衰落值范围的下限，以每一级加减法运算均不进行字长扩展的情况，计算每一级的信噪比衰落值作为衰落值范围的上限，从而得到FFT中每一级信噪比衰落的范围；

步骤三、利用所述最终输出信噪比以及每一级信噪比衰落的范围，计算得到FFT中各级输出信噪比的范围；

步骤四、利用FFT中各级输出信噪比的范围计算出各级截位向量的范围，从而得到各级字长的范围，并确定多组字长配置方案；

步骤五、对各组字长配置方案进行输出信噪比的验证，剔除未达到最终输出信噪比要求的字长配置方案，并在满足最终信噪比要求的字长配置方案中，选取存储资源消耗最少的一组作为最终字长配置方案；

所述步骤二中计算每一级的信噪比衰落值的具体方法为：利用定点仿真语言SystemC，对每一级加减法运算均进行字长扩展、以及每一级加减法运算均不进行字长扩展的两种情况的定点FFT进行仿真，计算两种情况下每一级输出信噪比，并将当前级的下一级输出信噪比与当前级输出信噪比做差作为当前级衰落值；

所述FFT为基2²FFT，其中输入字长为b₀，最终输出信噪比为SQNR_out，FFT运算长度为N，则FFT运算每一级i的字长为其中T_i为第i级截位向量；

<mrow> <msub> <mi>T</mi> <mi>v</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>-</mo> <mn>1</mn> <mo>+</mo> <msqrt> <mrow> <mn>1</mn> <mo>-</mo> <mn>4</mn> <mo>&CenterDot;</mo> <msup> <mn>2</mn> <mrow> <mo>-</mo> <mn>3</mn> <mi>v</mi> </mrow> </msup> <mo>&CenterDot;</mo> <mrow> <mo>(</mo> <msup> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>4</mn> </mfrac> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>v</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>T</mi> <mi>i</mi> </msub> </mrow> </msup> <mo>&CenterDot;</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>v</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>4</mn> </mfrac> <mo>)</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <mi>v</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>-</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>i</mi> </munderover> <msub> <mi>T</mi> <mi>k</mi> </msub> </mrow> </msup> <mo>&CenterDot;</mo> <msup> <mn>2</mn> <mrow> <mo>-</mo> <mn>3</mn> <mi>v</mi> </mrow> </msup> <mo>-</mo> <msub> <mi>SQNR</mi> <mrow> <mi>o</mi> <mi>u</mi> <mi>t</mi> </mrow> </msub> <mo>/</mo> <msub> <mi>SQNR</mi> <mi>v</mi> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> </mrow> <mrow> <mn>2</mn> <mo>&CenterDot;</mo> <msup> <mn>2</mn> <mrow> <mo>-</mo> <mn>3</mn> <mi>v</mi> </mrow> </msup> <mo>&CenterDot;</mo> <msup> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>4</mn> </mfrac> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>v</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>T</mi> <mi>i</mi> </msub> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

SQNR_v为第v级输出信噪比；

所述步骤三中，在每一级信噪比衰落范围的区间上根据需要选取多个采样值，其中第i级采样值为Δ_i，则第i级输出信噪比为则每一级获得多个输出信噪比；然后利用每一级每个输出信噪比计算一个字长，在所述步骤五中，形成多组字长配置方案，每个字长配置方案中均包括log₂ N+1个字长值分别为则该方案的存储资源消耗为：其中N为FFT运算长度。