CN108241592A

CN108241592A - Fft计算装置及方法

Info

Publication number: CN108241592A
Application number: CN201611229387.3A
Authority: CN
Inventors: 陶洪波; 张科; 许巧春; 陆国栋; 李憬然
Original assignee: DATANG LIANYI TECHNOLOGY Co Ltd; RADIOSKY RADIO EQUIPMENT TESTING (BEIJING) CO Ltd; STATE RADIO MONITORING CENTER TESTING CENTER
Current assignee: DATANG LIANYI TECHNOLOGY Co Ltd; RADIOSKY RADIO EQUIPMENT TESTING (BEIJING) CO Ltd; STATE RADIO MONITORING CENTER TESTING CENTER
Priority date: 2016-12-27
Filing date: 2016-12-27
Publication date: 2018-07-03

Abstract

本发明提供了一种FFT计算装置及方法，所述FFT计算装置，包括：模拟数字转换器，配置为接收模拟信号，将所述模拟信号转换为数字信号并输出；可编程器件，配置为对所述数字信号进行预处理并输出；图形处理器GPU，配置为对经过所述预处理后的数字信号进行FFT计算。基于本发明提供的FFT计算装置及方法，能够实现高精度的FFT计算，且有效地减低系统的功耗以及成本。

Description

FFT计算装置及方法

技术领域

本发明涉及数字信号处理领域，特别是涉及一种FFT计算装置及方法。

背景技术

快速傅里叶变换(Fast Fourier Transformation，简称为FFT)是离散傅里叶变换的快速算法，它是根据离散傅傅里叶变换的奇、偶、虚、实等特性，对离散傅立叶变换的算法进行改进获得的。

在高分辨率的频谱分析过程中需要对信号进行FFT计算，而频谱分析的精度很大程度上取决于FFT的计算精度。

FFT计算是频谱分析仪中不可缺少的一种计算方法，而常用的FFT的计方法一般采用以下几种：

1.采用FFT专用硬件器，同时使用FPGA(Field-Programmable Gate Array，现场可编程门阵列)作为预处理器；

2.采用X86(由Intel推出的一种复杂指令集，用于控制芯片的运行的程序)，在应用软件中实现FFT计算；

3.采用DSP(Digital Signal Process，数字信号处理器)，将DSP作为FFT计算的加速器；

4.采用FPGA，在FPGA内部使用通过IP实现FFT计算。

对于以上几种FFT计算方法，FFT硬件加速器虽然低延时、抵功耗，但功能比较单一，硬件设计较为特殊，应用面相对较窄。X86/DSP进行FFT计算时，对CPU的开销占用较大，系统的实时性很难得到保证。而FPGA进行FFT计算时，只有在固定点数且精度要求不高的条件下实时性才最好，当FFT点数变化且FFT的计算点数较大时，现有容量的FPGA很难满足高精度的FFT计算，且实现代价较高。

发明内容

本发明提供了一种FFT计算装置及方法以克服上述问题或者至少部分地解决上述问题。

根据本发明的一方面，提供了一种FFT计算装置，包括：

模拟数字转换器，配置为接收模拟信号，将所述模拟信号转换为数字信号并输出；

可编程器件，配置为对所述数字信号进行预处理并输出；

图形处理器GPU，配置为对经过所述预处理后的数字信号进行FFT计算。

可选地，上述装置还包括：

显示器，配置为显示所述FFT计算的结果。

可选地，所述GPU包括：

第一内核，配置为控制所述FFT计算的结果的显示，并将预置的预处理参数发送给所述可编程器件；

多个第二内核，配置为通过GPU库函数进行并行FFT计算。

可选地，所述参数包括以下至少之一：中心频率、扫频带宽、RBW(ResolutionBandwidth，分辨率带宽)。

可选地，所述预处理包括以下至少之一：混频、滤波、根据预置的RBW值进行抽取滤波。

可选地，所述GPU通过PCIe实现与所述可编程器件的通信。

根据本发明的另一个方面，提供了一种FFT计算方法，包括：

模拟数字转换器接收模拟信号，将所述模拟信号转换为数字信号并输出；

可编程器件对所述数字信号进行预处理并输出；

GPU对经过所述预处理后的数字信号进行FFT计算。

可选地，所述GPU对经过所述预处理后的数字信号进行FFT计算之后还包括：

显示所述FFT计算的结果。

可选地，所述GPU包括：第一内核、多个第二内核；

其中，所述GPU对经过所述预处理后的数字信号进行FFT计算包括：

所述第一内核将预置的预处理参数发送给所述可编程器件；

所述多个第二内核通过GPU库函数进行并行FFT计算；

其中，所述显示所述FFT计算的结果包括：

所述第一内核控制所述FFT计算的显示。

可选地，所述预处理参数包括以下至少之一：中心频率、扫频带宽、RBW。

基于本发明提供的技术方案，模拟信号先通过模拟数字转换器转换为数字信号，并输入至可编程器件，可编程器件对上述数字信号进行预处理之后输出至GPU中进行FFT计算。上述方案提供的FFT计算装置，利用了GPU的高效处理能力，能够实现高精度的FFT计算，且有效地减低系统的功耗以及成本。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述，本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是根据本发明实施例的FFT计算装置结构示意图；

图2是根据本发明优选实施例的FFT计算装置结构示意图；

图3是根据本发明实施例的FFT计算方法流程示意图；

图4是根据本发明优选实施例的GPU示意图；

图5是根据本发明优选实施例的FFT计算装置结构示意图；

图6是根据本发明优选实施例的FFT计算方法流程示意图；

图7是根据本发明优选实施例的NVIDIA的CUDA工具包示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

针对现有技术中的缺陷，本发明的一个实施例提供了一种FFT计算装置，如图1所示，根据本发明实施例的FFT计算装置可以包括：

模拟数字转换器10，配置为接收模拟信号，将模拟信号转换为数字信号并输出；可编程器件20，配置为对数字信号进行预处理并输出；GPU30，配置为对经过预处理后的数字信号进行FFT计算。

本实施例提供的FFT计算装置，利用了GPU的高效处理能力，能够实现高精度的FFT计算，且有效地减低系统的功耗以及成本。

优选地，GPU30可以通过PCIe实现与可编程器件20的通信。

上述实施例提供的方案主要利用了GPU的高效处理能力，对于GPU来说，其一般都具有多核的结构，基于GPU的多核结构，可以为不同的内核分配不同的功能。

可选地，GPU30可以包括：

第一内核31，配置为控制FFT计算的结果的显示，并将预置的预处理参数发送给可编程器件；

多个第二内核32，配置为通过GPU库函数进行并行FFT计算。

为不同的内核分配相对独立的不同的功能，可以保证各个功能的高效实现。一般来说，GPU都配置由相应的函数库，其中都会包括FFT函数库，基于这个FFT函数库即可实现FFT计算。即使有些GPU没有FFT函数库，由于GPU则使用标准的C语言开发，从而大大降低了系统的开发难度的同时还提高了系统的可重配置能力，因此还可以自行编写或移植FFT函数库。

优选地，上述预处理参数包括以下至少之一：中心频率、扫频带宽(Span)、RBW。其中，扫描带宽(Span)指的是在屏幕范围内所测量的频率跨度。

可选地，上述预处理可以包括以下至少之一：对信号信息混频、滤波、根据不同的RBW值对信号进行抽取滤波。

本优选实施例提供的预处理操作和对应的预处理参数只是最典型的操作和参数，基于不同的具体情况，可采用的预处理操作和预处理参数并不限于上述的例子。

根据本发明的一个优选实施例，如图2所示，上述FFT计算装置还可以包括：

显示器40，配置为显示FFT计算的结果。

由于GPU本身就是用于进行图像处理的，因此基于上述第一内核31，可以直接在显示器40上显示FFT计算的结果，实现起来简单方便。

对应于上述FFT计算装置，本发明实施例还提供了一种FFT计算方法。图3是根据本发明实施例的FFT计算方法流程示意图，如图3所示，根据本发明实施例的FFT计算方法可以包括：

步骤S302，模拟数字转换器接收模拟信号，将模拟信号转换为数字信号并输出；

步骤S304，可编程器件对数字信号进行预处理并输出；

步骤S306，GPU对经过预处理后的数字信号进行FFT计算。

可选地，GPU进行FFT计算之后还可以进行步骤S308，显示上述FFT计算的结果。

优选地，GPU包括：第一内核及多个第二内核，其中，

GPU对经过预处理后的数字信号进行FFT计算包括：

第一内核将预置的预处理参数发送给可编程器件；

多个第二内核通过GPU库函数进行并行FFT计算；

其中，显示所述FFT计算的结果包括：

第一内核控制所述FFT计算的显示。

可选地，预处理参数可以包括以下至少之一：中心频率、Span、RBW。

可选地，可编程器件对数字信号的预处理可以包括以下至少之一：混频、滤波、根据预置的RBW值进行抽取滤波。

根据上述实施例提供的FFT计算方法，模拟信号先通过模拟数字转换器转换为数字信号，并输入至可编程器件，可编程器件对上述数字信号进行预处理之后输出至图形处理器进行FFT计算，本实施例通过使用GPU中的多个第二内核的进行FFT并行计算的处理能力，能够对高精度的FFT实现加速，并且能够有效地降低系统的功耗以及成本。

下面通过一个具体的优选实施例对本发明的技术方案进行说明。

在本实施例中，GPU30采用NVIDIA最新推出的TX1移动GPU，该处理器包括4个Cortex-A57内核，以及256个CUDA内核，如图4所示。可编程器件20采用FPGA，显示器40采用LCD(Liquid Crystal Display，液晶显示器)，模拟数字转换器10采用AD(Analog-to-Digital Converter，简写为AD)模块，则FFT计算装置示意图如图5所示。

如图4所示，NVIDIA的TX1移动GPU具有或支持以下功能：2×ISP(InternetService Provider，互联网服务提供商)，ARM7(Advanced RISC Machines，嵌入式处理器)，两个2160p30VIDEO ENCODER(视频编码器)，AUDIO(音频)，USB3.0接口，SECURITY ENGINE(安全引擎)，HDMI(High Definition Multimedia Interface，高清晰度多媒体接口)，DualDISPLAY(双重显示器)，UART(Universal Asynchronous Receiver/Transmitter，通用异步收发传输器)，EMMC4.5(Embedded Multi Media Card，嵌入式非易失性存储器系统)，DDR3LLPDDR2LPDDR3(内存条)，SPI SDIO(串行外设接口)以及I²S和I²C总线。

如图6所示，根据本发明具体实施例的FFT计算方法为：

步骤S602，AD接收模拟信号，将模拟信号转换为数字信号并输出；

步骤S604，FPGA基于Cortex-A57内核发送的预处理参数对数字信号进行预处理并输出；

步骤S606，256个CUDA内核对经过预处理后的数字信号进行并行FFT计算；

步骤S608，在Cortex-A57内核的控制下，LED显示上述FFT计算的结果。

在本具体实施例中，FFT计算基于NVIDIA的CUDA工具包实现，如图7所示，该工具包提供标准的FFT函数库。同时，上述的NVIDIA TX1移动GPU同样使用标准C语言开发，则降低系统的开发难度，提高系统的可重配置能力。

根据本发明具体实施例提供的FFT计算方法，信号经过AD转换之后将数字信号输入至FPGA中，FPGA实现对信号的混频、滤波以及根据不同的RBW值对信号进行抽取滤波。GPU中内置的Cortex-A57作为系统的控制单元，完成对信号分析后结果界面显示，同时将用户设置的参数，如中心频率，Span以及RBW等发送给给FPGA。而GPU中的CUDA核心通过GPU库函数完成FFT计算，而256个CUDA核心进行并行FFT计算可以实现高精度的FFT的加速计算。

本发明提供的FFT计算方案，充分利用了GPU的高效处理能力，能够实现高精度的FFT计算，且有效地减低系统的功耗以及成本。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的FFT计算装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此，本领域技术人员应认识到，虽然本文已详尽示出和描述了本发明的多个示例性实施例，但是，在不脱离本发明精神和范围的情况下，仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此，本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims

1.一种快速傅里叶变换FFT计算装置，包括：

可编程器件，配置为对所述数字信号进行预处理并输出；

2.根据权利要求1所述的装置，其中，还包括：

显示器，配置为显示所述FFT计算的结果。

3.根据权利要求2所述的装置，其中，所述GPU包括：

多个第二内核，配置为通过GPU库函数进行并行FFT计算。

4.根据权利要求3所述的装置，其中，所述预处理参数包括以下至少之一：中心频率、扫频带宽、分辨率带宽RBW。

5.根据权利要求1所述的装置，其中，所述预处理包括以下至少之一：混频、滤波、根据预置的RBW值进行抽取滤波。

6.根据权利要求1-5所述的装置，其中，所述GPU通过PCIe实现与所述可编程器件的通信。

7.一种FFT计算方法，包括：

可编程器件对所述数字信号进行预处理并输出；

GPU对经过所述预处理后的数字信号进行FFT计算。

8.根据权利要求7所述的方法，其中，所述GPU对经过所述预处理后的数字信号进行FFT计算之后还包括：

显示所述FFT计算的结果。

9.根据权利要求8所述的方法，其中，所述GPU包括：第一内核、多个第二内核；

所述第一内核将预置的预处理参数发送给所述可编程器件；

所述多个第二内核通过GPU库函数进行并行FFT计算；

其中，所述显示所述FFT计算的结果包括：

所述第一内核控制所述FFT计算的显示。

10.根据权利要求9所述的方法，其中，所述预处理参数包括以下至少之一：中心频率、扫频带宽、RBW。

11.根据权利要求7所述的方法，其中，所述预处理包括以下至少之一：混频、滤波、根据预置的RBW值进行抽取滤波。