CN113626756A

CN113626756A - 神经网络实现端到端的定点快速傅里叶变换量化方法及系统

Info

Publication number: CN113626756A
Application number: CN202010380295.5A
Authority: CN
Inventors: 崔文倩; 张舜卿; 陈智勇; 曹姗; 徐树公
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2020-05-08
Filing date: 2020-05-08
Publication date: 2021-11-09
Anticipated expiration: 2040-05-08
Also published as: CN113626756B

Abstract

一种神经网络实现端到端的定点快速傅里叶变换量化方法及系统，将浮点时域数据通过基于深度学习的神经网络的量化处理得到相应的定点时域数据，并进一步通过定点快速傅里叶变换得到对应的顶点频域数据，再通过基于深度学习的神经网络的去向量处理得到浮点频域数据。本发明使用截断方法满足有限字长的要求并方便地节省内存资源，同时通过机器学习方法联合优化信号的量化与去量化过程，不必需各种先验信息就能够完成信号的量化工作，且适用于任何线性运算。

Description

神经网络实现端到端的定点快速傅里叶变换量化方法及系统

技术领域

本发明涉及的是一种信号处理领域的技术，具体是一种适用于正交频分复用系统的神经网络实现端到端的定点快速傅里叶变换量化方法及系统。

背景技术

现代信息通信技术产业是建立在硅基解决方案之上的，由于硅的半导电性，互补金属氧化物半导体(CMOS)集成电路具有很强的二进制信息位表示和计算能力，从而引发了本世纪初的信息革命技术。然而，在现实世界中的感知信号或是采样信号通常不是二进制的，量化问题在过去的几十年里已经被揭示出来。由于量化的分辨率对电路设计的许多方面都有很大的影响，例如面积、速度或功耗，所以量化方案已经被广泛研究。作为通信信号处理领域的基本模块，FFT运算与量化联合设计的研究变得十分有意义。

发明内容

本发明针对现有技术存在的上述不足，提出一种神经网络实现端到端的定点快速傅里叶变换量化方法及系统，使用截断方法满足有限字长的要求并方便地节省内存资源，同时通过机器学习方法联合优化信号的量化与去量化过程，不必需各种先验信息就能够完成信号的量化工作，且适用于任何线性运算。

本发明是通过以下技术方案实现的：

本发明涉及一种神经网络实现端到端的定点快速傅里叶变换量化方法，将浮点时域数据通过基于深度学习的神经网络的量化处理得到相应的定点时域数据，并进一步通过定点快速傅里叶变换(FFT)得到对应的顶点频域数据，再通过基于深度学习的神经网络的去向量处理得到浮点频域数据。

技术效果

本发明整体所解决的技术问题包括：

1)联合量化和信号处理设计问题：目前包括FFT/IFFT的信号处理电路设计，都是基于一些预先定义的位宽要求，这样能够方便与ADC/DACs平滑级联。由于ADC/DACs是为通用信号处理系统设计的，因此目前很少有关于与特定信号处理算法的联合优化问题的研究。

2)联合量化和去量化设计的问题：目前的研究主要集中在量化方面，而去量化方案通常被忽略。但是，如果我们能够从联合量化和去量化的角度清楚地识别出目标的恢复要求，就可以解决定点信号处理中的瓶颈问题，从而能够进一步优化现有的量化/去量化方案。；

与现有技术相比，本发明不使用传统的量化损耗，而是同时考虑浮点和定点信号处理链，并选择上述两种方案之间的端到端信号失真作为性能度量。本发明能够联合测量量化和去量化的质量，并在此基础上进行优化量化和去量化的设计。同时，应用基于机器学习的方法，只要训练数据可用，上述方案就可以适应不同的输入信号，并扩展到其他线性/非线性对称操作。

附图说明

图1为端到端量化框架示意图；

图2为本发明流程示意图；

图3为深度学习网络架构示意图；

图4为指数信号基线与CNN量化结果示意图。

具体实施方式

如图1所示，为本实施例涉及一种基于复数表示的端到端量化框架，输入的浮点数据x(k)需要经过量化网络Q的得到定点量化数据

将时域数据进行定点FFT运算后得到频域数据

再经过去量化网络

恢复成浮点数据

所述的端到端量化框架包括：分别用于量化和去量化的基于深度学习的神经网络以及定点FFT运算模块，其中：神经网络对量化函数

和去量化函数

建模，将输入的浮点数据的数组Re(x(k))输入用于量化的神经网络，得到量化完成的数据

和

定点FFT运算模块输出的频域数据

和

输入用于去量化的神经网络得到恢复出的浮点频域数据。

如图1所示，第k个浮点和相应的定点输入帧以及经过浮点和定点FFT处理后的相应频域信号分别表示为：x(k)＝[x₁(k),x₂(k),…,x_N(k)]^T，

最终输出的浮点频域数据为：

其中：矩阵W和

分别表示浮点与定点的FFT运算，矩阵中的元素

优选为w_mn均匀量化之后的数值，在其他场合也可采用不同的量化机制实现，本实施例以均匀量化举例。

如图2所示，所述的用于量化和去量化的基于深度学习的神经网络，优选为CNN架构，包括一个输入层、多个隐藏层和一个输出层，该神经网络的输入数据为N×1的一维矩阵Re(x(k))，Im(x(k))，其中Im(x(k))全部设置为零。

所述的隐藏层为三级级联的卷积层实现，本实施例进一步采用修正线性单元(ReLU)作为前两级隐藏层的非线性激活函数以避免消失梯度问题。

在量化与去量化函任务中需要将输出尽可能地二值化，所以在最后一级隐藏层中，使用Sigmoid函数作为激活函数。

本实施例神经网络所采用的损失函数为通过上述端到端量化框架进行最小化归一化均方误差(NMSE)：

其中：

和

分别表示量化与去量化函数，K是子帧总数，|·|则表示绝对值函数，y(k)、

分别为完成FFT运算后的向量y(k)＝[y₁(k),y₂(k),…,y_N(k)]^T，

通过，在实数域上的相应FFT过程得到：

其中量化后的时域信号

为：

去量化之后的频域信号

为：

优选地，所述的用于量化和去量化的基于深度学习的神经网络的训练过程具体为：

以将数据尽可能二值化。

之后，在给定浮点时间数据x(k)和频率数据y(k)的情况下，所述神经网络经不断训练重新生成得到更新后的网络参数，本实施例中使用训练数据集来不断优化神经网络中的权重。

所述的神经网络在FFT运算的点数N为128的情境下的详细配置和参数如表1所示。

表1网络结构与参数综述

量化网络	DNN	去量化网络	DNN
				输入层	128×1	输入层	128×1
隐藏层1	512-ReLu	隐藏层1	512-ReLu
				隐藏层2	512-ReLu	隐藏层2	512-ReLu
隐藏层3	1024-Sigmoid	隐藏层3	1024-Sigmoid
				输出层	128-ReLu	输出层	128-ReLu

本实施例中首先随机产生10万个不同信号样本，构成一个小的训练数据集。在ground-truth实验中，信号数据才用浮点数x(k)表示方式，相应的进行浮点FFT运算得出精确的频域信号结果y(k)。在基线实验中，所有的信号都按照设定的同一台阶进行均匀量化。本实施例用定点数

表示这些量化信号。

本实施例设置的单词长度是8。相应的进行8位定点FFT运算，得出同样字长的频域信号

在基于机器学习的实验中使用SGD优化器对神经网络进行训练。在所有实验中，初始学习率设置为0.1，阶跃衰减为0.001。

基于pytorch库，然后利用CNN网络提取信号的特征，并用时域和频域数据作为标记，以适应神经网络的输出。该网络会把信号量化为用于基线实验中定点FFT运算的相同的输入字长。

首先本实施例评估定点和浮点FFT的资源消耗，本实施例使用同一块FPGA开发板ZedBoard Zynq-7000测试了定点和浮点FFT模块的资源利用使用情况及其率。如表2所示，本实施例已经列出了这两种计算在LUT和Reg上的消耗。很明显，定点FFT运算在这两个资源的消耗都较少。

表2定点与浮点FFT的资源消耗对比

本实施例的测试集是1000个不同的信号，以及相应的信噪比为0，3，6，9，12，15的信号。考虑到8位定点数的有限表示范围，FFT结果可能超过数据的最大表示范围，因此本实施例将所有采样数据先预处理到范围[-1,1]中，这样完成FFT运算能够有效避免数据溢出。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整，本发明的保护范围以权利要求书为准且不由上述具体实施所限，在其范围内的各个实现方案均受本发明之约束。

Claims

1.一种神经网络实现端到端的定点快速傅里叶变换量化方法，其特征在于，将浮点时域数据通过基于深度学习的神经网络的量化处理得到相应的定点时域数据，并进一步通过定点快速傅里叶变换得到对应的顶点频域数据，再通过基于深度学习的神经网络的去向量处理得到浮点频域数据。

2.根据权利要求1所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，第k个浮点和相应的定点输入帧以及经过浮点和定点FFT处理后的相应频域信号分别表示为：x(k)＝[x₁(k)，x₂(k)，...，x_N(k)]^T，

最终输出的浮点频域数据为：

其中：矩阵w和

分别表示浮点与定点的FFT运算，矩阵中的元素

3.根据权利要求1所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，所述的神经网络，为CNN架构，包括一个输入层、多个隐藏层和一个输出层，该神经网络的输入数据为N×1的一维矩阵Re(x(k))，Im(x(k))，其中Im(x(k))全部设置为零。

4.根据权利要求3所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，所述的隐藏层为三级级联的卷积层实现并采用修正线性单元(ReLU)作为前两级隐藏层的非线性激活函数以避免消失梯度问题；最后一级隐藏层中，使用Sigmoid函数作为激活函数。

5.根据权利要求1或3所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，所述的神经网络所采用的损失函数为最小化归一化均方误差(NMSE)：

其中：Q(·)和

分别为完成FFT运算后的向量y(k)＝[y₁(k)，y₂(k)，...，y_N(k)]^T，

通过，在实数域上的相应FFT过程得到：

其中量化后的时域信号

为：

去量化之后的频域信号

为：

6.根据权利要求1或3所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，所述的神经网络的训练过程具体为：

以将数据尽可能二值化。

7.根据权利要求1所述的神经网络实现端到端的定点快速傅里叶变换量化方法，其特征是，所述的神经网络具体包括：结构相同的量化网络和去量化网络，均为DNN网络，包括：128×1的输入层、512-ReLu的第一和第二隐藏层以及1024-Sigmoid的第三隐藏层和128-ReLu的输出层。

8.一种实现上述任一权利要求所述方法的端到端的定点快速傅里叶变换架构，包括：分别用于量化和去量化的基于深度学习的神经网络以及定点FFT运算模块，其中：神经网络对量化函数Q(·)和去量化函数

和

定点FFT运算模块输出的频域数据

和

输入用于去量化的神经网络得到恢复出的浮点频域数据。