CN116865884A

CN116865884A - 基于在线学习的宽带频谱感知方法

Info

Publication number: CN116865884A
Application number: CN202310913341.7A
Authority: CN
Inventors: 董培浩; 贾继斌; 何超伟
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-07-24
Filing date: 2023-07-24
Publication date: 2023-10-10

Abstract

本发明公开了基于在线学习的宽带频谱感知方法，包括：步骤1)：建立实现宽带频谱感知的信号检测模型，采集原始信号数据并进行数据预处理，构建训练集；步骤2)：建立利用训练集进行宽带频谱感知的DNN和CNN网络；步骤3)：根据DNN和CNN网络构建在线学习网络并输入训练集，利用对冲反向传播算法对在线学习网络进行在线的神经网络训练；步骤4)：利用训练后的神经网络预测接收信号的频谱占用情况，并进行对神经网络的性能评估。本发明易于拓展且适合处理海量数据，可以有效减少频谱检测的人为干扰因素，及时应对不同电磁环境变化，实现频谱的实时准确检测。

Description

基于在线学习的宽带频谱感知方法

技术领域

本发明属于无线通信技术领域，具体涉及基于在线学习的宽带频谱感知方法。

背景技术

随着无线通信技术从低速到高速的快速发展，频谱也呈现出由窄带到宽带的发展趋势，认知无线电宽带频谱感知技术受到了越来越多的关注，其主要目标是要求认知用户在很宽的频段范围内进行频谱感知来搜索更多的频谱接入机会。根据奈奎斯特采样准则，SU为了对宽频带的频谱状态实现实时检测需要以不低于两倍信号带宽的速率来对信号采样。但是在进行宽带频谱感知时，采用奈奎斯特采样速率会带来极大的采样开销。此外，过高的采样速率对于模数转换器件的性能而言也是极大的挑战。针对该问题，研究人员提出基于次奈奎斯特速率的采样方式，将压缩采样理论与宽带频谱感知相结合的压缩感知方法。该方法利用信号的频域稀疏性，将频谱感知问题转化为稀疏信号重构问题，进而采用稀疏信号重构算法来实现对宽带信号的频谱感知。然而，基于压缩感知的方法涉及的计算量较大，计算复杂度较高。此外，这类算法往往对信号的频域稀疏性有所要求，并且易于受到噪声不确定性的影响，无法适用于动态复杂电磁环境的频谱感知。近年来，深度学习在各种学习任务中取得巨大成功，已被广泛应用于无线通信领域。与传统的基于模型的频谱感知算法相比，基于深度学习的方法是以数据驱动的方式直接从原始频谱数据中发掘信号的深层特征，提供显著的频谱检测性能，这得益于神经网络学习信号样本特征的强大能力。

目前，深度神经网络已经广泛应用于多类无线通信与信息处理问题中，在性能、复杂度、资源开销等方面显著优于传统算法。然而，深度神经网络大多是以批量学习的设置来训练的，这种设置需要在学习任务开始前准备好所有的训练数据集，并且对于新的训练数据，模型往往要从头开始重新训练，训练的时间成本和空间成本昂贵，因此在实际大规模应用中的可扩展性差。随着信息技术的发展，数据规模呈现爆炸式增长，这种以批量数据处理为特点的学习算法无法适应大数据场景下的流式数据，无法有效适用于实时任务，而且也可能没有足够的内存空间来存储，这些问题在电磁频谱环境瞬息万变的无线网络中尤为突出。所以一个更加理想的选择就是以在线的形式去学习模型。在线学习指的是模型顺序地接收训练数据，每接收一小部分的少量样本，模型会进行预测并对当前模型进行更新，然后再处理新的样本数据。在线学习算法不需要计算机存储下所有的训练数据，可以根据数据分布的变化自动调整模型本身，这些优势使得在线学习更适合处理海量数据并能对外在环境动态的变化做出及时反应。因此，利用在线学习技术进行宽带频谱感知，通过对顺序到达的数据进行学习，能够发掘无线信号的内在结构性，在动态复杂电磁环境下实现准确高效频谱感知。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足，提供基于在线学习的宽带频谱感知方法，能够利用深度神经网络通过对顺序到达的数据进行学习，发掘无线信号的内在结构性，实现对动态变化的频谱环境的实时检测，同时能够利用对冲反向传播算法，根据观察到的数据自动确定如何以及何时以数据驱动的方式修改神经网络的容量，易于拓展且适合处理海量数据，可以有效减少频谱检测的人为干扰因素，及时应对不同电磁环境变化，实现频谱的实时准确检测。

为实现上述技术目的，本发明采取的技术方案为：

基于在线学习的宽带频谱感知方法，包括：

步骤1)：建立实现宽带频谱感知的信号检测模型，采集原始信号数据并进行数据预处理，构建训练集；

步骤2)：建立利用训练集进行宽带频谱感知的DNN和CNN网络；

步骤3)：根据DNN和CNN网络构建在线学习网络并输入训练集，利用对冲反向传播算法对在线学习网络进行在线的神经网络训练；

步骤4)：利用训练后的神经网络预测接收信号的频谱占用情况，并进行对神经网络的性能评估。

为优化上述技术方案，采取的具体措施还包括：

上述的步骤1)具体如下：

步骤1.1)在宽带通信系统中，假定待感知的宽带频谱被划分为N个互不重叠的连续窄频带，即N个子频段；

将宽带频谱感知问题视为信号检测问题，即次用户SU检测主用户PU占用的子频段的问题，其对应的检测模型为：

其中，x(t)表示次用户SU执行一次频谱感知过程接收到的信号，即原始信号数据；s_n(t)表示第n个子频段中PU发送的信号；h表示信道增益；w(t)表示加性高斯白噪声；H₀表示授权频段空闲，可以被SU使用；H₁表示授权频段被占用，不能被SU使用；

步骤1.2)在连续时间T内，采集原始信号数据x(t)，并对其进行如下预处理：

(1)以采样时间间隔T_s进行欠奈奎斯特采样，得到离散信号样本：

(2)对离散信号样本进行M点的离散傅里叶变换处理，得到离散谱信号：

(3)将离散谱信号的实部虚部合并为一个向量，即x＝[Re(x[0]),...,Re(x[M-1]),Im(x[0]),...,Im(x[M-1])]，构成数据集的样本特征向量，对应的样本标签向量采用0/1编码，即y＝[y₁,y₂,...,y_N]，其中y_i(i＝1,...,N)取0或1，0表示未被占用，1表示被占用，以此来表示N个子频段的占用情况；

(4)将样本特征向量x和对应的样本标签向量y作为单个训练数据构建训练集Ω，表示为：

Ω＝{(x⁽¹⁾,y⁽¹⁾),(x⁽²⁾,y⁽²⁾),…,(x^(K),y^(K))}，

其中，(x^(k),y^(k))表示训练集的第k个样本，k＝1,2,…,K。

上述的步骤2建立的DNN网络为4层的神经网络，前三层为隐藏层，神经元个数分别为512、256和128，激活函数均设置为整流线性单元Relu函数，最后一层为输出层，神经元个数设置为子频段的个数N，激活函数设置为Sigmoid函数；

建立的CNN网络为5层的神经网络，前三层为卷积层，卷积核数目均设置为16，卷积核大小均设置为3，步长均设置为1，后两层为FC层，第一个FC层神经元数目设置为128，最后一个FC层是输出层，神经元个数设置为子频段的个数N，激活函数分别设置为Relu和Sigmoid函数，在每个卷积层之后设置失活率为0.2的随机失活层，在第三个卷积层之后先做展平处理然后接入FC层。

上述的步骤3)所述根据DNN和CNN网络构建在线学习网络，具体为：

将DNN网络的每一个隐藏层与输出分类器连在一起，即每个隐藏层的输出输入进下一个隐藏层并输入进该层的输出分类器，同时网络的输入层设有对应的输出分类器；

对于CNN网络，其中的卷积层先经过展平处理之后再输入进该层的输出分类器，每层输出分类器的神经元个数设置为子频段的个数N，激活函数设置为Sigmoid，则在线学习网络的DNN有4个输出分类器，CNN有5个输出分类器。

上述的在线学习网络的预测输出为：

其中，

h⁽⁰⁾＝x

L为网络的隐藏层个数。

上述的步骤3)进行在线的神经网络训练前首先设置DNN和CNN网络训练的参数并选择二分类交叉熵损失函数，利用随机梯度下降算法更新网络参数。

上述的步骤3)所述输入训练集，利用对冲反向传播算法进行在线的神经网络训练，具体为：

将训练集的数据x以流的形式顺序输入进神经网络DNN和CNN中，各个层输出的分类结果表示第l层输出预测第n个子频段的占用与否，计算各层分类结果与真实标签y的交叉熵损失：

则总的损失函数为：

利用HBP算法迭代更新网络参数，直至所有的训练集输入完毕，则网络模型训练完成，保存最终的训练模型。

上述的步骤4)中，对于单个频段的预测，有占用和未占用两种结果，是一个二元假设检验的分类问题，通过设置决策门限γ以实现对输出结果的分类：

则神经网络的预测一共有四种情况：

情况一、预测占用实际也为占用TP，即预测标签真实标签y_n＝1；

情况二、预测占用实际为未占用FP，即预测标签真实标签y_n＝0；

情况三、预测未占用实际为占用FN，即预测标签真实标签y_n＝1；

情况四、预测未占用实际也为未占用TN，即预测标签真实标签y_n＝0。

上述的步骤4)使用检测概率和虚警概率来评估性能，其中，检测概率P_d为在PU存在的条件下，检测出PU存在的概率，虚警概率P_f为PU不存在的条件下，检测出PU存在的概率，具体表示为：

其中H₀表示授权频段空闲，可以被SU使用；H₁表示授权频段被占用，不能被SU使用；

在固定P_f的情况下，比较P_d的大小，P_d越高，表明性能越好；

具体采用所有子频段上P_d和P_f的平均值来评估性能。

上述的步骤4)将接收信号分别输入进步骤3中训练好的在线学习网络中，输出分类结果的概率值，通过与提前设置好的决策门限值γ比较，确定子频段的占用情况，从而确定出宽带信号频段的占用情况，并与真实标签对比计算出测试数据的检测概率，来评估网络的性能。

本发明具有以下有益效果：

本发明首先建立宽带频谱感知模型，采集原始信号数据并做预处理操作；接着设计可利用预处理信号进行宽带频谱感知的DNN和CNN网络结构；然后将设计的DNN和CNN嵌入在线学习框架，并将训练数据顺序送入设计好的在线学习网络，利用对冲反向传播算法完成神经网络训练；最后，测试数据评估训练好的神经网络的性能。本发明方法利用在线学习和深度学习的优点，既能适应于动态变化的频谱环境又能从海量数据中充分发掘无线信号的内在结构性，即使在电磁环境发生很大改变的情况下，通过在线学习技术快速提升自适应能力，实现频谱的实时准确检测，获得优于传统方法的性能。

(1)本发明能够从顺序到达的数据流中学习深度神经网络模型，利用神经网络强大的学习能力，以数据驱动的方式发掘无线信号的内在结构性，实现频谱的准确检测；

(2)本发明利用对冲反向传播算法，能够在线训练具有自适应能力的深度神经网络模型，在浅层网络和深层网络之间共享知识，提升在线预测性能，能够在模型训练的初期拥有浅层网络快速收敛的能力，随着时间的推移，也能够适应性地将模型容量从简单扩展到复杂，很好地结合了在线学习和深度学习的优点，即使电磁环境发生很大改变，通过在线学习快速调整模型本身以适应动态变化的环境，对频谱进行实时准确检测；

(3)相比于已有方案易受到复杂多变的电磁环境的影响，本发明由于采用在线学习技术，易于拓展且适应动态变化的环境，显著提高频谱检测的实时性和准确性。

附图说明

图1是本发明方法的原理图；

图2是本发明在线DNN网络的结构图；

图3是本发明在线CNN网络的结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明中的步骤虽然用标号进行了排列，但并不用于限定步骤的先后次序，除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础，否则步骤的相对次序是可以调整的。可以理解，本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。

如图1-3所示，本发明的一种基于在线学习的宽带频谱感知方法，包括以下步骤：

步骤1)：建立实现宽带频谱感知的信号检测模型，采集原始信号数据并进行数据预处理，构建训练集，具体如下：

宽带频谱感知问题可以视为信号检测问题，即次用户(Secondary User，SU)检测主用户(Primary User,PU)占用的子频段，其检测模型可表示为：

步骤1.2)在连续时间T内，采集原始信号数据x(t)，并对其做一系列预处理操作：

(3)将得到的离散谱信号的实部虚部合并为一个向量，即x＝[Re(x[0]),...,Re(x[M-1]),Im(x[0]),...,Im(x[M-1])]，构成数据集的样本特征向量，对应的样本标签向量采用0/1编码，即y＝[y₁,y₂,...,y_N]，其中y_i(i＝1,...,N)取0或1，0表示未被占用，1表示被占用，以此来表示N个子频段的占用情况；

Ω＝{(x⁽¹⁾,y⁽¹⁾),(x⁽²⁾,y⁽²⁾),…,(x^(K),y^(K))}，

其中，(x^(k),y^(k))表示训练集的第k(k＝1,2,...,K)个样本。

步骤2)：建立利用训练集进行宽带频谱感知的深度神经网络(Deep NeuralNetwork，DNN)和卷积神经网络(Convolutional Neural Network，CNN)网络，具体如下：

步骤2)设计了两种用于宽带频谱感知的网络结构，分别是由全连接(FullyConnected,FC)层构成的DNN和由卷积层和FC层构成的CNN。

DNN网络设计为一个4层的神经网络，前三层为隐藏层，神经元个数分别为512、256和128，激活函数均设置为整流线性单元(Rectified linear unit，Relu)函数，最后一层为输出层，神经元个数设置为子频段的个数N，激活函数设置为Sigmoid函数。

CNN网络设计为一个5层的神经网络，前三层为卷积层，卷积核数目均设置为16，卷积核大小均设置为3，步长均设置为1，后两层为FC层，第一个FC层神经元数目设置为128，最后一个FC层是输出层，神经元个数设置为子频段的个数N，激活函数分别设置为Relu和Sigmoid函数，在每个卷积层之后设置失活率为0.2的随机失活层，在第三个卷积层之后先做展平处理然后接入FC层。

步骤3)：根据DNN和CNN网络构建在线学习网络并输入训练集，利用对冲反向传播算法对在线学习网络进行在线的神经网络训练；具体如下：

目前，现有的深度神经网络大多是以批量学习的方式来训练的，这就要求在学习任务开始之前准备好所有的训练数据集，而这种学习方式并不适合现实中大多数据是以流的形式到达的学习任务。因此，本发明的目标是将设计的DNN和CNN嵌入在线学习框架，使其能够从顺序到达的数据流中学习深度神经网络。

首先，修改已有的深度神经网络，将步骤2中设计的DNN和CNN网络的每一个隐藏层与输出分类器连在一起，即每个隐藏层的输出不仅要输入进下一个隐藏层，而且还要输入进该层的输出分类器，同时网络的输入层也有对应的输出分类器。

对于CNN的结构而言，其中的卷积层要先经过展平处理之后再输入进该层的输出分类器。每层输出分类器的神经元个数设置为子频段的个数N，激活函数设置为Sigmoid。则嵌入在线学习框架的DNN有4个输出分类器，CNN有5个输出分类器。网络预测输出为

其中，

h⁽⁰⁾＝x

L为网络的隐藏层个数。

然后，在每一轮在线训练中仅在少量的数据样本上应用反向传播进行训练，这里不使用标准的反向传播算法，使用对冲反向传播(Hedge Backpropagation，HBP)算法，它在每一轮的在线学习中会评估每一个分类器的性能，并且能够通过使用对冲算法中具有不同深度的分类器去扩展反向传播算法，以便在线地训练深度神经网络。这两个网络训练的参数配置：epoch＝1，batch_size＝10，学习率η＝0.01，β＝0.99，平滑参数s＝0.2，选择二分类交叉熵损失函数，利用随机梯度下降算法更新网络参数α^(l)，Θ^(l)和W^(l)。

具体的神经网络训练过程为：

将训练集的数据x以流的形式顺序输入进神经网络中，各个层输出的分类结果表示第l层输出预测第n个子频段的占用与否，计算各层分类结果与真实标签y的交叉熵损失

则总的损失函数为

利用HBP算法迭代更新网络参数，直至所有的训练集输入完毕，则模型训练完成，保存最终的训练模型。如果有新的数据，可在此模型的基础上，继续训练，更新网络参数，无需从头开始训练。

步骤4)：利用训练后的神经网络预测接收信号的频谱占用情况，并进行对神经网络的性能评估，具体如下：

对于单个频段的预测，有占用和未占用两种结果，是一个二元假设检验的分类问题，通过设置一个合适的决策门限γ以实现对输出结果的分类：

则神经网络的预测一共有四种情况：

情况一预测占用实际也为占用(True Positive，TP)，即预测标签真实标签y_n＝1；

情况二预测占用实际为未占用(False Positive，FP)，即预测标签真实标签y_n＝0；

情况三预测未占用实际为占用(False Negative，FN)，即预测标签真实标签y_n＝1；

情况四预测未占用实际也为未占用(True Negative，TN)，即预测标签真实标签y_n＝0。

通常使用检测概率和虚警概率来衡量感知算法的性能，其中，检测概率P_d定义为在PU存在的条件下，检测出PU存在的概率，虚警概率P_f定义为PU不存在的条件下，检测出PU存在的概率，用公式可表示为：

衡量感知算法的性能，在固定P_f的情况下，比较P_d的大小，P_d越高，表明感知性能越好。

在宽带频谱感知问题中，通过用所有子频段上P_d和P_f的平均值来衡量宽带感知算法的性能。

将测试数据分别输入进步骤3中训练好的DNN和CNN网络中，输出分类结果的概率值，通过与提前设置好的决策门限值γ比较，确定子频段的占用情况，从而确定出宽带信号频段的占用情况，并与真实标签对比计算出测试数据的检测概率，来评估网络的性能。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.基于在线学习的宽带频谱感知方法，其特征在于，包括：

步骤2)：建立利用训练集进行宽带频谱感知的DNN和CNN网络；

2.根据权利要求1所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤1)具体如下：

Ω＝{(x⁽¹⁾,y⁽¹⁾),(x⁽²⁾,y⁽²⁾),,(x^(K),y^(K))}，

其中，(x^(k),y^(k))表示训练集的第k个样本，k＝1,2,,K。

3.根据权利要求1所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤2建立的DNN网络为4层的神经网络，前三层为隐藏层，神经元个数分别为512、256和128，激活函数均设置为整流线性单元Relu函数，最后一层为输出层，神经元个数设置为子频段的个数N，激活函数设置为Sigmoid函数；

4.根据权利要求1所述的基于在线学习的宽带频谱感知方法，其特征在于，步骤3)所述根据DNN和CNN网络构建在线学习网络，具体为：

5.根据权利要求4所述的基于在线学习的宽带频谱感知方法，其特征在于，在线学习网络的预测输出为：

其中，

h⁽⁰⁾＝x

L为网络的隐藏层个数。

6.根据权利要求1所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤3)进行在线的神经网络训练前首先设置DNN和CNN网络训练的参数并选择二分类交叉熵损失函数，利用随机梯度下降算法更新网络参数。

7.根据权利要求6所述的基于在线学习的宽带频谱感知方法，其特征在于，步骤3)所述输入训练集，利用对冲反向传播算法进行在线的神经网络训练，具体为：

则总的损失函数为：

8.根据权利要求1所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤4)中，对于单个频段的预测，有占用和未占用两种结果，是一个二元假设检验的分类问题，通过设置决策门限γ以实现对输出结果的分类：

则神经网络的预测一共有四种情况：

9.根据权利要求8所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤4)使用检测概率和虚警概率来评估性能，其中，检测概率P_d为在PU存在的条件下，检测出PU存在的概率，虚警概率P_f为PU不存在的条件下，检测出PU存在的概率，具体表示为：

具体采用所有子频段上P_d和P_f的平均值来评估性能。

10.根据权利要求9所述的基于在线学习的宽带频谱感知方法，其特征在于，所述步骤4)将接收信号分别输入进步骤3中训练好的在线学习网络中，输出分类结果的概率值，通过与提前设置好的决策门限值γ比较，确定子频段的占用情况，从而确定出宽带信号频段的占用情况，并与真实标签对比计算出测试数据的检测概率，来评估网络的性能。