CN113541834B

CN113541834B - 一种异常信号半监督分类方法、系统、数据处理终端

Info

Publication number: CN113541834B
Application number: CN202110708117.5A
Authority: CN
Inventors: 齐佩汉; 陈婉清; 姜涛; 周航平; 位萱; 马建峰; 孟永超; 张抗抗; 周小雨
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2021-06-24
Filing date: 2021-06-24
Publication date: 2023-03-03
Anticipated expiration: 2041-06-24
Also published as: CN113541834A

Abstract

本发明涉及深度学习和无线通信频谱信号技术领域，公开了一种异常信号半监督分类方法、系统、数据处理终端，通过建立一个深度聚类模型，将异常信号数据作为CNN模型的输入，然后提取输入数据的压缩特征作为K‑means聚类算法的输入，用于聚类；同时将CNN所提取的特征输入到CNN的分类层进行分类；最后计算K‑means的输出与CNN的输出间的损失，并更新CNN的参数，直到迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的。为了使该模型在我们的数据集上有较好的表现，我们引入预训练模型、确定聚类的初始质心、构建类别均值Memory以及替换伪标签等优化方法，并且所采用的半监督的学习方法可以使频谱管理人员在用户交互较小的情况下对异常信号分类。

Description

一种异常信号半监督分类方法、系统、数据处理终端

技术领域

本发明涉及深度学习和无线通信频谱信号技术领域，尤其涉及一种异常信号半监督分类方法、系统、数据处理终端。

背景技术

无线电频谱是我们最宝贵和最广泛使用的自然资源之一。随着无线通信技术的发展，无线通信网络包含多种类型的通信系统，用于多样化的用户通信服务，同时频谱使用变得非常复杂，这导致电波拥塞和其他干扰等问题。无线网络结构复杂多样，其中无线频谱信号中的异常的种类更是繁多，为了方便无线网络结构的频谱管理，研究人员通常希望在检测出异常信号后，还能知道该异常的类别，以及哪种异常出现的次数多等等。如果能将不同频带上存在的相似异常进行分组，这样不仅可以使用户交互最小，还有利于频谱管理，这对促进新一代无线系统的发展变得至关重要。然而，实际的无线频带使用不同的参数，如信号带宽、调制类型和时间占用，因此无线频谱异常信号分类问题，仍然是一个昂贵的过程。所以无线通信网络需要一个高效、可靠的解决方案来分类出各种无线频谱异常信号。

目前，业内常用的现有技术是这样的：最近，基于深度学习的方法在诸如图像分类、对象检测和跟踪以及检索等各个领域取得了一系列突破。它们采用的结构大都基于卷积神经网络(CNNs)。而关于聚类的研究工作都是基于特征编码的，如哈希，这可以大大降低图像特征的维数，从而使大规模聚类成为可能。然而，降低特征的维数相当于降低表征能力，导致聚类性能不理想。

综上所述，现有技术存在的问题是：

(1)给异常的无线频谱异常信号打上标签类别需要耗费大量的人力，财力，实现起来十分困难，因此之前研究人员所提出的有监督学习的分类方法，不适用于无线频谱异常信号。

(2)由于真实世界里，无线网络环境十分复杂，无线频谱异常信号的种类繁多，单纯地使用无监督学习的算法对多种异常信号进行聚类也很难达到我们想要的结果。

解决以上问题及缺陷的难度为：既要完全利用好真实无线网络环境中有用信息，也要保证无线频谱异常信号的分类准确度。本发明结合了记忆增强频谱异常检测编码器MemSAD、卷积神经网络CNN以及无监督学习聚类算法K-means，提出了一种基于深度学习的半监督的异常信号分类方法来解决上述问题。

解决以上问题及缺陷的意义为：可以使频谱管理人员可以在用户交互较小的情况下，从复杂的无限网络环境中对异常信号进行分类，且分类准确度可接受。

发明内容

针对现有技术存在的问题，本发明提供了一种异常信号半监督分类方法、系统、数据处理终端。

本发明是这样实现的，一种异常信号半监督分类方法，所述方法包括以下步骤：

步骤一：构建一个深度学习聚类模型，利用少量有标签的异常信号数据预训练一个CNN分类模型；

步骤二：将异常信号数据作为步骤一中训练好的CNN模型的输入，通过CNN中间层的映射函数提取输入数据的压缩特征；

步骤三：将CNN提取的小部分少量有标签的每个类别的压缩特征的均值作为初始聚类质心；

步骤四：将CNN中间层提取的全部压缩特征作为K-means聚类算法的输入用于聚类，从而得到新的聚类质心；

步骤五：将CNN中间层提取的全部少量有标签的每个类别的压缩特征的均值放入Memory中；

步骤六：计算K-means得到的新的聚类质心与存放在Memory中的均值的欧式距离，若K-means中某个类的质心离Memory中的某个均值最近，则为该类中的所有无标签的数据打上Memory中的类别标签；

步骤七：此时，K-means的聚类结果中所有的数据都有了相应了标签，利用交叉熵函数损失去更新CNN网络的参数；

步骤八：重复上述步骤四至步骤七，直到迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的。

进一步，所述深度学习聚类模型包括一个记忆增强频谱异常检测编码器MemSAD、一个经典的卷积神经网络CNN和一个无监督聚类算法K-means；

所述深度学习聚类模型采用了一个合成异常信号数据集，所述合成异常信号数据集中包含少量有标签的数据

和大量无标签的数据

该合成异常信号数据集为原始异常信号通过MemSAD编码器网络进行编码、解码后的重构误差；深度学习聚类模型的输入异常信号数据如下：

其中，x_i为原始异常信号数据，

为MemSAD编码器输出的重构异常信号数据。

进一步，所述预训练一个CNN分类模型包括利用合成异常信号数据集中全部的少量有标签数据

作为CNN网络的输入，经过卷积、池化以及展平等操作，进行预训练，最后将训练好的CNN网络参数保存下来；

采用预先训练好的CNN网络来提取数据特征，将全部异常数据

输入到该网络，通过卷积层、池化层等中间层的映射函数对

的特征进行压缩提取，得到压缩特征：

其中，f_θ(·)为卷积层、池化层等中间层的映射函数，

为输入异常信号数据。

进一步，所述K-means算法预先设置所需参数，所述参数包括异常信号聚类的类别数k和初始聚类质心。通过CNN网络的中间层映射函数f_θ(·)提取的有标签数据

的压缩特征

F＜L，选取其中的一小部分压缩特征

C＜F来计算其每一个类别的均值

计算出k个类别的压缩特征的均值，并将这k个均值作为K-means算法的初始聚类质心；

所述K-means算法将CNN网络所提取的全部数据的压缩特征

F＜I＜N作为K-means的输入，对压缩特征序列

中每一个数据点，计算其与每一个初始质心

的欧式距离，并将数据点划分到距离最近的一个质心所属的类别中，把所有数据归好类后，一共有k个类；然后通过计算每个聚类样本的均值重新确定每个类的质心

进一步，所述CNN网络将所提取的全部有标签的数据的压缩特征来计算其

F＜L每一个类别的均值

并将其存放在Memory中；

通过计算K-means得到的新的聚类质心

与存放在Memory中的均值

的欧式距离来为K-means的聚类结果打上伪标签，即若K-means中某个类的质心

与Memory中的某个均值

的距离最近，则认为K-means第i类中的所有无标签数据的类别都为Memory中的第j类，此时，K-means聚类结果中的所有无标签数据都有了相应了标签；

将K-means第一次聚类的结果r_i和通过CNN网络中间层的输出结果

一起输入到CNN网络的分类层，计算K-means的输出与CNN的输出之间的损失，即计算全连接网络的分类结果与K-means聚类结果的交叉熵函数，交叉熵函数定义如下：

其中，r_i为K-means的聚类输出结果，

为CNN分类器的输出结果。

进一步，将压缩后的异常信号序列

作为K-means算法的输入，将每个输入样本按照最小距离原则分配到最近的类中，并使用每个聚类的样本均值更新每个聚类中心，直到聚类中心不再发生变化，即K-means算法的训练目标表示如下：

其中，C为质心矩阵，每个输入样本

都与{0,1}k中的伪标签r_i关联；

所述K-means算法采用调整兰德指数ARI评价指标来判断本次聚类结果和上次聚类结果的相似度，从而判断K-means何时收敛，ARI定义如下：

其中，

为兰德系数，E为期望。ARI的值越高，聚类结果就越相似，越接近于聚类的收敛性。

进一步，所述异常信号半监督分类方法采用CNN网络和K-means算法交替进行异常信号分类，通过计算K-means聚类输出和卷积神经网络CNN的输出之间的损失来联合更新卷积神经网络CNN分类器的参数

以及映射函数的参数θ，直到找到一个最佳的参数

和θ^*使迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的，即解决下列问题：

其中，

为交叉熵损失函数，r_i为K-means的聚类输出结果，

为CNN分类器的输出结果。

本发明的另一目的在于提供一种异常信号半监督分类系统，所述半监督的异常信号分类系统包括：

模型构建模块，用于构建一个深度学习聚类模型；

模型预训练模块，用于利用少量有标签的异常信号数据预训练一个CNN分类模型；

压缩特征提取模块，用于将异常信号数据作为训练好的CNN模型的输入，通过CNN中间层的映射函数提取输入数据的压缩特征；

参数设置模块，用于对K-means聚类算法的所需参数进行预先设置；

聚类质心获取模块，用于对初始聚类质心和新的聚类质心进行计算；

距离计算模块，用于计算K-means得到的新的聚类质心与存放在Memory中的均值的欧式距离；

参数更新模块，用于利用交叉熵函数损失去更新CNN网络的参数。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：

本发明克服已有技术的不足之处，提出了一种基于深度学习的半监督异常信号分类方法，可以对大量无标签、少量有标签的信号数据进行半监督分类，解决了大多数聚类算法在无标签条件下聚类效果不佳的问题。具体优点及积极效果如下：

(1)本发明针对信号种类繁多，区分不明显的问题，采用了MemSAD的重构损失作为输入，增大了异常样本的差异性，从而提高了深度学习半监督分类模型识别的准确率。

(2)本发明针对目前分类模型并未对异常信号建模的问题，通过结合卷积神经网络CNN和无监督聚类算法K-means，构建了一种基于深度学习的半监督异常信号分类模型，该模型无需获取大量具有标签的数据即可对数据进行分类处理，并且聚类效果比单纯使用无监督聚类算法K-means效果更佳。

附图说明

图1是本发明实施例提供的异常信号半监督分类方法的流程图。

图2是本发明实施例提供的基于深度学习的半监督的异常信号分类方法的模型结构图。

图3是本发明实施例提供的微调后的AlexNet网络的参数。

图4是本发明实施例提供的合成异常信号数据集，里面包含12类异常。

图5是本发明实施例提供的K-means聚类评价指标ARI在不同迭代次数下的值。

图6是本发明实施例提供的基于深度学习的半监督的异常信号分类方法的聚类结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本实施实例提供了一种异常信号半监督分类方法、系统、数据处理终端，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的异常信号半监督分类方法包括以下步骤：

S101：构建一个深度学习聚类模型，利用少量有标签的异常信号数据预训练一个CNN分类模型；

S102：将全部异常信号数据作为步骤S101中训练好的CNN模型的输入，通过CNN中间层的映射函数提取输入数据的压缩特征；

S103：将CNN提取的小部分少量有标签的每个类别的压缩特征的均值作为初始聚类质心；

S104：将CNN中间层提取的全部压缩特征作为K-means聚类算法的输入用于聚类，从而得到新的聚类质心；

S105：将CNN中间层提取的全部少量有标签的每个类别的压缩特征的均值放入Memory中；

S106：计算K-means得到的新的聚类质心与存放在Memory中的均值的欧式距离，若K-means中某个类的质心离Memory中的某个均值最近，则为该类中的所有无标签的数据打上Memory中的类别标签；

S107：此时，K-means的聚类结果中所有的数据都有了相应了标签，利用交叉熵函数损失去更新CNN网络的参数；

S108：重复上述步骤S104至步骤S107，直到迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的。

下面结合具体实施例对本发明进一步进行描述。

本发明是这样实现的，一种异常信号半监督分类方法包括以下步骤：

步骤S1：构建一个深度学习聚类模型，所述深度学习聚类模型包括一个记忆增强频谱异常检测编码器MemSAD(Memory-augmented Unsupervised Spectrum AnomalyDetection)、一个经典的卷积神经网络CNN(Convolutional Neural Networks)和一个无监督聚类算法K-means。首先利用30％有标签的异常信号数据预训练一个CNN分类模型；

步骤S2：将异常信号数据(30％有标签数据和70％无标签数据)作为步骤S1中训练好的CNN模型的输入，通过CNN中间层的映射函数提取输入数据的压缩特征；

步骤S3：将CNN提取的前5％的有标签数据的每个类别的压缩特征的均值作为初始聚类质心；

步骤S4：将CNN中间层提取的全部数据压缩特征作为K-means聚类算法的输入用于聚类，从而得到新的聚类质心；

步骤S5：将CNN中间层提取的30％有标签数据的每个类别的压缩特征的均值放入Memory中；

步骤S6：计算K-means得到的新的聚类质心与存放在Memory中的均值的欧式距离，若K-means中某个类的质心离Memory中的某个均值最近，则为该类中的所有无标签的数据打上Memory中的类别标签；

步骤S7：此时，K-means的聚类结果中所有的数据都有了相应了标签，利用交叉熵函数损失去更新CNN网络的参数；

步骤S8：重复上述步骤S4、S5、S6、S7，直到迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的。

步骤S1中，具体地，如图2所示，本发明所构建的深度学习聚类模型由以下几个部分组成：一个记忆增强无监督频谱异常检测编码器MemSAD(Memory-augmentedUnsupervised Spectrum Anomaly Detection)、一个经典的卷积神经网络CNN(Convolutional Neural Networks)和K-means聚类算法。

(1)MemSAD：可检测由故障和误用导致的频谱使用异常，其内存模块记录了正常数据的原型模式，并且允许在训练和测试阶段同时进行更新，从而提高记忆项以及从正常数据学习压缩特征的能力。

(2)CNN：用于提取异常数据的压缩特征以及对异常数据进行分类，本发明所采用的CNN网络是一个微调后的AlexNet网络。AlexNet是一个由5个卷积层和3个全连接层组成的，本发明对该网络的参数进行了微调，具体参数见图3。

(3)K-means聚类算法：用于对CNN网络压缩后的特征进行聚类。

进一步，步骤S1中所述的深度学习聚类模型将原始异常信号X＝{x₁,...,x_i,...,x_N}通过MemSAD编码器网络进行重构，得到重构后的异常信号

该合成异常信号数据集为MemSAD的重构误差

深度学习聚类模块的输入异常信号数据如下：

其中，x_i为原始异常信号数据，

为MemSAD编码器输出的重构异常信号数据。

进一步，步骤S1中所述的深度学习聚类模型将30％有标签的异常信号数据

作为CNN网络的输入，经过卷积、池化以及展平等操作，进行预训练，最后将训练好的CNN模型参数保存下来。

步骤S2中，具体地，该合成异常信号数据集含36000个异常数据，信号异常类别数为12，如图4所示。其中10800个有标签数据(占比30％)，25200个无标签数据(占比70％)作为步骤S1中训练好的CNN模型的输入。

进一步，将异常数据

输入到微调后的AlexNet网络，通过卷积层、池化层等中间层的映射函数可以对

的特征进行压缩提取，得到

步骤S3中，具体地，K-means算法需要预先设置所需参数，所述参数包括异常信号聚类的类别数和初始聚类质心。首先确定一个k值，即我们希望将数据集经过聚类得到12个类别，因此令k＝12。从步骤S2中CNN网络的中间层映射函数f_θ(·)提取的10800个有标签数据的压缩特征中选取前540个数据的压缩特征(占比5％)来计算其每一个类别的均值

由于每个特征是有类别标签的，因而可以计算出12个类别的压缩特征的均值，并将这12个均值作为K-means算法的初始聚类质心。

步骤S4中，具体地，将步骤S2中所提取的36000个数据的压缩特征作为K-means的输入，对压缩特征序列中每一个数据点，计算其与步骤S3中所得到的每一个初始质心

的欧式距离，将数据点划分到距离最近的一个质心所属的类别中，把所有数据归好类后，一共有12个类。然后通过计算每个聚类样本的均值重新确定每个类的质心

步骤S5中，具体地，利用步骤S2中所提取的10800个有标签数据的压缩特征来计算其每一个类别的均值

并将其存放在Memory中。

步骤S6中，具体地，计算K-means得到的新的聚类质心

与存放在Memory中的均值

的欧式距离来为K-means的聚类结果打上伪标签。即若K-means中某个类的质心

与Memory中的某个均值

的距离最近，认为K-means第3类中的所有无标签数据的标签为6。此时，K-means聚类结果中的所有无标签数据都有了相应了标签。

步骤S7中，具体地，此时，所有的数据都有了相应了标签，将K-means第一次聚类的结果r_i和通过CNN网络中间层的输出结果

其中，r_i为K-means的聚类输出结果，

为CNN分类器的输出结果。

进一步，通过误差反向传播算法以及交叉熵损失函数来更新CNN的参数，并得到新的中间层映射函数。输入数据通过新的映射函数进行压缩特征的提取，并将提取的特征输入到K-means算法中，此时K-means沿用上一次保存的初始质心进行聚类。

步骤S8中，具体地，重复上述步骤S4、S5、S6、S7，直到迭代过程收敛，以达到用聚类结果来辅助训练分类器的目的。K-means算法的具体的训练目标表示如下：

其中，C为质心矩阵，每个输入样本

都与{0,1}k中的伪标签r_i关联。

进一步，本发明采用调整兰德指数ARI评价指标来判断本次聚类结果和上次聚类结果的相似度，从而判断K-means何时收敛，ARI定义如下：

其中，

进一步，K-means聚类评价指标ARI在不同迭代次数下的值如图5所示。

进一步，利用K-means的聚类结果辅助CNN进行参数更新，直到找到一个最佳的参数

和θ^*使迭代过程收敛。以达到用聚类结果来辅助训练分类器的目的。即解决下列问题：

其中，

为交叉熵损失函数，r_i为K-means的聚类输出结果，

为CNN分类器的输出结果。

进一步，当CNN的分类器训练完成后，输入无标签的测试数据，得到K-means的最终聚类结果图，如图6所示。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。