CN111259937A

CN111259937A - 一种基于改进tsvm的半监督通信辐射源个体识别方法

Info

Publication number: CN111259937A
Application number: CN202010023372.1A
Authority: CN
Inventors: 王世练; 姚步泉; 丁立达; 张炜; 王昊; 胡礼; 赖鹏辉
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-01-09
Filing date: 2020-01-09
Publication date: 2020-06-09
Anticipated expiration: 2040-01-09
Also published as: CN111259937B

Abstract

本发明属于通信辐射源个体识别领域，公开了一种基于改进TSVM的半监督通信辐射源个体识别方法。本发明在传统半监督支持向量机TSVM方法的基础上，利用训练样本中各类分布比例的先验信息以及阈值调节因子，通过预置门限对上一次预测结果进行优化，根据预测结果置信度进行迭代，改进了传统TSVM基于局部组合搜索的迭代方法。本发明中的方法在通信辐射源个体识别中，当有标签的训练样本较少时，较TSVM方法，在保证识别准确率的同时，还可有效减少分类器的迭代次数，减少模型的运算量。

Description

一种基于改进TSVM的半监督通信辐射源个体识别方法

技术领域

本发明涉及通信辐射源个体识别领域，提出一种基于改进TSVM的半监督通信辐射源个体识别方法(an improved TSVM iterative algorithm based on the Confidenceof Prediction,CP-TSVM)。

背景技术

通信辐射源个体识别(Special Emitter Identification,SEI)是通过对各辐射源蕴含的独有的射频信号指纹进行提取，并且利用这些特征构造分类器从而对目标进行判别。为了充分提取出信号指纹特征，需要大量有标签的训练集，然而在实际场景下，标签的获取往往需要耗费大量的人力物力，导致难以获取到足额的有标签训练样本。如果训练样本不够多，将难以涵盖所有可能的指纹信息，识别性能必然会受到影响。由于无标签的样本获取较为容易，且与有标签的样本具有相同的指纹特征，如何利用这部分样本来提升识别性能，已成为通信辐射源个体识别领域的热点问题之一。半监督机器学习(Semi-Supervised Learning, SSL)是一种自动地利用没有标签的样本来提升学习性能的方法，近年来在个体识别领域得到越来越广泛的使用。

半监督支持向量机(Semi-Supervised Support Vector Machines,S3VM)是SSL中非常主流的一类分类器，其中最著名的是Joachim于1999年提出的直推式支持向量机(Transductive Support Vector Machine,TSVM)，求解目标为寻找既能将有标记样本分开，又能穿过数据低密度区域的超平面。但是在实际运用中TSVM 虽然解决了纯监督式SVM应用于半监督场景带来的问题，但由于TSVM的搜索策略是基于局部组合搜索，由标签开关程序引导，因此迭代次数可能会非常多，导致运算复杂度高，训练时间长。

发明内容

本发明要解决的技术问题是，针对TSVM在半监督通信辐射源个体识别中运算复杂度高、模型训练时间长，提供提出一种基于改进TSVM的半监督通信辐射源个体识别方法(CP-TSVM)。在通信辐射源个体识别中，当有标签的训练样本较少时，与经典的TSVM方法相比，在保证识别准确率的同时，还能大幅度减少分类器的运算量。

本发明在传统半监督支持向量机TSVM方法的基础上，利用训练样本中各类分布比例的先验信息，通过预置门限对上一次预测结果进行优化，利用优化后的标签重新训练分类器并再次进行预测，若两次的预测的标签结果一致，或者达到设置的迭代次数，则训练结束。在使用SVM对所有样本的预测过程中，不仅能得到每个样本的预测标签值，根据该样本点到超平面的距离，还能得到该样本预测结果的置信度，距离超平面越远的样本属于该类别的可能性就越大，置信度就越高；距离超平面越近的样本误判的可能性就越大，置信度就越低。每经过一次预测，都利用置信度对结果进行重新划分。

本发明的技术方案是：

一种基于改进TSVM的半监督通信辐射源个体识别方法，包括如下步骤：

第①步：提取待识别辐射源个体的双谱特征，对信号进行双谱变换得到二维谱，采用矩形路径积分法将二维谱变为一维谱，每一条积分路径对应一个特征值；

第②步：采用主成分分析法对特征值进行降维处理，兼顾准确率和运算效率，选取合适的主成分维数，得到通信辐射源个体的特征向量；

第③步：使用l个有标签的样本进行有监督的SVM训练，得到分类器 SVM₀；

第④步：基于分类器SVM₀对所有样本进行预测，得到所有样本的标签 Label₀；

第⑤步：将Label₀的置信度按照降序排列，高于式(1)的部分，标签判定为“+1”，低于式(2)的部分，标签判定为“-1”，中间的部分若预测值大于0，则标签设为“+1”，若预测值小于0，则标签设为“-1”，得到新的样本标签Label₁；

其中，l代表有标签样本的数目，u代表无标签样本的数目，α为两种标签样本的比例，θ为阈值调节因子，θ值的确定依赖于先验知识，若事先知道训练样本和测试样本中各辐射源个体分布比例相近，θ选取为较小值，若分布比例未知或者相差较大，则θ设置为较大值，以增加自主迭代学习的能力；

第⑥步：选取Label₁中的80％，Label₀中的20％进行组合得到新的样本标签 temp_Label₁，使用temp_Label₁对样本空间重新进行训练和预测，得到样本标签 temp_Label₂，对temp_Label₂按照第⑤步中的方法进行更新，得到标签Label₂；

第⑦步：如果Label₂与Label₁相等，输出Label₂为预测结果，若不相同，令C₂＝min{C₁,2C₂}，C₁和C₂分别为有标签样本和无标签样本的惩罚因子，继续进行迭代，令i＝i+1，直到Label_i+1与Label_i相等，或者达到所设置的最大迭代次数为止，最后一次迭代的标签即为CP-TSVM方法所预测的结果。

相比于现有技术，本发明的有益效果是，提供的基于改进TSVM的半监督通信辐射源个体识别方法，当有标签训练样本数目较少、待识别的无标签样本数目较多时，与经典的TSVM方法相比，在保证识别准确率的同时，还具有更低的运算复杂度。

附图说明

图1是通信辐射源信号双谱特征提取、降维和分类器构造主要步骤流程图；

图2是本发明提供的CP-TSVM方法流程框图；

图3是SVM、TSVM和CP-TSVM三种方法下通信辐射源个体识别率随信噪比的变化曲线图；

图4是CP-TSVM和TSVM方法训练时间对比柱状图。

具体实施方式

下面结合图1、图2详细说明本发明提供的基于改进TSVM的半监督通信辐射源个体识别方法，包括如下步骤：

第③步：使用l个有标签的样本进行有监督的SVM训练，得到分类器SVM₀；

利用本发明和现有的SVM、TSVM方法进行对比，验证CP-TSVM方法在有标签样本数量较小情况下的性能。每个辐射源个体采用20个样本作为有标签的训练样本，1000个样本作为测试样本，对比在不同的信噪比条件下，3种方法的识别正确率。结果如图3所示，横轴表示信噪比，纵轴表示个体识别正确率，可以发现CP-TSVM方法识别效果最好，TSVM其次，SVM方法效果最差。两种半监督方法准确率都明显高于纯监督的SVM方法，表明在有标签样本较少时，引入半监督机器学习方法确实能提升分类器的识别效果。本发明提供的 CP-TSVM方法，在不同的信噪比下，较纯监督的SVM方法，平均正确识别率提升约10％，较半监督TSVM方法，平均正确识别率提升约为3％，验证了 CP-TSVM方法的有效性。

对比本发明提供的CP-TSVM方法与传统TSVM方法的运算复杂度，统计各信噪比下两种方法的运算时间，结果如图4所示。观察可知CP-TSVM方法在各信噪比下，平均所需要的运算时间约为70s，传统的TSVM方法平均所需时间约为150s，CP-TSVM方法较传统的TSVM方法节约了近一半的运算时间，表明本发明提供的CP-TSVM方法具有更好的运算效率。

以上所述仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于改进TSVM的半监督通信辐射源个体识别方法,其特征在于，包括以下步骤：

第④步：基于分类器SVM₀对所有样本进行预测，得到所有样本的标签Label₀；

第⑥步：选取Label₁中的80％，Label₀中的20％进行组合得到新的样本标签temp_Label₁，使用temp_Label₁对样本空间重新进行训练和预测，得到样本标签temp_Label₂，对temp_Label₂按照第⑤步中的方法进行更新，得到标签Label₂；