CN111259937A - 一种基于改进tsvm的半监督通信辐射源个体识别方法 - Google Patents
一种基于改进tsvm的半监督通信辐射源个体识别方法 Download PDFInfo
- Publication number
- CN111259937A CN111259937A CN202010023372.1A CN202010023372A CN111259937A CN 111259937 A CN111259937 A CN 111259937A CN 202010023372 A CN202010023372 A CN 202010023372A CN 111259937 A CN111259937 A CN 111259937A
- Authority
- CN
- China
- Prior art keywords
- label
- tsvm
- samples
- radiation source
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Complex Calculations (AREA)
Abstract
本发明属于通信辐射源个体识别领域,公开了一种基于改进TSVM的半监督通信辐射源个体识别方法。本发明在传统半监督支持向量机TSVM方法的基础上,利用训练样本中各类分布比例的先验信息以及阈值调节因子,通过预置门限对上一次预测结果进行优化,根据预测结果置信度进行迭代,改进了传统TSVM基于局部组合搜索的迭代方法。本发明中的方法在通信辐射源个体识别中,当有标签的训练样本较少时,较TSVM方法,在保证识别准确率的同时,还可有效减少分类器的迭代次数,减少模型的运算量。
Description
技术领域
本发明涉及通信辐射源个体识别领域,提出一种基于改进TSVM的半监督通信辐射源个体识别方法(an improved TSVM iterative algorithm based on the Confidenceof Prediction,CP-TSVM)。
背景技术
通信辐射源个体识别(Special Emitter Identification,SEI)是通过对各辐射源蕴含的独有的射频信号指纹进行提取,并且利用这些特征构造分类器从而对目标进行判别。为了充分提取出信号指纹特征,需要大量有标签的训练集,然而在实际场景下,标签的获取往往需要耗费大量的人力物力,导致难以获取到足额的有标签训练样本。如果训练样本不够多,将难以涵盖所有可能的指纹信息,识别性能必然会受到影响。由于无标签的样本获取较为容易,且与有标签的样本具有相同的指纹特征,如何利用这部分样本来提升识别性能,已成为通信辐射源个体识别领域的热点问题之一。半监督机器学习(Semi-Supervised Learning, SSL)是一种自动地利用没有标签的样本来提升学习性能的方法,近年来在个体识别领域得到越来越广泛的使用。
半监督支持向量机(Semi-Supervised Support Vector Machines,S3VM)是SSL中非常主流的一类分类器,其中最著名的是Joachim于1999年提出的直推式支持向量机(Transductive Support Vector Machine,TSVM),求解目标为寻找既能将有标记样本分开,又能穿过数据低密度区域的超平面。但是在实际运用中TSVM 虽然解决了纯监督式SVM应用于半监督场景带来的问题,但由于TSVM的搜索策略是基于局部组合搜索,由标签开关程序引导,因此迭代次数可能会非常多,导致运算复杂度高,训练时间长。
发明内容
本发明要解决的技术问题是,针对TSVM在半监督通信辐射源个体识别中运算复杂度高、模型训练时间长,提供提出一种基于改进TSVM的半监督通信辐射源个体识别方法(CP-TSVM)。在通信辐射源个体识别中,当有标签的训练样本较少时,与经典的TSVM方法相比,在保证识别准确率的同时,还能大幅度减少分类器的运算量。
本发明在传统半监督支持向量机TSVM方法的基础上,利用训练样本中各类分布比例的先验信息,通过预置门限对上一次预测结果进行优化,利用优化后的标签重新训练分类器并再次进行预测,若两次的预测的标签结果一致,或者达到设置的迭代次数,则训练结束。在使用SVM对所有样本的预测过程中,不仅能得到每个样本的预测标签值,根据该样本点到超平面的距离,还能得到该样本预测结果的置信度,距离超平面越远的样本属于该类别的可能性就越大,置信度就越高;距离超平面越近的样本误判的可能性就越大,置信度就越低。每经过一次预测,都利用置信度对结果进行重新划分。
本发明的技术方案是:
一种基于改进TSVM的半监督通信辐射源个体识别方法,包括如下步骤:
第①步:提取待识别辐射源个体的双谱特征,对信号进行双谱变换得到二维谱,采用矩形路径积分法将二维谱变为一维谱,每一条积分路径对应一个特征值;
第②步:采用主成分分析法对特征值进行降维处理,兼顾准确率和运算效率,选取合适的主成分维数,得到通信辐射源个体的特征向量;
第③步:使用l个有标签的样本进行有监督的SVM训练,得到分类器 SVM0;
第④步:基于分类器SVM0对所有样本进行预测,得到所有样本的标签 Label0;
第⑤步:将Label0的置信度按照降序排列,高于式(1)的部分,标签判定为“+1”,低于式(2)的部分,标签判定为“-1”,中间的部分若预测值大于0,则标签设为“+1”,若预测值小于0,则标签设为“-1”,得到新的样本标签Label1;
其中,l代表有标签样本的数目,u代表无标签样本的数目,α为两种标签样本的比例,θ为阈值调节因子,θ值的确定依赖于先验知识,若事先知道训练样本和测试样本中各辐射源个体分布比例相近,θ选取为较小值,若分布比例未知或者相差较大,则θ设置为较大值,以增加自主迭代学习的能力;
第⑥步:选取Label1中的80%,Label0中的20%进行组合得到新的样本标签 temp_Label1,使用temp_Label1对样本空间重新进行训练和预测,得到样本标签 temp_Label2,对temp_Label2按照第⑤步中的方法进行更新,得到标签Label2;
第⑦步:如果Label2与Label1相等,输出Label2为预测结果,若不相同,令C2=min{C1,2C2},C1和C2分别为有标签样本和无标签样本的惩罚因子,继续进行迭代,令i=i+1,直到Labeli+1与Labeli相等,或者达到所设置的最大迭代次数为止,最后一次迭代的标签即为CP-TSVM方法所预测的结果。
相比于现有技术,本发明的有益效果是,提供的基于改进TSVM的半监督通信辐射源个体识别方法,当有标签训练样本数目较少、待识别的无标签样本数目较多时,与经典的TSVM方法相比,在保证识别准确率的同时,还具有更低的运算复杂度。
附图说明
图1是通信辐射源信号双谱特征提取、降维和分类器构造主要步骤流程图;
图2是本发明提供的CP-TSVM方法流程框图;
图3是SVM、TSVM和CP-TSVM三种方法下通信辐射源个体识别率随信噪比的变化曲线图;
图4是CP-TSVM和TSVM方法训练时间对比柱状图。
具体实施方式
下面结合图1、图2详细说明本发明提供的基于改进TSVM的半监督通信辐射源个体识别方法,包括如下步骤:
第①步:提取待识别辐射源个体的双谱特征,对信号进行双谱变换得到二维谱,采用矩形路径积分法将二维谱变为一维谱,每一条积分路径对应一个特征值;
第②步:采用主成分分析法对特征值进行降维处理,兼顾准确率和运算效率,选取合适的主成分维数,得到通信辐射源个体的特征向量;
第③步:使用l个有标签的样本进行有监督的SVM训练,得到分类器SVM0;
第④步:基于分类器SVM0对所有样本进行预测,得到所有样本的标签 Label0;
第⑤步:将Label0的置信度按照降序排列,高于式(1)的部分,标签判定为“+1”,低于式(2)的部分,标签判定为“-1”,中间的部分若预测值大于0,则标签设为“+1”,若预测值小于0,则标签设为“-1”,得到新的样本标签Label1;
其中,l代表有标签样本的数目,u代表无标签样本的数目,α为两种标签样本的比例,θ为阈值调节因子,θ值的确定依赖于先验知识,若事先知道训练样本和测试样本中各辐射源个体分布比例相近,θ选取为较小值,若分布比例未知或者相差较大,则θ设置为较大值,以增加自主迭代学习的能力;
第⑥步:选取Label1中的80%,Label0中的20%进行组合得到新的样本标签 temp_Label1,使用temp_Label1对样本空间重新进行训练和预测,得到样本标签 temp_Label2,对temp_Label2按照第⑤步中的方法进行更新,得到标签Label2;
第⑦步:如果Label2与Label1相等,输出Label2为预测结果,若不相同,令C2=min{C1,2C2},C1和C2分别为有标签样本和无标签样本的惩罚因子,继续进行迭代,令i=i+1,直到Labeli+1与Labeli相等,或者达到所设置的最大迭代次数为止,最后一次迭代的标签即为CP-TSVM方法所预测的结果。
利用本发明和现有的SVM、TSVM方法进行对比,验证CP-TSVM方法在有标签样本数量较小情况下的性能。每个辐射源个体采用20个样本作为有标签的训练样本,1000个样本作为测试样本,对比在不同的信噪比条件下,3种方法的识别正确率。结果如图3所示,横轴表示信噪比,纵轴表示个体识别正确率,可以发现CP-TSVM方法识别效果最好,TSVM其次,SVM方法效果最差。两种半监督方法准确率都明显高于纯监督的SVM方法,表明在有标签样本较少时,引入半监督机器学习方法确实能提升分类器的识别效果。本发明提供的 CP-TSVM方法,在不同的信噪比下,较纯监督的SVM方法,平均正确识别率提升约10%,较半监督TSVM方法,平均正确识别率提升约为3%,验证了 CP-TSVM方法的有效性。
对比本发明提供的CP-TSVM方法与传统TSVM方法的运算复杂度,统计各信噪比下两种方法的运算时间,结果如图4所示。观察可知CP-TSVM方法在各信噪比下,平均所需要的运算时间约为70s,传统的TSVM方法平均所需时间约为150s,CP-TSVM方法较传统的TSVM方法节约了近一半的运算时间,表明本发明提供的CP-TSVM方法具有更好的运算效率。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (1)
1.一种基于改进TSVM的半监督通信辐射源个体识别方法,其特征在于,包括以下步骤:
第①步:提取待识别辐射源个体的双谱特征,对信号进行双谱变换得到二维谱,采用矩形路径积分法将二维谱变为一维谱,每一条积分路径对应一个特征值;
第②步:采用主成分分析法对特征值进行降维处理,兼顾准确率和运算效率,选取合适的主成分维数,得到通信辐射源个体的特征向量;
第③步:使用l个有标签的样本进行有监督的SVM训练,得到分类器SVM0;
第④步:基于分类器SVM0对所有样本进行预测,得到所有样本的标签Label0;
第⑤步:将Label0的置信度按照降序排列,高于式(1)的部分,标签判定为“+1”,低于式(2)的部分,标签判定为“-1”,中间的部分若预测值大于0,则标签设为“+1”,若预测值小于0,则标签设为“-1”,得到新的样本标签Label1;
其中,l代表有标签样本的数目,u代表无标签样本的数目,α为两种标签样本的比例,θ为阈值调节因子,θ值的确定依赖于先验知识,若事先知道训练样本和测试样本中各辐射源个体分布比例相近,θ选取为较小值,若分布比例未知或者相差较大,则θ设置为较大值,以增加自主迭代学习的能力;
第⑥步:选取Label1中的80%,Label0中的20%进行组合得到新的样本标签temp_Label1,使用temp_Label1对样本空间重新进行训练和预测,得到样本标签temp_Label2,对temp_Label2按照第⑤步中的方法进行更新,得到标签Label2;
第⑦步:如果Label2与Label1相等,输出Label2为预测结果,若不相同,令C2=min{C1,2C2},C1和C2分别为有标签样本和无标签样本的惩罚因子,继续进行迭代,令i=i+1,直到Labeli+1与Labeli相等,或者达到所设置的最大迭代次数为止,最后一次迭代的标签即为CP-TSVM方法所预测的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023372.1A CN111259937B (zh) | 2020-01-09 | 2020-01-09 | 一种基于改进tsvm的半监督通信辐射源个体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023372.1A CN111259937B (zh) | 2020-01-09 | 2020-01-09 | 一种基于改进tsvm的半监督通信辐射源个体识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111259937A true CN111259937A (zh) | 2020-06-09 |
CN111259937B CN111259937B (zh) | 2022-04-05 |
Family
ID=70948635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010023372.1A Active CN111259937B (zh) | 2020-01-09 | 2020-01-09 | 一种基于改进tsvm的半监督通信辐射源个体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111259937B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464713A (zh) * | 2020-10-21 | 2021-03-09 | 安徽农业大学 | 一种基于深度学习的通信辐射源射频指纹识别方法 |
WO2023273249A1 (zh) * | 2021-06-30 | 2023-01-05 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定系统异常检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160210763A1 (en) * | 2015-01-21 | 2016-07-21 | California Institute Of Technology | Fourier ptychographic tomography |
CN110109060A (zh) * | 2019-03-27 | 2019-08-09 | 西安电子科技大学 | 一种基于深度学习网络的雷达辐射源信号分选方法及系统 |
CN110309766A (zh) * | 2019-06-28 | 2019-10-08 | 中国人民解放军国防科技大学 | 一种基于扩展巴氏距离的复双谱对角切片特征提取方法 |
-
2020
- 2020-01-09 CN CN202010023372.1A patent/CN111259937B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160210763A1 (en) * | 2015-01-21 | 2016-07-21 | California Institute Of Technology | Fourier ptychographic tomography |
CN110109060A (zh) * | 2019-03-27 | 2019-08-09 | 西安电子科技大学 | 一种基于深度学习网络的雷达辐射源信号分选方法及系统 |
CN110309766A (zh) * | 2019-06-28 | 2019-10-08 | 中国人民解放军国防科技大学 | 一种基于扩展巴氏距离的复双谱对角切片特征提取方法 |
Non-Patent Citations (3)
Title |
---|
VINEETH BALASUBRAMANIAN ET AL.: "Kernel Learning for Efficiency Maximization in the Conformal Predictions Framework", 《2010 NINTH INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS》 * |
任东方等: "基于双谱与特征选择的通信辐射源识别算法", 《信息工程大学学报》 * |
王雅圣等: "基于置信学习机与近红外光谱的煤种快速分类方法", 《光谱学与光谱分析》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464713A (zh) * | 2020-10-21 | 2021-03-09 | 安徽农业大学 | 一种基于深度学习的通信辐射源射频指纹识别方法 |
CN112464713B (zh) * | 2020-10-21 | 2022-11-08 | 安徽农业大学 | 一种基于深度学习的通信辐射源射频指纹识别方法 |
WO2023273249A1 (zh) * | 2021-06-30 | 2023-01-05 | 国网上海市电力公司 | 基于tsvm模型的智能电能表自动化检定系统异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111259937B (zh) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414462B (zh) | 一种无监督的跨域行人重识别方法及系统 | |
Zhao et al. | Cloud shape classification system based on multi-channel cnn and improved fdm | |
CN107515895B (zh) | 一种基于目标检测的视觉目标检索方法与系统 | |
CN109389180A (zh) | 一款基于深度学习的电力设备图像识别方法及巡查机器人 | |
CN108229550B (zh) | 一种基于多粒度级联森林网络的云图分类方法 | |
CN111259937B (zh) | 一种基于改进tsvm的半监督通信辐射源个体识别方法 | |
CN113326731A (zh) | 一种基于动量网络指导的跨域行人重识别算法 | |
CN111859010B (zh) | 一种基于深度互信息最大化的半监督音频事件识别方法 | |
CN105718866A (zh) | 一种视觉目标检测与识别方法 | |
JP2014026455A (ja) | メディアデータ解析装置、方法、及びプログラム | |
JP6871658B2 (ja) | 反復分類に基づく水域識別方法及び装置 | |
CN112861695A (zh) | 行人身份再识别方法、装置、电子设备及存储介质 | |
CN113222072A (zh) | 基于K-means聚类和GAN的肺部X光图像分类方法 | |
CN105160598B (zh) | 一种基于改进em算法的电网业务分类方法 | |
CN116486172A (zh) | 基于语义表征的无监督域适应图像分类方法 | |
CN101216886B (zh) | 一种基于谱分割理论的镜头聚类方法 | |
CN116229112A (zh) | 一种基于多重注意力的孪生网络目标跟踪方法 | |
CN113449676B (zh) | 一种基于双路互促进解纠缠学习的行人重识别方法 | |
Wang et al. | Multi-domain incremental learning for face presentation attack detection | |
CN110688880A (zh) | 一种基于精简ResNet残差网络的车牌识别方法 | |
CN112784774B (zh) | 一种基于数据增强的小样本高光谱分类方法 | |
KR101408345B1 (ko) | 데이터 분류를 위한 데이터 처리 장치 및 방법, 상기 방법을 기록한 기록 매체 | |
CN103488997B (zh) | 基于各类重要波段提取的高光谱图像波段选择方法 | |
CN111488840A (zh) | 一种基于多任务学习模型的人体行为分类方法 | |
CN113572732B (zh) | 一种基于vae和聚合hmm的多步攻击建模和预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |