CN108509935B - 一种基于随机森林算法的雷达工作模式识别方法 - Google Patents
一种基于随机森林算法的雷达工作模式识别方法 Download PDFInfo
- Publication number
- CN108509935B CN108509935B CN201810324493.2A CN201810324493A CN108509935B CN 108509935 B CN108509935 B CN 108509935B CN 201810324493 A CN201810324493 A CN 201810324493A CN 108509935 B CN108509935 B CN 108509935B
- Authority
- CN
- China
- Prior art keywords
- radar
- tree
- learning
- working mode
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 title claims description 21
- 230000006870 function Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000003066 decision tree Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 230000001149 cognitive effect Effects 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 5
- 238000004088 simulation Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 238000003909 pattern recognition Methods 0.000 description 5
- 238000013145 classification model Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 230000035485 pulse pressure Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明属于认知电子对抗技术领域,具体的说是一种基于随机森林的雷达工作模式识别方法。本发明主要包括:根据雷达的工作模式获得雷达信号的标签集和样本集,对获得的样本集和标签集合进行学习,学习的目标是获得使损失函数最小的最终分类器,包括数据预处理、训练集获取、特征选取和对训练集进行学习。本发明可以准确对雷达的工作模式进行识别,方法简单,速度更快,效果良好。
Description
技术领域
本发明属于认知电子对抗技术领域,具体的说是一种基于随机森林(RandomForest,RF)的雷达工作模式识别方法。
背景技术
认知电子战中,快速准确估计目标雷达的工作模式有助于学习目标行为,是认知系统对目标威胁估计和干扰效能估计的关键和主要依据,也是对目标制定精确干扰策略的重要保证。雷达的工作模式是由多种参数共同决定,且大部分的参数都是重叠的,对于某些工作模式不能够仅仅依赖简单的基本规则进行定义识别。在传统的雷达工作模式识别方法中,仍有大量的数据并未挖掘进行利用,而且基于简单规则的识别方法存在可靠性欠缺的问题。对于存在模式差异同时参数部分重叠的工作模式之间存在难以准确识别的问题。目前在认知雷达对抗领域中,机器学习算法的引入研究较为缺乏,所以对机器学习算法的研究是比较重要而且前沿的领域。
发明内容
本发明的目的,是在工作模式识别准确率、数据挖掘和新数据识别等问题上,提出一种基于机器学习算法中的随机森林分类算法进行雷达工作模式识别工作。
基于树的机器学习学习方法在数据挖掘中有较大的优势,并且具有可解释强、学习能力强等优点,并且能够进行准确的分类工作。随机森林适用于高维、非线性的特征参数,具有较强的鲁棒性和很好的抗噪声能力,能很好的避免过拟合,对新数据只需利用训练好的模型便能进行准确的预测。在分类问题上,随机森林是机器学习领域最重要的分类算法之一。因为雷达工作模式的特点,在雷达的信号数据库中各个工作模式是确定的并且是离散值,因此我们将对雷达工作模式识别的任务建模为一个多分类模型。随机森林算法在雷达工作模式识别的引入不仅能够提高识别的正确率,还对雷达的信号参数数据进行有效的挖掘利用,并且对未知的新数据拥有较好的泛化能力。
本发明的技术方案为:
基于随机森林的雷达工作模式识别问题本质上是机器学习中的分类问题,数学上是一个映射c:X→Y,c是真实Y的估计。用于训练的分类器的样本形式是(x,c(x)),其中x∈X为雷达数据库中已知样本,c(x)为该样本所属的真实类别。随机森林的目的在于构造一个目标函数f,尽可能的逼近真实的函数c,从而达到能够准确预测雷达工作模式。具体的雷达工作模式识别原理如图1所示。
基于随机森林的雷达工作模式识别的原理是:假设X={x1,x2,x3,...,xn}是雷达数据库中样本集合,Y={C1,C2,C3,...,Cn}是类别标签构成的集合。把已知的数据样本X与Y输入到分类器中进行训练,选择相应的损失函数作为优化目标,将待识别信号特征X输入到训练好的分类器中,即可得到对应的工作模式。模型的学习过程就是不断地优化损失函数,使得损失函数降到最小。针对多分类问题,选择典型的交叉熵损失函数L(y,y′)作为算法中的损失函数。
其中y为样本的真实值,y'为预测值,N表示样本的个数。
如表1所示,分类模型最终得到结果的情况可以总结为一个混淆矩阵的形式,利用混淆矩阵对分类模型进行评价。机器学习领域中评价分类模型一般选取分类预测的准确率,但准确率往往不能全面体现模型的分类能力和泛化能力,所以引入F1指标(F1measure)评价指标。
表1分类问题混淆矩阵表
F1measure=2PR/(P+R)
其中P为精确率,R为召回率,计算公式为:
P=TP/(TP+FP)
R=TP/(TP+FN)
其中TP(True Positive)为真正例个数,FP(False Positive)为假正例个数,FN(False Negative)为假反例个数。
具体识别流程如图2所示,具体操作如下:
因随机森林属于监督学习算法,所以需要预先通过实验得到训练样本对模型进行学习训练。具体的训练集生成及模型假设具体流程如下:
S1、假设目标雷达具有五种工作模式,包括:海面搜索、海面跟踪、固定跟踪、SAR和A-S测距等。根据雷达手册在每个工作模式下产生相应的信号,并加入噪声。
S2、发射不同模式的雷达信号,信号的标签集合为Y={C1,C2,C3,…,Cn},通过侦查接收雷达信号,对信号进行预处理并采样,获得样本集X={x1,x2,x3,…,xn}。
S3、获得样本集X和标签集合Y后,将数据集X和标签集Y输入随机森林模型进行学习。
S4、S1~S3完成了训练数据集的生成,接下来的工作是对获得的样本集X和标签集合Y进行学习。学习的目标是获得使损失函数最小的最终分类器f(x):
s.t.min(L(y,f(x)))
Gm(x)为决策树基本分类器,αm为决策树基本分类器的权值,m为决策树的个数。学习流程如图3所示,具体操作如下:
S5、数据预处理:因雷达数据之间关联性较强,所以在此不采用归一化的数据处理方法。在此只对集合X中缺失较多的样本进行删除。对于存在缺省少量特征数据的样本,用零值进行填充。
S6、训练集获取:从样本集x中的行、特征列两个维度上进行有放回的随机采样(booststrap),得到训练数据集Xi,i=1,2,…,n。
S7、特征选取:根据样本数和特征数,用建立决策树的方法获取最佳的分割特征,其中树桩点使用Gini指数进行特征选取。其中Gini指数公式如下:
其中K表示工作模式的类别数,pk表示样本点属于第k类的概率。基尼指数Gini(X,A)表示经特征A=a分割后,集合X的不确定性。基尼指数数值越大,样本集合的不确定性也就越大。其中概率pk常用极大似然估计进行计算。
pk=|Ck|/|X|
这里,|X|是样本的总数,|Ck|是X中属于第k类的样本子集。
在特征集中选取使得基尼指数Gini(D,A)最小的特征A生成树桩点,若Gini(D,A)足够小,则生成决策树Gm(x),否则,递归步骤S7生成树桩点。
S8、对训练集进行学习:根据S7生成的树桩点构建树Gm(x)并对样本集进行分类,计算该树分类误差em,根据分类误差em计算该树的权值αm。
αm=log((1-em)/em)/2
进一步更新树集f(x),公式如下所示:
fm+1(x)=fm(x)+αmGm(x)
S9、得到新的树集fm+1(x)后,对数据集X进行分类,计算损失函数值,如损失函数值并未达到指标值,则返回S6。
S10、重复执行步骤S6~S9,直至损失函数值最优。
S11、得到训练好的随机森林模型后,输入需要识别的信号参数,将预测结果作为识别结果。
本发明的有益效果为,本发明可以准确对雷达的工作模式进行识别,方法简单,速度更快,效果良好。
附图说明
图1雷达工作模式识别原理图;
图2模式识别工作流程图;
图3算法学习流程图;
图4不同工作模式与PRI的对应取值图;
图5算法识别结果展示图;
图6特征重要性的分布图;
图7利用重要特征的识别结果展示图。
具体实施方式
下面结合附图对上述基于随机森林的雷达模式识别算法方案进行验证,为能有良好的实验效果,对算法模型提出如下条件:
1.雷达未知的工作模式是能被学习的性能能够得到提升;
2.具体的识别规则无需表述出来;
3.有具体的数据作为算法模型的输入,供学习算法从中学习。
如表2所示,不同的工作模式的特征参数取值具有较大的模糊性,基于传统的识别规则很容易导致特征参数列表的膨胀,并且作战环境中,侦查到的信号存在噪声,导致参数的估计存在误差,进一步局限了传统识别规则的正确率。所以为了验证随机森林算法的泛化能力,仿真时,对每个工作模式的信号都随机加入高斯噪声。
表2不同工作模式的规范参数表
基于随机森林算法的识别效果仿真:
仿真情况1:选取每种工作模式下的样本300个,将SAR、A-S测距、海面搜索、固定跟踪和海面跟踪等五个工作模式进行编号,顺序对应为0、1、2、3、4。生成的部分仿真样本数据如表3所示。
表3仿真部分样本表
在模型训练前选取仿真样本数据的60%作为训练样本数据,40%的数据作为测试数据。根据表可以知道,加入噪声的特征参数的取值范围浮动大,不同工作模式之间的取值部分混叠。比如不同工作模式和对应的PRI值的分布情况存在较大的混叠情况,具体情况如图4所示。
将数据输入算法模型中学习,得到的结果在测试集上正确率达到了98%,可以得出该方法具有较好的性能和泛化能力的结论。具体结果如图5所示。同时RF算法能得到特征重要性的分布,具体见图6所示。从图中可以看出,每个CPI内脉冲数、Tor内脉冲总数、频率视数、脉压比这四个特征在决定工作模式时占的权重比较大。
仿真情况2:根据仿真情况1的特征重要性结果图6,选取其中的四个比较重要的特征,即CPI内脉冲数、Tor内脉冲总数、频率视数和脉压比,作为数据的特征参数进行输入。得到的效果和仿真情况1的效果基本一样。因此该方法具有较好的特征筛选能力,能够有效抵抗噪声数据,算法的表现力非常好。识别结果如图7所示。
Claims (1)
1.一种基于随机森林算法的雷达工作模式识别方法,其特征在于,包括以下步骤:
S1、设定目标雷达具有五种工作模式,分别为:海面搜索、海面跟踪、固定跟踪、SAR和A-S测距,根据雷达手册在每个工作模式下产生相应的发射信号,并加入噪声;
S2、发射不同模式的雷达信号,信号的标签集合为Y={C1,C2,C3,…,Cn},通过侦查接收雷达信号,对信号进行预处理并采样,获得样本集X={x1,x2,x3,…,xn};
S3、对获得的样本集X和标签集合Y进行学习,学习的目标是获得使损失函数最小的最终分类器f(x):
s.t.min(L(y,f(x)))
Gm(x)为决策树基本分类器,αm为决策树基本分类器的权值,m为决策树的个数,L(·)函数为交叉熵损失函数;
S4、数据预处理:集合X中缺失超过设定阈值的样本进行删除;对于存在缺省少量特征数据的样本,用零值进行填充;
S5、训练集获取:从样本集X中的行、特征列两个维度上进行有放回的随机采样,得到训练数据集Xi,i=1,2,…,n;
S6、特征选取:根据样本数和特征数,用建立决策树的方法获取最佳的分割特征,其中树桩点使用基尼指数进行特征选取,基尼指数公式如下:
其中K表示工作模式的类别数,pk表示样本点属于第k类的概率,基尼指数Gini(X,A)表示经特征A=a分割后,集合X的不确定性,基尼指数数值越大,样本集合的不确定性也就越大,其中概率pk用极大似然估计进行计算:
pk=|Ck|/|X|
|X|是样本的总数,|Ck|是X中属于第k类的样本子集;
在特征集中选取使得基尼指数Gini(D,A)最小的特征A生成树桩点,若Gini(D,A)足够小,则生成决策树Gm(x),否则,递归步骤S7生成树桩点;
S7、对训练集进行学习:根据S6生成的树桩点构建树Gm(x)并对样本集进行分类,计算该树分类误差em,根据分类误差em计算该树的权值αm:
αm=log((1-em)/em)/2
更新分类器f(x),公式如下所示:
fm+1(x)=fm(x)+αmGm(x)
S8、得到新的分类器fm+1(x)后,对数据集X进行分类,计算损失函数值,如损失函数值并未达到指标值,则返回S5;
S9、重复执行步骤S5~S8,直至损失函数值最优;
S10、得到训练好的随机森林模型后,输入需要识别的信号参数,将预测结果作为识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810324493.2A CN108509935B (zh) | 2018-04-12 | 2018-04-12 | 一种基于随机森林算法的雷达工作模式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810324493.2A CN108509935B (zh) | 2018-04-12 | 2018-04-12 | 一种基于随机森林算法的雷达工作模式识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509935A CN108509935A (zh) | 2018-09-07 |
CN108509935B true CN108509935B (zh) | 2020-01-03 |
Family
ID=63381811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810324493.2A Active CN108509935B (zh) | 2018-04-12 | 2018-04-12 | 一种基于随机森林算法的雷达工作模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509935B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109272040B (zh) * | 2018-09-20 | 2020-08-14 | 中国科学院电子学研究所苏州研究院 | 一种雷达工作模式生成方法 |
TWI761671B (zh) * | 2019-04-02 | 2022-04-21 | 緯創資通股份有限公司 | 活體偵測方法與活體偵測系統 |
CN110276382B (zh) * | 2019-05-30 | 2023-12-22 | 平安科技(深圳)有限公司 | 基于谱聚类的人群分类方法、装置及介质 |
CN110598564B (zh) * | 2019-08-16 | 2022-02-11 | 浙江工业大学 | 基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法 |
CN112070103B (zh) * | 2020-04-26 | 2021-04-30 | 河海大学 | 通过微波链路网格化自适应可变尺度反演大气能见度的方法 |
CN111627289A (zh) * | 2020-05-27 | 2020-09-04 | 西北工业大学 | 一种导航雷达模拟训练效果评价方法 |
CN111814846B (zh) * | 2020-06-19 | 2023-08-01 | 浙江大华技术股份有限公司 | 属性识别模型的训练方法、识别方法及相关设备 |
CN112257869A (zh) * | 2020-09-29 | 2021-01-22 | 北京北大千方科技有限公司 | 基于随机森林的套牌车分析方法、系统及计算机介质 |
CN112578344A (zh) * | 2020-11-16 | 2021-03-30 | 浙江大学 | 一种无需先验知识的雷达工作模式实时识别仪 |
CN113608172B (zh) * | 2021-06-23 | 2023-12-29 | 西安电子科技大学 | 一种基于改进k近邻的机载多功能雷达工作模式识别方法 |
CN113449807B (zh) * | 2021-07-13 | 2022-06-14 | 电子科技大学 | 一种基于可靠性检验的新类别雷达信号创建方法 |
CN113743464B (zh) * | 2021-08-02 | 2023-09-05 | 昆明理工大学 | 一种连续特征离散化损失信息补偿方法及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016025357A2 (en) * | 2014-08-13 | 2016-02-18 | Microsoft Technology Licensing, Llc | Distributed stage-wise parallel machine learning |
CN105844300A (zh) * | 2016-03-24 | 2016-08-10 | 河南师范大学 | 一种基于随机森林算法的优化分类方法及装置 |
CN107292335A (zh) * | 2017-06-06 | 2017-10-24 | 云南电网有限责任公司信息中心 | 一种基于随机森林模型的输电线路点云数据自动分类方法 |
CN107358142A (zh) * | 2017-05-15 | 2017-11-17 | 西安电子科技大学 | 基于随机森林构图的极化sar图像半监督分类方法 |
-
2018
- 2018-04-12 CN CN201810324493.2A patent/CN108509935B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016025357A2 (en) * | 2014-08-13 | 2016-02-18 | Microsoft Technology Licensing, Llc | Distributed stage-wise parallel machine learning |
CN105844300A (zh) * | 2016-03-24 | 2016-08-10 | 河南师范大学 | 一种基于随机森林算法的优化分类方法及装置 |
CN107358142A (zh) * | 2017-05-15 | 2017-11-17 | 西安电子科技大学 | 基于随机森林构图的极化sar图像半监督分类方法 |
CN107292335A (zh) * | 2017-06-06 | 2017-10-24 | 云南电网有限责任公司信息中心 | 一种基于随机森林模型的输电线路点云数据自动分类方法 |
Non-Patent Citations (2)
Title |
---|
Vegetation characteristics and underlying topography from interferometric radar;Treuhaft, RN;《RADIO SCIENCE》;19961231;第1449-1485页 * |
基于随机森林的雷达信号脉内调制识别;刘歌 等;《电信科学》;20160531;第69-76页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108509935A (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509935B (zh) | 一种基于随机森林算法的雷达工作模式识别方法 | |
Ren et al. | A novel hybrid method of lithology identification based on k-means++ algorithm and fuzzy decision tree | |
CN111222549B (zh) | 一种基于深度神经网络的无人机故障预测方法 | |
CN108960303B (zh) | 一种基于lstm的无人机飞行数据异常检测方法 | |
CN111444790B (zh) | 一种对多功能雷达工作模式序列的脉冲级智能识别方法 | |
CN109508000A (zh) | 异构多传感器多目标跟踪方法 | |
Li et al. | Deterministic vector long-term forecasting for fuzzy time series | |
Li | Research on radar signal recognition based on automatic machine learning | |
CN111695290B (zh) | 一种适用于变化环境下的短期径流智能预报混合模型方法 | |
CN116448419A (zh) | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 | |
CN113259331A (zh) | 一种基于增量学习的未知异常流量在线检测方法及系统 | |
CN112990125B (zh) | 一种辐射源雷达属于目标平台的判别方法 | |
Siminski | An outlier-robust neuro-fuzzy system for classification and regression | |
CN116796275A (zh) | 一种工业设备多模态时序异常检测方法 | |
CN116522250A (zh) | 基于多种算法的矿床类型预测方法及系统 | |
CN110598914B (zh) | 一种多因素影响下矿井灾害气体浓度区间预测方法及系统 | |
CN114219157B (zh) | 一种基于最优决策和动态分析的烷烃气体红外光谱测量方法 | |
CN115937568A (zh) | 一种玄武岩构造背景分类方法、系统、装置及存储介质 | |
CN113269217A (zh) | 基于Fisher准则的雷达目标分类方法 | |
CN112184037B (zh) | 一种基于加权svdd的多模态过程故障检测方法 | |
CN111950427A (zh) | 基于热红外波谱特征和bp神经网络模型的石榴子石亚类识别方法 | |
CN117235434B (zh) | 林业碳汇项目基线构建方法、系统、终端及介质 | |
Chen et al. | A probabilistic fuzzy method for emitter identification based on genetic algorithm | |
Phyo et al. | Efficient K-Means Clustering Algorithm for Predicting of Students’ Academic Performance | |
Tian et al. | Radar signal recognition method based on SVM model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240319 Address after: No. 351 Tiyu Road, Xiaodian District, Taiyuan City, Shanxi Province 030000 Patentee after: NORTH AUTOMATIC CONTROL TECHNOLOGY INSTITUTE Country or region after: Zhong Guo Address before: 611731, No. 2006, West Avenue, hi tech West District, Sichuan, Chengdu Patentee before: University of Electronic Science and Technology of China Country or region before: Zhong Guo |
|
TR01 | Transfer of patent right |