CN116593980B - 雷达目标识别模型训练方法、雷达目标识别方法及装置 - Google Patents
雷达目标识别模型训练方法、雷达目标识别方法及装置 Download PDFInfo
- Publication number
- CN116593980B CN116593980B CN202310427516.3A CN202310427516A CN116593980B CN 116593980 B CN116593980 B CN 116593980B CN 202310427516 A CN202310427516 A CN 202310427516A CN 116593980 B CN116593980 B CN 116593980B
- Authority
- CN
- China
- Prior art keywords
- convolution
- feature matrix
- parallel
- network
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 title claims abstract description 37
- 238000000605 extraction Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 21
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 127
- 238000011176 pooling Methods 0.000 claims description 41
- 238000010606 normalization Methods 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 5
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 17
- 230000004913 activation Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/41—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
- G01S7/411—Identification of targets based on measurements of radar reflectivity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种雷达目标识别模型训练方法、雷达目标识别方法及装置,属于雷达目标识别技术领域。该方法对目标雷达信号依次通过卷积输入层、第一并联卷积网络、第二并联卷积网络、多尺度特征融合模块以及池化注意力层进行特征提取,基于特征提取结果利用分类器获得雷达目标识别结果。本发明利用基于串并联卷积网络和池化注意力的特征提取网络,在处理信号时可以高效的提取信号中有效信息,并且对计算量和内存的需求远小于传统方法。
Description
技术领域
本发明属于雷达探测技术领域,尤其是涉及一种基于串并联卷积网络和池化注意力的雷达目标识别模型训练方法、雷达目标识别方法及装置。
背景技术
雷达信号包含丰富的目标结构特征,如目标尺寸、散射体分布等,因此利用雷达信号进行目标识别是一个非常活跃的研究领域。
特征学习是雷达目标识别的关键,相关方法大致可以分为两类:基于物理机制的方法和基于数据驱动的方法。前者通过特定的物理意义在学习特征子空间中实现识别任务,通常在实践中表现良好,但此类方法严重依赖于个人经验。基于数据驱动的雷达目标识别方法,尤其是深度学习方法,由于具备自动从数据集中学习有用特征的能力,在过去几年中受到了越来越多的关注。
当前,深度学习方法普遍利用卷积神经网络的特性从雷达信号的频谱中学习特征,然而在实际应用中发现,现有方法对信号信息的特征提取还不够充分,导致目标识别效果不佳。
发明内容
本发明的目的在于,提供一种雷达目标识别模型训练方法,以较小的计算量和内存需求对雷达信号中更具表现力的信息的高效提取,从而提高雷达目标识别。此外,本发明还提供了一种雷达目标识别方法及装置。
本发明的第1方面,公开了一种雷达目标识别模型的训练方法,该方法包括:
构建训练数据集;
使用特征提取网络提取训练数据的特征信息;所述特征提取网络包括依次连接的卷积输入层、第一并联卷积网络、第二并联卷积网络、多尺度特征融合模块以及池化注意力层;其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成;
使用分类器基于特征信息对目标进行分类,并根据损失函数结果对分类器参数进行优化。
在一个实施例中,所述分组卷积块中,每组的卷积核数量等于该组特征矩阵的通道数量,两组分别进行卷积核大小为3,步距为2,且采用零填充方式的卷积运算。
在一个实施例中,所述第二普通卷积块中,每个卷积层的卷积核大小均为3,步距均为2,采用零填充方式,且每层卷积层的卷积核数量是该层输入特征矩阵的通道数量的两倍。
在一个实施例中,所述基于池化的深度可分离卷积块为包含池化层的深度可分离卷积块,所述池化层用于在深度可分离卷积中逐通道卷积后,对每个单通道特征矩阵使用池化操作;深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵的通道数量,并使用两个串联的卷积层压缩特征矩阵的二维尺寸。
在一个实施例中,所述多尺度特征融合模块中,网络主干由卷积核大小逐渐减小的三层卷积层组成,并使用残差支路对每个卷积层的输入做局部平均池化操作。
本发明的第2方面,公开了一种雷达目标识别方法,所述方法包括:
获取目标雷达信号;
利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵;
利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵;
利用多尺度特征融合模块对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵;
采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵;
利用分类器基于所述第四特征矩阵获得雷达目标识别结果;
其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成。
本发明的第3方面,公开了一种雷达目标识别装置,该装置包括:
输入模块,被配置为获取目标雷达信号;
初始特征提取模块,被配置为利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
第一特征提取模块,被配置为利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵;
第二特征提取模块,被配置为利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵;
第三特征提取模块,被配置为对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵;
第四特征提取模块,被配置为采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵;
识别模块,被配置为基于所述第四特征矩阵获得雷达目标识别结果;
其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成。
本发明利用基于串并联卷积网络和池化注意力的雷达目标识别模型,在处理信号时可以高效的提取信号中有效信息,并且对计算量和内存的需求远小于传统方法。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其他特征、目的和优点将会变得更明显:
图1为根据本发明实施例的雷达目标识别模型训练方法流程示意图;
图2为根据本发明实施例的雷达目标识别模型特征提取网络结构示意图;
图3为根据本发明实施例的雷达目标识别方法流程示意图;
图4为根据本发明实施例的雷达目标识别装置组成示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明公开了一种雷达目标识别模型训练方法,如图1所示,该方法包括如下步骤:
步骤101、构建训练数据集;
采集雷达信号数据,保证每个类别的雷达信号数据都有被采样到,并将数据集划分为训练集和测试集,例如训练集和测试集比例为7:3。
在一个实施例中,该步骤还包括对训练数据集中的训练数据(训练样本)进行标准化和零均值化处理;
对于数据x,经标准化处理后的数据x*为:
其中,μ为样本的平均值,σ为样本的标准差。
对于每一组数据x,对其进行零均值化处理表示为:
因此,零均值化处理是将输入数据各维度的数据都减去该维度数据的平均值,从而将输入数据各维度的数据均中心化到0。
在一个实施例中,该步骤还包括对训练数据进行增强处理,以扩充训练数据集;
具体地,增强处理包括随机剪裁、水平翻转和缩放等,通过这些操作增加训练数据的结构多样性,达到扩充数据集的效果,从而提升模型泛化能力,避免在训练过程中过拟合。
步骤102、使用串并联卷积网络提取训练数据的特征信息;
图2为根据本发明实施例的串并联卷积网络组成示意图。如图2所示,该串并联卷积网络200由普通卷积、分组卷积及点卷积组成,通过卷积层输出相加的形式提取特征信息。具体地,串并联卷积网络200包括沿数据输入方向依次连接的卷积输入层201、第一并联卷积网络202、第二并联卷积网络203、多尺度特征融合模块204以及池化注意力层205。
卷积输入层201用于输入训练数据,采用普通卷积层,其输出连接第一并联卷积网络202的输入。在一个示例中,卷积输入层201由三层连续的卷积层组成,每层卷积层对该层的输入特征矩阵做卷积核大小为3,步距为1,采用零填充方式的卷积操作,并且第一层的卷积核个数设置为20,后面两层的卷积核个数为输入特征矩阵通道数量的两倍,以达到增加通道数量的目的。最后,对第三层的输出结果做批归一化处理和ReLU激活函数处理,得到输出特征矩阵C0(初始特征信息):
C0=σ{BN(Conv3(Conv2(Conv1(X))))}
其中,σ表示激活函数处理,BN表示批归一化处理,Convi表示第i层卷积操作。
第一并联卷积网络202是由分组卷积块和第一普通卷积块组成的并联网络:分组卷积块将输入的特征矩阵C0按通道分成两组,每组的卷积核数量等于该组特征矩阵的通道数量,两组分别进行卷积核大小为3,步距为2,采用零填充方式的卷积运算,达到减少运算量和参数量和隔绝不同组信息交换的效果。第一普通卷积块由两个并联的卷积层组成,卷积核大小分别为3和5,步距均为2,均采用零填充方式,将两个卷积层的输出拼接后输入批归一化层和ReLU激活函数。最后,将分组卷积块和第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合,得到第一并联卷积网络202的输出特征矩阵C1(第一特征信息):
C1=BN{ConvGroup(C0)}+BN{Conv(3)(C0)+Conv(5)(C0)}
其中,ConvGroup为组卷积操作,Conv(i)为卷积核大小为i的卷积操作。
第二并联卷积网络203是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,其与第一并联卷积网络202串联连接,以第一并联卷积网络202的输出特征矩阵C1作为输入。
第二普通卷积块由三个卷积层、批归一化层串联组成,每个卷积层的卷积核大小均为3,步距均为2,采用零填充方式,三个卷积层的卷积核的数量不同,每层的卷积核数量是该层输入特征矩阵的通道数量的两倍。
基于池化的深度可分离卷积块是在基本的深度可分离卷积块上增加了池化层,即包含池化层的深度可分离卷积块,用来减少模型的计算量,该池化层用于在深度可分离卷积中逐通道卷积后,对每个单通道特征矩阵使用池化操作。作为示例,该池化层采用窗口大小为2,步幅为2,取一个窗口中的四个数值平均值为输出。深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵C1的通道数量。然后使用两个串联的步幅为2的卷积层,用来压缩特征矩阵的二维尺寸,同时提升其通道数量以达到和普通卷积块有相同的输出尺寸大小。
最后,将基于池化的深度可分离卷积块和第二普通卷积块的输出相加,同样是采用特征矩阵相同位置数值相加的方法,得到输出特征矩阵C2(第二特征信息):
C2=BN{ConvPoint(C1)}+BN{Conv(C1)}
多尺度特征融合模块204以第二并联卷积网络203的输出特征矩阵C2作为输入,进一步提取特征信息。该模块的卷积层的卷积核大小逐层减小,并采用残差连接方式,对每层的输入做池化处理,与输出相加后经批归一化层和ReLU激活函数输出。
作为示例,多尺度特征融合模块204的网络主干由卷积核大小不同的三层卷积层组成,卷积核大小从第一层到第三层分别设置为7、5和3,步幅大小均为2,采用零填充方式,逐层压缩特征矩阵。每个卷积层后面都连接一个批归一化层和ReLU激活函数,通过三层的下采样压缩特征信息,提高模型的对特征信息的提取能力。
该模块的残差支路对每个卷积层的输入做局部平均池化操作,例如选取窗口大小为2,对每个窗口计算平均值,经过池化后生成和该卷积层输出有相同尺寸大小的特征矩阵。
最后,将特征矩阵相同位置数值相加的方法生成该模块的最终输出特征矩阵Bi(第三特征信息):
Bi=σ(BN(Conv(Bi-1)+Pool(Bi-1)))
其中,i表示层数,值为从1到3,第一层卷积层的输入B0即为第二并联卷积网络203的输出C2。第三层卷积层的输出B3即为该模块的输出特征矩阵。
池化注意力层205使用通道注意力机制,将通道权重作用在经卷积操作后的特征矩阵上,加强通道间信息的关联性。池化注意力层205对输入特征矩阵B3做全局平均池化操作,生成一个长度为其通道数量的向量,再将该向量经softmax处理,得到通道权重向量,同时对输入B3做卷积核大小为3的卷积操作,然后将所得特征矩阵的每个通道的所有数值和权重向量中对应的通道权重值相乘,所得结果经批归一化层和ReLU激活函数后得到最终输出特征矩阵D(第四特征信息)。
步骤103、搭建分类器,基于特征信息对目标进行分类,并根据损失函数结果对模型参数进行优化;
作为示例,分类器包括全连接层以及Softmax层。全连接层利用矩阵相乘的方法进行特征空间转换整合网络提取出的特征信息。将权重矩阵和输入特征矩阵相乘再加偏置后通过softmax层分类,若训练集中数据所包含的目标种类总数为C,测试样本中第i个数据对应于目标集中各类目标的概率预测分布表示为:
Q(xi)=softmax(WTX+b)
其中,X为全连接层的输入,WT为可训练的权重矩阵,b为偏置向量。
通过最大后验概率将测试样本xi分类到最大目标概率c0中:
c0=argmaxQ(xi)
作为示例,本发明的损失函数采用交叉熵的代价函数:
其中,N表示一个批次中训练样本的个数,z(i)用于表示第i个训练样本,P(i│xtrain)表示训练样本对应于第i个目标的概率。
通过使用训练数据计算损失函数相对于参数的梯度来学习参数,在收敛时固定学习参数,得到训练完成的雷达目标识别模型。
本发明利用基于串并联卷积网络和池化注意力的雷达目标识别模型,在处理信号时可以高效的提取信号中有效信息,并且对计算量和内存的需求远小于传统方法。
同时,在模型预训练阶段对数据做了额外的预处理以增加雷达通讯信号样本的多样性,预处理后的模型将不再受限于大量的训练样本,在实际应用中具有现实意义。
图3为根据本发明实施例的雷达目标识别方法流程示意图。如图3所示,该方法包括如下步骤:
步骤301、获取目标雷达信号;
步骤302、利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
卷积输入层用于输入目标雷达信号,采用普通卷积层进行处理,输出初始特征信息。在一个示例中,卷积输入层由三层连续的卷积层组成,每层卷积层对该层的输入特征矩阵做卷积核大小为3,步距为1,采用零填充方式的卷积操作,并且第一层的卷积核个数设置为20,后面两层的卷积核个数为输入特征矩阵通道数量的两倍,以达到增加通道数量的目的。最后,对第三层的输出结果做批归一化处理和ReLU激活函数处理,得到输出特征矩阵C0(初始特征信息):
C0=σ{BN(Conv3(Conv2(Conv1(X))))}
其中,σ表示激活函数处理,BN表示批归一化处理,Convi表示第i层卷积操作。
步骤303、利用第一并联卷积网络对初始特征矩阵进行特征提取以获得第一特征矩阵;
第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络:分组卷积块将输入的特征矩阵C0按通道分成两组,每组的卷积核数量等于该组特征矩阵的通道数量,两组分别进行卷积核大小为3,步距为2,采用零填充方式的卷积运算,达到减少运算量和参数量和隔绝不同组信息交换的效果。第一普通卷积块由两个并联的卷积层组成,卷积核大小分别为3和5,步距均为2,均采用零填充方式,将两个卷积层的输出拼接后输入批归一化层和ReLU激活函数。最后,将分组卷积块和第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合,得到第一并联卷积网络202的输出特征矩阵C1(第一特征信息):
C1=BN{ConvGroup(C0)}+BN{Conv(3)(C0)+Conv(5)(C0)}
其中,ConvGroup为组卷积操作,Conv(i)为卷积核大小为i的卷积操作。
步骤304、利用第二并联卷积网络对第一特征矩阵进行特征提取以获得第二特征矩阵;
第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,其与第一并联卷积网络串联连接,以第一并联卷积网络的输出特征矩阵C1作为输入。
第二普通卷积块由三个卷积层、批归一化层串联组成,每个卷积层的卷积核大小均为3,步距均为2,采用零填充方式,三个卷积层的卷积核的数量不同,每层的卷积核数量是该层输入特征矩阵的通道数量的两倍。
基于池化的深度可分离卷积块是在基本的深度可分离卷积块上增加了池化层,即包含池化层的深度可分离卷积块,用来减少模型的计算量,该池化层用于在深度可分离卷积中逐通道卷积后,对每个单通道特征矩阵使用池化操作。作为示例,该池化层采用窗口大小为2,步幅为2,取一个窗口中的四个数值平均值为输出。深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵C1的通道数量。然后使用两个串联的步幅为2的卷积层,用来压缩特征矩阵的二维尺寸,同时提升其通道数量以达到和普通卷积块有相同的输出尺寸大小。
最后,将基于池化的深度可分离卷积块和第二普通卷积块的输出相加,同样是采用特征矩阵相同位置数值相加的方法,得到输出特征矩阵C2(第二特征信息):
C2=BN{ConvPoint(C1)}+BN{Conv(C1)}
步骤305、利用多尺度特征融合模块对第二特征信息进行多尺度特征融合以获得第三特征矩阵;
多尺度特征融合模块以第二并联卷积网络的输出特征矩阵C2作为输入,进一步提取特征信息。该模块的卷积层的卷积核大小逐层减小,并采用残差连接方式,对每层的输入做池化处理,与输出相加后经批归一化层和ReLU激活函数输出。
作为示例,多尺度特征融合模块的网络主干由卷积核大小不同的三层卷积层组成,卷积核大小从第一层到第三层分别设置为7、5和3,步幅大小均为2,采用零填充方式,逐层压缩特征矩阵。每个卷积层后面都连接一个批归一化层和ReLU激活函数,通过三层的下采样压缩特征信息,提高模型的对特征信息的提取能力。
该模块的残差支路对每个卷积层的输入做局部平均池化操作,例如选取窗口大小为2,对每个窗口计算平均值,经过池化后生成和该卷积层输出有相同尺寸大小的特征矩阵。
最后,将特征矩阵相同位置数值相加的方法生成该模块的最终输出Bi(第三特征信息):
Bi=σ(BN(Conv(Bi-1)+Pool(Bi-1)))
其中,i表示层数,值为从1到3,第一层卷积层的输入B0即为第二并联卷积网络203的输出C2。第三层卷积层的输出B3即为该模块的输出特征矩阵。
步骤306、采用池化注意力机制对第三特征矩阵进行处理以获得第四特征矩阵;
池化注意力层使用通道注意力机制,将通道权重作用在经卷积操作后的特征矩阵上,加强通道间信息的关联性。池化注意力层对输入特征矩阵B3做全局平均池化操作,生成一个长度为其通道数量的向量,再将该向量经softmax处理,得到通道权重向量,同时对输入B3做卷积核大小为3的卷积操作,然后将所得特征矩阵的每个通道的所有数值和权重向量中对应的通道权重值相乘,所得结果经批归一化层和ReLU激活函数后得到最终输出特征矩阵D(第四特征信息)。
步骤307、利用分类器基于第四特征信息获得雷达目标识别结果;
分类器包括全连接层以及Softmax层。全连接层利用矩阵相乘的方法进行特征空间转换整合网络提取出的特征信息。将权重矩阵和输入特征矩阵相乘再加偏置后通过softmax层分类,输出雷达目标识别结果。
图4为根据本发明实施例的雷达目标识别装置组成示意图。如图4所示,该装置400包括:
输入模块401,被配置为获取目标雷达信号;
初始特征提取模块402,被配置为利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
第一特征提取模块403,被配置为利用第一并联卷积网络对初始特征矩阵进行特征提取以获得第一特征矩阵;
第二特征提取模块404,被配置为利用第二并联卷积网络对第一特征矩阵进行特征提取以获得第二特征矩阵;
第三特征提取模块405,被配置为对第二特征矩阵进行多尺度特征融合以获得第三特征矩阵;
第四特征提取模块406,被配置为采用池化注意力机制对第三特征矩阵进行处理以获得第四特征矩阵;
识别模块407,被配置为基于第四特征矩阵获得雷达目标识别结果。
其中,各特征提取部分的组成与上文描述的相同,在此不再赘述。
本发明中,处理器可以为中央处理器(Central Processing Unit,CPU),或者其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。存储单元可以是暂态存储器,也可以是非暂态存储器。
虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,可以对本本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。
Claims (7)
1.一种雷达目标识别模型的训练方法,其特征在于,该方法包括:
构建训练数据集;
使用特征提取网络提取训练数据的特征信息;所述特征提取网络包括依次连接的卷积输入层、第一并联卷积网络、第二并联卷积网络、多尺度特征融合模块以及池化注意力层;其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成;
使用分类器基于特征信息对目标进行分类,并根据损失函数结果对分类器参数进行优化。
2.根据权利要求1所述的训练方法,其特征在于,所述分组卷积块中,每组的卷积核数量等于该组特征矩阵的通道数量,两组分别进行卷积核大小为3,步距为2,且采用零填充方式的卷积运算。
3.根据权利要求1所述的训练方法,其特征在于,所述第二普通卷积块中,每个卷积层的卷积核大小均为3,步距均为2,采用零填充方式,且每层卷积层的卷积核数量是该层输入特征矩阵的通道数量的两倍。
4.根据权利要求1所述的训练方法,其特征在于,所述基于池化的深度可分离卷积块为包含池化层的深度可分离卷积块,所述池化层用于在深度可分离卷积中逐通道卷积后,对每个单通道特征矩阵使用池化操作;深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵的通道数量,并使用两个串联的卷积层压缩特征矩阵的二维尺寸。
5.根据权利要求1所述的训练方法,其特征在于,所述多尺度特征融合模块中,网络主干由卷积核大小逐渐减小的三层卷积层组成,并使用残差支路对每个卷积层的输入做局部平均池化操作。
6.一种雷达目标识别方法,其特征在于,所述方法包括:
获取目标雷达信号;
利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵;
利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵;
利用多尺度特征融合模块对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵;
采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵;
利用分类器基于所述第四特征矩阵获得雷达目标识别结果;
其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成。
7.一种雷达目标识别装置,其特征在于,该装置包括:
输入模块,被配置为获取目标雷达信号;
初始特征提取模块,被配置为利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵;
第一特征提取模块,被配置为利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵;
第二特征提取模块,被配置为利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵;
第三特征提取模块,被配置为对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵;
第四特征提取模块,被配置为采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵;
识别模块,被配置为基于所述第四特征矩阵获得雷达目标识别结果;
其中,所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络,所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组,每组分别进行卷积运算,所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出,所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合;所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络,所述第二普通卷积块由三个卷积层、批归一化层串联组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310427516.3A CN116593980B (zh) | 2023-04-20 | 2023-04-20 | 雷达目标识别模型训练方法、雷达目标识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310427516.3A CN116593980B (zh) | 2023-04-20 | 2023-04-20 | 雷达目标识别模型训练方法、雷达目标识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116593980A CN116593980A (zh) | 2023-08-15 |
CN116593980B true CN116593980B (zh) | 2023-12-12 |
Family
ID=87610633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310427516.3A Active CN116593980B (zh) | 2023-04-20 | 2023-04-20 | 雷达目标识别模型训练方法、雷达目标识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116593980B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912888A (zh) * | 2023-09-12 | 2023-10-20 | 深圳须弥云图空间科技有限公司 | 对象识别方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828251A (zh) * | 2019-03-07 | 2019-05-31 | 中国人民解放军海军航空大学 | 基于特征金字塔轻量卷积神经网络的雷达目标识别方法 |
AU2020104006A4 (en) * | 2020-12-10 | 2021-02-18 | Naval Aviation University | Radar target recognition method based on feature pyramid lightweight convolutional neural network |
CN113177465A (zh) * | 2021-04-27 | 2021-07-27 | 江苏科技大学 | 基于深度可分离卷积神经网络的sar图像自动目标识别方法 |
CN114092832A (zh) * | 2022-01-20 | 2022-02-25 | 武汉大学 | 一种基于并联混合卷积网络的高分辨率遥感影像分类方法 |
CN115641473A (zh) * | 2022-10-21 | 2023-01-24 | 长沙理工大学 | 基于cnn-自注意力机制混合架构的遥感图像分类方法 |
CN115941407A (zh) * | 2022-12-23 | 2023-04-07 | 天津光电通信技术有限公司 | 基于递归式卷积网络和注意力机制的信号调制识别方法 |
-
2023
- 2023-04-20 CN CN202310427516.3A patent/CN116593980B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828251A (zh) * | 2019-03-07 | 2019-05-31 | 中国人民解放军海军航空大学 | 基于特征金字塔轻量卷积神经网络的雷达目标识别方法 |
AU2020104006A4 (en) * | 2020-12-10 | 2021-02-18 | Naval Aviation University | Radar target recognition method based on feature pyramid lightweight convolutional neural network |
CN113177465A (zh) * | 2021-04-27 | 2021-07-27 | 江苏科技大学 | 基于深度可分离卷积神经网络的sar图像自动目标识别方法 |
CN114092832A (zh) * | 2022-01-20 | 2022-02-25 | 武汉大学 | 一种基于并联混合卷积网络的高分辨率遥感影像分类方法 |
CN115641473A (zh) * | 2022-10-21 | 2023-01-24 | 长沙理工大学 | 基于cnn-自注意力机制混合架构的遥感图像分类方法 |
CN115941407A (zh) * | 2022-12-23 | 2023-04-07 | 天津光电通信技术有限公司 | 基于递归式卷积网络和注意力机制的信号调制识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116593980A (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113159051B (zh) | 一种基于边缘解耦的遥感图像轻量化语义分割方法 | |
CN112818861B (zh) | 一种基于多模态上下文语义特征的情感分类方法及系统 | |
CN109885756B (zh) | 基于cnn和rnn的序列化推荐方法 | |
CN115937655B (zh) | 多阶特征交互的目标检测模型及其构建方法、装置及应用 | |
CN109271522A (zh) | 基于深度混合模型迁移学习的评论情感分类方法及系统 | |
CN111027576B (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
CN109871749B (zh) | 一种基于深度哈希的行人重识别方法和装置、计算机系统 | |
CN113806746A (zh) | 基于改进cnn网络的恶意代码检测方法 | |
CN113642445B (zh) | 一种基于全卷积神经网络的高光谱影像分类方法 | |
CN112381763A (zh) | 一种表面缺陷检测方法 | |
CN116593980B (zh) | 雷达目标识别模型训练方法、雷达目标识别方法及装置 | |
CN115859142A (zh) | 一种基于卷积变压器生成对抗网络的小样本滚动轴承故障诊断方法 | |
CN112883227A (zh) | 一种基于多尺度时序特征的视频摘要生成方法和装置 | |
CN114898773A (zh) | 基于深度自注意力神经网络分类器的合成语音检测方法 | |
CN114420151B (zh) | 基于并联张量分解卷积神经网络的语音情感识别方法 | |
CN115512096A (zh) | 基于CNN与Transformer的低分辨率图像分类方法及系统 | |
CN114299305A (zh) | 聚合密集和注意力多尺度特征的显著性目标检测算法 | |
CN117670109A (zh) | 一种企业可信度评估方法、装置、系统及存储介质 | |
CN117975086A (zh) | 一种基于度量元学习的少样本图像分类方法及系统 | |
CN117216542A (zh) | 一种模型训练方法和相关装置 | |
CN114998725B (zh) | 基于自适应空谱注意力核生成网络的高光谱图像分类方法 | |
CN115329821A (zh) | 一种基于配对编码网络和对比学习的舰船噪声识别方法 | |
CN111368976B (zh) | 基于神经网络特征识别的数据压缩方法 | |
CN115132181A (zh) | 语音识别方法、装置、电子设备、存储介质及程序产品 | |
CN113917370A (zh) | 一种基于油中溶解气体小样本数据的变压器故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |