CN116593980B

CN116593980B - 雷达目标识别模型训练方法、雷达目标识别方法及装置

Info

Publication number: CN116593980B
Application number: CN202310427516.3A
Authority: CN
Inventors: �田明宏; 刘燕; 李宏; 郭建明; 万晓磊; 关鑫璞
Original assignee: 93209 Troops Of Chinese Pla
Current assignee: 93209 Troops Of Chinese Pla
Priority date: 2023-04-20
Filing date: 2023-04-20
Publication date: 2023-12-12
Anticipated expiration: 2043-04-20
Also published as: CN116593980A

Abstract

本发明公开了一种雷达目标识别模型训练方法、雷达目标识别方法及装置，属于雷达目标识别技术领域。该方法对目标雷达信号依次通过卷积输入层、第一并联卷积网络、第二并联卷积网络、多尺度特征融合模块以及池化注意力层进行特征提取，基于特征提取结果利用分类器获得雷达目标识别结果。本发明利用基于串并联卷积网络和池化注意力的特征提取网络，在处理信号时可以高效的提取信号中有效信息，并且对计算量和内存的需求远小于传统方法。

Description

雷达目标识别模型训练方法、雷达目标识别方法及装置

技术领域

本发明属于雷达探测技术领域，尤其是涉及一种基于串并联卷积网络和池化注意力的雷达目标识别模型训练方法、雷达目标识别方法及装置。

背景技术

雷达信号包含丰富的目标结构特征，如目标尺寸、散射体分布等，因此利用雷达信号进行目标识别是一个非常活跃的研究领域。

特征学习是雷达目标识别的关键，相关方法大致可以分为两类：基于物理机制的方法和基于数据驱动的方法。前者通过特定的物理意义在学习特征子空间中实现识别任务，通常在实践中表现良好，但此类方法严重依赖于个人经验。基于数据驱动的雷达目标识别方法，尤其是深度学习方法，由于具备自动从数据集中学习有用特征的能力，在过去几年中受到了越来越多的关注。

当前，深度学习方法普遍利用卷积神经网络的特性从雷达信号的频谱中学习特征，然而在实际应用中发现，现有方法对信号信息的特征提取还不够充分，导致目标识别效果不佳。

发明内容

本发明的目的在于，提供一种雷达目标识别模型训练方法，以较小的计算量和内存需求对雷达信号中更具表现力的信息的高效提取，从而提高雷达目标识别。此外，本发明还提供了一种雷达目标识别方法及装置。

本发明的第1方面，公开了一种雷达目标识别模型的训练方法，该方法包括：

构建训练数据集；

使用特征提取网络提取训练数据的特征信息；所述特征提取网络包括依次连接的卷积输入层、第一并联卷积网络、第二并联卷积网络、多尺度特征融合模块以及池化注意力层；其中，所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络，所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组，每组分别进行卷积运算，所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出，所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合；所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络，所述第二普通卷积块由三个卷积层、批归一化层串联组成；

使用分类器基于特征信息对目标进行分类，并根据损失函数结果对分类器参数进行优化。

在一个实施例中，所述分组卷积块中，每组的卷积核数量等于该组特征矩阵的通道数量，两组分别进行卷积核大小为3，步距为2，且采用零填充方式的卷积运算。

在一个实施例中，所述第二普通卷积块中，每个卷积层的卷积核大小均为3，步距均为2，采用零填充方式，且每层卷积层的卷积核数量是该层输入特征矩阵的通道数量的两倍。

在一个实施例中，所述基于池化的深度可分离卷积块为包含池化层的深度可分离卷积块，所述池化层用于在深度可分离卷积中逐通道卷积后，对每个单通道特征矩阵使用池化操作；深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵的通道数量，并使用两个串联的卷积层压缩特征矩阵的二维尺寸。

在一个实施例中，所述多尺度特征融合模块中，网络主干由卷积核大小逐渐减小的三层卷积层组成，并使用残差支路对每个卷积层的输入做局部平均池化操作。

本发明的第2方面，公开了一种雷达目标识别方法，所述方法包括：

获取目标雷达信号；

利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵；

利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵；

利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵；

利用多尺度特征融合模块对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵；

采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵；

利用分类器基于所述第四特征矩阵获得雷达目标识别结果；

其中，所述第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络，所述分组卷积块将所述卷积输入层输出的初始特征矩阵按通道分成两组，每组分别进行卷积运算，所述第一普通卷积块由两个并联的卷积层组成且将所述两个并联的卷积层的输出拼接后输出，所述分组卷积块和所述第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合；所述第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络，所述第二普通卷积块由三个卷积层、批归一化层串联组成。

本发明的第3方面，公开了一种雷达目标识别装置，该装置包括：

输入模块，被配置为获取目标雷达信号；

初始特征提取模块，被配置为利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵；

第一特征提取模块，被配置为利用第一并联卷积网络对所述初始特征矩阵进行特征提取以获得第一特征矩阵；

第二特征提取模块，被配置为利用第二并联卷积网络对所述第一特征矩阵进行特征提取以获得第二特征矩阵；

第三特征提取模块，被配置为对所述第二特征矩阵进行多尺度特征融合以获得第三特征矩阵；

第四特征提取模块，被配置为采用池化注意力机制对所述第三特征矩阵进行处理以获得第四特征矩阵；

识别模块，被配置为基于所述第四特征矩阵获得雷达目标识别结果；

本发明利用基于串并联卷积网络和池化注意力的雷达目标识别模型，在处理信号时可以高效的提取信号中有效信息，并且对计算量和内存的需求远小于传统方法。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其他特征、目的和优点将会变得更明显：

图1为根据本发明实施例的雷达目标识别模型训练方法流程示意图；

图2为根据本发明实施例的雷达目标识别模型特征提取网络结构示意图；

图3为根据本发明实施例的雷达目标识别方法流程示意图；

图4为根据本发明实施例的雷达目标识别装置组成示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

本发明公开了一种雷达目标识别模型训练方法，如图1所示，该方法包括如下步骤：

步骤101、构建训练数据集；

采集雷达信号数据，保证每个类别的雷达信号数据都有被采样到，并将数据集划分为训练集和测试集，例如训练集和测试集比例为7:3。

在一个实施例中，该步骤还包括对训练数据集中的训练数据(训练样本)进行标准化和零均值化处理；

对于数据x，经标准化处理后的数据x^*为：

其中，μ为样本的平均值，σ为样本的标准差。

对于每一组数据x，对其进行零均值化处理表示为：

因此，零均值化处理是将输入数据各维度的数据都减去该维度数据的平均值，从而将输入数据各维度的数据均中心化到0。

在一个实施例中，该步骤还包括对训练数据进行增强处理，以扩充训练数据集；

具体地，增强处理包括随机剪裁、水平翻转和缩放等，通过这些操作增加训练数据的结构多样性，达到扩充数据集的效果，从而提升模型泛化能力，避免在训练过程中过拟合。

步骤102、使用串并联卷积网络提取训练数据的特征信息；

图2为根据本发明实施例的串并联卷积网络组成示意图。如图2所示，该串并联卷积网络200由普通卷积、分组卷积及点卷积组成，通过卷积层输出相加的形式提取特征信息。具体地，串并联卷积网络200包括沿数据输入方向依次连接的卷积输入层201、第一并联卷积网络202、第二并联卷积网络203、多尺度特征融合模块204以及池化注意力层205。

卷积输入层201用于输入训练数据，采用普通卷积层，其输出连接第一并联卷积网络202的输入。在一个示例中，卷积输入层201由三层连续的卷积层组成，每层卷积层对该层的输入特征矩阵做卷积核大小为3，步距为1，采用零填充方式的卷积操作，并且第一层的卷积核个数设置为20，后面两层的卷积核个数为输入特征矩阵通道数量的两倍，以达到增加通道数量的目的。最后，对第三层的输出结果做批归一化处理和ReLU激活函数处理，得到输出特征矩阵C₀(初始特征信息)：

C₀＝σ{BN(Conv₃(Conv₂(Conv₁(X))))}

其中，σ表示激活函数处理，BN表示批归一化处理，Conv_i表示第i层卷积操作。

第一并联卷积网络202是由分组卷积块和第一普通卷积块组成的并联网络：分组卷积块将输入的特征矩阵C₀按通道分成两组，每组的卷积核数量等于该组特征矩阵的通道数量，两组分别进行卷积核大小为3，步距为2，采用零填充方式的卷积运算，达到减少运算量和参数量和隔绝不同组信息交换的效果。第一普通卷积块由两个并联的卷积层组成，卷积核大小分别为3和5，步距均为2，均采用零填充方式，将两个卷积层的输出拼接后输入批归一化层和ReLU激活函数。最后，将分组卷积块和第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合，得到第一并联卷积网络202的输出特征矩阵C₁(第一特征信息)：

C₁＝BN{ConvGroup(C₀)}+BN{Conv(₃)(C₀)+Conv(₅)(C₀)}

其中，ConvGroup为组卷积操作，Conv(_i)为卷积核大小为i的卷积操作。

第二并联卷积网络203是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络，其与第一并联卷积网络202串联连接，以第一并联卷积网络202的输出特征矩阵C₁作为输入。

第二普通卷积块由三个卷积层、批归一化层串联组成，每个卷积层的卷积核大小均为3，步距均为2，采用零填充方式，三个卷积层的卷积核的数量不同，每层的卷积核数量是该层输入特征矩阵的通道数量的两倍。

基于池化的深度可分离卷积块是在基本的深度可分离卷积块上增加了池化层，即包含池化层的深度可分离卷积块，用来减少模型的计算量，该池化层用于在深度可分离卷积中逐通道卷积后，对每个单通道特征矩阵使用池化操作。作为示例，该池化层采用窗口大小为2，步幅为2，取一个窗口中的四个数值平均值为输出。深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵C₁的通道数量。然后使用两个串联的步幅为2的卷积层，用来压缩特征矩阵的二维尺寸，同时提升其通道数量以达到和普通卷积块有相同的输出尺寸大小。

最后，将基于池化的深度可分离卷积块和第二普通卷积块的输出相加，同样是采用特征矩阵相同位置数值相加的方法，得到输出特征矩阵C₂(第二特征信息)：

C₂＝BN{ConvPoint(C₁)}+BN{Conv(C₁)}

多尺度特征融合模块204以第二并联卷积网络203的输出特征矩阵C₂作为输入，进一步提取特征信息。该模块的卷积层的卷积核大小逐层减小，并采用残差连接方式，对每层的输入做池化处理，与输出相加后经批归一化层和ReLU激活函数输出。

作为示例，多尺度特征融合模块204的网络主干由卷积核大小不同的三层卷积层组成，卷积核大小从第一层到第三层分别设置为7、5和3，步幅大小均为2，采用零填充方式，逐层压缩特征矩阵。每个卷积层后面都连接一个批归一化层和ReLU激活函数，通过三层的下采样压缩特征信息，提高模型的对特征信息的提取能力。

该模块的残差支路对每个卷积层的输入做局部平均池化操作，例如选取窗口大小为2，对每个窗口计算平均值，经过池化后生成和该卷积层输出有相同尺寸大小的特征矩阵。

最后，将特征矩阵相同位置数值相加的方法生成该模块的最终输出特征矩阵B_i(第三特征信息)：

B_i＝σ(BN(Conv(B_i-1)+Pool(B_i-1)))

其中，i表示层数，值为从1到3，第一层卷积层的输入B₀即为第二并联卷积网络203的输出C₂。第三层卷积层的输出B₃即为该模块的输出特征矩阵。

池化注意力层205使用通道注意力机制，将通道权重作用在经卷积操作后的特征矩阵上，加强通道间信息的关联性。池化注意力层205对输入特征矩阵B₃做全局平均池化操作，生成一个长度为其通道数量的向量，再将该向量经softmax处理，得到通道权重向量，同时对输入B₃做卷积核大小为3的卷积操作，然后将所得特征矩阵的每个通道的所有数值和权重向量中对应的通道权重值相乘，所得结果经批归一化层和ReLU激活函数后得到最终输出特征矩阵D(第四特征信息)。

步骤103、搭建分类器，基于特征信息对目标进行分类，并根据损失函数结果对模型参数进行优化；

作为示例，分类器包括全连接层以及Softmax层。全连接层利用矩阵相乘的方法进行特征空间转换整合网络提取出的特征信息。将权重矩阵和输入特征矩阵相乘再加偏置后通过softmax层分类，若训练集中数据所包含的目标种类总数为C，测试样本中第i个数据对应于目标集中各类目标的概率预测分布表示为：

Q(x_i)＝softmax(W^TX+b)

其中，X为全连接层的输入，W^T为可训练的权重矩阵，b为偏置向量。

通过最大后验概率将测试样本x_i分类到最大目标概率c₀中：

c₀＝argmaxQ(x_i)

作为示例，本发明的损失函数采用交叉熵的代价函数：

其中，N表示一个批次中训练样本的个数，z(i)用于表示第i个训练样本，P(i│x_train)表示训练样本对应于第i个目标的概率。

通过使用训练数据计算损失函数相对于参数的梯度来学习参数，在收敛时固定学习参数，得到训练完成的雷达目标识别模型。

同时，在模型预训练阶段对数据做了额外的预处理以增加雷达通讯信号样本的多样性，预处理后的模型将不再受限于大量的训练样本，在实际应用中具有现实意义。

图3为根据本发明实施例的雷达目标识别方法流程示意图。如图3所示，该方法包括如下步骤：

步骤301、获取目标雷达信号；

步骤302、利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵；

卷积输入层用于输入目标雷达信号，采用普通卷积层进行处理，输出初始特征信息。在一个示例中，卷积输入层由三层连续的卷积层组成，每层卷积层对该层的输入特征矩阵做卷积核大小为3，步距为1，采用零填充方式的卷积操作，并且第一层的卷积核个数设置为20，后面两层的卷积核个数为输入特征矩阵通道数量的两倍，以达到增加通道数量的目的。最后，对第三层的输出结果做批归一化处理和ReLU激活函数处理，得到输出特征矩阵C₀(初始特征信息)：

C₀＝σ{BN(Conv₃(Conv₂(Conv₁(X))))}

步骤303、利用第一并联卷积网络对初始特征矩阵进行特征提取以获得第一特征矩阵；

第一并联卷积网络是由分组卷积块和第一普通卷积块组成的并联网络：分组卷积块将输入的特征矩阵C₀按通道分成两组，每组的卷积核数量等于该组特征矩阵的通道数量，两组分别进行卷积核大小为3，步距为2，采用零填充方式的卷积运算，达到减少运算量和参数量和隔绝不同组信息交换的效果。第一普通卷积块由两个并联的卷积层组成，卷积核大小分别为3和5，步距均为2，均采用零填充方式，将两个卷积层的输出拼接后输入批归一化层和ReLU激活函数。最后，将分组卷积块和第一普通卷积块的输出采用特征矩阵相同位置数值相加的方法结合，得到第一并联卷积网络202的输出特征矩阵C₁(第一特征信息)：

C₁＝BN{ConvGroup(C₀)}+BN{Conv(₃)(C₀)+Conv(₅)(C₀)}

步骤304、利用第二并联卷积网络对第一特征矩阵进行特征提取以获得第二特征矩阵；

第二并联卷积网络是由基于池化的深度可分离卷积块和第二普通卷积块组成的并联网络，其与第一并联卷积网络串联连接，以第一并联卷积网络的输出特征矩阵C₁作为输入。

C₂＝BN{ConvPoint(C₁)}+BN{Conv(C₁)}

步骤305、利用多尺度特征融合模块对第二特征信息进行多尺度特征融合以获得第三特征矩阵；

多尺度特征融合模块以第二并联卷积网络的输出特征矩阵C₂作为输入，进一步提取特征信息。该模块的卷积层的卷积核大小逐层减小，并采用残差连接方式，对每层的输入做池化处理，与输出相加后经批归一化层和ReLU激活函数输出。

作为示例，多尺度特征融合模块的网络主干由卷积核大小不同的三层卷积层组成，卷积核大小从第一层到第三层分别设置为7、5和3，步幅大小均为2，采用零填充方式，逐层压缩特征矩阵。每个卷积层后面都连接一个批归一化层和ReLU激活函数，通过三层的下采样压缩特征信息，提高模型的对特征信息的提取能力。

最后，将特征矩阵相同位置数值相加的方法生成该模块的最终输出B_i(第三特征信息)：

B_i＝σ(BN(Conv(B_i-1)+Pool(B_i-1)))

步骤306、采用池化注意力机制对第三特征矩阵进行处理以获得第四特征矩阵；

池化注意力层使用通道注意力机制，将通道权重作用在经卷积操作后的特征矩阵上，加强通道间信息的关联性。池化注意力层对输入特征矩阵B₃做全局平均池化操作，生成一个长度为其通道数量的向量，再将该向量经softmax处理，得到通道权重向量，同时对输入B₃做卷积核大小为3的卷积操作，然后将所得特征矩阵的每个通道的所有数值和权重向量中对应的通道权重值相乘，所得结果经批归一化层和ReLU激活函数后得到最终输出特征矩阵D(第四特征信息)。

步骤307、利用分类器基于第四特征信息获得雷达目标识别结果；

分类器包括全连接层以及Softmax层。全连接层利用矩阵相乘的方法进行特征空间转换整合网络提取出的特征信息。将权重矩阵和输入特征矩阵相乘再加偏置后通过softmax层分类，输出雷达目标识别结果。

图4为根据本发明实施例的雷达目标识别装置组成示意图。如图4所示，该装置400包括：

输入模块401，被配置为获取目标雷达信号；

初始特征提取模块402，被配置为利用卷积输入层对目标雷达信号进行特征提取以获得初始特征矩阵；

第一特征提取模块403，被配置为利用第一并联卷积网络对初始特征矩阵进行特征提取以获得第一特征矩阵；

第二特征提取模块404，被配置为利用第二并联卷积网络对第一特征矩阵进行特征提取以获得第二特征矩阵；

第三特征提取模块405，被配置为对第二特征矩阵进行多尺度特征融合以获得第三特征矩阵；

第四特征提取模块406，被配置为采用池化注意力机制对第三特征矩阵进行处理以获得第四特征矩阵；

识别模块407，被配置为基于第四特征矩阵获得雷达目标识别结果。

其中，各特征提取部分的组成与上文描述的相同，在此不再赘述。

本发明中，处理器可以为中央处理器(Central Processing Unit，CPU)，或者其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。存储单元可以是暂态存储器，也可以是非暂态存储器。

虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，可以对本本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

Claims

1.一种雷达目标识别模型的训练方法，其特征在于，该方法包括：

构建训练数据集；

2.根据权利要求1所述的训练方法，其特征在于，所述分组卷积块中，每组的卷积核数量等于该组特征矩阵的通道数量，两组分别进行卷积核大小为3，步距为2，且采用零填充方式的卷积运算。

3.根据权利要求1所述的训练方法，其特征在于，所述第二普通卷积块中，每个卷积层的卷积核大小均为3，步距均为2，采用零填充方式，且每层卷积层的卷积核数量是该层输入特征矩阵的通道数量的两倍。

4.根据权利要求1所述的训练方法，其特征在于，所述基于池化的深度可分离卷积块为包含池化层的深度可分离卷积块，所述池化层用于在深度可分离卷积中逐通道卷积后，对每个单通道特征矩阵使用池化操作；深度可分离卷积块的后半部分点卷积的卷积核数量设置为输入特征矩阵的通道数量，并使用两个串联的卷积层压缩特征矩阵的二维尺寸。

5.根据权利要求1所述的训练方法，其特征在于，所述多尺度特征融合模块中，网络主干由卷积核大小逐渐减小的三层卷积层组成，并使用残差支路对每个卷积层的输入做局部平均池化操作。

6.一种雷达目标识别方法，其特征在于，所述方法包括：

获取目标雷达信号；

利用分类器基于所述第四特征矩阵获得雷达目标识别结果；

7.一种雷达目标识别装置，其特征在于，该装置包括：

输入模块，被配置为获取目标雷达信号；