CN114296041A

CN114296041A - 基于DCNN和Transformer的雷达辐射源识别方法

Info

Publication number: CN114296041A
Application number: CN202111649998.4A
Authority: CN
Inventors: 赵志强; 朱贺; 潘勉; 吕帅帅
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-04-08

Abstract

本发明公开了一种基于DCNN和Transformer的雷达辐射源识别方法，将Transformer架构引入到雷达辐射源识别领域，并且对架构进行改进，克服了之前学习远程依赖性难题，计算两个位置之间的关联突破之前卷积神经网络的限制。采用注意力机制模型，对于多通道的数据特征提取，通过学习进入全局特征提取前的数据通道特征，学习通道依赖性，凸显特征提取后的各个通道的重要性，提高辐射源时频图的表征能力。本发明提出的方法可以对低信噪比的时频图首先进行局部特征提取，然后考虑关联位置之间的关系考虑全局特征，在信噪比的情况下，综合局部特征跟全局特征，能够有良好的识别效果。

Description

基于DCNN和Transformer的雷达辐射源识别方法

技术领域

本发明属于雷达对抗侦查领域，具体是雷达辐射源信号识别领域涉及到基于DCNN和Transformer的雷达辐射源识别方法。

背景技术

现代电子战争和雷达技术对抗战争中，雷达的作战能力体现了一个国家的军事技术实力，其主要作用是为远程探测和打击敌方目标提供强有力的保证，而雷达辐射源识别是无线电子战争中关键的核心功能，过程是将测得的辐射源信号参数与我们的库内样本预先就存在的参数进行特征对比确认辐射源的特性的过程，最终，对观测和截获的雷达信号进行分析，和识别从而获取对方的战术情报，可以为作战领导提供战场上瞬息万变的战况，从而采取相应的举措。

传统的雷达侦察设备中，识别大多是基于常规的脉冲描述字的使用，包含特征到达方向与时间(DOA/TOA)、射频(RF)、脉宽(PA)、脉冲重复间隔(PRI)等，相关的科研人员将接收到的信号常规的脉冲参数与库内样本的参数模板进行对比完成雷达辐射源识别的工作。现阶段，根据确切消息，大多数发达国家已经开始广泛使用低截获概率雷达(lowprobability of intercept，LPI)，新型雷达配备了更加复杂的波形并且调制参数多样，传统的脉冲描述字识别方法已经不能很好的识别。所以，对雷达辐射源的信号的识别，具有极其重要的意义。

随着人工智能领域深度学习的快速发展，国内外已经将深度学习应用于雷达辐射源识别当中，取代了之前人工提取特征进行识别的过程，并且已经取得良好的效果。有科研人员提出将得到的雷达信号进行时频转换，然后通过对图像进行特征提取，对图像进行去噪归一化等处理来提高识别度。Ming Zhang等利用卷积神经网络挖掘CWD时频图中的抽象特征，这种智能识别系统可以识别八种信号类型，包括BPSK(Barker码编码方式)线性调频、Costas码、Frank码和多时码(T1、T2、T3和T4)，在信噪比为-2dB时，总体识别率为93.7％。周志文利用随机投影和主成分分析的方式对时频图像进行降维，结合深度学习来完成识别任务，并通过实验验证对六种信号识别的有效性。

上述方法存在的关键问题是：首先，电磁环境充斥着各种噪声，在信噪比比较低的状况下，识别准确率不能保证，这在真正的电子战争中，会导致严重的损失；其次，这些方法在识别一些相位调制特征相似的时频特征图时，不能做出正确的判断，往往敌方会利用这一性质，采取难以识别的调制方式进行反对抗，这些因素限制了网络的可利用性。

发明内容

为了解决上述问题，我们提出了一种基于DCNN和Transformer的雷达辐射源目标识别方法，旨在解决现有技术中的低信噪比识别准确率不高的、特征相似的调制方式难以识别的技术问题，该方法首先构建雷达辐射源信号时频图数据集，对时频图进行预处理降低样本中的敏感性；然后构建DCNN局部特征提取模块，经过归一化的数据作为DCNN的输入，通过池化层，捕捉细节特征，然后通过通道注意力机制，对各个通道的特征进行建模分析，对各个通道依赖程度进行调整，调整后的特征作为输出，再用Transformer处理经过通道注意力的特征，弥补DCNN全局建模能力较弱的问题，搭建分类器对雷达辐射源目标分类，对Transformer模型的输出，使用全连接将更有效的特征进行保留，最后采用softmax对网络的输出进行分类；

为实现上述目的，本发明包括以下步骤：

S1，构建数据集；

通过MATLAB仿真生成包括二相编码信号、线性调频连续波信号、Costas信号、Frank信号、多相码(P1、P2、P3、P4)和多时码(T1、T2、T3、T4)，12类别不同调制信号，信号在信噪比为-8db到8db范围内，每个信噪比下每一类调制信号样本数至少包含500个，对信号进行时频变换得到包含12种信号时频图的数据集。根据时频图样本数建立训练集和测试集：训练集和测试集比例保持在7：3。对得到的数据采用Mean均值和Std标准差的归一化的预处理方法；

S2，构建雷达辐射源识别网络模型；

所述的雷达辐射源识别网络模型包括多层CNN(DCNN)局部特征提取模块、通道注意力机制模块、Transformer和分类器。

首先利用多层CNN特征提取模块对于预处理后的时频图数据进行特征提取，通过通道注意力机制层对于通道重要性进行表征，利用Transformer进行全局特征关联，最后，构造全连接层利用softmax进行分类输出。

S3，通过多层CNN(DCNN)局部特征提取模块，提取信号时频图的局部特征；

S4，对于提取到的信号时频图的局部特征，通过通道注意力机制模块动态调整输出各个通道的特征，强调关键通道输出信息。

S5，通过Transformer处理经过通道注意力机制模块处理的输出特征，弥补CNN局部特征提取全局建模能力较弱的问题；

S6，通过分类器，对目标分类，对Transformer模型的输出，再次使用全连接进行样本标记空间映射，将更有效的特征进行保留，最后采用softmax对网络的输出进行分类；

S7，通过训练集数据训练雷达辐射源识别网络模型；

S8，将测试集送入S7步骤中已训练完成的模型中进行测试。

优选地，所述S1详细步骤为：

S1.1：通过MATLAB仿真生成一个包括二相编码信号、线性调频连续波信号、Costas信号、Frank信号、多相码(P1、P2、P3、P4)和多时码(T1、T2、T3、T4)，一共12种不同调制类型信号，对信号进行Choi-Williams分布时频处理，得到信号时频图数据集；根据时频图样本数建立训练集和测试集：训练集和测试集比例保持在7：3，将数据和标签对应随机打乱，将训练数据集记为D＝{(x_i,y_k)}_{i∈[1,n],k∈[1,c]}，其中x_i表示第i个样本，y_k表示样本属于第k类，一共采集了c类目标，n表示样本总数；

S1.2：对得到的时频图数据进行Mean均值和Std标准差的归一化，单个时频图样本表示为x_raw＝[x₁,x₂,x₃…,x_M]，其中M表示时频图数据中特征总数，对每个生成的训练集、测试集数据进行归一化处理；归一化后的时频图特征表示为：

其中x为时频图样本输入数据，mean(x)和std(x)分别为时频图输入数据的均值和标准差。x'为mean均值和std标准差的归一化的响应；统一数据的尺度，使数据都保持在0-1之间，方便于后续的网络处理。

优选地，所述S3详细步骤为：

所述的多层CNN局部特征提取模块包括四个依次连接的卷积模块；第一个卷积模块包含第一卷积层、第一批归一化层、Relu激活函数，其中卷积层采用64个3*3的卷积核，stride跟padding设置为1；第二个卷积模块包含第二卷积层、第二最大池化层、第二批归一化层、Relu激活函数，其中卷积层采用64个3*3的卷积核，stride跟padding设置为1，池化层尺寸大小设置为2*2；第三个卷积模块包含第三卷积层、第三批归一化层、Relu激活函数，其中卷积层采用128个3*3的卷积核，stride跟padding设置为1；第四个卷积模块包含第四卷积层、第四最大池化层、第二批归一化、Relu激活函数，其中卷积层采用128个3*3的卷积核，stride跟padding设置为1，池化层尺寸大小设置为2*2；

批归一化采用：

其中，Fⁿ(k,l)表示批归一化之前的雷达辐射源样本对应的卷积层输出中，第k个通道中的第l个元素，

即为批归一化之后的辐射源数据，α^k和β^k为可训练的对应于第k个通道的参数，ε是一个很小的数，为了防止除数为0，大小为10e-8,E(.)为求均值操作，Var(.)表示求方差操作；

激活函数采用Relu函数：

为输入，

为Relu的响应输出。

优选地，所述S4详细步骤为：

对于多层CNN局部特征提取模块的输出，通过一个128维的alpha向量来学习不同通道间的重要性，通过矩阵相乘，得到通道注意力机制模块的输出。通道注意力机制模块具体公式如下：

其中O_conv(k)表示输出Z_add中第k个通道的输出向量，α代表网络自动学习的alpha向量，O_att则代表通道注意力机制模块输出。

优选地，所述S5详细步骤为：

S5.1：对S4后的输出进行切块操作，将输出特征按照32*32进行切分，进行embedding操作，每个embedding大小为32*32*128，得到4个embedding，初始化一个同样大小的token，进行全连接操作，将每个32*32*128embedding映射到一个大小128的低维中，得到5*128的输出。

S5.2：加入位置编码，通过卷积层提取和通道注意力机制模块的局部特征中，并不包含位置的序列信息，采用动态学习的方式，学习位置信息。

其中，P(k,l)表示第k个通道序列特征中的第l个元素，l的取值范围是[0，dmodel)，表示位置编码的维度。可见每一个通道序列中的值都是由不同周期的正余弦函数的取值组合，从而产生独一的具有纹理的位置信息。

S5.3：通过多头注意力机制提取全局有效特征，多头注意力机制将切块后加位置编码的128维输出，分别分成8组head，每一维特征分别乘以三个随机初始化的矩阵W_q，W_k，W_V得到Q，K，V三个矩阵，在每一组中进行self-attention，再将8组的结果进行拼接，其中每一个head_i表示为：

head_i＝Attention(Q_i,K_i,V_i)

MultiHead(Q,K,V)＝Concat(head₀,...,head₇)WO

其中d_k为输入维度数，再将head₀到head₇按列相连，乘以随机初始化的矩阵W₀，即可得到最终的全局有效特征MultiHead(Q,K,V)，记为Z；

S5.4：将得到的全局有效特征输入前向神经网络，通过线性变化，实现高维到低维的转换，进一步保留有效特征；再经过Relu激活函数，输出非线性结果；

S5.5：对前向神经网络的输出进行归一化处理，最后的输出为

优选地，所述S6详细步骤为：

所述的分类器包括全连接层和softmax层；

S6.1：首先通过全连接层对输入的token序列进行处理，通过一个全连接层将归一化处理后的token序列映射到一个低维度特征dim，dim每一项公式为：

i为token序列中第i个神经元，W_i为每个神经元的权重值，b_i为偏差值，

为全连接层的响应输出。

S6.2：通过softmax层对

进行分类，所述激活函数softmax的数学模型表示如下：

其中z_j代表第j个元素，m为类别数，p_j为激活函数softmax的响应。

优选地，所述S7详细步骤为：

将预处理后训练集样本输入到雷达辐射源识别网络中训练网络，网络采用Adam算法更新网络权值；所述Adam算法如下：

m←β_1m+(1-β₁)g

ν←β₂ν+(1-β₂)g2

其中g表示为损失函数L(θ)的梯度；θ表示为迭代权重；

表示梯度算子；m表示初始化为0的g的一阶矩估计；ν表示为初始化为0的g的二阶矩估计；β₁为一阶矩估计的指数衰减率，取值为0.9；β₂为二阶矩估计的指数衰减率，取值为0.9；T表示转置操作；α为学习率，初始设置为0.001；ε为平滑常数，防止除数0，取值为10e-8；

采用交叉熵损失函数；为了避免过拟合的发生以防止网络的泛化能力降低；所述交叉熵损失函数表示如下：

其中H(p,q)表示交叉熵损失函数；p(x)表示样本的真实分布；q(x)表示模型所预测的分布；交叉熵损失函数越小，表示样本的真实分布与模型所预测的分布越接近；引入早停机制，以测试准确率作为标准，引入学习率衰减，设置最小学习率为0；设置最大训练轮数为100轮，batch_size大小为32；以测试准确率为标准，保存识别准确率最高的网络模型。

本发明的有益效果是：

1、本发明将Transformer架构引入到雷达辐射源识别领域，并且对架构进行改进，克服了之前学习远程依赖性难题，计算两个位置之间的关联突破之前卷积神经网络的限制。

2、本发明采用注意力机制模型，对于多通道的数据特征提取，通过学习进入全局特征提取前的数据通道特征，学习通道依赖性，凸显特征提取后的各个通道的重要性，提高辐射源时频图的表征能力。

3、现有的技术对于雷达辐射源的识别在电磁环境复杂情况下识别的正确率识别效果非常差，本发明提出的方法可以对低信噪比的时频图首先进行局部特征提取，然后考虑关联位置之间的关系考虑全局特征，在信噪比的情况下，综合局部特征跟全局特征，能够有良好的识别效果。

附图说明

图1：本发明实施例雷达辐射源识别模型结构示意图。

具体实施方式

以下结合附图与实施例对本发明方法进行进一步描述。

一种基于DCNN和Transformer的雷达辐射源识别方法，具体实施步骤如下：

训练阶段：

S1：构建数据集，利用MATLAB仿真生成调制类型信号的数据集包含二相编码信号、线性调频连续波信号、Costas信号、Frank信号、多相码(P1、P2、P3、P4)和多时码(T1、T2、T3、T4)；信号参数如下表：

每一种调制类型信号分别在{-8dB，-6dB，-4dB，-2dB，0dB，2dB，4dB，6dB，8dB}信噪比下各生成1000个样本信号，即每一种调制信号共生成9000个样本，十二种不同调制类型信号共108000个样本。各类目标训练集和测试集样本数的比例为7：3，将挑选的数据集记作T＝{(x_i,y_k)}_{i∈[1,n],k∈[1,c]}，其中x_i表示第i个样本，y_k表示样本属于第k类，一共采集了c类目标，n表示样本总数。

对所提取数据集中的样本做数据预处理，对数据进行Mean均值和Std标准差的归一化，假设原始雷达辐射源数据表示为x_raw＝[x₁,x₂,x₃…,x_M]，其中M表示雷达辐射源数据中特征总数，对每个生成的训练集、测试集数据进行归一化处理；归一化后的雷达辐射源表示为：

其中x雷达辐射源输入时频图数据，mean(x)和std(x)分别为所有输入数据的均值和标准差。x'为mean均值和std标准差的归一化的响应；统一数据的尺度，使我们的数据都保持在0-1之间，方便于后续的网络处理。

S2：构建雷达辐射源识别模型；

如图1所示，所述的雷达辐射源识别网络模型包括多层CNN(DCNN)局部特征提取模块、通道注意力机制模块、Transformer和分类器。

首先利用多层CNN特征提取模块对于预处理后的时频图数据进行特征提取，通过通道注意力机制层对于通道重要性进行表征，利用Transformer进行全局特征关联，最后，搭建多层全连接利用softmax进行分类输出。

S3：通过多层CNN(DCNN)局部特征提取模块，提取信号时频图的局部特征，具体实施步骤如下：

时频图数据分别通过四个卷积模块，进行特征提取，所述的多层CNN局部特征提取模块包括四个依次连接的卷积模块；第一个卷积模块包含第一卷积层、第一批归一化、Relu激活函数，其中采用64个3*3的卷积核，stride跟padding设置为1；第二个卷积模块包含第二卷积层、第二最大池化层、第二批归一化、Relu激活函数，其中采用64个3*3的卷积核，stride跟padding设置为1，池化层尺寸大小设置为2*2；第三个卷积模块包含第三卷积层、第三批归一化、Relu激活函数，其中采用128个3*3的卷积核，stride跟padding设置为1；第四个卷积模块包含第四卷积层、第四最大池化层、第二批归一化、Relu激活函数，其中采用128个3*3的卷积核，stride跟padding设置为1，池化层尺寸大小设置为2*2；

S4：对于提取到的信号时频图的局部特征，通过通道注意力机制模块动态调整输出各个通道的特征，强调关键通道输出信息。

对于多层CNN局部特征提取模块的输出,发明通过自适应的调整各个通道的特征响应值，引入通道注意力机制，增加了很小的运算，但是性能却提升了很多，发明通过一个128维的alpha向量来学习不同通道间的重要性，通过矩阵相乘，得到注意力层的输出。注意力层具体公式如下：

其中O_conv(k)表示输出Z_add中第k个通道的输出向量，α代表网络自动学习的alpha向量，O_att则代表注意力层输出。

S5：通过Transformer处理经过通道注意力机制模块处理的输出特征，弥补CNN局部特征提取全局建模能力较弱的问题，具体实施步骤如下：

S5.1：对S4后的输出进行切块操作，将输出特征按照32*32进行切分，进行embedding操作，每个embedding大小为32*32*128，可以得到4个embedding，初始化一个同样大小的token，进行全连接操作，将每个32*32*128子集映射到一个大小128的低维中，得到5*128的输出。

S5.3：通过多头注意力机制层提取全局有效特征，多头注意力机制将切块后加位置编码的128维输出，分别分成8组head，每一维特征分别乘以三个随机初始化的矩阵W_q，W_k，W_V得到Q，K，V三个矩阵，在每一组中进行self-attention，再将8组的结果进行拼接，其中每一个head_i表示为：

head_i＝Attention(Q_i,K_i,V_i)

MultiHead(Q,K,V)＝Concat(head₀,...,head₇)WO

S5.4：将得到的全局有效特征输入前向神经网络，通过线性变化，实现高维到低维的转换，进一步保留有效特征；经过Relu激活函数，输出非线性结果；

S5.5：层归一化，对前向神经网络输出线性层的所有神经元进行归一化。令第

层神经的净输入为

其均值和方差为：

其中

为第

层神经元的数量，层归一化为：

其中，γ，β代表缩放和平移的参数向量，和

维数目相同，最后的输出为

S6：通过分类器，对目标分类，对Transformer模型的输出，再次使用全连接进行样本标记空间映射，将更有效的特征进行保留，最后采用softmax对网络的输出进行分类，具体步骤如下：

S6.1：首先通过全连接层对输入的token序列进行处理，通过一个归一化处理后的token序列映射到一个低维度特征dim，dim每一项公式为：

为全连接层的响应输出。

S6.2：通过softmax层对F(x)进行分类，所述激活函数softmax的数学模型表示如下：

其中z_j代表第j个元素，m为类别数，p_j为激活函数softmax的响应，得到最后的output。

S7：通过训练集数据训练雷达辐射源识别网络模型；

m←β_1m+(1-β₁)g

ν←β₂ν+(1-β₂)g2

其中g表示为损失函数L(θ)的梯度；θ表示为迭代权重；

测试阶段：

S8：将经过预处理后的测试集数据依次输入到训练好的雷达辐射源识别网络模型中，得到测试集每个样本的识别结果。

经过上述8个步骤，即可得到本发明所提出的一种基于DCNN和Transformer的雷达辐射源识别方法模型。

Claims

1.基于DCNN和Transformer的雷达辐射源识别方法，其特征在于，步骤如下：

S1，构建数据集；

通过MATLAB仿真生成包括二相编码信号、线性调频连续波信号、Costas信号、Frank信号、多相码P1、P2、P3、P4和多时码T1、T2、T3、T4，12类别不同调制信号，信号在信噪比为-8db到8db范围内，每个信噪比下每一类调制信号样本数至少包含500个，对信号进行时频变换得到包含12种信号时频图的数据集；根据时频图样本数建立训练集和测试集：训练集和测试集比例保持在7：3；对得到的数据采用Mean均值和Std标准差的归一化的预处理方法；

S2，构建雷达辐射源识别网络模型；

所述的雷达辐射源识别网络模型包括多层CNN局部特征提取模块、通道注意力机制模块、Transformer和分类器；

首先利用多层CNN特征提取模块对于预处理后的时频图数据进行特征提取，通过通道注意力机制层对于通道重要性进行表征，利用Transformer进行全局特征关联，最后，构造全连接层利用softmax进行分类输出；

S3，通过多层CNN局部特征提取模块，提取信号时频图的局部特征；

S4，对于提取到的信号时频图的局部特征，通过通道注意力机制模块动态调整输出各个通道的特征，强调关键通道输出信息；

S7，通过训练集数据训练雷达辐射源识别网络模型；

S8，将测试集送入S7步骤中已训练完成的模型中进行测试。

2.根据权利要求1所述的基于DCNN和Transformer的雷达辐射源识别方法，其特征在于，S1详细步骤为：

S1.1：通过MATLAB仿真生成一个包括二相编码信号、线性调频连续波信号、Costas信号、Frank信号、多相码P1、P2、P3、P4和多时码T1、T2、T3、T4，一共12种不同调制类型信号，对信号进行Choi-Williams分布时频处理，得到信号时频图数据集；根据时频图样本数建立训练集和测试集：训练集和测试集比例保持在7：3，将数据和标签对应随机打乱，将训练数据集记为D＝{(x_i,y_k)}_{i∈[1,n],k∈[1,c]}，其中x_i表示第i个样本，y_k表示样本属于第k类，一共采集了c类目标，n表示样本总数；

其中x为时频图样本输入数据，mean(x)和std(x)分别为时频图输入数据的均值和标准差；x'为mean均值和std标准差的归一化的响应；统一数据的尺度，使数据都保持在0-1之间，方便于后续的网络处理。

3.根据权利要求1所述的基于DCNN和Transformer的雷达辐射源识别方法，其特征在于，S3详细步骤为：

批归一化采用：

激活函数采用Relu函数：

为输入，

为Relu的响应输出。

4.根据权利要求3所述的基于DCNN和Transformer的雷达辐射源识别方法，其特征在于，S4详细步骤为：

对于多层CNN局部特征提取模块的输出，通过一个128维的alpha向量来学习不同通道间的重要性，通过矩阵相乘，得到通道注意力机制模块的输出；通道注意力机制模块具体公式如下：

5.根据权利要求4所述的基于DCNN和Transformer的雷达辐射源识别方法，其特征在于，S5详细步骤为：

S5.1：对S4后的输出进行切块操作，将输出特征按照32*32进行切分，进行embedding操作，每个embedding大小为32*32*128，得到4个embedding，初始化一个同样大小的token，进行全连接操作，将每个32*32*128embedding映射到一个大小128的低维中，得到5*128的输出；

S5.2：加入位置编码，通过卷积层提取和通道注意力机制模块的局部特征中，并不包含位置的序列信息，采用动态学习的方式，学习位置信息；