CN114527441A

CN114527441A - 基于多头注意力机制的lstm网络的雷达信号识别方法

Info

Publication number: CN114527441A
Application number: CN202210026583.XA
Authority: CN
Inventors: 全大英; 胡志鹏; 汪晓锋
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2022-01-11
Filing date: 2022-01-11
Publication date: 2022-05-24

Abstract

本发明提供了一种基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述识别方法包括如下步骤：S1、生成数据集，数据集中的多种典型雷达信号作为LSTM网络的训练及测试用；S2、对产生的数据集信号进行预处理；S3、构建LSTM网络，设置LSTM网络参数；S4、将数据集信号序列的训练样本数据输入至步骤S3的LSTM网络中，当迭代次数达到n次时，结束训练，得到训练好的LSTM的网络模型；S5、将数据集中每种信号的测试集数据输入到训练好的LSTM网络模型中，网络输出为雷达信号预测类别。本发明以雷达信号辐射源信号序列经过多头注意力机制进行表征学习得到的新的序列，再把该序列输入到LSTM神经网络中进行特征提取识别，从而提高实现雷达信号识别率。

Description

基于多头注意力机制的LSTM网络的雷达信号识别方法

技术领域

本发明涉及信号处理技术领域，具体涉及基于多头注意力机制的LSTM(LongShort-Term Memory)网络的雷达信号识别方法。

背景技术

随着电子信息领域的发展，电子对抗在电子情报侦察、电子支援和威胁告警系统中发挥着重要的作用，雷达辐射源信号识别是电子对抗中的重要环节。

随着深度学习(Deep Learning，DL)应用在计算机视觉、语音识别和数据分类等领域体现出其优异的性能。深度学习模型是一个拥有多个非线性映射层的深度神经网络模型，能够对输入信号进行逐层抽象并提取特征，挖掘更深层次的潜在规律。目前也有基于神经网络的雷达信号识别方法，常用的有BP神经网络、ResNet残差神经网络和支持向量机等，然而上述采用深度学习方法识别雷达信号调制类型里，它依旧是在对信号进行某种特征提取变换后，将得到的特征作为信号识别依据，而后用神经网络进行分类识别，因而识别能力仍有局限性。

发明内容

针对现有技术中存在的不足，本发明的目的在于提供基于多头注意力机制的LSTM网络的雷达信号识别方法。本发明以雷达信号辐射源信号序列经过多头注意力机制进行表征学习得到的新的序列，再把该序列输入到LSTM神经网络中进行特征提取识别，从而提高实现雷达信号识别率。

为解决上述技术问题，本发明通过下述技术方案实现：

基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述识别方法包括如下步骤：

S1、取一个有标签标注的数据集，该数据集可以包括但不限于这九种典型雷达信号(常规脉冲信号、线性调频信号、非线性调频信号、双相相移键控信号、正交相移键控信号、频移键控信号、线性调频与双相相移键控信号的混合调制信号、线性调频与频移键控信号的混合调制信号、双相相移键控信号与频移键控信号的混合调制信号)，把这九种典型雷达信号作为LSTM(Long Short-Term Memory)网络的训练及测试用；其中，每种信号从-16dB到8dB每隔2dB信噪比生成4000组(取其中3200组作为训练集，取另外800组作为测试集)雷达序列数据样本；

S2、对产生的数据集信号进行预处理；

S3、构建LSTM网络，设置LSTM网络参数；

S4、将数据集信号序列的训练样本数据输入至步骤S3的LSTM网络中，当迭代次数达到n次时，结束训练，得到训练好的LSTM的网络模型；即LSTM的网络模型的训练方式为：LSTM网络的迭代次数为300，初始化学习率设置为0.001，并且每次迭代之后学习率变为原来的0.95倍，LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，将LSTM网络的损失函数设置为对数损失函数，使用AdamOptimizer算法来控制学习率，使用指数线性单元激活函数作为激活函数，并将softmax分类器作为网络的输出层。

S5、将数据集中每种信号的测试集数据输入到训练好的LSTM网络模型中，网络输出为雷达信号预测类别标签。

进一步的：所述步骤S2中，数据集信号进行预处理步骤包括：

S01、将产生数据集的信号先以序列的形式输出，再将数据集信号输入到多头注意力机制中，进行多头注意力变换，并以同样大小的数据序列形式输出；

S02、在I路、Q路这两种形式输出的数据集中标注信号所属的类别，从每类信号的训练集数据中随机抽出样本序列作为训练样本，从测试集数据中随机抽取样本序列作为测试样本；即，从每类信号的3200组训练集数据中随机抽出3000组样本序列作为训练样本，从800组测试集中随机抽取700组样本序列作为测试样本。

进一步的：所述步骤S3中，设置LSTM网络参数：选用循环神经网络RNN中的长短时记忆网络来构建，将LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，将LSTM网络的损失函数设置为Log-cosh对数损失函数，使用AdamOptimizer算法来控制学习率，使用指数线性单元激活函数作为激活函数，并将softmax分类器作为网络的输出层。

进一步的：所述LSTM网络中的网络元胞，表示如下：

h_t＝σ(W_O·[h_t-1，x_t]+b_o]*tanh(f_t*C_t-1+R_t)式中，t代表时间；h_t为t时刻LSTM网络元胞的输出；σ为sigmoid激活函数；Wo表示输出门的权重；h_t-1表示上一个元胞的输出；x_t表示t时刻LSTM网络元胞的输入；b_o表示输出门的偏置；f_t表示t时刻LSTM网络元胞中遗忘门的输出；C_t-1表示t-1时刻的元胞状态；Rt表示t时刻LSTM网络元胞中记忆门的输出；tanh表示做双曲正切运算。

进一步的：所述指数线性单元激活函数，表示如下：

式中，x表示输入值，是一个常系数，f(x)表示指数线性单元激活函数的输出。

进一步的：所述softmax分类器，表示如下：

式中，y_i表示第i个元素的评分向量，

表示对第i个元素的评分向量求指数，

表示对所有元素评分向量的指数求和，L_i表示第i个元素输出的评分值。

进一步的：所述多头注意力机制的核心过程为通过Q(Query)和K(Key)计算得到注意力权重；然后在作用于V(Value)得到整个权重和输出。Q、K、V是根据同样的输入矩阵X线性变换得到的Q＝XW^Q

K＝XW^K

V＝XW^V

其中，W^Q，W^K和W^V是三个可训练的参数矩阵。此多头注意力机制中，将head设置为8，所以需定义8组W^Q，W^K和W^V可训练的参数矩阵。

具体的，对于输入Q、K和V来说，其输出向量得计算公式为：

详细公式可写为：

其中，q_i为一组数据序列中位置i上的数w_i的向量Query，k_j、v_j分别表示同一组数据序列中的位置j上的数w_i的向量Key和Value；d_k表示的维度大小；i，j＝0，1，2，…，7，表示包含数据序列中的数的数量；S_i，j为q_i与k_j作向量点积运算和除法运算后得到的结果；

是S_i，j的soft的Softmax分值；z_i即为w_i经self-attention计算后得到的输出结果；最后将z_i和w_i进行拼接，作为LSTM的输入。

根据本发明目的的第二个方面，本发明提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现上述基于多头注意力机制的LSTM网络的雷达信号识别方法的步骤。

根据本发明目的的第二个方面，本发明一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述基于多头注意力机制的LSTM网络的雷达信号识别方法的步骤。

本发明与现有技术相比，具有以下优点及有益效果：

本发明所采用的LSTM循环神经网络，输入的不是信号的特征，而是截获的原始信号的IQ路数据，让神经网络根据分类目标自动学习良好的特征，进而实现不同的调制信号的高效准确识别；因此，本发明对雷达信号处理技术领域具有重要的实际应用价值。

附图说明

图1是本发明的实现流程图。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案，下面结合具体实施例对本发明的优选实施方案进行描述，但是应当理解，附图仅用于示例性说明，不能理解为对本发明的限制；为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明，不能理解为对本发明的限制。

下面结合附图和实施例对本发明作进一步的说明，但并不作为对本发明限制的依据。

如图1所示，基于多头注意力机制的LSTM网络的雷达信号识别方法，所述识别方法包括如下步骤：

S1、对一个有标签标注的数据集，该数据集可以包括但不限于这九种典型雷达信号(常规脉冲信号、线性调频信号、非线性调频信号、双相相移键控信号、正交相移键控信号、频移键控信号、线性调频与双相相移键控信号的混合调制信号、线性调频与频移键控信号的混合调制信号、双相相移键控信号与频移键控信号的混合调制信号)，把这九种典型雷达信号作为LSTM(Long Short-Term Memory)网络的训练及测试用；其中，每种信号从-16dB到8dB每隔2dB信噪比生成4000组(取其中3200组作为训练集，取另外800组作为测试集)雷达序列数据样本；

S2、对产生的数据集信号进行多头注意力机制处理，每组输入的X信号序列，经过多头注意力机制(在此设置注意力机制中head＝8，1个头就只有1个学习空间，8个头就有8个学习空间，能够通过KQV映射到不同的空间去学习特征，去优化每一组输入数据的不同特征部分，得到更多元的表达，从而均衡每一种学习空间的特征产生的偏差，提升学习效果)后，一组经过注意力机制处理的信号数据会通过注意力机制的每个头输出一组相同维度的信号序列，head＝8的注意力机制会得到8组相同维度的信号序列。将输出的8组处理过的同样大小维度的信号序列(X₁，X₂，...，X₈)输入到构建好的LSTM网络中；

S3、构建LSTM网络，设置LSTM网络参数；

S4、将数据集信号序列的训练样本数据输入至步骤S3的LSTM网络中，当迭代次数达到n次时，结束训练，得到训练好的LSTM的网络模型；LSTM的网络模型的训练方式为：LSTM网络的迭代次数为300，初始化学习率设置为0.001，并且每次迭代之后学习率变为原来的0.95倍，且将LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，将LSTM网络的损失函数设置为对数损失函数，使用AdamOptimizer算法来控制学习率，使用指数线性单元激活函数作为激活函数，并将softmax分类器作为网络的输出层。

所述步骤S1中，可以通过matlab建立数据库程序，仿真生成数据集，也可以通过实测信号得到的数据进行标注，建立数据集。

所述步骤S2中，数据集信号进行预处理步骤包括：

S02、在I路、Q路这两种形式输出的数据集中标注信号所属的类别，从每类信号的训练集数据中随机抽出样本序列作为训练样本，从测试集数据中随机抽取样本序列作为测试样本。

所述步骤S3中，设置LSTM网络参数：选用循环神经网络RNN中的长短时记忆网络来构建，将LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，将LSTM网络的损失函数设置为对数损失函数，使用AdamOptimizer算法来控制学习率，使用指数线性单元激活函数作为激活函数，并将softmax分类器作为网络的输出层。

所述LSTM网络中的网络元胞，表示如下：

h_t＝σ(W_O·[h_t-1，x_t]+b_o)*tanh(f_t*C_t-1+R_t)

式中，t代表时间；h_t为t时刻LSTM网络元胞的输出；σ为sigmoid激活函数；Wo表示输出门的权重；h_t-1表示上一个元胞的输出；x_t表示t时刻LSTM网络元胞的输入；b_o表示输出门的偏置；f_t表示t时刻LSTM网络元胞中遗忘门的输出；C_t-1表示t-1时刻的元胞状态；Rt表示t时刻LSTM网络元胞中记忆门的输出；tanh表示做双曲正切运算。

所述指数线性单元激活函数，表示如下：

所述softmax分类器，表示如下：

式中，y_i表示第i个元素的评分向量，

表示对第i个元素的评分向量求指数，

所述多头注意力机制的核心过程为通过Q(Query)和K(Key)计算得到注意力权重；然后在作用于V(Value)得到整个权重和输出。Q、K、V是根据同样的输入矩阵X线性变换得到的Q＝XW^Q

K＝XW^K

V＝XW^V

具体的，对于输入Q(Query)、K(Key)和V(Value)来说，其输出向量得计算公式为：

详细公式可写为：

其中，q_i为一组数据序列中位置i上的数w_i的向量Query，k_j、v_j分别表示同一组数据序列中的位置j上的数w_i的向量Key和Value；d_k表示的维度大小；本发明中多头注意力机制里head设置为8，因此i，j＝0，1，2，…，7，表示包含数据序列中的数的数量；S_i，j为q_i与k_j作向量点积运算和除法运算后得到的结果；

是S_i，j的soft的Softmax分值；z_i即为w_i经self-attention计算后得到的输出结果；最后将z_o和w_o进行拼接，作为LSTM的输入。

所述步骤S1中，典型雷达信号包括常规脉冲信号、线性调频信号、非线性调频信号、双相相移键控信号、正交相移键控信号、频移键控信号、线性调频与双相相移键控信号的混合调制信号、线性调频与频移键控信号的混合调制信号、双相相移键控信号与频移键控信号的混合调制信号。

常规脉冲信号(CW)的载波频率为fc＝5MHz；线性调频信号(LFM)和非线性调频信号(NLFM)的初始频率和带宽均为5MHz；双相相移键控信号(BPSK)的巴克码长度为13，载波频率为5MHz；正交相移键控信号(QPSK)的序列长度为16，载波频率为5MHz；频移键控信号(FSK)的调频序列为4，基准频率为1MHz；LFM/BPSK混合调制信号是指对脉冲内部线性调频的基础上再进行相位编码得到的一种复合调制信号，该混合调制信号的参数仍按照相应的单一调制信号的参数设置；LFM/FSK混合调制信号是指在脉冲内部采用频率编码调制，对每个子脉冲内部又采用线性调频，该混合调制信号的参数仍按照相应的单一调制信号的参数设置)；BPSK/FSK混合信号是指在脉冲内部采用频率编码调制，对每个子脉冲内部又采用二相编码，该混合调制信号的参数仍按照相应的单一调制信号的参数设置。

在众多深度学习模型中，循环神经网络RNN(Recurrent Neural NetWork)将时序的概念引入到网络结构设计中，使其在时序数据分析中表现出更强的适应性。而在众多RNN的变体中，LSTM模型弥补了RNN的梯度消失和梯度爆炸、长短期记忆能力不足等问题，而此发明考虑的LSTM循环神经网络，输入的不是信号的特征，而是截获的原始信号的IQ路数据，让神经网络根据分类目标自动学习良好的特征，进而实现不同的调制信号的正确识别。

实施例1：

S1、通过matlab建立数据库程序，仿真生成数据集，数据集包括上述9种雷达信号。其中每种信号从-16dB到8dB每隔2dB信噪比生成4000组(其中3200组作为训练集，800组作为测试集)雷达序列数据样本。

S2、获取雷达信号的训练样本和测试样本。

对S1生成的雷达数据集的信号，以I路、Q路这两种序列的形式输出，再将I路、Q路的数据集信号分别进行多头注意力机制处理，并以相同的形式输出。

在多头注意力机制处理之后的序列标注信号的所属类别，从每类信号的3200组训练集数据中随机抽出3000组样本序列作为训练样本，从800组测试集中随机抽取700组样本序列作为测试样本。

S3、构建LSTM网络。

设置LSTM网络元胞：

将LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，其中LSTM网络元胞表示如下：

h_t＝σ(W_O·[h_t-1，x_t]+b_o)*tanh(f_t*C_t-1+R_t)

设置LSTM网络的损失函数：常见损失函数有L1损失函数、L2损失函数、Huber损失函数、Log-cosh损失函数和对数损失函数，本实施例选用但不限于Log-cosh损失函数；

设置LSTM网络的优化算法：常见的网络优化算法有随机梯度下降算法、小批量梯度下降算法、Adagrad算法和AdamOptimizer算法，本实例选用AdamOptimizer算法但不限于AdamOptimizer算法；

设置LSTM网络的激活函数：常见的激活函数有sigmoid激活函数、双曲正切激活函数、非线性单元激活函数和指数线性单元激活函数，本实例选用指数线性单元激活函数但不限于指数线性单元激活函数，指数线性单元激活函数表示如下：

S4、设置LSTM网络的迭代次数为300，学习率设置为0.01，并且每次迭代之后学习率变为原来的0.95倍；

将经过多头注意力机制处理的I路、Q路两路信号序列的训练样本数据同时输入到设置好的LSTM网络中，对LSTM网络进行迭代训练，当迭代次数达到300时，结束训练，保存得到训练好的网络模型。

S5、将测试集的数据输入到训练好的LSTM网络模型中，输出每个测试信号的预测类别及信号识别成功的准确率。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明的设施可借助软件加必需的通用硬件平台的方式来实现。本发明的实施例可以使用现有的处理器来实现，或者由被用于此目的或其他目的用于适当系统的专用处理器来实现，或者由硬接线系统来实现。本发明的实施例还包括非暂态计算机可读存储介质，其包括用于承载或具有存储在其上的机器可执行指令或数据结构的机器可读介质；这种机器可读介质可以是可由通用或专用计算机或具有处理器的其他机器访问的任何可用介质。举例来说，这种机器可读介质可以包括RAM、ROM、EPROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储设备，或任何其他可用于以机器可执行指令或数据结构的形式携带或存储所需的程序代码，并可被由通用或专用计算机或其它带有处理器的机器访问的介质。当信息通过网络或其他通信连接(硬接线、无线或硬接线或无线的组合)传输或提供给机器时，该连接也被视为机器可读介质。

依据本发明的描述及附图，本领域技术人员很容易制造或使用本发明的基于多头注意力机制的LSTM网络的雷达信号识别方法，并且能够产生本发明所记载的积极效果。

以上所述，仅是本发明的较佳实施例，并非对本发明做任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化，均落入本发明的保护范围之内。

Claims

1.基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述识别方法包括如下步骤：

S1、取一个有标签标注的数据集，将数据集中的多种典型雷达信号作为LSTM(LongShort-Term Memory)网络的训练及测试用；

S2、对产生的数据集信号进行预处理；

S3、构建LSTM网络，设置LSTM网络参数；

S4、将数据集信号序列的训练样本数据输入至步骤S3的LSTM网络中，当迭代次数达到n次时，结束训练，得到训练好的LSTM的网络模型；

2.根据权利要求1所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述步骤S2中，数据集信号进行预处理步骤包括：

3.根据权利要求1所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述步骤S3中，设置LSTM网络参数：选用循环神经网络RNN中的长短时记忆网络来构建，将LSTM网络中的网络元胞个数设置为4，将遗忘参数设置为1，将LSTM网络的损失函数设置为对数损失函数，使用AdamOptimizer算法来控制学习率，使用指数线性单元激活函数作为激活函数，并将softmax分类器作为网络的输出层。

4.根据权利要求3所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述LSTM网络中的网络元胞，表示如下：

h_t＝σ(W_O·[h_t-1，x_t]+b_o)*tanh(f_t*C_t-1+R_t)

5.根据权利要求3所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述指数线性单元激活函数，表示如下：

6.根据权利要求3所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述softmax分类器，表示如下：

式中，y_i表示第i个元素的评分向量，

表示对第i个元素的评分向量求指数，

7.根据权利要求2所述的基于多头注意力机制的LSTM网络的雷达信号识别方法，其特征在于：所述多头注意力机制的核心过程为通过Q和K计算得到注意力权重；然后在作用于V得到整个权重和输出。Q、K、V是根据同样的输入矩阵X线性变换得到的；

Q＝XW^Q

K＝XW^K

V＝XW^V

8.具体的，对于输入Q、K和V来说，其输出向量得计算公式为：

详细公式可写为：

是S_i，j的soft的Softmax分值；z_i即为w_i经self-attention计算后得到的输出结果；最后将z_i和w_i进行拼接，作为LSTM网络的输入。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至8任一项所述的基于多头注意力机制的LSTM网络的雷达信号识别方法的步骤。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至8任一项所述的基于多头注意力机制的LSTM网络的雷达信号识别方法的步骤。