CN111553186A

CN111553186A - 一种基于深度长短时记忆网络的电磁信号识别方法

Info

Publication number: CN111553186A
Application number: CN202010146877.7A
Authority: CN
Inventors: 廖开升; 钟轶; 张亚平; 古照勇
Original assignee: CETC 29 Research Institute
Current assignee: CETC 29 Research Institute; Southwest China Research Institute Electronic Equipment
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2020-08-18

Abstract

本发明公开了一种基于深度长短时记忆网络的电磁信号识别方法，其方案为：将电磁信号序列数据进行野值去除、滑窗切片、归一化的预处理，作为输入特征向量；根据电磁信号的输入特征向量，设置一个深度长短时记忆网络模型，第一层为输入层，中间层为长短时记忆层，最后一层为全连接输出层，利用归一化指数函数作为最终输出；通过反向传播优化算法对损失函数进行迭代优化，并朝着损失函数减小的方向更新网络权重系数，获得用于电磁信号识别的网络模型；将待分类的电磁信号经预处理后，输入至网络模型进行分类识别，得到识别结果。本发明具有较强的抗噪声、抗干扰能力，提升了电磁信号识别效率和准确率；同时提升了电磁信号识别的鲁棒性和可扩展性。

Description

一种基于深度长短时记忆网络的电磁信号识别方法

技术领域

本发明属于电磁信号识别技术领域，具体涉及一种基于深度长短时记忆网络的电磁信号识别方法。

背景技术

随着无线电业务的日益增多，以及各种新体制无线电设备层出不穷，使得电磁环境中的信号种类、数量越来越多，电磁频谱愈加拥挤，给无线电频谱监测带来了新的挑战。电磁信号识别作为无线电频谱监测的关键环节，及时、准确的电磁信号识别能够为稀有频谱资源的有效监测、合理利用提供强有力的支撑保障。

传统的电磁信号识别技术直接利用信号参数特征，采用特征参数匹配的方法与电磁信号识别数据库中的相应特征参数进行匹配，而识别出信号的属性。对于传统电磁信号，由于各个特征参数都基本恒定，因此特征参数匹配法有较好的识别效果。然而，随着新体制无线电设备的出现，电磁信号调制参数灵活多变，传统的电磁信号识别技术很难满足要求。

目前，电磁信号识别方法主要依靠人工方式进行信号特征提取进而实现分类识别。常见的电磁信号特征提取方法有时域分析法，频域分析法、瞬时自相关法、谱相关法和时频域分析法等。这些方法一般将电磁信号按照一定的变换后进行特征提取，通过分离度较高的特征向量实现电磁信号分类。而分类器的选择一般使用浅层机器学习方法，如常见的K最近邻法，支持向量机、决策树和浅层神经网络等。经过多年的积累，这些方法在电磁信号识别领域均取得了较好的识别效果。然而，现有的信号特征提取方法主要依赖领域专家对识别对象的深入认识及经验，需要花费大量的精力来完成提取且过程繁琐，难以实现信号识别自动化、智能化，对日益复杂的海量电磁信号数据适应能力差，可扩展性差。

近年来，深度学习技术因其优异的性能广泛用于计算机视觉和自然语言处理领域。深度学习技术没有显式的特征提取过程，直接把底层特征作为深度学习模型的输入，通过多层的非线性映射方式，提取抽象不变的高层属性特征，形成表征数据分布式的表示，相较于浅层机器学习模型具有更强的泛化能力，能刻画数据更加丰富的信息本质。因此，将深度学习技术用于电磁信号高层特征的自动提取与识别，将是电磁信号识别领域的一个研究热点。

发明内容

本发明针对传统电磁信号识别方法难以适从对新体制电磁信号识别的问题，提供了一种基于深度长短时记忆网络的电磁信号识别方法。

本发明采用的技术方案如下：一种基于深度长短时记忆网络的电磁信号识别方法，包括：

步骤S1，首先去除输入电磁信号中的野值，然后对电磁信号进行滑窗切片，再对电磁信号进行归一化处理，作为输入特征向量；

步骤S2，根据电磁信号的输入特征向量，设置一个N层结构的深度神经网络模型，其中N＝4，5，6…，第一层为输入层，中间层为长短时记忆层，最后一层为全连接输出层，利用归一化指数函数(Softmax)作为最终输出；

步骤S3、训练深度长短时记忆网络：通过反向传播优化算法对损失函数进行迭代优化，并朝着损失函数减小的方向更新网络权重系数，当达到设置的迭代轮数或损失值经过设定迭代轮数不再降低时，停止对深度长短时记忆网络的训练，得到训练好的深度长短时记忆网络结构；

步骤S4、基于深度长短时记忆网络的电磁信号识别：将待识别的电磁信号经步骤S1预处理后，输入至步骤3获得的网络模型进行分类识别，得到识别结果。

进一步的，所述步骤S1包括以下过程：

步骤S11，将原始电磁信号序列按照数值由小到大进行排列，对应第25％的数值(下四分位点)取为Q₁，对应第75％的数值(上四分位点)取为Q₃，二者之差记为四分位距IQR＝Q₃-Q₁，将满足小于Q₁-3IQR或大于Q₃+3IQR的特征值判定为野值并去除；

步骤S12，划窗大小设置为n，以m为步进对原始电磁信号序列数据进行划窗切片，其中n＝2^t，t＝1，2，3，...，m＝2^j，j＝0，1，2，...，输出长度为n的特征向量；

步骤S13，将标记好标签的样本集随机打乱顺序，按照一定划分比例将数据集划分为训练集、验证集和测试集；按照各类型电磁信号的占比进行分层抽样，以保留电磁信号类别比例；

步骤S14，获取训练样本均值μ和标准差σ，对待输入网络模型的特征向量X按X^*＝(X-μ)/σ进行归一化处理。

进一步的，所述划分比例包括但不限于4:1:1。

进一步的，所述划分比例包括但不限于2:1:1。

进一步的，所述步骤S2包括以下过程：

步骤S21、构建输入层：输入层由划窗大小n及特征向量的输入特征数k决定，形状为n×k；

步骤S22、构建长短时记忆层：长短时记忆层层数不低于2层，每层的单元个数由划窗大小n决定，每个单元的输出空间维度不低于64维，一般取2ⁱ(i＝6，7，8，...)维，每个单元由输入门、遗忘门和输出门等三种门结构构成；

1)遗忘门通过Sigmoid函数激活，决定单元状态中的忘记信息，当前层的输入x_t和上一层的输出h_t-1作为输入，在t时刻的输出为：

f_t＝σ(W_f·(h_t-1，x_t)+b_f)

其中，W_f，b_f分别是遗忘门权重系数和遗忘门偏置系数；

2)单元存储信息更新由旧的单元状态C_t-1乘以遗忘门输出f_t和新候选输入门信息i_t·C_t的和生成：

t_r＝σ(W_t·(h_t-1，x_t)+b_t)

C_r＝tanh(W_c·(h_t-1，x_t)+b_c)

C_r＝f_r·C_t-1+t_r·C_t

其中W_t，b_i分别是输入门权重系数和输入门偏置系数；W_c，b_c分别是单元状态权重系数和单元状态偏置系数；

3)输出门决定输出信息：使用Sigmoid激活函数决定要输出单元状态的部分信息，使用tanh激活函数处理单元状态，两部分的乘积构成输出值：

o_r＝σ(W_o·(h_t-1，x_r)+b_o)

h_r＝o_r·tanh(C_r)

其中，W_o，b_o分别是输出门的权重系数和偏置系数；

每层长短时记忆层输入前增加一层失活层，失活概率包括但不限于0.1～0.6；除最后一层长短时记忆层外，每一层的所有时刻状态输出作为输入连接至下一层长短时记忆层。最后一层长短时记忆层的最后时刻的状态输出作为下一层全连接的输入，其余时刻的状态信息不输出；

步骤S23、构建全连接输出层：全连接输出层的神经元个数由待识别电磁信号类型数目决定；每个神经元采用非线性整流(ReLu)函数激活。通过指数平均(Softmax)函数，获得分类结果的输出。

进一步的，所述输入特征包括但不限于幅度分量、相位分量、同相分量、正交分量、全脉冲描述字的载频、重频、脉宽及脉幅等，特征的选择可以是其中的一种，也可以是多种或全部。

进一步的，步骤S3的具体方法为：

经步骤2搭建好深度长短时记忆网络模型后，利用训练集和验证集对该模型进行模型训练：

步骤S31、损失函数选择：损失函数选择交叉熵损失函数；

步骤S32、优化器的选择：可选的优化器包括但不限于Adam算法、RMSProp算法；Adam优化器学习率设置为0.001～0.1，指数衰减率β₁设置为0.9～0.99，指数衰减率β₂设置为0.99～0.999。RMSProp优化器学习率设置为0.001～0.1；

步骤S33、性能评估指标的选择：选择准确率作为训练阶段评价网络模型好坏的性能评估指标；

步骤S34、批处理大小选择：根据电磁信号训练集大小、训练用计算机内存大小，及内存与图形处理器之间的传输速率综合考虑，一般设置为2ⁱ(i＝7，8，9，...)；

步骤S35、训练轮数选择：训练轮数视训练样本大小及预期训练目标而定，一般设置为100～300轮，提前终止训练轮数设置为5～20；

步骤S36、网络模型训练：每一轮训练时将训练集打乱顺序并按批处理大小分为若干份输入至网络模型进行训练，利用损失函数和优化器对网络权重系数进行更新，每轮训练后将验证集数据输入网络模型获取模型准确率，以指导模型防止欠拟合或过拟合；当训练达到预设的训练轮数或损失值经过设定轮后不再降低时，训练中止。

进一步的，步骤S4具体方法为：

经过步骤S3训练后，得到最优化的深度长短时记忆网络模型。将经步骤1预处理的测试电磁信号样本输入至训练好的网络模型中，得到电磁信号所属信号类型的概率输出。

与现有技术相比，采用上述技术方案的有益效果为：采用本发明的技术方案，通过长短时记忆网络挖掘电磁信号长时关联特性，有效地避免了简单循环神经网络容易导致的梯度消失问题，具有较强的抗噪声、抗干扰能力，极大地提升了电磁信号识别效率和准确率。同时，该方法采用端对端的学习模式，将特征提取与分类两个步骤合二为一，通过自学习的方式自动提取基于信号特征及时域关联规律的高阶特征，无需先验知识及人工特征提取，实现了电磁信号识别过程的自动化、智能化，极大地提升了电磁信号识别的鲁棒性，及应对复杂电磁空间的适应性和可拓展性，解决了传统电磁识别方法的局限性。

附图说明

图1是本发明的基于深度长短时记忆网络的电磁信号识别全流程框架图；

图2是本发明的深度长短时记忆网络结构图；

图3是本发明的网络模型训练过程中损失值和准确率的学习曲线；

图4是本发明与传统电磁信号识别算法的识别混淆矩阵对比。

具体实施方式

下面结合附图对本发明做进一步描述。

本实施例的一种基于深度长短时记忆网络的电磁信号识别方法，以某批次实采电磁信号数据为例，实现流程如图1所示，具体实施步骤如下：

步骤1、电磁信号预处理：

带标签的电磁信号原始数据包含信号类型15类，信号个数合计577195个。

步骤1.1、去除野值：对每组原始电磁信号数据计算下四分位Q₁，上四分位Q₃，及四分位距IQR，判定小于Q1-3IQR或大于Q₁+3IQR的特征值为野值，并予以去除。

步骤1.2、划窗切片：对每组电磁信号序列数据，用划窗大小为128，以4为步进对原始电磁信号序列数据进行划窗切片，输出时间步为128的特征向量。经划窗切片处理后的样本总数为140037。

步骤1.3、数据集划分：将标记好标签的样本集随机打乱顺序，按9:1进行分层抽样，划分训练集和测试集。并将训练集按8:2进一步细分为训练集和验证集。最终训练集样本数为100826，验证集样本数25207，测试集样本数14004。

步骤1.4、归一化处理：计算训练样本均值μ和标准差σ，并保存。对训练集、验证集和测试集的特征向量X按X^*＝(X-μ)/σ进行归一化处理。

步骤2、构建深度长短时记忆网络结构，如图2所示：

步骤2.1、构建输入层：本实施例采用信号同相分量、正交分量作为输入特征。根据所选特征及脉冲时间步，输入层形状为128×2。

步骤2.2、构建长短时记忆层：本实施例选用2层的长短时记忆网络，2层长短时记忆层的单元输出空间维度均设置为128维。每层长短时记忆层输入前增加一层失活层，失活概率设置为0.2。第一层的所有时刻状态输出作为输入连接至第二层长短时记忆层。第二层长短时记忆层仅最后时刻的状态输出作为下一层全连接的输入。

步骤2.3、构建全连接输出层：全连接输出层神经元个数根据实施例的电磁信号类型设置为15。每个神经元采用非线性整流函数激活。通过指数平均(softmax)函数，获得分类信号类型标签及对应所属概率的输出。

步骤3、训练深度长短时记忆网络：

步骤3.1、损失函数选择：损失函数选择交叉熵损失函数。

步骤3.2、优化器的选择：本实施例选择Adam算法作为模型优化器，学习率设置为0.001，指数衰减率β₁设置为0.9，指数衰减率β₂设置为0.999。

步骤3.3、性能评估指标的选择：本实施例选择识别准确率作为训练阶段评价网络模型好坏的性能评估指标。

步骤3.4、批处理大小选择：本实施例批处理大小设置为128。

步骤3.5、训练轮数选择：本实施例训练轮数设置为200轮，提前终止训练轮数设置为5。

步骤3.6、网络模型训练：每一轮训练时将训练集打乱顺序并按批处理大小分为788份输入至网络模型进行训练，利用损失函数和优化器对网络权重系数进行更新，每轮训练后将验证集数据输入网络模型获取模型损失值与准确率，以指导模型训练防止模型欠拟合或过拟合。网络模型学习曲线如图3所示，左边是训练轮数和损失值的关系，右边是训练论数和准确率的关系，图中Training loss为训练损耗，Validation为验证损耗。由于损失值经过5轮后不再降低，总共训练轮数为70轮时训练终止。

步骤4、基于深度长短时记忆网络的电磁信号识别：

将电磁信号测试集样本输入到训练好的网络模型中，得到电磁信号样本所属电磁信号类型及概率的输出。根据测试集标签对识别的电磁信号类型进行评估，得到步骤3训练所得的网络模型在测试集上的识别准确率为98.8％，F1分数为98.8％。测试集信号识别结果统计报告如表1所示，本发明算法与传统电磁信号识别算法的识别混淆矩阵对比如图4所示。

本发明构建的深度长短时记忆网络模型与传统特征提取+支持向量机的分类模型识别对比结果如表2所示。两种方法均在前述同一批实采数据进行训练，训练样本数据以及所采用的预处理方式均相同。

表1 电磁信号识别结果统计报告

信号类型	准确率	查全率	F1分数	测试信号样本数
					A	1.00	1.00	1.00	204
B	1.00	1.00	1.00	119
					C	0.88	0.95	0.91	731
D	0.99	0.99	0.99	10017
					E	1.00	1.00	1.00	141
F	0.96	1.00	0.98	118
					G	1.00	0.81	0.90	144
H	1.00	1.00	1.00	97
					I	0.88	1.00	0.94	46
J	0.99	0.99	0.99	601
					K	1.00	1.00	1.00	41
L	1.00	0.87	0.93	47
					M	1.00	1.00	1.00	1239
N	1.00	1.00	1.00	312
					O	1.00	1.00	1.00	147
均值	0.99	0.99	0.99	14004

表2 本发明算法与传统算法识别性能对比

	准确率	查全率	F1分数
				对比算法	0.87	0.90	0.88
本发明算法	0.99	0.99	0.99

从图4可以看出，对比算法对电磁信号类型A、F、G、K识别率几乎为0，而本发明所提算法对A、F、K识别率几乎为100％，对类型G的识别也超过了80％。同时，从表2的对比统计结果也可以看出，本发明所提算法明显优于传统电磁信号识别算法，其中准确率提升了约12％，查全率提升了约9％，F1分数提升了约11％，验证了本发明所提算法的有效性、鲁棒性和优越性。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。如果本领域技术人员，在不脱离本发明的精神所做的非实质性改变或改进，都应该属于本发明权利要求保护的范围。

Claims

1.一种基于深度长短时记忆网络的电磁信号识别方法，其特征在于，包括：

步骤S2，根据电磁信号的输入特征向量，设置一个N层结构的深度神经网络模型，其中N＝4，5，6...，第一层为输入层，中间层为长短时记忆层，最后一层为全连接输出层，利用归一化指数函数作为最终输出，获得深度长短时记忆网络结构；

步骤S3、通过反向传播优化算法对损失函数进行迭代优化，并朝着损失函数减小的方向更新网络权重系数，当达到设置的迭代轮数或损失值经过设定迭代轮数不再降低时，停止对深度长短时记忆网络的训练，得到训练好的深度长短时记忆网络结构；

步骤S4、将待识别的电磁信号经步骤S1预处理后，输入至步骤S3获得的网络模型进行分类识别，得到识别结果。

2.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，

所述步骤S1包括以下过程：

步骤S11，将原始电磁信号序列按照数值由小到大进行排列，对应第25％的数值取为Q₁，对应第75％的数值取为Q₃，二者之差记为四分位距IQR＝Q₃-Q₁，将满足小于Q₁-3IQR或大于Q₃+3IQR的特征值判定为野值并去除；

步骤S12，划窗大小设置为n，以m为步进对原始电磁信号序列数据进行划窗切片，其中n＝2ⁱ，i＝1，2，3，...，m＝2^j，j＝0，1，2，...，输出长度为n的特征向量；

步骤S13，将标记好标签的样本集随机打乱顺序，按照一定划分比例将数据集划分为训练集、验证集和测试集；

步骤S14，获取训练样本均值μ和标准差σ，对待输入网络模型的特征向量X按

进行归一化处理。

3.如权利要求2所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，所述划分比例包括但不限于4∶1∶1。

4.如权利要求2所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，所述划分比例包括但不限于2∶1∶1。

5.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，所述步骤S2包括以下过程：

步骤S21、输入层由划窗大小n及特征向量的输入特征数k决定，形状为n×k；

步骤S22、长短时记忆层层数不低于2层，每层的单元个数由划窗大小n决定，每个单元的输出空间维度取2ⁱ维，其中i＝6，7，8，...，每个单元由输入门、遗忘门和输出门三种门结构构成；

f_t＝σ(W_f·(h_t-1，x_t)+b_f)

其中，W_f，b_f分别是遗忘门权重系数和遗忘门偏置系数；

2)单元存储信息更新由旧的单元状态c_t-1乘以遗忘门输出f_t和新候选输入门信息

的和生成：

3)输出门决定输出信息：使用Sigmoid激活函数决定要输出单元状态的部分信息，使用tanh激活函数处理单元状态，两部分的乘积构成输出值h_t：

σ_t＝σ(W_o·(h_t-1，x_t)+b_o)

h_t＝o_r·tanh(c_r)

其中，W_o，b_o分别是输出门的权重系数和偏置系数；

每层长短时记忆层输入前增加一层失活层；除最后一层长短时记忆层外，每一层的所有时刻状态输出作为输入连接至下一层长短时记忆层；最后一层长短时记忆层的最后时刻的状态输出作为下一层全连接输出层的输入，其余时刻的状态信息不输出；

步骤S23，全连接输出层的神经元个数由待识别电磁信号类型数目决定；每个神经元采用非线性整流函数激活，通过指数平均函数，获得分类结果的输出。

6.如权利要求5所述的基于深度长短时记忆网络的电磁信号识别方法，所述输入特征包括但不限于幅度分量、相位分量、同相分量、正交分量、全脉冲描述字的载频、重频、脉宽及脉幅中的一种或多种或全部。

7.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，步骤S3包括以下过程：

经步骤S2搭建好深度长短时记忆网络模型后，利用训练集和验证集对深度长短时记忆网络模型进行模型训练：

步骤S31、损失函数选择交叉熵损失函数；

步骤S32、选择Adam算法或者RMSProp算法做为优化器；

步骤S33、选择准确率作为训练阶段评价网络模型好坏的性能评估指标；

步骤S34、根据电磁信号训练集大小、训练用计算机内存大小，及内存与图形处理器之间的传输速率设定；

步骤S35、训练轮数视训练样本大小及预期训练目标而定；

步骤S36、每一轮训练时将训练集打乱顺序并按批处理大小分为若干份输入至网络模型进行训练，利用损失函数和优化器对网络权重系数进行更新，每轮训练后将验证集数据输入长短时记忆网络模型获取模型准确率，以指导模型防止欠拟合或过拟合；当训练达到预设的训练轮数或损失值经过设定轮数后不再降低时，训练中止。

8.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，Adam优化器学习率设置为0.001～0.1，指数衰减率β₁设置为0.9～0.99，指数衰减率β₂设置为0.99～0.999；RMSProp优化器学习率设置为0.001～0.1。

9.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，批处理大小选择设置为2ⁱ，i＝7，8，9，...。

10.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法，其特征在于，

训练轮数设置为100～300轮，提前终止训练轮数设置为5～20轮。