CN111553186A - 一种基于深度长短时记忆网络的电磁信号识别方法 - Google Patents
一种基于深度长短时记忆网络的电磁信号识别方法 Download PDFInfo
- Publication number
- CN111553186A CN111553186A CN202010146877.7A CN202010146877A CN111553186A CN 111553186 A CN111553186 A CN 111553186A CN 202010146877 A CN202010146877 A CN 202010146877A CN 111553186 A CN111553186 A CN 111553186A
- Authority
- CN
- China
- Prior art keywords
- layer
- training
- long
- input
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015654 memory Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000006870 function Effects 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 14
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000005457 optimization Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 8
- 210000004027 cell Anatomy 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000002779 inactivation Effects 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种基于深度长短时记忆网络的电磁信号识别方法,其方案为:将电磁信号序列数据进行野值去除、滑窗切片、归一化的预处理,作为输入特征向量;根据电磁信号的输入特征向量,设置一个深度长短时记忆网络模型,第一层为输入层,中间层为长短时记忆层,最后一层为全连接输出层,利用归一化指数函数作为最终输出;通过反向传播优化算法对损失函数进行迭代优化,并朝着损失函数减小的方向更新网络权重系数,获得用于电磁信号识别的网络模型;将待分类的电磁信号经预处理后,输入至网络模型进行分类识别,得到识别结果。本发明具有较强的抗噪声、抗干扰能力,提升了电磁信号识别效率和准确率;同时提升了电磁信号识别的鲁棒性和可扩展性。
Description
技术领域
本发明属于电磁信号识别技术领域,具体涉及一种基于深度长短时记忆网络的电磁信号识别方法。
背景技术
随着无线电业务的日益增多,以及各种新体制无线电设备层出不穷,使得电磁环境中的信号种类、数量越来越多,电磁频谱愈加拥挤,给无线电频谱监测带来了新的挑战。电磁信号识别作为无线电频谱监测的关键环节,及时、准确的电磁信号识别能够为稀有频谱资源的有效监测、合理利用提供强有力的支撑保障。
传统的电磁信号识别技术直接利用信号参数特征,采用特征参数匹配的方法与电磁信号识别数据库中的相应特征参数进行匹配,而识别出信号的属性。对于传统电磁信号,由于各个特征参数都基本恒定,因此特征参数匹配法有较好的识别效果。然而,随着新体制无线电设备的出现,电磁信号调制参数灵活多变,传统的电磁信号识别技术很难满足要求。
目前,电磁信号识别方法主要依靠人工方式进行信号特征提取进而实现分类识别。常见的电磁信号特征提取方法有时域分析法,频域分析法、瞬时自相关法、谱相关法和时频域分析法等。这些方法一般将电磁信号按照一定的变换后进行特征提取,通过分离度较高的特征向量实现电磁信号分类。而分类器的选择一般使用浅层机器学习方法,如常见的K最近邻法,支持向量机、决策树和浅层神经网络等。经过多年的积累,这些方法在电磁信号识别领域均取得了较好的识别效果。然而,现有的信号特征提取方法主要依赖领域专家对识别对象的深入认识及经验,需要花费大量的精力来完成提取且过程繁琐,难以实现信号识别自动化、智能化,对日益复杂的海量电磁信号数据适应能力差,可扩展性差。
近年来,深度学习技术因其优异的性能广泛用于计算机视觉和自然语言处理领域。深度学习技术没有显式的特征提取过程,直接把底层特征作为深度学习模型的输入,通过多层的非线性映射方式,提取抽象不变的高层属性特征,形成表征数据分布式的表示,相较于浅层机器学习模型具有更强的泛化能力,能刻画数据更加丰富的信息本质。因此,将深度学习技术用于电磁信号高层特征的自动提取与识别,将是电磁信号识别领域的一个研究热点。
发明内容
本发明针对传统电磁信号识别方法难以适从对新体制电磁信号识别的问题,提供了一种基于深度长短时记忆网络的电磁信号识别方法。
本发明采用的技术方案如下:一种基于深度长短时记忆网络的电磁信号识别方法,包括:
步骤S1,首先去除输入电磁信号中的野值,然后对电磁信号进行滑窗切片,再对电磁信号进行归一化处理,作为输入特征向量;
步骤S2,根据电磁信号的输入特征向量,设置一个N层结构的深度神经网络模型,其中N=4,5,6…,第一层为输入层,中间层为长短时记忆层,最后一层为全连接输出层,利用归一化指数函数(Softmax)作为最终输出;
步骤S3、训练深度长短时记忆网络:通过反向传播优化算法对损失函数进行迭代优化,并朝着损失函数减小的方向更新网络权重系数,当达到设置的迭代轮数或损失值经过设定迭代轮数不再降低时,停止对深度长短时记忆网络的训练,得到训练好的深度长短时记忆网络结构;
步骤S4、基于深度长短时记忆网络的电磁信号识别:将待识别的电磁信号经步骤S1预处理后,输入至步骤3获得的网络模型进行分类识别,得到识别结果。
进一步的,所述步骤S1包括以下过程:
步骤S11,将原始电磁信号序列按照数值由小到大进行排列,对应第25%的数值(下四分位点)取为Q1,对应第75%的数值(上四分位点)取为Q3,二者之差记为四分位距IQR=Q3-Q1,将满足小于Q1-3IQR或大于Q3+3IQR的特征值判定为野值并去除;
步骤S12,划窗大小设置为n,以m为步进对原始电磁信号序列数据进行划窗切片,其中n=2t,t=1,2,3,...,m=2j,j=0,1,2,...,输出长度为n的特征向量;
步骤S13,将标记好标签的样本集随机打乱顺序,按照一定划分比例将数据集划分为训练集、验证集和测试集;按照各类型电磁信号的占比进行分层抽样,以保留电磁信号类别比例;
步骤S14,获取训练样本均值μ和标准差σ,对待输入网络模型的特征向量X按X*=(X-μ)/σ进行归一化处理。
进一步的,所述划分比例包括但不限于4:1:1。
进一步的,所述划分比例包括但不限于2:1:1。
进一步的,所述步骤S2包括以下过程:
步骤S21、构建输入层:输入层由划窗大小n及特征向量的输入特征数k决定,形状为n×k;
步骤S22、构建长短时记忆层:长短时记忆层层数不低于2层,每层的单元个数由划窗大小n决定,每个单元的输出空间维度不低于64维,一般取2i(i=6,7,8,...)维,每个单元由输入门、遗忘门和输出门等三种门结构构成;
1)遗忘门通过Sigmoid函数激活,决定单元状态中的忘记信息,当前层的输入xt和上一层的输出ht-1作为输入,在t时刻的输出为:
ft=σ(Wf·(ht-1,xt)+bf)
其中,Wf,bf分别是遗忘门权重系数和遗忘门偏置系数;
2)单元存储信息更新由旧的单元状态Ct-1乘以遗忘门输出ft和新候选输入门信息it·Ct的和生成:
tr=σ(Wt·(ht-1,xt)+bt)
Cr=tanh(Wc·(ht-1,xt)+bc)
Cr=fr·Ct-1+tr·Ct
其中Wt,bi分别是输入门权重系数和输入门偏置系数;Wc,bc分别是单元状态权重系数和单元状态偏置系数;
3)输出门决定输出信息:使用Sigmoid激活函数决定要输出单元状态的部分信息,使用tanh激活函数处理单元状态,两部分的乘积构成输出值:
or=σ(Wo·(ht-1,xr)+bo)
hr=or·tanh(Cr)
其中,Wo,bo分别是输出门的权重系数和偏置系数;
每层长短时记忆层输入前增加一层失活层,失活概率包括但不限于0.1~0.6;除最后一层长短时记忆层外,每一层的所有时刻状态输出作为输入连接至下一层长短时记忆层。最后一层长短时记忆层的最后时刻的状态输出作为下一层全连接的输入,其余时刻的状态信息不输出;
步骤S23、构建全连接输出层:全连接输出层的神经元个数由待识别电磁信号类型数目决定;每个神经元采用非线性整流(ReLu)函数激活。通过指数平均(Softmax)函数,获得分类结果的输出。
进一步的,所述输入特征包括但不限于幅度分量、相位分量、同相分量、正交分量、全脉冲描述字的载频、重频、脉宽及脉幅等,特征的选择可以是其中的一种,也可以是多种或全部。
进一步的,步骤S3的具体方法为:
经步骤2搭建好深度长短时记忆网络模型后,利用训练集和验证集对该模型进行模型训练:
步骤S31、损失函数选择:损失函数选择交叉熵损失函数;
步骤S32、优化器的选择:可选的优化器包括但不限于Adam算法、RMSProp算法;Adam优化器学习率设置为0.001~0.1,指数衰减率β1设置为0.9~0.99,指数衰减率β2设置为0.99~0.999。RMSProp优化器学习率设置为0.001~0.1;
步骤S33、性能评估指标的选择:选择准确率作为训练阶段评价网络模型好坏的性能评估指标;
步骤S34、批处理大小选择:根据电磁信号训练集大小、训练用计算机内存大小,及内存与图形处理器之间的传输速率综合考虑,一般设置为2i(i=7,8,9,...);
步骤S35、训练轮数选择:训练轮数视训练样本大小及预期训练目标而定,一般设置为100~300轮,提前终止训练轮数设置为5~20;
步骤S36、网络模型训练:每一轮训练时将训练集打乱顺序并按批处理大小分为若干份输入至网络模型进行训练,利用损失函数和优化器对网络权重系数进行更新,每轮训练后将验证集数据输入网络模型获取模型准确率,以指导模型防止欠拟合或过拟合;当训练达到预设的训练轮数或损失值经过设定轮后不再降低时,训练中止。
进一步的,步骤S4具体方法为:
经过步骤S3训练后,得到最优化的深度长短时记忆网络模型。将经步骤1预处理的测试电磁信号样本输入至训练好的网络模型中,得到电磁信号所属信号类型的概率输出。
与现有技术相比,采用上述技术方案的有益效果为:采用本发明的技术方案,通过长短时记忆网络挖掘电磁信号长时关联特性,有效地避免了简单循环神经网络容易导致的梯度消失问题,具有较强的抗噪声、抗干扰能力,极大地提升了电磁信号识别效率和准确率。同时,该方法采用端对端的学习模式,将特征提取与分类两个步骤合二为一,通过自学习的方式自动提取基于信号特征及时域关联规律的高阶特征,无需先验知识及人工特征提取,实现了电磁信号识别过程的自动化、智能化,极大地提升了电磁信号识别的鲁棒性,及应对复杂电磁空间的适应性和可拓展性,解决了传统电磁识别方法的局限性。
附图说明
图1是本发明的基于深度长短时记忆网络的电磁信号识别全流程框架图;
图2是本发明的深度长短时记忆网络结构图;
图3是本发明的网络模型训练过程中损失值和准确率的学习曲线;
图4是本发明与传统电磁信号识别算法的识别混淆矩阵对比。
具体实施方式
下面结合附图对本发明做进一步描述。
本实施例的一种基于深度长短时记忆网络的电磁信号识别方法,以某批次实采电磁信号数据为例,实现流程如图1所示,具体实施步骤如下:
步骤1、电磁信号预处理:
带标签的电磁信号原始数据包含信号类型15类,信号个数合计577195个。
步骤1.1、去除野值:对每组原始电磁信号数据计算下四分位Q1,上四分位Q3,及四分位距IQR,判定小于Q1-3IQR或大于Q1+3IQR的特征值为野值,并予以去除。
步骤1.2、划窗切片:对每组电磁信号序列数据,用划窗大小为128,以4为步进对原始电磁信号序列数据进行划窗切片,输出时间步为128的特征向量。经划窗切片处理后的样本总数为140037。
步骤1.3、数据集划分:将标记好标签的样本集随机打乱顺序,按9:1进行分层抽样,划分训练集和测试集。并将训练集按8:2进一步细分为训练集和验证集。最终训练集样本数为100826,验证集样本数25207,测试集样本数14004。
步骤1.4、归一化处理:计算训练样本均值μ和标准差σ,并保存。对训练集、验证集和测试集的特征向量X按X*=(X-μ)/σ进行归一化处理。
步骤2、构建深度长短时记忆网络结构,如图2所示:
步骤2.1、构建输入层:本实施例采用信号同相分量、正交分量作为输入特征。根据所选特征及脉冲时间步,输入层形状为128×2。
步骤2.2、构建长短时记忆层:本实施例选用2层的长短时记忆网络,2层长短时记忆层的单元输出空间维度均设置为128维。每层长短时记忆层输入前增加一层失活层,失活概率设置为0.2。第一层的所有时刻状态输出作为输入连接至第二层长短时记忆层。第二层长短时记忆层仅最后时刻的状态输出作为下一层全连接的输入。
步骤2.3、构建全连接输出层:全连接输出层神经元个数根据实施例的电磁信号类型设置为15。每个神经元采用非线性整流函数激活。通过指数平均(softmax)函数,获得分类信号类型标签及对应所属概率的输出。
步骤3、训练深度长短时记忆网络:
步骤3.1、损失函数选择:损失函数选择交叉熵损失函数。
步骤3.2、优化器的选择:本实施例选择Adam算法作为模型优化器,学习率设置为0.001,指数衰减率β1设置为0.9,指数衰减率β2设置为0.999。
步骤3.3、性能评估指标的选择:本实施例选择识别准确率作为训练阶段评价网络模型好坏的性能评估指标。
步骤3.4、批处理大小选择:本实施例批处理大小设置为128。
步骤3.5、训练轮数选择:本实施例训练轮数设置为200轮,提前终止训练轮数设置为5。
步骤3.6、网络模型训练:每一轮训练时将训练集打乱顺序并按批处理大小分为788份输入至网络模型进行训练,利用损失函数和优化器对网络权重系数进行更新,每轮训练后将验证集数据输入网络模型获取模型损失值与准确率,以指导模型训练防止模型欠拟合或过拟合。网络模型学习曲线如图3所示,左边是训练轮数和损失值的关系,右边是训练论数和准确率的关系,图中Training loss为训练损耗,Validation为验证损耗。由于损失值经过5轮后不再降低,总共训练轮数为70轮时训练终止。
步骤4、基于深度长短时记忆网络的电磁信号识别:
将电磁信号测试集样本输入到训练好的网络模型中,得到电磁信号样本所属电磁信号类型及概率的输出。根据测试集标签对识别的电磁信号类型进行评估,得到步骤3训练所得的网络模型在测试集上的识别准确率为98.8%,F1分数为98.8%。测试集信号识别结果统计报告如表1所示,本发明算法与传统电磁信号识别算法的识别混淆矩阵对比如图4所示。
本发明构建的深度长短时记忆网络模型与传统特征提取+支持向量机的分类模型识别对比结果如表2所示。两种方法均在前述同一批实采数据进行训练,训练样本数据以及所采用的预处理方式均相同。
表1 电磁信号识别结果统计报告
信号类型 | 准确率 | 查全率 | F1分数 | 测试信号样本数 |
A | 1.00 | 1.00 | 1.00 | 204 |
B | 1.00 | 1.00 | 1.00 | 119 |
C | 0.88 | 0.95 | 0.91 | 731 |
D | 0.99 | 0.99 | 0.99 | 10017 |
E | 1.00 | 1.00 | 1.00 | 141 |
F | 0.96 | 1.00 | 0.98 | 118 |
G | 1.00 | 0.81 | 0.90 | 144 |
H | 1.00 | 1.00 | 1.00 | 97 |
I | 0.88 | 1.00 | 0.94 | 46 |
J | 0.99 | 0.99 | 0.99 | 601 |
K | 1.00 | 1.00 | 1.00 | 41 |
L | 1.00 | 0.87 | 0.93 | 47 |
M | 1.00 | 1.00 | 1.00 | 1239 |
N | 1.00 | 1.00 | 1.00 | 312 |
O | 1.00 | 1.00 | 1.00 | 147 |
均值 | 0.99 | 0.99 | 0.99 | 14004 |
表2 本发明算法与传统算法识别性能对比
准确率 | 查全率 | F1分数 | |
对比算法 | 0.87 | 0.90 | 0.88 |
本发明算法 | 0.99 | 0.99 | 0.99 |
从图4可以看出,对比算法对电磁信号类型A、F、G、K识别率几乎为0,而本发明所提算法对A、F、K识别率几乎为100%,对类型G的识别也超过了80%。同时,从表2的对比统计结果也可以看出,本发明所提算法明显优于传统电磁信号识别算法,其中准确率提升了约12%,查全率提升了约9%,F1分数提升了约11%,验证了本发明所提算法的有效性、鲁棒性和优越性。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。如果本领域技术人员,在不脱离本发明的精神所做的非实质性改变或改进,都应该属于本发明权利要求保护的范围。
Claims (10)
1.一种基于深度长短时记忆网络的电磁信号识别方法,其特征在于,包括:
步骤S1,首先去除输入电磁信号中的野值,然后对电磁信号进行滑窗切片,再对电磁信号进行归一化处理,作为输入特征向量;
步骤S2,根据电磁信号的输入特征向量,设置一个N层结构的深度神经网络模型,其中N=4,5,6...,第一层为输入层,中间层为长短时记忆层,最后一层为全连接输出层,利用归一化指数函数作为最终输出,获得深度长短时记忆网络结构;
步骤S3、通过反向传播优化算法对损失函数进行迭代优化,并朝着损失函数减小的方向更新网络权重系数,当达到设置的迭代轮数或损失值经过设定迭代轮数不再降低时,停止对深度长短时记忆网络的训练,得到训练好的深度长短时记忆网络结构;
步骤S4、将待识别的电磁信号经步骤S1预处理后,输入至步骤S3获得的网络模型进行分类识别,得到识别结果。
2.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,
所述步骤S1包括以下过程:
步骤S11,将原始电磁信号序列按照数值由小到大进行排列,对应第25%的数值取为Q1,对应第75%的数值取为Q3,二者之差记为四分位距IQR=Q3-Q1,将满足小于Q1-3IQR或大于Q3+3IQR的特征值判定为野值并去除;
步骤S12,划窗大小设置为n,以m为步进对原始电磁信号序列数据进行划窗切片,其中n=2i,i=1,2,3,...,m=2j,j=0,1,2,...,输出长度为n的特征向量;
步骤S13,将标记好标签的样本集随机打乱顺序,按照一定划分比例将数据集划分为训练集、验证集和测试集;
3.如权利要求2所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,所述划分比例包括但不限于4∶1∶1。
4.如权利要求2所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,所述划分比例包括但不限于2∶1∶1。
5.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,所述步骤S2包括以下过程:
步骤S21、输入层由划窗大小n及特征向量的输入特征数k决定,形状为n×k;
步骤S22、长短时记忆层层数不低于2层,每层的单元个数由划窗大小n决定,每个单元的输出空间维度取2i维,其中i=6,7,8,...,每个单元由输入门、遗忘门和输出门三种门结构构成;
1)遗忘门通过Sigmoid函数激活,决定单元状态中的忘记信息,当前层的输入xt和上一层的输出ht-1作为输入,在t时刻的输出为:
ft=σ(Wf·(ht-1,xt)+bf)
其中,Wf,bf分别是遗忘门权重系数和遗忘门偏置系数;
其中Wt,bi分别是输入门权重系数和输入门偏置系数;Wc,bc分别是单元状态权重系数和单元状态偏置系数;
3)输出门决定输出信息:使用Sigmoid激活函数决定要输出单元状态的部分信息,使用tanh激活函数处理单元状态,两部分的乘积构成输出值ht:
σt=σ(Wo·(ht-1,xt)+bo)
ht=or·tanh(cr)
其中,Wo,bo分别是输出门的权重系数和偏置系数;
每层长短时记忆层输入前增加一层失活层;除最后一层长短时记忆层外,每一层的所有时刻状态输出作为输入连接至下一层长短时记忆层;最后一层长短时记忆层的最后时刻的状态输出作为下一层全连接输出层的输入,其余时刻的状态信息不输出;
步骤S23,全连接输出层的神经元个数由待识别电磁信号类型数目决定;每个神经元采用非线性整流函数激活,通过指数平均函数,获得分类结果的输出。
6.如权利要求5所述的基于深度长短时记忆网络的电磁信号识别方法,所述输入特征包括但不限于幅度分量、相位分量、同相分量、正交分量、全脉冲描述字的载频、重频、脉宽及脉幅中的一种或多种或全部。
7.如权利要求1所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,步骤S3包括以下过程:
经步骤S2搭建好深度长短时记忆网络模型后,利用训练集和验证集对深度长短时记忆网络模型进行模型训练:
步骤S31、损失函数选择交叉熵损失函数;
步骤S32、选择Adam算法或者RMSProp算法做为优化器;
步骤S33、选择准确率作为训练阶段评价网络模型好坏的性能评估指标;
步骤S34、根据电磁信号训练集大小、训练用计算机内存大小,及内存与图形处理器之间的传输速率设定;
步骤S35、训练轮数视训练样本大小及预期训练目标而定;
步骤S36、每一轮训练时将训练集打乱顺序并按批处理大小分为若干份输入至网络模型进行训练,利用损失函数和优化器对网络权重系数进行更新,每轮训练后将验证集数据输入长短时记忆网络模型获取模型准确率,以指导模型防止欠拟合或过拟合;当训练达到预设的训练轮数或损失值经过设定轮数后不再降低时,训练中止。
8.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,Adam优化器学习率设置为0.001~0.1,指数衰减率β1设置为0.9~0.99,指数衰减率β2设置为0.99~0.999;RMSProp优化器学习率设置为0.001~0.1。
9.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,批处理大小选择设置为2i,i=7,8,9,...。
10.如权利要求7所述的基于深度长短时记忆网络的电磁信号识别方法,其特征在于,
训练轮数设置为100~300轮,提前终止训练轮数设置为5~20轮。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010146877.7A CN111553186A (zh) | 2020-03-05 | 2020-03-05 | 一种基于深度长短时记忆网络的电磁信号识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010146877.7A CN111553186A (zh) | 2020-03-05 | 2020-03-05 | 一种基于深度长短时记忆网络的电磁信号识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111553186A true CN111553186A (zh) | 2020-08-18 |
Family
ID=72000032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010146877.7A Pending CN111553186A (zh) | 2020-03-05 | 2020-03-05 | 一种基于深度长短时记忆网络的电磁信号识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111553186A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329625A (zh) * | 2020-11-05 | 2021-02-05 | 中国科学技术大学 | 一种基于深度学习的刀具磨损状态实时识别方法及模型 |
CN112529035A (zh) * | 2020-10-30 | 2021-03-19 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 识别不同电台个体种类的智能识别方法 |
CN112861790A (zh) * | 2021-03-10 | 2021-05-28 | 西南交通大学 | 一种基于深度学习的电磁探测网络组网方式识别方法 |
CN113156320A (zh) * | 2021-03-12 | 2021-07-23 | 山东大学 | 基于深度学习的锂离子电池soc估计方法及系统 |
CN115567356A (zh) * | 2022-09-30 | 2023-01-03 | 中国人民解放军国防科技大学 | 基于两层级联卷积神经网络的电磁信号识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108712397A (zh) * | 2018-04-28 | 2018-10-26 | 天津大学 | 基于深度学习的通信协议识别方法 |
CN109657604A (zh) * | 2018-12-17 | 2019-04-19 | 中国人民解放军战略支援部队信息工程大学 | 基于循环神经网络的卫星幅相信号识别解调方法及装置 |
-
2020
- 2020-03-05 CN CN202010146877.7A patent/CN111553186A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108712397A (zh) * | 2018-04-28 | 2018-10-26 | 天津大学 | 基于深度学习的通信协议识别方法 |
CN109657604A (zh) * | 2018-12-17 | 2019-04-19 | 中国人民解放军战略支援部队信息工程大学 | 基于循环神经网络的卫星幅相信号识别解调方法及装置 |
Non-Patent Citations (1)
Title |
---|
张云开: "复杂电磁环境下的调制方式识别与参数估计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529035A (zh) * | 2020-10-30 | 2021-03-19 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 识别不同电台个体种类的智能识别方法 |
CN112329625A (zh) * | 2020-11-05 | 2021-02-05 | 中国科学技术大学 | 一种基于深度学习的刀具磨损状态实时识别方法及模型 |
CN112861790A (zh) * | 2021-03-10 | 2021-05-28 | 西南交通大学 | 一种基于深度学习的电磁探测网络组网方式识别方法 |
CN112861790B (zh) * | 2021-03-10 | 2022-03-11 | 西南交通大学 | 一种基于深度学习的电磁探测网络组网方式识别方法 |
CN113156320A (zh) * | 2021-03-12 | 2021-07-23 | 山东大学 | 基于深度学习的锂离子电池soc估计方法及系统 |
CN113156320B (zh) * | 2021-03-12 | 2023-05-30 | 山东大学 | 基于深度学习的锂离子电池soc估计方法及系统 |
CN115567356A (zh) * | 2022-09-30 | 2023-01-03 | 中国人民解放军国防科技大学 | 基于两层级联卷积神经网络的电磁信号识别方法 |
CN115567356B (zh) * | 2022-09-30 | 2024-05-07 | 中国人民解放军国防科技大学 | 基于两层级联卷积神经网络的电磁信号识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111553186A (zh) | 一种基于深度长短时记忆网络的电磁信号识别方法 | |
CN109620152B (zh) | 一种基于MutiFacolLoss-Densenet的心电信号分类方法 | |
CN107392241B (zh) | 一种基于加权列抽样XGBoost的图像目标分类方法 | |
CN107944410B (zh) | 一种基于卷积神经网络的跨领域面部特征解析方法 | |
CN109142946A (zh) | 基于蚁群算法优化随机森林的变压器故障检测方法 | |
CN110942091B (zh) | 寻找可靠的异常数据中心的半监督少样本图像分类方法 | |
CN111414461A (zh) | 一种融合知识库与用户建模的智能问答方法及系统 | |
CN106485089B (zh) | 谐波用户典型工况的区间参数获取方法 | |
CN113887643B (zh) | 一种基于伪标签自训练和源域再训练的新对话意图识别方法 | |
CN110990718B (zh) | 一种公司形象提升系统的社会网络模型构建模块 | |
CN111461025B (zh) | 一种自主进化的零样本学习的信号识别方法 | |
CN109948726B (zh) | 一种基于深度森林的电能质量扰动分类方法 | |
CN110750645A (zh) | 基于对抗训练的跨领域虚假评论识别方法 | |
CN116910571B (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
Perner | How to interpret decision trees? | |
CN113269647A (zh) | 基于图的交易异常关联用户检测方法 | |
CN108596204B (zh) | 一种基于改进型scdae的半监督调制方式分类模型的方法 | |
CN111191033B (zh) | 一种基于分类效用的开集分类方法 | |
CN116524960A (zh) | 一种基于混合熵下采样和集成分类器的语音情感识别系统 | |
CN115344693A (zh) | 一种基于传统算法和神经网络算法融合的聚类方法 | |
Jeyakarthic et al. | Optimal bidirectional long short term memory based sentiment analysis with sarcasm detection and classification on twitter data | |
CN113283519A (zh) | 一种基于离散系数的深度神经网络近似模型分析方法 | |
CN117131436A (zh) | 面向开放环境的辐射源个体识别方法 | |
CN115828100A (zh) | 基于深度神经网络的手机辐射源频谱图类别增量学习方法 | |
CN113010673A (zh) | 一种基于熵优化支持向量机的漏洞自动分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200818 |