CN115032602A - 一种基于多尺度卷积胶囊网络的雷达目标识别方法 - Google Patents
一种基于多尺度卷积胶囊网络的雷达目标识别方法 Download PDFInfo
- Publication number
- CN115032602A CN115032602A CN202210391547.3A CN202210391547A CN115032602A CN 115032602 A CN115032602 A CN 115032602A CN 202210391547 A CN202210391547 A CN 202210391547A CN 115032602 A CN115032602 A CN 115032602A
- Authority
- CN
- China
- Prior art keywords
- capsule
- hrrp
- layer
- network
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/41—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
- G01S7/411—Identification of targets based on measurements of radar reflectivity
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/41—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
- G01S7/417—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section involving the use of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度卷积胶囊网络的雷达目标识别方法,利用改进的深度学习网络即多尺度卷积胶囊网络对目标HRRP进行识别分类,融合了泛化能力强的网络来充分捕捉HRRP中有效的结构信息,在构建复杂模型的同时还优化了网络中的参数,实现更快的收敛和更高的识别性能,基于CNN获取局部结构信息的能力和Inception结构,提出了多尺度CNN结构,从多个角度详细捕捉HRRP目标的不同层次的可分信息,增加了网络的稀疏性。同时将更鲁棒的胶囊网络作为CNN的补充,弥补了CNN难以体现目标HRRP序列结构信息的不足,以更强的拟合能力在雷达HRRP识别领域发挥更大的优势。
Description
技术领域
本发明属于雷达目标识别领域,具体的讲,涉及一种基于多尺度卷积和胶囊网络的雷达目标识别方法。
背景技术
随着雷达技术的不断成熟,早期基于诸如统计模型、流行学习以及核方法的大部分传统HRRP识别方法已经能够获取目标强散射点的分布并进行识别分类,但是大多数的传统方法基于全连接结构进行分帧建模,遗漏了帧间关联信息,无法捕获反映HRRP特性的结构信息,同时还对目标数据的完备程度要求较高,然而在实际环境中的识别对象通常是非合作的目标,采集到的样本角域信息不完整,数据的分布无法达到实验理想状态,从而增加了在特征提取过程中对研究者经验的依赖性。近些年深度学习算法的盛兴,改变了传统的全连接结构,可以自动获取HRRP数据中蕴含的深层次特征。
对HRRP目标特征的学习与提取是雷达目标识别过程中举足轻重的一个环节。传统的HRRP特征提取方法主要分为两大部分:(1)基于变换(Transformer)的特征提取方法,如谱图,频谱幅度特征等。这些方法都是将HRRP信号投影到频域,之后对其频域特征进行建模识别。(2)基于降维后的数据,进行特征提取的方法。虽然传统特征提取方法有很好的识别性能,但是这些方法大多是无监督且有损的,并且特征提取方法的选择高度依赖科研人员对数据的认识和经验,因此,很多情况下,难以达到好的效果。近年来,随着深度学习的发展,基于深度学习的方法逐渐被引入到了雷达目标识别中。
发明内容
针对以上传统方法的不足和HRRP数据的特点,本发明提供了一种基于多尺度卷积胶囊网络的雷达目标识别方法。
本文利用改进的深度学习网络即多尺度卷积胶囊网络对目标HRRP进行识别分类,融合了泛化能力强的网络来充分捕捉HRRP中有效的结构信息,在构建复杂模型的同时还优化了网络中的参数,实现更快的收敛和更高的识别性能,基于CNN获取局部结构信息的能力和Inception结构,提出了多尺度CNN结构,从多个角度详细捕捉HRRP目标的不同层次的可分信息,增加了网络的稀疏性。同时将更鲁棒的胶囊网络作为CNN的补充,弥补了CNN难以体现目标HRRP序列结构信息的不足,以更强的拟合能力在雷达HRRP识别领域发挥更大的优势。
本发明使用多尺度卷积胶囊网络,使模型具备一定深度。按这种方式组织的模型可以更好的依赖数据逐步抽象出高层的结构特征,构建了多尺度卷积模块取代堆叠的深度卷积层来增加网络的稀疏性,不仅拓宽了网络层,还增强了对不同尺度结构的适用性,在一定程度上控制网络的计算量与参数量同时还确保了较高特征提取性能。基础胶囊层构建了用于表达HRRP不同特征间的空间关系的向量胶囊,并通过动态路由的方式将特征传递给高层次的预测胶囊进行分类。由于CNN中的池化操作会丢失HRRP样本中相关的位置信息,因此该模块在卷积获取胶囊特征后利用动态路由机制的全连接层传输向量特征,进一步探索HRRP样本中不同属性的关系,以向量输出的形式实现更好的分类。
一种基于多尺度卷积胶囊网络的雷达目标识别方法,包括以下步骤:
S1:数据集采集。
S2:对数据集中的样本进行预处理。
S3:将预处理后的HRRP样本输入到多尺度卷积模块进行特征提取;
S4:将S3得到的特征传入一个卷积层和ReLU激活层进行处理,之后将得到的高维特征传入胶囊网络模块,在卷积获取胶囊特征后通过动态路由机制将基础胶囊中保存的HRRP特征转化为更全面的整体特征,并传递给表示HRRP目标类别的预测胶囊层进行分类。为了避免全连接的路由机制引起过拟合现象,引入dropout方法,丢弃了部分无效的向量神经元的传递,进一步探索HRRP样本中不同属性的关系,以向量输出的形式实现更好的分类;
S5:搭建重构模块,将预测胶囊层中单位长度最大的高级胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据;
S6:通过经过S2处理后的数据集对由多尺度卷积模块、胶囊网络模块构建的多尺度卷积胶囊网络进行训练。
进一步的,S1详细步骤为:
将雷达采集到的HRRP数据集依据目标的种类进行合并,每种种类的样本分别在不同的数据段里选择训练样本和测试样本,在训练集和测试集的选取过程中,保证所选取的训练集样本与雷达所成姿态涵盖测试集样本与雷达所成的姿态。各类目标训练集和测试集样本数的比例为7:3。
进一步的,所述S2详细步骤为:
优选地,所述S3详细步骤为:
S3.1:将经过预处理的HRRP样本输入到多尺度卷积模块之中,所述的多尺度卷积模块包含了3个堆叠的特征提取子块和1个全连接层,其中,每一个特征提取子块均由相同的网络层组成,包含了卷积层、批归一化以及激活层,再经过一个全连接层进行特征映射,通过全连接层输出的最大值来判定输入HRRP样本的目标类别。
多尺度卷积模块中特征提取子块共包含了K个同步处理的卷积核,步长均设置为2,补零层则用0填充以增加稀疏性,样本通过第k1个不同尺度的卷积核运算输出的多层次位置特征表示为其中D代表通道数,W代表特征的宽。
S3.2:卷积层后的数据需要进一步处理,为了使模型易于收敛,网络训练过程更加稳定,在卷积之后加入了批归一化,通过计算每个mini_batch中数据的均值和方差,假设一个小批次中有Nm个HRRP样本,那么定义输出为其中Fn表示第n个HRRP样本对应的卷积输出,在每个小批次中,对中的HRRP数据进行批归一化得到表示为:
其中,Fn(k,l)表示批归一化之前的HRRP样本对应的卷积层输出中,第k个通道中的第l个元素,即为批归一化之后的HRRP数据,αk和βk为可训练的对应于第k个通道的参数,ε是一个很小的数,为了防止除数为0,E(.)为求均值操作,Var(.)表示求方差操作;
多层次的特征F(k1)分别经过批归一化调整分布和激活层的非线性映射后,融合为多个不同层次的特征得到最终的输出特征图Fm,可表示为:
Fm=[F(1),F(2),...,F(k)]
其中[·]表示拼接起来的各层特征,此时D×K的值表示特征图的高,与特征图的宽W大小相等。也就是说多尺度卷积模块提取得到的特征图可以看作是正方形的图片,能够用于后续网络模块进一步提取HRRP样本的包络特征信息。
优选地,所述S4详细步骤为:
S4.1:将多尺度卷积模块的输出再经过一个卷积层和ReLU激活层处理,在获取多尺度卷积模块提取到的位置特征中的局部层次信息的同时将其映射到更高维的空间,通道数从1转换为256,以便于传输向量形式的胶囊特征。
S4.2:胶囊网络模块由初级胶囊层和预测胶囊层组成,首先将上步输出传入初级胶囊层,将上步输出中每八个卷积特征节点堆叠成一个基础胶囊特征,记作即1×8形式的向量神经元,同时得到32个通道,每一个通道输出64(8×8)个长度为8的基础胶囊,因此初级胶囊层一共包含了2048(8×8×32)个基础胶囊。
S4.3:将初级胶囊层记作胶囊网络模块的第l1层,将第l1层堆叠后的第n1个胶囊记作其中n1=1,2,…,2048,路由过程中的预测胶囊层记作l1+1层,该层输出的第m(m=0,1,2)个预测胶囊记作vm。首先经过转化矩阵Wnm得到向量可表示为:
为了使最终得到的胶囊包含丰富精准的全局特征表示,使用非线性激活函数squash将向量sm的模值分布在0-1之间,最后输出用于分类的预测胶囊vm,且输出vm的长度||vm||表示某一类HRRP目标存在的概率,vm的方向则表示样本组件中的不同特征信息。l+1层输出的预测胶囊vm由以下式子计算得到:
通过不断迭代调整bnm来更新网络的权重参数cnm。bnm的更新方式由以下式子表示:
优选地,所述S5详细步骤为:
重构模块可以看作一个解码器,用于将HRRP样本正确分类的输出结果还原成初始的输入,也就是输出维度为256的向量,并参与整个多尺度卷积胶囊网络的训练,用于辅助对照HRRP分类的结果。具体地说,将预测胶囊层中单位长度最大的胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据。
优选地,所述S6详细步骤为:
S6.1:多尺度卷积胶囊网络的总损失由胶囊分类损失Ld与重构损失Lrec两部分构成,并且损失Ld起主导作用,表达式如下:
Loss总=Ld+Lrec
胶囊形式使多个分类能够同时存在,所以多尺度卷积胶囊网络的训练过程由MarginLoss作为损失函数Ld,由每个预测胶囊的损失相加得到,表达式为:
Ld=Ydmax(0,m+-||vd||)2+λ(1-Yd)max(0,||vd||-m-)2
其中d表示HRRP目标类别,Yd是表示训练中的分类标签,m+、m-为固定的超参数,分别设置为0.9、0.1,λ是防止网络求解局部最优的系数,设置为0.5。当训练过程中预测胶囊匹配到正确的HRRP样本d时,Yd=1,并且在这个预测胶囊预测的概率超过0.9时损失置零,当概率低于0.9时计算得到相应的损失值进行优化;同样地,预测胶囊匹配到错误的HRRP样本时,也就是样本中不存在类别d,则Yd=0。上述过程实际上是对每个预测胶囊进行了二分类的操作,同时引入参数λ保证了网络训练过程的稳定性。
重构模块中解码过程的重构损失Lrec表示的是输入HRRP样本和重构数据之间的差距,本发明将两者间的欧氏距离作为重构损失,并加入整个多尺度卷积胶囊网络的损失一起训练网络的参数,其表达式如下:
其中hic表示初始HRRP样本,hir表示重构数据,α是缩放系数,并设置为0.0005,使胶囊分类损失在总损失中占主导的地位。
因此,多尺度卷积胶囊网络总损失函数可由下式定义:
S6.2:初始化所有待训练的权重及偏置,设置训练参数,包括学习率、batch_size、训练批次,对模型进行训练。
本发明的有益效果是:
1、本发明构建了多尺度卷积块取代堆叠的深度卷积层来增加网络的稀疏性,不仅拓宽了网络层,还增强了对不同尺度结构的适用性,在一定程度上控制网络的计算量与参数量同时还确保了较高特征提取性能。把拥有不同尺寸大小卷积核的卷积层作为滑动窗口用于提取不同层次的HRRP位置特征,并将不同感受野的位置特征合并成一整张特征图供后续模块使用。其中不同的卷积核参数均由网络训练得到,并应用于测试阶段的HRRP特征提取,弥补了传统的胶囊网络仅使用一个卷积层提取样本特征不全面的缺点,提高了后续基础胶囊构建的质量。
2、胶囊网络模块中的基础胶囊层本质上是一个卷积算法-胶囊层,其主要功能是将卷积层的特征转换为胶囊特征,也就是将神经元由标量的形式调整成可用于胶囊特征传输的向量形式,而不是卷积神经网络那样的标量输入与标量输出。每个基础胶囊都将以矢量形态呈现,用于表示HRRP样本的一种实例特征信息,与卷积神经网络获取得到的特征表示的结构组件类似,我们使用基础胶囊作为提取特征的结构组件,这些结构组件所表示的不同类型飞机的实例化参数正是由输入基础胶囊层的标量神经元来描述。用于描述HRRP样本中某个实例化信息(机舱、机翼、机棚或者机尾等)的矢量胶囊,由八个标量构成,即长度为8。这样每个基础胶囊中就涵盖了样本中八种不同的特征属性,比如目标飞机方向、速度、尺寸以及边缘属性等。这样的向量表示方式就能描述概括出不同类型飞机的某个实例化信息,丰富了特征的描述信息,不仅能表示是否拥有某种实例特征,还能够表示HRRP样本间类似的特征属性。
3、预测胶囊层可看作是一个线性层,主要通过动态路由机制将基础胶囊中保存的HRRP特征转化为更全面的整体特征,并传递给表示HRRP目标类别的高层预测胶囊进行分类。每一个预测胶囊与上一层的基础胶囊以全连接的形式相连,并且都是向量形式的输出,对应一种HRRP目标的分类结果。此外,为了避免全连接的路由机制引起过拟合现象,我们引入了dropout方法,丢弃了部分无效的向量神经元的传递,消除减弱了神经元节点间的联合适应性,增强了泛化能力。
附图说明
图1本发明实施例的步骤流程图。
具体实施方式
参照图1,为本发明的一种基于多尺度卷积和胶囊网络的雷达高分辨距离像识别方法技术流程图,具体实施步骤如下:
S1:数据集采集。
将雷达采集到的HRRP数据集依据目标的种类进行合并,每种种类的样本分别在不同的数据段里选择训练样本和测试样本,在训练集和测试集的选取过程中,保证所选取的训练集样本与雷达所成姿态涵盖测试集样本与雷达所成的姿态。各类目标训练集和测试集样本数的比例为7:3。
S2:对数据集中的样本进行预处理。
原始HRRP样本经过强度归一化和重心对齐法处理之后幅值已经被限制在0-1之间,不仅统一了尺度,而且在0-1之间的数值非常有利于后续的神经网络处理;分布偏右或偏左的HRRP回波信号都被调整到了中心点附近。
S3:将预处理后的HRRP样本输入到多尺度卷积模块进行特征提取;
S3.1:将经过预处理的HRRP样本输入到多尺度卷积模块之中,所述的多尺度卷积模块包含了3个堆叠的特征提取子块和1个全连接层,其中,每一个特征提取子块均由相同的网络层组成,包含了卷积层、批归一化以及激活层,再经过一个全连接层进行特征映射,通过全连接层输出的最大值来判定输入HRRP样本的目标类别。
多尺度卷积模块中特征提取子块共包含了K个同步处理的卷积核,步长均设置为2,补零层则用0填充以增加稀疏性,样本通过第k1个不同尺度的卷积核运算输出的多层次位置特征表示为其中D代表通道数,W代表特征的宽。
S3.2:卷积层后的数据需要进一步处理,为了使模型易于收敛,网络训练过程更加稳定,在卷积之后加入了批归一化,通过计算每个mini_batch中数据的均值和方差,假设一个小批次中有Nm个HRRP样本,那么定义输出为其中Fn表示第n个HRRP样本对应的卷积输出,在每个小批次中,对中的HRRP数据进行批归一化得到表示为:
其中,Fn(k,l)表示批归一化之前的HRRP样本对应的卷积层输出中,第k个通道中的第l个元素,即为批归一化之后的HRRP数据,αk和βk为可训练的对应于第k个通道的参数,ε是一个很小的数,为了防止除数为0,E(.)为求均值操作,Var(.)表示求方差操作;
多层次的特征F(k1)分别经过批归一化调整分布和激活层的非线性映射后,融合为多个不同层次的特征得到最终的输出特征图Fm,可表示为:
Fm=[F(1),F(2),...,F(k)]
其中[·]表示拼接起来的各层特征,此时D×K的值表示特征图的高,与特征图的宽W大小相等。也就是说多尺度卷积模块提取得到的特征图可以看作是正方形的图片,能够用于后续网络模块进一步提取HRRP样本的包络特征信息。
S4:将S3得到的特征传入一个卷积层和ReLU激活层进行处理,之后将得到的高维特征传入胶囊网络模块,在卷积获取胶囊特征后通过动态路由机制将基础胶囊中保存的HRRP特征转化为更全面的整体特征,并传递给表示HRRP目标类别的预测胶囊层进行分类。为了避免全连接的路由机制引起过拟合现象,引入dropout方法,丢弃了部分无效的向量神经元的传递,进一步探索HRRP样本中不同属性的关系,以向量输出的形式实现更好的分类;
S4.1:将多尺度卷积模块的输出再经过一个卷积层和ReLU激活层处理,在获取多尺度卷积模块提取到的位置特征中的局部层次信息的同时将其映射到更高维的空间,通道数从1转换为256,以便于传输向量形式的胶囊特征。
S4.2:胶囊网络模块由初级胶囊层和预测胶囊层组成,首先将上步输出传入初级胶囊层,将上步输出中每八个卷积特征节点堆叠成一个基础胶囊特征,记作即1×8形式的向量神经元,同时得到32个通道,每一个通道输出64(8×8)个长度为8的基础胶囊,因此初级胶囊层一共包含了2048(8×8×32)个基础胶囊。
S4.3:将初级胶囊层记作胶囊网络模块的第l1层,将第l1层堆叠后的第n1个胶囊记作其中n1=1,2,…,2048,路由过程中的预测胶囊层记作l1+1层,该层输出的第m(m=0,1,2)个预测胶囊记作vm。首先经过转化矩阵Wnm得到向量可表示为:
为了使最终得到的胶囊包含丰富精准的全局特征表示,使用非线性激活函数squash将向量sm的模值分布在0-1之间,最后输出用于分类的预测胶囊vm,且输出vm的长度||vm||表示某一类HRRP目标存在的概率,vm的方向则表示样本组件中的不同特征信息。l+1层输出的预测胶囊vm由以下式子计算得到:
通过不断迭代调整bnm来更新网络的权重参数cnm。bnm的更新方式由以下式子表示:
S5:搭建重构模块,将预测胶囊层中单位长度最大的高级胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据;
重构模块可以看作一个解码器,用于将HRRP样本正确分类的输出结果还原成初始的输入,也就是输出维度为256的向量,并参与整个多尺度卷积胶囊网络的训练,用于辅助对照HRRP分类的结果。具体地说,将预测胶囊层中单位长度最大的胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据。
S6:通过经过S2处理后的数据集对由多尺度卷积模块、胶囊网络模块构建的多尺度卷积胶囊网络进行训练。
S6.1:多尺度卷积胶囊网络的总损失由胶囊分类损失Ld与重构损失Lrec两部分构成,并且损失Ld起主导作用,表达式如下:
Loss总=Ld+Lrec
胶囊形式使多个分类能够同时存在,所以多尺度卷积胶囊网络的训练过程由MarginLoss作为损失函数Ld,由每个预测胶囊的损失相加得到,表达式为:
Ld=Ydmax(0,m+-||vd||)2+λ(1-Yd)max(0,||vd||-m-)2
其中d表示HRRP目标类别,Yd是表示训练中的分类标签,m+、m-为固定的超参数,分别设置为0.9、0.1,λ是防止网络求解局部最优的系数,设置为0.5。当训练过程中预测胶囊匹配到正确的HRRP样本d时,Yd=1,并且在这个预测胶囊预测的概率超过0.9时损失置零,当概率低于0.9时计算得到相应的损失值进行优化;同样地,预测胶囊匹配到错误的HRRP样本时,也就是样本中不存在类别d,则Yd=0。上述过程实际上是对每个预测胶囊进行了二分类的操作,同时引入参数λ保证了网络训练过程的稳定性。
重构模块中解码过程的重构损失Lrec表示的是输入HRRP样本和重构数据之间的差距,本发明将两者间的欧氏距离作为重构损失,并加入整个多尺度卷积胶囊网络的损失一起训练网络的参数,其表达式如下:
其中hic表示初始HRRP样本,hir表示重构数据,α是缩放系数,并设置为0.0005,使胶囊分类损失在总损失中占主导的地位。
因此,多尺度卷积胶囊网络总损失函数可由下式定义:
S6.2:初始化所有待训练的权重及偏置,设置训练参数,包括学习率、batch_size、训练批次,对模型进行训练。
实施例
训练阶段:
S1:采集数据集,将雷达采集到的HRRP数据集依据目标的种类进行合并,每种种类的样本分别在不同的数据段里选择训练样本和测试样本,在训练集和测试集的选取过程中,保证所选取的训练集样本与雷达所成姿态涵盖测试集样本与雷达所成的姿态。各类目标训练集和测试集样本数的比例为7:3。
S2:对经过S1所提取数据集中的样本做预处理,具体操作步骤如下:
S2.1:强度归一化。将原始HRRP表示为Xraw=[x1,x2,...,xL1],其中L1表示HRRP内包含的距离单元总数,则强度归一化之后的HRRP可以表示为:
S3:将预处理的数据集送入多尺度卷积模块,具体步骤如下:
S3.1:多尺度卷积模块中特征提取子块共包含了K个同步处理的卷积核,步长均设置为2,补零层则用0填充以增加稀疏性,样本通过第k1个不同尺度的卷积核运算输出的多层次位置特征可表示为其中D代表通道数,W代表特征的宽。
S3.2:在卷积之后加入批归一化,通过计算每个mini_batch中数据的均值和方差,假设一个小批次中有Nm个HRRP样本,那么定义输出为其中Fn表示第n个HRRP样本对应的卷积输出,在每个小批次中,对中的HRRP数据进行批归一化得到 表示为:
其中,Fn(k,l)表示批归一化之前的HRRP样本对应的卷积层输出中,第k个通道中的第l个元素,即为批归一化之后的HRRP数据,αk和βk为可训练的对应于第k个通道的参数,ε是一个很小的数,为了防止除数为0,E(.)为求均值操作,Var(.)表示求方差操作;
将多层次的特征F(k1)经过批归一化调整分布和激活层的非线性映射后,融合为多个不同层次的特征得到最终的输出特征图Fm,可表示为
Fm=[F(1),F(2),...,F(k)]
S4:将经过多尺度卷积模块的数据传入胶囊网络模块,具体步骤如下:
S4.1:经过一个卷积层和ReLU激活层,在获取多尺度卷积提取到的位置特征中的局部层次信息的同时将其映射到更高维的空间,通道数从1转换为256,以便于传输向量形式的胶囊特征。
S4.2:胶囊网络模块由初级胶囊层和预测胶囊层组成,首先将上步输出传入初级胶囊层,将上步输出得到的特征图中每八个卷积特征节点堆叠成一个基础胶囊特征,记作即1×8形式的向量神经元,同时得到32个通道,每一个通道输出64(8×8)个长度为8的基础胶囊,因此初级胶囊层一共包含了2048(8×8×32)个基础胶囊。
S4.3:把初级胶囊层记作网络的第l1层,在l1层堆叠后的第n1个胶囊记作其中n1=1,2,…,2048,路由过程中的预测胶囊层为记作l1+1层,该层输出的第m(m=0,1,2)个预测胶囊记作vm。首先经过转化矩阵Wnm得到向量可表示为:
为了使最终得到的胶囊包含丰富精准的全局特征表示,我们使用非线性激活函数squash将向量sm的模值分布在0-1之间,最后输出用于分类的预测胶囊vm,且输出vm的长度||vm||表示某一类HRRP目标存在的概率,模长越长,属于这类目标飞机的可能性就越大,反之可能性越小,vm的方向则表示样本组件中的不同特征信息。l+1层输出的预测胶囊vm可由下面式子计算得到:
通过不断迭代调整bnm来更新网络的权重参数cnm。bnm的更新方式可由下面的式子表示:
S5:构建重构模块,具体步骤如下:
S5.1:将预测胶囊层中单位长度最大的胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据。
S6:设计多尺度卷积胶囊网络损失函数,开启训练,具体步骤如下:
S6.1:损失函数设计为交叉熵。多尺度卷积胶囊网络的总损失由胶囊分类损失Ld与重构损失Lrec两部分构成,并且损失Ld起主导作用,表达式如下:
Loss总=Ld+Lrec
胶囊形式使多个分类能够同时存在,所以卷积胶囊网络的训练过程由MarginLoss作为损失函数Ld,由每个预测胶囊的损失相加得到,表达式为:
Ld=Ydmax(0,m+-||vd||)2+λ(1-Yd)max(0,||vd||-m-)2
其中d表示HRRP目标类别,Yd是表示训练中的分类标签,m+、m-为固定的超参数,分别设置为0.9、0.1,λ是防止网络求解局部最优的系数,设置为0.5。当训练过程中预测胶囊匹配到正确的HRRP样本d时,Yd=1,并且在这个预测胶囊预测的概率超过0.9时损失置零,当概率低于0.9时计算得到相应的损失值进行优化;同样地,预测胶囊匹配到错误的HRRP样本时,也就是样本中不存在类别d,那么Yd=0。上述过程实际上是对每个预测胶囊进行了二分类的操作,同时引入参数λ保证了网络训练过程的稳定性。
重构模块中解码过程的重构损失Lrec表示的是输入HRRP样本和重构数据之间的差距,将两者间的欧氏距离作为重构损失,并加入整个多尺度卷积胶囊网络的损失一起训练网络的参数,其表达式如下:
其中hic表示初始HRRP样本,hir表示重构数据,α是缩放系数,并设置为0.0005,使胶囊分类损失在总损失中占主导的地位。
因此,多尺度卷积胶囊网络总损失函数可由下式定义:
S6.2:初始化上述模型中所有待训练的权重及偏置,设置训练参数,包括学习率、batch_size、训练批次,开启模型训练。
测试阶段:
S7:对由S1采集到的测试数据进行训练阶段的步骤S2预处理操作
其中exp(·)表示取指数运算,c表示类别个数。
我们通过最大后验概率将测试HRRP样本xtest分类到最大目标概率的k0中:
经过上述8个步骤,即可得到本发明所提出的一种基于多尺度卷积和胶囊网络的雷达高分辨距离像识别方法。
Claims (7)
1.一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,包括以下步骤:
S1:数据集采集;
S2:对数据集中的样本进行预处理;
S3:将预处理后的HRRP样本输入到多尺度卷积模块进行特征提取;
S4:将S3得到的特征传入一个卷积层和ReLU激活层进行处理,之后将得到的高维特征传入胶囊网络模块,在卷积获取胶囊特征后通过动态路由机制将基础胶囊中保存的HRRP特征转化为更全面的整体特征,并传递给表示HRRP目标类别的预测胶囊层进行分类;为了避免全连接的路由机制引起过拟合现象,引入dropout方法,丢弃了部分无效的向量神经元的传递,进一步探索HRRP样本中不同属性的关系,以向量输出的形式实现更好的分类;
S5:搭建重构模块,将预测胶囊层中单位长度最大的高级胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据;
S6:通过经过S2处理后的数据集对由多尺度卷积模块、胶囊网络模块构建的多尺度卷积胶囊网络进行训练。
2.根据权利要求1所述的一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,S1详细步骤为:
将雷达采集到的HRRP数据集依据目标的种类进行合并,每种种类的样本分别在不同的数据段里选择训练样本和测试样本,在训练集和测试集的选取过程中,保证所选取的训练集样本与雷达所成姿态涵盖测试集样本与雷达所成的姿态;各类目标训练集和测试集样本数的比例为7:3。
4.根据权利要求3所述的一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,所述S3详细步骤为:
S3.1:将经过预处理的HRRP样本输入到多尺度卷积模块之中,所述的多尺度卷积模块包含了3个堆叠的特征提取子块和1个全连接层,其中,每一个特征提取子块均由相同的网络层组成,包含了卷积层、批归一化以及激活层,再经过一个全连接层进行特征映射,通过全连接层输出的最大值来判定输入HRRP样本的目标类别;
多尺度卷积模块中特征提取子块共包含了K个同步处理的卷积核,步长均设置为2,补零层则用0填充以增加稀疏性,样本通过第k1个不同尺度的卷积核运算输出的多层次位置特征表示为其中D代表通道数,W代表特征的宽;
S3.2:卷积层后的数据需要进一步处理,为了使模型易于收敛,网络训练过程更加稳定,在卷积之后加入了批归一化,通过计算每个mini_batch中数据的均值和方差,假设一个小批次中有Nm个HRRP样本,那么定义输出为其中Fn表示第n个HRRP样本对应的卷积输出,在每个小批次中,对中的HRRP数据进行批归一化得到 表示为:
其中,Fn(k,l)表示批归一化之前的HRRP样本对应的卷积层输出中,第k个通道中的第l个元素,即为批归一化之后的HRRP数据,αk和βk为可训练的对应于第k个通道的参数,ε是一个很小的数,为了防止除数为0,E(.)为求均值操作,Var(.)表示求方差操作;
多层次的特征F(k1)分别经过批归一化调整分布和激活层的非线性映射后,融合为多个不同层次的特征得到最终的输出特征图Fm,可表示为:
Fm=[F(1),F(2),...,F(k)]
5.根据权利要求4所述的一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,所述S4详细步骤为:
S4.1:将多尺度卷积模块的输出再经过一个卷积层和ReLU激活层处理,在获取多尺度卷积模块提取到的位置特征中的局部层次信息的同时将其映射到更高维的空间,通道数从1转换为256,以便于传输向量形式的胶囊特征;
S4.2:胶囊网络模块由初级胶囊层和预测胶囊层组成,首先将上步输出传入初级胶囊层,将上步输出中每八个卷积特征节点堆叠成一个基础胶囊特征,记作即1×8形式的向量神经元,同时得到32个通道,每一个通道输出64(8×8)个长度为8的基础胶囊,因此初级胶囊层一共包含了2048(8×8×32)个基础胶囊;
S4.3:将初级胶囊层记作胶囊网络模块的第l1层,将第l1层堆叠后的第n1个胶囊记作其中n1=1,2,…,2048,路由过程中的预测胶囊层记作l1+1层,该层输出的第m(m=0,1,2)个预测胶囊记作vm;首先经过转化矩阵Wnm得到向量可表示为:
为了使最终得到的胶囊包含丰富精准的全局特征表示,使用非线性激活函数squash将向量sm的模值分布在0-1之间,最后输出用于分类的预测胶囊vm,且输出vm的长度||vm||表示某一类HRRP目标存在的概率,vm的方向则表示样本组件中的不同特征信息;l+1层输出的预测胶囊vm由以下式子计算得到:
通过不断迭代调整bnm来更新网络的权重参数cnm;bnm的更新方式由以下式子表示:
6.根据权利要求5所述的一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,所述S5详细步骤为:
重构模块可以看作一个解码器,用于将HRRP样本正确分类的输出结果还原成初始的输入,也就是输出维度为256的向量,并参与整个多尺度卷积胶囊网络的训练,用于辅助对照HRRP分类的结果;具体地说,将预测胶囊层中单位长度最大的胶囊表示作为重构目标,并经过三个带激活函数的全连接网络层,输出得到重构的目标数据。
7.根据权利要求6所述的一种基于多尺度卷积胶囊网络的雷达目标识别方法,其特征在于,所述S6详细步骤为:
S6.1:多尺度卷积胶囊网络的总损失由胶囊分类损失Ld与重构损失Lrec两部分构成,并且损失Ld起主导作用,表达式如下:
Loss总=Ld+Lrec
胶囊形式使多个分类能够同时存在,所以多尺度卷积胶囊网络的训练过程由MarginLoss作为损失函数Ld,由每个预测胶囊的损失相加得到,表达式为:
Ld=Ydmax(0,m+-||vd||)2+λ(1-Yd)max(0,||vd||-m-)2
其中d表示HRRP目标类别,Yd是表示训练中的分类标签,m+、m-为固定的超参数,分别设置为0.9、0.1,λ是防止网络求解局部最优的系数,设置为0.5;当训练过程中预测胶囊匹配到正确的HRRP样本d时,Yd=1,并且在这个预测胶囊预测的概率超过0.9时损失置零,当概率低于0.9时计算得到相应的损失值进行优化;同样地,预测胶囊匹配到错误的HRRP样本时,也就是样本中不存在类别d,则Yd=0;上述过程实际上是对每个预测胶囊进行了二分类的操作,同时引入参数λ保证了网络训练过程的稳定性;
重构模块中解码过程的重构损失Lrec表示的是输入HRRP样本和重构数据之间的差距,本发明将两者间的欧氏距离作为重构损失,并加入整个多尺度卷积胶囊网络的损失一起训练网络的参数,其表达式如下:
其中hic表示初始HRRP样本,hir表示重构数据,α是缩放系数,并设置为0.0005,使胶囊分类损失在总损失中占主导的地位;
因此,多尺度卷积胶囊网络总损失函数可由下式定义:
S6.2:初始化所有待训练的权重及偏置,设置训练参数,包括学习率、batch_size、训练批次,对模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210391547.3A CN115032602A (zh) | 2022-04-14 | 2022-04-14 | 一种基于多尺度卷积胶囊网络的雷达目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210391547.3A CN115032602A (zh) | 2022-04-14 | 2022-04-14 | 一种基于多尺度卷积胶囊网络的雷达目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115032602A true CN115032602A (zh) | 2022-09-09 |
Family
ID=83120012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210391547.3A Pending CN115032602A (zh) | 2022-04-14 | 2022-04-14 | 一种基于多尺度卷积胶囊网络的雷达目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115032602A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270997A (zh) * | 2022-09-20 | 2022-11-01 | 中国人民解放军32035部队 | 基于迁移学习的火箭目标姿态稳定判别方法及相关装置 |
CN116304842A (zh) * | 2023-05-18 | 2023-06-23 | 南京信息工程大学 | 一种基于cfc结构改进的胶囊网络文本分类方法 |
-
2022
- 2022-04-14 CN CN202210391547.3A patent/CN115032602A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270997A (zh) * | 2022-09-20 | 2022-11-01 | 中国人民解放军32035部队 | 基于迁移学习的火箭目标姿态稳定判别方法及相关装置 |
CN115270997B (zh) * | 2022-09-20 | 2022-12-27 | 中国人民解放军32035部队 | 基于迁移学习的火箭目标姿态稳定判别方法及相关装置 |
CN116304842A (zh) * | 2023-05-18 | 2023-06-23 | 南京信息工程大学 | 一种基于cfc结构改进的胶囊网络文本分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287800B (zh) | 一种基于sgse-gan的遥感图像场景分类方法 | |
CN108830334B (zh) | 一种基于对抗式迁移学习的细粒度目标判别方法 | |
CN110399850B (zh) | 一种基于深度神经网络的连续手语识别方法 | |
CN107145830B (zh) | 基于空间信息增强和深度信念网络的高光谱图像分类方法 | |
CN108830287A (zh) | 基于残差连接的Inception网络结合多层GRU的中文图像语义描述方法 | |
CN112347888B (zh) | 基于双向特征迭代融合的遥感图像场景分类方法 | |
CN112329760B (zh) | 基于空间变换网络端到端印刷体蒙古文识别翻译的方法 | |
CN112070078B (zh) | 基于深度学习的土地利用分类方法及系统 | |
Ding et al. | Global–local transformer network for HSI and LiDAR data joint classification | |
CN112733659B (zh) | 一种基于自步学习双流多尺度密集连接网络的高光谱图像分类方法 | |
CN111639719B (zh) | 基于时空运动和特征融合的足迹图像检索方法 | |
CN115032602A (zh) | 一种基于多尺度卷积胶囊网络的雷达目标识别方法 | |
CN112765352A (zh) | 基于具有自注意力机制的图卷积神经网络文本分类方法 | |
CN113344045B (zh) | 一种结合hog特征提高sar船只分类精度的方法 | |
CN111736125A (zh) | 基于注意力机制和双向堆叠循环神经网络的雷达目标识别方法 | |
CN104700100A (zh) | 面向高空间分辨率遥感大数据的特征提取方法 | |
CN109239670B (zh) | 基于结构嵌入和深度神经网络的雷达hrrp识别方法 | |
CN110096976A (zh) | 基于稀疏迁移网络的人体行为微多普勒分类方法 | |
CN111580097A (zh) | 基于单层双向循环神经网络的雷达目标识别方法 | |
CN113255602A (zh) | 基于多模态数据的动态手势识别方法 | |
CN115131313A (zh) | 基于Transformer的高光谱图像变化检测方法及装置 | |
CN114511785A (zh) | 基于瓶颈注意力模块的遥感图像云检测方法及系统 | |
Zhang et al. | All adder neural networks for on-board remote sensing scene classification | |
CN113065520A (zh) | 一种面向多模态数据的遥感图像分类方法 | |
CN111596292A (zh) | 基于重要性网络和双向堆叠循环神经网络的雷达目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |