CN109507655B - 基于导向重构与范数约束dbn的sar目标识别算法 - Google Patents

基于导向重构与范数约束dbn的sar目标识别算法 Download PDF

Info

Publication number
CN109507655B
CN109507655B CN201811512718.3A CN201811512718A CN109507655B CN 109507655 B CN109507655 B CN 109507655B CN 201811512718 A CN201811512718 A CN 201811512718A CN 109507655 B CN109507655 B CN 109507655B
Authority
CN
China
Prior art keywords
layer
neuron
visual
image
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811512718.3A
Other languages
English (en)
Other versions
CN109507655A (zh
Inventor
王健
秦春霞
杨珂
任萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Xian Aisheng Technology Group Co Ltd
Original Assignee
Northwestern Polytechnical University
Xian Aisheng Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University, Xian Aisheng Technology Group Co Ltd filed Critical Northwestern Polytechnical University
Priority to CN201811512718.3A priority Critical patent/CN109507655B/zh
Publication of CN109507655A publication Critical patent/CN109507655A/zh
Application granted granted Critical
Publication of CN109507655B publication Critical patent/CN109507655B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • G01S7/417Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section involving the use of neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于导向重构与范数约束DBN的SAR目标识别算法,针对传统基于DBN的SAR目标识别算法网络结构复杂度高、训练次数较多且识别率低等问题,提出利用导向重构算法对训练样本和测试样本做重构预处理,然后裁剪后扩展成一维图像矢量,用加权范数约束的深度置信网络提取低维特征,用Softmax对目标进行分类。实验结果表明,本发明方法可降低图像特征的维度和网络训练的次数,网络的识别性能进一步提高。

Description

基于导向重构与范数约束DBN的SAR目标识别算法
技术领域
本发明涉及一种基于导向重构与范数约束深度置信网络(Deep BeliefNetworks,DBN)的目标识别算法,可以应用于各种军用或民用的图像处理系统。
背景技术
现代高科技战争中,战场信息及时准确获取以及战场态势的高效评估,对争夺战场的军事主导权具有十分重要的作用。合成孔径雷达图像(Synthetic Aperture Radar,SAR)作为一种重要的微波成像传感器,在环境监测、资源勘察和国防军事等领域有着非常广泛的应用。
近年来,基于深度神经网络的目标识别技术在各个领域都取得很好的效果,促进其在SAR图像目标识别方面的研究。文献“SAR Automatic Target Recognition Based onEuclidean Distance Restricted Autoencoder,IEEE J.Sel.Topics Appl.EarthObserv.Remote Sens.,pp.1-11,Jul.2017.”将欧氏距离限制与自编码器相结合,使得在增加样本类间距的同时减小类内样本间距,用dropout操作解决有限训练样本产生的过拟合现象。文献“Synthetic Aperture Radar Target Recognition with Feature FusionBased on a Stacked Autoencoder,Sensors,2017,17,192,1-16”提取23个冗余性较低的图像全局和局部互补性TPLBP特征,并将基线和TPLBP特征作为SAE的输入,利用无监督学习算法和Softmax对目标进行分类。文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报,2016,38(1):97-103.”提出相似性约束的受限玻尔兹曼机模型并引入监督信息,可将多个相似性约束的受限玻尔兹曼机堆叠成深度模型。文献“基于稀疏理论的SAR图像目标识别研究[D].西安:西安电子科技大学,2015.”将L0.5范数约束引入,约束受限玻尔兹曼机,得到更为稀疏的特征表示并通过范数约束的深度置信网络,对三类目标与十类目标进行分类。文献“Song,S.;Xu,B.;Yang,J.SAR Target Recognition viaSupervised Discriminative Dictionary Learning and Sparse Representation ofthe SAR-HOG Feature.Remote Sens.2016,8,683.”Shengli Song提出基于监督判别字典学习和SAR-HOG特征(a histogram of oriented gradients-like feature for SAR ATR)的稀疏表示的SAR图像目标识别,实验结果表明SAR-HOG特征可以可靠地捕获SAR图像中目标结构,监督判别字典(Supervised Discriminative dictionary Learning,SDDL)可以进一步捕捉不同类别间的细微差异。以上研究成果表明将约束引入DBN模型可以提高SAR目标识别的性能。但是,在引入相似性约束和范数约束在提高DBN在SAR目标识别时,带来模型网络结构复杂度较高、训练次数较多和网络过拟合等问题。为此,本发明提出一种基于导向重构与加权范数约束深度置信网络的快速SAR目标识别算法。
发明内容
要解决的技术问题
针对传统基于DBN的SAR目标识别算法网络结构复杂度高、训练次数较多且识别率低等问题,本发明提出了基于导向重构与加权范数约束深度置信网络的快速SAR目标识别算法。
技术方案
一种基于导向重构与范数约束DBN的SAR目标识别算法,其特征在于步骤如下:
步骤1:基于导向滤波器的两尺度图像重构
对原图像In做拉普拉斯滤波得到高频图像Hn
Hn=In*L (1)
式中,In是第n个源图像,L是一个3×3拉普拉斯滤波器,Hn取绝对值并作局部平均用来重建特征映射图Sn
Sn=|Hn|*gr,σ (2)
式中,g是一个(2r+1)×(2r+1)高斯低通滤波器,σ是高斯低通滤波器的标准差,r和σ均为5;特征映射图对图像高频细节分量的显著性水平提供良好的表征,特征映射图的权重图如下:
Figure BDA0001901199500000031
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,其相对应的源图像In作为引导图像并通过导向滤波器生成的加权图如下:
Figure BDA0001901199500000032
Figure BDA0001901199500000033
r11,r2和ε2是加权导向滤波器的参数,
Figure BDA00019011995000000313
Figure BDA00019011995000000314
是低频近似分量和高频细节分量的加权图并对其进行归一化处理;其中r1=45;ε1=0.3;r2=7;ε2=10-6
总之,利用平滑滤波器对源图像进行两尺度分解得到低频近似分量,高频细节分量则通过源图像减去低频近似分量获得,如下式:
Figure BDA0001901199500000034
Figure BDA0001901199500000035
式中:
Figure BDA0001901199500000036
是源图像的低频分量,
Figure BDA0001901199500000037
是源图像的高频分量;G是(2r+1)×(2r+1)窗口的平滑滤波器,其中r=15;
最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构低频分量
Figure BDA0001901199500000038
和高频分量
Figure BDA0001901199500000039
随后利用分量进行重构后得到重构图像,如下式:
Figure BDA00019011995000000310
Figure BDA00019011995000000311
将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像,则
Figure BDA00019011995000000312
步骤2:基于加权范数约束深度置信网络的低维特征提取
设X={x1,x2,…,xN}代表训练样本数据,xn(n=1,2,…,N)是其中第n个训练样本数据,其是由原图像In作两尺度分解和重构后的图像
Figure BDA0001901199500000041
做裁剪并扩展成一维矢量形成的,
Figure BDA0001901199500000042
是一个列向量,N表示训练样本的总数;受限玻尔兹曼机RBM将输入图像X由可视层V映射到隐层H;
在RBM中,任意两个相连的神经元之间的权值Wvh表示其连接强度,v表示可视层的随机变量,h表示隐含层的随机变量,每个神经元自身有一个可视层神经元的偏置系数b和隐含层神经元的偏置系数c来表示其自身权重;RBM的能量函数表示为:
Figure BDA0001901199500000043
Figure BDA0001901199500000044
表示该网络的模型系数,
Figure BDA0001901199500000045
表示第i个可视层神经元与第j个隐含层神经元之间的连接权值,hj表示第j个隐含层的神经元,vi表示第i个可视层的神经元,dx表示可视层神经元的数目,dh表示隐含层神经元的数目;可视层与隐含层的联合概率分布
Figure BDA0001901199500000046
得到可视层v的独立分布为:
Figure BDA0001901199500000047
式中dv和dh表示可视层与隐含层神经元的数量;第j个隐含层神经元hj被激活的概率和第i个可视层神经元vi被激活概率分别为:
Figure BDA0001901199500000048
Figure BDA0001901199500000049
式中,σ设定为Sigmoid函数,根据概率密度独立性,可得到下式:
Figure BDA00019011995000000410
Figure BDA00019011995000000411
RBM根据
Figure BDA0001901199500000051
计算每个隐含层神经元的开启概率P(hj|x),j=1,2,…,dh,取一个0-1的随机数μ作为阈值,隐含层每个神经元激活状态如下(可视层同理):
Figure BDA0001901199500000052
RBM共有五个参数:v是输入向量,h是输出向量,Wvh和b、c,也就是相应的权重和偏置值,是通过学习得到的;对于一个样本数据x,采用对比散度算法CD对其进行训练:
(1)将x赋给可视层v1,利用
Figure BDA0001901199500000053
计算出隐含层中每个神经元被激活的概率P(h1|v1);
(2)从计算的概率分布中采取Gibbs抽样抽取一个样本h1~P(h1|v1);
(3)用h1重构可视层,即通过隐含层反推可视层,利用
Figure BDA0001901199500000054
式计算可视层中每个神经元被激活的概率P(v2|h1);
(4)同样地,由得到的概率分布中采取Gibbs抽样抽取一个样本v2~P(v2|h1);
(5)通过v2再次计算隐含层中每个神经元被激活的概率,得到概率分布P(h2|v2);
(6)更新权重:Wvh←Wvh+λ(P(h1|v1)v1-P(h2|v2)v2)、b←b+λ(v1-v2)和c←c+λ(h1-h2)。
在这个训练阶段,在可视层会产生一个向量v,通过它将值传递到隐含层;反过来,可视层的输入会被随机的选择,以尝试去重构原始的输入信号;最后,这些新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得h;这些后退和前进的步骤就是Gibbs采样,而隐含层激活单元和可视层输入之间的相关性差别就作为权值更新的主要依据;
给定一组N个训练数据{x1,x2,…,xN},则范数约束玻尔兹曼机的广义最优化问题可以描述为:
Figure BDA0001901199500000061
其中
Figure BDA0001901199500000062
表示第n个样本xn在可视层和隐含层的联合概率分布,p[hnj|xn]表示当输入层为第n个样本xn时,隐含层第j个神经元被激活的概率:
Figure BDA0001901199500000063
Figure BDA0001901199500000064
其中f(p[hnj|xn])是关于p[hnj|xn]的函数,并且p[hnj|xn]是表征样本xn对应的所有隐含层概率密度组成的向量,p[hnj|xn]={p(hn1|xl),p(hn2|xn),…,p(hnF|xn)};其中的右边一项用范数的形式表现为:
Figure BDA0001901199500000065
Figure BDA0001901199500000066
Figure BDA0001901199500000067
则三种范数正则项表示的梯度可以直接求导得出:
Figure BDA0001901199500000068
Figure BDA0001901199500000069
Figure BDA00019011995000000610
事实上,范数约束玻尔兹曼机的广义最优化问题右边的正则项,可以表示为n个不同范数的线性叠加:
Figure BDA0001901199500000071
λi表示不同范数的权重系数,
Figure BDA0001901199500000072
表示不同的p范数,为了便于算法性能验证,这里p取0.5,1,2;
通过多轮训练可以得到最佳网络模型及其系数θ={W,b,c}还有每个训练样本对应的低维特征矢量hn{n=1,2,…,N};
步骤3:基于softmax分类器的目标分类输出
对于训练集{(y1,L1),…,(yN,LN)},yn(i=1,2,…,N)是训练样本数据xn(n=1,2,…,N)经过多层RBM训练提取的输出特征矢量hn{n=1,2,…,N},数据的标签值是Ln∈{1,2,…,k};其中k是样本的种类,取值3,10;假设输出函数hW(y)形式如下:
Figure BDA0001901199500000073
其中,W1,W2,…,Wk是模型参数,
Figure BDA0001901199500000074
是归一化因子,使得输出向量的所有元素之和即总概率为1。定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
Figure BDA0001901199500000075
引入示性函数得到Softmax的代价函数为
Figure BDA0001901199500000076
上述对数似然函数的第一项是不能用梯度下降法来更新参数的,通过添加一个权重衰减项来使代价函数满足凸函数的性质,得到最优化的解,这里λ=10-4;Softmax回归中将y分类为类别j的概率为:
Figure BDA0001901199500000081
用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y);
Figure BDA0001901199500000082
有益效果
本发明提出一种基于导向重构与范数约束DBN的SAR目标识别算法,针对传统基于DBN的SAR目标识别算法网络结构复杂度高、训练次数较多且识别率低等问题,提出利用导向重构算法对训练样本和测试样本做重构预处理,然后裁剪后扩展成一维图像矢量,用加权范数约束的深度置信网络提取低维特征,用Softmax对目标进行分类。实验结果表明,本发明方法可降低图像特征的维度和网络训练的次数,网络的识别性能进一步提高。
附图说明
图1深度置信网络的两层RBM结构;
图2基于导向重构与范数约束DBN的SAR目标识别算法流程;
图3实验源图像数据MSTAR集的三类目标图:(a)BMP-2的SAR图像;(b)BTR-70的SAR图像;(c)T-72的SAR图像;(d)BMP-2的光学图像;(e)BTR-70的光学图像;(f)T-72的光学图像。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
步骤一:基于导向滤波器的两尺度图像重构
对目标识别来说,对原图像进行两尺度重构就是采用特征映射图的导向滤波器处理,以便突出不同类目标图像之间的细节差异性。其具体步骤如下:
对原图像In做拉普拉斯滤波得到高频图像Hn
Hn=In*L (1)
式中,In是第n个源图像,L是一个3×3拉普拉斯滤波器,Hn取绝对值并作局部平均用来重建特征映射图Sn
Sn=|Hn|*gr,σ (2)
式中,g是一个(2r+1)×(2r+1)高斯低通滤波器,σ是高斯低通滤波器的标准差,r和σ均为5。特征映射图对图像高频细节分量的显著性水平提供良好的表征。特征映射图的权重图如下:
Figure BDA0001901199500000091
N是输入图像的像素数,
Figure BDA0001901199500000092
是第n幅输入图像像素数为k时的特征映射值。
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,其相对应的源图像In作为引导图像并通过导向滤波器生成的加权图如下:
加权图并对其进行归一化处理,其中r1=45;ε1=0.3;r2=7;ε2=10-6
总之,利用平滑滤波器对源图像进行两尺度分解得到低频近似分量,高频细节分量则通过源图像减去低频近似分量获得,如下式:
Figure BDA0001901199500000093
Figure BDA0001901199500000094
式中:
Figure BDA0001901199500000095
是源图像的低频分量,
Figure BDA0001901199500000096
是源图像的高频分量。G是(2r+1)×(2r+1)窗口的平滑滤波器,其中r=15。
最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构低频分量
Figure BDA0001901199500000097
和高频分量
Figure BDA0001901199500000098
随后利用分量进行重构后得到重构图像,如下式:
Figure BDA0001901199500000101
Figure BDA0001901199500000102
将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像,则
Figure BDA0001901199500000103
步骤二:基于加权范数约束深度置信网络的低维特征提取
DBN由若干层神经元构成,组成元素是受限玻尔兹曼机(Restricted BoltzmannMachines,RBM)。一个典型的网络结构如图1所示。
设X={x1,x2,…,xN}代表训练样本数据,xn(n=1,2,…,N)是其中第n个训练样本数据,其是由原图像In作两尺度分解和重构后的图像
Figure BDA0001901199500000109
做裁剪并扩展成一维矢量形成的,
Figure BDA0001901199500000104
是一个列向量,N表示训练样本的总数。RBM将输入图像X由可视层V映射到隐层H。
在RBM中,任意两个相连的神经元之间的权值Wvh表示其连接强度,v表示可视层的随机变量,h表示隐含层的随机变量,每个神经元自身有一个可视层神经元的偏置系数b和隐含层神经元的偏置系数c来表示其自身权重。RBM的能量函数表示为:
Figure BDA0001901199500000105
θ={Wvh,b,c}表示该网络的模型系数,
Figure BDA0001901199500000106
表示第i个可视层神经元与第j个隐含层神经元之间的连接权值,hj表示第j个隐含层的神经元,vi表示第i个可视层的神经元,dx表示可视层神经元的数目,dh表示隐含层神经元的数目。可视层与隐含层的联合概率分布
Figure BDA0001901199500000107
得到可视层v的独立分布为:
Figure BDA0001901199500000108
式中dv和dh表示可视层与隐含层神经元的数量。第j个隐含层神经元hj被激活的概率和第i个可视层神经元vi被激活概率分别为:
Figure BDA0001901199500000111
Figure BDA0001901199500000112
式中,σ设定为Sigmoid函数,根据概率密度独立性,可得到下式:
Figure BDA0001901199500000113
Figure BDA0001901199500000114
RBM根据
Figure BDA0001901199500000115
计算每个隐含层神经元的开启概率P(hj|x),j=1,2,…,dh,取一个0-1的随机数μ作为阈值,隐含层每个神经元激活状态如下(可视层同理):
Figure BDA0001901199500000116
RBM共有五个参数:v是输入向量,h是输出向量,Wvh和b、c,也就是相应的权重和偏置值,是通过学习得到的。对于一个样本数据x,采用对比散度算法(ContrastiveDivergence,CD)对其进行训练:
(7)将x赋给可视层v1,利用
Figure BDA0001901199500000117
计算出隐含层中每个神经元被激活的概率P(h1|v1);
(8)从计算的概率分布中采取Gibbs抽样抽取一个样本h1~P(h1|v1);
(9)用h1重构可视层,即通过隐含层反推可视层,利用
Figure BDA0001901199500000118
式计算可视层中每个神经元被激活的概率P(v2|h1);
(10)同样地,由得到的概率分布中采取Gibbs抽样抽取一个样本v2~P(v2|h1);
(11)通过v2再次计算隐含层中每个神经元被激活的概率,得到概率分布P(h2|v2);
(12)更新权重:Wvh←Wvh+λ(P(h1|v1)v1-P(h2|v2)v2)、b←b+λ(v1-v2)和c←c+λ(h1-h2)。
在这个训练阶段,在可视层会产生一个向量v,通过它将值传递到隐含层。反过来,可视层的输入会被随机的选择,以尝试去重构原始的输入信号。最后,这些新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得h。这些后退和前进的步骤就是Gibbs采样,而隐含层激活单元和可视层输入之间的相关性差别就作为权值更新的主要依据。
给定一组N个训练数据{x1,x2,…,xN},则范数约束玻尔兹曼机的广义最优化问题可以描述为:
Figure BDA0001901199500000121
其中
Figure BDA0001901199500000122
表示第n个样本xn在可视层和隐含层的联合概率分布,p[hnj|xn]表示当输入层为第n个样本xn时,隐含层第j个神经元被激活的概率:
Figure BDA0001901199500000123
Figure BDA0001901199500000124
其中f(p[hnj|xn])是关于p[hnj|xn]的函数,并且p[hnj|xn]是表征样本xn对应的所有隐含层概率密度组成的向量,p[hnj|xn]={p(hn1|xl),p(hn2|xn),…,p(hnF|xn)}。其中的右边一项用范数的形式表现为:
Figure BDA0001901199500000125
Figure BDA0001901199500000131
Figure BDA0001901199500000132
则三种范数正则项表示的梯度可以直接求导得出:
Figure BDA0001901199500000133
Figure BDA0001901199500000134
Figure BDA0001901199500000135
事实上,范数约束玻尔兹曼机的广义最优化问题右边的正则项,可以表示为n个不同范数的线性叠加:
Figure BDA0001901199500000136
λi表示不同范数的权重系数,||x||pi表示不同的p范数,为了便于算法性能验证,这里p取0.5,1,2。
通过多轮训练可以得到最佳网络模型及其系数θ={W,b,c}还有每个训练样本对应的低维特征矢量hn{n=1,2,…,N}。
步骤三:基于softmax分类器的目标分类输出
对于训练集{(y1,L1),…,(yN,LN)},yn(i=1,2,…,N)是训练样本数据xn(n=1,2,…,N)经过多层RBM训练提取的输出特征矢量hn{n=1,2,…,N},数据的标签值是Ln∈{1,2,…,k}。其中k是样本的种类,取值3,10。假设输出函数hW(y)形式如下:
Figure BDA0001901199500000137
其中,W1,W2,…,Wk是模型参数,
Figure BDA0001901199500000141
是归一化因子,使得输出向量的所有元素之和即总概率为1。定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
Figure BDA0001901199500000142
引入示性函数得到Softmax的代价函数为
Figure BDA0001901199500000143
上述对数似然函数的第一项是不能用梯度下降法来更新参数的,通过添加一个权重衰减项来使代价函数满足凸函数的性质,得到最优化的解,这里λ=10-4。Softmax回归中将y分类为类别j的概率为:
Figure BDA0001901199500000144
用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y)。
Figure BDA0001901199500000145
1.实验条件
实验环境为Intel(R)Core(TM)i5-3230M CPU@2.6GHz,内存为4GB,采用MATLABR2016a编程。实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达,分辨率为0.3×0.3。工作在X波段,所用的极化方式为HH极化方式。对采集到的数据进行处理,从中提取出128×128包含各类目标的数据集图像。实验在标准操作条件(Standard OperatingConditions,SOC)和扩展操作条件(Extended Operating Conditions,EOC)下进行测试。在SOC环境中,测试条件接近标准环境,在EOC环境中,测试条件接近实战环境。SOC环境下,仿真测试包含三类目标七个型号:BMP2步兵战车包括SN-9563、SN-9566和SN-C21,T72坦克包括SN-132、SN-812和SN-S7,BTR70装甲运输车包括SN-C71。同类不同型号配备上有差异,但总体散射特性相差不大。在EOC环境下,MSTAR混合目标数据中还包含其他的一组雷达工作在不同俯仰角的成像图片,分别为2S1(自行榴弹炮)、BRDM2(装甲侦察车)、BTR60(装甲运输车)、D7(推土机)、T62(坦克)、ZIL131(货运卡车)、ZSU234(自行高炮)、T72,用于算法鲁棒性和抗噪声性能的检测。
2.实验内容
本发明首先利用导向重构算法对训练样本集进行预处理,然后基于加权范数约束深度置信网络对SAR目标进行深层稀疏特征提取,最后连接一个Softmax分类器进行分类输出。基于导向重构与加权范数约束的SAR目标识别算法原理如图2所示。对于三类目标(BMP-2、T-72、BTR-70)及其不同型号数据训练和测试样本的类型和数量如表1。表2列出了15度,45度俯仰下不同配置的样本集,用于验证本算法的鲁棒性。导向滤波器重构的输入图像尺寸为128×128,重构预处理完成后,从128×128的训练集图像中心裁剪32×32或者64×64的图像块,将图像块向量化为1×1024或者1×4096的图像矢量,表三中五种网络结构的输入,随着自动降噪参数的变化,不同网络结构的识别性能如表3所示。
3.分类评价指标
聚类正确率(Accuracy,AC)和归一化互信息(Normalized Mutual Information,NMI)作为聚类结果的评价指标。给定一个样本数据xi,ri表示获得的聚类标签,si表示样本提供的标签,正确率定义如下:
Figure BDA0001901199500000161
其中n是样本的总数,map(ri)是一个将每个聚类标签映射到等价标签的置换映射函数,最佳映射可以用Kuhn-Munkres算法。
归一化互信息是度量两张图片相似度的一种表达方式,值越大代表两张图片的相似性越高。通常用来作为图像配准中的评判准则或是目标函数。在两幅图像的灰度级数相似的情况下有良好的配准精度,较高的可靠性:
Figure BDA0001901199500000162
ni是第i个聚类的尺寸,
Figure BDA0001901199500000163
是第j个聚类的尺寸,nij表示聚类之间交叉的数量,k表示聚类的个数。
在SAR识别算法中,由于训练样本与测试样本的同一类目标有部分差异,归一化互信息高时只能说明训练结果与训练样本高度相似,会导致测试样本的识别精度有不同程度的下降,而且过拟合曲线同样说明归一化互信息无法作为评价识别结果的指标,因此采用AC作为评价SAR目标识别结果的指标。
4.仿真测试
导向滤波器重构的输入图像尺寸为128×128,重构预处理完成后,从128×128的训练集图像中心裁剪32×32或者64×64的图像块,将图像块向量化为处理为1×1024或者1×4096的图像矢量,作为表3中五种结构的输入。表3中五种结构分别为:
结构一:1024×98×3的三层前向神经网络,将dropout设置为0,权值动量因子为0.69。每一层(包含输出层)的输出激活函数均选用sigmoid函数,模型训练10次。
结构二:由两个1024×100和100×100的受限玻尔兹曼机组成。以均值为0,方差为0.05的高斯分布随机生成初始权值,0初始化所有的偏置,RBM和DBN的学习率设定为0.0045。dropout设置为0.5,权值动量因子为0.65。每一层(包含输出层)的输出激活函数均选用sigmoid函数模型训练25次。
结构三:由一个1024×98的受限玻尔兹曼机组成,以均值为0,方差为0.05的高斯分布随机生成初始权值,0初始化所有的偏置,RBM和DBN的学习率设定为0.0045,且范数约束系数取值为λ1=0,λ2=0,λ3=0.0045。dropout设置为0.5,权值动量因子为0.65。每一层(包含输出层)的输出激活函数均选用sigmoid函数,模型训练25次。
结构四:由一个1024×100的受限玻尔兹曼机组成,以均值为0,方差为0.01的高斯分布随机生成初始权值,0初始化所有的偏置,RBM和DBN的学习率设定为0.0045,且范数约束系数取值为λ1=0,λ2=0,λ3=0.0045。dropout设置为0.5,权值动量因子设置为0.65。每一层的激活函数均选用sigmoid函数,输出采用softmax分类器,模型训练25次。
结构五与结构四除了输入神经元网络结构不相同外,其他一样。
由表3可以得出,相同的网络结构下,相对于前项神经网络,深度置信网络的识别性能更好,提高了1.363%。采用堆叠玻尔兹曼机形成的深度置信网络,随着玻尔兹曼机层数及神经元的增加,数据样本少的情况下,过拟合的风险将大大增加,网络的泛化能力变差。设置合理的结构,导向重构算法对训练样本进行预处理,加权范数约束深度置信网络提取深层稀疏特征,Softmax分类器作为识别网络的输出层,可以提高网络的识别性能。
表4中,相似性约束DBN算法中对应的隐单元数目分别为1000,500和200;而每一层所使用的u向量的维度为500,500和200,最大迭代次数都设置为300次。初始网络的权值是由随机采样生成的均值为0,方差为0.01的高斯分布,而初始化所有可视层和隐含层偏置为0,学习率设定为0.002。DBN中的权衡参数设置为0.5。总体时间复杂度为O(698×1000+1000×500+500×200),简化的复杂度为O(1000×500+500×200)。L0.5范数约束DBN中层级识别系统的深度结构构建为两层,两个隐含层的节点数限定为300。DBN由RBM或稀疏受限玻尔兹曼机(Sparse Restricted Boltzmann Machine,SRBM)堆叠而成。对于RBM,其学习率取值为0.0045,对于DBN中的反向传播神经网络BPNN,其学习率设定为1。总体时间复杂度为O(4096×300+300×300)。本发明算法以均值为0,方差为0.01的高斯分布随机生成网络的初始连接权值,用0初始化所有的偏置,RBM和DBN的学习率设定为0.0045,且范数约束系数取值为λ1=0,λ2=0,λ3=0.0045,模型训练25次即可得到相对较好的输出结果。综合来看,本发明算法的识别性能更优。
表5中,SAR-HOG算子与本发明算法在测试样本为30度时比多流型低秩近似提取的特征用于识别算法时效果更好,Softmax作为分类器输出时比SVM、KNN、SRC、LCK-SVD算法分类性能更优,比SDDLSR对俯仰角发生变化时的鲁棒性更差,但是训练速度更快,识别效率更高。随着测试样本俯仰角从30度增加至45度,本发明算法的识别率降低了16.602%,比其他四种算法降低了18.71%,20.17%,20.03%,19.06%更好,比MLA+LSR的13.51%、HOG+SDDLSR的15.15%差一点。从运行时间来看,HOG+SDDLSR耗时最长,本发明算法耗时相对较短。
表1三类目标的训练数据和测试数据
Figure BDA0001901199500000181
表2扩展目标下三类目标的训练数据和测试数据
Figure BDA0001901199500000182
表3本发明中几种不同网络结构识别性能对比
Figure BDA0001901199500000191
表4不同文献识别算法的识别性能比较
Figure BDA0001901199500000192
表5俯仰角和配置发生变换时不同参考文献的识别性能
Figure BDA0001901199500000193

Claims (1)

1.一种基于导向重构与范数约束DBN的SAR目标识别算法,其特征在于步骤如下:
步骤1:基于导向滤波器的两尺度图像重构
对源图像In做拉普拉斯滤波得到高频图像Hn
Hn=In*L (1)
式中,In是第n个源图像,L是一个3×3拉普拉斯滤波器,Hn取绝对值并作局部平均用来重建特征映射图Sn
Sn=|Hn|*gr,σ (2)
式中,g是一个(2r+1)×(2r+1)高斯低通滤波器,σ是高斯低通滤波器的标准差,r和σ均为5;特征映射图对图像高频细节分量的显著性水平提供良好的表征,特征映射图的权重图如下:
Figure FDA0003749146870000011
将加权导向滤波器应用于每个视觉特征加权映射图Pn中,其相对应的源图像In作为引导图像并通过导向滤波器生成的加权图如下:
Figure FDA0003749146870000012
Figure FDA0003749146870000013
r11,r2和ε2是加权导向滤波器的参数,
Figure FDA0003749146870000014
Figure FDA0003749146870000015
是低频近似分量和高频细节分量的加权图并对其进行归一化处理;其中r1=45;ε1=0.3;r2=7;ε2=10-6
总之,利用平滑滤波器对源图像进行两尺度分解得到低频近似分量,高频细节分量则通过源图像减去低频近似分量获得,如下式:
Figure FDA0003749146870000016
Figure FDA0003749146870000017
式中:
Figure FDA0003749146870000018
是源图像的低频分量,
Figure FDA0003749146870000019
是源图像的高频分量;G是(2r+1)×(2r+1)窗口的平滑滤波器,其中r=15;
最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构低频分量
Figure FDA0003749146870000021
和高频分量
Figure FDA0003749146870000022
随后利用分量进行重构后得到重构图像,如下式:
Figure FDA0003749146870000023
Figure FDA0003749146870000024
将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像,则
Figure FDA0003749146870000025
步骤2:基于加权范数约束深度置信网络的低维特征提取
设X={x1,x2,…,xN}代表训练样本数据,xn(n=1,2,…,N)是其中第n个训练样本数据,其是由源图像In作两尺度分解和重构后的图像
Figure FDA0003749146870000026
做裁剪并扩展成一维矢量形成的,
Figure FDA0003749146870000027
是一个列向量,N表示训练样本的总数;受限玻尔兹曼机RBM将输入图像X由可视层V映射到隐层H;
在RBM中,任意两个相连的神经元之间的权值Wvh表示其连接强度,v表示可视层的随机变量,h表示隐含层的随机变量,每个神经元自身有一个可视层神经元的偏置系数b和隐含层神经元的偏置系数c来表示其自身权重;RBM的能量函数表示为:
Figure FDA0003749146870000028
θ={Wvh,b,c}表示该网络的模型系数,
Figure FDA0003749146870000029
表示第i个可视层神经元与第j个隐含层神经元之间的连接权值,hj表示第j个隐含层的神经元,vi表示第i个可视层的神经元,dx表示可视层神经元的数目,dh表示隐含层神经元的数目;可视层与隐含层的联合概率分布
Figure FDA00037491468700000210
得到可视层v的独立分布为:
Figure FDA0003749146870000031
式中dv和dh表示可视层与隐含层神经元的数量;第j个隐含层神经元hj被激活的概率和第i个可视层神经元vi被激活概率分别为:
Figure FDA0003749146870000032
Figure FDA0003749146870000033
式中,σ设定为Sigmoid函数,根据概率密度独立性,可得到下式:
Figure FDA0003749146870000034
Figure FDA0003749146870000035
RBM根据
Figure FDA0003749146870000036
计算每个隐含层神经元的开启概率P(hj|x),j=1,2,…,dh,取一个0-1的随机数μ作为阈值,隐含层每个神经元激活状态如下,可视层同理:
Figure FDA0003749146870000037
RBM共有五个参数:v是输入向量,h是输出向量,Wvh和b、c,也就是相应的权重和偏置值,是通过学习得到的;对于一个样本数据x,采用对比散度算法CD对其进行训练:
(1)将x赋给可视层v1,利用
Figure FDA0003749146870000038
计算出隐含层中每个神经元被激活的概率P(h1|v1);
(2)从计算的概率分布中采取Gibbs抽样抽取一个样本h1~P(h1|v1);
(3)用h1重构可视层,即通过隐含层反推可视层,利用
Figure FDA0003749146870000041
式计算可视层中每个神经元被激活的概率P(v2|h1);
(4)同样地,由得到的概率分布中采取Gibbs抽样抽取一个样本v2~P(v2|h1);
(5)通过v2再次计算隐含层中每个神经元被激活的概率,得到概率分布P(h2|v2);
(6)更新权重:Wvh←Wvh+λ(P(h1|v1)v1-P(h2|v2)v2)、b←b+λ(v1-v2)和c←c+λ(h1-h2);
在这个训练阶段,在可视层会产生一个向量v,通过它将值传递到隐含层;反过来,可视层的输入会被随机的选择,以尝试去重构原始的输入信号;最后,这些新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得h;这些后退和前进的步骤就是Gibbs采样,而隐含层激活单元和可视层输入之间的相关性差别就作为权值更新的主要依据;
给定一组N个训练数据{x1,x2,…,xN},则范数约束玻尔兹曼机的广义最优化问题可以描述为:
Figure FDA0003749146870000042
其中
Figure FDA0003749146870000043
表示第n个样本xn在可视层和隐含层的联合概率分布,p[hnj|xn]表示当输入层为第n个样本xn时,隐含层第j个神经元被激活的概率:
Figure FDA0003749146870000044
Figure FDA0003749146870000045
其中f(p[hnj|xn])是关于p[hnj|xn]的函数,并且p[hnj|xn]是表征样本xn对应的所有隐含层概率密度组成的向量,p[hnj|xn]={p(hn1|xl),p(hn2|xn),…,p(hnF|xn)};其中的右边一项用范数的形式表现为:
Figure FDA0003749146870000051
Figure FDA0003749146870000052
Figure FDA0003749146870000053
则三种范数正则项表示的梯度可以直接求导得出:
Figure FDA0003749146870000054
Figure FDA0003749146870000055
Figure FDA0003749146870000056
事实上,范数约束玻尔兹曼机的广义最优化问题右边的正则项,可以表示为n个不同范数的线性叠加:
Figure FDA0003749146870000057
λi表示不同范数的权重系数,
Figure FDA0003749146870000058
表示不同的p范数,为了便于算法性能验证,这里p取0.5,1,2;
通过多轮训练可以得到最佳网络模型及其系数θ={W,b,c}还有每个训练样本对应的低维特征矢量hn{n=1,2,…,N};
步骤3:基于softmax分类器的目标分类输出
对于训练集{(y1,L1),…,(yN,LN)},yn(i=1,2,…,N)是训练样本数据xn(n=1,2,…,N)经过多层RBM训练提取的输出特征矢量hn{n=1,2,…,N},数据的标签值是Ln∈{1,2,...,k};其中k是样本的种类,取值3,10;假设输出函数hW(y)形式如下:
Figure FDA0003749146870000061
其中,W1,W2,…,Wk是模型参数,
Figure FDA0003749146870000062
是归一化因子,使得输出向量的所有元素之和即总概率为1;定义示性函数1{·},若函数的输入表达式为真,则函数输出值为1,否则为0;即
Figure FDA0003749146870000063
引入示性函数得到Softmax的对数似然函数为
Figure FDA0003749146870000064
上述对数似然函数的第一项是不能用梯度下降法来更新参数的,通过添加一个权重衰减项来使代价函数满足凸函数的性质,得到最优化的解,这里λ=10-4;Softmax回归中将y分类为类别j的概率为:
Figure FDA0003749146870000065
用梯度下降法对损失函数进行求导进行优化,得到最优的目标输出函数hW(y);
Figure FDA0003749146870000066
CN201811512718.3A 2018-12-11 2018-12-11 基于导向重构与范数约束dbn的sar目标识别算法 Active CN109507655B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811512718.3A CN109507655B (zh) 2018-12-11 2018-12-11 基于导向重构与范数约束dbn的sar目标识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811512718.3A CN109507655B (zh) 2018-12-11 2018-12-11 基于导向重构与范数约束dbn的sar目标识别算法

Publications (2)

Publication Number Publication Date
CN109507655A CN109507655A (zh) 2019-03-22
CN109507655B true CN109507655B (zh) 2022-09-02

Family

ID=65753256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811512718.3A Active CN109507655B (zh) 2018-12-11 2018-12-11 基于导向重构与范数约束dbn的sar目标识别算法

Country Status (1)

Country Link
CN (1) CN109507655B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751291B (zh) * 2019-10-29 2021-02-12 支付宝(杭州)信息技术有限公司 实现安全防御的多方联合训练神经网络的方法及装置
CN111505613B (zh) * 2020-04-16 2022-05-03 电子科技大学 基于虚拟天线Kuhn-Munkres算法的MIMO雷达发射天线布置方法
CN113160114A (zh) * 2021-01-29 2021-07-23 珠海迪沃航空工程有限公司 一种用于螺栓检测的动态图像识别方法及系统
CN113033615B (zh) * 2021-03-01 2022-06-07 电子科技大学 一种基于在线微簇聚类的雷达信号目标实时关联方法
CN113095381B (zh) * 2021-03-29 2024-04-05 西安交通大学 一种基于改进型dbn的水声目标辨识方法及系统
CN115546241B (zh) * 2022-12-06 2023-04-28 成都数之联科技股份有限公司 边缘检测方法、装置、电子设备及计算机可读存储介质
CN117314763A (zh) * 2023-08-17 2023-12-29 贵州医科大学附属口腔医院 一种基于机器学习的口腔卫生管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046268A (zh) * 2015-06-18 2015-11-11 西安电子科技大学 基于Wishart深度网络的极化SAR图像分类方法
CN105809198A (zh) * 2016-03-10 2016-07-27 西安电子科技大学 基于深度置信网络的sar图像目标识别方法
CN106355151A (zh) * 2016-08-30 2017-01-25 电子科技大学 一种基于深度置信网络的三维sar图像目标识别方法
CN108171200A (zh) * 2018-01-12 2018-06-15 西安电子科技大学 基于sar图像统计分布和dbn的sar图像分类方法
CN108764064A (zh) * 2018-05-07 2018-11-06 西北工业大学 基于导向滤波器与自编码器的sar目标识别算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046268A (zh) * 2015-06-18 2015-11-11 西安电子科技大学 基于Wishart深度网络的极化SAR图像分类方法
CN105809198A (zh) * 2016-03-10 2016-07-27 西安电子科技大学 基于深度置信网络的sar图像目标识别方法
CN106355151A (zh) * 2016-08-30 2017-01-25 电子科技大学 一种基于深度置信网络的三维sar图像目标识别方法
CN108171200A (zh) * 2018-01-12 2018-06-15 西安电子科技大学 基于sar图像统计分布和dbn的sar图像分类方法
CN108764064A (zh) * 2018-05-07 2018-11-06 西北工业大学 基于导向滤波器与自编码器的sar目标识别算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SAR Automatic Target Recognition Based on Euclidean Distance Restricted Autoencoder;Sheng Deng et al.;《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》;20170731;第10卷(第7期);第3323-3333页 *
相似性约束的深度置信网络在SAR图像目标识别的应用;丁军等;《电子与信息学报》;20160131;第38卷(第1期);第97-103页 *

Also Published As

Publication number Publication date
CN109507655A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109507655B (zh) 基于导向重构与范数约束dbn的sar目标识别算法
Yue et al. A novel semi-supervised convolutional neural network method for synthetic aperture radar image recognition
Pei et al. SAR automatic target recognition based on multiview deep learning framework
Kortylewski et al. Compositional convolutional neural networks: A robust and interpretable model for object recognition under occlusion
Chen et al. SAR target recognition based on deep learning
Abdennour et al. Driver identification using only the CAN-Bus vehicle data through an RCN deep learning approach
Rogers et al. Neural networks for automatic target recognition
CN111027439A (zh) 基于辅助分类生成对抗网络的sar目标识别方法
Shi et al. Automatic target recognition for synthetic aperture radar images based on super-resolution generative adversarial network and deep convolutional neural network
CN108764064A (zh) 基于导向滤波器与自编码器的sar目标识别算法
Shao et al. A performance analysis of convolutional neural network models in SAR target recognition
CN113159264B (zh) 一种入侵检测方法、系统、设备及可读存储介质
Niu et al. Parameter extraction based on deep neural network for SAR target simulation
Mohine et al. Acoustic modality based hybrid deep 1D CNN-BiLSTM algorithm for moving vehicle classification
Wang et al. Recognition and classification of ship images based on SMS-PCNN model
Zhang et al. A novel radar target recognition method for open and imbalanced high-resolution range profile
Wang et al. A SAR target recognition based on guided reconstruction and weighted norm-constrained deep belief network
Friedlander et al. Deep learning model-based algorithm for SAR ATR
CN116664940A (zh) 一种合成孔径雷达自动目标识别的方法
CN116311067A (zh) 基于高维特征图谱的目标综合识别方法、装置及设备
Yu et al. EMC²A-Net: An Efficient Multibranch Cross-Channel Attention Network for SAR Target Classification
Zhan et al. SAR automatic target recognition based on deep convolutional neural networks
Close et al. A Bayesian approach to localized multi-kernel learning using the relevance vector machine
Jacob et al. Analysis of Deep Neural Networks for Military Target Classification using Synthetic Aperture Radar Images
Yang et al. Target Recognition and Classification of Underwater Airplane and Sunken Ship Images Based on Convolutional Neural Network with Side-scan Sonar

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant