CN105512680B - 一种基于深度神经网络的多视sar图像目标识别方法 - Google Patents

一种基于深度神经网络的多视sar图像目标识别方法 Download PDF

Info

Publication number
CN105512680B
CN105512680B CN201510873282.0A CN201510873282A CN105512680B CN 105512680 B CN105512680 B CN 105512680B CN 201510873282 A CN201510873282 A CN 201510873282A CN 105512680 B CN105512680 B CN 105512680B
Authority
CN
China
Prior art keywords
layer
image
rnn
value
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510873282.0A
Other languages
English (en)
Other versions
CN105512680A (zh
Inventor
王鹏波
李轩
李春升
门志荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201510873282.0A priority Critical patent/CN105512680B/zh
Publication of CN105512680A publication Critical patent/CN105512680A/zh
Application granted granted Critical
Publication of CN105512680B publication Critical patent/CN105512680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度神经网络的多视SAR图像目标识别方法,包括图像预处理、基于CAE的特征提取、基于RNN的多视SAR图像识别三个步骤。首先对输入图形进行裁剪,能量归一化等预处理过程,然后通过对CAE进行无监督训练提取到原始图像的特征,而后先利用上述特征构建多视SAR图像特征序列。之后,用训练集特征序列对RNN进行有监督训练。训练完成后,RNN可用于对测试集特征序列进行识别。本发明能充分利用CNN在学习和提取图像概括性特征方面的能力,及RNN充分提取序列上下文关系的能力,从而有效的提高了多视SAR图像目标的识别率,具有较高的工程价值。

Description

一种基于深度神经网络的多视SAR图像目标识别方法
技术领域
本发明涉及雷达技术领域,具体地说,是指一种基于深度神经网络的多视SAR图像目标识别方法。
背景技术
作为SAR图像解译系统的组成部分,SAR自动目标识别由于其在灾害评估、资源探测、战场侦察等军事和民用领域的重要意义,引起了研究人员的广泛关注。SAR自动目标识别主要包括特征提取和识别器的构建两个部分。对于特征提取方面,PCA、KPCA、KLDA等方法都被比较成功的运用。对于目标识别领域,模板匹配法,HMM,SVM等方法也都进行了尝试。但是,对于特征提取而言,目前的方法主要集中于对图像特征进行空间变换处理,使得不同类特征具有较好的区分性。但是,这样的做法并不能利用图像中的二维结构信息,得到的特征并不具有概括性,对噪声的鲁棒性不强。
另外,SAR图像识别最重要的指标为识别正确率。而一种有效的提升识别正确率的方法即是利用多幅属于同一目标的多视SAR图像进行联合识别。但是,已有的多视SAR图像识别方法,例如联合稀疏表示,决策级融合等等,都并不能充分利用图像之间的相关性,实现识别正确率的提升。
近年来,两种特殊的深度神经网络:卷积神经网络(Convolution NeuralNetwork,简称CNN)和循环神经网络(Recurrent Neural Network,简称RNN)在模式识别领域得到了广泛的应用。前者能够有效的提取图像中的二维结构信息,并且,其中的卷积层、降采样层交替出现的网络结构使得CNN对于图像一定程度的畸变具有识别不变性。而后者则能够有效提取序列中上下文之间的相互关系。因此,需要将两种模型的优势进行结合,在利用CNN提取特征的基础上,运用RNN提取相互关系,实现多视SAR图像目标识别。
发明内容
本发明的目的是从特征提取和目标识别两个角度入手,提升多视SAR图像目标识别率。本发明将CNN中的所有的卷积层和降采样层当做卷积稀疏自编码器(ConvolutionalAuto-Encoder,简称CAE)进行无监督训练,用于特征提取。此后,利用RNN对多视SAR图像经过CAE提取后的特征进行识别。这样可以充分利用CNN和RNN的优势,提升多视SAR图像识别正确率。
一种基于深度神经网络的多视SAR图像目标识别方法,主要包括以下步骤:
步骤一、对输入的训练集图像和测试集图像进行尺寸裁剪,能量归一化等预处理过程。
(1)以原始图像的目标中心为中心进行裁剪,仅保留原图中目标的部分。
(2)对裁剪后的图像进行能量归一化处理
其中式(1)中,x(i,j)表示原图中(i,j)像素点的原始值,m为原图中各个像素点的均值,σ为原图中各个像素点的均方差,为经过归一化后的图像中(i,j)像素点的值;
步骤二、构建包含卷积层和降采样层的卷积稀疏自编码器(Convolutional Auto-Encoder,简称CAE),并采用类似于稀疏自编码器(Sparse Auto-Encoder,简称SAE)的无监督训练方法对CAE进行无监督训练,利用完成训练的CAE提取原始图像的特征。并对提取到的特征进行降维处理。
(1)初始化CAE;建立含有卷积层L层,降采样层L层的CAE,其中,卷积层与降采样层交替排列,设第k层卷积层和第k层降采样层所含子图个数为Mk
(2)构建训练所用输入数据Xdata
设输入图像的尺寸为n1×n1,个数为N1,第1层卷积层单元的局部感知域尺寸为m1×m1,卷积层的子图个数为M1,构建尺寸为m1 2×N1(n1-m1+1)2的原始输入数据矩阵X。运用m1×m1的矩形窗在原始图像上进行滑动,遍历整个图像。同时,将矩形窗在各个位置所对应的窗内原始图像数据转换为向量,构成X中的某一列。随机分配该向量在X中的位置。选取X中的某些列,构建训练所用的输入数据Xdata
(3)构建SAE;
输入层节点的个数为输入数据Xdata中数据的维度m1 2,隐含层节点的个数为卷积层的子图个数M1,输出层节点的个数为与输入层相同,隐含层和输出层可以根据下式获得。
hi=f(Wxi+b1) (2)
yi=f(Uhi+b2) (3)
其中,xi表示Xdata中的第i列,作为输入数据。hi为隐含层节点的值。yi为输出层节点的值,W为隐含层与输出层之间的转移矩阵,U为隐含层与输出层之间的转移矩阵,b1,b2分别为隐含层和输出层偏置向量,W,U的初始值在的范围中随机选择,b1,b2的初始值为0。f()为sigmoid函数,即
(4)无监督训练SAE;
无监督训练的目标函数为
其中N表示Xdata中的数据个数,β为稀疏准则的权重,ρ稀疏参数,ρj为隐含层第j个节点的平均值,KL()表示KL散度,λ为权值衰减参数。第一项表示输入和输出的差别,第二项表示对隐含层提取到的特征进行稀疏性限制,最后一项表示对网络参数值的惩罚项。
以式(4)为目标函数,采用L-bfgs优化方法对网络参数进行更新,直至网络收敛为止。
(5)卷积和降采样操作;
对于第1层卷积层和第1层降采样层而言。第1层卷积层中子图的尺寸为(n1-m1+1)×(n1-m1+1),子图k中第(i,j)个点的取值ck(i,j)为:
其中,x(i,j)为由原始图像中由(i,j),(i+m1-1,j),(i,j+m1-1),(i+m1-1,j+m1-1)所限定的m1×m1的区域转化为的m1 2×1的向量,wk为第k个子图的权重,为第(3)步中获得的W矩阵中的第k行,b1 (k)为第k个子图的偏置,为第(3)步中获得的b1向量中的第k个元素。
降采样层的子图个数与前一层卷积层的子图个数相同,设第1层降采样层中单元对应的局部感知域大小为p1×p1,不同单元对应的局部感知域不重叠,降采样层的子图k中第(i,j)个点的取值sk(i,j)为:
如果构建的CAE中卷积层和降采样层的个数等于1时,则直接进行第(7)步,否则执行第(6)步。
(6)对下一层卷积层和降采样层进行无监督训练;
设第k层降采样层的子图尺寸为nk×nk,子图个数为Mk-1,原始输入图像个数为N,下一层卷积层单元的局部感知域尺寸为mk×mk,子图个数为Mk,构建尺寸为 的原始输入数据矩阵Xk。运用mk×mk的矩形窗在上一层降采样层中的各个子图上滑动,遍历整个子图。同时,将矩形窗在各个子图同样位置所对应的窗内子图数据合并为一个向量,构成Xk中的某一列。随机分配该向量在Xk中的位置。选取Xk中的某些列,构建训练所用的输入数据Xdata
将Xdata作为SAE的输入,重复第(2)~(6)步,逐层训练,直至训练完(1)步中构建的CAE中的所有层。
(7)获取图像特征;
设最后一层降采样层的子图尺寸为nL×nL,子图个数为NL。将每个子图都转化为 的向量,并将这NL个向量拼接为尺寸为的向量。对该向量采用PCA方法,进行降维处理,获得图像特征。
步骤三、采用步骤二中获取到的特征,构建多视SAR图像特征序列,对循环神经网络(Recurrent Neural Network,简称RNN)进行有监督训练。完成训练后,利用该RNN对测试集数据进行识别。
(1)构建多视SAR图像特征序列;
根据SAR图像的视角信息,将具有固定视角间隔的多幅属于同一目标的SAR图像利用步骤二所提取到的特征进行组合,得到多视SAR图像特征序列。假设共构建了N个序列,每个序列中共含有M个图像特征。
(2)初始化RNN;
设置RNN的输入层左半部节点数与输入特征的维数相同,RNN的输入层右半部节点数与RNN中隐含层的节点数相同,输出层节点数与待分类的类别数相同,每个节点与一种类别相对应。设利用步骤二获得的特征维数为m,RNN的隐含层节点个数为u,输出层节点数为n,则RNN的输入层含有m+u个节点。RNN中相邻两层间的转移矩阵的初始值随机获得,服从标准正态分布。各偏置向量中每个单元的初始值为0。利用步骤(1)中获得的多视SAR图像特征序列作为RNN的输入。设此时输入的特征为xt
此时,第1层隐含层节点的取值ht,由式(7)获得
ht=f(W1xt+W2ht-1dh) (7)
其中,ht-1为序列中前一特征对应的隐含层节点值,令当t=1时,序列中前一特征所对应的隐含层取值h0中每个单元的值为0。W1为当前时刻输入与隐含层之间的转移矩阵,W2为序列中前一特征对应的隐含层取值与此时隐含层之间的转移矩阵,dh为隐含层所对应的偏置向量,f()为sigmoid函数。
输出层节点中第k个节点的值由式(8)获得
其中,W3为隐含层与输出层之间的转移矩阵,do为输出层所对应的偏置向量。ht为当前时刻隐含层节点的值。为W3矩阵中的第k行,为do向量中的第k个单元。
此后,将序列中下一特征xt+1和通过式(7)得到的ht输入到RNN中,重复执行本步,直至处理完序列中所有特征为止。
(3)有监督训练RNN;
网络有监督训练的目标函数为:
其中,N为序列个数,M为序列中图像特征个数,yij表示第j个序列中第i个特征对应的输出结果,pij为对应特征的标注,设该特征属于第k类,则pij中第k个单元值为1,其他单元值为0,λ为权值衰减参数。为矩阵W的Frobenius范数。采用BPTT的更新策略训练RNN,并用共轭梯度法对网络参数进行更新,直至收敛为止。
(4)利用RNN进行识别
采用步骤(1)中的方法对测试集图像构建具有与训练集相同视角间隔的多视SAR图像特征序列。将该序列代入式(7)~(8),得到网络的输出yavg
其中yt表示序列中第t个特征对应的网络输出。取出yavg中最大的值,设yavg中第k个单元值为yavg中的最大值,则测试图像属于第k类。
本发明的优点在于:
(1)本发明通过将CNN中对特征提取至关重要的卷积层和降采样层独立为CAE,进行无监督训练。这样可以有效的利用CNN的结构特点提取有效利用原始图像信息的特征。从而保证该方法具有较强的鲁棒性;
(2)本发明运用在自然语言处理中得到广泛应用的RNN,将其应用在多视SAR图像目标识别领域。由于RNN具有较强的提取序列中的上下文相关性,因此,本发明可以充分利用多视SAR图像之间的相关性,实现识别正确率的提升。
附图说明
图1为本发明的流程图;
图2为CAE结构示意图
图3为CAE第1层卷积层进行无监督训练所用的数据结构图;
图4为SAE无监督训练的示意图;
图5为CAE卷积降采样操作的示意图;
图6为CAE第k层(k>1)卷积层进行无监督训练所用的数据结构图;
图7为RNN结构示意图;
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明是一种基于深度神经网络的多视SAR图像目标识别方法,流程如图1所示,包括以下几个步骤:
步骤一、对输入的训练集图像和测试集图像进行尺寸裁剪,能量归一化等预处理过程。
(1)以原始图像的目标中心为中心进行裁剪,仅保留原图中目标的部分。
(2)对裁剪后的图像进行能量归一化处理
其中式(1)中,x(i,j)表示原图中(i,j)像素点的原始值,m为原图中各个像素点的均值,σ为原图中各个像素点的均方差,为经过归一化后的图像中(i,j)像素点的值;
步骤二、构建包含卷积层和降采样层的卷积稀疏自编码器(Convolutional Auto-Encoder,简称CAE),并采用类似于稀疏自编码器(Sparse Auto-Encoder,简称SAE)的无监督训练方法对CAE进行无监督训练,利用完成训练的CAE提取原始图像的特征。并对提取到的特征进行降维处理。
(1)初始化CAE;建立含有卷积层L层,降采样层L层的CAE,构建如图2所示,卷积层与降采样层交替排列,设第k层卷积层和第k层降采样层所含子图个数为Mk
(2)构建训练所用输入数据Xdata
设输入图像的尺寸为n1×n1,个数为N1,第1层卷积层单元的局部感知域尺寸为m1×m1,卷积层的子图个数为M1,构建尺寸为m1 2×N1(n1-m1+1)2的原始输入数据矩阵X。运用m1×m1的矩形窗在原始图像上进行滑动,遍历整个图像。同时,将矩形窗在各个位置所对应的窗内原始图像数据转换为向量,构成X中的某一列,随机分配该向量在X中的位置。如图3所示。选取X中的某些列,构建训练所用的输入数据Xdata
(3)构建SAE;
如图4所示,输入层节点的个数为输入数据Xdata中数据的维度m1 2,隐含层节点的个数为卷积层的子图个数M1,输出层节点的个数为与输入层相同,隐含层和输出层可以根据下式获得。
hi=f(Wxi+b1) (2)
yi=f(Uhi+b2) (3)
其中,xi表示Xdata中的第i列,作为输入数据。hi为隐含层节点的值。yi为输出层节点的值,W为隐含层与输出层之间的转移矩阵,U为隐含层与输出层之间的转移矩阵,b1,b2分别为隐含层和输出层偏置向量,W,U的初始值在的范围中随机选择,b1,b2的初始值为0。f()为sigmoid函数,即
(4)无监督训练SAE;
无监督训练的目标函数为
其中N表示Xdata中的数据个数,β为稀疏准则的权重,ρ稀疏参数,ρj为隐含层第j个节点的平均值,KL()表示KL散度,λ为权值衰减参数。第一项表示输入和输出的差别,第二项表示对隐含层提取到的特征进行稀疏性限制,最后一项表示对网络参数值的惩罚项。
以式(4)为目标函数,采用L-bfgs优化方法对网络参数进行更新,直至网络收敛为止。
(5)卷积和降采样操作;
对于第1层卷积层和第1层降采样层而言,如图5所示,输入图像的尺寸为n1×n1,设第1层卷积层和第1层降采样层所含子图个数为M1,第1层卷积层单元的局部感知域尺寸为m1×m1,第1层卷积层中子图的尺寸为(n1-m1+1)×(n1-m1+1),子图k中第(i,j)个点的取值ck(i,j)为:
其中,x(i,j)为由原始图像中由(i,j),(i+m1-1,j),(i,j+m1-1),(i+m1-1,j+m1-1)所限定的m1×m1的区域转化为的m1 2×1的向量,wk为第k个子图的权重,为第(3)步中获得的W矩阵中的第k行,b1 (k)为第k个子图的偏置,为第(3)步中获得的b1向量中的第k个元素。
如图5所示,降采样层的子图个数与前一层卷积层的子图个数相同,设第1层降采样层中单元对应的局部感知域大小为p1×p1,不同单元对应的局部感知域不重叠,降采样层的子图k中第(i,j)个点的取值sk(i,j)为:
如果构建的CAE中卷积层和降采样层的个数等于1时,则直接进行第(7)步,否则执行第(6)步。
(6)对下一层卷积层和降采样层进行无监督训练;
设第k层降采样层的子图尺寸为nk×nk,子图个数为Mk-1,原始输入图像个数为N,下一层卷积层单元的局部感知域尺寸为mk×mk,子图个数为Mk,构建尺寸为 的原始输入数据矩阵Xk。运用mk×mk的矩形窗在上一层降采样层中的各个子图上滑动后,遍历整个子图。同时,将矩形窗在各个子图同样位置所对应的窗内子图数据合并为一个向量,构成Xk中的某一列。如图6所示。随机分配该向量在Xk中的位置。选取Xk中的某些列,构建训练所用的输入数据Xdata
将Xdata作为SAE的输入,重复第(2)~(6)步,逐层训练,直至训练完(1)步中构建的CAE中的所有层。
(7)获取图像特征;
设最后一层降采样层的子图尺寸为nL×nL,子图个数为NL。将每个子图都转化为 的向量,并将这NL个向量拼接为尺寸为的向量,对该向量采用PCA方法,进行降维处理,获得图像特征。
步骤三、采用步骤二中获取到的特征,构建多视SAR图像特征序列,对循环神经网络(Recurrent Neural Network,简称RNN)进行有监督训练。完成训练后,利用该RNN对测试集数据进行识别。
(1)构建多视SAR图像特征序列;
根据SAR图像的视角信息,将具有固定视角间隔的多幅属于同一目标的SAR图像利用步骤二所提取到的特征进行组合,得到多视SAR图像特征序列。假设共构建了N个序列,每个序列中共含有M个图像特征。
(2)初始化RNN;
如图7所示,初始化RNN。设置RNN的输入层左半部节点数与输入特征的维数相同,RNN的输入层右半部节点数与RNN中隐含层的节点数相同,输出层节点数与待分类的类别数相同,每个节点与一种类别相对应。设利用步骤二获得的特征维数为m,RNN的隐含层节点个数为u,输出层节点数为n,则RNN的输入层含有m+u个节点。RNN中相邻两层间的转移矩阵的初始值随机获得,服从标准正态分布。各偏置向量中每个单元的初始值为0。利用步骤(1)中获得的多视SAR图像特征序列作为RNN的输入。设此时输入的特征为xt
此时,第1层隐含层节点的取值ht,由式(7)获得
ht=f(W1xt+W2ht-1dh) (7)
其中,ht-1为序列中前一特征对应的隐含层节点值,令当t=1时,序列中前一特征所对应的隐含层取值h0中每个单元的值为0。W1为当前时刻输入与隐含层之间的转移矩阵,W2为序列中前一特征对应的隐含层取值与此时隐含层之间的转移矩阵,dh为隐含层所对应的偏置向量,f()为sigmoid函数。
输出层节点中第k个节点的值由式(8)获得
其中,W3为隐含层与输出层之间的转移矩阵,do为输出层所对应的偏置向量。ht为当前时刻隐含层节点的值。为W3矩阵中的第k行,为do向量中的第k个单元。
此后,将序列中下一特征xt+1和通过式(7)得到的ht输入到RNN中,重复执行本步,直至处理完序列中所有特征为止。
(3)有监督训练RNN;
网络有监督训练的目标函数为:
其中,N为序列个数,M为序列中图像特征个数,yij表示第j个序列中第i个特征对应的输出结果,pij为对应特征的标注,设该特征属于第k类,则pij中第k个单元值为1,其他单元值为0,λ为权值衰减参数。为矩阵W的Frobenius范数。采用BPTT的更新策略训练RNN,并用共轭梯度法对网络参数进行更新,直至收敛为止。
(4)利用RNN进行识别
采用步骤(1)中的方法对测试集图像构建具有与训练集相同视角间隔的多视SAR图像特征序列。将该序列代入式(7)~(8),得到网络的输出yavg
其中yt表示序列中第t个特征对应的网络输出。取出yavg中最大的值,设yavg中第k个单元值为yavg中的最大值,则测试图像属于第k类。
实施例:
一种基于深度神经网络的多视SAR图像目标识别方法,具体为:
步骤一、对输入的训练集图像和测试集图像进行尺寸裁剪,能量归一化等预处理过程。
选取MSATR数据库中的T72,BMP2,BTR70三个数据集,其中训练集为在17度俯视角下采集的T72_132,BMP2_S71,BTR70_C71三个数据集,测试集为在15度俯视角才采集的T72_132,T72_812,T72_S7,BMP2_9563,BMP2_9566,BMP2_S71,BTR70_C71这7个数据集。
(1)将原始的训练图像和获得的各种分辨率的测试图像进行裁剪,由128×128裁剪为64×64。
(2)采用能量归一化方法对训练集图像和测试集图像进行归一化操作。公式如下
步骤二、构建包含卷积层和降采样层的卷积稀疏自编码器(Convolutional Auto-Encoder,简称CAE),并采用类似于稀疏自编码器(Sparse Auto-Encoder,简称SAE)的无监督训练方法对CAE进行无监督训练,利用完成训练的CAE提取原始图像的概括性特征。并对提取到的特征进行降维处理。
(1)构建如图2所示CAE,含有一层卷积层和一层降采样层。其中,卷积层的局部感知域尺寸为23×23,子图个数为16。降采样层的局部感知域尺寸为3×3。
(2)构建训练所用输入数据Xdata
输入训练图像的尺寸为64×64,个数为698,构建尺寸为1225×1231272的原始输入数据矩阵X。通过23×23的矩形窗在原始图像上进行滑动,遍历整个图像。同时,将矩形窗在各个位置所对应的窗内原始图像数据转换为向量,构成X中的某一列,随机分配该向量在X中的位置。如图3所示,选取X中的前1/6列,构建训练所用的输入数据Xdata,尺寸为1225×205212。
(3)构建SAE;
如图4所示,输入层节点的个数为数据的维度1225,隐含层节点的个数为16,输出层节点的个数为与输入层相同,隐含层和输出层可以根据下式获得。
hi=f(Wxi+b1) (2)
yi=f(Uhi+b2) (3)
其中,W,U的初始值在的范围中随机选择,b1,b2的初始值为0。
(4)无监督训练SAE;
无监督训练的目标函数为
其中,取N为205212,β为3,ρ为0.04,λ为8e-2。
以式(4)为目标函数,采用L-bfgs优化方法对网络参数进行更新,步长因子初始值为1,采用Wolfe线性搜索,其中,充分下降条件系数为1e-4,曲率条件系数为0.9。利用过去50代的信息修正Hessian矩阵的估计。最大更新周期为100,收敛的条件为目标函数值的变化小于1e-9或者参数的最大变化幅度小于1e-9。
(5)卷积和降采样操作;
对于第1层卷积层和第1层降采样层而言,如图5所示。第1层卷积层中子图的尺寸为42×42,子图k中第(i,j)个点的取值ck(i,j)为:
降采样层中,子图k中第(i,j)个点的取值sk(i,j)为:
(6)获取图像特征;
最后一层降采样层的子图尺寸为14×14,子图个数为16。将每个子图都转化为196×1的向量,并将这16个向量拼接为尺寸为3136×1的向量。并对该向量,采用PCA方法进行降维。取前240个主成分,此时累积方差贡献率大于99%。特征的维度由3136维降至240维。获得图像特征。
步骤三、采用步骤二中获取到的特征,构建多视SAR图像特征序列,对循环神经网络(Recurrent Neural Network,简称RNN)进行有监督训练。完成训练后,利用该RNN对测试集数据进行识别。
(1)构建多视SAR图像特征序列;
根据SAR图像的视角信息,将具有30°视角间隔的3幅属于同一目标的SAR图像利用步骤二所提取到的特征进行组合,得到多视SAR图像特征序列。共构建649个序列。
(2)初始化RNN;
如图7所示,构建RNN。设RNN的隐含层节点个数为200,输出层节点数为3,则RNN的输入层含有440个节点。RNN中相邻两层间的转移矩阵的初始值随机获得,服从标准正态分布。各偏置向量中每个单元的初始值为0。利用步骤(1)中获得的多视SAR图像特征序列作为RNN的输入。设此时输入的特征为xt
此时,第1层隐含层节点的取值ht,由式(7)获得
ht=f(W1xt+W2ht-1dh) (7)
其中,ht-1为序列中前一特征对应的隐含层节点值,令当t=1时,序列中前一特征所对应的隐含层取值h0中每个单元的值为0。W1为当前时刻输入与隐含层之间的转移矩阵,W2为序列中前一特征对应的隐含层取值与此时隐含层之间的转移矩阵,dh为隐含层所对应的偏置向量,f()为sigmoid函数。
输出层节点中第k个节点的值由式(8)获得
其中,W3为隐含层与输出层之间的转移矩阵,do为输出层所对应的偏置向量。ht为当前时刻隐含层节点的值。为W3矩阵中的第k行,为do向量中的第k个单元。
此后,将序列中下一特征xt+1和通过式(7)得到的ht输入到RNN中,重复执行本步,直至处理完序列中所有特征为止。
(3)有监督训练RNN;
网络有监督训练的目标函数为:
其中,N为649,M为3,λ为1e-4。来自于T72_132训练集的数据,pi定义为[1,0,0];来自于BMP2_S71训练集的数据,pi定义为[0,1,0];来自于BTR70_C71训练集的数据,pi定义为[0,0,1]。
采用BPTT的更新策略训练RNN,并用共轭梯度方法对网络参数进行更新,直至收敛为止。以式(9)为目标函数,最大更新周期为10,收敛的条件为目标函数值的变化小于1e-9或者参数的最大变化幅度小于1e-9。
(4)利用RNN进行识别
采用步骤(1)中的方法对测试集图像构建具有与训练集相同视角间隔的多视SAR图像特征序列。将该序列代入式(7)~(8),得到网络的输出yavg
其中yi表示序列中第i个特征对应的网络输出。取出yavg中最大的值。若yavg中第一个单元值最大,则该测试图像属于T72类,若yavg中第二个单元值最大,则该测试图像属于BMP2类,若yavg中第三个单元值最大,则该测试图像属于BTR70类。
仿真验证:
按照具体实施例中所使用的数据和模型的参数,进行训练和识别。同时,为证明本发明所提出方法的鲁棒性,我们通过采用对原有测试集SAR图像中随机选取的部分极值点置随机值的方法获得具有不同遮挡率的测试集图像,进行模型的训练和识别。另外,也采用PCA、KPCA的特征提取方法,决策级融合、联合稀疏表示的多视SAR图像识别方法进行了对比实验。实验基于Intel(R)Core(TM)i5-3210M@2.50GHz CPU的计算机。实验结果如下:
表1在不同遮挡率下利用PCA特征的多视SAR图像识别结果
表2在不同遮挡率下利用KPCA特征的多视SAR图像识别结果
表3在不同遮挡率下利用CAE特征的多视SAR图像识别结果
根据以上三个表中的结果可得,随着遮挡率的增加,本发明所提出的基于CAE的特征提取方法,和基于RNN的多视SAR图像目标识别方法,都能取得优于其他特征提取和目标识别方法的结果,并且具有较强的鲁棒性。同时,将基于CAE的特征提取方法与基于RNN的目标识别方法相结合,可以取得最优的识别正确率。通过实验的结果,验证了本发明所提出的方法的实用性。

Claims (1)

1.一种基于深度神经网络的多视SAR图像目标识别方法,包括以下步骤:
步骤一、对输入的训练集图像和测试集图像进行尺寸裁剪,能量归一化预处理过程;
(1)以原始图像的目标中心为中心进行裁剪,仅保留原图中目标的部分;
(2)对裁剪后的图像进行能量归一化处理
其中式(1)中,x(i,j)表示原图中(i,j)像素点的原始值,m为原图中各个像素点的均值,σ为原图中各个像素点的均方差,为经过归一化后的图像中(i,j)像素点的值;
步骤二、构建包含卷积层和降采样层的卷积稀疏自编码器CAE,并采用类似于稀疏自编码器SAE的无监督训练方法对CAE进行无监督训练,利用完成训练的CAE提取原始图像的特征,并对提取到的特征进行降维处理;
(1)初始化CAE;建立含有卷积层L层,降采样层L层的CAE,其中,卷积层与降采样层交替排列,设第k层卷积层和第k层降采样层所含子图个数为Mk
(2)构建训练所用输入数据Xdata
设输入图像的尺寸为n1×n1,个数为N1,第1层卷积层单元的局部感知域尺寸为m1×m1,卷积层的子图个数为M1,构建尺寸为m1 2×N1(n1-m1+1)2的原始输入数据矩阵X;运用m1×m1的矩形窗在原始图像上进行滑动,遍历整个图像;同时,将矩形窗在各个位置所对应的窗内原始图像数据转换为向量,构成X中的某一列;随机分配该向量在X中的位置;选取X中的某些列,构建训练所用的输入数据Xdata
(3)构建SAE;
输入层节点的个数为输入数据Xdata中数据的维度m1 2,隐含层节点的个数为卷积层的子图个数M1,输出层节点的个数为与输入层相同,隐含层和输出层根据下式获得;
hi=f(Wxi+b1) (2)
yi=f(Uhi+b2) (3)
其中,xi表示Xdata中的第i列,作为输入数据;hi为隐含层节点的值;yi为输出层节点的值,W为隐含层与输出层之间的转移矩阵,U为隐含层与输出层之间的转移矩阵,b1,b2分别为隐含层和输出层偏置向量,W,U的初始值在的范围中随机选择,b1,b2的初始值为0;f()为sigmoid函数,即
(4)无监督训练SAE;
无监督训练的目标函数为
其中N表示Xdata中的数据个数,β为稀疏准则的权重,ρ稀疏参数,ρj为隐含层第j个节点的平均值,KL()表示KL散度,λ为权值衰减参数;第一项表示输入和输出的差别,第二项表示对隐含层提取到的特征进行稀疏性限制,最后一项表示对网络参数值的惩罚项;
以式(4)为目标函数,采用L-bfgs优化方法对网络参数进行更新,直至网络收敛为止;
(5)卷积和降采样操作;
第1层卷积层中子图的尺寸为(n1-m1+1)×(n1-m1+1),子图k中第(i,j)个点的取值ck(i,j)为:
其中,x(i,j)为由原始图像中由(i,j),(i+m1-1,j),(i,j+m1-1),(i+m1-1,j+m1-1)所限定的m1×m1的区域转化为的m1 2×1的向量,wk为第k个子图的权重,为第(3)步中获得的W矩阵中的第k行,b1 (k)为第k个子图的偏置,为第(3)步中获得的b1向量中的第k个元素;
降采样层的子图个数与前一层卷积层的子图个数相同,设第1层降采样层中单元对应的局部感知域大小为p1×p1,不同单元对应的局部感知域不重叠,降采样层的子图k中第(i,j)个点的取值sk(i,j)为:
如果构建的CAE中卷积层和降采样层的个数等于1时,则直接进行第(7)步,否则执行第(6)步;
(6)对下一层卷积层和降采样层进行无监督训练;
设第k层降采样层的子图尺寸为nk×nk,子图个数为Mk-1,原始输入图像个数为N,下一层卷积层单元的局部感知域尺寸为mk×mk,子图个数为Mk,构建尺寸为Mk-1mk 2×N(nk-mk+1)2的原始输入数据矩阵Xk;运用mk×mk的矩形窗在上一层降采样层中的各个子图上滑动后,遍历整个子图;同时,将矩形窗在各个子图同样位置所对应的窗内子图数据合并为一个向量,构成Xk中的某一列;随机分配该向量在Xk中的位置;选取Xk中的某些列,构建训练所用的输入数据Xdata
将Xdata作为SAE的输入,重复第(2)~(6)步,逐层训练,直至训练完(1)步中构建的CAE中的所有层;
(7)获取图像特征;
设最后一层降采样层的子图尺寸为nL×nL,子图个数为NL;将每个子图都转化为nL 2×1的向量,并将这NL个向量拼接为尺寸为NLnL 2×1的向量;对该向量采用PCA方法,进行降维处理,获得图像特征;
步骤三、采用步骤二中获取到的特征,构建多视SAR图像特征序列,对循环神经网络RNN进行有监督训练,完成训练后,利用该RNN对测试集数据进行识别;
(1)构建多视SAR图像特征序列;
根据SAR图像的视角信息,将具有固定视角间隔的多幅属于同一目标的SAR图像利用步骤二所提取到的特征进行组合,得到多视SAR图像特征序列;假设共构建了N个序列,每个序列中共含有M个图像特征;
(2)初始化RNN;
设置RNN的输入层左半部节点数与输入特征的维数相同,RNN的输入层右半部节点数与RNN中隐含层的节点数相同,输出层节点数与待分类的类别数相同,每个节点与一种类别相对应;设利用步骤二获得的特征维数为m,RNN的隐含层节点个数为u,输出层节点数为n,则RNN的输入层含有m+u个节点;RNN中相邻两层间的转移矩阵的初始值随机获得,服从标准正态分布;各偏置向量中每个单元的初始值为0;利用步骤(1)中获得的多视SAR图像特征序列作为RNN的输入;设此时输入的特征为xt
此时,第1层隐含层节点的取值ht,由式(7)获得
ht=f(W1xt+W2ht-1dh) (7)
其中,ht-1为序列中前一特征对应的隐含层节点值,令当t=1时,序列中前一特征所对应的隐含层取值h0中每个单元的值为0;W1为当前时刻输入与隐含层之间的转移矩阵,W2为序列中前一特征对应的隐含层取值与此时隐含层之间的转移矩阵,dh为隐含层所对应的偏置向量,f()为sigmoid函数;
输出层节点中第k个节点的值由式(8)获得
其中,W3为隐含层与输出层之间的转移矩阵,do为输出层所对应的偏置向量;ht为当前时刻隐含层节点的值;w3 (k)为W3矩阵中的第k行,do (k)为do向量中的第k个单元;
将序列中下一特征xt+1和通过式(7)得到的ht输入到RNN中,重复执行本步,直至处理完序列中所有特征为止;
(3)有监督训练RNN;
网络有监督训练的目标函数为:
其中,N为序列个数,M为序列中图像特征个数,yij表示第j个序列中第i个特征对应的输出结果,pij为对应特征的标注,设该特征属于第k类,则pij中第k个单元值为1,其他单元值为0,λ为权值衰减参数;为矩阵W的Frobenius范数;采用BPTT的更新策略训练RNN,并用共轭梯度法对网络参数进行更新,直至收敛为止;
(4)利用RNN进行识别
对测试集图像构建具有与训练集相同视角间隔的多视SAR图像特征序列,将该序列代入式(7)~(8),得到网络的输出yavg
其中yi表示序列中第i个特征对应的网络输出;取出yavg中最大的值,设yavg中第k个单元值yavg (k)为yavg中的最大值,则测试图像属于第k类。
CN201510873282.0A 2015-12-02 2015-12-02 一种基于深度神经网络的多视sar图像目标识别方法 Active CN105512680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510873282.0A CN105512680B (zh) 2015-12-02 2015-12-02 一种基于深度神经网络的多视sar图像目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510873282.0A CN105512680B (zh) 2015-12-02 2015-12-02 一种基于深度神经网络的多视sar图像目标识别方法

Publications (2)

Publication Number Publication Date
CN105512680A CN105512680A (zh) 2016-04-20
CN105512680B true CN105512680B (zh) 2019-01-08

Family

ID=55720646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510873282.0A Active CN105512680B (zh) 2015-12-02 2015-12-02 一种基于深度神经网络的多视sar图像目标识别方法

Country Status (1)

Country Link
CN (1) CN105512680B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709997B (zh) * 2016-04-29 2019-07-19 电子科技大学 基于深度神经网络和稀疏自编码器的三维关键点检测方法
CN106022239A (zh) * 2016-05-13 2016-10-12 电子科技大学 一种基于循环神经网络的多目标跟踪方法
CN106067096B (zh) * 2016-06-24 2019-09-17 北京邮电大学 一种数据处理方法、装置及系统
CN106203493B (zh) * 2016-07-04 2019-07-12 何广森 一种食物识别装置及识别方法
CN107229967B (zh) * 2016-08-22 2021-06-15 赛灵思公司 一种基于fpga实现稀疏化gru神经网络的硬件加速器及方法
CN106372107B (zh) * 2016-08-19 2020-01-17 中兴通讯股份有限公司 自然语言文句库的生成方法及装置
CN106778835B (zh) * 2016-11-29 2020-03-24 武汉大学 融合场景信息和深度特征的遥感图像机场目标识别方法
CN107122375B (zh) * 2016-12-12 2020-11-06 南京理工大学 基于图像特征的图像主体的识别方法
CN107203598A (zh) * 2017-05-08 2017-09-26 广州智慧城市发展研究院 一种实现图像转换标签的方法及系统
CN107239751B (zh) * 2017-05-22 2020-11-03 西安电子科技大学 基于非下采样轮廓波全卷积网络的高分辨sar图像分类方法
CN107273929A (zh) * 2017-06-14 2017-10-20 电子科技大学 一种基于深度协同神经网络的无人机自主降落方法
TWI636404B (zh) * 2017-07-31 2018-09-21 財團法人工業技術研究院 深度神經網路、使用深度神經網路的方法與電腦可讀媒體
CN107527069A (zh) 2017-08-22 2017-12-29 京东方科技集团股份有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN108153943B (zh) * 2017-12-08 2021-07-23 南京航空航天大学 基于时钟循环神经网络的功率放大器的行为建模方法
CN108388907B (zh) * 2017-12-29 2021-03-02 中国科学院自动化研究所 基于多视角学习的极化sar数据分类器实时更新方法
CN108334906B (zh) * 2018-02-08 2021-02-23 北京鑫车科技有限公司 一种金融典当服务的抵押物自动识别评估方法和装置
CN108256634A (zh) * 2018-02-08 2018-07-06 杭州电子科技大学 一种基于轻量级深度神经网络的船舶目标检测方法
CN108776779B (zh) * 2018-05-25 2022-09-23 西安电子科技大学 基于卷积循环网络的sar序列图像目标识别方法
CN108765338A (zh) * 2018-05-28 2018-11-06 西华大学 基于卷积自编码卷积神经网络的空间目标图像复原方法
CN109086700B (zh) * 2018-07-20 2021-08-13 杭州电子科技大学 基于深度卷积神经网络的雷达一维距离像目标识别方法
CN109146803B (zh) * 2018-07-26 2021-08-17 北京航空航天大学 基于多角度图像的sar图像辐射分辨率提升方法及装置
CN109101629A (zh) * 2018-08-14 2018-12-28 合肥工业大学 一种基于深度网络结构和节点属性的网络表示方法
CN109214452B (zh) * 2018-08-29 2020-06-23 杭州电子科技大学 基于注意深度双向循环神经网络的hrrp目标识别方法
CN109993050B (zh) * 2018-11-28 2019-12-27 中国人民解放军国防科技大学 一种合成孔径雷达图像识别方法
CN110045362B (zh) * 2019-03-01 2022-02-22 合肥工业大学 基于rnn的雷达目标航迹识别方法和装置
CN109871907B (zh) * 2019-03-19 2023-04-18 山东大学 基于sae-hmm模型的雷达目标高分辨率距离像识别方法
CN109977969A (zh) * 2019-03-27 2019-07-05 北京经纬恒润科技有限公司 一种图像识别方法及装置
CN110187321B (zh) * 2019-05-30 2022-07-22 电子科技大学 基于深度学习的复杂环境下雷达辐射源特征参数提取方法
CN110118657B (zh) * 2019-06-21 2021-06-11 杭州安脉盛智能技术有限公司 基于相对熵和k最近邻算法滚动轴承故障诊断方法及系统
CN110766084B (zh) * 2019-10-28 2021-06-15 北京理工大学 基于cae与hl-cnn的小样本sar目标识别方法
CN111581298B (zh) * 2020-04-29 2023-11-14 北华航天工业学院 大数据仓库的异构数据整合系统及方法
CN111985532B (zh) * 2020-07-10 2021-11-09 西安理工大学 一种场景级上下文感知的情感识别深度网络方法
CN112147592A (zh) * 2020-08-31 2020-12-29 北京航空航天大学 多视目标识别方法、装置、控制设备及存储介质
CN112766108B (zh) * 2021-01-08 2023-07-18 西安电子科技大学 基于上下文信息的sar图像目标检测方法
CN114049551B (zh) * 2021-10-22 2022-08-05 南京航空航天大学 一种基于ResNet18的SAR原始数据目标识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494305B2 (en) * 2011-12-20 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Image filtering by sparse reconstruction on affinity net
CN103955702B (zh) * 2014-04-18 2017-02-15 西安电子科技大学 基于深度rbf网络的sar图像地物分类方法
CN104200224A (zh) * 2014-08-28 2014-12-10 西北工业大学 基于深度卷积神经网络的无价值图像去除方法
CN105069400B (zh) * 2015-07-16 2018-05-25 北京工业大学 基于栈式稀疏自编码的人脸图像性别识别系统

Also Published As

Publication number Publication date
CN105512680A (zh) 2016-04-20

Similar Documents

Publication Publication Date Title
CN105512680B (zh) 一种基于深度神经网络的多视sar图像目标识别方法
CN107330396B (zh) 一种基于多属性和多策略融合学习的行人再识别方法
CN108108657B (zh) 基于多任务深度学习的修正局部敏感哈希车辆检索方法
Wang et al. Salient band selection for hyperspectral image classification via manifold ranking
Yang et al. Multi-scale recognition with DAG-CNNs
CN110163258A (zh) 一种基于语义属性注意力重分配机制的零样本学习方法及系统
CN106529499A (zh) 基于傅里叶描述子和步态能量图融合特征的步态识别方法
Zhang et al. Unsupervised difference representation learning for detecting multiple types of changes in multitemporal remote sensing images
CN106354735A (zh) 一种图像中目标的检索方法和装置
Zhang et al. A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data
CN105893947B (zh) 基于多局部相关特征学习的两视角人脸识别方法
CN109190566A (zh) 一种融合局部编码与cnn模型手指静脉识别方法
CN109190514A (zh) 基于双向长短期记忆网络的人脸属性识别方法及系统
CN110334715A (zh) 一种基于残差注意网络的sar目标识别方法
CN109492528A (zh) 一种基于高斯和深度特征的行人再识别方法
CN112149538A (zh) 一种基于多任务学习的行人重识别方法
CN110008861A (zh) 一种基于全局和局部特征学习的行人再识别方法
CN110390294A (zh) 一种基于双向长短期记忆神经网络的目标跟踪方法
Fang et al. Pedestrian attributes recognition in surveillance scenarios with hierarchical multi-task CNN models
CN105718858A (zh) 一种基于正负广义最大池化的行人识别方法
Huang et al. Occluded suspect search via channel-guided mechanism
CN114429646A (zh) 基于深度自注意力变换网络的步态识别方法
Sathiyaprasad et al. Content based video retrieval using Improved gray level Co-occurrence matrix with region-based pre convoluted neural network–RPCNN
Zhang et al. Progressively diffused networks for semantic image segmentation
Yang et al. UP-Net: unique keyPoint description and detection net

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant