CN108510467B

CN108510467B - 基于深度可变形卷积神经网络的sar图像目标识别方法

Info

Publication number: CN108510467B
Application number: CN201810263825.0A
Authority: CN
Inventors: 白静; 叶维健; 徐航; 李超贤; 张景森; 李晓宇; 焦李成; 侯彪
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2018-03-28
Filing date: 2018-03-28
Publication date: 2022-04-08
Anticipated expiration: 2038-03-28
Also published as: CN108510467A

Abstract

本发明公开了一种基于深度可变形卷积神经网络的SAR图像目标识别方法，主要解决现有技术目标识别速度慢，准确率低的问题，其步骤为：1)对于SAR图像目标切片数据进行数据扩增，构建目标与场景的合成图像集合，进而得到训练样本集和测试样本集；2)构建基于像素级的峰值特征模块与连通区域标记模块；3)构建深度可变形卷积神经网络并对其进行训练；4)依据得到的峰值图像标记结果，画出目标检测结果图，将目标送入网络，得到输出的分类标签，完成SAR图像目标识别。本发明利用多层网络结构提取输入图像的特征，提高了SAR目标识别中检测速度和识别准确率，可用于遥感目标的目标检测、目标识别和侦查监视。

Description

基于深度可变形卷积神经网络的SAR图像目标识别方法

技术领域

本发明属于遥感图像处理领域，特别涉及一种SAR图像目标检测与识别方法，可用于遥感目标的目标检测、目标识别和侦查监视。

背景技术

机载和星载合成孔径雷达SAR可以在全天候的白天和夜间条件下运行，并且可以完成获得高分辨率图像和目标信息，获取大面积数据的任务。SAR图像同时包含形状和散射信息，可以很好地表示物体，因此特别适用于目标识别、侦查、监视等任务中。由于其散射/成像机制和散斑，SAR图像的解译与理解同视觉图像存在很大差异，通过人眼搜索大规模SAR图像中的小目标通常是耗时且不切实际的。

MIT林肯实验室将SAR图像的自动目标识别ATR标准体系结构划分为三个阶段：检测、判别和分类。检测使用恒虚警率CFAR检测器从SAR图像中提取候选目标；其结果中可能不仅包含坦克、装甲车、导弹发射装置等目标，还可能包含建筑物、树木、桥梁等虚假警报杂物。在判别阶段，选择合适的特征训练鉴别器来消除误报问题；最后，分类器被用来将每个输入分类为特定的目标类型，目前的三种主流模式为：模板匹配、基于模型的方法和机器学习。基于模型的方法通过对另一个子空间的对象表示以获取区分性特征，而模板匹配法则使用不同的分类规则。这些传统算法忽略了人类学习系统，即通过识别信息来学习对象的分层表示。与人类学习系统多层结构相同的深度学习已经被引入到各个领域，然而对于SAR图像而言，由于其用于针对特定目标学习深层结构的SAR图像数量非常有限，导致将深度卷积网络直接应用会导致严重过拟合，且卷积神经网络对于几何变换的模拟能力十分有限。例如，Chen等人在2016年《IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》上发表了一篇题为“Target Classification Using the Deep ConvolutionalNetworks forSAR Images”的文章，公开了一种基于深度卷积神经网络的SAR图像目标识别方法，利用五层卷积层结构实现SAR图像目标识别。该方法在对SAR图像进行预测时未考虑网络的过拟合情况，对数据几何变换的模拟能力不强，同时存在训练参数过多的问题，导致最终目标识别在训练阶段效率偏低，识别准确率达不到理想数值。

发明内容

本发明的目的在于针对上述现有技术存在的缺陷，提出一种基于深度可变形卷积神经网络的SAR目标识别方法，以提高SAR目标识别效率和识别准确率。

本发明的技术思路是：通过提取图像的峰值特征并经过改进，在合成的SAR目标背景图中快速寻找到目标所在位置，完成目标检测过程；通过使用可变形卷积网络对处理好的数据集进行训练及对数据偏移量的学习保证深度卷积网络的稳定性，进而提高识别准确率。

其实现方案包括如下：

(1)对于SAR图像目标切片数据进行数据扩增：

(1a)对于俯视角为17度的数据，在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片；

(1b)对于俯视角为15度的SAR图像目标切片，将每一类目标图像以中心像素点为中心，切取88×88的切片；

(2)将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中，共获得50幅不同场景下的合成图像；

(3)构建网络训练样本集和测试样本集：

(3a)对于10类地物目标，每一类均使用2200幅经过数据扩增的俯视角为17度的目标切片图像，共计22000幅训练图像构成训练样本集，每一个训练样本均有各自的参考标签；

(3b)使用5000幅经过数据扩增的俯视角为17度及2425幅俯视角为15度的目标切片图像，共计7425幅测试图像构成测试样本集，每一个测试样本均有各自的参考标签；

(4)构建基于像素级的峰值特征提取模块：

(4a)对SAR图像使用中值滤波器进行噪声去除，并对中值滤波后SAR图像依次进行膨胀、腐蚀、像素值归一化和阈值分割；

(4b)对SAR图像进行计数滤波，并对计数滤波后的SAR图像进行膨胀处理，得到峰值特征提取模块；

(5)构建连通区域标记模块：

(5a)使用8连通区域判定准则，通过一次对图像的遍历，记录下每一行或列中连续的序列和标记的等价对；

(5b)对标记前的峰值图像利用(5a)得到的等价对进行重新标记，完成连通区域标记模块；

(6)构建一个包括7层结构的深度可变形卷积神经网络模型，即第1层为网络输入层，第2层为第一卷积层，第3层为第二卷积层，第4层为第三卷积层，第5层为第四卷积层，第6层为全局均值池化层，第7层为输出层；

(7)对深度可变形卷积神经网络模型进行训练：

将训练样本集与训练样本集标签作为深度可变形卷积神经网络模型的输入，对深度可变形卷积神经网络模型进行若干次迭代有监督训练，设置初始学习率为2×e^-4，数据迭代次数为20；

设置训练集与测试集批块的大小为25，调整深度卷积神经网络的超参数并防止过拟合，得到训练好的深度可变形卷积神经网络模型；

(8)依据(5b)中得到的峰值图像标记结果，画出目标检测结果图，框出检测到的目标，将这些目标送入(7)得到的深度可变形卷积神经网络，得到输出的实际分类标签，完成SAR图像目标识别。

本发明与现有技术相比，具有以下优点：

1.本发明由于在可变形卷积单元中对卷积核的每个采样点位置都增加了一个偏移的变量，使得卷积核可以在当前位置附近任意采样，而不再局限于传统卷积网络中的规则格点，削弱了规则格点采样的局制，使得卷积层具有对几何变换进行建模的能力，大幅提升了SAR图像目标识别的准确率。

2.本发明采用全局均值池化层对于众多基于神经网络的机器学习算法所使用的全连接层进行替代，使得原本数量庞大的参数得以省略，可以大大减小网络规模，避免过拟合，有效地提升了SAR图像目标识别的效率。

3.本发明基于像素级峰值特征进行特征改进与参数设计，可以快速确定目标所在区域，且无需变换滑窗的尺度，更节约了批量处理SAR合成图像所需要的时间，方法不基于学习机制，因此省去对训练集训练的时间，大大提升了检测的效率。

4.本发明通过在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片，对SAR图像目标切片数据实现数据扩增，可以大大增加每一类训练图像的数量，使得训练数据集得到有效扩充，有效地提升所训练出的可变形卷积网络模型稳定性。

附图说明

图1是本发明的实现流程图；

图2是用本发明对MSTAR数据集的合成SAR图像进行目标检测的仿真图。

具体实施方案

以下结合附图和具体实施例，对本发明作进一步的详细描述。

参照图1，本发明基于深度可变形卷积神经网络的运动目标识别方法，包括如下步骤：

步骤1，对于SAR图像目标切片数据进行数据扩增。

1a)对于俯视角为17度的数据：

首先，随机选取一张128×128的原始目标切片，在该目标切片上随机选取(x,y)坐标点，x，y均为10到30间的随机数；

然后，以(x,y)坐标点作为扩充切片的左上角坐标，向右扩增88个像素点，向下扩增88个像素点，获取88×88大小的目标切片；

1b)对于俯视角为15度的SAR图像目标切片，将每一类目标图像以中心像素点为中心，切取88×88的切片。

步骤2，构建目标与场景的合成图像集合。

将包含目标的10类436个图像切片嵌入不同环境场景的数据图像中，共获得50幅不同场景下的合成图像。

步骤3，构建训练样本集和测试样本集。

3a)对于10类地物目标，每一类均使用2200幅经过数据扩增的俯视角为17度的目标切片图像，共计22000幅训练图像构成训练样本集，每一个训练样本均有各自的参考标签；

3b)使用5000幅经过数据扩增的俯视角为17度及2425幅俯视角为15度的目标切片图像，共计7425幅测试图像构成测试样本集，每一个测试样本均有各自的参考标签。

步骤4，构建基于像素级的峰值特征提取模块。

4a)对SAR图像使用中值滤波器进行噪声去除，降低图像里所带有的相干斑噪声；

4b)对中值滤波后SAR图像进行膨胀操作，即使用大小为5×5的块填满当前像素点邻域间隙；

4c)对SAR图像进行腐蚀操作，即使用大小为5×5的块分离目标区域和周围的杂波区域；

4d)将像素值大于200的点通过像素值归一化转换为1，将像素值小于200的点通过像素值归一化转换为0，完成像素值归一化和阈值分割；

4e)以光栅扫描顺序依次对SAR图像像素点进行扫描，判断当前像素点的5×5邻域内像素值大小，若皆为1时，则该点处像素值为1；否则，将该点处的像素值置零，完成SAR图像的计数滤波；

4f)使用大小为11×11的块填满当前像素点邻域间隙，完成膨胀操作。

步骤5，构建连通区域标记模块。

5a)使用8连通区域判定准则，通过一次对图像的遍历，记录下每一行或列中连续的序列和标记的等价对；

5b)对标记前的峰值图像利用5a)得到的等价对进行重新标记，完成连通区域标记模块的构建。

步骤6，构建深度可变形卷积神经网络模型。

设置深度可变形卷积神经网络包括7层结构，即第1层为网络输入层，第2层为第一卷积层，第3层为第二卷积层，第4层为第三卷积层，第5层为第四卷积层，第6层为全局均值池化层，第7层为输出层；

其各层的结构参数设置如下：

输入层，为训练样本集中的SAR目标切片；

第一卷积层，由一个大小为5的卷积核和大小为88×88的16个特征映射图组成，卷积操作步长为1；

第二卷积层，由一个大小为5的卷积核和大小为44×44的32个特征映射图组成，卷积操作步长为2；

第三卷积层，由一个大小为6的卷积核和大小为44×44的64个特征映射图组成，卷积操作步长为1；

第四卷积层，由一个大小为4的卷积核和大小为22×22的128个特征映射图组成，卷积操作步长为2；

输出层，选用Softmax分类器，分类类别数设置为10类。

各卷积层在进行卷积之前需要对每层的输入进行0填充操作，即在通过卷积操作后，为了保留原特征映射图大小，对特征映射图边缘使用0像素值填充；

各卷积层的激活函数均采用修正线性单元ReLU；

各卷积层均使用Batch Normalization归一化操作，以避免梯度消失；

第三卷积层与第四卷积层卷积操作前，需使用可变形卷积单元改变采样点的位置，使得卷积层具有对几何变换进行建模的能力。

步骤7，对深度可变形卷积神经网络模型进行训练。

将训练样本集与训练样本集标签作为深度可变形卷积神经网络模型的输入，设置训练集与测试集批块的大小为25，设置初始学习率为2×e^-4，数据迭代次数为20，对深度可变形卷积神经网络模型进行20次迭代有监督训练，得到训练好的深度可变形卷积神经网络模型。

步骤8，获取SAR图像目标检测与识别结果。

依据5b)中得到的峰值图像标记结果，画出目标检测结果图，框出检测到的目标，将这些目标送入步骤7得到的深度可变形卷积神经网络，得到输出的实际分类标签，完成SAR图像目标识别。

以下结合仿真试验，对本发明的技术效果作进一步说明：

本发明的仿真实验是在GPU GeForce GTX 1080 Ti，RAM 20G的硬件环境与Ubuntu14.04的软件环境下基于tensorflow平台实现的。实验中使用的目标和环境场景数据来源于MSTAR数据库。

仿真实验1：对50幅合成图像进行目标检测，得到峰值图像标记结果，根据峰值图像标记画出目标检测结果图，框出检测到的目标，如图2所示，其中：

图2(a)是由MSTAR数据集中目标与环境场景合成的合成SAR图像；

图2(b)是用本发明对一幅合成图像进行目标检测得到的峰值图像标记结果；

图2(c)是用本发明中根据峰值图像标记画出的目标检测结果图。

从图2可见，本发明中提出的目标检测算法，可以有效地从背景中检测出目标，在检测精度方面获得了优良的结果。

仿真实验2：实验共采用22000幅训练图像、7245幅测试图像，对MSTAR数据集中的10类目标进行目标识别，得到实际分类标签，根据分类结果得到目标识别的混淆矩阵、每一类的识别准确率和测试集总准确率，如表1所示。

表1 SAR图像目标识别实验的混淆矩阵与识别准确率

从表1可见，本发明中提出的目标识别算法，总识别准确率达到99.31％，与传统识别算法和最新研究成果相比在性能方面有很大幅度的提升。

综上，本发明使用基于可变形卷积神经网络的SAR图像目标识别算法引入可变形卷积单元，可以有效地改变采样点的位置，使得卷积层具有对几何变换进行建模的能力，另外网络使用全局均值池化层代替CNN中的全卷积层，使得原本数量庞大的参数得以省略，可以大大减小网络规模，避免过拟合。同时，本发明基于像素级峰值特征进行特征改进与参数设计，可以快速确定目标所在区域，且无需变换滑窗的尺度，节约了批量处理SAR合成图像所需要的时间。

Claims

1.一种基于深度可变形卷积神经网络的SAR图像目标识别方法，其特征在于，包括：

(1)对于SAR图像目标切片数据进行数据扩增：

(3)构建网络训练样本集和测试样本集：

(4)构建基于像素级的峰值特征提取模块：

(5)构建连通区域标记模块：

(5b)对标记前的峰值图像利用(5a)得到的等价对进行重新标记，完成连通区域标记模块的构建；

(7)对深度可变形卷积神经网络模型进行训练：

2.根据权利要求1所述的方法，其特征在于，步骤(1a)中对于俯视角为17度的数据，在每一类128×128的原始目标切片中扩增获取88×88大小的目标切片，其实现如下：

然后，以(x,y)坐标点作为扩充切片的左上角坐标，向右扩增88个像素点，向下扩增88个像素点，获取88×88大小的目标切片。

3.根据权利要求1所述的方法，其特征在于，步骤(4a)中对中值滤波后SAR图像依次进行膨胀、腐蚀、像素值归一化和阈值分割，是先使用大小为5×5的块填满当前像素点邻域间隙，完成膨胀操作；再使用大小为5×5的块分离目标区域和周围的杂波区域，完成腐蚀操作；再将像素值大于200的点通过像素值归一化转换为1，将像素值小于200的点通过像素值归一化转换为0，完成像素值归一化和阈值分割。

4.根据权利要求1所述的方法，其特征在于，步骤(4b)中对SAR图像进行计数滤波，并进行膨胀处理，其实现如下：

(4b1)以光栅扫描顺序依次对SAR图像像素点进行扫描，判断当前像素点的5×5邻域内像素值大小，若皆为1时则该点处像素值为1，否则置零，完成SAR图像的计数滤波；

(4b2)使用大小为11×11的块填满当前像素点邻域间隙，完成膨胀操作。

5.根据权利要求1所述的方法，其特征在于，步骤(6)中的深度可变形卷积神经网络模型，其各层的结构参数设置如下：

输入层为训练样本集中的SAR目标切片；

第一卷积层由一个大小为5的卷积核和大小为88×88的16个特征映射图组成，卷积操作步长为1；

第二卷积层由一个大小为5的卷积核和大小为44×44的32个特征映射图组成，卷积操作步长为2；

第三卷积层由一个大小为6的卷积核和大小为44×44的64个特征映射图组成，卷积操作步长为1；

第四卷积层由一个大小为4的卷积核和大小为22×22的128个特征映射图组成，卷积操作步长为2；

输出层分类器选用Softmax分类器，分类类别数设置为10类。

6.根据权利要求5所述的方法，其特征在于，各卷积层在进行卷积之前需要对每层的输入进行0填充操作，即在通过卷积操作后，为了保留原特征映射图大小，对特征映射图边缘使用0像素值填充。

7.根据权利要求5所述的方法，其特征在于，各卷积层的激活函数均采用修正线性单元ReLU。

8.根据权利要求5所述的方法，其特征在于，各卷积层均使用Batch Normalization归一化操作，以避免梯度消失。

9.根据权利要求5所述的方法，其特征在于，第三卷积层与第四卷积层卷积操作前，需使用可变形卷积单元改变采样点的位置，使得卷积层具有对几何变换进行建模的能力。