CN111860336B

CN111860336B - 基于位置感知的高分辨遥感图像倾斜船舶目标检测方法

Info

Publication number: CN111860336B
Application number: CN202010708200.8A
Authority: CN
Inventors: 李映; 刘凌毅
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-07-21
Filing date: 2020-07-21
Publication date: 2022-02-11
Anticipated expiration: 2040-07-21
Also published as: CN111860336A

Abstract

本发明涉及一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，利用UNet‑like多尺度卷积网络提取多尺度深度特征图；利用提取出来的深度特征图通过基于锚点的旋转框回归模型直接预测每个锚点存在船舶的可能性得分和锚点所在预测框的位置；利用位置感知得分校正模型对锚点得分进行校正。本方法利用UNet‑like卷积神经网络提取兼备深度语义特征和浅层细节特征，在保证分类精度的同时提升模型定位精度，提升了小尺寸船舶的检测性能。同时利用位置感知得分校正模型进一步修正候选框得分，提高候选框定位精度。

Description

基于位置感知的高分辨遥感图像倾斜船舶目标检测方法

技术领域

本发明涉及一种遥感图像的船舶目标检测方法，特别是从高分辨遥感图像中检测倾斜密集排列船舶目标的方法。

背景技术

在过去的几十年中，船舶检测一直是遥感领域的热门话题，其对促进国防建设，港口管理和货物运输等方面的发展有重要作用。传统船舶检测算法通过提取并识别船舶的形状和纹理特征来实现船舶检测，此类方法简单易行、可解释性强，但其提取特征多为浅层信息，且设计一种适用于所有船舶的手工特征较为困难。

目前卷积神经网络已在目标检测领域取得了重大进展。但遥感图像中的船舶存在尺寸变化大和图像占比小的特点导致基于深度学习的船舶检测算法生成大量冗余的候选区域，大幅提升了时间复杂度和假样率；同时，船舶长宽比大，常密集排列的特点增加了特征提取和密集船舶定位的难度。《Rotated region based CNN for ship detection》(ICIP.IEEE,2017:900-904.)提出了一种基于旋转区域的CNN用于船舶检测，它使用旋转感兴趣区域(RRoI)池化层提取旋转区域特征并直接回归旋转角度。《Automatic ShipDetection in Remote Sensing Images from Google Earth of Complex Scenes Basedon Multiscale Rotation Dense Feature Pyramid Networks》(Remote Sensing.IEEE,2018:14.)提出了多尺度旋转密集特征金字塔网络，设计了具有多尺度RoI Align的旋转锚策略，以提高旋转对象的特征提取模型的效率。然而，大量的旋转锚增加了物体分类的难度并产生了更多的错误警报。《Rotated Region Based Fully Convolutional Network forShip Detection》(IGRSS.IEEE,2018:673-676.)提出了一种基于全卷积神经网络的旋转船舶检测方法，该方法具有较快的检测速度，但由于正样本和负样本的比例不平衡，在复杂背景下检测的准确性较低。

发明内容

要解决的技术问题

为了进一步提升倾斜船舶目标检测方法的性能，本发明提供一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，利用UNet-like多尺度卷积网络提取多尺度深度特征图；利用提取出来的深度特征图通过基于锚点的旋转框回归模型直接预测每个锚点存在船舶的可能性得分和锚点所在预测框的位置；利用位置感知得分校正模型对锚点得分进行校正。本方法利用UNet-like卷积神经网络提取兼备深度语义特征和浅层细节特征，在保证分类精度的同时提升模型定位精度，提升了小尺寸船舶的检测性能。同时利用位置感知得分校正模型进一步修正候选框得分，提高候选框定位精度。

技术方案

一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，其特征在于步骤如下：

步骤1：图像预处理：将遥感图像处理成统一地物分辨率和尺寸的图像块，并进行归一化；

步骤2：将预处理后的图像块输入训练好的UNet-like多尺度卷积网络进行特征提取，得到不同尺寸的特征图；所述的UNet-like多尺度卷积网络由主干网络和特征融合网络构成，主干网络选用ResNet101，用于提取4种不同深度水平的特征图{C2,C3,C4,C5}；特征融合网络利用双线性插值将深层特征图C5放大为原来的2倍，使其与浅层特征图C4融合，再通过一个3x3卷积层和一个1x1卷积层得到融合后的特征图C4’，将C4’放大为原来的2倍与C3融合，得到特征图C3’，将C3’放大为原来的2倍与C2融合，得到特征图C2’；最后将特征图{C2’,C3’,C4’}分别传入一个3x3卷积层和一个1x1卷积层，得到融合后的特征图{P2,P3,P4}，其具有相同的通道数但不同的特征图尺寸，尺寸最大的P2用于检测小目标船舶，尺寸最小的P4用于检测大目标船舶；

步骤3：基于anchor的倾斜边框回归模型

基于锚点的倾斜边框回归模型从步骤2得到的三个不同尺寸的特征图中直接进行预测，回归模型可分为分类子网络和位置回归子网络两部分，分类子网络预测每个锚点的概率得分，位置回归子网络预测锚点到预测框四边的距离和倾斜角度，其步骤如下：

(1)从数据集内采集船舶尺寸信息，将其按照面积划分为3组，每组利用K-mean算法得到5个聚类作为anchor先验参数；

(2)分类子网络按顺序由三个3x3卷积层，一个1x1卷积层和一个sigmoid函数构成，分类子网络输出得分图与输入特征图尺寸相同，通道数为5，代表5个anchor存在船舶目标的概率的得分，从得分图内筛选出高于阈值的点作为预测点；

(3)回归子网络结构与分类子网络一致，输出特征图的通道数为25，代表5个anchor的距离和角度预测量(t₁,t₂,t₃,t₄,t_θ)，预测框的距离和角度由预测量和anchor先验参数计算，其公式如下：

θ＝(sigmoid(t_θ×2-1)×π/4

其中h_k和w_k是第k个anchor的长宽先验参数；

(4)将提取出来的特征图{P1,P2,P2}分别输入训练好的基于锚点的倾斜边框回归模型，得到分类得分图，距离预测图和角度预测图，筛选出得分图中大于0.5的锚点位置(x,y)，并提取该锚点位置的距离预测值(t₁,t₂,t₃,t₄)和角度预测值t_θ，根据步骤(3)中公式计算出预测距离(d₁,d₂,d₃,d₄)和倾斜角度θ；

(5)预测框位置由锚点坐标(x,y)和预测的距离(d₁,d₂,d₃,d₄)及倾斜角度θ唯一确定，{D₁,D₂,D₃,D₄}为预测框的点，D₁点为x,y坐标和最小的点，D₂,D₃,D₄顺时针依次排列，d₁,d₂,d₃,d₄为锚点到四条边的距离，θ为预测框的倾斜角；

步骤4：位置感知得分校准

位置感知得分校准模型对预测框得分进行修正，根据预测框的位置选取9个采样点，将采样点在得分图上等采样值的均值作为预测框的修正得分，其具体步骤如下：

(1)根据预测框的坐标位置，计算采样点的坐标位置：

采样点	横坐标	纵坐标
			S1	0.5x<sub>1</sub>+0.3x<sub>3</sub>+0.2x<sub>4</sub>	0.5y<sub>1</sub>+0.3y<sub>3</sub>+0.2y<sub>4</sub>
S2	0.6x<sub>1</sub>+0.4x<sub>3</sub>	0.6y<sub>1</sub>+0.4y<sub>3</sub>
			S3	0.5x<sub>1</sub>+0.3x<sub>3</sub>+0.2x<sub>2</sub>	0.5y<sub>1</sub>+0.3y<sub>3</sub>+0.2y<sub>2</sub>
S4	0.4x<sub>2</sub>+0.6x<sub>4</sub>	0.4y<sub>2</sub>+0.6y<sub>4</sub>
			S5	0.5x<sub>1</sub>+0.5x<sub>3</sub>	0.5y<sub>1</sub>+0.5y<sub>3</sub>
S6	0.6x<sub>2</sub>+0.4x<sub>4</sub>	0.6y<sub>2</sub>+0.4y<sub>4</sub>
			S7	0.3x<sub>1</sub>+0.5x<sub>3</sub>+0.2x<sub>2</sub>	0.3y<sub>1</sub>+0.5y<sub>3</sub>+0.2y<sub>2</sub>
S8	0.4x<sub>1</sub>+0.6x<sub>3</sub>	0.4y<sub>1</sub>+0.6y<sub>3</sub>
			S9	0.3x<sub>1</sub>+0.5x<sub>3</sub>+0.2x<sub>4</sub>	0.3y<sub>1</sub>+0.5y<sub>3</sub>+0.2y<sub>4</sub>

其中(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)分别为倾斜框端点D1,D2,D3,D4的坐标；

(2)将采样点从原图映射到得分图上，利用双线性插值得到采样点位置的预测得分值，并取采样点的得分值均值作为预测框的校正得分值；

(3)利用非极大值抑制算法将重叠度大于0.3的冗余预测框去除，得到图像块的检测结果；

步骤5：图像块检测结果融合

借助图像块信息将预测框在图像块的坐标转化为原图上的坐标，并利用非极大值抑制算法剔出冗余预测框，得到最终检测结果，其步骤如下：

(1)将预测框的坐标与所在图像块的左上角坐标相加并按照图像块的放缩比例还原，得到预测框在原检测遥感图像上的坐标位置；

(2)将所有图像块上的结果汇总，利用非极大值抑制算法剔出重叠度大于0.3的候选框，得到最终检测结果。

所述的图像预处理具体如下：

(1)读取遥感图像内包含的地物信息，并将图像进行放缩使图像的空间分辨率为5米；

(2)将放缩后的图像进行裁剪，裁剪的图像尺寸为1024*1024像素，相邻图片之间重叠128像素，并记录裁剪图像块左上角像素点在原图上的坐标；

(3)将裁减后的图像块的每个像素值进行归一化，使其减去统计学均值，将图像块逐一进行检测。

所述的UNet-like多尺度卷积网络的训练如下：主干网络ResNet101选用在ImageNet分类数据集训练好的分类模型作为预训练模型，特征融合网络采用Kaiming初始化方法对网络参数进行初始化，UNet-like多尺度卷积网络将与基于锚点的倾斜边框回归模型在船舶数据集上共同训练调优，以实现其提取船舶深度语义特征的功能。

所述的基于anchor的倾斜边框回归模型的训练如下：利用Kaiming初始化方法对基于锚点的倾斜边框回归模型进行初始化，并将其与UNet-like多尺度卷积网络共同在公开倾斜船舶数据集HRSC2016和自建倾斜传播数据集HRSD中进行训练调优；损失函数由分类损失函数、距离回归损失函数和角度损失函数构成，分类损失函数采用Focal损失函数，距离回归损失函数采用IoU损失函数，角度损失函数采用余弦损失函数；模型训练采用随机梯度下降算法，学习率设置为0.001，学习率每1万次迭代缩小为原来的十分之一；动量参数设置为0.9；模型训练9万轮，batch size设置为8。

有益效果

本发明提出了一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，利用UNet-like多尺度卷积网络提取具备深度语义信息的高分辨特征图，将特征图传入基于锚点的旋转框回归模型直接预测旋转矩形框作为预测框。再通过位置感知得分校正模型修正预测框的得分。本方法提取的特征图同时包含深层语义信息和浅层位置信息，提升对不同尺寸船舶的检测能力，利用锚点来改善不同长宽比和尺度船舶的定位能力，最后使用位置感知得分校正模型进一步修正预测框的得分，提升模型检测性能，其具体优点如下：

设计了UNet-like多尺度卷积网络结构，主干网络ResNet101可充分提取遥感图像中的深层语义信息，UNet结构将不同层特征图融合，增加特征图的细节位置信息。采用多尺度特征图预测，不同大小的特征图负责预测相应尺寸的船舶，提升了对各种尺寸船舶的检测性能。

采用基于锚点的旋转框回归模型，引入不同长宽比的锚来辅助不同形状船舶进行位置回归，提升了模型对不同类型船舶的定位性能，在不同尺寸特征图上进行多尺度检测，改善了模型对不同尺寸船舶的检测能力，采用旋转矩形框进行定位，可更精准的定位船舶，避免密集排列导致的船舶漏检问题。

提出了位置感知得分校正模型，利用预测框位置信息对预测框得分进行修正，使定位更好的预测框的得分更高，避免非极大值抑制算法将定位精准但得分较低的预测框剔除的问题，提升模型的定位精度。

附图说明

图1是基于位置感知的高分辨遥感图像倾斜船舶目标检测方法流程图。

图2是UNet-like多尺度卷积网络结构图。

图3是旋转矩形框定位示意图。

图4是采样点相对位置示意图。

具体实施方式

现结合实施例、附图对本发明作进一步描述：

一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，包括下述步骤：

(1)利用UNet-like多尺度卷积网络提取深度语义特征图。选择ResNet101作为主干网络，利用UNet网络特征图融合思想将浅层特征逐层与深层特征融合，得到融合后的特征图。

(2)将融合后的特征图传入基于锚点的旋转框回归模型内，直接预测每个锚点分类得分和锚点所在预测框的位置。模型由卷积层构成，可同时预测所有锚点的概率得分、位置偏移和倾斜角度，筛选得分高于阈值的锚点，利用这些锚点预测的位置偏移和锚点的先验长宽参数计算出锚点到预测框各边的垂直距离，再结合预测的倾斜角度得到最终预测框位置。

(3)利用位置感知得分校正模型对预测框得分进行校正，根据矩形框的相对位置在所得最终预测框中计算出9个关键采样点，将采样点映射到锚点概率得分图上，利用双线性差值得到采样点的得分值，并将得分值的均值作为最终预测框的修正得分值，利用倾斜矩形框非最大值抑制算法，去除冗余预测框得到最终船舶预测结果。

(4)模型在公开倾斜船舶数据集HRSC2016和自建倾斜传播数据集HRSD中进行训练，主干网络采用已在ImageNet训练好的ResNet101作为预训练模型，分类损失函数、距离回归损失函数和角度损失函数分别采用Focal损失函数、IoU损失函数和余弦损失函数，采用随机梯度下降算法进行模型训练。

如图1所示，具体步骤如下：

1.图像预处理

图像预处理步骤将遥感图像处理成统一空间分辨率和尺寸的图像块，并进行归一化，使检测方法在相同的情况下进行检测，提升检测方法的鲁棒性，其步骤如下：

(1)读取遥感图像内包含的地物信息，并将图像进行放缩使图像的空间分辨率为5米。

(2)将放缩后的图像进行裁剪，裁剪的图像尺寸为1024x1024像素，相邻图像之间重叠128像素，并记录裁剪图像块左上角像素点在原图上的坐标。

(3)将裁减后的图像块的每个像素值进行归一化，使其减去统计学均值。将图像块逐一进行检测。

2.UNet-like多尺度卷积网络特征提取

将预处理后的图像块传入UNet-like多尺度卷积网络对进行特征提取，得到不同尺寸的特征图，网络结构图如图2，其步骤如下：

(1)UNet-like多尺度卷积网络由主干网络和特征融合网络构成，主干网络选用ResNet101，用于提取4种不同深度水平的特征图{C2,C3,C4,C5}。特征融合网络利用双线性插值将深层特征图C5放大为原来的2倍，使其与浅层特征图C4融合，再通过一个3x3卷积层和一个1x1卷积层得到融合后的特征图C4’，将C4’重复上述操作与C3融合，得到特征图C3’，将C3’重复上述操作与C2融合，得到特征图C2’。最后将特征图{C2’,C3’,C4’}分别传入一个3x3卷积层和一个1x1卷积层，得到具有相同通道数的特征图{P2,P3,P4}。

(2)主干网络ResNet101选用在ImageNet分类数据集训练好的分类模型作为预训练模型，特征融合网络采用Kaiming初始化方法对网络参数进行初始化。UNet-like多尺度卷积网络将与基于锚点的倾斜边框回归模型在船舶数据集上共同训练调优，以实现其提取船舶深度语义特征的功能。

(3)图像块经过训练好的UNet-like多尺度卷积网络，得到融合后的特征图{P2,P3,P4}，其具有相同的通道数但不同的特征图尺寸。尺寸最大的P2用于检测小目标船舶，尺寸最小的P4用于检测大目标船舶。

3.基于锚点的倾斜边框回归模型预测

基于锚点的倾斜边框回归模型从上步得到的三个不同尺寸的特征图中直接进行预测，回归模型可分为分类子网络和位置回归子网络两部分，分类子网络预测每个锚点的概率得分，位置回归子网络预测锚点到预测框四边的距离和倾斜角度，其步骤如下：

(1)从数据集内采集船舶尺寸信息，将其按照面积划分为3组，每组利用K-mean算法得到5个聚类作为锚点先验参数。

(2)分类子网络按顺序由三个3x3卷积层，一个1x1卷积层和一个sigmoid函数构成，分类子网络输出得分图与输入特征图尺寸相同，通道数为5，代表5个锚点存在船舶目标的概率的得分。从得分图内筛选出高于阈值的点作为预测点。

(3)回归子网络结构与分类子网络一致，输出特征图的通道数为25，代表5个锚点的距离和角度预测量(t₁,t₂,t₃,t₄,t_θ)，预测框的距离和角度由预测量和锚点先验参数计算，其公式如下：

θ＝(sigmoid(t_θ×2-1)×π/4

其中h_k和w_k是第k个锚的长宽先验参数。

(4)利用Kaiming初始化方法对基于锚点的倾斜边框回归模型进行初始化，并将其与UNet-like多尺度卷积网络共同在公开倾斜船舶数据集HRSC2016和自建倾斜传播数据集HRSD中进行训练调优。损失函数由分类损失函数、距离回归损失函数和角度损失函数构成，分类损失函数采用Focal损失函数，距离回归损失函数采用IoU损失函数，角度损失函数采用余弦损失函数。模型训练采用随机梯度下降算法，学习率设置为0.001，学习率每1万次迭代缩小为原来的十分之一。动量参数设置为0.9。模型训练9万轮，batch size设置为8。

(5)将提取出来的特征图{P1,P2,P2}分别传入训练好的基于锚点的倾斜边框回归模型，得到分类得分图，距离预测图和角度预测图，筛选出得分图中大于0.5的锚点位置(x,y)，并提取该锚点位置的距离预测值(t₁,t₂,t₃,t₄)和角度预测值t_θ，根据步骤(3)中公式计算出预测距离(d₁,d₂,d₃,d₄)和倾斜角度θ。

(6)预测框位置由锚点坐标(x,y)和预测的距离(d₁,d₂,d₃,d₄)及倾斜角度θ唯一确定，图3为预测框定位示意图，{D₁,D₂,D₃,D₄}为预测框的点，D₁点为x,y坐标和最小的点，D₂,D₃,D₄顺时针依次排列，d₁,d₂,d₃,d₄为锚点到四条边的距离，θ为预测框的倾斜角。

4.位置感知得分校准

位置感知得分校准模型对预测框得分进行修正，根据预测框的位置选取9个采样点，将采样点在得分图上的采样值均值作为预测框的修正得分，其具体步骤如下：

(1)根据预测框的坐标位置，计算采样点的坐标位置，预测框和采样点的相对位置见图4，其具体坐标见下表，其中(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)分别为倾斜框端点D1,D2,D3,D4的坐标。

(2)将采样点从原图映射到得分图上，利用双线性插值得到采样点位置的预测得分值，并取采样点的得分值均值作为预测框的校正得分值。

(3)利用非极大值抑制算法将重叠度大于0.3的冗余预测框去除，得到图像块的检测结果。

5.图像块检测结果融合

(1)将预测框的坐标与所在图像块的左上角坐标相加并按照图像块的放缩比例还原，得到预测框在原检测遥感图像上的坐标位置。

Claims

1.一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，其特征在于步骤如下：

步骤3：基于anchor的倾斜边框回归模型

θ＝(sigmoid(t_θ×2-1)×π/4

其中h_k和w_k是第k个anchor的长宽先验参数；

(4)将提取出来的特征图{P2,P3,P4}分别输入训练好的基于锚点的倾斜边框回归模型，得到分类得分图，距离预测图和角度预测图，筛选出得分图中大于0.5的锚点位置(x,y)，并提取该锚点位置的距离预测值(t₁,t₂,t₃,t₄)和角度预测值t_θ，根据步骤(3)中公式计算出预测距离(d₁,d₂,d₃,d₄)和倾斜角度θ；

步骤4：位置感知得分校准

位置感知得分校准模型对预测框得分进行修正，根据预测框的位置选取9个采样点，将采样点在得分图上的采样值的均值作为预测框的修正得分，其具体步骤如下：

(1)根据预测框的坐标位置，计算采样点的坐标位置：

步骤5：图像块检测结果融合

2.根据权利要求1所述的一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，其特征在于所述的图像预处理具体如下：

3.根据权利要求1所述的一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，其特征在于所述的UNet-like多尺度卷积网络的训练如下：主干网络ResNet101选用在ImageNet分类数据集训练好的分类模型作为预训练模型，特征融合网络采用Kaiming初始化方法对网络参数进行初始化，UNet-like多尺度卷积网络将与基于锚点的倾斜边框回归模型在船舶数据集上共同训练调优，以实现其提取船舶深度语义特征的功能。

4.根据权利要求1所述的一种基于位置感知的高分辨遥感图像倾斜船舶目标检测方法，其特征在于所述的基于anchor的倾斜边框回归模型的训练如下：利用Kaiming初始化方法对基于锚点的倾斜边框回归模型进行初始化，并将其与UNet-like多尺度卷积网络共同在公开倾斜船舶数据集HRSC2016和自建倾斜传播数据集HRSD中进行训练调优；损失函数由分类损失函数、距离回归损失函数和角度损失函数构成，分类损失函数采用Focal损失函数，距离回归损失函数采用IoU损失函数，角度损失函数采用余弦损失函数；模型训练采用随机梯度下降算法，学习率设置为0.001，学习率每1万次迭代缩小为原来的十分之一；动量参数设置为0.9；模型训练9万轮，batch size设置为8。