CN110674698A

CN110674698A - 一种密集子区域切割的遥感图像旋转舰船目标检测方法

Info

Publication number: CN110674698A
Application number: CN201910816272.1A
Authority: CN
Inventors: 陈华杰; 吴栋; 侯新雨; 韦玉谭
Original assignee: Hangzhou Electronic Science and Technology University
Current assignee: Hangzhou Dianzi University; Hangzhou Electronic Science and Technology University
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2020-01-10
Anticipated expiration: 2039-08-30
Also published as: CN110674698B

Abstract

本发明公开了一种密集子区域切割的遥感图像旋转舰船目标检测方法，在于对训练集目标进行预处理，根据图像标注工具获取的训练集目标信息，将目标切割成密集的子区域，获取到子目标信息，经YOLO V3训练后获取训练权重文件，并根据权重文件预测目标的密集子区域的中心点，宽和高的信息。通过对密集子区域中心点坐标数据的拟合得到函数关系并计算出预测目标的中心点坐标和角度，在结合密集子目标的宽和高的信息计算出预测目标的宽度和高度，完成对密集子区域的信息的后处理，提取到预测目标的中心点、宽、高、角度的信息，完成对具有角度等特殊目标的检测。

Description

一种密集子区域切割的遥感图像旋转舰船目标检测方法

技术领域

本发明属于深度学习领域，涉及一种密集子区域切割的遥感图像旋转舰船目标检测方法一种密集子区域切割的图像检测方法。

背景技术

目前，目标检测已被广泛应用于军事和民用等领域中。深度卷积神经网络可以利用目标数据集对要检测的目标进行自主学习，并完善自己的模型。YOLO V3是一种单步目标检测算法，此算法不需要使用区域候选网络(RPN)来提取候选目标信息，而是直接通过网络来产生目标的位置和类别信息，是一种端到端的目标检测算法。因此，单步目标检测算法具有更快的检测速度。

YOLO V3模型是采用分网格直接回归目标坐标和分类目标的方法进行目标检测，主要利用水平矩形边界框定义目标位置，通过边界框参数的回归对目标进行定位。这种方法对于目标对象是人，车等目标是足够准确的，而对于目标对象是文本，舰船，道路等具有角度或弧度等特殊目标是不适合的。

发明内容

本发明针对现有技术的不足，提供了一种基于YOLO V3的密集子区域切割目标的检测方法，该方法通过对训练集目标进行密集子区域切割的方法来获取到密集的子目标，使用YOLO V3算法训练集进行训练，在测试集中获取到所有子目标的中心位置和宽高，对所有获得到的中心点坐标进行拟合，完成待测图像的目标检测。

步骤(1)、训练集数据预处理。

利用图像标注工具对图像中待检测的目标进行标注，获取到图像中目标的中心点坐标(x,y)、目标的宽w和高h，目标的角度信息angle。根据设置的切割步长step和目标的高度h，确定目标切割为子目标的个数n；根据目标的中心点坐标和目标的宽及高计算出目标的四个顶点的坐标(x1,y1)，(x2,y2)，(x3,y3)，(x4,y4)；根据子目标的个数n得到相邻子目标的间隔(dcx,dcy)；根据间隔大小和顶点位置得到第i个子目标的中心点坐标(xi,yi)，其中0＜i＜n；根据子目标的中心点坐标，并以目标的宽度w作为子目标的宽度来确定切割的子目标的位置信息；根据子目标的位置信息对目标进行切割，获取密集子目标。

其中：n＝h/step+1

h_vec＝[h·cos(angle)/2,h·sin(angle)/2]

w_vec＝[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]

dcx＝(x3-x1)/n

dcy＝(y3-y1)/n

xi＝x1+dcx·(0.5+i)

yi＝x1+dcx·(0.5+i)

步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练。

根据密集子目标的标注框的高度和宽度，利用K-近邻聚类方法对子目标的标注框进行聚类后分为9类，获取9类框的大小，以此来设置YOLO V3锚点框参数。提取密集子目标的中心点信息、高度、宽度，放入YOLO V3进行训练，训练直到损失函数不再降低，获取权重文件。

步骤(3)、使用YOLO V3对测试集进行预测。

利用步骤(2)中得到的权重文件，对测试集图像进行测试。对于每一张图片进行预测后，获取所有预测的子目标的中心点坐标(xc*,yc*)，高度h*，宽度w*。

步骤(4)、预测子目标数据的后处理。

根据步骤(3)中每一幅图片中所有预测的子目标的中心点进行多项式拟合，得到中心点坐标的函数关系，由函数获取到拟合直线的角度angle_θ；根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)和的平均值为预测目标的中心点坐标(xc,yc)；根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)利用勾股定理计算出预测目标的高度；根据获取到的所有预测的子目标的宽度w*的平均值w*mean，利用角度angle_θ，并根据三角函数求出目标宽度wc。由此获得预测目标的中心点(xc,yc)，高度hc，宽度wc，角度angle_θ信息，根据信息在预测图片中画出预测框完成预测。

其中：xc＝(xc*max+xc*min)/2

yc＝(yc*max+yc*min)/2

wc＝max(w*meangcos(angle_θ),w*meangsin(angle_θ))。

本发明的有益效果如下：本发明的关键在于对训练集目标进行预处理，将一个目标切割成密集的子区域，经YOLO V3训练后获取预测目标的密集子区域的中心点，宽和高的信息。通过对密集子区域的信息的后处理，提取到预测目标的中心点、宽、高、角度的信息，完成对具有角度等特殊目标的检测。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合具体实施例对本发明做进一步的分析。

本实验将一组采集的舰船目标图像划分为训练集和测试集。如图1所示，在基于YOLO V3的旋转目标检测任务中的具体步骤如下：

步骤(1)、训练集数据预处理。

其中：n＝h/step+1

h_vec＝[h·cos(angle)/2,h·sin(angle)/2]

w_vec＝[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]

dcx＝(x3-x1)/n

dcy＝(y3-y1)/n

xi＝x1+dcx·(0.5+i)

yi＝x1+dcx·(0.5+i)

步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练。

步骤(3)、使用YOLO V3对测试集进行预测。

步骤(4)、预测子目标数据的后处理。

其中：xc＝(xc*max+xc*min)/2

yc＝(yc*max+yc*min)/2

wc＝max(w*meangcos(angle_θ),w*meangsin(angle_θ))。

上述实施例并非是对于本发明的限制，本发明并非仅限于上述实施例，只要符合本发明要求，均属于本发明的保护范围。

Claims

1.一种密集子区域切割的遥感图像旋转舰船目标检测方法，其特征在于，该方法具体包括以下步骤：

步骤(1)、训练集数据预处理；

利用图像标注工具对图像中待检测的目标进行标注，获取到图像中目标的中心点坐标(x,y)、目标的宽w和高h，目标的角度信息angle；根据设置的切割步长step和目标的高度h，确定目标切割为子目标的个数n；根据目标的中心点坐标和目标的宽及高计算出目标的四个顶点的坐标(x1,y1)，(x2,y2)，(x3,y3)，(x4,y4)；根据子目标的个数n得到相邻子目标的间隔(dcx,dcy)；根据间隔大小和顶点位置得到第i个子目标的中心点坐标(xi,yi)，其中0＜i＜n；根据子目标的中心点坐标，并以目标的宽度w作为子目标的宽度来确定切割的子目标的位置信息；根据子目标的位置信息对目标进行切割，获取密集子目标；

其中：n＝h/step+1

h_vec＝[h·cos(angle)/2,h·sin(angle)/2]

w_vec＝[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]

dcx＝(x3-x1)/n

dcy＝(y3-y1)/n

xi＝x1+dcx·(0.5+i)

yi＝x1+dcx·(0.5+i)

步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练；

根据密集子目标的标注框的高度和宽度，利用K-近邻聚类方法对子目标的标注框进行聚类后分为9类，获取9类框的大小，以此来设置YOLO V3锚点框参数；提取密集子目标的中心点信息、高度、宽度，放入YOLO V3进行训练，训练直到损失函数不再降低，获取权重文件；

步骤(3)、使用YOLO V3对测试集进行预测；

利用步骤(2)中得到的权重文件，对测试集图像进行测试；对于每一张图片进行预测后，获取所有预测的子目标的中心点坐标(xc*,yc*)，高度h*，宽度w*；

步骤(4)、预测子目标数据的后处理；

根据步骤(3)中每一幅图片中所有预测的子目标的中心点进行多项式拟合，得到中心点坐标的函数关系，由函数获取到拟合直线的角度angle_θ；根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)和的平均值为预测目标的中心点坐标(xc,yc)；根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)利用勾股定理计算出预测目标的高度；根据获取到的所有预测的子目标的宽度w*的平均值w*mean，利用角度angle_θ，并根据三角函数求出目标宽度wc；由此获得预测目标的中心点(xc,yc)，高度hc，宽度wc，角度angle_θ信息，根据信息在预测图片中画出预测框完成预测；

其中：xc＝(xc*max+xc*min)/2

yc＝(yc*max+yc*min)/2

wc＝max(w*meangcos(angle_θ),w*meangsin(angle_θ))。