CN110674698A - 一种密集子区域切割的遥感图像旋转舰船目标检测方法 - Google Patents
一种密集子区域切割的遥感图像旋转舰船目标检测方法 Download PDFInfo
- Publication number
- CN110674698A CN110674698A CN201910816272.1A CN201910816272A CN110674698A CN 110674698 A CN110674698 A CN 110674698A CN 201910816272 A CN201910816272 A CN 201910816272A CN 110674698 A CN110674698 A CN 110674698A
- Authority
- CN
- China
- Prior art keywords
- target
- sub
- targets
- coordinates
- angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种密集子区域切割的遥感图像旋转舰船目标检测方法,在于对训练集目标进行预处理,根据图像标注工具获取的训练集目标信息,将目标切割成密集的子区域,获取到子目标信息,经YOLO V3训练后获取训练权重文件,并根据权重文件预测目标的密集子区域的中心点,宽和高的信息。通过对密集子区域中心点坐标数据的拟合得到函数关系并计算出预测目标的中心点坐标和角度,在结合密集子目标的宽和高的信息计算出预测目标的宽度和高度,完成对密集子区域的信息的后处理,提取到预测目标的中心点、宽、高、角度的信息,完成对具有角度等特殊目标的检测。
Description
技术领域
本发明属于深度学习领域,涉及一种密集子区域切割的遥感图像旋转舰船目标检测方法一种密集子区域切割的图像检测方法。
背景技术
目前,目标检测已被广泛应用于军事和民用等领域中。深度卷积神经网络可以利用目标数据集对要检测的目标进行自主学习,并完善自己的模型。YOLO V3是一种单步目标检测算法,此算法不需要使用区域候选网络(RPN)来提取候选目标信息,而是直接通过网络来产生目标的位置和类别信息,是一种端到端的目标检测算法。因此,单步目标检测算法具有更快的检测速度。
YOLO V3模型是采用分网格直接回归目标坐标和分类目标的方法进行目标检测,主要利用水平矩形边界框定义目标位置,通过边界框参数的回归对目标进行定位。这种方法对于目标对象是人,车等目标是足够准确的,而对于目标对象是文本,舰船,道路等具有角度或弧度等特殊目标是不适合的。
发明内容
本发明针对现有技术的不足,提供了一种基于YOLO V3的密集子区域切割目标的检测方法,该方法通过对训练集目标进行密集子区域切割的方法来获取到密集的子目标,使用YOLO V3算法训练集进行训练,在测试集中获取到所有子目标的中心位置和宽高,对所有获得到的中心点坐标进行拟合,完成待测图像的目标检测。
步骤(1)、训练集数据预处理。
利用图像标注工具对图像中待检测的目标进行标注,获取到图像中目标的中心点坐标(x,y)、目标的宽w和高h,目标的角度信息angle。根据设置的切割步长step和目标的高度h,确定目标切割为子目标的个数n;根据目标的中心点坐标和目标的宽及高计算出目标的四个顶点的坐标(x1,y1),(x2,y2),(x3,y3),(x4,y4);根据子目标的个数n得到相邻子目标的间隔(dcx,dcy);根据间隔大小和顶点位置得到第i个子目标的中心点坐标(xi,yi),其中0<i<n;根据子目标的中心点坐标,并以目标的宽度w作为子目标的宽度来确定切割的子目标的位置信息;根据子目标的位置信息对目标进行切割,获取密集子目标。
其中:n=h/step+1
h_vec=[h·cos(angle)/2,h·sin(angle)/2]
w_vec=[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]
dcx=(x3-x1)/n
dcy=(y3-y1)/n
xi=x1+dcx·(0.5+i)
yi=x1+dcx·(0.5+i)
步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练。
根据密集子目标的标注框的高度和宽度,利用K-近邻聚类方法对子目标的标注框进行聚类后分为9类,获取9类框的大小,以此来设置YOLO V3锚点框参数。提取密集子目标的中心点信息、高度、宽度,放入YOLO V3进行训练,训练直到损失函数不再降低,获取权重文件。
步骤(3)、使用YOLO V3对测试集进行预测。
利用步骤(2)中得到的权重文件,对测试集图像进行测试。对于每一张图片进行预测后,获取所有预测的子目标的中心点坐标(xc*,yc*),高度h*,宽度w*。
步骤(4)、预测子目标数据的后处理。
根据步骤(3)中每一幅图片中所有预测的子目标的中心点进行多项式拟合,得到中心点坐标的函数关系,由函数获取到拟合直线的角度angle_θ;根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)和的平均值为预测目标的中心点坐标(xc,yc);根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)利用勾股定理计算出预测目标的高度;根据获取到的所有预测的子目标的宽度w*的平均值w*mean,利用角度angle_θ,并根据三角函数求出目标宽度wc。由此获得预测目标的中心点(xc,yc),高度hc,宽度wc,角度angle_θ信息,根据信息在预测图片中画出预测框完成预测。
其中:xc=(xc*max+xc*min)/2
yc=(yc*max+yc*min)/2
wc=max(w*meangcos(angle_θ),w*meangsin(angle_θ))。
本发明的有益效果如下:本发明的关键在于对训练集目标进行预处理,将一个目标切割成密集的子区域,经YOLO V3训练后获取预测目标的密集子区域的中心点,宽和高的信息。通过对密集子区域的信息的后处理,提取到预测目标的中心点、宽、高、角度的信息,完成对具有角度等特殊目标的检测。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合具体实施例对本发明做进一步的分析。
本实验将一组采集的舰船目标图像划分为训练集和测试集。如图1所示,在基于YOLO V3的旋转目标检测任务中的具体步骤如下:
步骤(1)、训练集数据预处理。
利用图像标注工具对图像中待检测的目标进行标注,获取到图像中目标的中心点坐标(x,y)、目标的宽w和高h,目标的角度信息angle。根据设置的切割步长step和目标的高度h,确定目标切割为子目标的个数n;根据目标的中心点坐标和目标的宽及高计算出目标的四个顶点的坐标(x1,y1),(x2,y2),(x3,y3),(x4,y4);根据子目标的个数n得到相邻子目标的间隔(dcx,dcy);根据间隔大小和顶点位置得到第i个子目标的中心点坐标(xi,yi),其中0<i<n;根据子目标的中心点坐标,并以目标的宽度w作为子目标的宽度来确定切割的子目标的位置信息;根据子目标的位置信息对目标进行切割,获取密集子目标。
其中:n=h/step+1
h_vec=[h·cos(angle)/2,h·sin(angle)/2]
w_vec=[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]
dcx=(x3-x1)/n
dcy=(y3-y1)/n
xi=x1+dcx·(0.5+i)
yi=x1+dcx·(0.5+i)
步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练。
根据密集子目标的标注框的高度和宽度,利用K-近邻聚类方法对子目标的标注框进行聚类后分为9类,获取9类框的大小,以此来设置YOLO V3锚点框参数。提取密集子目标的中心点信息、高度、宽度,放入YOLO V3进行训练,训练直到损失函数不再降低,获取权重文件。
步骤(3)、使用YOLO V3对测试集进行预测。
利用步骤(2)中得到的权重文件,对测试集图像进行测试。对于每一张图片进行预测后,获取所有预测的子目标的中心点坐标(xc*,yc*),高度h*,宽度w*。
步骤(4)、预测子目标数据的后处理。
根据步骤(3)中每一幅图片中所有预测的子目标的中心点进行多项式拟合,得到中心点坐标的函数关系,由函数获取到拟合直线的角度angle_θ;根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)和的平均值为预测目标的中心点坐标(xc,yc);根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)利用勾股定理计算出预测目标的高度;根据获取到的所有预测的子目标的宽度w*的平均值w*mean,利用角度angle_θ,并根据三角函数求出目标宽度wc。由此获得预测目标的中心点(xc,yc),高度hc,宽度wc,角度angle_θ信息,根据信息在预测图片中画出预测框完成预测。
其中:xc=(xc*max+xc*min)/2
yc=(yc*max+yc*min)/2
wc=max(w*meangcos(angle_θ),w*meangsin(angle_θ))。
上述实施例并非是对于本发明的限制,本发明并非仅限于上述实施例,只要符合本发明要求,均属于本发明的保护范围。
Claims (1)
1.一种密集子区域切割的遥感图像旋转舰船目标检测方法,其特征在于,该方法具体包括以下步骤:
步骤(1)、训练集数据预处理;
利用图像标注工具对图像中待检测的目标进行标注,获取到图像中目标的中心点坐标(x,y)、目标的宽w和高h,目标的角度信息angle;根据设置的切割步长step和目标的高度h,确定目标切割为子目标的个数n;根据目标的中心点坐标和目标的宽及高计算出目标的四个顶点的坐标(x1,y1),(x2,y2),(x3,y3),(x4,y4);根据子目标的个数n得到相邻子目标的间隔(dcx,dcy);根据间隔大小和顶点位置得到第i个子目标的中心点坐标(xi,yi),其中0<i<n;根据子目标的中心点坐标,并以目标的宽度w作为子目标的宽度来确定切割的子目标的位置信息;根据子目标的位置信息对目标进行切割,获取密集子目标;
其中:n=h/step+1
h_vec=[h·cos(angle)/2,h·sin(angle)/2]
w_vec=[w/2·cos(3π/2+angle),w/2·sin(3π/2+angle)]
dcx=(x3-x1)/n
dcy=(y3-y1)/n
xi=x1+dcx·(0.5+i)
yi=x1+dcx·(0.5+i)
步骤(2)、使用YOLO V3算法对预处理后的训练集进行训练;
根据密集子目标的标注框的高度和宽度,利用K-近邻聚类方法对子目标的标注框进行聚类后分为9类,获取9类框的大小,以此来设置YOLO V3锚点框参数;提取密集子目标的中心点信息、高度、宽度,放入YOLO V3进行训练,训练直到损失函数不再降低,获取权重文件;
步骤(3)、使用YOLO V3对测试集进行预测;
利用步骤(2)中得到的权重文件,对测试集图像进行测试;对于每一张图片进行预测后,获取所有预测的子目标的中心点坐标(xc*,yc*),高度h*,宽度w*;
步骤(4)、预测子目标数据的后处理;
根据步骤(3)中每一幅图片中所有预测的子目标的中心点进行多项式拟合,得到中心点坐标的函数关系,由函数获取到拟合直线的角度angle_θ;根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)和的平均值为预测目标的中心点坐标(xc,yc);根据所有预测的子目标的中心点坐标取最大坐标(xc*max,yc*max)最小坐标(xc*min,yc*min)利用勾股定理计算出预测目标的高度;根据获取到的所有预测的子目标的宽度w*的平均值w*mean,利用角度angle_θ,并根据三角函数求出目标宽度wc;由此获得预测目标的中心点(xc,yc),高度hc,宽度wc,角度angle_θ信息,根据信息在预测图片中画出预测框完成预测;
其中:xc=(xc*max+xc*min)/2
yc=(yc*max+yc*min)/2
wc=max(w*meangcos(angle_θ),w*meangsin(angle_θ))。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910816272.1A CN110674698B (zh) | 2019-08-30 | 2019-08-30 | 一种密集子区域切割的遥感图像旋转舰船目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910816272.1A CN110674698B (zh) | 2019-08-30 | 2019-08-30 | 一种密集子区域切割的遥感图像旋转舰船目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110674698A true CN110674698A (zh) | 2020-01-10 |
CN110674698B CN110674698B (zh) | 2021-12-07 |
Family
ID=69076127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910816272.1A Active CN110674698B (zh) | 2019-08-30 | 2019-08-30 | 一种密集子区域切割的遥感图像旋转舰船目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674698B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488113A (zh) * | 2020-11-06 | 2021-03-12 | 杭州电子科技大学 | 一种基于局部直线匹配的遥感图像旋转舰船目标检测方法 |
CN112966609A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 目标检测方法及装置 |
CN113221773A (zh) * | 2021-05-19 | 2021-08-06 | 中国电子科技集团公司第二十八研究所 | 基于遥感影像快速构建飞机分类数据集的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722712A (zh) * | 2012-01-02 | 2012-10-10 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
CN105205808A (zh) * | 2015-08-20 | 2015-12-30 | 武汉大学 | 基于多特征多约束的多视影像密集匹配融合方法及系统 |
US20170353670A1 (en) * | 2016-06-07 | 2017-12-07 | Disney Enterprises, Inc. | Video segmentation from an uncalibrated camera array |
-
2019
- 2019-08-30 CN CN201910816272.1A patent/CN110674698B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722712A (zh) * | 2012-01-02 | 2012-10-10 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
CN105205808A (zh) * | 2015-08-20 | 2015-12-30 | 武汉大学 | 基于多特征多约束的多视影像密集匹配融合方法及系统 |
US20170353670A1 (en) * | 2016-06-07 | 2017-12-07 | Disney Enterprises, Inc. | Video segmentation from an uncalibrated camera array |
Non-Patent Citations (2)
Title |
---|
MINGCHEN GAO等: "Segmentation label propagation using deep convolutional neural networks and dense conditional random field", 《IEEE》 * |
张刚等: "基于区域特征分割的密集匹配点云渐进形态学滤波", 《地球信息科学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488113A (zh) * | 2020-11-06 | 2021-03-12 | 杭州电子科技大学 | 一种基于局部直线匹配的遥感图像旋转舰船目标检测方法 |
CN112966609A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 目标检测方法及装置 |
CN112966609B (zh) * | 2021-03-05 | 2023-08-11 | 北京百度网讯科技有限公司 | 目标检测方法及装置 |
CN113221773A (zh) * | 2021-05-19 | 2021-08-06 | 中国电子科技集团公司第二十八研究所 | 基于遥感影像快速构建飞机分类数据集的方法 |
CN113221773B (zh) * | 2021-05-19 | 2022-09-13 | 中国电子科技集团公司第二十八研究所 | 基于遥感影像快速构建飞机分类数据集的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110674698B (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674698B (zh) | 一种密集子区域切割的遥感图像旋转舰船目标检测方法 | |
CN111487641B (zh) | 一种利用激光雷达检测物体的方法、装置、电子设备及存储介质 | |
KR101830249B1 (ko) | 이동체의 위치 인식 장치 및 방법 | |
CN101609504B (zh) | 一种红外图像海面目标检测识别定位方法 | |
CN103559791B (zh) | 一种融合雷达和ccd摄像机信号的车辆检测方法 | |
US9454692B2 (en) | Method for identifying and positioning building using outline region restraint of mountain | |
Huang et al. | DMPR-PS: A novel approach for parking-slot detection using directional marking-point regression | |
CN105654097B (zh) | 图像中四边形标记物的检测方法 | |
CN113424079A (zh) | 障碍物检测方法、装置、计算机设备和存储介质 | |
CN104197899A (zh) | 移动机器人定位方法及系统 | |
CN103310194A (zh) | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 | |
CN114241298A (zh) | 一种激光雷达和图像融合的塔吊环境目标检测方法及系统 | |
CN108364466A (zh) | 一种基于无人机交通视频的车流量统计方法 | |
JP6381137B2 (ja) | 標識検出装置、方法、及びプログラム | |
CN103605953A (zh) | 基于滑窗搜索的车辆兴趣目标检测方法 | |
CN110674674A (zh) | 一种基于yolo v3的旋转目标检测方法 | |
CN104933738A (zh) | 一种基于局部结构检测和对比度的视觉显著图生成方法 | |
JP6826023B2 (ja) | 点群から対象を特定する対象識別装置、プログラム及び方法 | |
TWI611961B (zh) | 車道線影像分析方法、影像分析裝置及其電腦可讀取式媒體 | |
CN110147748B (zh) | 一种基于道路边缘检测的移动机器人障碍物识别方法 | |
CN104915678A (zh) | 一种输电线路中目标对象的检测方法及装置 | |
CN105307116A (zh) | 一种基于移动机器人的分布式视觉定位系统及方法 | |
CN107886541B (zh) | 基于反向投影法的单目运动目标位姿实时测量方法 | |
CN105302132A (zh) | 一种基于行走机器人的分布式视觉定位系统及方法 | |
CN101567045B (zh) | 一种人脸特征点精确定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |