CN115082694B - 基于扁长形锚点和线段扩充技术的船舶检测方法和装置 - Google Patents
基于扁长形锚点和线段扩充技术的船舶检测方法和装置 Download PDFInfo
- Publication number
- CN115082694B CN115082694B CN202210535227.0A CN202210535227A CN115082694B CN 115082694 B CN115082694 B CN 115082694B CN 202210535227 A CN202210535227 A CN 202210535227A CN 115082694 B CN115082694 B CN 115082694B
- Authority
- CN
- China
- Prior art keywords
- candidate
- candidate frame
- features
- line segment
- ship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 99
- 238000005516 engineering process Methods 0.000 title claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 30
- 238000011176 pooling Methods 0.000 claims abstract description 15
- 230000001629 suppression Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000003708 edge detection Methods 0.000 claims description 6
- 230000005764 inhibitory process Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种基于扁长形锚点和线段扩充技术的船舶检测方法和装置,其中,所述方法包括:将目标图像输入至候选框检测网络中输出船舶对象的第一候选框;从目标图像中识别出船舶对象与水平面之间的分界线段,提取目标图像的卷积神经网络特征;将第一候选框在卷积神经网络特征上进行感兴趣区域池化处理得到第一候选框的特征;对第一候选框的特征进行回归和分类得到第二候选框;根据第二候选框和分界线段扩充得到候选框集合;将候选框集合的候选框进行非极大值抑制合并得到船舶对象检测结果。本发明实施例设计了多种不同比例的扁长形锚点,覆盖了大部分船舶对象的长宽比,充分考虑了实际的船舶应用场景,避免了船舶对象识别不完整的问题。
Description
技术领域
本发明涉及互联网技术领域,特别是涉及一种基于扁长形锚点和线段扩充技术的船舶检测方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,船舶的定位主要依靠自动识别系统(Automatic Identification System,简称AIS)。AIS是安装在船舶上的一套系统,借由与邻近船舶、AIS岸台、以及卫星等设备交换电子资料,并且供船舶交通管理系统辨识及定位。通常,300吨以上的船舶要求强制安装AIS,但300吨以下的船舶暂无硬性安装需求,特别是较大比例的民用船舶(如木船、帆船、摩托艇)没有安装AIS。
为了实现了船舶的全面检测,常用基于深度学习的检测算法进行船舶检测。但是,现有的检测算法对船舶这类呈扁长形态的物体的检测结果不准确。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于扁长形锚点和线段扩充技术的船舶检测方法、装置、电子设备和计算机可读存储介质。
为了解决上述问题,根据本发明实施例的第一方面,公开了一种基于扁长形锚点和线段扩充技术的船舶检测方法,所述方法包括:获取待检测的目标图像,所述目标图像包含船舶对象和水平面;将所述目标图像输入至预先训练完毕的候选框检测网络中,输出所述船舶对象的多个第一候选框,所述候选框检测网络基于预设的多种扁长形锚点训练而成;从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段,并提取所述目标图像的卷积神经网络特征;分别将多个所述第一候选框在所述卷积神经网络特征上进行感兴趣区域池化处理,得到多个所述第一候选框的特征;对多个所述第一候选框的特征进行回归和分类得到多个第二候选框;根据多个所述第二候选框和所述分界线段扩充得到候选框集合;将所述候选框集合中的候选框进行非极大值抑制合并得到所述船舶对象的检测结果。
可选地,所述候选框检测网络的训练步骤,包括:获取样本图像,将所述样本图像的尺寸重新调整至预设尺寸;对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;对所述分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;分别对所述分类多维特征和所述回归多维特征进行上采样处理,并根据预设损失函数进行所述候选框检测网络的训练。
可选地,所述对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征,包括:对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;对所述第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;对所述第二层特征进行下采样处理、卷积处理和线性处理得到所述分层特征。
可选地,所述分类多维特征为(p_pos,p_neg),其中,所述p_pos表示像素点是正样本的概率,所述p_neg表示像素点是负样本的概率;所述回归多维特征为(x,y,w,h),其中,所述x表示候选框起点横坐标,所述y表示候选框起点纵坐标,所述w表示候选框的宽,所述h表示候选框的高。
可选地,所述从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段,包括:将所述目标图像转换为灰度图像;基于边缘检测算法提取所述灰度图像的边缘;将所述边缘进行霍夫变换得到倾斜角在预设范围内的所述分界线段。
可选地,所述根据多个所述第二候选框和所述分界线段扩充得到候选框集合,包括:在多个所述第二候选框中选择下边缘与所述分界线段相邻的候选框;基于选择的候选框分别向左和/或向右扩充得到多个候选框;将多个所述第二候选框和扩充得到的多个候选框作为所述候选框集合。
可选地,所述提取所述目标图像的卷积神经网络特征,包括:将所述目标图像输入至残差网络和特征金字塔网络中,输出所述卷积神经网络特征。
根据本发明实施例的第二方面,还公开了一种基于扁长形锚点和线段扩充技术的船舶检测装置,所述装置包括:目标图像获取模块,用于获取待检测的目标图像,所述目标图像包含船舶对象和水平面;候选框检测模块,用于将所述目标图像输入至预先训练完毕的候选框检测网络中,输出所述船舶对象的多个第一候选框,所述候选框检测网络基于预设的多种扁长形锚点训练而成;线段检测模块,用于从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段;特征提取模块,用于提取所述目标图像的卷积神经网络特征;池化处理模块,用于分别将多个所述第一候选框在所述卷积神经网络特征上进行感兴趣区域池化处理,得到多个所述第一候选框的特征;回归分类模块,用于对多个所述第一候选框的特征进行回归和分类得到多个第二候选框;候选框扩充模块,用于根据多个所述第二候选框和所述分界线段扩充得到候选框集合;候选框合并模块,用于将所述候选框集合中的候选框进行非极大值抑制合并得到所述船舶对象的检测结果。
可选地,所述装置还包括:候选框检测网络训练模块,所述候选框检测网络训练模块包括:样本图像获取模块,用于获取样本图像,将所述样本图像的尺寸重新调整至预设尺寸;样本图像处理模块,用于对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;分层特征处理模块,用于对所述分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;网络训练模块,用于分别对所述分类多维特征和所述回归多维特征进行上采样处理,并根据预设损失函数进行所述候选框检测网络的训练。
可选地,所述样本图像处理模块,用于对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;对所述第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;对所述第二层特征进行下采样处理、卷积处理和线性处理得到所述分层特征。
可选地,所述分类多维特征为(p_pos,p_neg),其中,所述p_pos表示像素点是正样本的概率,所述p_neg表示像素点是负样本的概率;所述回归多维特征为(x,y,w,h),其中,所述x表示候选框起点横坐标,所述y表示候选框起点纵坐标,所述w表示候选框的宽,所述h表示候选框的高。
可选地,所述线段检测模块,包括:灰度转换模块,用于将所述目标图像转换为灰度图像;边缘提取模块,用于基于边缘检测算法提取所述灰度图像的边缘;霍夫变换模块,用于将所述边缘进行霍夫变换得到倾斜角在预设范围内的所述分界线段。
可选地,所述候选框扩充模块,包括:候选框选择模块,用于在多个所述第二候选框中选择下边缘与所述分界线段相邻的候选框;候选框复用模块,用于基于选择的候选框分别向左和/或向右扩充得到多个候选框;候选框集合模块,用于将多个所述第二候选框和扩充得到的多个候选框作为所述候选框集合。
可选地,所述特征提取模块,用于将所述目标图像输入至残差网络和特征金字塔网络中,输出所述卷积神经网络特征。
根据本发明实施例的第三方面,还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的一种基于扁长形锚点和线段扩充技术的船舶检测方法。
根据本发明实施例的第四方面,还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的一种基于扁长形锚点和线段扩充技术的船舶检测方法。
与现有技术相比,本发明实施例提供的技术方案具有如下优点:
本发明实施例提供的一种基于扁长形锚点和线段扩充技术的船舶检测方案,获取包含船舶对象和水平面的目标图像,利用基于多种扁长形锚点训练而成的候选框检测网络输出目标图像中船舶对象的多个第一候选框。并且,从目标图像中识别出船舶对象与水平面之间的分界线段,以及提取出目标图像的卷积神经网络特征。然后,将多个第一候选框在卷积神经网络特征上进行感兴趣区域池化处理得到多个第一候选框的特征,进而对多个第一候选框进行回归和分类得到多个第二候选框,再利用分界线段对多个第二候选框进行扩充得到候选框集合,最终,将候选框集合中的候选框进行非极大值抑制合并得到船舶对象的检测结果。
本发明实施例中在候选框检测网络的训练过程中,设计了多种不同比例的扁长形锚点,覆盖了大部分船舶对象的长宽比,充分考虑了实际的船舶应用场景。而且,识别出船舶对象与水平面之间的分界线段之后,基于分界线段对候选框进行扩充得到候选框集合,避免了船舶对象识别不完整的问题。
附图说明
图1是本发明实施例的一种基于扁长形锚点和线段扩充技术的船舶检测方法的步骤流程图;
图2是本发明实施例的一种候选框检测网络的结构示意图;
图3是本发明实施例的从目标图像中识别出倾斜角在预设范围内的多个线段的示意图;
图4是本发明实施例的分界线段的示意图;
图5是本发明实施例的候选框检测网络、线段检测网络和船舶检测网络之间的关系示意图;
图6是本发明实施例的一种船舶检测的流程示意图;
图7是本发明实施例的一种基于扁长形锚点和线段扩充技术的船舶检测装置的结构框图;
图8是本发明实施例的一种电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种基于扁长形锚点和线段扩充技术的船舶检测方法的步骤流程图。该基于扁长形锚点和线段扩充技术的船舶检测方法可以应用于终端或者服务器。该基于扁长形锚点和线段扩充技术的船舶检测方法具体可以包括如下步骤:
步骤101,获取待检测的目标图像。
在本发明的实施例中,目标图像可以为任意格式的图像,在实际应用中,目标图像可以包含一个或多个船舶对象和水平面。即目标图像可以包含行驶或停泊在水中的船舶对象。
步骤102,将目标图像输入至预先训练完毕的候选框检测网络中,输出船舶对象的多个第一候选框。
在本发明的实施例中,候选框检测网络基于预设的多种扁长形锚点训练而成。在实际应用中,预设的多种扁长形锚点可以为7种比例的锚点,7种比例分别为[2:1],[5:1],[7:1],[10:1],[12:1],[15:1],[20:1]。假设船舶对象的高度为20像素值、30像素值、40像素值、50像素值和60像素值。对应于上述各船舶对象的高度的锚点大小如下表所示。
高\比例 | 2:1 | 5:1 | 7:1 | 10:1 | 12:1 | 15:1 | 20:1 |
20 | 40x20 | 100x20 | 140x20 | 200x20 | 240x20 | 300x20 | 400x20 |
30 | 60x30 | 150x30 | 210x30 | 300x30 | 360x30 | 450x30 | 600x30 |
40 | 80x40 | 200x40 | 280x40 | 400x40 | 480x40 | 600x40 | 800x40 |
50 | 100x50 | 250x50 | 350x50 | 500x50 | 600x50 | 750x50 | 1000x50 |
60 | 120x60 | 300x60 | 420x60 | 600x60 | 720x60 | 900x60 | 1200x60 |
表1
在实际应用中,候选框检测网络的训练步骤为:获取样本图像,将样本图像的尺寸重新调整至预设尺寸;对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;对分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;分别对分类多维特征和回归多维特征进行上采样处理,并根据预设损失函数进行候选框检测网络的训练。其中,对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征的一种实施方式为:对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;对第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;对第二层特征进行下采样处理、卷积处理和线性处理得到第三层特征,第三层特征即分层特征。
参照图2,示出了一种候选框检测网络的结构示意图。在图2中,候选框网络的训练步骤为:
a)、将样本图像重新调整(resize)到500x500;
b)、将a)经过卷积和线性(ReLu)得到第一层特征;
c)、b)得到的特征下采样后,继续卷积及Relu,得到第二层特征;
d)、c)得到的特征下采样后,继续卷积,得到第三层特征,此时的特征已经具有较高的抽象性;
e)、将d)得到的特征经过全连接层,计算分类分支,得到维度为128x70的特征,即128个像素点,每个点输出70维特征:2*35锚点,2维用(p_pos,p_neg)表示:
p_pos:表示该点是正样本的概率;
p_neg:表示该点是负样本的概率;
f)、将d)得到的特征经过全连接层,计算回归分支,得到维度为128x140的特征,即128个像素点,每个点输出140维特征:4*35锚点,4维用(x,y,w,h)表示:
x:表示候选框起点横坐标;
y:表示候选框起点纵坐标;
w:表示候选框的宽;
h:表示候选框的高;
g)、将e)上采样回500x500的大小,各点的35个锚点和真值做比较,计算损失值,损失函数为常规的L2损失函数;
h)、将f)上采样回500x500的大小,各点的35个锚点和真值做比较,计算损失值,损失函数为常规的L1损失函数。
步骤103,从目标图像中识别出船舶对象与水平面之间的分界线段,并提取目标图像的卷积神经网络特征。
在实际应用中,平面中的每一条直线对应一组极坐标(ρ,θ),其中,ρ表示极径,θ表示极角,即一个二元数组。平面中的每一点都有无数条直线经过,这些直线对应的二元数组构成一条曲线(计算机无法做连续遍历,因此这是一条离散曲线)。将参数空间(ρ,θ)量化,赋初值一个二维矩阵M,M(ρ,θ)就是一个累加器了。然后对图像进行边缘检测(为了加速计算),轮廓上的每一个点进行变换,变换到属于哪一组(ρ,θ),就把该组(ρ,θ)对应的累加器数加1。当所有点处理完成后,就来分析得到的M(ρ,θ),设置一个阈值T,认为当M(ρ,θ)>T,就认为存在一条有意义的直线存在。而对应的M(ρ,θ)就是这组直线的参数,T可以根据实际情况设定。有了M(ρ,θ)和点的坐标值就可以计算得到直线。基于上述原理,本发明实施例从目标图像中识别出船舶对象与水平面之间的分界线段的一种实施方式为,将目标图像转换为灰度图像;基于边缘检测算法(canny算法)提取灰度图像的边缘;将边缘进行霍夫(Hough)变换得到倾斜角在预设范围内的分界线段。由于船舶检测关注横向的线段,因此倾斜角可以在预设范围为5°以内。参照图3,示出了从目标图像中识别出倾斜角在预设范围内的多个线段的示意图。图3中,黑色线段即识别出的多个线段。在设定水平面和线段长度之后,可以进一步检测出船舶对象与水平面之间的分界线段,如图4所示。图4示出了分界线段的示意图。图4中,黑色线段即检测得到的分界线段。
在本发明的实施例中,提取目标图像的卷积神经网络特征的一种实施方式为,将目标图像输入至残差网络(Resnet50)和特征金字塔网络(Feature Pyramid Network,简称FPN)中,输出卷积神经网络特征。
步骤104,分别将多个第一候选框在卷积神经网络特征上进行感兴趣区域池化处理,得到多个第一候选框的特征。
在本发明的实施例中,将多个第一候选框在卷积神经网络特征上进行感兴趣区域池化处理(ROI Pooling)得到第一候选框对应的特征。
步骤105,对多个第一候选框的特征进行回归和分类得到多个第二候选框。
在本发明的实施例中,针对每个第一候选框的特征分别进行回归和分类得到对应的多个第二候选框。
步骤106,根据多个第二候选框和分界线段扩充得到候选框集合。
在本发明的实施例中,根据多个第二候选框和分界线段扩充得到候选框集合的一种实施方式为,在多个第二候选框中选择下边缘与分界线段相邻的候选框;基于选择的候选框分别向左和/或向右扩充得到多个候选框;将多个第二候选框和扩充得到的多个候选框作为候选框集合。在实际应用中,基于选择的候选框分别向左和/或向右扩充得到多个候选框时,可以扩充得到3个候选框,分别为复用选择的候选框的长直线最左侧得到的候选框,复用选择的候选框的长直线最右侧得到的候选框,复用选择的候选框的长直线最左侧和最右侧得到的候选框。
步骤107,将候选框集合中的候选框进行非极大值抑制合并得到船舶对象的检测结果。
本发明实施例提供的一种基于扁长形锚点和线段扩充技术的船舶检测方案,获取包含船舶对象和水平面的目标图像,利用基于多种扁长形锚点训练而成的候选框检测网络输出目标图像中船舶对象的多个第一候选框。并且,从目标图像中识别出船舶对象与水平面之间的分界线段,以及提取出目标图像的卷积神经网络特征。然后,将多个第一候选框在卷积神经网络特征上进行感兴趣区域池化处理得到多个第一候选框的特征,进而对多个第一候选框进行回归和分类得到多个第二候选框,再利用分界线段对多个第二候选框进行扩充得到候选框集合,最终,将候选框集合中的候选框进行非极大值抑制合并得到船舶对象的检测结果。
本发明实施例中在候选框检测网络的训练过程中,设计了多种不同比例的扁长形锚点,覆盖了大部分船舶对象的长宽比,充分考虑了实际的船舶应用场景。而且,识别出船舶对象与水平面之间的分界线段之后,基于分界线段对候选框进行扩充得到候选框集合,避免了船舶对象识别不完整的问题。
在本发明的实施例中,需要预先训练候选框检测网络、线段检测网络和船舶检测网络。参照图5,示出了候选框检测网络、线段检测网络和船舶检测网络之间的关系示意图。在图5中,候选框检测网络输出的第一候选框按照线段检测网络输出的分界线段进行扩充,将扩充得到的候选框集合利在船舶检测网络输出的卷积神经网络特征上用ROI Pooling后,再分别计算分类损失值和回归损失值。
参照图6,示出了一种船舶检测的流程示意图。
在图6中,获取目标图像,将目标图像分别输入候选框检测网络、Resnet50和FPN,以及线段检测网络。从候选框检测网络输出第一候选框。从Resnet50和FPN输出卷积神经网络特征。从线段检测网络输出分界线段。将第一候选框在卷积神经网络特征上进行ROIPooling处理,得到第一候选框的特征。对第一候选框的特征进行回归和分类得到第二候选框。第二候选框结合分界线段进行线段扩充得到候选框集合。候选框集合输入到非极大值抑制(Non Maximum Suppression,简称NMS)得到检测结果。
参照图7,示出了本发明实施例的一种基于扁长形锚点和线段扩充技术的船舶检测装置的结构框图,该基于扁长形锚点和线段扩充技术的船舶检测装置可以应用于终端或者服务器。该基于扁长形锚点和线段扩充技术的船舶检测装置具体可以包括如下模块:
目标图像获取模块71,用于获取待检测的目标图像,所述目标图像包含船舶对象和水平面;
候选框检测模块72,用于将所述目标图像输入至预先训练完毕的候选框检测网络中,输出所述船舶对象的多个第一候选框,所述候选框检测网络基于预设的多种扁长形锚点训练而成;
线段检测模块73,用于从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段;
特征提取模块74,用于提取所述目标图像的卷积神经网络特征;
池化处理模块75,用于分别将多个所述第一候选框在所述卷积神经网络特征上进行感兴趣区域池化处理,得到多个所述第一候选框的特征;
回归分类模块76,用于对多个所述第一候选框的特征进行回归和分类得到多个第二候选框;
候选框扩充模块77,用于根据多个所述第二候选框和所述分界线段扩充得到候选框集合;
候选框合并模块78,用于将所述候选框集合中的候选框进行非极大值抑制合并得到所述船舶对象的检测结果。
在本发明的一种优选实施例中,所述装置还包括:候选框检测网络训练模块,所述候选框检测网络训练模块包括:
样本图像获取模块,用于获取样本图像,将所述样本图像的尺寸重新调整至预设尺寸;
样本图像处理模块,用于对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;
分层特征处理模块,用于对所述分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;
网络训练模块,用于分别对所述分类多维特征和所述回归多维特征进行上采样处理,并根据预设损失函数进行所述候选框检测网络的训练。
在本发明的一种优选实施例中,所述样本图像处理模块,用于对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;对所述第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;对所述第二层特征进行下采样处理、卷积处理和线性处理得到所述分层特征。
在本发明的一种优选实施例中,所述分类多维特征为(p_pos,p_neg),其中,所述p_pos表示像素点是正样本的概率,所述p_neg表示像素点是负样本的概率;所述回归多维特征为(x,y,w,h),其中,所述x表示候选框起点横坐标,所述y表示候选框起点纵坐标,所述w表示候选框的宽,所述h表示候选框的高。
在本发明的一种优选实施例中,所述线段检测模块73,包括:
灰度转换模块,用于将所述目标图像转换为灰度图像;
边缘提取模块,用于基于边缘检测算法提取所述灰度图像的边缘;
霍夫变换模块,用于将所述边缘进行霍夫变换得到倾斜角在预设范围内的所述分界线段。
在本发明的一种优选实施例中,所述候选框扩充模块77,包括:
候选框选择模块,用于在多个所述第二候选框中选择下边缘与所述分界线段相邻的候选框;
候选框复用模块,用于基于选择的候选框分别向左和/或向右扩充得到多个候选框;
候选框集合模块,用于将多个所述第二候选框和扩充得到的多个候选框作为所述候选框集合。
在本发明的一种优选实施例中,所述特征提取模块74,用于将所述目标图像输入至残差网络和特征金字塔网络中,输出所述卷积神经网络特征。
本发明实施例还提供了一种电子设备,参见图8,包括:处理器801、存储器802以及存储在所述存储器802上并可在所述处理器801上运行的计算机程序8021,所述处理器801执行所述程序8021时实现前述实施例的基于扁长形锚点和线段扩充技术的船舶检测方法。
本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述实施例的基于扁长形锚点和线段扩充技术的船舶检测方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,本发明实施例中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种基于扁长形锚点和线段扩充技术的船舶检测方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种基于扁长形锚点和线段扩充技术的船舶检测方法,其特征在于,所述方法包括:
获取待检测的目标图像,所述目标图像包含船舶对象和水平面;
将所述目标图像输入至预先训练完毕的候选框检测网络中,输出所述船舶对象的多个第一候选框,所述候选框检测网络基于预设的多种扁长形锚点训练而成;
从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段,并提取所述目标图像的卷积神经网络特征;
分别将多个所述第一候选框在所述卷积神经网络特征上进行感兴趣区域池化处理,得到多个所述第一候选框的特征;
对多个所述第一候选框的特征进行回归和分类得到多个第二候选框;
根据多个所述第二候选框和所述分界线段扩充得到候选框集合;
将所述候选框集合中的候选框进行非极大值抑制合并得到所述船舶对象的检测结果;
其中,所述候选框检测网络的训练步骤,包括:
获取样本图像,将所述样本图像的尺寸重新调整至预设尺寸;
对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;
对所述分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;
分别对所述分类多维特征和所述回归多维特征进行上采样处理,并根据预设损失函数进行所述候选框检测网络的训练;
其中,所述对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征,包括:
对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;
对所述第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;
对所述第二层特征进行下采样处理、卷积处理和线性处理得到所述分层特征;
所述分类多维特征为(p_pos,p_neg),其中,所述p_pos表示像素点是正样本的概率,所述p_neg表示像素点是负样本的概率;所述回归多维特征为(x,y,w,h),其中,所述x表示候选框起点横坐标,所述y表示候选框起点纵坐标,所述w表示候选框的宽,所述h表示候选框的高。
2.根据权利要求1所述的方法,其特征在于,所述从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段,包括:
将所述目标图像转换为灰度图像;
基于边缘检测算法提取所述灰度图像的边缘;
将所述边缘进行霍夫变换得到倾斜角在预设范围内的所述分界线段。
3.根据权利要求1所述的方法,其特征在于,所述根据多个所述第二候选框和所述分界线段扩充得到候选框集合,包括:
在多个所述第二候选框中选择下边缘与所述分界线段相邻的候选框;
基于选择的候选框分别向左和/或向右扩充得到多个候选框;
将多个所述第二候选框和扩充得到的多个候选框作为所述候选框集合。
4.根据权利要求1所述的方法,其特征在于,所述提取所述目标图像的卷积神经网络特征,包括:
将所述目标图像输入至残差网络和特征金字塔网络中,输出所述卷积神经网络特征。
5.一种基于扁长形锚点和线段扩充技术的船舶检测装置,其特征在于,所述装置包括:
目标图像获取模块,用于获取待检测的目标图像,所述目标图像包含船舶对象和水平面;
候选框检测模块,用于将所述目标图像输入至预先训练完毕的候选框检测网络中,输出所述船舶对象的多个第一候选框,所述候选框检测网络基于预设的多种扁长形锚点训练而成;
线段检测模块,用于从所述目标图像中识别出所述船舶对象与所述水平面之间的分界线段;
特征提取模块,用于提取所述目标图像的卷积神经网络特征;
池化处理模块,用于分别将多个所述第一候选框在所述卷积神经网络特征上进行感兴趣区域池化处理,得到多个所述第一候选框的特征;
回归分类模块,用于对多个所述第一候选框的特征进行回归和分类得到多个第二候选框;
候选框扩充模块,用于根据多个所述第二候选框和所述分界线段扩充得到候选框集合;
候选框合并模块,用于将所述候选框集合中的候选框进行非极大值抑制合并得到所述船舶对象的检测结果;
候选框检测网络训练模块,所述候选框检测网络训练模块包括:
样本图像获取模块,用于获取样本图像,将所述样本图像的尺寸重新调整至预设尺寸;
样本图像处理模块,用于对预设尺寸的样本图像进行下采样处理、卷积处理和线性处理得到分层特征;
分层特征处理模块,用于对所述分层特征分别进行分类处理和回归处理得到分类多维特征和回归多维特征;
网络训练模块,用于分别对所述分类多维特征和所述回归多维特征进行上采样处理,并根据预设损失函数进行所述候选框检测网络的训练;
所述样本图像处理模块,用于对预设尺寸的样本图像进行卷积处理和线性处理得到第一层特征;对所述第一层特征进行下采样处理、卷积处理和线性处理得到第二层特征;对所述第二层特征进行下采样处理、卷积处理和线性处理得到所述分层特征;
所述分类多维特征为(p_pos,p_neg),其中,所述p_pos表示像素点是正样本的概率,所述p_neg表示像素点是负样本的概率;所述回归多维特征为(x,y,w,h),其中,所述x表示候选框起点横坐标,所述y表示候选框起点纵坐标,所述w表示候选框的宽,所述h表示候选框的高。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任意一项所述的基于扁长形锚点和线段扩充技术的船舶检测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至4中任意一项所述的基于扁长形锚点和线段扩充技术的船舶检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210535227.0A CN115082694B (zh) | 2022-05-17 | 2022-05-17 | 基于扁长形锚点和线段扩充技术的船舶检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210535227.0A CN115082694B (zh) | 2022-05-17 | 2022-05-17 | 基于扁长形锚点和线段扩充技术的船舶检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115082694A CN115082694A (zh) | 2022-09-20 |
CN115082694B true CN115082694B (zh) | 2024-03-05 |
Family
ID=83247486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210535227.0A Active CN115082694B (zh) | 2022-05-17 | 2022-05-17 | 基于扁长形锚点和线段扩充技术的船舶检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082694B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107818326A (zh) * | 2017-12-11 | 2018-03-20 | 珠海大横琴科技发展有限公司 | 一种基于场景多维特征的船只检测方法及系统 |
CN109598729A (zh) * | 2018-11-28 | 2019-04-09 | 江苏科技大学 | 一种基于srm分割和分层线段特征的船舶目标检测方法 |
CN111368658A (zh) * | 2020-02-24 | 2020-07-03 | 交通运输部水运科学研究所 | 一种自主航行中智能船舶外部目标的自动检测方法及系统 |
CN111368769A (zh) * | 2020-03-10 | 2020-07-03 | 大连东软信息学院 | 基于改进锚点框生成模型的船舶多目标检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9256619B2 (en) * | 2014-01-29 | 2016-02-09 | Raytheon Company | Method for detecting and recognizing boats |
-
2022
- 2022-05-17 CN CN202210535227.0A patent/CN115082694B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107818326A (zh) * | 2017-12-11 | 2018-03-20 | 珠海大横琴科技发展有限公司 | 一种基于场景多维特征的船只检测方法及系统 |
CN109598729A (zh) * | 2018-11-28 | 2019-04-09 | 江苏科技大学 | 一种基于srm分割和分层线段特征的船舶目标检测方法 |
CN111368658A (zh) * | 2020-02-24 | 2020-07-03 | 交通运输部水运科学研究所 | 一种自主航行中智能船舶外部目标的自动检测方法及系统 |
CN111368769A (zh) * | 2020-03-10 | 2020-07-03 | 大连东软信息学院 | 基于改进锚点框生成模型的船舶多目标检测方法 |
Non-Patent Citations (1)
Title |
---|
基于无人船视觉的水面目标识别与跟踪研究;李阳;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115082694A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110310264B (zh) | 一种基于dcnn的大尺度目标检测方法、装置 | |
CN109712071B (zh) | 基于航迹约束的无人机图像拼接与定位方法 | |
CN113469191B (zh) | 基于多层特征融合注意力机制的sar图像叠掩区提取方法 | |
CN102214290B (zh) | 车牌定位方法及车牌定位模板训练方法 | |
CN112711995A (zh) | 一种基于图像的海上目标识别方法 | |
CN114170438A (zh) | 神经网络训练的方法、电子设备及计算机存储介质 | |
CN115424017B (zh) | 一种建筑物内外轮廓分割方法、装置及存储介质 | |
CN113628180A (zh) | 一种基于语义分割网络的遥感建筑物检测方法及系统 | |
CN118015284B (zh) | 基于生成对抗网络的点云分割方法及系统 | |
CN116758437A (zh) | 交并比-焦点损失函数的sar图像目标检测方法及装置 | |
CN117253150A (zh) | 一种基于高分辨率遥感图像的船舶轮廓提取方法及系统 | |
CN111445388A (zh) | 一种图像超分辨重建模型训练方法、船只跟踪方法及装置 | |
CN111882585B (zh) | 被动声呐多目标方位迹提取方法、电子设备及计算机可读存储介质 | |
CN117726954A (zh) | 一种遥感图像海陆分割方法及系统 | |
CN115082694B (zh) | 基于扁长形锚点和线段扩充技术的船舶检测方法和装置 | |
CN115170807B (zh) | 一种图像分割、模型训练方法、装置、设备及介质 | |
CN111783656A (zh) | 一种基于统计特性预分割的自适应红外小目标检测方法 | |
CN115861997A (zh) | 一种关键前景特征引导知识蒸馏的车牌检测识别方法 | |
CN116091887A (zh) | 基于弱监督的目标检测模型训练方法及装置 | |
CN115619813A (zh) | Sem图像前景提取方法、装置、计算机设备及存储介质 | |
CN114926803A (zh) | 车道线检测模型建立方法、车道线检测方法、装置和设备 | |
CN113298102B (zh) | 一种目标分类模型的训练方法及装置 | |
CN111435086B (zh) | 基于拼接图的导航方法和装置 | |
CN113505650A (zh) | 地形特征线提取方法及装置、设备 | |
CN117475262B (zh) | 图像生成方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |