CN111950527A - 一种基于yolo v2神经网络的目标检测方法及装置 - Google Patents

一种基于yolo v2神经网络的目标检测方法及装置 Download PDF

Info

Publication number
CN111950527A
CN111950527A CN202010901157.7A CN202010901157A CN111950527A CN 111950527 A CN111950527 A CN 111950527A CN 202010901157 A CN202010901157 A CN 202010901157A CN 111950527 A CN111950527 A CN 111950527A
Authority
CN
China
Prior art keywords
image
detected
yolo
ship
ship detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010901157.7A
Other languages
English (en)
Inventor
邓练兵
欧阳可佩
高妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dahengqin Technology Development Co Ltd
Original Assignee
Zhuhai Dahengqin Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Dahengqin Technology Development Co Ltd filed Critical Zhuhai Dahengqin Technology Development Co Ltd
Priority to CN202010901157.7A priority Critical patent/CN111950527A/zh
Publication of CN111950527A publication Critical patent/CN111950527A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于YOLO V2神经网络的目标检测方法及装置,其中,方法包括如下步骤:获取待检测图像;将所述待检测图像输入YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果。通过实施本方法,在保证目标检测率的同时,提高了目标检测速度,既能保证目标检测的实时性要求,又能保证目标检测的准确度要求。

Description

一种基于YOLO V2神经网络的目标检测方法及装置
技术领域
本发明涉及神经网络领域,具体涉及一种基于YOLO V2神经网络的目标检测方法及装置。
背景技术
在建立环岛电子围网时,需要安装大量视频监控设备完成对环岛周围海域的监控,尤其是对环岛周围船只的监控,通过对船只的检测能够完成对非法船只的监控以及对船只非法行为的监控。
相关技术中,对船只的检测一般采用Faster R-CNN或者YOLO的检测方式,FasterR-CNN虽然准确度较高,但是实时性差;而YOLO虽然能够满足实时性要求,但是其准确度低。因此,亟需提出一种既能满足实时性要求,又能满足准确度要求的船只检测方法。
发明内容
有鉴于此,本发明实施例提供了一种基于YOLO V2神经网络的目标检测方法及装置,以解决现有技术中船只检测不能同时满足实时性和准确性要求的缺陷。
根据第一方面,本发明实施例提供一种基于YOLO V2神经网络的目标检测方法,包括如下步骤:获取待检测图像;将所述待检测图像输入YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果。
可选地,所述YOLO V2船只检测网络包括:输入层、多个卷积层、多个池化层以及输出层;根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果,包括:对所述卷积层或池化层的输出结果进行批量规范化处理,将最后一个池化层的输出结果传输至所述输出层,得到所述待检测图像的船只检测结果。
可选地,所述方法,还包括:获取多个图像作为训练样本;对所述训练样本进行预处理,将经过预处理的后的训练样本输入到所述YOLO V2船只检测网络,得到最后一个池化层输出的特征图;在所述特征图中,根据K-means维度聚类算法,提取目标检测边界框;确定所述目标检测边界框与所述目标的标定位置的偏差值,得到损失值;通过反向传播修正各个所述卷积层参数的权重大小,直至所述损失值满足预设条件,得到YOLO V2船只检测网络。
可选的,所述YOLO V2船只检测网络包括:转移层,所述转移层设置在最后一个池化层之前,用于将第一特征图与第二特征图进行连接,得到新的特征图,所述新的特征图的通道维度大于所述第一特征图的通道维度和所述第二特征图的通道维度,所述第一特征图为所述最后一个池化层的输入,所述第二特征图为所述最后一个池化层的输出。
可选地,所述获取待检测图像之后,还包括:将所述待检测图像按照预设图像大小要求进行预处理,得到目标尺寸的待检测图像;将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像。
可选地,将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像包括:对所述待检测图像进行边缘提取,得到所述待检测图像的多个轮廓连通区域;确定所述多个轮廓连通区域中最小连通区域;根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率,得到目标分辨率的待检测图像。
可选地,所述获取待检测图像,包括:对获取到的视频数据按照目标间隔进行抽帧处理,得到所述待检测图像。
根据第二方面,本发明实施例提供一种基于YOLO V2神经网络的目标检测装置,包括:图像获取模块,用于获取待检测图像;船只检测网络模块,用于将所述待检测图像输入YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;船只检测结果确定模块,用于根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果。
根据第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一实施方式所述的基于YOLO V2神经网络的目标检测方法的步骤。
根据第四方面,本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面或第一方面任一实施方式所述的基于YOLO V2神经网络的目标检测方法的步骤。
本发明技术方案,具有如下优点:
本实施例提供的基于YOLO V2神经网络的目标检测方法/装置,YOLO V2船只检测网络以Googlenet为构架,在保证目标检测率的同时,提高了目标检测速度,既能保证目标检测的实时性要求,又能保证目标检测的准确度要求。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于YOLO V2神经网络的目标检测方法的一个具体示例的流程图;
图2为本发明实施例中基于YOLO V2神经网络的目标检测装置的一个具体示例原理框图;
图3为本发明实施例中电子设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本实施例提供一种基于YOLO V2神经网络的目标检测方法,如图1所示,包括如下步骤:
S101,获取待检测图像。
示例性地,待检测图像的格式可以是.tif、.jpg、.png、.bmp格式,也可以是.avi的视频格式。获取待检测图像的方式可以是接收事先部署的多台监控摄像头的影像数据,摄像头包括全景摄像机、高清网络摄像机、高清红外网络摄像机,低照度高清网络智能球等。本实施例对待检测图像的格式以及获取方式不做限定,本领域技术人员可以根据需要确定。
S102,将待检测图像输入YOLO V2船只检测网络,YOLO V2船只检测网络以Googlenet为基础网络构建得到。
示例性地,YOLO V2船只检测网络使用的是Googlenet架构,Googlenet的核心是Inception Module,Inception Module的基本组成结构有四个部分,分别为:1*1卷积,3*3卷积,5*5卷积,3*3最大池化,最后对四个部分的运算结果进行组合。通过多个卷积核提取待检测图像不同尺度的信息,最后进行融合,从而能够更好地表征待检测图像。
S103,根据YOLO V2船只检测网络的输出结果,得到待检测图像的船只检测结果。
示例性地,将待检测图像输入YOLO V2船只检测网络中,然后对其进行卷积操作,得到最后一层13x13的特征图。然后在13x13的每一个网格上进行anchor boxes的提取,然后输出可能性超过阈值的anchor boxes,即为待检测图像的船只检测结果。阈值大小可以是80%,本实施例对阈值大小不做限定,本领域技术人员可以根据需要确定。
本实施例提供的基于YOLO V2神经网络的目标检测方法,YOLO V2船只检测网络以Googlenet为构架,在保证目标检测率的同时,提高了目标检测速度,既能保证目标检测的实时性要求,又能保证目标检测的准确度要求。
作为本实施例一种可选的实施方式,YOLO V2船只检测网络包括:输入层、多个卷积层、多个池化层以及输出层;根据YOLO V2船只检测网络的输出结果,得到待检测图像的船只检测结果,包括:对卷积层或池化层的输出结果进行批量规范化处理,将最后一个池化层的输出结果传输至输出层,得到待检测图像的船只检测结果。
示例性地,批量规范化操作在YOLO V2船只检测网络每次随机梯度下降训练时,通过批处理(mini-batch)来对相应的网络响应做规范化操作,使得输出信号各个维度的均值为0,方差为1。可以对所有卷积层和池化层的输入进行批量规范化操作,也可以对某些卷积层或池化层的输入进行批量规范化操作,本实施例对批量规范化操作的层数不做限定,本领域技术人员可以根据需要确定。批量规范化操作不仅加快了船只检测网络的收敛速度,而且缓解了深层网络的“梯度弥散”的问题,从而使得训练深层网络模型更加容易和稳定。
作为本实施例的一种可选的实施方式,上述方法还包括:
首先,获取多个图像作为训练样本。
示例性地,训练样本的获取方式可以是接收事先部署的多台监控摄像头的影像数据,摄像头包括全景摄像机、高清网络摄像机、高清红外网络摄像机,低照度高清网络智能球等。本实施例对训练样本的获取方式不做限定,本领域技术人员可以根据需要确定。
其次,对训练样本进行预处理,将经过预处理的后的训练样本输入到YOLOV2船只检测网络,得到最后一个池化层输出的特征图。
示例性地,对样本进行预处理的方式可以是当样本是视频格式时,将视频转换为图像,每个视频都会生成大约10张的图像,然后对样本进行人工筛选,挑选出其中包含船只的图片,将包含船只的图片进行标记,标记出船只的位置和大小,将标记船只的图片作为训练样本,将训练样本进行均衡化、去噪。把数据预处理后的训练样本输入到YOLO V2船只检测网络,进行卷积和池化操作,得到最后一层13x13的特征图。
再次,在特征图中,根据K-means维度聚类算法,提取目标检测边界框;确定目标检测边界框与目标的标定位置的偏差值,得到损失值。
示例性地,根据K-means维度聚类算法,在13x13的每一个网格上进行目标检测边界框的提取。将目标检测边界框对比xml文件记录的船只标定位置,计算损失值。损失值的计算方式可以是:
Figure BDA0002659172910000071
其中,y(t)表示训练样本中船只的实际位置,f(x(t))表示YOLO V2船只检测网络输出的目标检测边界框,T表示训练样本总数量,t表示训练样本数量。本实施例对损失的具体计算方式不做限定,可以根据需要确定。
然后,通过反向传播修正各个卷积层参数的权重大小,直至损失值满足预设条件,得到YOLO V2船只检测网络。
示例性地,损失值满足的预设条件可以是损失值降低至0.2,本实施例对损失值满足的预设条件不做限定,本领域技术人员可以根据需要确定。将损失值反向传播,旨在得到最优的全局参数矩阵,进而将多层神经网络应用到分类或者回归任务中去。前向传递输入信号直至输出产生损失值,反向传播损失值信息修正各个卷积参数的权重矩阵,不断迭代进而得到YOLO V2船只检测网络。其中,前100次迭代次数的训练学习率可以为0.0001,100到25000次的学习率可以为0.00001,25000到30000次的学习率可以为0.000001。本实施例提供的基于YOLO V2神经网络的目标检测方法,通过K-means维度聚类算法进行聚类,提取目标检测边界框,计算时间短,速度快,鲁棒性。
作为本实施例中一种可选的实施方式,YOLO V2船只检测网络包括:转移层,转移层设置在最后一个池化层之前,用于将第一特征图与第二特征图进行连接,得到新的特征图,新的特征图的通道维度大于第一特征图的通道维度和第二特征图的通道维度,第一特征图为所述最后一个池化层的输入,第二特征图为所述最后一个池化层的输出。
示例性地,在最后一个池化层之前设置转移层,转移层以更高分辨率的第一特征图为输入,然后将其连接到后面的低分辨率的第二特征图上,第一特征图维度是第二特征图的2倍,转移层抽取第一特征图的局部区域,其转化其通道维度,将第一特征图连接到第二特征图,形成新的特征图,在新的特征图的基础上进行目标检测。通过添加转移层,提高了对对小物体的检测能力。
作为本实施例一种可选的实施方式,所述方法还包括:对船只检测结果进行召回率和准确率评价;
Figure BDA0002659172910000081
Figure BDA0002659172910000082
其中,recall表示召回率,precision表示准确率,TPi表示第i张图片正确检测的船只数据个数,FPi表示第i张图片误检测的船只数据个数,FNi表示第i张图片漏检测的船只数据个数。
示例性地,本实施例分别选择10组高清船只影像和红外船只影像进行检测。来计算船只影像的识别率。
在实际数据中进行测试,对检测结果进行统计,其统计结果如下表,根据统计结果可以看出,本实施例提出的目标检测方法能够达到很高的精度。
表1自然图像检测结果评价
TP<sub>i</sub> FN<sub>i</sub> FP<sub>i</sub> recall precision
167 18 3 90.27% 98.24%
表2红外图像检测结果评价
TP<sub>i</sub> FN<sub>i</sub> FP<sub>i</sub> recall precision
120 7 1 99.17% 99.17%
作为本实施例一种可选的实施方式,所述方法还包括:对所述待检测图像按照预设图像格式要求进行预处理,将预处理之后的待检测图像输入到所述预先训练好的YOLOV2船只检测网络进行船只识别处理。预设图像格式可以是.jpg格式,将所有待检测图像处理成为.jpg格式,以使得输入至预先训练好的YOLO V2船只检测网络的待检测图像保持格式一致,提高了船只识别效率。
作为本实施例一种可选的实施方式,所述对所述待检测图像按照预设图像格式要求进行预处理,包括:将所述待检测图像按照预设图像大小要求进行预处理,得到目标尺寸的待检测图像;将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像。
示例性地,将待检测图像按照预设图像大小要求进行预处理的具体方式可以是将待检测图像进行缩放,目标尺寸可以是10cmx 10cm,目标分辨率可以是1024x 768像素,本实施例对预设图像大小以及目标分辨率大小不做限定,本领域技术人员可以根据需要确定。将目标尺寸的待检测图像按照预设图像分辨率要求进行预处理的方式可以是对待检测图像在保留细节的情况下,进行重采样,本实施例对预处理方式不做限定,本领域技术人员可以根据需要确定。本实施例对输入到预先训练好的YOLO V2船只检测网络中的待检测图像尺寸进行处理,使其保持尺寸一致,并且将其转化为目标分辨率的待检测图像,从而提高船只识别效率。
作为本实施例一种可选的实施方式,将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像包括:
首先,对待检测图像进行边缘提取,得到待检测图像的中的多个轮廓连通区域,确定多个轮廓连通区域中最小连通区域。
示例性地,对待检测图像进行边缘提取的方式可以是通过Roberts算子、Sobel算子、Prewitt算子,拉普拉斯算子等得到。待检测图像中除了检测目标以外,还有许多其他物体,各个物体的边缘处往往有灰度值急剧变化,通过提取灰度值急剧变化的点就能提取出待检测图像中各个物体的轮廓连通区域,得到待检测图像的多个轮廓连通区域。通过对多个轮廓连通区域进行尺寸计算以及计算结果比较,得到多个轮廓连通区域中最小连通区域。本实施例对边缘提取方法不做限定,本领域技术人员可以根据需要确定。
然后,根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率,得到目标分辨率的待检测图像。
示例性地,根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率的方式可以是当最小连通区域的尺寸小于第一预设尺寸时,待检测图像的分辨率为第一分辨率;当最小连通区域的尺寸大于第一预设尺寸,小于第二预设尺寸时,待检测图像的分辨率为第二分辨率;当最小连通区域的尺寸大于第二预设尺寸,小于第三预设尺寸时,待检测图像的分辨率为第三分辨率,其中,第一预设尺寸、第二预设尺寸、第三预设尺寸依次增大,对应的第一分辨率、第二分辨率、第三分辨率依次减小。比如,第一预设尺寸为1cm2,第二预设尺寸为,3cm2,第三预设尺寸为5cm2,第一分辨率大小为1024x 768像素,第二分辨率大小为960x540像素;第三分辨率大小为640x 360。本实施例对根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率的具体方式以及预设尺寸大小不做限定,本领域技术人员可以根据需要确定。
本实施例提供的基于YOLO V2神经网络的船只检测方法,在将待检测图像输入神经网络之前,对其分辨率按照待检测图像中最小物体的边缘轮廓灵活确定,当按照待检测图像中最小物体较大时,说明待检测图像中目标船只比较大的可能性较大,对于目标船只比较大的待检测图像,其分辨率可以较小,从而减小数据处理量,提高船只检测效率;当按照待检测图像中最小物体较小时,说明待检测图像中目标船只比较小的可能性较大,对于目标船只比较小的待检测图像,提高其分辨率,从而提高船只检测的准确性。
作为本实施例一种可选的实施方式,所述获取待检测图像,包括:
对获取到的视频数据按照目标间隔进行抽帧处理,得到所述待检测图像。
示例性地,目标间隔可以是两帧,对拍摄到的视频数据进行抽帧处理,每隔两帧,选取一帧图像作为待检测图像,将抽帧后获取到的待检测图像输入预先训练好的YOLO V2船只检测网络,减小了视频数据的处理量,提高了检测效率。
本实施例提供一种基于YOLO V2神经网络的目标检测装置,如图2所示,包括:
图像获取模块201,用于获取待检测图像;具体内容参见上述实施例方法对应步骤S101,在此不再赘述。
船只检测网络模块202,用于将所述待检测图像输入YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;具体内容参见上述实施例方法对应步骤S102,在此不再赘述。
船只检测结果确定模块203,用于根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果。具体内容参见上述实施例方法对应步骤S103,在此不再赘述。
本实施例提供的基于YOLO V2神经网络的目标检测装置,YOLO V2船只检测网络以Googlenet为构架,在保证目标检测率的同时,提高了目标检测速度,既能保证目标检测的实时性要求,又能保证目标检测的准确度要求。
作为本实施例一种可选的实施方式,所述船只检测网络模块包括:输入层、多个卷积层、多个池化层以及输出层;船只检测结果确定模块,包括:船只检测结果确定子模块,对所述卷积层或池化层的输出结果进行批量规范化处理,将最后一个池化层的输出结果传输至所述输出层,得到所述待检测图像的船只检测结果。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,基于YOLO V2神经网络的目标检测装置基于YOLO V2神经网络的目标检测装置还包括:
训练样本获取模块,用于获取多个图像作为训练样本;具体内容参见上述实施例方法对应步骤,在此不再赘述。
特征图确定模块,用于对所述训练样本进行预处理,将经过预处理的后的训练样本输入到所述YOLO V2船只检测网络,得到最后一个池化层输出的特征图;具体内容参见上述实施例方法对应步骤,在此不再赘述。
目标检测边界框提取模块,用于在所述特征图中,根据K-means维度聚类算法,提取目标检测边界框;具体内容参见上述实施例方法对应步骤,在此不再赘述。
损失值确定模块,用于确定所述目标检测边界框与所述目标的标定位置的偏差值,得到损失值;具体内容参见上述实施例方法对应步骤,在此不再赘述。
船只检测网络确定模块,用于通过反向传播修正各个所述卷积层参数的权重大小,直至所述损失值满足预设条件,得到YOLO V2船只检测网络。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,所述装置还包括:转移层模块,所述转移层模块设置在最后一个池化层之前,用于将第一特征图与第二特征图进行连接,得到新的特征图,所述新的特征图的通道维度大于所述第一特征图的通道维度和所述第二特征图的通道维度,所述第一特征图为所述最后一个池化层的输入,所述第二特征图为所述最后一个池化层的输出。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,所述装置还包括:评价模块,用于对所述船只检测结果进行召回率和准确率评价;
Figure BDA0002659172910000131
Figure BDA0002659172910000132
其中,recall表示召回率,precision表示准确率,TPi表示第i张图片正确检测的船只数据个数,FPi表示第i张图片误检测的船只数据个数,FNi表示第i张图片漏检测的船只数据个数。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,所述装置还包括:
尺寸处理模块,用于将所述待检测图像按照预设图像大小要求进行预处理,得到目标尺寸的待检测图像;具体内容参见上述实施例方法对应步骤,在此不再赘述。
分辨率修正模块,用于将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,分辨率修正模块包括:
边缘提取模块,用于对所述待检测图像进行边缘提取,得到所述待检测图像的多个轮廓连通区域;具体内容参见上述实施例方法对应步骤,在此不再赘述。
最小连通区域确定模块,用于确定所述多个轮廓连通区域中最小连通区域;具体内容参见上述实施例方法对应步骤,在此不再赘述。
目标分辨率待检测图像确定模块,用于根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率,得到目标分辨率的待检测图像。具体内容参见上述实施例方法对应步骤,在此不再赘述。
作为本实施例一种可选的实施方式,所述图像获取模块201,包括:
抽帧模块,用于对获取到的视频数据按照目标间隔进行抽帧处理,得到所述待检测图像。具体内容参见上述实施例方法对应步骤,在此不再赘述。
本申请实施例还提供一种电子设备,如图3所示,处理器310和存储器320,其中处理器310和存储器320可以通过总线或者其他方式连接。
处理器310可以为中央处理器(Central Processing Unit,CPU)。处理器310还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器320作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的基于YOLO V2神经网络的目标检测方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理。
存储器320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器320可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器320中,当被所述处理器310执行时,执行如图1所示实施例中的基于YOLO V2神经网络的目标检测方法。
上述电子设备的具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例1中基于YOLOV2神经网络的目标检测方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种基于YOLO V2神经网络的船只检测方法,其特征在于,包括如下步骤:
获取待检测图像;
将所述待检测图像输入预先训练好的YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;
根据所述YOLO V2船只检测网络的输出结果,得到对所述待检测图像的船只检测结果。
2.根据权利要求1所述的方法,其特征在于,所述YOLO V2船只检测网络包括:输入层、多个卷积层、多个池化层以及输出层;根据所述YOLO V2船只检测网络的输出结果,得到对所述待检测图像的船只检测结果,包括:
对所述卷积层或池化层的输出结果进行批量规范化处理,将最后一个池化层的输出结果传输至所述输出层,得到对所述待检测图像的船只检测结果。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取多个船只图像作为训练样本;
对所述训练样本进行预处理,将经过预处理后的训练样本输入到所述YOLO V2船只检测网络,得到最后一个池化层输出的特征图;
在所述特征图中,根据K-means维度聚类算法,提取船只检测边界框;
确定所述船只检测边界框与所述船只的标定位置的偏差值,得到损失值;
通过反向传播修正各个卷积层参数的权重大小,直至所述损失值满足预设条件,得到YOLO V2船只检测网络。
4.根据权利要求1所述的方法,其特征在于,所述YOLO V2船只检测网络包括:转移层,所述转移层设置在最后一个池化层之前,用于将第一特征图与第二特征图进行连接,得到新的特征图,所述新的特征图的通道维度大于所述第一特征图的通道维度和所述第二特征图的通道维度,所述第一特征图为所述最后一个池化层的输入,所述第二特征图为所述最后一个池化层的输出。
5.根据权利要求1所述的方法,其特征在于,所述获取待检测图像之后,包括:
将所述待检测图像按照预设图像大小要求进行预处理,得到目标尺寸的待检测图像;
将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像。
6.根据权利要求5所述的方法,其特征在于,将所述目标尺寸的待检测图像按照预设图像分辨率要求进行预处理,得到目标分辨率的待检测图像包括:
对所述待检测图像进行边缘提取,得到所述待检测图像的多个轮廓连通区域;
确定所述多个轮廓连通区域中最小连通区域;
根据最小连通区域的尺寸与预设尺寸大小关系,确定待检测图像的分辨率,得到目标分辨率的待检测图像。
7.根据权利要求1所述的方法,其特征在于,所述获取待检测图像,包括:
对获取到的视频数据按照目标间隔进行抽帧处理,得到所述待检测图像。
8.一种基于YOLO V2神经网络的目标检测装置,其特征在于,包括:
图像获取模块,用于获取待检测图像;
船只检测网络模块,用于将所述待检测图像输入YOLO V2船只检测网络,所述YOLO V2船只检测网络以Googlenet为基础网络构建得到;
船只检测结果确定模块,用于根据所述YOLO V2船只检测网络的输出结果,得到所述待检测图像的船只检测结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一所述的基于YOLOV2神经网络的目标检测方法的步骤。
10.一种存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-7任一所述的基于YOLO V2神经网络的目标检测方法的步骤。
CN202010901157.7A 2020-08-31 2020-08-31 一种基于yolo v2神经网络的目标检测方法及装置 Pending CN111950527A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010901157.7A CN111950527A (zh) 2020-08-31 2020-08-31 一种基于yolo v2神经网络的目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010901157.7A CN111950527A (zh) 2020-08-31 2020-08-31 一种基于yolo v2神经网络的目标检测方法及装置

Publications (1)

Publication Number Publication Date
CN111950527A true CN111950527A (zh) 2020-11-17

Family

ID=73368243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010901157.7A Pending CN111950527A (zh) 2020-08-31 2020-08-31 一种基于yolo v2神经网络的目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN111950527A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051548A (zh) * 2023-03-14 2023-05-02 中国铁塔股份有限公司 一种定位方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886230A (zh) * 2019-02-28 2019-06-14 中南大学 一种图像目标检测方法及装置
CN110443208A (zh) * 2019-08-08 2019-11-12 南京工业大学 一种基于YOLOv2的车辆目标检测方法、系统及设备
CN110991310A (zh) * 2019-11-27 2020-04-10 北京金山云网络技术有限公司 人像检测方法、装置、电子设备及计算机可读介质
CN111259973A (zh) * 2020-01-20 2020-06-09 太原理工大学 一种提高实时目标检测系统中均值平均精度的方法
CN111553184A (zh) * 2019-12-27 2020-08-18 珠海大横琴科技发展有限公司 一种基于电子围网的小目标检测方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886230A (zh) * 2019-02-28 2019-06-14 中南大学 一种图像目标检测方法及装置
CN110443208A (zh) * 2019-08-08 2019-11-12 南京工业大学 一种基于YOLOv2的车辆目标检测方法、系统及设备
CN110991310A (zh) * 2019-11-27 2020-04-10 北京金山云网络技术有限公司 人像检测方法、装置、电子设备及计算机可读介质
CN111553184A (zh) * 2019-12-27 2020-08-18 珠海大横琴科技发展有限公司 一种基于电子围网的小目标检测方法、装置及电子设备
CN111259973A (zh) * 2020-01-20 2020-06-09 太原理工大学 一种提高实时目标检测系统中均值平均精度的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
温捷文 等: "实时目标检测算法 YOLO 的批再规范化处理", 《计算机应用研究》 *
秦皓楠HOWARD_XDU: "YOLOv2——引入:Anchor+特征融合 (目标检测)(one-stage)(深度学习)(CVPR 2017)", 《HTTPS://BLOG.CSDN.NET/GENTLEMAN_QIN/ARTICLE/DETAILS/84349144》 *
苏松志 等: "《行人检测 理论与实践》", 31 March 2016 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051548A (zh) * 2023-03-14 2023-05-02 中国铁塔股份有限公司 一种定位方法及装置
CN116051548B (zh) * 2023-03-14 2023-08-11 中国铁塔股份有限公司 一种定位方法及装置

Similar Documents

Publication Publication Date Title
US11138478B2 (en) Method and apparatus for training, classification model, mobile terminal, and readable storage medium
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
CN110426112B (zh) 一种生猪体重测量方法及装置
US20230085605A1 (en) Face image processing method, apparatus, device, and storage medium
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
US11157797B2 (en) Evaluating quality of a product such as a semiconductor substrate
CN111291825B (zh) 病灶分类模型训练方法、装置、计算机设备和存储介质
CN107633237B (zh) 图像背景分割方法、装置、设备及介质
CN111666855B (zh) 基于无人机的动物三维参数提取方法、系统及电子设备
CN112348787A (zh) 物体缺陷检测模型的训练方法、物体缺陷检测方法及装置
CN114299034A (zh) 一种缺陷检测模型的训练方法、缺陷检测方法及装置
CN113205142B (zh) 一种基于增量学习的目标检测方法和装置
CN112927279A (zh) 一种图像深度信息生成方法、设备及存储介质
WO2023082453A1 (zh) 一种图像处理方法及装置
CN111553182A (zh) 一种船只检索方法、装置及电子设备
CN111597933A (zh) 人脸识别方法和装置
CN112669323A (zh) 图像处理方法及相关设备
CN111444923A (zh) 自然场景下图像语义分割方法和装置
JP7059889B2 (ja) 学習装置、画像生成装置、学習方法、及び学習プログラム
CN111368698A (zh) 主体识别方法、装置、电子设备及介质
CN111445388A (zh) 一种图像超分辨重建模型训练方法、船只跟踪方法及装置
CN111553183A (zh) 一种船只检测模型训练方法、船只检测方法及装置
CN111950527A (zh) 一种基于yolo v2神经网络的目标检测方法及装置
CN112818946A (zh) 年龄识别模型的训练、年龄识别方法、装置及电子设备
CN110210314B (zh) 人脸检测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201117