CN109685152A - 一种基于dc-spp-yolo的图像目标检测方法 - Google Patents
一种基于dc-spp-yolo的图像目标检测方法 Download PDFInfo
- Publication number
- CN109685152A CN109685152A CN201811633166.1A CN201811633166A CN109685152A CN 109685152 A CN109685152 A CN 109685152A CN 201811633166 A CN201811633166 A CN 201811633166A CN 109685152 A CN109685152 A CN 109685152A
- Authority
- CN
- China
- Prior art keywords
- target
- frame
- image
- spp
- yolo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于DC‑SPP‑YOLO的图像目标检测方法,首先利用数据增强方法对训练图像样本进行预处理并构建训练样本集,采用k‑means聚类算法选取用于目标边界框预测的先验候选框;然后将YOLOv2模型的卷积层连接方式由逐层连接改进为密集连接,同时在卷积模块与目标检测层之间引入空间金字塔池化,建立DC‑SPP‑YOLO目标检测模型;最后以预测值与真实值之间的误差平方和构建损失函数,迭代更新模型权重参数使得损失函数收敛,获得DC‑SPP‑YOLO模型并用于目标检测。本发明考虑了加深卷积网络引起的“梯度消失”和YOLOv2模型未充分使用多尺度局部区域特征,构建了基于卷积层密集连接和空间金字塔池化改进的DC‑SPP‑YOLO目标检测模型,提高了目标检测精度。
Description
技术领域
本发明涉及一种图像目标检测方法,属于机器视觉技术领域,尤其涉及一种基于密集连接和空间金字塔池化YOLO(Dense Connectivity and Spatial Pyramid PoolingImprovedYou Look Only Once,DC-SPP-YOLO)的目标检测方法。
背景技术
目标检测是机器视觉领域的核心研究内容之一,广泛应用于驾驶导航、工件检测、机械臂抓取等方面。建立并训练高质量的目标检测模型,能够提取更丰富、有效的目标特征,提高在图像或视频中定位和分类目标的准确度。
传统的形变部件模型(Deformable Parts Models,DPM)等目标检测方法通过滑动窗口搜索目标位置,效率低下;提取目标的梯度方向直方图(Histogram of OrientedGradients,HOG)等人工设计特征用于目标分类,难以全面、深层次的表达目标特征信息。深度卷积神经网络因具有良好的特征提取和表达能力被应用于图像目标分类和检测任务,其中的YOLO(You Look Only Once)算法具有目标检测速度快、无需生成推荐区域等优点,实现了图像目标的实时检测。然而,YOLO和YOLOv2法在目标检测精度方面仍然存在局限;当通过加深网络提高模型学习能力时会出现梯度消失现象,YOLOv3算法采用残差连接方式缓解了梯度消失现象但阻碍了网络各层的信息流;同时,YOLOv2和YOLOv3算法的多尺度目标检测偏重于融合不同尺度卷积层的全局特征,忽略了融合同一卷积层不同尺度的局部区域特征;这都制约着目标检测准确度的提高。
因此,本发明充分考虑了加深卷积网络引起的“梯度消失”问题和YOLOv2模型未充分使用多尺度局部区域特征问题,在YOLOv2网络模型中采用卷积层密集连接方式进行改进,同时引入空间金字塔池化汇聚多尺度局部区域特征,构建了DC-SPP-YOLO目标检测模型,提高了目标检测的精度。
发明内容
本发明以提高YOLOv2模型目标检测精度为目的;首先采用数据增强方法对训练样本进行预处理并构建训练数据集,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;然后构建YOLOv2目标检测网络模型,将卷积层连接方式由逐层连接改进为密集连接,对卷积层输入数据进行批归一化并采用Leaky ReLU激活函数进行非线性化,在卷积模块与目标检测层之间引入空间金字塔池化模块汇聚多尺度图像局部区域特征;最后以目标位置和类别预测的最小平方和误差为训练目标构建损失函数,训练深度卷积网络模型直至损失函数收敛,进而利用所训练的DC-SPP-YOLO模型检测图像目标。DC-SPP-YOLO目标检测流程如图1所示。
本发明采用的技术方案为一种基于DC-SPP-YOLO的图像目标检测方法,该方法具体包括以下步骤:
步骤一:采用图像几何变换等数据增强方法对训练样本进行预处理并构建训练数据集,以训练图像目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;
步骤二:构建YOLOv2目标检测网络模型,将卷积层连接方式由逐层连接改进为密集连接,对卷积层输入数据进行批归一化并采用Leaky ReLU激活函数进行非线性化,在卷积模块与目标检测层之间引入空间金字塔池化模块汇聚多尺度图像局部区域特征;
步骤三:以目标位置和类别预测的最小平方和误差为训练目标构建损失函数,根据步骤一获得的训练数据集和目标边界框先验信息,训练步骤二所构建的DC-SPP-YOLO目标检测模型直至损失函数收敛;
步骤四:输入被测目标图像,利用所训练的DC-SPP-YOLO模型检测图像中的目标,输出图像中每个目标的边界框位置、尺寸以及目标类别。
具体而言,步骤一包括如下步骤:
采用几何变换等方法对训练样本进行数据增强,增加训练样本的多样性进而提高目标检测精度。设原图像中某一像素点的坐标为(x0,y0),几何变换后该像素点的坐标为(x1,y1),图像宽和高分别为width和height;对图像进行水平位移为Tx、垂直位移为Ty的平移变换可表示为
对图像绕中心点进行逆时针旋转的旋转变换表示为
对图像进行水平镜像变换和垂直镜像变换分别表示为
对图像进行水平方向缩放因子为Sx、垂直方向缩放因子为Sy的缩放表示为
以训练图像中目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,即
其中为训练样本目标边界框与聚类中心目标边界框的交并比;采用k-means聚类方法将所有训练样本中的目标边界框分为K类,取各类中心的目标边界框尺寸作为模型预测目标边界框的先验候选框尺寸。k-means聚类算法选取训练样本目标边界先验框的流程如图2所示。
步骤二包括如下步骤:
将输入图像划分为S×S的网格,训练图像中预先标记的目标真实边框中心坐标所在的网格负责预测该类目标的位置和类别。通过回归预测每个包含目标真实位置中心的网格预测B个可能的目标边框。每个目标边框包含五个参数,即边框中心点坐标x和y、边框宽度w和高度h、该边框含有目标的置信度c。其中置信度c由该边框含有物体概率Pr(Object)和边框准确度两部分组成,即
是预测框与真实框的交并比,
对预测框包含的目标类别进行预测,若训练样本中共有C类(C∈N*)目标,则该预测框包含的物体属于第i类(i∈N*,i≤C)的概率为Pr(Classi|Object),预测框的类别置信度表示为
模型预测输出为S×S×(B*(5+C))维的特征向量,其表示输入图像每一个网格预测的边界框的位置、大小、置信度以及其包含的目标类别概率。
以YOLOv2的darknet19网络为基础,将最后一个卷积模块的连接方式由逐层连接改进为密集连接,如图3所示。设卷积模块的初始输入为x0,第l层输入为xl,批次归一化、非线性激活函数和卷积用非线性映射Gl(.)表示;则逐层连接方式可表示为
xl=Gl(xl-1) (10)
密集连接方式将前l-1层输出的特征图堆叠为[x0,x1,…,xl-1]作为第l层输入,即
xl=Gl([x0,x1,…,xl-1]) (11)
每个非线性映射函数Gl(.)输出k幅堆叠的特征图,密集连接模块的第l层输入k0+k×(l-1)幅堆叠的特征图,其中k0为每个密集连接模块输入的特征图通道数。在卷积层之前进行批次归一化,采用leaky ReLU激活函数
对卷积进行非线性化处理。
在卷积层与目标检测层之间引入空间金字塔池化模块,如图4所示,池化窗口尺寸sizepool×sizepool的取值可表示为
其中sizefmap×sizefmap表示输入特征图尺寸,ni=1,2,3,…;池化步长均为1,采用边界填充保证池化后特征图尺寸不变。
步骤三包括如下步骤:
训练步骤二所构建并如图5所示的DC-SPP-YOLO目标检测模型,使其学习预测目标位置和类别,设预测的边界框中心相对于其所在网格左上角坐标与网格边长的比值分别为tx和ty,采用Sigmoid激活函数函数
约束预测值,将其归一化为σ(tx)和σ(ty);设边界框宽、高相对于先验框宽、高的比值取对数为tw和th;边界框相对先验框的目标置信度为tc,归一化为σ(tc);边界框中心点所在网格左上角坐标为(Cx,Cy);先验框的宽和高分别为pw和ph;则边界框的中心点坐标(bx,by)、宽bw、高bh和置信度bc分别为
bx=σ(tx)+Cx (15)
by=σ(ty)+Cy (16)
bc=σ(tc) (19)
预测的边界框输出最终表示为b=[bx,by,bw,bh,bc]T;同理,训练集中目标边界框的真实信息可表示为g=[gx,gy,gw,gh,gc]T;目标的分类情况表示为Class=[Class1,Class2,…,ClassC]T,目标属于各类的实际概率为Pr(Classl)l∈C,模型预测的目标属于各类的概率为
采用最小平方和误差构建目标预测的损失函数:
其中W、H分别为特征图每列和每行的网格数。和表示指示函数;当预测框与实际框的最大值大于阈值IoUthres时认为该预测框包含目标,否则认为该预测框不包含目标,▽σ(.)表示对Sigmoid函数求导后的函数,由于bx、by和bc分别采用Sigmoid激活函数约束的预测值,因此在反向传播计算损失过程中会出现▽σ(.)项。λnoobj、λobj、λcoord和λclass分别为各部分损失的权重系数。在前Nprior个训练样本中引入损失项,计算没有提供实际框有效预测(除了最大的先验框之外)的先验框与预测边界框之间的损失。其中λprior为该项损失的权重系数,先验框的位置和尺度参数表示为prior=[priorx,priory,priorw,priorh]T。如图6所示,训练深度卷积神经网络直至损失函数收敛,获得DC-SPP-YOLO目标检测模型。
步骤四包括如下步骤:
输入被测目标图像,加载根据步骤三训练好的DC-SPP-YOLO模型检测图像中的被测目标;设置阈值IoUthres和Pr(Class)thres,筛选符合要求的目标位置和类别信息;再采用非极大抑制进行局部最大搜索,抑制冗余边框;取筛选后每个网格和Pr(Classi)最大的预测结果作为最终的目标检测结果输出。
本发明的优点:充分考虑了深度卷积网络的梯度消失问题和同一卷积层多尺度局部区域特征融合方法;在YOLOv2网络模型中采用卷积层密集连接方式进行改进,聚合不同卷积层特征,增大网络信息流,强化特征传播;引入空间金字塔池化模块汇聚多尺度局部区域特征,综合利用丰富的多尺度全局特征和局部区域特征;构建了DC-SPP-YOLO目标检测模型,提高了目标检测的精度。
附图说明
图1是本发明所述的一种基于DC-SPP-YOLO的目标检测方法流程图。
图2是k-means聚类算法选取训练样本目标边界先验框的流程图。
图3是DC-SPP-YOLO算法密集连接卷积的原理图。
图4是DC-SPP-YOLO算法空间金字塔池化的原理图。
图5是DC-SPP-YOLO深度卷积网络模型图。
图6是DC-SPP-YOLO算法计算损失函数和迭代更新网络权重的流程图。
图7是具体实施方式中DC-SPP-YOLO模型在PASCAL VOC标准数据集上的图像目标检测结果。
具体实施方式
下面结合实例及附图对本发明作进一步的描述,需要说明的是,实施例并不限定本发明要求保护的范围。
实施例
实施例采用公开且被广泛应用于图像识别与目标检测算法性能测评的PASCALVOC(2007+2012)标准数据集进行DC-SPP-YOLO模型的训练和测试;其中VOC 2007+2012数据集共包含图像样本32487幅,训练数据集图像8218幅,验证数据集图像8333幅,VOC 2007测试数据集图像4952幅,VOC 2012测试数据集图像10990幅。
实施例的计算机配置为Intel(R)Xeon(R)E5-26433.3GHz CPU,32.00GB内存,1块显存为11.00GB的Navida GTX 1080Ti GPU。实施例在Windows10系统Visual Studio 2017平台上进行,所使用的深度学习框架为Darknet,采用C/C++语言编程实现。
将本发明应用到上述PASCAL VOC数据集图像目标检测中,具体步骤如下:
步骤一:采用几何变换等方法对训练样本进行数据增强;对训练图像随机进行水平位移Tx和垂直位移Ty分别在(-width/4,width/4)和(-height/4,height/4)之间随机变化的平移变换;对训练图像绕中心点进行随机逆时针旋转变换,旋转角的变化范围为(-π,π);对图像随机进行水平镜像变换和垂直镜像变换;对图像进行水平方向缩放因子Sx∈[1,3]、垂直方向缩放因子Sy∈[1,3]的随机缩放变换。
以训练图像中目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,即采用k-means聚类方法将所有训练样本中的目标边界框分为5类,取各类中心的目标边界框尺寸作为模型预测目标边界框的先验边界框尺寸。聚类获得的先验边界框尺寸(w,h)分别为:(1.3221,1.73145)、(3.19275,4.00944)、(5.05587,8.09892)、(9.47112,4.84053)和(11.2364,10.0071)。
步骤二:将训练图像缩放至416×416像素大小输入DC-SPP-YOLO网络模型,每10个训练批次对输入图像尺寸进行随机缩放,缩放的大小在256×256像素至608×608像素之间随机变化,变化幅度为32像素的整数倍。
将输入图像划分为13×13的网格,训练图像中预先标记的目标真实边框中心坐标所在的网格负责预测该类目标的位置和类别。对输入数据进行批次归一化,采用在YOLOv2模型的基础上,将最后一个卷积模块的连接方式改进为4层卷积层密集连接;输入特征图尺寸为13×13×512,输出特征图尺寸为13×13×6144;再采用1×1的卷积核减少特征图数量至。在卷积层之前进行批次归一化,采用ai=10的Leaky ReLU激活函数对卷积进行非线性化处理。
在卷积模块与目标检测模块之间引入空间金字塔池化模块,空间金字塔池化模块共有3层,池化窗口尺寸分别设置为5×5、7×7和13×13,滑动步长为1,采用最大池化方式;输入特征图尺寸为13×13×512,输出特征图尺寸为13×13×2048。DC-SPP-YOLO模型结构及参数设置如图5所示。
通过回归预测每个包含目标真实位置中心的网格预测5个可能的目标边框,设置接受该边界框包含目标的交并比阈值IoUthres=0.5。PASCAL VOC数据集共有20类目标,通过分类的方法预测物体属于每一个类别的概率,取最大概率的类别作为预测的物体类别,设置接受物体属于某一类别的概率阈值Pr(Class)thres=0.5。
步骤三:训练DC-SPP-YOLO目标检测模型,计算预测边界框中心相对于其所在网格左上角坐标与网格边长的比值tx和ty,采用Sigmoid激活函数函数约束预测值,将其归一化为σ(tx)和σ(ty);计算边界框宽、高相对于先验框宽、高的比值对数tw和th;计算边界框相对先验框的目标置信度为tc并归一化为σ(tc);根据边界框中心点所在网格左上角坐标(Cx,Cy)、先验框的宽pw和高ph计算预测的边界框位置和置信度向量b=[bx,by,bw,bh,bc]T;计算模型预测的目标属于各类的概率
采用最小平方和误差构建目标预测的损失函数,根据步骤二可知W=13、H=13,IoUthres=0.5,Pr(Class)thres=0.5。设置各部分损失的权重系数λnoobj、λobj、λcoord和λclass分别为1、1、5、1。在前12800个训练样本中引入损失项,计算没有提供实际框有效预测的先验框与预测边界框之间的损失,权重系数λprior=0.1。
分批次输入训练样本,设置批次大小为64、初始学习率为0.001、动量为0.9、权值衰减系数为0.0005,计算每批次训练的平均损失,采用自适应矩估计优化算法迭代更新权值,训练网络模型直至损失函数收敛,得到DC-SPP-YOLO目标检测模型。
步骤四:输入测试数据集图像样本,加载根据步骤三训练好的DC-SPP-YOLO模型检测图像中的被测目标;根据阈值IoUthres和Pr(Class)thres,筛选符合要求的目标位置和类别信息;再采用非极大抑制进行局部最大搜索,抑制冗余边框;取筛选后每个网格和Pr(Classi)最大的预测结果作为最终的目标检测结果输出。DC-SPP-YOLO模型目标检测结果如图7所示。
上述步骤为本发明在PASCAL VOC数据集上进行模型训练和目标检测的具体应用,为了验证本发明的有效性,设置基于YOLOv2模型的目标检测方法为实验对比方法,利用平均查准率均值(mean Average Precision,mAP)和目标检测速度作为性能评价指标,评价DC-SPP-YOLO算法的目标检测性能。PASCAL VOC 2007测试数据集的目标检测结果如表1所示。
表1 DC-SPP-YOLO算法在PASCAL VOC 2007测试数据集上的目标检测结果
由表1可知,在PASCAL VOC 2007测试数据集上,当输入特征图尺寸分别为416×416像素和544×544像素时,DC-SPP-YOLO模型目标检测的mAP分别为78.4%和79.5%,YOLOv2模型目标检测的mAP分别为76.8%和78.6%;实验结果表明,同等实验条件下,采用PASCAL VOC 2007测试数据集,DC-SPP-YOLO模型的目标检测精度高于YOLOv2模型的目标检测精度更高。
在上述实验条件下测试卷积层密集连接改进和空间金字塔池化改进之后YOLOv2目标检查模型的性能提升情况,结果如表2所示。
表2卷积层密集连接改进和空间金字塔池化改进的YOLOv2模型性能提升情况
由实验结果可知,在YOLOv2模型中采用卷积层密集连接改进使得其在PASCALVOC2007测试数据集上目标检测mAP达到77.6%,相较于YOLOv2的mAP提升0.8%;在YOLOv2模型中引入空间金字塔池化模块使得mAP提升0.7%;同时采用卷积层密集连接和空间金字塔池化改进的DC-SPP-YOLOv2模型目标检测精度达到78.4%,相较于YOLOv2算法的mAP提升1.6%。
PASCAL VOC 2012测试数据集的目标检测结果如表3所示。
表3 DC-SPP-YOLO模型在PASCAL VOC 2012测试数据集上的目标检测结果
注:表3目标检测mAP和各类别AP的结果均为百分比数值(%),粗体表示上述四种模型检测该类目标的最高AP值。DC-SPP-YOLO模型在PASCAL VOC 2012标准测试数据集上的目标检测结果通过了PASCAL VOC Evaluation Server的测评,测评结果可见http://host.robots.ox.ac.uk:8080/anonymous/TAD5II.html。
实验结果表明DC-SPP-YOLO算法在PASCAL VOC 2012测试数据集上的目标检测mAP达到74.6%,相较于YOLOv2模型的mAP提升1.2%;20类被测目标中的18类,DC-SPP-YOLO模型预测的AP值高于YOLOv2模型预测的AP值(表3中字体的加粗部分),目标检测精度有了较明显的提升。
上述实验结果表明:采用本发明所述方法对YOLOv2目标检测模型进行的改进合理、有效,提高了图像目标检测的精度。
Claims (5)
1.一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:该方法具体包括以下步骤:
步骤一:采用图像几何变换等数据增强方法对训练样本进行预处理并构建训练数据集,以训练图像目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;
步骤二:构建YOLOv2目标检测网络模型,将卷积层连接方式由逐层连接改进为密集连接,对卷积层输入数据进行批归一化并采用Leaky ReLU激活函数进行非线性化,在卷积模块与目标检测层之间引入空间金字塔池化模块汇聚多尺度图像局部区域特征;
步骤三:以目标位置和类别预测的最小平方和误差为训练目标构建损失函数,根据步骤一获得的训练数据集和目标边界框先验信息,训练步骤二所构建的DC-SPP-YOLO目标检测模型直至损失函数收敛;
步骤四:输入被测目标图像,利用所训练的DC-SPP-YOLO模型检测图像中的目标,输出图像中每个目标的边界框位置、尺寸以及目标类别。
2.根据权利要求1所述的一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:步骤一包括如下步骤,
采用几何变换等方法对训练样本进行数据增强,增加训练样本的多样性进而提高目标检测精度;设原图像中某一像素点的坐标为(x0,y0),几何变换后该像素点的坐标为(x1,y1),图像宽和高分别为width和height;对图像进行水平位移为Tx、垂直位移为Ty的平移变换可表示为
对图像绕中心点进行逆时针旋转的旋转变换表示为
对图像进行水平镜像变换和垂直镜像变换分别表示为
对图像进行水平方向缩放因子为Sx、垂直方向缩放因子为Sy的缩放表示为
以训练图像中目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,即
其中为训练样本目标边界框与聚类中心目标边界框的交并比;采用k-means聚类方法将所有训练样本中的目标边界框分为K类,取各类中心的目标边界框尺寸作为模型预测目标边界框的先验候选框尺寸;k-means聚类算法选取训练样本目标边界先验框的流程。
3.根据权利要求1所述的一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:步骤二包括如下步骤,
将输入图像划分为S×S的网格,训练图像中预先标记的目标真实边框中心坐标所在的网格负责预测该类目标的位置和类别;通过回归预测每个包含目标真实位置中心的网格预测B个可能的目标边框;每个目标边框包含五个参数,即边框中心点坐标x和y、边框宽度w和高度h、该边框含有目标的置信度c;其中置信度c由该边框含有物体概率Pr(Object)和边框准确度两部分组成,即
是预测框与真实框的交并比,
对预测框包含的目标类别进行预测,若训练样本中共有C类目标,C∈N*,则该预测框包含的物体属于第i类的概率为Pr(Classi|Object),i∈N*,i≤C,预测框的类别置信度表示为
模型预测输出为S×S×(B*(5+C))维的特征向量,其表示输入图像每一个网格预测的边界框的位置、大小、置信度以及其包含的目标类别概率;
以YOLOv2的darknet19网络为基础,将最后一个卷积模块的连接方式由逐层连接改进为密集连接;设卷积模块的初始输入为x0,第l层输入为xl,批次归一化、非线性激活函数和卷积用非线性映射Gl(.)表示;则逐层连接方式可表示为
xl=Gl(xl-1) (10)
密集连接方式将前l-1层输出的特征图堆叠为[x0,x1,…,xl-1]作为第l层输入,即
xl=Gl([x0,x1,…,xl-1]) (11)
每个非线性映射函数Gl(.)输出k幅堆叠的特征图,密集连接模块的第l层输入k0+k×(l-1)幅堆叠的特征图,其中k0为每个密集连接模块输入的特征图通道数;在卷积层之前进行批次归一化,采用leaky ReLU激活函数
对卷积进行非线性化处理;
在卷积层与目标检测层之间引入空间金字塔池化模块,池化窗口尺寸sizepool×sizepool的取值表示为
其中sizefmap×sizefmap表示输入特征图尺寸,ni=1,2,3,…;池化步长均为1,采用边界填充保证池化后特征图尺寸不变。
4.根据权利要求1所述的一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:步骤三包括如下步骤,
训练步骤二所构建DC-SPP-YOLO目标检测模型,使其学习预测目标位置和类别,设预测的边界框中心相对于其所在网格左上角坐标与网格边长的比值分别为tx和ty,采用Sigmoid激活函数函数
约束预测值,将其归一化为σ(tx)和σ(ty);设边界框宽、高相对于先验框宽、高的比值取对数为tw和th;边界框相对先验框的目标置信度为tc,归一化为σ(tc);边界框中心点所在网格左上角坐标为(Cx,Cy);先验框的宽和高分别为pw和ph;则边界框的中心点坐标(bx,by)、宽bw、高bh和置信度bc分别为
bx=σ(tx)+Cx (15)
by=σ(ty)+Cy (16)
bc=σ(tc) (19)
预测的边界框输出最终表示为b=[bx,by,bw,bh,bc]T;同理,训练集中目标边界框的真实信息表示为g=[gx,gy,gw,gh,gc]T;目标的分类情况表示为Class=[Class1,Class2,…,ClassC]T,目标属于各类的实际概率为Pr(Classl)l∈C,模型预测的目标属于各类的概率为
采用最小平方和误差构建目标预测的损失函数:
其中W、H分别为特征图每列和每行的网格数;和表示指示函数;当预测框与实际框的最大值大于阈值IoUthres时认为该预测框包含目标,否则认为该预测框不包含目标,▽σ(.)表示对Sigmoid函数求导后的函数,由于bx、by和bc分别采用Sigmoid激活函数约束的预测值,因此在反向传播计算损失过程中会出现▽σ(.)项;λnoobj、λobj、λcoord和λclass分别为各部分损失的权重系数;在前Nprior个训练样本中引入损失项,计算没有提供实际框有效预测的先验框与预测边界框之间的损失;其中λprior为该项损失的权重系数,先验框的位置和尺度参数表示为prior=[priorx,priory,priorw,priorh]T;训练深度卷积神经网络直至损失函数收敛,获得DC-SPP-YOLO目标检测模型。
5.根据权利要求1所述的一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:步骤四包括如下步骤,
输入被测目标图像,加载根据步骤三训练好的DC-SPP-YOLO模型检测图像中的被测目标;设置阈值IoUthres和Pr(Class)thres,筛选符合要求的目标位置和类别信息;再采用非极大抑制进行局部最大搜索,抑制冗余边框;取筛选后每个网格和Pr(Classi)最大的预测结果作为最终的目标检测结果输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811633166.1A CN109685152B (zh) | 2018-12-29 | 2018-12-29 | 一种基于dc-spp-yolo的图像目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811633166.1A CN109685152B (zh) | 2018-12-29 | 2018-12-29 | 一种基于dc-spp-yolo的图像目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109685152A true CN109685152A (zh) | 2019-04-26 |
CN109685152B CN109685152B (zh) | 2020-11-20 |
Family
ID=66191056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811633166.1A Active CN109685152B (zh) | 2018-12-29 | 2018-12-29 | 一种基于dc-spp-yolo的图像目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109685152B (zh) |
Cited By (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147837A (zh) * | 2019-05-14 | 2019-08-20 | 中国电子科技集团公司第二十八研究所 | 基于特征聚焦的任意方向密集目标检测方法、系统及设备 |
CN110223224A (zh) * | 2019-04-29 | 2019-09-10 | 杰创智能科技股份有限公司 | 一种基于信息过滤网络的图像超分辨实现算法 |
CN110232370A (zh) * | 2019-06-21 | 2019-09-13 | 华北电力大学(保定) | 一种改进ssd模型的输电线路航拍图像金具检测方法 |
CN110276247A (zh) * | 2019-05-09 | 2019-09-24 | 南京航空航天大学 | 一种基于YOLOv3-Tiny的行车检测方法 |
CN110334594A (zh) * | 2019-05-28 | 2019-10-15 | 昆明理工大学 | 一种基于批再规范化处理的yolo算法的目标检测方法 |
CN110363104A (zh) * | 2019-06-24 | 2019-10-22 | 中国科学技术大学 | 一种柴油黑烟车的检测方法 |
CN110443208A (zh) * | 2019-08-08 | 2019-11-12 | 南京工业大学 | 一种基于YOLOv2的车辆目标检测方法、系统及设备 |
CN110472572A (zh) * | 2019-08-14 | 2019-11-19 | 西北工业大学 | 一种复杂环境下海上目标的快速识别和分类方法 |
CN110472640A (zh) * | 2019-08-15 | 2019-11-19 | 山东浪潮人工智能研究院有限公司 | 一种目标检测模型预测框处理方法及装置 |
CN110472641A (zh) * | 2019-08-16 | 2019-11-19 | 河海大学常州校区 | 一种空化泡近壁溃灭图像特征数据提取方法 |
CN110532894A (zh) * | 2019-08-05 | 2019-12-03 | 西安电子科技大学 | 基于边界约束CenterNet的遥感目标检测方法 |
CN110533088A (zh) * | 2019-08-16 | 2019-12-03 | 湖北工业大学 | 一种基于区分式卷积神经网络的场景文字语种识别方法 |
CN110648331A (zh) * | 2019-09-02 | 2020-01-03 | 众安信息技术服务有限公司 | 用于医学图像分割的检测方法、医学图像分割方法及装置 |
CN110827259A (zh) * | 2019-11-04 | 2020-02-21 | 上海芯翌智能科技有限公司 | 一种用于目标关键点检测的样本增广的方法与设备 |
CN110991311A (zh) * | 2019-11-28 | 2020-04-10 | 江南大学 | 一种基于密集连接深度网络的目标检测方法 |
CN111046923A (zh) * | 2019-11-26 | 2020-04-21 | 佛山科学技术学院 | 一种基于边界框的图像目标检测方法、装置及存储介质 |
CN111062282A (zh) * | 2019-12-05 | 2020-04-24 | 武汉科技大学 | 基于改进yolov3模型的变电站指针式仪表识别方法 |
CN111079638A (zh) * | 2019-12-13 | 2020-04-28 | 河北爱尔工业互联网科技有限公司 | 基于卷积神经网络的目标检测模型训练方法、设备和介质 |
CN111079540A (zh) * | 2019-11-19 | 2020-04-28 | 北航航空航天产业研究院丹阳有限公司 | 一种基于目标特性的分层可重构车载视频目标检测方法 |
CN111127438A (zh) * | 2019-12-25 | 2020-05-08 | 昆明理工大学 | 基于改进yolo算法的肺部ct图像中结节检测方法 |
CN111127457A (zh) * | 2019-12-25 | 2020-05-08 | 上海找钢网信息科技股份有限公司 | 钢筋数目统计模型训练方法、统计方法、装置及设备 |
CN111178158A (zh) * | 2019-12-10 | 2020-05-19 | 山东大学 | 一种骑车人检测方法及系统 |
CN111179247A (zh) * | 2019-12-27 | 2020-05-19 | 上海商汤智能科技有限公司 | 三维目标检测方法及其模型的训练方法及相关装置、设备 |
CN111259736A (zh) * | 2020-01-08 | 2020-06-09 | 上海海事大学 | 一种基于深度学习的复杂环境下行人实时检测方法 |
CN111275191A (zh) * | 2020-02-26 | 2020-06-12 | 上海商汤智能科技有限公司 | 检测细胞的方法及装置、电子设备和存储介质 |
CN111353544A (zh) * | 2020-03-05 | 2020-06-30 | 天津城建大学 | 一种基于改进的Mixed Pooling-YOLOV3目标检测方法 |
CN111402211A (zh) * | 2020-03-04 | 2020-07-10 | 广西大学 | 一种基于深度学习的高速列车车底异物识别方法 |
CN111429418A (zh) * | 2020-03-19 | 2020-07-17 | 天津理工大学 | 一种基于YOLO v3神经网络的工业零件检测方法 |
CN111460919A (zh) * | 2020-03-13 | 2020-07-28 | 华南理工大学 | 一种基于改进YOLOv3的单目视觉道路目标检测及距离估计方法 |
CN111462051A (zh) * | 2020-03-14 | 2020-07-28 | 华中科技大学 | 一种基于深度神经网络的布匹疵点检测方法和系统 |
CN111476219A (zh) * | 2020-06-02 | 2020-07-31 | 苏州科技大学 | 智能家居环境中图像目标检测方法 |
CN111508093A (zh) * | 2020-04-26 | 2020-08-07 | 王素云 | 一种用于高速公路的过路费预算系统 |
CN111553406A (zh) * | 2020-04-24 | 2020-08-18 | 上海锘科智能科技有限公司 | 基于改进yolo-v3的目标检测系统、方法及终端 |
CN111553348A (zh) * | 2020-04-26 | 2020-08-18 | 中南大学 | 一种基于centernet的anchor-based目标检测方法 |
CN111597900A (zh) * | 2020-04-16 | 2020-08-28 | 浙江工业大学 | 非法遛狗识别方法 |
CN111709336A (zh) * | 2020-06-08 | 2020-09-25 | 杭州像素元科技有限公司 | 一种高速公路行人检测方法、设备及可读存储介质 |
CN111709381A (zh) * | 2020-06-19 | 2020-09-25 | 桂林电子科技大学 | 基于YOLOv3-SPP的道路环境目标检测方法 |
CN111723737A (zh) * | 2020-06-19 | 2020-09-29 | 河南科技大学 | 一种基于多尺度匹配策略深度特征学习的目标检测方法 |
CN111753956A (zh) * | 2020-06-18 | 2020-10-09 | 南京邮电大学 | 一种基于卷积神经网络的目标边界实时检测方法 |
CN111797940A (zh) * | 2020-07-20 | 2020-10-20 | 中国科学院长春光学精密机械与物理研究所 | 一种基于海洋搜救的图像识别方法及相关装置 |
CN111832608A (zh) * | 2020-05-29 | 2020-10-27 | 上海海事大学 | 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法 |
CN111881803A (zh) * | 2020-07-22 | 2020-11-03 | 安徽农业大学 | 一种基于改进YOLOv3的畜脸识别方法 |
CN111951233A (zh) * | 2020-07-24 | 2020-11-17 | 中国农业大学 | 一种鱼刺残留检测方法及系统 |
CN112016605A (zh) * | 2020-08-19 | 2020-12-01 | 浙江大学 | 一种基于边界框角点对齐和边界匹配的目标检测方法 |
CN112184756A (zh) * | 2020-09-30 | 2021-01-05 | 北京理工大学 | 一种基于深度学习的单目标快速检测方法 |
CN112200189A (zh) * | 2020-10-19 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 基于SPP-YOLOv3的车型识别方法、装置及计算机可读存储介质 |
CN112308019A (zh) * | 2020-11-19 | 2021-02-02 | 中国人民解放军国防科技大学 | 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 |
CN112364974A (zh) * | 2020-08-28 | 2021-02-12 | 西安电子科技大学 | 一种基于激活函数改进的YOLOv3算法 |
CN112507896A (zh) * | 2020-12-14 | 2021-03-16 | 大连大学 | 一种采用改进的yolo-v4模型对樱桃果实进行检测的方法 |
CN112529836A (zh) * | 2020-10-30 | 2021-03-19 | 广州优飞信息科技有限公司 | 高压线路缺陷检测方法、装置、存储介质及电子设备 |
CN112529065A (zh) * | 2020-12-04 | 2021-03-19 | 浙江工业大学 | 一种基于特征对齐和关键点辅助激励的目标检测方法 |
CN112528934A (zh) * | 2020-12-22 | 2021-03-19 | 燕山大学 | 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法 |
CN112541532A (zh) * | 2020-12-07 | 2021-03-23 | 长沙理工大学 | 基于密集连接结构的目标检测方法 |
CN112560675A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 |
CN112581430A (zh) * | 2020-12-03 | 2021-03-30 | 厦门大学 | 一种基于深度学习的航空发动机无损检测方法、装置、设备及存储介质 |
CN112766188A (zh) * | 2021-01-25 | 2021-05-07 | 浙江科技学院 | 一种基于改进yolo算法的小目标行人检测方法 |
CN112801027A (zh) * | 2021-02-09 | 2021-05-14 | 北京工业大学 | 基于事件相机的车辆目标检测方法 |
CN112861871A (zh) * | 2021-02-07 | 2021-05-28 | 天津理工大学 | 一种基于目标边界定位的红外目标检测方法 |
CN112926681A (zh) * | 2021-03-29 | 2021-06-08 | 复旦大学 | 一种基于深度卷积神经网络的目标检测方法及装置 |
CN113033672A (zh) * | 2021-03-29 | 2021-06-25 | 西安电子科技大学 | 基于特征增强的多类别光学图像旋转目标自适应检测方法 |
CN113052834A (zh) * | 2021-04-20 | 2021-06-29 | 河南大学 | 一种基于卷积神经网络多尺度特征的管道缺陷检测方法 |
CN113076804A (zh) * | 2021-03-09 | 2021-07-06 | 武汉理工大学 | 基于YOLOv4改进算法的目标检测方法、装置及系统 |
CN113076788A (zh) * | 2020-01-06 | 2021-07-06 | 四川大学 | 一种基于改进的yolov3-tiny网络的交通标识检测方法 |
CN113177559A (zh) * | 2021-04-22 | 2021-07-27 | 重庆兆光科技股份有限公司 | 结合广度和密集卷积神经网络的图像识别方法、系统、设备及介质 |
CN113591992A (zh) * | 2021-08-02 | 2021-11-02 | 中国民用航空飞行学院 | 一种燃气涡轮发动机的孔探智能检测辅助系统及方法 |
CN113610118A (zh) * | 2021-07-19 | 2021-11-05 | 中南大学 | 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质 |
CN113657423A (zh) * | 2021-06-25 | 2021-11-16 | 上海师范大学 | 适用于小体积零件与堆叠零件的目标检测方法及其应用 |
CN113705583A (zh) * | 2021-08-16 | 2021-11-26 | 南京莱斯电子设备有限公司 | 一种基于卷积神经网络模型的目标检测识别方法 |
CN113850256A (zh) * | 2021-09-10 | 2021-12-28 | 北京理工大学 | 基于fsaf及快-慢速权重的目标检测与识别方法 |
CN113971755A (zh) * | 2020-07-22 | 2022-01-25 | 中国科学院沈阳自动化研究所 | 基于改进yolov3模型的全天候海面目标检测模型 |
CN114049616A (zh) * | 2021-12-01 | 2022-02-15 | 清华大学 | 一种基于模糊分类的立体空间目标检测方法及系统 |
CN114202733A (zh) * | 2022-02-18 | 2022-03-18 | 青岛海信网络科技股份有限公司 | 一种基于视频的交通故障检测方法及设备 |
CN114764906A (zh) * | 2021-01-13 | 2022-07-19 | 长沙中车智驭新能源科技有限公司 | 用于自动驾驶的多传感器后融合方法、电子设备及车辆 |
CN115526908A (zh) * | 2022-09-27 | 2022-12-27 | 电子科技大学 | 一种高速运动滤棒爆珠检测与定位方法 |
CN116052026A (zh) * | 2023-03-28 | 2023-05-02 | 石家庄铁道大学 | 一种无人机航拍图像目标检测方法、系统及存储介质 |
CN116503865A (zh) * | 2023-05-29 | 2023-07-28 | 北京石油化工学院 | 氢气道路运输风险识别方法、装置、电子设备及存储介质 |
CN118447422A (zh) * | 2024-07-08 | 2024-08-06 | 杭州长望智创科技有限公司 | 一种无人机视角的目标检测模型及检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316001A (zh) * | 2017-05-31 | 2017-11-03 | 天津大学 | 一种自动驾驶场景中小且密集的交通标志检测方法 |
CN109034210A (zh) * | 2018-07-04 | 2018-12-18 | 国家新闻出版广电总局广播科学研究院 | 基于超特征融合与多尺度金字塔网络的目标检测方法 |
-
2018
- 2018-12-29 CN CN201811633166.1A patent/CN109685152B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316001A (zh) * | 2017-05-31 | 2017-11-03 | 天津大学 | 一种自动驾驶场景中小且密集的交通标志检测方法 |
CN109034210A (zh) * | 2018-07-04 | 2018-12-18 | 国家新闻出版广电总局广播科学研究院 | 基于超特征融合与多尺度金字塔网络的目标检测方法 |
Non-Patent Citations (7)
Title |
---|
JOSEPH REDMON等: "YOLO9000:Better, Faster, Stronger", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
KAIMING HE等: "Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition", 《IEEE》 * |
KWANG-JU KIM等: "Performance Enhancement of YOLOv3 by Adding Prediction Layers with Spatial Pyramid Pooling for Vehicle Detection", 《IEEE》 * |
叶虎: "YOLO算法的原理与实现", 《练数成金HTTP://WWW.DATAGURU.CN/ARTICLE-12966-1.HTML》 * |
薛月菊等: "未成熟芒果的改进YOLOv2识别方法", 《农业工程学 报 》 * |
魏湧明等: "基于YOLOv2的无人机航拍图像定位研究", 《激光与光电子学进展》 * |
黄小杭等: "基于YOLOv2的莲蓬快速识别研究", 《现代农业科技》 * |
Cited By (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223224A (zh) * | 2019-04-29 | 2019-09-10 | 杰创智能科技股份有限公司 | 一种基于信息过滤网络的图像超分辨实现算法 |
CN110276247A (zh) * | 2019-05-09 | 2019-09-24 | 南京航空航天大学 | 一种基于YOLOv3-Tiny的行车检测方法 |
CN110147837A (zh) * | 2019-05-14 | 2019-08-20 | 中国电子科技集团公司第二十八研究所 | 基于特征聚焦的任意方向密集目标检测方法、系统及设备 |
CN110334594A (zh) * | 2019-05-28 | 2019-10-15 | 昆明理工大学 | 一种基于批再规范化处理的yolo算法的目标检测方法 |
CN110232370A (zh) * | 2019-06-21 | 2019-09-13 | 华北电力大学(保定) | 一种改进ssd模型的输电线路航拍图像金具检测方法 |
CN110232370B (zh) * | 2019-06-21 | 2022-04-26 | 华北电力大学(保定) | 一种改进ssd模型的输电线路航拍图像金具检测方法 |
CN110363104A (zh) * | 2019-06-24 | 2019-10-22 | 中国科学技术大学 | 一种柴油黑烟车的检测方法 |
CN110363104B (zh) * | 2019-06-24 | 2022-07-15 | 中国科学技术大学 | 一种柴油黑烟车的检测方法 |
CN110532894A (zh) * | 2019-08-05 | 2019-12-03 | 西安电子科技大学 | 基于边界约束CenterNet的遥感目标检测方法 |
CN110532894B (zh) * | 2019-08-05 | 2021-09-03 | 西安电子科技大学 | 基于边界约束CenterNet的遥感目标检测方法 |
CN110443208A (zh) * | 2019-08-08 | 2019-11-12 | 南京工业大学 | 一种基于YOLOv2的车辆目标检测方法、系统及设备 |
CN110472572A (zh) * | 2019-08-14 | 2019-11-19 | 西北工业大学 | 一种复杂环境下海上目标的快速识别和分类方法 |
CN110472640B (zh) * | 2019-08-15 | 2022-03-15 | 山东浪潮科学研究院有限公司 | 一种目标检测模型预测框处理方法及装置 |
CN110472640A (zh) * | 2019-08-15 | 2019-11-19 | 山东浪潮人工智能研究院有限公司 | 一种目标检测模型预测框处理方法及装置 |
CN110533088A (zh) * | 2019-08-16 | 2019-12-03 | 湖北工业大学 | 一种基于区分式卷积神经网络的场景文字语种识别方法 |
CN110472641A (zh) * | 2019-08-16 | 2019-11-19 | 河海大学常州校区 | 一种空化泡近壁溃灭图像特征数据提取方法 |
CN110648331A (zh) * | 2019-09-02 | 2020-01-03 | 众安信息技术服务有限公司 | 用于医学图像分割的检测方法、医学图像分割方法及装置 |
CN110648331B (zh) * | 2019-09-02 | 2023-01-17 | 众安信息技术服务有限公司 | 用于医学图像分割的检测方法、医学图像分割方法及装置 |
CN110827259A (zh) * | 2019-11-04 | 2020-02-21 | 上海芯翌智能科技有限公司 | 一种用于目标关键点检测的样本增广的方法与设备 |
CN111079540A (zh) * | 2019-11-19 | 2020-04-28 | 北航航空航天产业研究院丹阳有限公司 | 一种基于目标特性的分层可重构车载视频目标检测方法 |
CN111046923B (zh) * | 2019-11-26 | 2023-02-28 | 佛山科学技术学院 | 一种基于边界框的图像目标检测方法、装置及存储介质 |
CN111046923A (zh) * | 2019-11-26 | 2020-04-21 | 佛山科学技术学院 | 一种基于边界框的图像目标检测方法、装置及存储介质 |
CN110991311A (zh) * | 2019-11-28 | 2020-04-10 | 江南大学 | 一种基于密集连接深度网络的目标检测方法 |
CN110991311B (zh) * | 2019-11-28 | 2021-09-24 | 江南大学 | 一种基于密集连接深度网络的目标检测方法 |
CN111062282A (zh) * | 2019-12-05 | 2020-04-24 | 武汉科技大学 | 基于改进yolov3模型的变电站指针式仪表识别方法 |
CN111062282B (zh) * | 2019-12-05 | 2023-09-29 | 武汉科技大学 | 基于改进yolov3模型的变电站指针式仪表识别方法 |
CN111178158A (zh) * | 2019-12-10 | 2020-05-19 | 山东大学 | 一种骑车人检测方法及系统 |
CN111178158B (zh) * | 2019-12-10 | 2024-02-23 | 山东大学 | 一种骑车人检测方法及系统 |
CN111079638A (zh) * | 2019-12-13 | 2020-04-28 | 河北爱尔工业互联网科技有限公司 | 基于卷积神经网络的目标检测模型训练方法、设备和介质 |
CN111127457A (zh) * | 2019-12-25 | 2020-05-08 | 上海找钢网信息科技股份有限公司 | 钢筋数目统计模型训练方法、统计方法、装置及设备 |
CN111127438A (zh) * | 2019-12-25 | 2020-05-08 | 昆明理工大学 | 基于改进yolo算法的肺部ct图像中结节检测方法 |
CN111179247A (zh) * | 2019-12-27 | 2020-05-19 | 上海商汤智能科技有限公司 | 三维目标检测方法及其模型的训练方法及相关装置、设备 |
CN113076788A (zh) * | 2020-01-06 | 2021-07-06 | 四川大学 | 一种基于改进的yolov3-tiny网络的交通标识检测方法 |
CN111259736A (zh) * | 2020-01-08 | 2020-06-09 | 上海海事大学 | 一种基于深度学习的复杂环境下行人实时检测方法 |
CN111259736B (zh) * | 2020-01-08 | 2023-04-07 | 上海海事大学 | 一种基于深度学习的复杂环境下行人实时检测方法 |
CN111275191B (zh) * | 2020-02-26 | 2023-11-28 | 上海商汤智能科技有限公司 | 检测细胞的方法及装置、电子设备和存储介质 |
CN111275191A (zh) * | 2020-02-26 | 2020-06-12 | 上海商汤智能科技有限公司 | 检测细胞的方法及装置、电子设备和存储介质 |
CN111402211A (zh) * | 2020-03-04 | 2020-07-10 | 广西大学 | 一种基于深度学习的高速列车车底异物识别方法 |
CN111402211B (zh) * | 2020-03-04 | 2022-11-11 | 广西大学 | 一种基于深度学习的高速列车车底异物识别方法 |
CN111353544A (zh) * | 2020-03-05 | 2020-06-30 | 天津城建大学 | 一种基于改进的Mixed Pooling-YOLOV3目标检测方法 |
CN111353544B (zh) * | 2020-03-05 | 2023-07-25 | 天津城建大学 | 一种基于改进的Mixed Pooling-YOLOV3目标检测方法 |
CN111460919B (zh) * | 2020-03-13 | 2023-05-26 | 华南理工大学 | 一种基于改进YOLOv3的单目视觉道路目标检测及距离估计方法 |
CN111460919A (zh) * | 2020-03-13 | 2020-07-28 | 华南理工大学 | 一种基于改进YOLOv3的单目视觉道路目标检测及距离估计方法 |
CN111462051A (zh) * | 2020-03-14 | 2020-07-28 | 华中科技大学 | 一种基于深度神经网络的布匹疵点检测方法和系统 |
CN111462051B (zh) * | 2020-03-14 | 2022-09-27 | 华中科技大学 | 一种基于深度神经网络的布匹疵点检测方法和系统 |
CN111429418A (zh) * | 2020-03-19 | 2020-07-17 | 天津理工大学 | 一种基于YOLO v3神经网络的工业零件检测方法 |
CN111597900A (zh) * | 2020-04-16 | 2020-08-28 | 浙江工业大学 | 非法遛狗识别方法 |
CN111597900B (zh) * | 2020-04-16 | 2023-10-24 | 浙江工业大学 | 非法遛狗识别方法 |
CN111553406B (zh) * | 2020-04-24 | 2023-04-28 | 上海锘科智能科技有限公司 | 基于改进yolo-v3的目标检测系统、方法及终端 |
CN111553406A (zh) * | 2020-04-24 | 2020-08-18 | 上海锘科智能科技有限公司 | 基于改进yolo-v3的目标检测系统、方法及终端 |
CN111553348A (zh) * | 2020-04-26 | 2020-08-18 | 中南大学 | 一种基于centernet的anchor-based目标检测方法 |
CN111508093A (zh) * | 2020-04-26 | 2020-08-07 | 王素云 | 一种用于高速公路的过路费预算系统 |
CN111832608B (zh) * | 2020-05-29 | 2023-09-12 | 上海海事大学 | 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法 |
CN111832608A (zh) * | 2020-05-29 | 2020-10-27 | 上海海事大学 | 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法 |
CN111476219B (zh) * | 2020-06-02 | 2024-09-17 | 苏州科技大学 | 智能家居环境中图像目标检测方法 |
CN111476219A (zh) * | 2020-06-02 | 2020-07-31 | 苏州科技大学 | 智能家居环境中图像目标检测方法 |
CN111709336A (zh) * | 2020-06-08 | 2020-09-25 | 杭州像素元科技有限公司 | 一种高速公路行人检测方法、设备及可读存储介质 |
CN111709336B (zh) * | 2020-06-08 | 2024-04-26 | 杭州像素元科技有限公司 | 一种高速公路行人检测方法、设备及可读存储介质 |
CN111753956B (zh) * | 2020-06-18 | 2022-08-12 | 南京邮电大学 | 一种基于卷积神经网络的目标边界实时检测方法 |
CN111753956A (zh) * | 2020-06-18 | 2020-10-09 | 南京邮电大学 | 一种基于卷积神经网络的目标边界实时检测方法 |
CN111709381A (zh) * | 2020-06-19 | 2020-09-25 | 桂林电子科技大学 | 基于YOLOv3-SPP的道路环境目标检测方法 |
CN111723737B (zh) * | 2020-06-19 | 2023-11-17 | 河南科技大学 | 一种基于多尺度匹配策略深度特征学习的目标检测方法 |
CN111723737A (zh) * | 2020-06-19 | 2020-09-29 | 河南科技大学 | 一种基于多尺度匹配策略深度特征学习的目标检测方法 |
CN111797940A (zh) * | 2020-07-20 | 2020-10-20 | 中国科学院长春光学精密机械与物理研究所 | 一种基于海洋搜救的图像识别方法及相关装置 |
CN111881803A (zh) * | 2020-07-22 | 2020-11-03 | 安徽农业大学 | 一种基于改进YOLOv3的畜脸识别方法 |
CN111881803B (zh) * | 2020-07-22 | 2023-10-31 | 安徽农业大学 | 一种基于改进YOLOv3的畜脸识别方法 |
CN113971755A (zh) * | 2020-07-22 | 2022-01-25 | 中国科学院沈阳自动化研究所 | 基于改进yolov3模型的全天候海面目标检测模型 |
CN113971755B (zh) * | 2020-07-22 | 2024-05-03 | 中国科学院沈阳自动化研究所 | 基于改进yolov3模型的全天候海面目标检测方法 |
CN111951233A (zh) * | 2020-07-24 | 2020-11-17 | 中国农业大学 | 一种鱼刺残留检测方法及系统 |
CN111951233B (zh) * | 2020-07-24 | 2024-05-14 | 中国农业大学 | 一种鱼刺残留检测方法及系统 |
CN112016605A (zh) * | 2020-08-19 | 2020-12-01 | 浙江大学 | 一种基于边界框角点对齐和边界匹配的目标检测方法 |
CN112016605B (zh) * | 2020-08-19 | 2022-05-27 | 浙江大学 | 一种基于边界框角点对齐和边界匹配的目标检测方法 |
CN112364974B (zh) * | 2020-08-28 | 2024-02-09 | 西安电子科技大学 | 一种基于激活函数改进的YOLOv3算法 |
CN112364974A (zh) * | 2020-08-28 | 2021-02-12 | 西安电子科技大学 | 一种基于激活函数改进的YOLOv3算法 |
CN112184756A (zh) * | 2020-09-30 | 2021-01-05 | 北京理工大学 | 一种基于深度学习的单目标快速检测方法 |
CN112200189A (zh) * | 2020-10-19 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 基于SPP-YOLOv3的车型识别方法、装置及计算机可读存储介质 |
CN112200189B (zh) * | 2020-10-19 | 2024-04-19 | 平安国际智慧城市科技股份有限公司 | 基于SPP-YOLOv3的车型识别方法、装置及计算机可读存储介质 |
CN112529836A (zh) * | 2020-10-30 | 2021-03-19 | 广州优飞信息科技有限公司 | 高压线路缺陷检测方法、装置、存储介质及电子设备 |
CN112308019A (zh) * | 2020-11-19 | 2021-02-02 | 中国人民解放军国防科技大学 | 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 |
CN112581430A (zh) * | 2020-12-03 | 2021-03-30 | 厦门大学 | 一种基于深度学习的航空发动机无损检测方法、装置、设备及存储介质 |
CN112529065B (zh) * | 2020-12-04 | 2024-02-13 | 浙江工业大学 | 一种基于特征对齐和关键点辅助激励的目标检测方法 |
CN112529065A (zh) * | 2020-12-04 | 2021-03-19 | 浙江工业大学 | 一种基于特征对齐和关键点辅助激励的目标检测方法 |
CN112541532A (zh) * | 2020-12-07 | 2021-03-23 | 长沙理工大学 | 基于密集连接结构的目标检测方法 |
CN112541532B (zh) * | 2020-12-07 | 2024-03-01 | 长沙理工大学 | 基于密集连接结构的目标检测方法 |
CN112507896A (zh) * | 2020-12-14 | 2021-03-16 | 大连大学 | 一种采用改进的yolo-v4模型对樱桃果实进行检测的方法 |
CN112507896B (zh) * | 2020-12-14 | 2023-11-07 | 大连大学 | 一种采用改进的yolo-v4模型对樱桃果实进行检测的方法 |
CN112560675B (zh) * | 2020-12-15 | 2022-06-21 | 三峡大学 | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 |
CN112560675A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 |
CN112528934A (zh) * | 2020-12-22 | 2021-03-19 | 燕山大学 | 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法 |
CN114764906A (zh) * | 2021-01-13 | 2022-07-19 | 长沙中车智驭新能源科技有限公司 | 用于自动驾驶的多传感器后融合方法、电子设备及车辆 |
CN112766188A (zh) * | 2021-01-25 | 2021-05-07 | 浙江科技学院 | 一种基于改进yolo算法的小目标行人检测方法 |
CN112766188B (zh) * | 2021-01-25 | 2024-05-10 | 浙江科技学院 | 一种基于改进yolo算法的小目标行人检测方法 |
CN112861871A (zh) * | 2021-02-07 | 2021-05-28 | 天津理工大学 | 一种基于目标边界定位的红外目标检测方法 |
CN112801027A (zh) * | 2021-02-09 | 2021-05-14 | 北京工业大学 | 基于事件相机的车辆目标检测方法 |
CN113076804B (zh) * | 2021-03-09 | 2022-06-17 | 武汉理工大学 | 基于YOLOv4改进算法的目标检测方法、装置及系统 |
CN113076804A (zh) * | 2021-03-09 | 2021-07-06 | 武汉理工大学 | 基于YOLOv4改进算法的目标检测方法、装置及系统 |
CN112926681A (zh) * | 2021-03-29 | 2021-06-08 | 复旦大学 | 一种基于深度卷积神经网络的目标检测方法及装置 |
CN112926681B (zh) * | 2021-03-29 | 2022-11-29 | 复旦大学 | 一种基于深度卷积神经网络的目标检测方法及装置 |
CN113033672B (zh) * | 2021-03-29 | 2023-07-28 | 西安电子科技大学 | 基于特征增强的多类别光学图像旋转目标自适应检测方法 |
CN113033672A (zh) * | 2021-03-29 | 2021-06-25 | 西安电子科技大学 | 基于特征增强的多类别光学图像旋转目标自适应检测方法 |
CN113052834B (zh) * | 2021-04-20 | 2023-04-18 | 河南大学 | 一种基于卷积神经网络多尺度特征的管道缺陷检测方法 |
CN113052834A (zh) * | 2021-04-20 | 2021-06-29 | 河南大学 | 一种基于卷积神经网络多尺度特征的管道缺陷检测方法 |
CN113177559A (zh) * | 2021-04-22 | 2021-07-27 | 重庆兆光科技股份有限公司 | 结合广度和密集卷积神经网络的图像识别方法、系统、设备及介质 |
CN113657423A (zh) * | 2021-06-25 | 2021-11-16 | 上海师范大学 | 适用于小体积零件与堆叠零件的目标检测方法及其应用 |
CN113610118A (zh) * | 2021-07-19 | 2021-11-05 | 中南大学 | 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质 |
CN113610118B (zh) * | 2021-07-19 | 2023-12-12 | 中南大学 | 一种基于多任务课程式学习的青光眼诊断方法、装置、设备及方法 |
CN113591992B (zh) * | 2021-08-02 | 2022-07-01 | 中国民用航空飞行学院 | 一种燃气涡轮发动机的孔探智能检测辅助系统及方法 |
CN113591992A (zh) * | 2021-08-02 | 2021-11-02 | 中国民用航空飞行学院 | 一种燃气涡轮发动机的孔探智能检测辅助系统及方法 |
CN113705583B (zh) * | 2021-08-16 | 2024-03-22 | 南京莱斯电子设备有限公司 | 一种基于卷积神经网络模型的目标检测识别方法 |
CN113705583A (zh) * | 2021-08-16 | 2021-11-26 | 南京莱斯电子设备有限公司 | 一种基于卷积神经网络模型的目标检测识别方法 |
CN113850256A (zh) * | 2021-09-10 | 2021-12-28 | 北京理工大学 | 基于fsaf及快-慢速权重的目标检测与识别方法 |
CN113850256B (zh) * | 2021-09-10 | 2024-08-13 | 北京理工大学 | 基于fsaf及快-慢速权重的目标检测与识别方法 |
CN114049616A (zh) * | 2021-12-01 | 2022-02-15 | 清华大学 | 一种基于模糊分类的立体空间目标检测方法及系统 |
CN114202733A (zh) * | 2022-02-18 | 2022-03-18 | 青岛海信网络科技股份有限公司 | 一种基于视频的交通故障检测方法及设备 |
CN115526908A (zh) * | 2022-09-27 | 2022-12-27 | 电子科技大学 | 一种高速运动滤棒爆珠检测与定位方法 |
CN116052026A (zh) * | 2023-03-28 | 2023-05-02 | 石家庄铁道大学 | 一种无人机航拍图像目标检测方法、系统及存储介质 |
CN116503865A (zh) * | 2023-05-29 | 2023-07-28 | 北京石油化工学院 | 氢气道路运输风险识别方法、装置、电子设备及存储介质 |
CN118447422A (zh) * | 2024-07-08 | 2024-08-06 | 杭州长望智创科技有限公司 | 一种无人机视角的目标检测模型及检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109685152B (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685152A (zh) | 一种基于dc-spp-yolo的图像目标检测方法 | |
CN110276269B (zh) | 一种基于注意力机制的遥感图像目标检测方法 | |
CN110136154B (zh) | 基于全卷积网络与形态学处理的遥感图像语义分割方法 | |
WO2021139069A1 (zh) | 自适应注意力指导机制的一般性目标检测方法 | |
CN106228125B (zh) | 基于集成学习级联分类器的车道线检测方法 | |
CN108229381A (zh) | 人脸图像生成方法、装置、存储介质和计算机设备 | |
CN111368769B (zh) | 基于改进锚点框生成模型的船舶多目标检测方法 | |
CN110287960A (zh) | 自然场景图像中曲线文字的检测识别方法 | |
CN111091105A (zh) | 基于新的边框回归损失函数的遥感图像目标检测方法 | |
CN108052881A (zh) | 一种实时检测施工现场图像中多类实体对象的方法及设备 | |
CN112418212B (zh) | 一种基于EIoU改进的YOLOv3算法 | |
CN111753828A (zh) | 一种基于深度卷积神经网络的自然场景水平文字检测方法 | |
CN113920107A (zh) | 一种基于改进yolov5算法的绝缘子破损检测方法 | |
CN113177456B (zh) | 基于单阶段全卷积网络和多特征融合的遥感目标检测方法 | |
CN113435282B (zh) | 基于深度学习的无人机影像麦穗识别方法 | |
CN106780546B (zh) | 基于卷积神经网络的运动模糊编码点的身份识别方法 | |
CN113449784B (zh) | 基于先验属性图谱的图像多分类方法、装置、设备及介质 | |
CN109711401A (zh) | 一种基于Faster Rcnn的自然场景图像中的文本检测方法 | |
CN111950488A (zh) | 一种改进的Faster-RCNN遥感图像目标检测方法 | |
CN107341440A (zh) | 基于多任务度量多核学习的室内rgb‑d场景图像识别方法 | |
CN117079132A (zh) | 基于高斯距离损失的遥感图像目标检测方法 | |
CN108230313A (zh) | 基于部件自适应选择与判别模型的sar图像目标检测方法 | |
CN116824335A (zh) | 一种基于YOLOv5改进算法的火灾预警方法及系统 | |
CN111611925A (zh) | 一种建筑物检测与识别方法及装置 | |
CN110298402A (zh) | 一种小目标检测性能优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |