CN105956632A - 一种检测目标的方法和装置 - Google Patents
一种检测目标的方法和装置 Download PDFInfo
- Publication number
- CN105956632A CN105956632A CN201610341049.2A CN201610341049A CN105956632A CN 105956632 A CN105956632 A CN 105956632A CN 201610341049 A CN201610341049 A CN 201610341049A CN 105956632 A CN105956632 A CN 105956632A
- Authority
- CN
- China
- Prior art keywords
- detected
- target
- region
- image
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 134
- 238000000034 method Methods 0.000 claims abstract description 65
- 239000013598 vector Substances 0.000 claims description 100
- 238000013507 mapping Methods 0.000 claims description 75
- 238000002372 labelling Methods 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 24
- 230000008859 change Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种检测目标的方法和装置,其中,所述方法包括:预测原始待检测图像中每一行对应的目标宽度范围;根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。采用本发明提供的检测目标的方法可以有效提高DPM目标检测效率。
Description
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种检测目标的方法和装置。
背景技术
目标检测作为进一步进行图像分析与理解的基础,具有重要的研究意义,人们对其投入了大量精力进行研究,现今已有许多目标检测算法被提出。其中,Pedro Felzenszwalb等人提出的可变形部件模型(Deformable Parts Model,DPM),由于具有较好的检测效果,现已在多个领域中使用。
采用DPM算法进行目标检测虽具有较高的检测精度,但同时也伴随着巨大的计算量,致使其性能较费。尤其是运行在计算性能有限的前端设备(例如相机)上时,该算法的实时性更加难以满足,在很大程度上限制了DPM算法的使用。
发明内容
有鉴于此,本发明提供一种检测目标的方法及装置,提高DPM检测目标的效率。
本发明提供了一种检测目标的方法,所述方法包括:预测原始待检测图像中每一行对应的目标宽度范围;
根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;
根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。
可选地,所述预测原始待检测图像中每一行对应的目标宽度范围,包括:
利用公式:ObjWid(h)min=Φ(h)-3σ(h),计算最小目标宽度;
利用公式:ObjWid(h)max=Φ(h)+3σ(h),计算最大目标宽度;
其中,ObjWid(h)min为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最小宽度,即最小目标宽度;ObjWid(h)max为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最大宽度,即最大目标宽度;σ(h)为待检测图像中目标宽度方差,Φ(h)为待检测图像中目标的平均宽度。
可选地,所述根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围,包括:
利用公式:计算每一行对应的特征金字塔的起始缩放层;
利用公式:计算每一行对应的特征金字塔的结束缩放层;
其中,表示预测第L行对应的起始缩放层;表示预测第L行对应的结束缩放层;
表示预测第L行对应的最小目标宽度;表示预测第L行对应的最大目标宽度;
Sbin*ModelWid表示目标DPM检测器的模板宽度的像素值,其中,ModelWid表示目标DPM检测器的模板宽度,该宽度是以Sbin为度量单位;
21/Interval表示相邻两个缩放层之间的缩放倍数,其中,Interval表示图像尺寸缩小到原始图像一半时经过的缩放层数。
可选地,所述根据所述每一行对应的缩放层范围和已训练的目标DPM检测器,确定每一行对应的待检测区域的HOG特征数据,包括:
根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息;
根据每一个所述映射区域的位置信息和所述原始待检测图像的图像数据,确定每一个所述映射区域的图像数据;
依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
可选地,所述根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息,包括:
根据公式:DetHgt=ModelHgt*Sbin*Scale,计算一个映射区域的高度;
其中,DetHgt表示一个映射区域的高度;ModelHgt表示DPM检测器的模板高度;Sbin是DPM检测器的模板高度的度量单位;
Scale为缩放层对应的缩放系数,采用以下公式表示:其中,表示第L行对应的一个缩放层, 表示所述映射区域相对层的待检测区域的缩放倍数;
根据所述映射区域的高度和所述原始待检测图像的宽度,确定一个映射区域的位置信息。
可选地,所述根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图,包括:
在每一待检测区域的HOG特征图像中,根据所述DPM检测器的滤波器模板确定待检测子窗口的特征向量;
从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置检测得分表包括:特征向量类别与检测得分的对应关系。
可选地,所述根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图,还包括:
根据预设数量的场景图像,建立检测得分表;具体包括:
获取预设数量的场景图像的全部HOG特征向量;
采用预设聚类算法对所述全部HOG特征向量进行聚类训练,获得预设类别的HOG特征向量;
将每一类HOG特征向量与所述DPM检测器进行卷积运算,获得对应的检测得分,建立所述检测得分表。
相应的,提供了一种检测目标的装置,所述装置包括:
目标宽度预测模块,用于预测原始待检测图像中每一行对应的目标宽度范围;
缩放层计算模块,用于根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
特征确定模块,用于根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;
检测模块,用于根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
目标确定模块,用于根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。
可选的,所述特征确定模块包括:
位置确定子模块,用于根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息;
映射区域确定子模块,用于根据每一个所述映射区域的位置信息和所述原始待检测图像的图像数据,确定每一个所述映射区域的图像数据;
检测区域确定子模块,用于依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
特征提取子模块,用于提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
可选的,所述检测模块包括:
特征向量确定子模块,用于在每一待检测区域的HOG特征图像中,根据所述DPM检测器的滤波器模板确定待检测子窗口的特征向量;
比较子模块,用于从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
查询子模块,用于根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置检测得分表包括:特征向量类别与检测得分的对应关系。
本发明实施例提供的检测目标的方法,与现有技术相比,通过预测每一行对应的目标宽度范围,增加了对监控场景中目标尺度的自适应学习,并可利用该自学习的预测结果,在纵向上减少了需要求取HOG特征金字塔的缩放层数;在横向上通过利用模板尺寸大小来确定需要缩放、计算HOG特征的待检区域,并通过对图像缩放数据及HOG特征数据的复用,极大减小了图像上需要缩放、求特征的区域大小及计算量;同时,利用HOG特征矢量量化并建立检测得分表,后续通过查表法替换了原有DPM算法的大量卷积运算,减少了目标检测过程中的运算量,有效提升了目标检测速度。
附图说明
图1是本发明提供的一种检测目标的方法流程图;
图2-A是本发明提供的一种检测目标的场景示意图;
图2-B是本发明提供的另一种检测目标的场景示意图;
图2-C是本发明提供的另一种检测目标的场景示意图;
图3是本发明提供的另一种检测目标的场景示意图;
图4是本发明实施例示出的第L行对应的HOG特征金字塔的示意图;
图5是本发明提供的另一种检测目标的方法流程图;
图6是本发明提供的检测目标的示意图;
图7本发明实施例示出的检测重合区域的场景示意图;
图8是本发明提供的另一种检测目标的方法流程图;
图9是本发明提供的另一种检测目标的方法流程图;
图10是本发明提供的另一种检测目标的方法流程图;
图11是本发明提供的一种检测目标的装置框图;
图12是本发明提供的另一种检测目标的装置框图;
图13是本发明提供的另一种检测目标的装置框图;
图14是本发明提供的另一种检测目标的装置框图;
图15是本发明提供的另一种检测目标的装置框图;
图16是本发明提供的另一种检测目标的装置框图;
图17是本发明提供的另一种检测目标的装置框图;
图18是本发明提供的另一种检测目标的装置框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请中可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在目标检测的相关技术中,采用DPM检测器对待检测图像进行目标检测主要包括:样本训练、目标检测两部分。其中,样本训练的目的是为了得到目标检测阶段需要的DPM检测器。
在样本训练阶段,假设需要检测的目标为车辆,根据相关技术,用于车辆检测的DPM检测器(简称为:车辆DPM检测器)的训练过程为:分别在车辆的正负样本中提取车辆在DPM模型下的特征向量,然后将上述特征向量输入预设机器学习模型中,比如SVM(Support Vector Machine,支持向量机)分类器中,训练得到车辆DPM检测器。
在目标检测阶段,采用训练好的车辆DPM检测器进行车辆检测过程可以包括:
步骤A、计算待检测图像的HOG(Histogram of Oriented Gradient,方向梯度直方图)特征金字塔;
步骤B、使用车辆DPM检测器(车辆特征向量滤波器)对所述HOG特征金字塔中每一缩放层的HOG特征图进行卷积运算,获得每一缩放层对应的检测得分图;
步骤C、将所述检测分数图中的分数与预设阈值比较,将分数图中大于所述阈值的点组成的区域确定为可能存在车辆的区域即车辆区域;
步骤D、利用相关技术中的非极大值抑制算法过滤重合的车辆区域,确定最终的车辆检测框。
现有技术中,在计算HOG特征金字塔时,是对整幅待检测图像进行缩放,然后利用DPM检测器对每一个缩放层进行卷积运算。由于在确定图像金字塔的缩放层数量的过程中,需要考虑目标在场景中任意位置的可能尺寸,导致计算量巨大,影响目标检测效率。
鉴于此,本发明提供了一种基于行检测的目标检测方法,参见图1所示的一种检测目标的方法流程图,包括:
步骤11、预测原始待检测图像中每一行对应的目标宽度范围;
对于位置固定的图像采集装置,拍摄图像的场景一般是固定的。预检测目标,比如人、车辆等,在图像中的尺寸可以根据经验预测一个尺寸范围。本发明实施例根据先验信息进一步预测了目标在每一行的尺寸范围,对现有技术预测的目标尺寸范围进行了细化,具体过程如下:
以视频监控设备为例,在纵向维度上,采集的监控图像中目标图像尺寸会随着目标距离图像采集装置的距离呈规律性变化。
仍以待检测目标是车辆为例,参照图2-A至图2-C所示的场景示意图,三幅图像是固定在某一位置的相机、对一台车辆在不同时刻采集的图像。从车辆在图像中位置和尺寸变化可知,在车辆从进入相机的视野范围到离开的过程中,即车辆距离相机的位置由远及近的过程中,车辆的标注矩形框的宽度在场景图片中的变化规律为:从小变大。在图2-A至图2-C中,根据图像采集原理可知,车辆的运动方向是在相机视野中从远处驶向相机。从三幅图像的尺寸变化可知,车辆距离相机越近,即目标标注框顶端的Y坐标越大,目标标注框顶端的宽度W也越大;图2-C中,车辆距离相机最近,即Y3值最大,相应的,车辆的标注矩形框的顶部宽度W3的值也最大。
假设以图像的左上角顶点为坐标原点(0,0),水平向右方向为X+方向;垂直向下方向为Y+方向建立坐标系。则,车辆的标注矩形框的顶端在整个场景图片中的纵坐标Y,随着车辆与相机之间距离的变小而逐渐变大。
也就是说目标标注矩形框的尺寸,随着标注矩形框的顶端的纵坐标的增加而变大。即车辆的标注矩形框的顶端宽度W在纵向维度即Y方向有特定的变化规律,本发明中称之为第一先验信息。
根据上述第一先验信息,本发明实施例中,可以采用以下公式(1)表示目标的标注矩形框的宽度与目标标注框的顶端的纵坐标之间的关系:
ObjWid=f(h),0<h<OriHgt......公式(1)
其中,h表示车辆标注矩形框的顶端在原始待检测图像中的纵坐标,OriHgt为原始待检测图像的高度,ObjWid表示在图像高度h处所对应的目标标注矩形框的宽度。
此处需要说明的是,本发明中涉及的目标标注矩形框是指在图像中可以最小完全覆盖目标的矩形区域。
在横向维度上,顶端处于同一行上的不同目标的标注矩形框,由于目标的型号不同,仍以目标是车辆为例,比如可以是面包车、卡车、小汽车、公交车等,对应的标注矩形框的宽度也不相同。
参见图3示出的另一场景示意图,顶端处于同一行上的三台车辆的标注矩形框,由于车辆的型号不同,对应的标注矩形框的宽度也不相同,即对于同一类别的目标,在相同位置,目标标注矩形框的宽度依据型号不同存在一定的分布规律,本发明称之为第二先验信息。
根据上述第二先验信息,经过一段时间对不同型号车辆的统计得知,目标的标注矩形框的宽度随目标型号的变化关系符合正态分布,可以采用以下公式(2)表示:
综合上述两个先验信息,得到如下公式:
其中,ObjWid(h)为待检测图像中,目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的宽度;σ(h)为待检测图像中目标宽度方差,Φ(h)为待检测图像中目标的平均宽度。其中,σ(h)与Φ(h)为关于参数h的表达式,可以根据训练图像集中的目标标定信息统计学习拟合得到。
根据正态分布函数的3σ原则,可知:在待检测图像中,当目标的标注矩形框的顶端处于整幅图像的h行时,目标标注矩形框的宽度范围(本发明简称:目标宽度范围),可以表示为:ObjWid(h)∈(Φ(h)-3σ(h),Φ(h)+3σ(h))。
也就是说:在待检图像中,当目标的标注矩形框的顶端在图像中的纵坐标为h时,上述标注矩形框的最小宽度可以采用公式(4)表示:
ObjWid(h)min=Φ(h)-3σ(h)……公式(4)
当目标的标注矩形框的顶端在图像中的纵坐标为h时,标注矩形框的最大宽度可以采用公式(5)表示:
ObjWid(h)max=Φ(h)+3σ(h)……公式(5)
上述步骤11是在目标检测之前,首先根据待检测目标在场景中的先验信息计算场景的先验标定信息的过程。本发明根据上述先验信息预测待检测图像中待检测目标的可能宽度范围,以便后续可以根据待检目标的宽度范围计算特征图像金字塔的层数,避免DPM检测器对图像金字塔的所有层进行检测,可以有效减小目标检测过程中的计算量,提高目标检测效率。
步骤12、根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
由于已训练好的车辆DPM检测器的模板尺寸是固定的,在DPM算法中,为了准确检测不同尺寸的车辆,需要对原始待检测图像中的待检测区域进行缩放,以使缩放后的待检测区域中的待检测车辆的标注矩形框的尺寸可以匹配DPM检测器的模板尺寸。
本发明实施例可以根据预测的每一行的目标宽度范围,预测以该行为顶端的待检测区域(需要卷积的图像区域)对应的HOG特征金字塔的缩放层范围,具体计算过程如下:
对于原始待检测图像的第L行,根据上述公式(4)和公式(5)可以预测车辆标注矩形框的最小宽度和最大宽度相应的,本发明实施例可以采用以下公式(6)计算所述当前行L对应的起始缩放层
可以采用以下公式(7)计算所述当前行L对应的结束缩放层
其中,表示预测当前行对应的最小目标宽度,即,当待检测目标的标注矩形框的顶端在第L行时,预测的标注矩形框的最小宽度;
表示预测当前行对应的最大目标宽度,即,当待检测目标的标注矩形框的顶端在第L行时,预测的标注矩形框的最大宽度;
Sbin*ModelWid表示车辆DPM检测器的模板宽度的像素值,其中,ModelWid表示车辆DPM检测器的模板宽度,该宽度是以Sbin为度量单位;
21/Interval表示相邻两个缩放层之间的缩放倍数,其中,Interval表示图像尺寸缩小到原始图像一半大小时经过的缩放层数。Interval是在目标检测前,根据图像场景的复杂程度,依据人为经验设定的一个数值,场景越复杂,Interval设定值越大。
根据上述公式(6)、(7)可知,原始待检图像的每一行都有对应的缩放层范围。
下面结合图3和图4说明当前行L对应的HOG特征金字塔的缩放层。示例性地,参照图3,假设步骤11预测第L行的目标宽度范围根据设定的Interval进行数值离散化后,包括3个宽度值,分别为:分别表示第L行上三种类型车辆所在的标注矩形框的顶端宽度。在目标检测过程中,要想利用固定模板尺寸的DPM检测器实现对上述三个目标的准确检测,需要对每个目标标注矩形框所在的待检测区域(该区域的高度利用后续步骤131确定)进行缩放,获得对应的待检测区域,以适应车辆DPM检测器的模板尺寸。
每一次缩放对应图像金字塔中的一个缩放层,也就是说第L行对应三个缩放层。图4示出了第L行对应的HOG特征金字塔的示意图,假设三个目标宽度对应的三个缩放层表示为:
假设,原始待检测图像位于图像金字塔的底层,层数等于1,则图4中该层对应的三角形底边宽度代表原始待检测图像的宽度;相应的,图4中层对应的三角形底边宽度表示第一待检测区域的宽度。所述第一待检测区域表示对图3中的第一标注矩形框在原始待检测图像中所在区域(该区域的高度等于第一标注矩形框的高度,宽度为原始待检测图像的宽度)进行缩放后,获得的待检测区域。
类似的,层对应的三角形底边宽度表示第二待检测区域的宽度。所述第二待检测区域表示对第二标注矩形框在原始图像中所在区域(该区域的高度等于第二标注矩形框的高度,宽度为原始待检测图像的宽度)进行缩放后,获得的区域。
层对应的三角形底边的宽度表示第三待检测区域的宽度。该第三待检测区域为对第三标注矩形框在原始图像中所在区域进行缩放后,获得的待检测区域。
上述第一、第二、第三待检测区域的高度匹配车辆DPM检测器的模板高度。
现有技术提供的经典DPM算法中,为了能够检测场景中不同尺寸的目标,需要对待检测图像进行全部尺度的缩放,才能将各目标均缩放到分类器模板的尺寸。但这样带来的问题是针对某个尺寸的目标,绝大部分的缩放层是没有价值的,只会增加计算量。本发明实施例中,由预测的目标宽度范围可计算需要缩放的层数范围,无需再对其他层对应的图像区域进行缩放,减少了图像缩放的计算量,同时也减少了后续卷积过程的计算量,减小了设备的计算量,进而可以缩短目标检测时间,提升目标检测效率。
步骤13、根据所述每一行对应的缩放层范围和已训练的目标DPM检测器,确定每一行对应的待检测区域的HOG特征数据;
参见图5所示的另一种检测目标的方法流程图,步骤13可以包括:
步骤131、根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在原始待检测图像中的映射区域的位置信息;
根据步骤12可以确定原始图像中的每一行对应的缩放层范围,比如,第L行对应的缩放层数为:3、4、5。根据DPM算法的检测原理,可以预测第L行存在三个标注矩形框的顶端宽度,也就是说原始待检测图像中存在三个车辆标注矩形框,这三个标注矩形框的顶端均位于第L行,且这三个标注矩形框的顶端宽度不同,代表三种类型的车辆,如图3所示。
第一标注矩形框缩小到特征金字塔的第3层后,可以被车辆DPM检测器检测到,也就是说第一标注矩形框所在的第一映射区域缩放到第3层后,形成的第一待检测区域的高度与DPM检测器的模板高度相等。在已知DPM检测器的模板高度的情况下,可以推导出第一映射区域的高度即第一标注矩形框的高度,进而确定第一映射区域在原始待检测图像中的位置信息。本发明实施例中,第一映射区域的宽度等于原始待检测图像的宽度。
同理,可以根据第二标注矩形框对应的特征金字塔层数即第4层,推导出第二映射区域的高度,进而确定原始待检测图像中的第二映射区域的位置信息。
根据第三标注矩形框对应的特征金字塔层数即第5层,推导出第三映射区域的高度,进而确定原始待检测图像中的第三映射区域的位置信息。
上述三个映射区域的起始行均是第L行,结束行因为映射区域的高度不同而不同。
依次类推,确定每一行对应的缩放层映射到原始待检测图像中的映射区域的位置信息。
确定映射区域的位置信息主要确定映射区域的高度信息。本发明实施例中,可以采用以下公式(8)计算一个映射区域的高度DetHgt:
DetHgt=ModelHgt*Sbin*Scale……公式(8)
其中,ModelHgt表示DPM检测器的模板高度;Sbin是DPM检测器的模板高度的度量单位;Scale为缩放层对应的缩放系数,即原始待检测图像中一个映射区域相对于对应缩放层的待检测区域的缩放倍数,可以采用以下公式(9)表示:
Wid(Li)表示步骤11预测的第L行的一个目标宽度;ModelWid表示DPM检测器的滤波器模板宽度;Sbin是DPM检测器中滤波器模板宽度的度量单位;表示上述目标宽度对应的缩放层,其中, 表示所述目标宽度所在的映射区域相对层的待检测区域的缩放倍数。
将公式(9)计算的缩放倍数待入公式(8)中,可以得到当前缩放层对应的待检测区域在原始待检测图像中的映射区域的高度DetHgt。
步骤132、根据每一个映射区域的位置信息和原始待检测图像的图像数据,确定每一个映射区域的图像数据;
根据相关知识,使用DPM检测器进行目标检测的过程,是使用DPM检测器的滤波器模板对每个缩放层对应的待检测区域进行卷积的过程。在步骤131确定了每个缩放层对应的映射区域的位置信息的基础上,可以从原始待检测图像中确定映射区域的图像数据。
步骤133、依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
本公开实施例中,在确定一个缩放层对应的映射区域的图像数据后,根据缩放层对应的缩放倍数Scale,对映射区域的图像数据进行缩放,获得待检测区域的图像数据。
如上,将原始待检测图像中第一映射区域的图像数据缩放至第3层后,得到第一待检测区域的图像数据;同理,将原始待检测图像中第二映射区域的图像数据缩放至第4层后,得到第二待检测区域的图像数据;将原始待检测图像中第三映射区域的图像数据缩放至第5层后,得到第三待检测区域的图像数据。其中,缩放层3、4、5示例性地表示上述公式(9)中的具体数值。
步骤134、提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
由于DPM目标检测过程是利用DPM检测器的滤波器模板对待检测区域的特征图像从左到右滑动窗口检测的过程,所以在目标检测之前,需要计算各待检测区域的HOG特征数据,参照图6所示的确定映射区域及目标检测的示意图。
结合上述示例,提取第一待检测区域的图像数据的HOG特征,获得由HOG特征数据构成的第一特征图像;同理,提取第二待检测区域的图像数据的HOG特征,获得由HOG特征数据构成的第二特征图像;提取第三待检测区域的图像数据的HOG特征,获得由HOG特征数据构成的第三特征图像。
另外,在计算各行对应的缩放层的待检测区域数据时,由于相邻行仅差一个像素,对于同一类别的目标,比如车辆,相邻行对应的车辆宽度范围会有交集。相应的,相邻行对应的缩放层范围也会有交集。进一步可以推定,缩放层数相同的情况下,不同行对应的映射区域会存在重合区域,则相应相同缩放层对应的待检测区域的图像数据以及特征数据也存在重合部分。
基于上述特征,本发明在计算下一行对应的待检测区域的缩放数据以及对应的HOG特征数据时,可以重复利用上一行的重合区域的缩放数据以及对应的HOG特征数据,以减少计算量。
参照图7所示的检测重合区域的场景示意图,在原始待检测图像中,假设根据公式(6)和(7)计算得出:第L行对应的缩放层具体为:3、4、5;第L+1行对应的缩放层具体为:5、6、7;二者具有相同的缩放层数:5。根据公式(9)和(8)可知,二者在第5层具有相同的映射区域高度DetHgt。
假设,第L行第5缩放层即的待检测区域对应的映射区域表示为Area[L,L+DetHgt];第L+1行第5缩放层即的待检测区域对应的映射区域表示为Area[L+1,L+1+DetHgt];从图6可知,两映射区域的重合区域可以表示为Area[L+1,L+DetHgt]。
相应的,缩放层的待检测区域与缩放层的待检测区域也对应有重合数据,可以表示为:Area[L+1,L+DetHgt][5]。因此,在目标检测时,对缩放层的待检测区域进行检测时,可以直接复用缩放层的待检测区域中的重合区域数据Area[L+1,L+DetHgt][5],节省第L+1行对应待检测区域图像数据的计算量。相应的,可以重复利用上述重合区域的HOG数据,进一步节省了特征数据的处理过程,提升目标检测效率。
步骤14、根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
本发明中,步骤14的实施至少包括两种方式:
第一种方式,与上述相关技术中的步骤B类似,采用车辆DPM检测器的滤波器模板以滑动窗口检测的方式在每一待检测区域对应的特征图像中进行检测,获得对应的检测得分图。
第二种方式,参照图8所示的另一种检测目标的方法流程图,步骤14可以包括:
步骤141、在每一待检测区域的HOG特征图像中,根据DPM检测器的滤波器模板确定待检测子窗口的特征向量;
在每一个HOG特征图像中,根据DPM检测器的滤波器模板尺寸可以划分出若干待检测子窗口区域,也就是说一个待检测子窗口区域的尺寸与滤波器模板尺寸相匹配。将每个子窗口区域的HOG特征数据采用一个HOG特征向量表示。本发明实施例中,DPM检测器就是特征向量滤波器。
步骤142、从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
本发明实施例中,可以首先根据预设数量的相同场景图像训练一类目标的特征向量集合。在对后续的图像进行目标检测的过程中,可以首先确定待检测子窗口的特征向量在预置特征向量集合中的类似特征向量。
具体过程为:假设上述预置特征向量集合为C,包括k中特征向量。计算步骤141确定的每一个待检测子窗口的特征向量与C中的每一类特征向量的欧式距离,表示为:d={d1,d2,…,dk}。选取最小值对应的下标i,则所述待检测子窗口的特征向量属于第i类HOG特征向量ci,即,其类似特征向量为ci。
步骤143,根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置得分表包括:特征向量类别与检测得分的对应关系。
上述预置得分表包括上述特征向量集合中的每一类特征向量与对应的检测得分的关系。其中,得分表中的每一种检测得分是由对应的特征向量与所述DPM检测器模板进行卷积运算得到的。
本发明实施例中,通过与一个待检测子窗口的特征向量类似的特征向量查询上述预置得分表,即可确定该待检测子窗口的检测得分,进而确定每一特征图像对应的得分图像。
本发明实施例中,在确定待检测区域的检测得分的过程中,无需利用DPM检测模板与待检测区域的HOG特征进行卷积计算,而是通过查询预置得分表的方式确定待检测区域的检测得分,有效减少了计算量,提高了DPM目标检测效率。
参照图9所示的本发明另一检测目标的方法流程图,在图8所示实施例的基础上,在上述步骤141之前还可以包括:
步骤140、根据预设数量的场景图像,建立检测得分表。
参照图10所示的本发明另一种检测目标的方法流程图,步骤140可以包括:
步骤1401、获取预设数量的场景图像的全部HOG特征向量;
利用DPM检测器进行目标检测的过程中,遍历的HOG特征向量类型存在无限种可能。本发明实施例中,事先随机选取m幅场景图像,计算其全部HOG特征,可以表示为:X={x1,x2,…,xn},其中,xn为HOG特征向量。
步骤1402、采用预设聚类算法对所述全部HOG特征向量进行聚类训练,获得预设类别的HOG特征向量;
本发明实施例可以选取k-means聚类算法对上述HOG特征向量集合进行聚类训练。具体训练过程如下:首先,将上述n类特征向量划分为k类,在X中随机选取k类作为初始种子点集,即C={c1,c2,…,ck},其中,ck为第k类所有HOG特征向量的中心点;其次,将剩余的{X-C}中的每一个HOG特征向量依次划分到离C中最近的类并更新ci,直到聚类中心C不再发生变化,此时C就为所要求的HOG特征向量类。即可以认为量化后的K类特征向量可以代表所有待检测图像的特征向量。
步骤1403、将每一类HOG特征向量与DPM检测器进行卷积运算,获得对应的检测得分,建立检测得分表。
具体为:将集合C中每一类的HOG特征与DPM的根滤波器模板与部件模滤波器板进行卷积,得到该类HOG特征向量对应的检测得分,建立检测得分表。
假设对上述m幅图像的特征向量进行量化后,集合C中包括256类HOG特征向量。即,用上述256类特征向量代替上述无数个特征向量。
将C中的256类特征向量与上述车辆DPM检测器的滤波器模板进行卷积运算,可以得到对应的256个检测得分,建立得分表,如表一所示:
特征向量类别 | 响应得分 |
K1 | C1 |
K2 | C2 |
K3 | C3 |
…… | …… |
K256 | C256 |
表一
可见,本发明可以通过对图像检测区域进行HOG特征矢量量化,与训练出DPM检测器模板进行卷积,将计算的得分建立得分表。在后续目标检测过程中,经过步骤13得到的HOG特征区域对应的检测得分,可以按照上述步骤141~143进行查表得到。与现有技术中直接用卷积计算检测得分相比,节省了很多计算性能,有效提升了目标检测效率。
步骤15、根据每个检测得分图中大于预设阈值的区域,确定目标检测框。
本发明实施例中,步骤15的具体实施过程为:与上述步骤C类似,将每个得分图像中每个点的窗口得分与预设阈值比较,将大于所述预设阈值的点组成的区域确定为每个待检区域中的目标标注框;与上述步骤D类似,将所有待检区域中的目标标注框映射到原始待检测图像中,可以利用NMS(NonMaximum Suppression,非极大值抑制)算法过滤重合的标注框,获得最终的目标检测框,即在原始待检测图像中标注目标的矩形框。
需要说明的是,本发明提供的检测目标的方法并不仅限于应用于视频监控技术领域,还可以应用于图像识别等其他计算机视觉领域。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。
其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
与本发明提供的一种检测目标的方法实施例相对应,本发明还提供了一种检测目标的装置,参照图11示出的一种检测目标的装置框图,可以包括:
目标宽度预测模块21,用于预测原始待检测图像中每一行对应的目标宽度范围;
缩放层计算模块22,用于根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
特征确定模块23,用于根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;
检测模块24,用于根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
目标确定模块25,用于根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。
参照图12示出的另一种检测目标的装置框图,在图11所示实施例的基础上,所述目标宽度预测模块21可以包括:
第一预测子模块211,用于利用公式:ObjWid(h)min=Φ(h)-3σ(h),计算最小目标宽度;
第二预测子模块212,用于利用公式:ObjWid(h)max=Φ(h)+3σ(h),计算最大目标宽度;
其中,ObjWid(h)min为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最小宽度,即最小目标宽度;ObjWid(h)max为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最大宽度,即最大目标宽度;σ(h)为待检测图像中目标宽度方差,Φ(h)为待检测图像中目标的平均宽度。
参照图13示出的另一种检测目标的装置框图,在图11所示实施例的基础上,所述缩放层计算模块22可以包括:
第一计算子模块221,用于利用公式:计算每一行对应的特征金字塔的起始缩放层;
第二计算子模块222,用于利用公式:计算每一行对应的特征金字塔的结束缩放层;
其中,表示预测第L行对应的起始缩放层;表示预测第L行对应的结束缩放层;
表示预测第L行对应的最小目标宽度;表示预测第L行对应的最大目标宽度;
Sbin*ModelWid表示目标DPM检测器的模板宽度的像素值,其中,ModelWid表示目标DPM检测器的模板宽度,该宽度是以Sbin为度量单位;
21/Interval表示相邻两个缩放层之间的缩放倍数,其中,Interval表示图像尺寸缩小到原始图像一半时经过的缩放层数。
参照图14示出的另一种检测目标的装置框图,在图13所示实施例的基础上,所述特征确定模块23可以包括:
位置确定子模块231,用于根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息;
映射区域确定子模块232,用于根据每一个所述映射区域的位置信息和所述原始待检测图像的图像数据,确定每一个所述映射区域的图像数据;
检测区域确定子模块233,用于依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
特征提取子模块234,用于提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
参照图15示出的另一种检测目标的装置框图,在图14所示实施例的基础上,所述位置确定子模块231可以包括:
高度确定单元2311,用于根据公式:DetHgt=ModelHgt*Sbin*Scale,计算一个映射区域的高度;
其中,DetHgt表示一个映射区域的高度;ModelHgt表示DPM检测器的模板高度;Sbin是DPM检测器的模板高度的度量单位;
Scale为缩放层对应的缩放系数,采用以下公式表示:其中,表示第L行对应的一个缩放层,表示所述映射区域相对层的待检测区域的缩放倍数;
位置确定单元2312,用于根据所述映射区域的高度和所述原始待检测图像的宽度,确定一个映射区域的位置信息。
参照图16示出的另一种检测目标的装置框图,在图11所示实施例的基础上,所述检测模块24可以包括:
特征向量确定子模块241,用于在每一待检测区域的HOG特征图像中,根据所述DPM检测器的滤波器模板确定待检测子窗口的特征向量;
比较子模块242,用于从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
查询子模块243,用于根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置检测得分表包括:特征向量类别与检测得分的对应关系。
参照图17示出的另一种检测目标的装置框图,在图16所示实施例的基础上,所述检测模块23还可以包括:
得分表创建子模块244,用于根据预设数量的场景图像,建立检测得分表。
参照图18示出的另一种检测目标的装置框图,在图17所示实施例的基础上,所述得分表创建子模块244可以具体包括:
特征向量获取单元2441,用于获取预设数量的场景图像的全部HOG特征向量;
分类单元2442,用于采用预设聚类算法对所述全部HOG特征向量进行聚类训练,获得预设类别的HOG特征向量;
计算单元2443,用于将每一类HOG特征向量与所述DPM检测器进行卷积运算,获得对应的检测得分,建立所述检测得分表。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种检测目标的方法,其特征在于,所述方法包括:
预测原始待检测图像中每一行对应的目标宽度范围;
根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;
根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。
2.根据权利要求1所述的方法,其特征在于,所述预测原始待检测图像中每一行对应的目标宽度范围,包括:
利用公式:ObjWid(h)min=Φ(h)-3σ(h),计算最小目标宽度;
利用公式:ObjWid(h)max=Φ(h)+3σ(h),计算最大目标宽度;
其中,ObjWid(h)min为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最小宽度,即最小目标宽度;ObjWid(h)max为待检测图像中目标的标注矩形框的顶端的纵坐标为h时,对应的标注矩形框的最大宽度,即最大目标宽度;σ(h)为待检测图像中目标宽度方差,Φ(h)为待检测图像中目标的平均宽度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围,包括:
利用公式:计算每一行对应的特征金字塔的起始缩放层;
利用公式:计算每一行对应的特征金字塔的结束缩放层;
其中,表示预测第L行对应的起始缩放层;表示预测第L行对应的结束缩放层;
表示预测第L行对应的最小目标宽度;表示预测第L行对应的最大目标宽度;
Sbin*ModelWid表示目标DPM检测器的模板宽度的像素值,其中,ModelWid表示目标DPM检测器的模板宽度,该宽度是以Sbin为度量单位;
21/Interval表示相邻两个缩放层之间的缩放倍数,其中,Interval表示图像尺寸缩小到原始图像一半时经过的缩放层数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述每一行对应的缩放层范围和已训练的目标DPM检测器,确定每一行对应的待检测区域的HOG特征数据,包括:
根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息;
根据每一个所述映射区域的位置信息和所述原始待检测图像的图像数据,确定每一个所述映射区域的图像数据;
依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息,包括:
根据公式:DetHgt=ModelHgt*Sbin*Scale,计算一个映射区域的高度;
其中,DetHgt表示一个映射区域的高度;ModelHgt表示DPM检测器的模板高度;Sbin是DPM检测器的模板高度的度量单位;
Scale为缩放层对应的缩放系数,采用以下公式表示:其中,表示第L行对应的一个缩放层, 表示所述映射区域相对层的待检测区域的缩放倍数;
根据所述映射区域的高度和所述原始待检测图像的宽度,确定一个映射区域的位置信息。
6.根据权利要求1所述的方法,其特征在于,所述根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图,包括:
在每一待检测区域的HOG特征图像中,根据所述DPM检测器的滤波器模板确定待检测子窗口的特征向量;
从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置检测得分表包括:特征向量类别与检测得分的对应关系。
7.根据权利要求6所述的方法,其特征在于,所述根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图,还包括:
根据预设数量的场景图像,建立检测得分表;具体包括:
获取预设数量的场景图像的全部HOG特征向量;
采用预设聚类算法对所述全部HOG特征向量进行聚类训练,获得预设类别的HOG特征向量;
将每一类HOG特征向量与所述DPM检测器进行卷积运算,获得对应的检测得分,建立所述检测得分表。
8.一种检测目标的装置,其特征在于,所述装置包括:
目标宽度预测模块,用于预测原始待检测图像中每一行对应的目标宽度范围;
缩放层计算模块,用于根据所述每一行对应的目标宽度范围,计算每一行对应的特征金字塔的缩放层范围;
特征确定模块,用于根据所述每一行对应的缩放层范围和已训练的目标可变形部件模型DPM检测器,确定每一行对应的待检测区域的方向梯度直方图HOG特征数据;
检测模块,用于根据每一缩放层对应的HOG特征图像和所述目标DPM检测器,确定每一个待检测区域的检测得分图;
目标确定模块,用于根据每个所述检测得分图中大于预设阈值的区域,确定目标检测框。
9.根据权利要求8所述的装置,其特征在于,所述特征确定模块包括:
位置确定子模块,用于根据所述缩放层范围内的缩放层数和已训练的目标DPM检测器的模板尺寸,确定每一缩放层对应的待检测区域在所述原始待检测图像中的映射区域的位置信息;
映射区域确定子模块,用于根据每一个所述映射区域的位置信息和所述原始待检测图像的图像数据,确定每一个所述映射区域的图像数据;
检测区域确定子模块,用于依据所述每一个映射区域的图像数据和缩放层对应的缩放系数,获取待检测区域的图像数据;
特征提取子模块,用于提取所述待检测区域的图像数据的HOG特征,获得所述待检测区域的HOG特征图像。
10.根据权利要求8所述的装置,其特征在于,所述检测模块包括:
特征向量确定子模块,用于在每一待检测区域的HOG特征图像中,根据所述DPM检测器的滤波器模板确定待检测子窗口的特征向量;
比较子模块,用于从预置特征向量集合中,确定与所述待检测子窗口的特征向量相似的类似特征向量;
查询子模块,用于根据所述类似特征向量查询预置检测得分表,确定所述待检测子窗口的特征向量对应的检测得分,所述预置检测得分表包括:特征向量类别与检测得分的对应关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610341049.2A CN105956632B (zh) | 2016-05-20 | 2016-05-20 | 一种检测目标的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610341049.2A CN105956632B (zh) | 2016-05-20 | 2016-05-20 | 一种检测目标的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105956632A true CN105956632A (zh) | 2016-09-21 |
CN105956632B CN105956632B (zh) | 2019-06-11 |
Family
ID=56910366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610341049.2A Active CN105956632B (zh) | 2016-05-20 | 2016-05-20 | 一种检测目标的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105956632B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106657713A (zh) * | 2016-12-30 | 2017-05-10 | 华中科技大学 | 一种视频运动放大方法 |
CN106997459A (zh) * | 2017-04-28 | 2017-08-01 | 成都艾联科创科技有限公司 | 一种基于神经网络和图像叠合分割的人数统计方法及系统 |
CN107368832A (zh) * | 2017-07-26 | 2017-11-21 | 中国华戎科技集团有限公司 | 基于图像的目标检测及分类方法 |
CN107886539A (zh) * | 2017-10-19 | 2018-04-06 | 昆明理工大学 | 一种工业场景下高精度齿轮视觉检测方法 |
CN109508637A (zh) * | 2018-10-10 | 2019-03-22 | 广州鹰瞰信息科技有限公司 | 嵌入式实时车辆检测方法与系统 |
CN109948605A (zh) * | 2019-02-15 | 2019-06-28 | 北京中电普华信息技术有限公司 | 一种针对小目标的图片增强方法及装置 |
CN109961447A (zh) * | 2019-03-29 | 2019-07-02 | 京东方科技集团股份有限公司 | 价签检测方法及装置、电子设备、存储介质 |
CN110181504A (zh) * | 2018-02-22 | 2019-08-30 | 北京猎户星空科技有限公司 | 一种控制机械臂移动的方法、装置及控制设备 |
CN110263736A (zh) * | 2019-06-24 | 2019-09-20 | 广州偕作信息科技有限公司 | 一种构件识别方法、装置、存储介质及系统 |
CN111429726A (zh) * | 2020-04-13 | 2020-07-17 | 城云科技(中国)有限公司 | 一种监控视频违停车辆检测、管理方法及对应的系统 |
CN114065868A (zh) * | 2021-11-24 | 2022-02-18 | 马上消费金融股份有限公司 | 文本检测模型的训练方法、文本检测方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719276A (zh) * | 2009-12-01 | 2010-06-02 | 北京中星微电子有限公司 | 一种检测图像中物体的方法和装置 |
CN103295021A (zh) * | 2012-02-24 | 2013-09-11 | 北京明日时尚信息技术有限公司 | 一种静态图片中车辆特征检测及识别的方法及系统 |
CN103530610A (zh) * | 2013-10-12 | 2014-01-22 | 智博锐视(北京)科技有限公司 | 目标检测方法和装置 |
CN103793892A (zh) * | 2012-11-01 | 2014-05-14 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN104504381A (zh) * | 2015-01-09 | 2015-04-08 | 博康智能网络科技股份有限公司 | 非刚体目标检测方法及其系统 |
CN105225226A (zh) * | 2015-09-02 | 2016-01-06 | 电子科技大学 | 一种基于图像分割的级联可变形部件模型目标检测方法 |
WO2016026371A1 (en) * | 2014-08-22 | 2016-02-25 | Zhejiang Shenghui Lighting Co., Ltd. | Fast object detection method based on deformable part model (dpm) |
CN105488468A (zh) * | 2015-11-26 | 2016-04-13 | 浙江宇视科技有限公司 | 一种目标区域的定位方法和装置 |
CN105512683A (zh) * | 2015-12-08 | 2016-04-20 | 浙江宇视科技有限公司 | 基于卷积神经网络的目标定位方法及装置 |
-
2016
- 2016-05-20 CN CN201610341049.2A patent/CN105956632B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719276A (zh) * | 2009-12-01 | 2010-06-02 | 北京中星微电子有限公司 | 一种检测图像中物体的方法和装置 |
CN103295021A (zh) * | 2012-02-24 | 2013-09-11 | 北京明日时尚信息技术有限公司 | 一种静态图片中车辆特征检测及识别的方法及系统 |
CN103793892A (zh) * | 2012-11-01 | 2014-05-14 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN103530610A (zh) * | 2013-10-12 | 2014-01-22 | 智博锐视(北京)科技有限公司 | 目标检测方法和装置 |
WO2016026371A1 (en) * | 2014-08-22 | 2016-02-25 | Zhejiang Shenghui Lighting Co., Ltd. | Fast object detection method based on deformable part model (dpm) |
CN104504381A (zh) * | 2015-01-09 | 2015-04-08 | 博康智能网络科技股份有限公司 | 非刚体目标检测方法及其系统 |
CN105225226A (zh) * | 2015-09-02 | 2016-01-06 | 电子科技大学 | 一种基于图像分割的级联可变形部件模型目标检测方法 |
CN105488468A (zh) * | 2015-11-26 | 2016-04-13 | 浙江宇视科技有限公司 | 一种目标区域的定位方法和装置 |
CN105512683A (zh) * | 2015-12-08 | 2016-04-20 | 浙江宇视科技有限公司 | 基于卷积神经网络的目标定位方法及装置 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106657713B (zh) * | 2016-12-30 | 2019-03-22 | 华中科技大学 | 一种视频运动放大方法 |
CN106657713A (zh) * | 2016-12-30 | 2017-05-10 | 华中科技大学 | 一种视频运动放大方法 |
CN106997459B (zh) * | 2017-04-28 | 2020-06-26 | 成都艾联科创科技有限公司 | 一种基于神经网络和图像叠合分割的人数统计方法及系统 |
CN106997459A (zh) * | 2017-04-28 | 2017-08-01 | 成都艾联科创科技有限公司 | 一种基于神经网络和图像叠合分割的人数统计方法及系统 |
CN107368832A (zh) * | 2017-07-26 | 2017-11-21 | 中国华戎科技集团有限公司 | 基于图像的目标检测及分类方法 |
CN107886539A (zh) * | 2017-10-19 | 2018-04-06 | 昆明理工大学 | 一种工业场景下高精度齿轮视觉检测方法 |
CN107886539B (zh) * | 2017-10-19 | 2021-05-14 | 昆明理工大学 | 一种工业场景下高精度齿轮视觉检测方法 |
CN110181504B (zh) * | 2018-02-22 | 2021-03-02 | 北京猎户星空科技有限公司 | 一种控制机械臂移动的方法、装置及控制设备 |
CN110181504A (zh) * | 2018-02-22 | 2019-08-30 | 北京猎户星空科技有限公司 | 一种控制机械臂移动的方法、装置及控制设备 |
CN109508637A (zh) * | 2018-10-10 | 2019-03-22 | 广州鹰瞰信息科技有限公司 | 嵌入式实时车辆检测方法与系统 |
CN109948605A (zh) * | 2019-02-15 | 2019-06-28 | 北京中电普华信息技术有限公司 | 一种针对小目标的图片增强方法及装置 |
CN109948605B (zh) * | 2019-02-15 | 2021-05-28 | 北京中电普华信息技术有限公司 | 一种针对小目标的图片增强方法及装置 |
CN109961447A (zh) * | 2019-03-29 | 2019-07-02 | 京东方科技集团股份有限公司 | 价签检测方法及装置、电子设备、存储介质 |
CN110263736A (zh) * | 2019-06-24 | 2019-09-20 | 广州偕作信息科技有限公司 | 一种构件识别方法、装置、存储介质及系统 |
CN111429726A (zh) * | 2020-04-13 | 2020-07-17 | 城云科技(中国)有限公司 | 一种监控视频违停车辆检测、管理方法及对应的系统 |
CN111429726B (zh) * | 2020-04-13 | 2021-11-26 | 城云科技(中国)有限公司 | 一种监控视频违停车辆检测、管理方法及对应的系统 |
CN114065868A (zh) * | 2021-11-24 | 2022-02-18 | 马上消费金融股份有限公司 | 文本检测模型的训练方法、文本检测方法及装置 |
CN114065868B (zh) * | 2021-11-24 | 2022-09-02 | 马上消费金融股份有限公司 | 文本检测模型的训练方法、文本检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105956632B (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105956632B (zh) | 一种检测目标的方法和装置 | |
CN107609485B (zh) | 交通标志的识别方法、存储介质、处理设备 | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN108898047B (zh) | 基于分块遮挡感知的行人检测方法及系统 | |
CN111126224A (zh) | 车辆检测方法及分类识别模型训练方法 | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN108549870A (zh) | 一种对物品陈列进行鉴别的方法及装置 | |
CN106570439B (zh) | 一种车辆检测方法及装置 | |
CN111274926B (zh) | 图像数据筛选方法、装置、计算机设备和存储介质 | |
KR101753097B1 (ko) | 차량검출방법, 차량검출을 위한 데이터베이스의 구조, 및 차량검출을 위한 데이터베이스 구축방법 | |
EP2927871A1 (en) | Method and device for calculating number of pedestrians and crowd movement directions | |
CN110135514B (zh) | 一种工件分类方法、装置、设备及介质 | |
CN105225523B (zh) | 一种车位状态检测方法及装置 | |
CN106446890B (zh) | 一种基于窗口打分和超像素分割的候选区域提取方法 | |
CN104615986A (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
CN108052929A (zh) | 车位状态检测方法、系统、可读存储介质和计算机设备 | |
CN110176024A (zh) | 在视频中对目标进行检测的方法、装置、设备和存储介质 | |
CN116740652B (zh) | 一种基于神经网络模型的锈斑面积扩大的监测方法与系统 | |
CN110827319B (zh) | 一种基于局部敏感直方图改进的Staple目标跟踪方法 | |
CN106682604B (zh) | 一种基于深度学习的模糊图像检测方法 | |
CN115035164A (zh) | 一种运动目标识别方法及装置 | |
CN105678333B (zh) | 一种拥挤区域的确定方法和装置 | |
CN105825215B (zh) | 一种基于局部近邻嵌入核函数的仪表定位方法及使用载体 | |
Aristoteles et al. | Identification of human sperm based on morphology using the you only look once version 4 algorithm | |
CN107679467B (zh) | 一种基于hsv和sdalf的行人重识别算法实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |