CN106326891A - 移动终端及其目标检测方法及装置 - Google Patents

移动终端及其目标检测方法及装置 Download PDF

Info

Publication number
CN106326891A
CN106326891A CN201510375020.1A CN201510375020A CN106326891A CN 106326891 A CN106326891 A CN 106326891A CN 201510375020 A CN201510375020 A CN 201510375020A CN 106326891 A CN106326891 A CN 106326891A
Authority
CN
China
Prior art keywords
image
hog
feature
delta
gamma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510375020.1A
Other languages
English (en)
Inventor
刘阳
陈敏杰
潘博阳
郭春磊
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Tianjin Co Ltd
Original Assignee
Spreadtrum Communications Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Tianjin Co Ltd filed Critical Spreadtrum Communications Tianjin Co Ltd
Priority to CN201510375020.1A priority Critical patent/CN106326891A/zh
Publication of CN106326891A publication Critical patent/CN106326891A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Abstract

移动终端及其目标检测方法及装置,所述检测方法包括:计算出图像金字塔所对应的基于HOG的特征金字塔;所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:提取HOG特征;所述提取HOG特征包括:计算梯度图像;进行直方图统计;进行归一化和截断;其中,所述进行归一化和截断包括:预先建立第一查找表,将多个数值与它们各自的开方倒数对应保存;累积每一方向直方图的二阶范数,获得梯度能量图像;依据所述梯度能量图像和所述第一查找表,计算出HOG特征。本发明在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,依据梯度能量图像和预先建立的所述第一查找表,计算出HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算。

Description

移动终端及其目标检测方法及装置
技术领域
本发明涉及计算机视觉和机器学习技术领域,特别是涉及一种移动终端及其目标检测方法及装置。
相关术语解释
Histogram of Oriented Gradient——HOG——梯度方向直方图;
Support Vector Machine——SVM——支持向量机;
Convolutional Neural Network——CNN——卷积神经网络;
Deformable Part-based Model——DPM——基于部件的变形模型;
Cascade——级联;
Image Pyramids——图像金字塔;
Feature Pyramids——特征金字塔;
Haar——哈尔。
背景技术
当前,包括智能手机、平板电脑在内的许多产品,都会带有目标检测的功能,例如人手检测、人脸检测、行人检测等。
以人手检测为例,人手检测的主要目的,是在图像和视频中检测出人手的目标实例,可应用于手势识别、人机交互等。
目标检测与识别是计算机视觉领域一个极具挑战性的课题,目标检测是目标识别的前提,可以直接影响识别成功率的大小。作为手势识别的初始化步骤,人手检测也不例外。
现有技术中存在多种目标识别和检测的方法,按照模型来区分的话,主流的方案有:
1)自提升级联模型(AdaBoost Cascaded Model),主要和哈尔特征一起应用于人脸检测(Face Detection)领域。该方案使用简单的哈尔特征学习许多简单的弱分类器(Weak Classifier),在训练阶段不断调整被错误分类样本的权重,最后通过加权平均来获得最终分类器。在实际检测时采用级联结构,每一层滤掉大部分非人脸候选,同时让大部分人脸候选通过,从而加速检测。
2)支持向量机(Support Vector Machine,SVM),主要和梯度方向直方图(Histogram of Oriented Gradient,HOG)特征一起应用于行人检测(PedestrianDetection)领域。该方案计算稠密的梯度方向特征,使用简单的线性SVM对高维的HOG描述子进行分类就能取得很好的效果。
3)卷积神经网络(Convolutional Neural Network,CNN)是近年大热的方法,适用于泛化目标(Generalized Object)的检测与识别。对输入图像进行多层的卷积、池化操作,再通过Softmax分类器进行分类即完成检测过程。尽管实现的过程近似于“黑盒”,但结果却超过了其他方法。
4)基于部件的变形模型(Deformable Part-based Model,DPM),主要和梯度方向直方图(HOG)特征一起应用于泛化目标的检测与识别,尤其适合对非刚性目标的检测和识别。该方法的核心要素,是将部件相对位置和整体位置视为隐变量,使用隐形SVM(Latent-SVM)完成半监督学习。该方法也可以实现级联检测,在不影响检测质量的前提下,可以实现一个数量级的速度提升。这是目前最好的目标检测方法之一。
发明人发现,上述现有技术的方案存在一定的缺陷,具体如下:
关于上述方案1),哈尔特征与自提升级联模型目前主要在人脸检测上取得了成功,从现有公开的论文、专利来看,在其他类别的目标检测中未必表现最好,有一定的局限性。主要原因是哈尔特征适用于纹理信息丰富的目标,却未必适用于边缘轮廓信息丰富的目标,如行人。
关于上述方案2),HOG特征和SVM分类器实现的行人检测器效果较好,但对变形或是侧面视角的行人目标的处理是它的弊端。究其原因,是因为没有针对变形和多视角的处理机制。
关于上述方案3),CNN模型和Softmax分类器实现的泛化目标检测器,在现有的标准数据集如:Visual Object Classes Challenge、ImageNet上的检测结果好于其他方法,同时也低于人类视觉系统的检测水平。但这类方法的操作近似“黑盒”,针对特定目标的检测、调参也需要耗费极大的人力。从目前的趋势来看,这类方法还需要进一步完善和改进。
关于上述方案4),基于DPM模型和HOG特征的检测器,虽然适用于变形和多视角的目标。但计算复杂度高、计算量大的问题影响了它的实际应用。尤其是对于以智能手机为代表移动终端而言,由于智能手机的运算能力远不如大型计算机,因此,该方案由于其计算复杂度高、计算量大的问题目前还无法在智能手机等移动终端上应用。
发明内容
本发明解决的技术问题是:对于基于DPM模型和HOG特征的目标检测方法,如何使得其处理过程中所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
为了解决上述技术问题,本发明实施例提供一种目标检测方法,包括:
构造图像金字塔;
计算出图像金字塔所对应的基于HOG的特征金字塔;
采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置;
所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
提取HOG特征;
所述提取HOG特征包括:
计算梯度图像;
进行直方图统计;
进行归一化和截断;
其中,所述进行归一化和截断包括:
预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
累积每一方向直方图的二阶范数,获得梯度能量图像;
依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
可选的,所述建立第一查找表包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
可选的,所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中,δ,γ∈{-1,1}, x ∈ { 1 , 2 , ... , [ w k ] } , y ∈ { 1 , 2 , ... , [ h k ] } ;
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
可选的,在所述构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,所述构造图像金字塔包括:
对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;
对于同一层尺度下的降采样,采用双三次插值的方式进行降采样。
可选的,所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
计算部分尺度的HOG特征;
在计算部分尺度的HOG特征之后,依据式7计算与其相邻的其他尺度的HOG特征;
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
可选的,所述计算梯度图像包括:
将输入图像转换为灰度格式;
使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像。
可选的,在所述计算梯度图像之后,还包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
为了解决上述技术问题,本发明实施例还提供一种目标检测装置,包括:图像金字塔构造单元、特征金字塔计算单元和目标位置确定单元;其中:
图像金字塔构造单元,适于构造图像金字塔;
特征金字塔计算单元,适于计算出图像金字塔所对应的基于HOG的特征金字塔;
目标位置确定单元,适于采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置;
所述特征金字塔计算单元包括:HOG特征提取单元,适于提取HOG特征;
所述HOG特征提取单元包括:梯度图像计算单元、直方图统计单元和归一化和截断单元;其中:
梯度图像计算单元,适于计算梯度图像;
直方图统计单元,适于进行直方图统计;
归一化和截断单元,适于进行归一化和截断;
其中,所述归一化和截断单元包括:
查找表子单元,适于预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
梯度能量计算子单元,适于累积每一方向直方图的二阶范数,获得梯度能量图像;
HOG特征计算子单元,适于依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
可选的,所述建立第一查找表包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
可选的,所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中,δ,γ∈{-1,1}, x ∈ { 1 , 2 , ... , [ w k ] } , y ∈ { 1 , 2 , ... , [ h k ] } ;
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据 1 N δ , γ ( x , y ) , 采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
可选的,所述目标检测装置还包括:图像金字塔构造单元、特征金字塔计算单元和目标位置确定单元;其中:
图像金字塔构造单元,适于在所述HOG特征提取单元执行操作之后,构造图像金字塔;
特征金字塔计算单元,适于在所述HOG特征提取单元执行操作之后,计算出图像金字塔所对应的基于HOG的特征金字塔;
目标位置确定单元,适于在所述HOG特征提取单元执行操作之后,采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置。
可选的,在所述构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,所述构造图像金字塔包括:
对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;
对于同一层尺度下的降采样,采用双三次插值的方式进行降采样。
可选的,所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
计算部分尺度的HOG特征;
在计算部分尺度的HOG特征之后,依据式7计算与其相邻的其他尺度的HOG特征;
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
可选的,所述计算梯度图像包括:
将输入图像转换为灰度格式;
使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像。
可选的,在所述计算梯度图像之后,还包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
为了解决上述技术问题,本发明实施例还提供一种移动终端,包括上述目标检测装置。
可选的,所述移动终端为智能手机或平板电脑。
与现有技术相比,本发明的技术方案具有以下有益效果:
在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存,在进行归一化和截断的过程中,依据梯度能量图像和预先建立的所述第一查找表,计算出HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算,使得基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
进一步地,在构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;对于同一层尺度下的降采样,采用双三次插值的方式进行降采样,从而进一步降低基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量。
进一步地,在计算图像金字塔所对应的基于HOG的特征金字塔的过程中,只计算少量尺度的HOG特征,在此基础上通过近似计算得到其他相邻尺度的HOG特征,从而在对检测质量影响不大的前提下,进一步降低基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量。
附图说明
图1为本发明实施例中目标检测方法流程图;
图2为本发明实施例中提取HOG特征方法流程图;
图3为本发明实施例中目标检测装置结构框图。
具体实施方式
根据背景技术部分的分析可知,基于DPM模型和HOG特征的目标检测方法(即方案4))在使用级联检测技术时,可以在不影响检测质量的前提下,实现一个数量级的检测速度提升,是目前最好的目标检测方法之一。
但该方案计算复杂度高、计算量大的问题影响了它的实际应用。尤其是对于以智能手机为代表移动终端而言,由于智能手机的运算能力远不如大型计算机,因此,该方案由于其计算复杂度高、计算量大的问题目前还无法在智能手机等移动终端上应用。
发明人对该方案计算复杂度高、计算量大的原因进行了分析,并在此基础上进行了相应的改进。具体地:
在提取HOG特征的过程中需要进行归一化处理。
现在技术在获得梯度能量(Gradient Energy)图像GE之后,依据梯度能量图像GE可以计算出(最终提取的)HOG特征,具体地:
采用四种不同的归一化方式获得归一化图像Nδ,γ(x,y),如式4所示。
式4: N δ , γ ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中,δ,γ∈{-1,1},
(最后提取的)HOG特征由两部分组成,第一部分对应M个编码方向,如式5所示。
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
第二部分对应四种归一化方式,如式6所示。
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值。
(最终提取的)HOG特征为F=[F1,F2]。
从上述式5和式6中可以看到,上述依据梯度能量图像GE计算出(最终提取的)HOG特征的过程中,由GE(x,y)+GE(x+δ,y)+GE(x,y+γ)+GE(x+δ,y+γ)得到的过程涉及除法运算和开方运算,整个归一化处理过程需要进行大量的除法运算和开方运算。
对于移动终端而言,由于移动终端的运算能力远不如大型计算机,因而需要花费大量的时间来完成上述归一化过程,导致基于DPM模型和HOG特征的目标检测方法(即方案4))难以在移动终端上应用。
本发明预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存,在提取HOG特征的过程中,在获得梯度能量图像GE之后,依据所述梯度能量图像和所述第一查找表,来计算(最终提取的)HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算,使得基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
为使本领域技术人员更好地理解和实现本发明,以下参照附图,通过具体实施例进行详细说明。
实施例一
如下所述,本发明实施例提供一种目标检测方法。
本实施例中的目标检测方法,在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,大大减小了其实现过程中所涉及的计算复杂度和计算量,使得其处理过程中所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
本发明所提供的方案适用于泛化目标的检测,例如在人手检测、人脸检测、行人检测等领域均可适用。尤其适合对非刚性目标的检测。
参照图1所示的目标检测方法流程图:
基于DPM模型和HOG特征的目标检测方法包括:
S101,构造图像金字塔。
为了实现对多尺度人手目标的检测,需要构造图像金字塔,并计算相应的特征金字塔。
构造图像金字塔需要进行降采样,本实施例中采用两种方式:双三次插值(Bicubic Interpolation)和双线性插值。对于相差一个尺度的降采样,采用更快捷的双线性插值。同一层(Octave)尺度下的降采样,采用双三次插值。这种区分性降采样策略可以在保证图像质量的前提下,尽可能的降低计算复杂度。
S102,计算出图像金字塔所对应的基于HOG的特征金字塔;
在完成图像金字塔后,需要计算出对应的特征金字塔。所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:提取HOG特征。
如图2所示,本实施例通过如下步骤提取HOG特征:
S201,计算梯度图像。
在计算梯度图像的过程中,为了减小计算量,可以将输入图像转换为灰度格式,再使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像,即Gx,Gy。再如式1计算出梯度幅值图像GM
式1: G M = G x 2 + G y 2
通常将梯度方向划分为M个方向,如式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
在所述计算梯度图像之后,还包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
S202,进行直方图统计。
在计算出梯度图像之后,进行直方图统计。
对大小为w*h的梯度图像,可以以大小为k*k的元胞为单元进行统计。通常可以采用双线性插值(Bilinear Interpolation),即梯度图像中任一像素会同时被纳入周围四个相邻的元胞进行统计。针对每一编码方向m,可以统计出维数为的二维直方图H(x,y,m),其中,整体得直方图维数是表示向下取整。
S203,进行归一化和截断。
在进行直方图统计之后,进行归一化和截断。
本实施例中,所述进行归一化和截断包括:
预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
累积每一方向直方图的二阶范数,获得梯度能量图像;
依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
其中,所述建立第一查找表具体可以包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征具体可以包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中,δ,γ∈{-1,1},
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
经过上述步骤S201至S203,完成了对HOG特征的提取。
通过以上对技术方案的描述可以看出:本实施例中,在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存,在进行归一化和截断的过程中,依据梯度能量图像和预先建立的所述第一查找表,计算出HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算,使得基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
若图像尺寸较大,为保证检测质量,每层(Octave)需计算更多的级数(Level)。如果每一级都计算HOG特征,则计算复杂度会很高。
实践表明,对于尺度相近的图像,它们的HOG特征呈现近似指数函数的关系。
本实施例只计算少量尺度的HOG特征,其他相邻尺度的HOG特征可以通过如式7的近似计算得到。
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
通过以上对技术方案的描述可以看出:本实施例中,在计算图像金字塔所对应的基于HOG的特征金字塔的过程中,只计算少量尺度的HOG特征,在此基础上通过近似计算得到其他相邻尺度的HOG特征,从而在对检测质量影响不大的前提下,进一步降低基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量。
S103,采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置。
至此,实现了基于DPM模型和HOG特征的目标检测。本实施例在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,在进行归一化处理的过程中(步骤S203),避免了大量的除法运算和开方运算,在计算图像金字塔所对应的基于HOG的特征金字塔的过程中(步骤S102),避免了计算大量尺度的HOG特征,在对检测质量影响不大的前提下大大减小了计算复杂度和计算量,使得基于DPM模型和HOG特征的目标检测方法其处理过程中所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内,便于该目标检测方法在移动终端上的应用。
实施例二
如下所述,本发明实施例提供一种目标检测装置。
参照图3所示的目标检测装置结构框图。
所述目标检测装置包括:图像金字塔构造单元301、特征金字塔计算单元302和目标位置确定单元303;其中各单元的主要功能如下:
图像金字塔构造单元301,适于构造图像金字塔;
特征金字塔计算单元302,适于计算出图像金字塔所对应的基于HOG的特征金字塔;
目标位置确定单元303,适于采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置;
所述特征金字塔计算单元302包括:HOG特征提取单元3021,适于提取HOG特征;
所述HOG特征提取单元3021包括:梯度图像计算单元30211、直方图统计单元30212和归一化和截断单元30213;其中:
梯度图像计算单元30211,适于计算梯度图像;
直方图统计单元30212,适于进行直方图统计;
归一化和截断单元30213,适于进行归一化和截断;
其中,所述归一化和截断单元30213包括:
查找表子单元,适于预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
梯度能量计算子单元,适于累积每一方向直方图的二阶范数,获得梯度能量图像;
HOG特征计算子单元,适于依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
通过以上对技术方案的描述可以看出:本实施例中,在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存,在进行归一化和截断的过程中,依据梯度能量图像和预先建立的所述第一查找表,计算出HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算,使得基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
在具体实施中,所述建立第一查找表可以包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
在具体实施中,所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征可以包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中,δ,γ∈{-1,1},
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
在具体实施中,在所述构造图像金字塔的过程中可以采用双线性插值和双三次插值这两种方式进行降采样,所述构造图像金字塔可以包括:
对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;
对于同一层尺度下的降采样,采用双三次插值的方式进行降采样。
通过以上对技术方案的描述可以看出:本实施例中,在构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;对于同一层尺度下的降采样,采用双三次插值的方式进行降采样,从而进一步降低基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量。
在具体实施中,所述计算出图像金字塔所对应的基于HOG的特征金字塔可以包括:
计算部分尺度的HOG特征;
在计算部分尺度的HOG特征之后,依据式7计算与其相邻的其他尺度的HOG特征;
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
通过以上对技术方案的描述可以看出:本实施例中,在计算图像金字塔所对应的基于HOG的特征金字塔的过程中,只计算少量尺度的HOG特征,在此基础上通过近似计算得到其他相邻尺度的HOG特征,从而在对检测质量影响不大的前提下,进一步降低基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量。
在具体实施中,所述计算梯度图像可以包括:
将输入图像转换为灰度格式;
使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像。
在具体实施中,在所述计算梯度图像之后,还可以包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
实施例三
如下所述,本发明实施例提供一种移动终端。
与现有技术的不同之处在于,所述移动终端包括如本发明实施例中所提供的目标检测装置。该移动终端在现有技术中基于DPM模型和HOG特征的目标检测方法的基础上进行了改进,预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存,在进行归一化和截断的过程中,依据梯度能量图像和预先建立的所述第一查找表,计算出HOG特征,从而避免了归一化处理过程中大量的除法运算和开方运算,使得基于DPM模型和HOG特征的目标检测方法所涉及的计算复杂度和计算量能够在智能手机等移动终端所允许的范围之内。
在具体实施中,所述移动终端可以是智能手机或平板电脑。
本领域普通技术人员可以理解,上述实施例的各种方法中,全部或部分步骤是可以通过程序指示相关的硬件来完成的,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (16)

1.一种目标检测方法,其特征在于,包括:
构造图像金字塔;
计算出图像金字塔所对应的基于HOG的特征金字塔;
采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置;
所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
提取HOG特征;
所述提取HOG特征包括:
计算梯度图像;
进行直方图统计;
进行归一化和截断;
其中,所述进行归一化和截断包括:
预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
累积每一方向直方图的二阶范数,获得梯度能量图像;
依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
2.如权利要求1所述的目标检测方法,其特征在于,所述建立第一查找表包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
3.如权利要求1所述的目标检测方法,其特征在于,所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中, δ , γ ∈ { - 1 , 1 } , x ∈ { 1 , 2 , ... , [ w k ] } , y ∈ { 1 , 2 , ... , [ h k ] } ;
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
4.如权利要求1所述的目标检测方法,其特征在于,在所述构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,所述构造图像金字塔包括:
对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;
对于同一层尺度下的降采样,采用双三次插值的方式进行降采样。
5.如权利要求1所述的目标检测方法,其特征在于,所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
计算部分尺度的HOG特征;
在计算部分尺度的HOG特征之后,依据式7计算与其相邻的其他尺度的HOG特征;
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
6.如权利要求1所述的目标检测方法,其特征在于,所述计算梯度图像包括:
将输入图像转换为灰度格式;
使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像。
7.如权利要求1所述的目标检测方法,其特征在于,在所述计算梯度图像之后,还包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
8.一种目标检测装置,其特征在于,包括:图像金字塔构造单元、特征金字塔计算单元和目标位置确定单元;其中:
图像金字塔构造单元,适于构造图像金字塔;
特征金字塔计算单元,适于计算出图像金字塔所对应的基于HOG的特征金字塔;
目标位置确定单元,适于采用基于部件的变形模型和级联检测的方式对特征金字塔进行搜索,确定目标位置;
所述特征金字塔计算单元包括:HOG特征提取单元,适于提取HOG特征;
所述HOG特征提取单元包括:梯度图像计算单元、直方图统计单元和归一化和截断单元;其中:
梯度图像计算单元,适于计算梯度图像;
直方图统计单元,适于进行直方图统计;
归一化和截断单元,适于进行归一化和截断;
其中,所述归一化和截断单元包括:
查找表子单元,适于预先建立第一查找表,所述第一查找表将多个数值与它们各自的开方倒数对应保存;
梯度能量计算子单元,适于累积每一方向直方图的二阶范数,获得梯度能量图像;
HOG特征计算子单元,适于依据所述梯度能量图像和所述第一查找表,计算出HOG特征。
9.如权利要求8所述的目标检测装置,其特征在于,所述建立第一查找表包括:
形成的函数曲线;
基于所述函数曲线,采用分段拟合的方法获得多个数值与它们各自的开方倒数;
将多个数值与它们各自的开方倒数对应保存,形成第一查找表。
10.如权利要求8所述的目标检测装置,其特征在于,所述依据所述梯度能量图像和所述第一查找表,计算出HOG特征包括:
采用式8获得归一化图像的平方
式8: N δ , γ 2 ( x , y ) = G E ( x , y ) + G E ( x + δ , y ) + G E ( x , y + γ ) + G E ( x + δ , y + γ )
其中, δ , γ ∈ { - 1 , 1 } , x ∈ { 1 , 2 , ... , [ w k ] } , y ∈ { 1 , 2 , ... , [ h k ] } ;
依据所述第一查找表,获得归一化图像的平方对应的开方倒数 1 N δ , γ ( x , y ) ;
依据采用式5和式6计算出F1(x,y,m)和F2(x,y,(δ,γ));
式5: F 1 ( x , y , m ) = Σ δ , γ m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 1 )
式6: F 2 ( x , y , ( δ , γ ) ) = Σ m m i n ( H ( x , y , m ) N δ , γ ( x , y ) , T 2 )
其中,δ,γ∈{-1,1},m∈{1,2,...,M},T1、T2为对应的截断阈值;
依据F1(x,y,m)和F2(x,y,(δ,γ)),计算出HOG特征F=[F1,F2]。
11.如权利要求8所述的目标检测装置,其特征在于,在所述构造图像金字塔的过程中采用双线性插值和双三次插值这两种方式进行降采样,所述构造图像金字塔包括:
对于相差一个尺度的降采样,采用双线性插值的方式进行降采样;
对于同一层尺度下的降采样,采用双三次插值的方式进行降采样。
12.如权利要求8所述的目标检测装置,其特征在于,所述计算出图像金字塔所对应的基于HOG的特征金字塔包括:
计算部分尺度的HOG特征;
在计算部分尺度的HOG特征之后,依据式7计算与其相邻的其他尺度的HOG特征;
式7:FS≈R(F,S)·S
其中,F表示已知特征,FS表示所要求解的近似特征,S表示相对尺度,λ表示指数函数的系数,R函数表示以相对尺度S对已知特征F进行重采样。
13.如权利要求8所述的目标检测装置,其特征在于,所述计算梯度图像包括:
将输入图像转换为灰度格式;
使用一维中心模板P=[-1,0,1]和它的转置PT分别对灰度格式的输入图像进行滤波,分别计算出x,y方向的梯度图像。
14.如权利要求8所述的目标检测装置,其特征在于,在所述计算梯度图像之后,还包括:将梯度方向划分为M个方向,采用式2计算出梯度方向编码图像GO
式2: G O = [ M 2 π · tan - 1 ( G y G x ) ] mod M
其中,[]表示取整函数,mod表示取模函数,GO是{1,2,...,M}范围内的整数。
15.一种移动终端,其特征在于,包括如权利要求8至14中任一项所述的目标检测装置。
16.如权利要求15所述的移动终端,其特征在于,所述移动终端为智能手机或平板电脑。
CN201510375020.1A 2015-06-30 2015-06-30 移动终端及其目标检测方法及装置 Pending CN106326891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510375020.1A CN106326891A (zh) 2015-06-30 2015-06-30 移动终端及其目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510375020.1A CN106326891A (zh) 2015-06-30 2015-06-30 移动终端及其目标检测方法及装置

Publications (1)

Publication Number Publication Date
CN106326891A true CN106326891A (zh) 2017-01-11

Family

ID=57723148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510375020.1A Pending CN106326891A (zh) 2015-06-30 2015-06-30 移动终端及其目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN106326891A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920264A (zh) * 2017-03-01 2017-07-04 智擎信息系统(上海)有限公司 一种基于可形变部件模型算法的目标检测硬件结构
CN113361545A (zh) * 2021-06-18 2021-09-07 北京易航远智科技有限公司 图像特征提取方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194114A (zh) * 2011-06-25 2011-09-21 电子科技大学 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
CN103186790A (zh) * 2011-12-27 2013-07-03 北京三星通信技术研究有限公司 对象检测系统和方法
CN103778435A (zh) * 2014-01-16 2014-05-07 大连理工大学 一种基于视频的行人快速检测方法
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194114A (zh) * 2011-06-25 2011-09-21 电子科技大学 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
CN103186790A (zh) * 2011-12-27 2013-07-03 北京三星通信技术研究有限公司 对象检测系统和方法
CN103778435A (zh) * 2014-01-16 2014-05-07 大连理工大学 一种基于视频的行人快速检测方法
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNJIE YAN等: "《The Fastest Deformable Part Model for Object Detection》", 《2014 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
董盛: "《基于视频的行人快速检测方法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920264A (zh) * 2017-03-01 2017-07-04 智擎信息系统(上海)有限公司 一种基于可形变部件模型算法的目标检测硬件结构
CN106920264B (zh) * 2017-03-01 2020-07-24 智擎信息系统(上海)有限公司 一种基于可形变部件模型算法的目标检测硬件结构
CN113361545A (zh) * 2021-06-18 2021-09-07 北京易航远智科技有限公司 图像特征提取方法、装置、电子设备和存储介质
CN113361545B (zh) * 2021-06-18 2024-04-05 北京易航远智科技有限公司 图像特征提取方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108427924B (zh) 一种基于旋转敏感特征的文本回归检测方法
CN104778457B (zh) 基于多示例学习的视频人脸识别方法
CN111753828B (zh) 一种基于深度卷积神经网络的自然场景水平文字检测方法
CN106682569A (zh) 一种基于卷积神经网络的快速交通标识牌识别方法
CN101930549B (zh) 基于第二代曲线波变换的静态人体检测方法
CN105574534A (zh) 基于稀疏子空间聚类和低秩表示的显著性目标检测方法
CN103578093B (zh) 图像配准方法、装置及增强现实系统
CN110991444B (zh) 面向复杂场景的车牌识别方法及装置
CN105069807A (zh) 一种基于图像处理的冲压工件缺陷检测方法
CN102663401B (zh) 一种图像特征提取和描述方法
CN103810704A (zh) 基于支持向量机和判别随机场的sar图像变化检测方法
CN103984963B (zh) 一种高分辨率遥感图像场景分类方法
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
CN105550641B (zh) 基于多尺度线性差分纹理特征的年龄估计方法和系统
CN107480585A (zh) 基于dpm算法的目标检测方法
CN103208097A (zh) 图像多方向形态结构分组的主分量分析协同滤波方法
CN109614866A (zh) 基于级联深度卷积神经网络的人脸检测方法
CN110751195A (zh) 一种基于改进YOLOv3的细粒度图像分类方法
CN103839066A (zh) 一种源于生物视觉的特征提取方法
CN104021567B (zh) 基于首数字定律的图像高斯模糊篡改检测方法
CN103390170A (zh) 一种基于多光谱遥感图像纹理元的地物类型纹理分类方法
CN105405138A (zh) 基于显著性检测的水面目标跟踪方法
Yang et al. An efficient method for vehicle model identification via logo recognition
CN112884033A (zh) 一种基于卷积神经网络的生活垃圾分类检测方法
CN112329808A (zh) 一种Deeplab语义分割算法的优化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111