CN107145894B - 一种基于方向梯度特征学习的目标检测方法 - Google Patents

一种基于方向梯度特征学习的目标检测方法 Download PDF

Info

Publication number
CN107145894B
CN107145894B CN201710146530.0A CN201710146530A CN107145894B CN 107145894 B CN107145894 B CN 107145894B CN 201710146530 A CN201710146530 A CN 201710146530A CN 107145894 B CN107145894 B CN 107145894B
Authority
CN
China
Prior art keywords
gradient
directional
image block
image
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710146530.0A
Other languages
English (en)
Other versions
CN107145894A (zh
Inventor
郑慧诚
何娜
陈佳捷
罗子泉
朱睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEW ORIENT ELECTRONIC TECHNOLOGICAL ENGINEERING Co Ltd
National Sun Yat Sen University
Original Assignee
NEW ORIENT ELECTRONIC TECHNOLOGICAL ENGINEERING Co Ltd
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEW ORIENT ELECTRONIC TECHNOLOGICAL ENGINEERING Co Ltd, National Sun Yat Sen University filed Critical NEW ORIENT ELECTRONIC TECHNOLOGICAL ENGINEERING Co Ltd
Priority to CN201710146530.0A priority Critical patent/CN107145894B/zh
Publication of CN107145894A publication Critical patent/CN107145894A/zh
Application granted granted Critical
Publication of CN107145894B publication Critical patent/CN107145894B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

一种基于方向梯度特征学习的目标检测方法。本发明提供的方法以图像块中不同大小矩形区域内梯度大小之和为特征,基于boosting进行筛选,产生图像块的方向梯度特征,可替代手工设计的HOG特征。对不同目标的检测结果也表明,本发明所提出的方向梯度特征相对于传统的HOG特征能获得更好的检测效果。

Description

一种基于方向梯度特征学习的目标检测方法
技术领域
本发明涉及计算机视觉研究领域,更具体地,涉及一种基于方向梯度特征学习的目标检测方法。
背景技术
目标检测方法因应用广泛,一直是计算机视觉领域的研究热点。过去的十几年里,目标检测领域获得了巨大的发展,特别是在2001年Viola和Jones提出boosted cascade这样一个里程碑式的工作后,级联框架在目标检测中受到追捧。为了获取泛化性能强的级联目标检测器,需要在训练过程中投入更多的训练数据,对目标检测器而言,训练一般要求平均假阳率要低于10-6,意味着训练过程需要处理非常大量的非目标样本,时间花销巨大,容易使训练产生严重的瓶颈。现今绝大多数级联检测器框架的训练都是基于假阳率和真阳率两个标准的,但两个标准之间是相互矛盾的,限制了级联检测器每一级的收敛速度,如果要生成高质量的检测器一般需要训练几天甚至一周。因此有必要对目标检测器的训练过程进行优化,加快训练速度。
目标检测器设计中的另外一个关键因素是特征选择。传统的级联检测器训练通常采用人工设计的特征,如HOG描述子固定将每个图像块均分成4个矩形单元,这种固定模式的特征提取方式不能有针对性地凸显感兴趣目标,因此训练出来的检测器辨别目标的能力有限。当前较流行的深度学习方法,虽然能够发现并刻画目标内部复杂的结构特征,但是需要庞大的训练集,部署环境通常必须有GPU的支持,训练也相当耗时,难以快速地对不同目标的特征进行学习。
发明内容
本发明为解决以上现有技术的难题,提供了一种基于方向梯度特征学习的目标检测方法,该方法通过改进特征学习方式和训练过程,提高了检测器的精度,同时加快了级联目标检测器的训练速度。
为实现以上发明目的,采用的技术方案是:
一种基于方向梯度特征学习的目标检测方法,包括以下步骤:
(1).方向梯度特征学习
S1.采集N+个只含目标的图像区域和N-个不含目标的图像区域构成图像区域训练集X,在图像区域上每隔s个像素定义一个大小为w×h像素的图像块;
S2.对于训练集X中的每个图像区域,计算其每个像素点的梯度大小及方向;
S3.将梯度方向分成l个连续的方向区间,然后为每个图像区域生成l幅方向梯度图,其具体过程如下:
S31.对于方向区间g的方向梯度图,若图像区域某个位置像素点的梯度方向在方向区间g内,则该方向梯度图在相同位置的取值设为步骤S2计算得到的像素点的梯度大小,否则将该方向梯度图在此处的取值置为0;
S32.通过对每个像素点进行步骤S31的操作得到训练集X中每个图像区域在方向区间g的方向梯度图;
S33.通过对每个方向区间进行步骤S31、S32的操作得到训练集X中每个图像区域的l幅方向梯度图;
S4.对图像区域的每幅方向梯度图,基于S1中所述分块方式得到对应的方向梯度图像块集合;
S5.对于每个方向区间的方向梯度图像块集合,执行以下操作:
S51.从方向区间g的方向梯度图像块集合中选出若干方向梯度图像块形成方向梯度特征学习的训练集;
S52.设方向梯度图像块训练集为
Figure GDA0002309693240000021
其中N为训练集P中正样本、负样本的总数,xi表示第i个方向梯度图像块,yi表示第i个方向梯度图像块的类标;当xi属于正样本时,yi=1;当xi属于负样本时,yi=-1;设xi上包括有若干不同位置与大小的矩形区域,这些矩形区域的特征用矩形区域内的梯度大小之和来表示;令
Figure GDA0002309693240000022
表示第i个方向梯度图像块中第m个矩形区域的特征,m=1:M,M表示xi中所有的矩形区域的总数,对应的训练集P中每个方向梯度图像块都会得到M个矩形区域;
S53.初始化训练集P中所有样本的权重:w1,i=1/N,i=1,...,N;
S54.初始化迭代参数t=1;
S55.为方向梯度图像块中的各矩形区域训练弱分类器;
S56.计算每个弱分类器在训练集P中所有样本上的加权总误差,挑选出使加权总误差最小的弱分类器
Figure GDA0002309693240000023
Figure GDA0002309693240000031
Figure GDA0002309693240000032
其中hm表示基于训练集P中方向梯度图像块的第m个矩形区域训练得到的弱分类器,H表示所有矩形区域弱分类器的集合;δ(·)为指示函数,当其参数为真时函数值为1,否则函数值为0;
S57.计算
Figure GDA0002309693240000033
的权重αt
Figure GDA0002309693240000034
其中
Figure GDA0002309693240000035
表示最小的加权总误差;
S58.更新训练集P中所有样本的权重:
Figure GDA0002309693240000036
Figure GDA0002309693240000037
S59.令t=t+1然后重复执行步骤S55~S58,直至t>r;
S510.执行完毕步骤S59后将训练过程中选中的前r个弱分类器对应的矩形区域在方向梯度图像块中的位置进行输出;
S511.方向区间g的方向梯度图像块集合中的各个方向梯度图像块按照步骤S510输出的位置信息提取相应方向梯度图像块中的r个矩形区域;
S512.对各个方向区间的方向梯度图像块集合进行步骤S51~S511的操作,此时图像区域中各个图像块对应的l个方向区间的方向梯度图像块都分别提取有r个矩形区域,计算每个矩形区域内的梯度大小之和,最后图像块就可以用一个lr维的方向梯度特征向量表示;
(2).训练级联目标检测器
S6.设定全局的假阳率Ft及最小真阳率dmin,以及初始化级联次数j=1,初始化全局假阳率Fj=1.0,全局真阳率Dj=1.0;
S7.基于(1)中提取的方向梯度特征向量,为图像区域中的每个图像块训练弱分类器,以AUC为收敛准则进行若干次boosting迭代,每次迭代挑选出一个最优的弱分类器;
S8.采用Gentle Adaboost整合步骤S7选中的所有弱分类器得到强分类器Hj(x);
S9.利用Hj(x)预测训练集X中所有图像区域的得分,并生成ROC曲线;在ROC曲线上查找使dj=dmin的点(dj,fj),其中dj表示真阳率,fj表示假阳率;
S10.令j=j+1,然后更新Fj、Dj,Fj+1=Fj×fj,Dj+1=Dj×dj
S11.当Fj>Ft时,重复执行步骤S7-S11;Fj小于或等于Ft时,输出级联目标检测器;
(3).目标检测
S12.使用多个窗口扫描可能包含目标的待检测图像,提取每个扫描窗口的方向梯度特征;
S13.采用训练好的级联目标检测器对扫描窗口进行二分类检测,输出检测到的结果。
优选地,所述步骤S2计算每个像素点梯度大小及方向的具体过程如下:
Gp(p,q)=H(p+1,q)-H(p-1,q)
Gq(p,q)=H(p,q+1)-H(p,q-1)
其中,Gp(p,q)、Gq(p,q)、H(p,q)分别表示像素点(p,q)水平方向的梯度大小、垂直方向的梯度大小和像素值;
利用以下公式计算像素点(p,q)的梯度大小G(p,q)和方向α(p,q):
Figure GDA0002309693240000041
Figure GDA0002309693240000042
优选地,所述级联目标检测器为boosting级联目标检测器。
优选地,在进行目标检测时,若一幅图像中同一个目标被不同大小的窗口扫描并在二分类时都被判为候选目标的情况下,首先根据候选目标之间的相似度将所有候选目标划分成多个不相交的子集;对每个子集,分别统计子集内候选目标四个顶点的坐标的均值,输出为该子集所对应的最终检测结果框的四个顶点坐标。
优选地,所述步骤S7采用输出为概率值的逻辑回归函数作为弱分类器,其模型如下:
Figure GDA0002309693240000043
其中x表示图像块的lr维方向梯度特征向量,y为1或-1,当图像块所属图像区域包含目标时,y=1,当图像块所属图像区域不含目标时,y=-1,w是模型的权重向量,b是一个偏置项。
优选地,所述w、b通过最小化目标函数获得,目标函数如下:
Figure GDA0002309693240000051
xi表示训练集X中第i个图像区域在该图像块处的方向梯度特征向量,yi是xi对应的类标,yi等于1或-1;λ是用于调节正则项重要性的参数,
Figure GDA0002309693240000052
表示权重向量的lk范数,k=1,2。
与现有技术相比,本发明的有益效果是:
①现有的boosting级联检测器训练通常采用手工设计的HOG特征,不能充分适应实际的数据分布。本发明提供的方法以图像块中不同大小矩形区域内梯度大小之和为特征,基于boosting进行筛选,产生图像块的方向梯度特征,可替代手工设计的HOG特征。对不同目标的检测结果也表明,本发明所提出的方向梯度特征相对于传统的HOG特征能获得更好的检测效果。
②级联检测器中的每一级boosting分类器训练采用AUC作为收敛判据。这种优化方法避免了因FPR-HR指标相互冲突难以收敛的问题,极大地提升了训练速度,同时也保证了boosting分类器的质量。
③基于ROC曲线训练级联框架,不断更新每一级的FPR,使级联训练只需要经过6-9级就能完成收敛,加快了训练速度;而经典的级联检测器训练采用固定FPR,一般训练20级左右才可以收敛,容易让训练陷入瓶颈。
附图说明
图1为方向梯度特征学习的流程示意图。
图2为级联目标检测器的流程示意图。
图3为目标检测的流程示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
本发明提供的方法相较于传统的boosting级联方法,主要做出了两方面的优化,一是提出一种方向梯度特征学习方法,提高了特征对目标的自适应刻画能力;二是限制训练时使用的样本数量和改进训练过程的收敛准则,极大地缩短了训练时间。
如图1、2、3所示,本发明提供的基于方向梯度特征学习的目标检测方法包括以下步骤:
(1).方向梯度特征学习
S1.采集N+个只含目标的图像区域和N-个不含目标的图像区域构成图像区域训练集X,在图像区域上每隔s个像素定义一个大小为w×h像素的图像块;
S2.对于训练集X中的每个图像区域,计算其每个像素点的梯度大小及方向;
S3.将梯度方向分成l个连续的方向区间,然后为每个图像区域生成l幅方向梯度图,其具体过程如下:
S31.对于方向区间g的方向梯度图,若图像区域某个位置像素点的梯度方向在方向区间g内,则该方向梯度图在相同位置的取值设为步骤S2计算得到的像素点的梯度大小,否则将该方向梯度图在此处的取值置为0;
S32.通过对每个像素点进行步骤S31的操作得到训练集X中每个图像区域在方向区间g的方向梯度图;
S33.通过对每个方向区间进行步骤S31、S32的操作得到训练集X中每个图像区域的l幅方向梯度图;
S4.对图像区域的每幅方向梯度图,基于S1中所述分块方式得到对应的方向梯度图像块集合;
S5.对于每个方向区间的方向梯度图像块集合,执行以下操作:
S51.从方向区间g的方向梯度图像块集合中选出若干方向梯度图像块形成方向梯度特征学习的训练集;
S52.设方向梯度图像块训练集为
Figure GDA0002309693240000061
其中N为训练集P中正样本、负样本的总数,xi表示第i个方向梯度图像块,yi表示第i个方向梯度图像块的类标;当xi属于正样本时,yi=1;当xi属于负样本时,yi=-1;设xi上包括有若干不同位置与大小的矩形区域,这些矩形区域的特征用矩形区域内的梯度大小之和来表示;令
Figure GDA0002309693240000062
表示第i个方向梯度图像块中第m个矩形区域的特征,m=1:M,M表示xi中所有的矩形区域的总数,对应的训练集P中每个方向梯度图像块都会得到M个矩形区域;
S53.初始化训练集P中所有样本的权重:w1,i=1/N,i=1,...,N;
S54.初始化迭代参数t=1;
S55.为方向梯度图像块中的各矩形区域训练弱分类器;
S56.计算每个弱分类器在训练集P中所有样本上的加权总误差,挑选出使加权总误差最小的弱分类器
Figure GDA0002309693240000071
Figure GDA0002309693240000072
Figure GDA0002309693240000073
其中hm表示基于训练集P中方向梯度图像块的第m个矩形区域训练得到的弱分类器,H表示所有矩形区域弱分类器的集合;δ(·)为指示函数,当其参数为真时函数值为1,否则函数值为0;
S57.计算
Figure GDA0002309693240000074
的权重αt
Figure GDA0002309693240000075
其中
Figure GDA0002309693240000076
表示最小的加权总误差;
S58.更新训练集P中所有样本的权重:
Figure GDA0002309693240000077
Figure GDA0002309693240000078
S59.令t=t+1然后重复执行步骤S55~S58,直至t>r;
S510.执行完毕步骤S59后将训练过程中选中的前r个弱分类器对应的矩形区域在方向梯度图像块中的位置进行输出;
S511.方向区间g的方向梯度图像块集合中的各个方向梯度图像块按照步骤S510输出的位置信息提取相应方向梯度图像块中的r个矩形区域;
S512.对各个方向区间的方向梯度图像块集合进行步骤S51~S511的操作,此时图像区域中各个图像块对应的l个方向区间的方向梯度图像块都分别提取有r个矩形区域,计算每个矩形区域内的梯度大小之和,最后图像块就可以用一个lr维的方向梯度特征向量表示;
(2).训练级联目标检测器
S6.设定全局的假阳率Ft及最小真阳率dmin,以及初始化级联次数j=1,初始化全局假阳率Fj=1.0,全局真阳率Dj=1.0;
S7.基于(1)中提取的方向梯度特征向量,为图像区域中的每个图像块训练弱分类器,以AUC为收敛准则进行若干次boosting迭代,每次迭代挑选出一个最优的弱分类器;
S8.采用Gentle Adaboost整合步骤S7选中的所有弱分类器得到强分类器Hj(x);
S9.利用Hj(x)预测训练集X中所有图像区域的得分,并生成ROC曲线;在ROC曲线上查找使dj=dmin的点(dj,fj),其中dj表示真阳率,fj表示假阳率;
S10.令j=j+1,然后更新Fj、Dj,Fj+1=Fj×fj,Dj+1=Dj×dj
S11.当Fj>Ft时,重复执行步骤S7-S11;Fj小于或等于Ft时,输出级联目标检测器;
(3).目标检测
S12.使用多个窗口扫描可能包含目标的待检测图像,提取每个扫描窗口的方向梯度特征;
S13.采用训练好的级联目标检测器对扫描窗口进行二分类检测,输出检测到的结果。
在具体的实施过程中,所述步骤S2计算每个像素点梯度大小及方向的具体过程如下:
Gp(p,q)=H(p+1,q)-H(p-1,q)
Gq(p,q)=H(p,q+1)-H(p,q-1)
其中,Gp(p,q)、Gq(p,q)、H(p,q)分别表示像素点(p,q)水平方向的梯度大小、垂直方向的梯度大小和像素值;
利用以下公式计算像素点(p,q)的梯度大小G(p,q)和方向α(p,q):
Figure GDA0002309693240000081
Figure GDA0002309693240000082
在具体的实施过程中,所述级联目标检测器为boosting级联目标检测器。
在具体的实施过程中,在进行目标检测时,若一幅图像中同一个目标被不同大小的窗口扫描并在二分类时都被判为候选目标的情况下,首先根据候选目标之间的相似度将所有候选目标划分成多个不相交的子集;对每个子集,分别统计子集内候选目标四个顶点的坐标的均值,输出为该子集所对应的最终检测结果框的四个顶点坐标。
在具体的实施过程中,所述步骤S7采用输出为概率值的逻辑回归函数作为弱分类器,其模型如下:
Figure GDA0002309693240000091
其中x表示图像块的lr维方向梯度特征向量,y为1或-1,当图像块所属图像区域包含目标时,y=1,当图像块所属图像区域不含目标时,y=-1,w是模型的权重向量,b是一个偏置项。
在具体的实施过程中,所述w、b通过最小化目标函数获得,目标函数如下:
Figure GDA0002309693240000092
xi表示训练集X中第i个图像区域在该图像块处的方向梯度特征向量,yi是xi对应的类标,yi等于1或-1;λ是用于调节正则项重要性的参数,
Figure GDA0002309693240000093
表示权重向量的lk范数,k=1,2。
实施例2
用实施例1的方法分别训练了针对人脸(正面和半侧面)、车辆(侧视图)和车标的级联检测器,并使用训练好的检测器进行了目标检测实验。
人脸级联检测器在训练过程中收集了12102幅正面和半侧面的人脸图像,这些图像主要来自GENKI、facetracer和FERET三个公开数据集;收集了8000幅没有人脸的图像作为非目标图像,这部分图像主要来自Caltech101和Corel 5k公开数据集。所有目标图像统一归一化为40×40像素大小,级联目标检测器中每个弱分类器训练时,采用轮盘赌算法分别选择1060个正样本和负样本构成有效的训练子集,式(11)的正则项选择l1范数。级联分类器的训练在第6级收敛,用时仅3个小时。在相同的训练集上,使用OpenCV提供的HOGboosting模型训练人脸检测器,第20级才完成收敛,训练时间长达2天,可见本发明提供的方法大大降低了训练时间;另外尝试了用常规的HOG特征代替本发明所提出的基于学习的方向梯度特征进行训练,也是在第6级收敛,但耗费了12个小时。在测试阶段,从FDDB数据库中挑选了1385幅图像(总共2178个正面和半侧面的人脸)组成测试集,分别对三个人脸检测器进行评估,检测结果如表1所示。
表1基于三种方法训练的人脸级联检测器检测结果对比
Figure GDA0002309693240000101
从上述实验结果可知,在基于学习的方向梯度特征上训练得到的级联检测器检测成功率比在常规HOG特征上训练得到的检测器高1.9%,误检的数量也更少;而相比经典的HOG boosting模型,检测成功率高出了3.3%。
在车辆级联检测器的训练中,从PASCALVOC 2005数据库(包括UIUC和ETHZ数据库)和PASCALVOC 2007中收集了200幅车辆的侧视图作为目标图像;非目标图像来自Caltech101和Corel 5k公开数据集,总共5000幅。所有目标图像统一归一化为80×32像素大小,使用的参数与人脸检测器训练过程一致。车辆级联检测器的训练在第6级收敛,用时39分钟。为了与文献[1]提出的基于SURF特征的boosting级联检测器的实验结果进行对比,从PASCAL VOC 2005的TUGRAZ数据库里抽取了200幅近似侧视的车辆图像作为测试集,对本发明方法训练的检测器进行评估,检测结果如表2所示。
表2.基于两种方法训练的车辆级联检测器检测结果对比
Figure GDA0002309693240000102
从实验结果可以看到,在相同的数据集上,本发明的方法训练的车辆级联检测器具有更高的检测成功率,同时也保持着较低的误检率。
车标级联检测器训练,主要针对27种类别的车辆标志,样本绝大部分取自高速公路拍摄的车辆,少部分取自白天停车场,包括1155幅车标图像,2587幅无车标的非目标图像。级联检测器的训练在第6级收敛,用时85分钟;OpenCV所提供的经典HOG boosting模型训练在第24级收敛,耗时超过2天。测试集由不同环境和光照条件下收集的4011幅含车标的图像组成,检测对比结果如表3所示。
表3.基于两种方法训练的车标级联检测器检测结果对比
Figure GDA0002309693240000111
对比两种方法对车标的训练和检测结果,可见本发明提出的方法,不仅在训练速度上取得了绝对的优势,检测成功率相比OpenCV中经典的HOG boosting模型也有较大的提升。
参考文献:
[1]Jianguo Li and Yimin Zhang.Learning SURF Cascade for Fast andAccurate Object Detection.In CVPR,2013.
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种基于方向梯度特征学习的目标检测方法,其特征在于:包括以下步骤:
(1).方向梯度特征学习
S1.采集N+个只含目标的图像区域和N-个不含目标的图像区域构成图像区域训练集X,在图像区域上每隔s个像素定义一个大小为w×h像素的图像块;
S2.对于训练集X中的每个图像区域,计算其每个像素点的梯度大小及方向;
S3.将梯度方向分成l个连续的方向区间,然后为每个图像区域生成l幅方向梯度图,其具体过程如下:
S31.对于方向区间g的方向梯度图,若图像区域某个位置像素点的梯度方向在方向区间g内,则该方向梯度图在相同位置的取值设为步骤S2计算得到的像素点的梯度大小,否则将该方向梯度图在此处的取值置为0;
S32.通过对每个像素点进行步骤S31的操作得到训练集X中每个图像区域在方向区间g的方向梯度图;
S33.通过对每个方向区间进行步骤S31、S32的操作得到训练集X中每个图像区域的l幅方向梯度图;
S4.对图像区域的每幅方向梯度图,基于S1中所述分块方式得到对应的方向梯度图像块集合;
S5.对于每个方向区间的方向梯度图像块集合,执行以下操作:
S51.从方向区间g的方向梯度图像块集合中选出若干方向梯度图像块形成方向梯度特征学习的训练集;
S52.设方向梯度图像块训练集为
Figure FDA0002309693230000011
其中N为训练集P中正样本、负样本的总数,xi表示第i个方向梯度图像块,yi表示第i个方向梯度图像块的类标;当xi属于正样本时,yi=1;当xi属于负样本时,yi=-1;设xi上包括有若干不同位置与大小的矩形区域,这些矩形区域的特征用矩形区域内的梯度大小之和来表示;令
Figure FDA0002309693230000012
表示第i个方向梯度图像块中第m个矩形区域的特征,m=1:M,M表示xi中所有的矩形区域的总数,对应的训练集P中每个方向梯度图像块都会得到M个矩形区域;
S53.初始化训练集P中所有样本的权重:w1,i=1/N,i=1,...,N;
S54.初始化迭代参数t=1;
S55.为方向梯度图像块中的各矩形区域训练弱分类器;
S56.计算每个弱分类器在训练集P中所有样本上的加权总误差,挑选出使加权总误差最小的弱分类器
Figure FDA0002309693230000021
Figure FDA0002309693230000022
Figure FDA0002309693230000023
其中hm表示基于训练集P中方向梯度图像块的第m个矩形区域训练得到的弱分类器,H表示所有矩形区域弱分类器的集合;δ(·)为指示函数,当其参数为真时函数值为1,否则函数值为0;
S57.计算
Figure FDA0002309693230000024
的权重αt
Figure FDA0002309693230000025
其中
Figure FDA0002309693230000026
表示最小的加权总误差;
S58.更新训练集P中所有样本的权重:
Figure FDA0002309693230000027
Figure FDA0002309693230000028
S59.令t=t+1然后重复执行步骤S55~S58,直至t>r;
S510.执行完毕步骤S59后将训练过程中选中的前r个弱分类器对应的矩形区域在方向梯度图像块中的位置进行输出;
S511.方向区间g的方向梯度图像块集合中的各个方向梯度图像块按照步骤S510输出的位置信息提取相应方向梯度图像块中的r个矩形区域;
S512.对各个方向区间的方向梯度图像块集合进行步骤S51~S511的操作,此时图像区域中各个图像块对应的l个方向区间的方向梯度图像块都分别提取有r个矩形区域,计算每个矩形区域内的梯度大小之和,最后图像块就可以用一个lr维的方向梯度特征向量表示;
(2).训练级联目标检测器
S6.设定全局的假阳率Ft及最小真阳率dmin,以及初始化级联次数j=1,初始化全局假阳率Fj=1.0,全局真阳率Dj=1.0;
S7.基于(1)中提取的方向梯度特征向量,为图像区域中的每个图像块训练弱分类器,以AUC为收敛准则进行若干次boosting迭代,每次迭代挑选出一个最优的弱分类器;
S8.采用Gentle Adaboost整合步骤S7选中的所有弱分类器得到强分类器Hj(x);
S9.利用Hj(x)预测训练集X中所有图像区域的得分,并生成ROC曲线;在ROC曲线上查找使dj=dmin的点(dj,fj),其中dj表示真阳率,fj表示假阳率;
S10.令j=j+1,然后更新Fj、Dj,Fj+1=Fj×fj,Dj+1=Dj×dj
S11.当Fj>Ft时,重复执行步骤S7-S11;Fj小于或等于Ft时,输出级联目标检测器;
(3).目标检测
S12.使用多个窗口扫描可能包含目标的待检测图像,提取每个扫描窗口的方向梯度特征;
S13.采用训练好的级联目标检测器对扫描窗口进行二分类检测,输出检测到的结果。
2.根据权利要求1所述的基于方向梯度特征学习的目标检测方法,其特征在于:所述步骤S2计算每个像素点梯度大小及方向的具体过程如下:
Gp(p,q)=H(p+1,q)-H(p-1,q)
Gq(p,q)=H(p,q+1)-H(p,q-1)
其中,Gp(p,q)、Gq(p,q)、H(p,q)分别表示像素点(p,q)水平方向的梯度大小、垂直方向的梯度大小和像素值;
利用以下公式计算像素点(p,q)的梯度大小G(p,q)和方向α(p,q):
Figure FDA0002309693230000031
Figure FDA0002309693230000032
3.根据权利要求1所述的基于方向梯度特征学习的目标检测方法,其特征在于:所述级联目标检测器为boosting级联目标检测器。
4.根据权利要求1所述的基于方向梯度特征学习的目标检测方法,其特征在于:在进行目标检测时,若一幅图像中同一个目标被不同大小的窗口扫描并在二分类时都被判为候选目标的情况下,首先根据候选目标之间的相似度将所有候选目标划分成多个不相交的子集;对每个子集,分别统计子集内候选目标四个顶点的坐标的均值,输出为该子集所对应的最终检测结果框的四个顶点坐标。
5.根据权利要求1所述的基于方向梯度特征学习的目标检测方法,其特征在于:所述步骤S7采用输出为概率值的逻辑回归函数作为弱分类器,其模型如下:
Figure FDA0002309693230000041
其中x表示图像块的lr维方向梯度特征向量,y为1或-1,当图像块所属图像区域包含目标时,y=1,当图像块所属图像区域不含目标时,y=-1,w是模型的权重向量,b是一个偏置项。
6.根据权利要求5所述的基于方向梯度特征学习的目标检测方法,其特征在于:所述w、b通过最小化目标函数获得,目标函数如下:
Figure FDA0002309693230000042
xi表示训练集X中第i个图像区域在该图像块处的方向梯度特征向量,yi是xi对应的类标,yi等于1或-1;λ是用于调节正则项重要性的参数,
Figure FDA0002309693230000043
表示权重向量的lk范数,k=1,2。
CN201710146530.0A 2017-03-13 2017-03-13 一种基于方向梯度特征学习的目标检测方法 Active CN107145894B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710146530.0A CN107145894B (zh) 2017-03-13 2017-03-13 一种基于方向梯度特征学习的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710146530.0A CN107145894B (zh) 2017-03-13 2017-03-13 一种基于方向梯度特征学习的目标检测方法

Publications (2)

Publication Number Publication Date
CN107145894A CN107145894A (zh) 2017-09-08
CN107145894B true CN107145894B (zh) 2020-03-13

Family

ID=59783799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710146530.0A Active CN107145894B (zh) 2017-03-13 2017-03-13 一种基于方向梯度特征学习的目标检测方法

Country Status (1)

Country Link
CN (1) CN107145894B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934242A (zh) * 2017-12-15 2019-06-25 北京京东尚科信息技术有限公司 图片识别方法和装置
CN109886117A (zh) * 2019-01-21 2019-06-14 青岛海信网络科技股份有限公司 一种目标行为检测的方法和设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301104A (ja) * 2008-06-10 2009-12-24 Chube Univ 物体検出装置
CN103034852A (zh) * 2012-12-28 2013-04-10 上海交通大学 静止摄像机场景下特定颜色行人的检测方法
KR20130058286A (ko) * 2011-11-25 2013-06-04 한국전자통신연구원 보행자 검출기의 보행자 검출 방법
CN103530610A (zh) * 2013-10-12 2014-01-22 智博锐视(北京)科技有限公司 目标检测方法和装置
CN103679677A (zh) * 2013-12-12 2014-03-26 杭州电子科技大学 一种基于模型互更新的双模图像决策级融合跟踪方法
CN105787470A (zh) * 2016-03-25 2016-07-20 黑龙江省电力科学研究院 一种基于聚合多通道特征对图像中输电线路杆塔进行检测的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301104A (ja) * 2008-06-10 2009-12-24 Chube Univ 物体検出装置
KR20130058286A (ko) * 2011-11-25 2013-06-04 한국전자통신연구원 보행자 검출기의 보행자 검출 방법
CN103034852A (zh) * 2012-12-28 2013-04-10 上海交通大学 静止摄像机场景下特定颜色行人的检测方法
CN103530610A (zh) * 2013-10-12 2014-01-22 智博锐视(北京)科技有限公司 目标检测方法和装置
CN103679677A (zh) * 2013-12-12 2014-03-26 杭州电子科技大学 一种基于模型互更新的双模图像决策级融合跟踪方法
CN105787470A (zh) * 2016-03-25 2016-07-20 黑龙江省电力科学研究院 一种基于聚合多通道特征对图像中输电线路杆塔进行检测的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Adaboost Learning for Human Detection Based on Histograms of Oriented Gradients;Chi-Chen Raxle Wang 等;《ACCV"07 Proceeding of the 8th Asian Conference on Computer Vision》;20071122;第885-895页 *
Facial Ethnicity Classification based on Boosted Local Texture and Shape Descriptions;Huaxiong Ding 等;《2013 10th IEEE International Conference and Workshops on Automatic Face and Gesture Recognition(FG)》;20130715;第1-6页 *
Learning SURF Cascade for Fast and Accurate Object Detection;Jianguo Li 等;《CVPR 2013》;20131231;第3468-3475页 *
基于方向梯度直方图的高效人头检测及其在智能监控系统中的应用;党路;《中国优秀硕士学位论文全文数据库信息科技辑》;20130715;第I138-1360页 *

Also Published As

Publication number Publication date
CN107145894A (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
CN106997597B (zh) 一种基于有监督显著性检测的目标跟踪方法
CN107316036B (zh) 一种基于级联分类器的害虫识别方法
CN108229550B (zh) 一种基于多粒度级联森林网络的云图分类方法
CN107633226B (zh) 一种人体动作跟踪特征处理方法
WO2018052587A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN111695514B (zh) 一种基于深度学习的雾天下车辆检测方法
Xiao et al. A fast method for particle picking in cryo-electron micrographs based on fast R-CNN
CN111540006B (zh) 基于深度迁移学习的植物气孔智能检测与识别方法及系统
CN107729812B (zh) 一种适用于监控场景中的车辆颜色识别的方法
CN111368660A (zh) 一种单阶段半监督图像人体目标检测方法
CN108154158B (zh) 一种面向增强现实应用的建筑物图像分割方法
CN114067444A (zh) 基于元伪标签和光照不变特征的人脸欺骗检测方法和系统
CN111898627B (zh) 一种基于pca的svm云微粒子优化分类识别方法
CN111967511A (zh) 一种基于异构特征融合网络的地基云图分类方法
CN110956158A (zh) 一种基于教师学生学习框架的遮挡行人再标识方法
CN111382690A (zh) 基于多损失融合模型的车辆再识别方法
CN107145894B (zh) 一种基于方向梯度特征学习的目标检测方法
Yi et al. Fast neural cell detection using light-weight SSD neural network
CN104200226B (zh) 基于机器学习的粒子滤波目标跟踪方法
CN114550134A (zh) 基于深度学习的交通标志检测与识别方法
CN107679467B (zh) 一种基于hsv和sdalf的行人重识别算法实现方法
CN116883741A (zh) 一种基于金字塔注意力机制的小样本虫害检测方法
CN112347967A (zh) 一种复杂场景下融合运动信息的行人检测方法
CN115063679B (zh) 一种基于深度学习的路面质量评估方法
CN111046861B (zh) 识别红外影像的方法、构建识别模型的方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant