CN105760858A - 一种基于类Haar中间层滤波特征的行人检测方法及装置 - Google Patents
一种基于类Haar中间层滤波特征的行人检测方法及装置 Download PDFInfo
- Publication number
- CN105760858A CN105760858A CN201610160605.6A CN201610160605A CN105760858A CN 105760858 A CN105760858 A CN 105760858A CN 201610160605 A CN201610160605 A CN 201610160605A CN 105760858 A CN105760858 A CN 105760858A
- Authority
- CN
- China
- Prior art keywords
- template
- rectangle
- weights
- channel characteristics
- pedestrian detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于类Haar中间层滤波特征的行人检测方法。首先提取训练图像集中各训练图像的目标特征,并用所提取的目标特征数据对基于决策树的Adaboost分类器进行训练,得到分类模型;然后提取待检测图像在多个尺度下的目标特征并输入所述分类模型,得到行人检测结果;目标特征的提取方法具体如下:对原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;对各通道特征图分别进行降采样;对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;将该原始图像的所有类Haar特征聚合为该原始图像的目标特征。本发明还公开了一种基于类Haar中间层滤波特征的行人检测。本发明可有效提高行人检测性能。
Description
技术领域
本发明涉及模式识别、图像处理和计算机视觉相交叉的技术领域,尤其涉及一种基于类Harr(Haar-like)中间层滤波特征的行人检测方法及装置。
背景技术
随着计算机视觉技术的发展,行人检测技术成为了现阶段乃至今后很长一段时间的研究热点。行人检测可以分为运动中的行人检测(或者称为目标跟踪),与静态图片中的行人检测,即本发明所研究的静态图片中的行人检测。静态图片中的行人检测,就是使用计算机对给定的单张图像或是视频中的某一帧,判断其中是否包含行人,如果包含行人还需要进一步定位出行人位置的一个过程。行人检测是对人体进行步态分析,行为识别以及跟踪等研究的前提和基础。因此如何能为后者的研究提供有力的保障和支持,是行人检测研究领域所要思考和亟待解决的问题。行人检测技术在社会中的需求量日趋加大,应用范围、场景也不断拓展。行人检测技术在智能监控系统、智能汽车系统、行人流量统计、行人分析以及智能机器人、智能家居等领域均有着广泛的应用前景。相信以后只要有人存在的场景,以及给人提供服务、需要对人进行安全保护和管理的地方,都会需要行人检测技术。
积分通道特征(IntegralChannelFeatures,ICF)是一种组合型行人描述特征,是在2009年由Dollar等人[DollárP,TuZ,PeronaP,etal.IntegralChannelFeatures[C].BMVC.2009,2(3):5.]提出的。ICF特征是在多个通道上进行行人特征提取,包括LUV颜色通道,若干梯度方向直方图通道以及梯度幅值通道。由于其从不同角度更加全面的对行人进行描述,使得其检测性能相比传统检测方法有了一定提升。但是一方面由于ICF特征选择的随机性较强,使得其检测性能不能够得到保证;另一方面ICF特征池的维数过高使得其检测精度和检测速度不能得到很好地平衡。鉴于此,在2014年Dollar等人[DollárP,AppelR,BelongieS,etal.Fastfeaturepyramidsforobjectdetection[J].PatternAnalysisandMachineIntelligence,IEEETransactionson,2014,36(8):1532-1545.]在ICF特征的基础之上又提出了更为高效的聚合通道特征(AggregatedChannelFeatures,ACF)。ACF特征仍然使用通道特征作为先验特征,所使用的通道同ICF特征。其计算流程如图1所示,对于输入图像I,先计算各通道特征C=Ω(I);对各通道特征图做降采样处理;对降采样之后的通道特征图做平滑滤波处理;对之后的各特征图中的特征点进行向量化生成最终的目标特征向量ACF特征。该特征相比ICF特征有一下两点变化:1、特征维数大大降低;2、特征信息更佳全面,这里每一个特征点作为一个候选特征。
上述基于ACF特征的行人检测方法虽然可以从总体上描述行人信息,也取得了较好的检测效果,但由于该算法缺乏对人体局部结构特征的描述,使得该算法在过滤一些非行人检测窗口上还有进一步的改进空间。如果能够更加全面地描述人体结构的局部特征,则可更全面地过滤掉一些非行人检测窗口,进而提升检测性能。
发明内容
本发明所要解决的技术问题在于克服现有技术不足,提供一种基于类Harr中间层滤波特征的行人检测方法及装置,能够有效降低行人漏检率及误检率,提高行人检测性能。
本发明技术方案具体如下:
一种基于类Haar中间层滤波特征的行人检测方法,首先提取训练图像集中各训练图像的目标特征,并用所提取的目标特征数据对基于决策树的Adaboost分类器进行训练,得到分类模型;然后提取待检测图像在多个尺度下的目标特征并输入所述分类模型,得到行人检测结果;所述目标特征的提取方法具体如下:对原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;对各通道特征图分别进行降采样;对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;将该原始图像的所有类Haar特征聚合,得到该原始图像的目标特征。
一种基于类Haar中间层滤波特征的行人检测装置,包括:
多尺度变化模块,用于对输入的待检测图像进行多尺度变换;
目标特征提取模块,用于提取多尺度变化模块输出的每一个尺度图像的目标特征;分类模型,用于根据目标特征提取模块所输入的目标特征对待检测图像进行行人检测,该分类模型通过对基于决策树的Adaboost分类器进行训练得到;
所述目标特征提取模块包括:
通道特征提取模块,用于对输入的原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;
降采样模块,用于对通道特征提取模块所输入的每一幅通道特征图进行降采样处理;
类Haar特征提取模块,用于对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;
特征聚合模块,用于将类Haar特征提取模块所提取的原始图像的所有类Haar特征聚合为目标特征。
本发明技术方案中,所采用的类Haar特征模板会直接影响行人检测的性能及检测效率;优选地,所述一组预设的类Haar特征模板包括7个矩形模板,具体如下:
模板1:1×1的矩形模板,单个矩形框的权值为1;
模板2:2×1的矩形模板,两个矩形框的权值分别为1、-1;
模板3:1×2的矩形模板,两个矩形框的权值分别为1、-1;
模板4、2×2的矩形模板,其中4个矩形框的权值均为0.25;
模板5:2×2的矩形模板,其中一列中的两个矩形框的权值均为0.5,另外一列中的两个矩形框的权值均为-0.5;
模板6、2×2的矩形模板,其中一行中的两个矩形框的权值均为0.5,另外一行中的两个矩形框的权值均为-0.5;
模板7:2×2的矩形模板,其中两个对角矩形框的权值均为0.5,另外两个对角矩形框的权值均为-0.5。
相比现有技术,本发明具有以下有益效果:
本发明借鉴了基于ACF特征的行人检测方法,利用多个通道特征作为底层特征,使用一组Haar-like模板对其进行滤波提取Haar-like中间层特征作为目标特征,结合Adaboost分类器,利用级联分类的思想进行行人检测。可在保证漏检率的同时大大降低行人误检率,本发明能够很好地过滤非行人窗口,提高行人检测的效率。
附图说明
图1为ACF特征提取的原理示意图;
图2为本发明行人检测方法的流程示意图;
图3为通道特征图示例;
图4为本发明优选的类Haar特征模板;
图5为目标特征提取的原理示意图;
图6为分类器的分类过程示意图;
图7为本发明方法与基于ACF特征行人检测算法的实际检测结果对比。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
本发明的思路是对基于ACF特征的行人检测方法进行改进,以ACF特征作为底层特征,利用Haar-like模板对其进行滤波提取Haar-like中间层特征作为目标特征,结合Adaboost分类器,利用级联分类的思想进行行人检测,以提高行人检测的性能。具体是先提取图像的多个不同的通道特征并进行降采样,然后利用一组预设的类Haar特征模板分别提取各通道特征的相应类Haar特征;最后将所有类Haar特征聚合,得到最终的目标特征;以所提取的目标特征作为基于决策树的Adaboost分类器的输入进行学习训练,并利用训练好的分类器对待检测图像进行多尺度的分类检测,从而得到更准确的行人检测结果。
本发明行人检测方法的基本流程如图2所示,包括训练阶段和检测阶段,其中训练阶段具体如下:
步骤1、提取训练图像集中各训练图像的多个通道特征:
通道特征的选取可参照ICF特征和ACF特征的提取方法,可以如ACF特征一样选择原始图像的梯度幅值特征、LUV颜色空间的三个通道特征,以及六个方向的梯度方向直方图特征,共十个通道特征;也可以选取其他的特征作为通道特征,例如HSV颜色空间的各通道特征、Canny边缘特征、LBP(LocalBinaryPatterns,局部二值模式)特征等。本发明优选采用ACF特征提取所采用的通道特征选择方案。
提取出各通道特征后,即可得到相应的通道特征图。图2显示了同一图像的一组通道特征图,其中,第一行从左到右依次为:原图、梯度幅值特征图、六个方向的梯度方向直方图特征;第二行从左到右依次为:LUV颜色空间的L、U、V三个通道特征图,HSV颜色空间的H、S、V通道特征图,以及Canny边缘特征图、LBP特征图。
步骤2、对各通道特征图进行降采样,其中降采样因子优选的值为4。
步骤3、利用一组预设的Haar-like特征模板对各通道特征图分别进行过滤提取中间层特征,每一个模板的滑动步距为一个特征点:
Haar-like特征是计算机视觉领域一种常用的特征描述符。它最初提出是用于人脸描述的,Viola等人套用了其用在人脸上的方法并扩展了Haar-like特征使其应用于行人检测,具体细节可参见文献[ViolaP,JonesM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C].ComputerVisionandPatternRecognition.Proceedingsofthe2001IEEEComputerSocietyConferenceon,2001,1:I-511-I-518.]。
Haar-like特征模板会直接对算法的检测效果、检测效率产生影响,因此Haar-like特征模板组合的设计至关重要。为了平衡检测性能与检测效率,本发明构建了T1~T7的一组Haar-like特征模板来进行中间层特征的提取,这一组Haar-like特征模板的具体结构如图4所示:模板T1为1×1的矩形模板,其中单个矩形框的权值为1;模板T2为2×1的矩形模板,两个矩形框的权值分别为1、-1;模板T3为1×2的矩形模板,两个矩形框的权值分别为1、-1;模板T4为2×2的矩形模板,其中4个矩形框的权值均为0.25;模板T5为2×2的矩形模板,其中一列中的两个矩形框的权值均为0.5,另外一列中的两个矩形框的权值均为-0.5;模板T6为2×2的矩形模板,其中一行中的两个矩形框的权值均为0.5,另外一行中的两个矩形框的权值均为-0.5;模板T7为2×2的矩形模板,其中两个对角矩形框的权值均为0.5,另外两个对角矩形框的权值均为-0.5。
假设原始图像的大小为64×128,其通道特征图经降采样(降采样因子为4)后的大小为16×32,用T1~T7的7个模板分别对降采样后的十个通道特征图进行滤波提取中间层特征,则每个模板在各通道特征图中对应的特征维数如下表1所示,单一通道特征图利用7个模板所提取的中间层特征可整合为3348维的特征向量。其中每个模板在图的宽度和高度方向的滑动步距是一个矩形框大小,即通道特征图中的一个特征点大小。图5以例举的形式描述了模板T4在通道1特征图上的中间层特征生成过程。
表1模板特征(滤波特征)描述
步骤4、将所有通道特征图的中间层特征向量聚合为最终的目标特征向量;对于本实施例而言,最终的目标特征维数为33480,如图5所示。
步骤5、把目标特征向量送入基于决策树的Adaboost分类器进行训练,得到分类器模型。
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些Adaboost弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特征,并放在关键的训练数据上面。AdaBoost算法解决了早期Boosting算法在实际应用中的缺陷,它不必事先知道有关弱学习的先验知识,但是其效率却可以和原来的Boosting算法一样。基于决策树的Adaboost分类器相关内容可参见文献[赵敏,陈恩红,宋睿.基于集成学习的Adaboost演化决策树算法[J].计算机应用与软件,2007,24(3):1-2.]
完成分类模型的训练之后即可用其进行检测,检测阶段具体如下:
步骤6、对于输入的待检测原始图像进行多尺度缩放;即按照一定比例逐层缩小图像的尺寸以致固定大小的检测窗口能够检测出原图像中更大尺度的行人。对于原始图像进行逐层缩小时,当图像的长或者宽缩小至检测窗口大小时,便停止缩小分层。本发明优选的缩小比例是0.75,即当前层图像是上一层图像的0.75倍。
步骤7、对每一层的尺度图像分别进行扫描检测,进而得到最终的行人检测结果:
对于某一层图像使用窗口滑动的方式进行扫描检测,按照与训练阶段相同的方法提取检测窗口的目标特征作为待测特征,然后利用已经训练好的分类模型对其进行分类判别。在检测时,如图6所示,逐个计算每一级强分类器中新增弱分类器的判别结果,并与之前的结构累加得到Ht。把得到的结果与阈值cascThr=-1最对比,如果Ht小于cascThr,则判为负,否则继续下一级的比较。行人检测即是判断待检测图像中是否包含行人,如果检测出待检测图像中包含行人,则可进一步确定行人在图像中的位置。
为了验证本发明方法的有效性,我们在INRIA行人数据库以及Caltech行人数据库上进行多组实验,INRIA行人数据库是目前使用最多的静态行人检测数据库,提供原始图片及相应的标注文件。训练集有正样本614张(包含1237个行人标注),负样本1218张;测试集有正样本288张(包含1126个行人标注),负样本453张。图片中行人大部分呈站立姿势且高度100像素左右。图片主要来源于GRAZ-01、个人照片及google,因此图片的清晰度较高。
下面以INRIA数据集为例,来说明对训练样本的处理方式。固定尺度(64×128)的正训练样本获取使用ACF特征中的方法,其中正样本数为2474。在本实验中使用了四轮循环训练分类器,其中每轮中的弱分类器个数:weak=[321285122048],最后训练得到2048个弱分类器。在首轮循环中,负样本是从1218张原始负训练样本随机选取5000个固定大小的负样本。在首轮训练完成之后,使用第一轮训练的model1对原始数据集中1218张大图进行预测,误检为行人的窗口标记为hardnegativesample,选取5000hardnegativesample加入到下一轮循环训练的负样本中,再从上一轮的负训练样本中随机选取5000个加入,下一轮循环负训练样本增加至10000个。之后的各轮循环训练中的负样本获取方式类似,均使用更新后的10000个,而正样本一直不变。训练结束之后,对训练模型进行评估的测试样本使用是INRIA中的288张正测试样本,其中图片尺寸均大于检测窗口,存在包含行人和不包含行人的区域,所以可以直接拿来测试评估,无需再选负测试样本。
表2显示了本发明方法与几种现有行人检测算法的精度对比结果。实验中用于对比的现有行人检测算法包括:
(1)VJ[ViolaP,JonesM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C].ComputerVisionandPatternRecognition.Proceedingsofthe2001IEEEComputerSocietyConferenceon,2001,1:I-511-I-518.]
(2)HOG[DalalN,TriggsB.Histogramsoforientedgradientsforhumandetection[C].ComputerVisionandPatternRecognition.IEEEComputerSocietyConferenceon,2005,1:886-893]
(3)LatSvm-V1[FelzenszwalbP,McAllesterD,RamananD.Adiscriminativelytrained,multiscale,deformablepartmodel[C].ComputerVisionandPatternRecognition.IEEEConferenceon,2008:1-8]
(4)HogLBP[WangX,HanTX,YanS.AnHOG-LBPhumandetectorwithpartialocclusionhandling[C].ComputerVision,IEEE12thInternationalConferenceon,2009:32-39]
(5)ICF[DollárP,TuZ,PeronaP,etal.IntegralChannelFeatures[C].BMVC.2009,2(3):5]
(6)LatSvm-V2[FelzenszwalbPF,GirshickRB,McAllesterD,etal.Objectdetectionwithdiscriminativelytrainedpart-basedmodels[J].PatternAnalysisandMachineIntelligence,IEEETransactionson,2010,32(9):1627-1645.]
(7)ACF[DollárP,AppelR,BelongieS,etal.Fastfeaturepyramidsforobjectdetection[J].PatternAnalysisandMachineIntelligence,IEEETransactionson,2014,36(8):1532-1545.]。
其中LatSvm-V1,LatSvm-V2算法都是基于DPM模型的算法,HogLBP也是一种融合特征。在ACF特征被提出之前,LatSvm-V2算法的性能几乎是最好的,其性能比ICF特征好,但是鉴于其较大的复杂度,较慢的计算速度,在行人检测方面该方法没有被进一步的优化、衍生发展下去。图中的“Ours”表示本发明方法。从表2中可以看出,相比所给出的这些现有的经典、常用、高效的算法本发明的检测性能有显著提高。
表2在不同数据集上的检测结果对比(missrate%/FPPI(0.1))
图7显示了本发明方法与基于ACF特征行人检测算法的实际检测结果对比实例,其中左侧为基于ACF特征行人检测算法的检测结果(图中的黑线框),右侧为本发明方法的检测结果(图中的白线框)。图7所显示的结果再次证明了本发明方法的优异性能。
Claims (8)
1.一种基于类Haar中间层滤波特征的行人检测方法,首先提取训练图像集中各训练图像的目标特征,并用所提取的目标特征数据对基于决策树的Adaboost分类器进行训练,得到分类模型;然后提取待检测图像在多个尺度下的目标特征并输入所述分类模型,得到行人检测结果;其特征在于,所述目标特征的提取方法具体如下:对原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;对各通道特征图分别进行降采样;对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;将该原始图像的所有类Haar特征聚合,得到该原始图像的目标特征。
2.如权利要求1所述行人检测方法,其特征在于,所述多个不同的通道特征具体为:梯度幅值特征、LUV颜色空间的三个通道特征,以及六个方向的梯度方向直方图特征。
3.如权利要求1所述行人检测方法,其特征在于,所述一组预设的类Haar特征模板包括7个矩形模板,具体如下:
模板1:1×1的矩形模板,单个矩形框的权值为1;
模板2:2×1的矩形模板,两个矩形框的权值分别为1、-1;
模板3:1×2的矩形模板,两个矩形框的权值分别为1、-1;
模板4、2×2的矩形模板,其中4个矩形框的权值均为0.25;
模板5:2×2的矩形模板,其中一列中的两个矩形框的权值均为0.5,另外一列中的两个矩形框的权值均为-0.5;
模板6、2×2的矩形模板,其中一行中的两个矩形框的权值均为0.5,另外一行中的两个矩形框的权值均为-0.5;
模板7:2×2的矩形模板,其中两个对角矩形框的权值均为0.5,另外两个对角矩形框的权值均为-0.5。
4.如权利要求1所述行人检测方法,其特征在于,所述降采样的降采样因子为4。
5.一种基于类Haar中间层滤波特征的行人检测装置,包括:
多尺度变化模块,用于对输入的待检测图像进行多尺度变换;
目标特征提取模块,用于提取多尺度变化模块输出的每一个尺度图像的目标特征;
分类模型,用于根据目标特征提取模块所输入的目标特征对待检测图像进行行人检测,该分类模型通过对基于决策树的Adaboost分类器进行训练得到;
其特征在于,所述目标特征提取模块包括:
通道特征提取模块,用于对输入的原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;
降采样模块,用于对通道特征提取模块所输入的每一幅通道特征图进行降采样处理;
类Haar特征提取模块,用于对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;
特征聚合模块,用于将类Haar特征提取模块所提取的原始图像的所有类Haar特征聚合为目标特征。
6.如权利要求5所述行人检测装置,其特征在于,所述多个不同的通道特征具体为:梯度幅值特征、LUV颜色空间的三个通道特征,以及六个方向的梯度方向直方图特征。
7.如权利要求5所述行人检测装置,其特征在于,所述一组预设的类Haar特征模板包括7个矩形模板,具体如下:
模板1:1×1的矩形模板,单个矩形框的权值为1;
模板2:2×1的矩形模板,两个矩形框的权值分别为1、-1;
模板3:1×2的矩形模板,两个矩形框的权值分别为1、-1;
模板4、2×2的矩形模板,其中4个矩形框的权值均为0.25;
模板5:2×2的矩形模板,其中一列中的两个矩形框的权值均为0.5,另外一列中的两个矩形框的权值均为-0.5;
模板6、2×2的矩形模板,其中一行中的两个矩形框的权值均为0.5,另外一行中的两个矩形框的权值均为-0.5;
模板7:2×2的矩形模板,其中两个对角矩形框的权值均为0.5,另外两个对角矩形框的权值均为-0.5。
8.如权利要求5所述行人检测装置,其特征在于,所述降采样的降采样因子为4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610160605.6A CN105760858A (zh) | 2016-03-21 | 2016-03-21 | 一种基于类Haar中间层滤波特征的行人检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610160605.6A CN105760858A (zh) | 2016-03-21 | 2016-03-21 | 一种基于类Haar中间层滤波特征的行人检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105760858A true CN105760858A (zh) | 2016-07-13 |
Family
ID=56346070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610160605.6A Pending CN105760858A (zh) | 2016-03-21 | 2016-03-21 | 一种基于类Haar中间层滤波特征的行人检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105760858A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339684A (zh) * | 2016-08-26 | 2017-01-18 | 北汽福田汽车股份有限公司 | 一种行人检测的方法、装置及车辆 |
CN106339686A (zh) * | 2016-08-29 | 2017-01-18 | 江苏大学 | 一种基于稀疏判别模板特征的行人检测方法 |
CN106446789A (zh) * | 2016-08-30 | 2017-02-22 | 电子科技大学 | 基于双目视觉的行人实时检测方法 |
CN106886757A (zh) * | 2017-01-19 | 2017-06-23 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN107491762A (zh) * | 2017-08-23 | 2017-12-19 | 珠海安联锐视科技股份有限公司 | 一种行人检测方法 |
CN107688790A (zh) * | 2017-09-01 | 2018-02-13 | 东软集团股份有限公司 | 人体行为识别方法、装置、存储介质及电子设备 |
WO2018113206A1 (zh) * | 2016-12-23 | 2018-06-28 | 深圳云天励飞技术有限公司 | 一种图像处理方法及终端 |
CN109344801A (zh) * | 2018-10-26 | 2019-02-15 | 京东方科技集团股份有限公司 | 一种物体检测方法及装置 |
CN111079669A (zh) * | 2019-12-20 | 2020-04-28 | 京东方科技集团股份有限公司 | 一种图像处理方法、装置及存储介质 |
CN111801689A (zh) * | 2018-04-17 | 2020-10-20 | 赫尔实验室有限公司 | 使用图像和尺寸特征进行实时对象检测和辨识的系统 |
CN112215103A (zh) * | 2020-09-27 | 2021-01-12 | 武汉理工大学 | 一种基于改进acf的车辆行人多类别检测方法及设备 |
CN114296629A (zh) * | 2021-12-28 | 2022-04-08 | 五邑大学 | 一种信号采集方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140133698A1 (en) * | 2012-11-09 | 2014-05-15 | Analog Devices Technology | Object detection |
CN104050451A (zh) * | 2014-06-18 | 2014-09-17 | 西北农林科技大学 | 一种基于多通道Haar-like特征的鲁棒目标跟踪方法 |
-
2016
- 2016-03-21 CN CN201610160605.6A patent/CN105760858A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140133698A1 (en) * | 2012-11-09 | 2014-05-15 | Analog Devices Technology | Object detection |
CN104050451A (zh) * | 2014-06-18 | 2014-09-17 | 西北农林科技大学 | 一种基于多通道Haar-like特征的鲁棒目标跟踪方法 |
Non-Patent Citations (2)
Title |
---|
SHANSHAN ZHANG 等: "Informed Haar-like Features Improve Pedestrian Detection", 《COMPUTER VISION AND PATTERN RECOGNITION》 * |
宁纪锋 等: "多通道Haar-like特征多示例学习目标跟踪", 《中国图象图形学报》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339684A (zh) * | 2016-08-26 | 2017-01-18 | 北汽福田汽车股份有限公司 | 一种行人检测的方法、装置及车辆 |
CN106339686A (zh) * | 2016-08-29 | 2017-01-18 | 江苏大学 | 一种基于稀疏判别模板特征的行人检测方法 |
CN106446789A (zh) * | 2016-08-30 | 2017-02-22 | 电子科技大学 | 基于双目视觉的行人实时检测方法 |
WO2018113206A1 (zh) * | 2016-12-23 | 2018-06-28 | 深圳云天励飞技术有限公司 | 一种图像处理方法及终端 |
CN106886757A (zh) * | 2017-01-19 | 2017-06-23 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN106886757B (zh) * | 2017-01-19 | 2019-06-11 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN107491762A (zh) * | 2017-08-23 | 2017-12-19 | 珠海安联锐视科技股份有限公司 | 一种行人检测方法 |
CN107491762B (zh) * | 2017-08-23 | 2018-05-15 | 珠海安联锐视科技股份有限公司 | 一种行人检测方法 |
CN107688790B (zh) * | 2017-09-01 | 2020-09-04 | 东软集团股份有限公司 | 人体行为识别方法、装置、存储介质及电子设备 |
CN107688790A (zh) * | 2017-09-01 | 2018-02-13 | 东软集团股份有限公司 | 人体行为识别方法、装置、存储介质及电子设备 |
CN111801689A (zh) * | 2018-04-17 | 2020-10-20 | 赫尔实验室有限公司 | 使用图像和尺寸特征进行实时对象检测和辨识的系统 |
CN109344801A (zh) * | 2018-10-26 | 2019-02-15 | 京东方科技集团股份有限公司 | 一种物体检测方法及装置 |
US11508144B2 (en) | 2018-10-26 | 2022-11-22 | Beijing Boe Technology Development Co., Ltd. | Method and device for object detection |
CN111079669A (zh) * | 2019-12-20 | 2020-04-28 | 京东方科技集团股份有限公司 | 一种图像处理方法、装置及存储介质 |
CN112215103A (zh) * | 2020-09-27 | 2021-01-12 | 武汉理工大学 | 一种基于改进acf的车辆行人多类别检测方法及设备 |
CN112215103B (zh) * | 2020-09-27 | 2024-02-23 | 武汉理工大学 | 一种基于改进acf的车辆行人多类别检测方法及设备 |
CN114296629A (zh) * | 2021-12-28 | 2022-04-08 | 五邑大学 | 一种信号采集方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
WO2017190574A1 (zh) | 一种基于聚合通道特征的快速行人检测方法 | |
CN108520226B (zh) | 一种基于躯体分解和显著性检测的行人重识别方法 | |
Wu et al. | Traffic sign detection based on convolutional neural networks | |
US11263435B2 (en) | Method for recognizing face from monitoring video data | |
Ullah et al. | Gender recognition from face images with local wld descriptor | |
Zang et al. | Traffic sign detection based on cascaded convolutional neural networks | |
Greenhalgh et al. | Traffic sign recognition using MSER and random forests | |
CN105447503B (zh) | 基于稀疏表示lbp和hog融合的行人检测方法 | |
Jia et al. | Fast human detection by boosting histograms of oriented gradients | |
CN105574509B (zh) | 一种基于光照的人脸识别系统回放攻击检测方法及应用 | |
CN107464245B (zh) | 一种图像结构边缘的定位方法及装置 | |
CN110706235A (zh) | 一种基于双级级联分割的远红外行人检测方法 | |
Sugiharto et al. | Traffic sign detection based on HOG and PHOG using binary SVM and k-NN | |
CN103679187A (zh) | 图像识别方法和系统 | |
Dehshibi et al. | Persian vehicle license plate recognition using multiclass Adaboost | |
Wang et al. | Hole-based traffic sign detection method for traffic signs with red rim | |
CN103186776A (zh) | 基于多特征和深度信息的人体检测方法 | |
Guofeng et al. | Traffic sign recognition based on SVM and convolutional neural network | |
Li et al. | Seatbelt detection based on cascade adaboost classifier | |
Araar et al. | Traffic sign recognition using a synthetic data training approach | |
Deshmukh et al. | Real-time traffic sign recognition system based on colour image segmentation | |
Das et al. | Human face detection in color images using HSV color histogram and WLD | |
CN107341456B (zh) | 一种基于单幅户外彩色图像的天气晴阴分类方法 | |
Rao et al. | Convolutional Neural Network Model for Traffic Sign Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160713 |
|
RJ01 | Rejection of invention patent application after publication |