CN105426819A - 基于多尺度hog的行人检测方法 - Google Patents
基于多尺度hog的行人检测方法 Download PDFInfo
- Publication number
- CN105426819A CN105426819A CN201510728940.7A CN201510728940A CN105426819A CN 105426819 A CN105426819 A CN 105426819A CN 201510728940 A CN201510728940 A CN 201510728940A CN 105426819 A CN105426819 A CN 105426819A
- Authority
- CN
- China
- Prior art keywords
- gradient
- pixel
- multiple dimensioned
- hog
- detection method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
- G06V10/473—Contour-based spatial representations, e.g. vector-coding using gradient analysis
Abstract
本发明公开了一种基于多尺度HOG的行人检测方法。针对HOG特征的缺点,提出了多尺度HOG特征,运用不同尺寸block和cell提取多尺度HOG特征向量,在保证描述行人性能几乎未变的前提下,大大降低了特征的维数,提高了系统的效率。
Description
技术领域
本发明涉及一种基于多尺度HOG的行人检测方法,属于计算机视觉中行人检测技术领域。
背景技术
行人检测是计算机视觉领域内的一个十分重要的分支,是最近十几年来的研究热点和难点。行人检测拥有非常广阔的应用前景,如视频的智能监控、汽车的辅助驾驶和家居智能服务等,存在巨大的商业价值。虽然经过十几年的发展已经有了一些初步的研究成果,但仍然存在很多尚未解决的难点,且目前还没有一种行人检测系统能够在任何环境和背景下通用。
近年来,基于机器学习的行人检测方法已经成为行人检测领域中主流的研究方向。主要包括两个重要方面,一个是特征描述算子,另一个是学习算法。特征描述算子有haar-like、HOG(梯度方向直方图)、LBP(局部二值模式)以及edgelet(边缘特征)等。学习算法有支持向量机(SVM)和级联分类器Adaboost。现有的行人检测技术有着检测速度慢、准确率不够高等缺点。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供了一种检测速度快、准确率高的基于多尺度HOG的行人检测方法。
技术方案:一种基于多尺度HOG的行人检测方法,包括以下步骤:
步骤1:采集图像;
步骤2:对步骤1中获得的图像进行像素梯度的计算;
步骤3:对步骤2获得的图像进行单元内梯度直方图的统计;
步骤4:对步骤3统计获得的单元内梯度直方图块归一化处理得到块归一化直方图;
步骤5:对步骤4得到块归一化直方图提取特征,得到多尺度HOG特征向量;
步骤6:将步骤5获得的多尺度HOG特征向量送入RBF核-SVM进行分类,输出分类结果。
进一步,所述步骤3中分别采用32×32、16×16以及8×8像素大小的单元进行梯度直方图统计。这样做使得后续提取出的多尺度HOG特征能够非常充分的体现行人的细节特征以及整体特征,不仅特征向量的维度大幅度降低,而且使用该特征的分类准确率与HOG特征基本一致。
有益效果:针对HOG特征的缺点,本发明提出了多尺度HOG特征,运用不同尺寸block和cell提取多尺度HOG特征向量,在保证描述行人性能几乎未变的前提下,大大降低了特征的维数,提高了系统的效率。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,基于特征融合的行人检测方法,其步骤如下:
步骤1:采集图像。
步骤2:对步骤1中获得的图像进行像素梯度的计算;
计算图像的一阶梯度。计算导数不仅能够获得人体轮廓和纹理信息,还能进一步减弱光照的影响。由于HOG特征的运算对模板算子非常的敏感,经过试验对比发现,反而是最简单的一维离散微分模板(1,0,+1)及其转置在水平和垂直两个方向上对图像各个像素进行梯度计算能够取得最好的检测效果。可以通过公式分别计算像素点(x,y)的梯度模值和方向角:
其中,G(x,y),α(x,y),H(x,y)分别表示像素点的梯度幅值、梯度方向以及像素点的灰度值。对于彩色图像可以分别计算它们各个颜色通道的梯度,选择其中幅值最大的值作为该像素点的梯度。
步骤3:对步骤2获得的图像进行单元内梯度直方图的统计;
该步骤的本质是对局部图像区域编码,且可以保持对图像中人体对象的外观和姿势的弱敏感性。我们把图像窗口划分为若干个小区域,这些小区域被称为“单元格”,即cell。把图像平均分成若干正方形的单元格(cell),cell的长和宽依次为所使用的block的一半长度,分别为32×32、16×16以及8×8像素大小。假设每个细胞包含8×8个像素,每个单元格内把的梯度方向平均分成9个区间(bin),然后在每个cell内所有像素的梯度值再分别在各个bin区间进行直方图统计,这样一个cell得到一个9维的特征向量。
步骤4:对步骤3统计获得的单元内梯度直方图块归一化处理得到块归一化直方图;
梯度值的变化范围非常广的主要原因是由于图像中局部的曝光率和前景-背景的对比度的多样化。因而要得到好的检测效果,必须进行有效地局部对比标准化。标准化的方法有很多,一般的方法都是将一组cell放到一个块中,然后分别标准化每个块。2×2个cell形成一个块,这样一个块就形成36维的特征向量,再利用L2-范数对整个块进行归一化,得到最终的特征向量。
步骤5:对步骤4得到块归一化直方图提取特征,得到多尺度HOG特征向量;
实施例中采集的图像为64×128,cell依次为32×32、16×16以及8×8像素大小,block依次为64×64、32×32以及16×16像素大小,那么一幅图像就包含42个block,每个block是36维向量,所以一幅64×128大小的图像的多尺度HOG特征向量为36×42=1512维。而在原始HOG特征中,cell为8×8,block为16×16,那么一幅图像就包含105个块,每个块是36维向量,所以一幅64×128大小的图像的HOG特征向量为36×105=3780维。
步骤6:将步骤5获得的多尺度HOG特征向量送入RBF核-SVM进行分类,输出分类结果。
实验将本发明提出的多尺度HOG特征与原始HOG特征在检测率、漏报率、虚警率和分类时间等四个方面进行比较,结果如表1所示。
1.检测率:表示测试正负样本被正确分类的概率;
2.漏报率:表示测试的正样本被错分类为负样本的概率;
3.虚警率:表示测试的负样本被错分类为正样本的概率;
其中,TP(truepositive)表示行人样本被正确分类为行人;FP(falsepositive)表示非行人样本被错误分类为行人;TN(truenegative)表示非行人样本被正确分类为非行人;FN(falsenegative)表示行人样本被错误的分类为非行人。
从表1中我们可以发现多尺度HOG特征在维数上比HOG特征减少了大约3/5,前者1512维,后者3780维;在检测时间方面,多尺度HOG特征为151ms,HOG特征为227ms,多尺度HOG特征相比较于HOG特征而言,分类器的分类速度前者高于后者;同时分别对比二者的漏检率和虚警率,可以发现多尺度HOG特征样本的检测正确率与HOG差不多;漏检率有所下降,虚警率略有升高。本发明提出的多尺度HOG特征在检测的效率方面优于HOG特征,而检测的正确率方面与HOG特征类似,能够满足一般应用要求。
表1
Claims (3)
1.一种基于多尺度HOG的行人检测方法,其特征在于,包括以下步骤:
步骤1:采集图像;
步骤2:对步骤1中获得的图像进行像素梯度的计算;
步骤3:对步骤2获得的图像进行单元内梯度直方图的统计;
步骤4:对步骤3统计获得的单元内梯度直方图块归一化处理得到块归一化直方图;
步骤5:对步骤4得到块归一化直方图提取特征,得到多尺度HOG特征向量;
步骤6:将步骤5获得的多尺度HOG特征向量送入RBF核-SVM进行分类,输出分类结果。
2.如权利要求1所述的基于多尺度HOG的行人检测方法,其特征在于,所述步骤3中分别采用32×32、16×16以及8×8像素大小的单元进行梯度直方图统计。
3.如权利要求1所述的基于多尺度HOG的行人检测方法,其特征在于,步骤2中通过公式分别计算像素点(x,y)的梯度模值和方向角:
其中,G(x,y),α(x,y),H(x,y)分别表示像素点的梯度幅值、梯度方向以及像素点的灰度值;对于彩色图像可以分别计算它们各个颜色通道的梯度,选择其中幅值最大的值作为该像素点的梯度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510728940.7A CN105426819A (zh) | 2015-10-30 | 2015-10-30 | 基于多尺度hog的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510728940.7A CN105426819A (zh) | 2015-10-30 | 2015-10-30 | 基于多尺度hog的行人检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105426819A true CN105426819A (zh) | 2016-03-23 |
Family
ID=55505019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510728940.7A Pending CN105426819A (zh) | 2015-10-30 | 2015-10-30 | 基于多尺度hog的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105426819A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009567A (zh) * | 2017-11-10 | 2018-05-08 | 电子科技大学 | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060034484A1 (en) * | 2004-08-16 | 2006-02-16 | Claus Bahlmann | Method for traffic sign detection |
CN102609716A (zh) * | 2012-01-10 | 2012-07-25 | 银江股份有限公司 | 一种基于改进的hog特征和pca的行人检测方法 |
CN103886279A (zh) * | 2012-12-21 | 2014-06-25 | 本田技研工业株式会社 | 使用合成训练数据的实时骑车人检测 |
CN104091157A (zh) * | 2014-07-09 | 2014-10-08 | 河海大学 | 一种基于特征融合的行人检测方法 |
-
2015
- 2015-10-30 CN CN201510728940.7A patent/CN105426819A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060034484A1 (en) * | 2004-08-16 | 2006-02-16 | Claus Bahlmann | Method for traffic sign detection |
CN102609716A (zh) * | 2012-01-10 | 2012-07-25 | 银江股份有限公司 | 一种基于改进的hog特征和pca的行人检测方法 |
CN103886279A (zh) * | 2012-12-21 | 2014-06-25 | 本田技研工业株式会社 | 使用合成训练数据的实时骑车人检测 |
CN104091157A (zh) * | 2014-07-09 | 2014-10-08 | 河海大学 | 一种基于特征融合的行人检测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009567A (zh) * | 2017-11-10 | 2018-05-08 | 电子科技大学 | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 |
CN108009567B (zh) * | 2017-11-10 | 2021-11-02 | 电子科技大学 | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Pedestrian detection method based on Faster R-CNN | |
CN102609716B (zh) | 一种基于改进的hog特征和pca的行人检测方法 | |
CN103761531B (zh) | 基于形状轮廓特征的稀疏编码车牌字符识别方法 | |
CN101739555B (zh) | 假脸检测方法及系统、假脸模型训练方法及系统 | |
CN104091157A (zh) | 一种基于特征融合的行人检测方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN103971097B (zh) | 一种基于多尺度笔画模型的车牌识别方法与系统 | |
CN102521561B (zh) | 基于多尺度韦伯局部特征和分层决策融合的人脸识别方法 | |
CN103048329B (zh) | 一种基于主动轮廓模型的路面裂缝检测方法 | |
CN103390164A (zh) | 基于深度图像的对象检测方法及其实现装置 | |
CN105160317A (zh) | 一种基于区域分块行人性别识别方法 | |
CN104732215A (zh) | 一种基于信息向量机的遥感影像海岸线提取方法 | |
CN104021375A (zh) | 一种基于机器学习的车型识别方法 | |
CN101930549B (zh) | 基于第二代曲线波变换的静态人体检测方法 | |
CN103310194A (zh) | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 | |
CN102147869A (zh) | 基于前景分析和模式识别的行人检测方法 | |
CN103186776B (zh) | 基于多特征和深度信息的人体检测方法 | |
CN103514456A (zh) | 基于压缩感知多核学习的图像分类方法及其装置 | |
CN102332086A (zh) | 一种基于双阈值局部二进制模式的人脸识别方法 | |
CN103778435A (zh) | 一种基于视频的行人快速检测方法 | |
CN104463128A (zh) | 用于人脸识别的眼镜检测方法及系统 | |
CN101251896B (zh) | 一种基于多分类器的物体检测系统及方法 | |
CN104657717A (zh) | 一种基于分层核稀疏表示的行人检测方法 | |
CN104268598A (zh) | 一种基于二维扫描激光的人腿检测方法 | |
CN104200228A (zh) | 一种安全带识别方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160323 |
|
RJ01 | Rejection of invention patent application after publication |