CN105426819A

CN105426819A - 基于多尺度hog的行人检测方法

Info

Publication number: CN105426819A
Application number: CN201510728940.7A
Authority: CN
Inventors: 王敏; 曹瑞
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2015-10-30
Filing date: 2015-10-30
Publication date: 2016-03-23

Abstract

本发明公开了一种基于多尺度HOG的行人检测方法。针对HOG特征的缺点，提出了多尺度HOG特征，运用不同尺寸block和cell提取多尺度HOG特征向量，在保证描述行人性能几乎未变的前提下，大大降低了特征的维数，提高了系统的效率。

Description

基于多尺度HOG的行人检测方法

技术领域

本发明涉及一种基于多尺度HOG的行人检测方法，属于计算机视觉中行人检测技术领域。

背景技术

行人检测是计算机视觉领域内的一个十分重要的分支，是最近十几年来的研究热点和难点。行人检测拥有非常广阔的应用前景，如视频的智能监控、汽车的辅助驾驶和家居智能服务等，存在巨大的商业价值。虽然经过十几年的发展已经有了一些初步的研究成果，但仍然存在很多尚未解决的难点，且目前还没有一种行人检测系统能够在任何环境和背景下通用。

近年来，基于机器学习的行人检测方法已经成为行人检测领域中主流的研究方向。主要包括两个重要方面，一个是特征描述算子，另一个是学习算法。特征描述算子有haar-like、HOG(梯度方向直方图)、LBP(局部二值模式)以及edgelet(边缘特征)等。学习算法有支持向量机(SVM)和级联分类器Adaboost。现有的行人检测技术有着检测速度慢、准确率不够高等缺点。

发明内容

发明目的：针对现有技术中存在的问题，本发明提供了一种检测速度快、准确率高的基于多尺度HOG的行人检测方法。

技术方案：一种基于多尺度HOG的行人检测方法，包括以下步骤：

步骤1：采集图像；

步骤2：对步骤1中获得的图像进行像素梯度的计算；

步骤3：对步骤2获得的图像进行单元内梯度直方图的统计；

步骤4：对步骤3统计获得的单元内梯度直方图块归一化处理得到块归一化直方图；

步骤5：对步骤4得到块归一化直方图提取特征，得到多尺度HOG特征向量；

步骤6：将步骤5获得的多尺度HOG特征向量送入RBF核-SVM进行分类，输出分类结果。

进一步，所述步骤3中分别采用32×32、16×16以及8×8像素大小的单元进行梯度直方图统计。这样做使得后续提取出的多尺度HOG特征能够非常充分的体现行人的细节特征以及整体特征，不仅特征向量的维度大幅度降低，而且使用该特征的分类准确率与HOG特征基本一致。

有益效果：针对HOG特征的缺点，本发明提出了多尺度HOG特征，运用不同尺寸block和cell提取多尺度HOG特征向量，在保证描述行人性能几乎未变的前提下，大大降低了特征的维数，提高了系统的效率。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示，基于特征融合的行人检测方法，其步骤如下：

步骤1：采集图像。

步骤2：对步骤1中获得的图像进行像素梯度的计算；

计算图像的一阶梯度。计算导数不仅能够获得人体轮廓和纹理信息，还能进一步减弱光照的影响。由于HOG特征的运算对模板算子非常的敏感，经过试验对比发现，反而是最简单的一维离散微分模板(1,0,+1)及其转置在水平和垂直两个方向上对图像各个像素进行梯度计算能够取得最好的检测效果。可以通过公式分别计算像素点(x,y)的梯度模值和方向角：

G (x, y) = \sqrt{{(H (x + 1, y) - H (x - 1, y))}^{2} + {(H (x, y + 1) - H (x, y - 1))}^{2}}

α (x, y) = \tan^{- 1} (\frac{H (x, y + 1) - H (x, y - 1)}{H (x + 1, y) - H (x - 1, y)})

其中，G(x,y)，α(x,y)，H(x,y)分别表示像素点的梯度幅值、梯度方向以及像素点的灰度值。对于彩色图像可以分别计算它们各个颜色通道的梯度，选择其中幅值最大的值作为该像素点的梯度。

步骤3：对步骤2获得的图像进行单元内梯度直方图的统计；

该步骤的本质是对局部图像区域编码，且可以保持对图像中人体对象的外观和姿势的弱敏感性。我们把图像窗口划分为若干个小区域，这些小区域被称为“单元格”，即cell。把图像平均分成若干正方形的单元格(cell)，cell的长和宽依次为所使用的block的一半长度，分别为32×32、16×16以及8×8像素大小。假设每个细胞包含8×8个像素，每个单元格内把的梯度方向平均分成9个区间(bin)，然后在每个cell内所有像素的梯度值再分别在各个bin区间进行直方图统计，这样一个cell得到一个9维的特征向量。

梯度值的变化范围非常广的主要原因是由于图像中局部的曝光率和前景-背景的对比度的多样化。因而要得到好的检测效果，必须进行有效地局部对比标准化。标准化的方法有很多，一般的方法都是将一组cell放到一个块中，然后分别标准化每个块。2×2个cell形成一个块，这样一个块就形成36维的特征向量，再利用L2-范数对整个块进行归一化，得到最终的特征向量。

实施例中采集的图像为64×128，cell依次为32×32、16×16以及8×8像素大小，block依次为64×64、32×32以及16×16像素大小，那么一幅图像就包含42个block，每个block是36维向量，所以一幅64×128大小的图像的多尺度HOG特征向量为36×42＝1512维。而在原始HOG特征中，cell为8×8，block为16×16，那么一幅图像就包含105个块，每个块是36维向量，所以一幅64×128大小的图像的HOG特征向量为36×105＝3780维。

实验将本发明提出的多尺度HOG特征与原始HOG特征在检测率、漏报率、虚警率和分类时间等四个方面进行比较，结果如表1所示。

1.检测率：表示测试正负样本被正确分类的概率；

2.漏报率：表示测试的正样本被错分类为负样本的概率；

3.虚警率：表示测试的负样本被错分类为正样本的概率；

其中，TP(truepositive)表示行人样本被正确分类为行人；FP(falsepositive)表示非行人样本被错误分类为行人；TN(truenegative)表示非行人样本被正确分类为非行人；FN(falsenegative)表示行人样本被错误的分类为非行人。

从表1中我们可以发现多尺度HOG特征在维数上比HOG特征减少了大约3/5，前者1512维，后者3780维；在检测时间方面，多尺度HOG特征为151ms，HOG特征为227ms，多尺度HOG特征相比较于HOG特征而言，分类器的分类速度前者高于后者；同时分别对比二者的漏检率和虚警率，可以发现多尺度HOG特征样本的检测正确率与HOG差不多；漏检率有所下降，虚警率略有升高。本发明提出的多尺度HOG特征在检测的效率方面优于HOG特征，而检测的正确率方面与HOG特征类似，能够满足一般应用要求。

表1

Claims

1.一种基于多尺度HOG的行人检测方法，其特征在于，包括以下步骤：

步骤1：采集图像；

步骤2：对步骤1中获得的图像进行像素梯度的计算；

步骤3：对步骤2获得的图像进行单元内梯度直方图的统计；

2.如权利要求1所述的基于多尺度HOG的行人检测方法，其特征在于，所述步骤3中分别采用32×32、16×16以及8×8像素大小的单元进行梯度直方图统计。

3.如权利要求1所述的基于多尺度HOG的行人检测方法，其特征在于，步骤2中通过公式分别计算像素点(x,y)的梯度模值和方向角：

G (x, y) = \sqrt{{(H (x + 1, y) - H (x - 1, y))}^{2} + {(H (x, y + 1) - H (x, y - 1))}^{2}}

α (x, y) = \tan^{- 1} (\frac{H (x, y + 1) - H (x, y - 1)}{H (x + 1, y) - H (x - 1, y)})

其中，G(x,y)，α(x,y)，H(x,y)分别表示像素点的梯度幅值、梯度方向以及像素点的灰度值；对于彩色图像可以分别计算它们各个颜色通道的梯度，选择其中幅值最大的值作为该像素点的梯度。