CN104008404B

CN104008404B - 一种基于显著直方图特征的行人检测方法及系统

Info

Publication number: CN104008404B
Application number: CN201410268777.6A
Authority: CN
Inventors: 胡瑞敏; 方稳华; 梁超; 王晓; 南源源; 温屹; 陈军
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2014-06-16
Filing date: 2014-06-16
Publication date: 2017-04-12
Anticipated expiration: 2034-06-16
Also published as: CN104008404A

Abstract

一种基于显著直方图特征的行人检测方法及系统，训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸，然后作为输入图像提取特征，根据所得特征训练分类器；正样本的图像包含行人，负样本的图像不包含行人；测试阶段包括对测试数据集中任一测试图像，首先以测试图像为输入图像，分别以输入图像的每个像素为中心建立预设尺寸的局部区域，并提取每个局部区域的特征，然后将每个局部区域的特征输入训练阶段所得分类器，得到各局部区域是否包含行人的分类结果。提取特征时，将梯度的幅值和相应局部区域显著概率值结合成带有显著信息的梯度幅值，然后和梯度的方向形成显著直方图；通过统计显著直方图，形成特征描述。

Description

一种基于显著直方图特征的行人检测方法及系统

技术领域

本发明涉及目标检测领域，特别涉及一种基于显著直方图特征的行人检测技术方案。

背景技术

目标检测在计算机视觉中是一个热点，广泛的应用在刑侦监控、特定目标检索、机器人学和智能车辆中；行人在目标检测中又是尤为重要的因素，因此行人检测在近几年的时间里引起了高度重视和研究。但是在不同场景下光照、噪声以及行人的多种姿态变化使行人检测的研究面临很大的挑战。目前大多的行人检测算法都是借助于Dalal-Triggs在文献(“Histograms of oriented gradients for human detection.In Computer Visionand Pattern Recognition”,2005.CVPR2005.IEEE Computer Society Conference on,volume1,pages886-893.)中提出的HOG特征。经过多年的研究，该领域取得了很大的改进。在Piotr Dollar的文献(Piotr Dollar,Christian Wojek,Bernt Schiele,and PietroPerona.Pedestrian detection:An evaluation of the state of the art.PatternAnalysis and Machine Intelligence,IEEE Transactions on,34(4):743-761,2012.)中对目前十六种行人检测算法比对的调研中可以发现，在行人检测过程中有两个重要的元素：特征和分类器。检测过程包含训练和测试两个阶段：第一，从训练图像中提取特征，其中特征包含了行人的色彩、纹理及外形等基本属性信息，将提取的特征训练出SVM分类器；第二，从测试集图像中提取特征，将这些特征送入到训练好的分类器，最后给出分类结果。从HOG特征的检测结果中可以看出，大部分的误检大多出现在背景的区域；而这些背景区域都是图像的非显著区域。

发明内容

本发明的目的是提出一种基于显著直方图特征的行人检测技术方案，解决现有的同类算法中高误检问题，通过滑动窗口法得到最佳的结果。

为了达到以上目的，本发明采用的技术方案提供了一种基于显著直方图特征的行人检测方法，包括训练阶段和测试阶段，

训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸，然后作为输入图像提取特征，根据所得特征训练分类器；正样本的图像包含行人，负样本的图像不包含行人；提取特征包括进行以下步骤，

步骤1.1，对输入图像进行颜色空间的归一化；

步骤1.2，以输入图像的每个像素为中心建立预设尺寸的局部区域，获取每个局部区域的显著概率值；

步骤1.3，对输入图像进行划分，划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素，a和b为预设参数；

步骤1.4，采集每个像素的梯度的幅值和方向；

步骤1.5，对每个像素，将步骤1.4中所得梯度的幅值和步骤1.2中得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值，然后和步骤1.4中得到的梯度的方向形成显著直方图；统计每个像素的显著直方图，形成每个像素的特征描述子；将每个小块中所有像素的特征描述子串联起来，得到各小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，得到各大块的特征描述子；将输入图像中所有大块的特征描述子串联起来，得到该输入图像的特征描述子；

测试阶段包括对测试数据集中任一测试图像，首先以测试图像为输入图像，分别以输入图像的每个像素为中心建立预设尺寸的局部区域，并提取每个局部区域的特征，然后将每个局部区域的特征输入训练阶段所得分类器，得到各局部区域是否包含行人的分类结果；提取特征包括进行以下步骤，

步骤2.1，对输入图像进行颜色空间的归一化；

步骤2.2，以输入图像的每个像素为中心建立预设尺寸的局部区域，获取每个局部区域的显著概率值；

步骤2.3，基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，将每个局部区域分别划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素，a和b为预设参数；

步骤2.4，采集每个像素的梯度的幅值和方向；

步骤2.5，基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，对每个局部区域分别提取特征如下，

对局部区域中每个像素，将步骤2.4中所得梯度的幅值和步骤2.2中得到的显著概率值结合成带有显著信息的梯度幅值，然后和步骤2.4中得到的梯度的方向形成显著直方图；统计每个像素的显著直方图，形成每个像素的特征描述子；将每个小块中所有像素的特征描述子串联起来，便得到各小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，便得到各大块的特征描述子；将局部区域中所有大块的特征描述子串联起来，便得到该局部区域的特征描述子，作为该局部区域的特征。

而且，步骤1.2和2.2中，设归一化后的输入图像记为图像I，图像I的每个像素I_k的显著度Y(I_k)通过下式获得，

其中，I_i是图像I的一个像素，d(I_k,I_i)是图像I的两个像素I_k和I_i在色彩LUV空间的距离，N是图像I的像素个数；

将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果，新的显著度计为S(I_k)，

设局部区域的显著概率值符合高斯分布，计算显著概率值的式子如下，

其中，和σ²分布代表高斯分布的均值和方差，R_k代表以像素I_k为中心的预设尺寸的局部区域；代表矩形区域的显著度，σ代表高斯分布的标准方差。

而且，步骤1.4和步骤2.4中，采集每个像素单元中各像素点的梯度的幅值和方向如下，提取位置(x,y)处像素的梯度如下，

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

其中，G_x(x,y)、G_y(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度，H(x,y)为在位置(x,y)处像素的像素值，该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为，

而且，步骤1.4和步骤2.4中，每个像素单元的显著信息的梯度幅值提取如下，

G_s(x,y)＝G(x,y)F(s_(x,y))

其中，F(s_(x,y))是以位置(x,y)处像素为中心的预设尺寸的局部区域相应显著概率值F(s_(x,y))。

本发明还相应提供了一种基于显著直方图特征的行人检测系统，包括以下模块，训练模块，用于首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸，然后作为输入图像提取特征，根据所得特征训练分类器；正样本的图像包含行人，负样本的图像不包含行人；

分类模块，用于对测试数据集中任一测试图像，首先以测试图像为输入图像，分别以输入图像的每个像素为中心建立预设尺寸的局部区域，并提取每个局部区域的特征，然后将每个局部区域的特征输入训练阶段所得分类器，得到各局部区域是否包含行人的分类结果；

训练模块包括以下子模块，

第一归一化子模块，用于对输入图像进行颜色空间的归一化；

第一显著概率值获取子模块，用于以输入图像的每个像素为中心建立预设尺寸的局部区域，获取每个局部区域的显著概率值；

第一图像划分子模块，用于对输入图像进行划分，划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素，a和b为预设参数；

第一梯度采集子模块，用于采集每个像素的梯度的幅值和方向；

第一特征生成子模块，用于对每个像素，将第一梯度采集子模块所得梯度的幅值和第一显著概率值获取子模块得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值，然后和第一梯度采集子模块得到的梯度的方向形成显著直方图；统计每个像素的显著直方图，形成每个像素的特征描述子；将每个小块中所有像素的特征描述子串联起来，得到各小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，得到各大块的特征描述子；将输入图像中所有大块的特征描述子串联起来，得到该输入图像的特征描述子；

分类模块包括以下子模块，

第二归一化子模块，用于对输入图像进行颜色空间的归一化；

第二显著概率值获取子模块，用于以输入图像的每个像素为中心建立预设尺寸的局部区域，获取每个局部区域的显著概率值；

第二图像划分子模块，用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，将每个局部区域分别划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素，a和b为预设参数；

第二梯度采集子模块，用于采集每个像素的梯度的幅值和方向；

第二特征生成子模块，用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，对每个局部区域分别提取特征如下，

对局部区域中每个像素，将第二梯度采集子模块所得梯度的幅值和第二显著概率值获取子模块得到的显著概率值结合成带有显著信息的梯度幅值，然后和第二梯度采集子模块得到的梯度的方向形成显著直方图；统计每个像素的显著直方图，形成每个像素的特征描述子；将每个小块中所有像素的特征描述子串联起来，便得到各小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，便得到各大块的特征描述子；将局部区域中所有大块的特征描述子串联起来，便得到该局部区域的特征描述子，作为该局部区域的特征。

本发明充分利用了包含显著信息的局部区域，形成了包含有显著度的特征描述子，将显著信息，梯度信息有机的结合成显著直方图特征描述子，应用在行人检测领域中取得了很好的效果。

附图说明

图1为实施例的基于显著直方图特征的行人检测方法的流程图。

具体实施方式

本发明技术方案可采用软件技术实现自动流程运行。下面结合附图和实施例对本发明技术方案进一步详细说明。预先搜集包含行人的正样本及不包含行人的负样本的样本数据集，建议选择单人室外照片作为正样本，选取不包含行人的室外照片为负样本。可先归一化正样本和负样本为预设尺寸，例如实施例归一化为128×64的矩形图像。分别从正样本和负样本中提取特征作为训练数据，根据训练数据学习训练SVM分类器，从测试数据集中任一测试图像提取以每个像素为中心的局部区域相应特征并输入训练好的分类器，输出各局部区域的分类结果。测试图像中局部区域与正样本和负样本归一化后尺寸一致，例如测试图像中局部区域可取128×64的矩形局部区域，和正样本和负样本归一化为128×64的矩形图像符合，以便提取相应的特征。

本发明实施例分为训练阶段和测试阶段，

训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸，实施例归一化为128×64的矩形图像，然后作为输入图像提取特征，根据所得特征训练分类器；提取特征包括进行以下步骤，

步骤1.1，对输入图像进行颜色空间的归一化；

实施例采用Gamma校正法对输入图像进行颜色空间的归一化，目的是调节图像的对比度，降低图像局部的阴影和光照变化所造成的影响，同时可以抑制噪音的干扰。

为了减少光照因素的影响，首先需要将整个图像进行归一化。在图像的纹理强度中，局部的表层曝光贡献的比重较大，所以，这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大，通常先转化为灰度图；

Gamma压缩公式：

I(x,y)＝I^*(x,y)^gamma

其中I^*(x,y)表示的是输入图像的原图像像素，(x,y)为输入图像中像素的位置，gamma是压缩系数(一般取值为0.5)，I(x,y)为归一化后的图像像素。

设步骤1.1归一化后的输入图像记为图像I，对图像I的每种色彩的统计信息可以算出图像I每个像素的显著度，假设像素的局部区域中的显著度符合高斯分布，计算出高斯分布的均值和方差，这样便可以把显著度转换成概率值。

按照一般方式，图像I的每个像素I_k的显著度Y(I_k)通过下式获得，

其中I_i是图像I的一个像素，d(I_k,I_i)是图像I的两个像素I_k和I_i在色彩LUV空间的距离，N是图像I的像素个数。本发明实施例将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果，新的显著度计为S(I_k)，从而得到局部区域的显著度的统计信息，其中局部区域的显著概率值符合高斯分布，显著概率值如下，

其中代表的是局部区域内显著度的概率分布，和σ²分布代表高斯分布的均值和方差，R_k代表以像素I_k为中心的矩形的局部区域，同样采用预定尺寸的局部区域，例如128×64的矩形局部区域，超出图像I的部分假设像素值为0，相应像素显著度也为0；代表的是矩形的局部区域R_k的显著度，根据局部区域R_k内每个像素新的显著度求平均得到，σ代表的是高斯分布的标准方差。

步骤1.3，对输入图像进行划分，划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素；

a和b为预设参数，本领域技术人员可自行根据预设尺寸设定取值；实施例将步骤1归一化后的图像I划分成多个大块，每个大块包括2×2的小块(Block)，每个小块中包含8×8个像素(Cell)。

步骤1.4，采集每个像素的梯度的幅值和方向；

采集步骤1.1归一化后的图像I中各像素点的梯度(包含梯度的幅值和方向)。计算图像像素的梯度，通过求导不仅能够捕获轮廓和纹理信息，还能弱化光照。提取图像I中位置(x,y)处像素的梯度方法如下：

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

其中G_x(x,y)、G_y(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度，H(x,y)为在位置(x,y)处像素的像素值。该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为：

步骤1.5，对每个像素，将步骤1.4中所得梯度的幅值和步骤1.2中得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值；然后和步骤1.4中得到的梯度的方向形成直方图，称为显著直方图特征。统计每个像素的显著直方图，即可形成每个像素的特征描述子，将每个小块中所有像素的特征描述子串联起来，便得到该小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，便得到该大块的特征描述子；将输入图像中所有大块的特征描述子串联起来，便得到该输入图像的特征描述子，即该正样本或负样本的特征。

每个像素的显著梯度幅值表示为：

G_s(x,y)＝G(x,y)F(s_(x,y))

其中G(x,y)可以从步骤1.4中得到，对以位置(x,y)处像素为中心的矩形的局部区域，同样采用预定尺寸，相应显著概率值F(s_(x,y))可以从步骤1.2得到，即假设位置(x,y)处像素为像素I_k，取即可。带有显著信息的幅值和方向投影成直方图，可称之为显著直方图，作为行人检测的描述子。具体投影实现方式为现有技术。显著直方图特征可以把图像中的显著部分直观的用直方图表示出了，为后期的直方图特征检测提供了很优越的检测条件，降低了把背景检测成行人的误检。

参见图1，测试阶段包括对测试数据集中任一测试图像，首先以测试图像为输入图像，分别以输入图像的每个像素为中心建立预设尺寸的局部区域，并提取每个局部区域的特征，然后将每个局部区域的特征输入训练阶段所得分类器，得到各局部区域是否包含行人的分类结果；提取特征包括进行以下步骤，

步骤2.1，对输入图像进行颜色空间的归一化；

Gamma压缩公式：

I(x,y)＝I^*(x,y)^gamma

设步骤2.1归一化后的输入图像记为图像I，对图像I的每种色彩的统计信息可以算出图像I每个像素的显著度，假设像素的局部区域中的显著度符合高斯分布，计算出高斯分布的均值和方差，这样便可以把显著度转换成概率值。

其中代表的是局部区域内显著度的概率分布，和σ²分布代表高斯分布的均值和方差，R_k代表以像素I_k为中心的矩形的局部区域，同样采用预定尺寸，例如128×64的矩形局部区域，超出图像I的部分假设像素值为0，相应像素显著度也为0；代表的是矩形的局部区域R_k的显著度，根据局部区域R_k内每个像素新的显著度求平均得到，σ代表的是高斯分布的标准方差。可得到相应显著图。

步骤2.3，基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，将每个局部区域分别划分成多个大块，每个大块包括a×a个小块，每个小块中包含b×b个像素；

对每个局部区域的划分方式和步骤1.3对样本图像的划分方式一致。实施例将每个局部区域划分成多个大块，每个大块包括2×2的小块(Block)，每个小块中包含8×8个像素(Cell)，实现图像分块。

步骤2.4，采集每个像素的梯度的幅值和方向；

采集步骤1归一化后的图像I中各像素点的梯度(包含梯度的幅值和方向)。计算图像像素的梯度，通过求导不仅能够捕获轮廓和纹理信息，还能弱化光照。提取图像I中位置(x,y)处像素的梯度方法如下：

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

步骤2.5，基于以输入图像的每个像素为中心建立的预设尺寸的局部区域，对每个局部区域分别提取特征：包括对局部区域中每个像素，将步骤2.4中所得梯度的幅值和步骤2.2中得到的显著概率值结合成带有显著信息的梯度幅值；然后和步骤2.4中得到的梯度的方向形成直方图，称为显著直方图特征。统计每个像素的显著直方图，即可形成每个像素的特征描述子，将每个小块中所有像素的特征描述子串联起来，便得到该小块的特征描述子；将每个大块中所有小块的特征描述子串联起来，便得到该大块的特征描述子；将局部区域中所有大块的特征描述子串联起来，便得到该局部区域的特征描述子，即该局部区域的特征，形成显著特征。

每个像素的显著梯度幅值表示为：

G_s(x,y)＝G(x,y)F(s_(x,y))

其中G(x,y)可以从步骤2.4中得到，对以位置(x,y)处像素为中心的矩形的局部区域，同样采用预定尺寸，相应显著概率值F(s_(x,y))可以从步骤2.2得到，即假设位置(x,y)处像素为像素I_k，取即可。

可见，从样本数据集的正样本和负样本和从测试数据集的测试图片内局部区域中提取特征的方式一致。按此方式，针对测试图片内任何局部区域均可得到是否包含行人的分类结果。无需预先确认测试图片内行人位置，适用于测试图片内多个位置存在行人的情况。

发明人在Pentium(R)、Dual-Core3.20GHz CPU、2G内存的计算机上运行，使用本实施例方法，使用公开的数据集和文献(“Histograms of oriented gradients for humandetection,”in Computer Vision and Pattern Recognition,2005.CVPR2005.IEEEComputer Society Conference on.IEEE,2005,vol.1,pp.886–893.)和文献(PiotrDollar,Christian Wojek,Bernt Schiele,and Pietro Perona,“Pedestrian detection:An evaluation of the state of the art,”Pattern Analysis and MachineIntelligence,IEEE Transactions on,vol.34,no.4,pp.743–761,2012.)中提到行人检测算法做了比较，检测效率有了很大的提升，因此可以应用在多媒体检索、智能交通等领域。

具体实施时，还可采用软件模块化方式实现一种基于显著直方图特征的行人检测系统，实施例提供的系统包括以下模块，

训练模块，用于首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸，然后作为输入图像提取特征，根据所得特征训练分类器；正样本的图像包含行人，负样本的图像不包含行人；

训练模块包括以下子模块，

分类模块包括以下子模块，

各模块具体实现与方法步骤相应，本发明不予赘述。

本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明技术领域的技术人员可以对所描述的具体实施例做各种各样的修改补充或者采用类似的方式替代，但并不会偏离本发明精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于显著直方图特征的行人检测方法，其特征在于：包括训练阶段和测试阶段，

步骤1.1，对输入图像进行颜色空间的归一化；

步骤1.4，采集每个像素的梯度的幅值和方向；

步骤2.1，对输入图像进行颜色空间的归一化；

步骤2.4，采集每个像素的梯度的幅值和方向；

2.根据权利要求1所述基于显著直方图特征的行人检测方法，其特征在于：步骤1.2和2.2中，设归一化后的输入图像记为图像I，图像I的每个像素I_k的显著度Y(I_k)通过下式获得，

Y (I_{k}) = Σ_{i = 1}^{N} d (I_{k}, I_{i})

F (s_{R_{k}}) = \frac{1}{\sqrt{2 π} σ} \exp (- \frac{(s_{R_{k}} - \overset{&OverBar;}{s})}{2 σ^{2}})

其中，和σ²分布代表高斯分布的均值和方差，R_k代表以像素I_k为中心的预设尺寸的局部区域；代表局部区域的显著度，σ代表高斯分布的标准方差。

3.根据权利要求2所述基于显著直方图特征的行人检测方法，其特征在于：步骤1.4和步骤2.4中，采集每个像素单元中各像素点的梯度的幅值和方向如下，

提取位置(x,y)处像素的梯度如下，

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

G (x, y) = \sqrt{G_{x} {(x, y)}^{2} + G_{y} {(x, y)}^{2}}

θ (x, y) = \tan^{- 1} (\frac{G_{y} (x, y)}{G_{x} (x, y)}) .

4.根据权利要求3所述基于显著直方图特征的行人检测方法，其特征在于：步骤1.4和步骤2.4中，每个像素的显著信息的梯度幅值提取如下，

G_s(x,y)＝G(x,y)F(s_(x,y))

5.一种基于显著直方图特征的行人检测系统，其特征在于：包括以下模块，

训练模块包括以下子模块，

分类模块包括以下子模块，