CN105654104A

CN105654104A - 一种基于多粒度特征的行人检测方法

Info

Publication number: CN105654104A
Application number: CN201410719718.6A
Authority: CN
Inventors: 吕楠; 张丽秋
Original assignee: WUXI EYE TECHNOLOGY Co Ltd
Current assignee: WUXI EYE TECHNOLOGY Co Ltd
Priority date: 2014-11-28
Filing date: 2014-11-28
Publication date: 2016-06-08

Abstract

本发明属于视频图像处理技术领域，并提供了一种基于多粒度特征的行人检测方法，包括：S1、提取训练样本集中的多粒度特征向量；S2、基于Gentle？Adaboost级联算法对所述多粒度特征向量进行训练，得到行人级联分类器；S3、利用行人级联分类器对自监控区域获取的输入图像进行行人检测；S4、基于EKM算法对步骤S3中检测到的行人进行跟踪和计数。在本发明中，通过提取训练样本集中训练样本的多粒度特征向量，并通过优化的利用行人级联分类器对监控区域中的行人进行检测，有效地提高了在公共区域内对行人进行人数统计的效率与准确度。

Description

一种基于多粒度特征的行人检测方法

技术领域

本发明属于计算机视频图像处理技术领域，特别涉及一种基于多粒度特征的行人检测方法。

背景技术

随着计算机技术和图像处理技术的发展，基于视频的智能监控系统得到了广泛的应用。在保障社会公共安全和交通安全方面、保护人民生命财产安全方面、在工业控制领域保障安全生产和产品检测方面以及有关商业领域方面都发挥着巨大的作用。目前，智能视频监控系统的应用主要在安全防控领域和非安全防控领域。公共场所人群监控、道路交通安全监控、工业生产安全监控等都属于安全防控领域的应用。非安全领域有：商业领域、工业产品检测、公共交通系统等。

然而，在实际使用中，基于行人轮廓的一维描述的现有技术在识别效率与检测精度上都不甚理想。因此，有必要对现有技术中的行人检测方法提出改进。

发明内容

本发明的目的在于公开一种基于多粒度特征的行人检测方法，用以提高对公共区域内对行人进行人数统计的效率与准确度。

为实现上述发明目的，本发明提供了一种基于多粒度特征的行人检测方法，包括以下步骤：

S1、提取训练样本集中的多粒度特征向量；

S2、基于GentleAdaboost级联算法对所述多粒度特征向量进行训练，得到行人级联分类器；

S3、利用行人级联分类器对自监控区域获取的输入图像进行行人检测；

S4、基于EKM算法对步骤S3中检测到的行人进行跟踪和计数。

作为本发明的进一步改进，所述步骤S1具体包括以下子步骤：

S11、对训练样本进行梯度计算以得到梯度图像；

S12、根据不同的粒度参数对梯度图像进行描述；

S13、提取多粒度特征；

S14、将图像基元在霍夫空间与图像空间之间通过方向划分和/或空间划分的方式建立映射与反映射关系；

S15、计算多粒度特征中的所有特征向量。

作为本发明的进一步改进，所述子步骤S12中对梯度图像进行描述的计算公式为：其中，

是从梯度图像空间I到多粒度特征空间∏_τ的一个映射；τ是粒度参数；是用来控制映射类型的特征参数；是梯度图像的一个多粒度特征的分量。

作为本发明的进一步改进，所述子步骤S13具体为首先将把梯度图像解析成预先定义的形状基元和/或结构基元，然后对所述形状基元和/或结构基元进行多粒度特征提取操作。

作为本发明的进一步改进，所述子步骤S13中的多粒度特征包括精细粒度特征与粗糙粒度特征。

作为本发明的进一步改进，所述子步骤S14中的方向划分具体为：将旋转不确定性参数τ_θ映射回到图像空间中，所述子步骤S14中的空间划分具体为：把平移不确定性参数τ_ρ映射回到图像空间中。

作为本发明的进一步改进，所述子步骤S15具体为：利用积分图快速计算多粒度特征中的所有特征向量。

作为本发明的进一步改进，所述积分图计算多粒度特征中的所有特征向量的过程中，限定所述多粒度特征在霍夫空间中以点(θ₀，ρ₀)为中心所形成的矩形区域R的宽度w∈{4，5，6，8，9，10，12}。

作为本发明的进一步改进，所述训练样本集包括正/负样本集，正/负样本集中的正/负样本为30×30像素的256阶灰度图像，所述正样本为包含行人区域的图像，所述负样本为不包含或者不完全包含行人区域的图像。

作为本发明的进一步改进，步骤S4中的所述“EKM算法”具体为：根据连续的输入图像中前一帧目标位置的坐标，利用Kalman滤波来预测本帧输入图像中目标可能的坐标点，然后利用meanshift算法以估计到的坐标点为起始点进行迭代运算。

与现有技术相比，本发明的有益效果是：在本发明中，通过提取训练样本集中训练样本的多粒度特征向量，并通过优化的利用行人级联分类器对监控区域中的行人进行检测，有效地提高了在公共区域内对行人进行人数统计的效率与准确度。

附图说明

图1为本发明一种基于多粒度特征的行人检测方法的流程示意图；

图2a为子步骤S11中Sobel算子计算x方向的梯度值的示意图；

图2b为子步骤S11中Sobel算子计算y方向的梯度值的示意图；

图3为训练样本中的每个像素点的邻域灰度级作卷积和运算的示意图；

图4为图像基元在霍夫空间与图像空间之间建立映射与反映射关系的示意图；

图5步骤S3中自监控区域获取视频流图像作为输入图像的示意图；

图6步骤S3中利用行人级联分类器对输入图像进行行人检测的示意图。

具体实施方式

下面结合附图所示的各实施方式对本发明进行详细说明，但应当说明的是，这些实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代，均属于本发明的保护范围之内。

参图1所示的本发明一种基于多粒度特征的行人检测方法的流程示意图。

在本实施方式中，由于行人在行走时头部与肩部的变化较小，基于易于检测方面的考虑，可将训练样本集定义为：只包含行头部和/或肩部的正样本集、不包含行人头部和/或肩部的负样本图集。

首先执行步骤S1、提取训练样本集中的多粒度特征向量。

具体的，该步骤S1包括以下五个子步骤：

S11、对训练样本进行梯度计算以得到梯度图像；

S12、根据不同的粒度参数对梯度图像进行描述；

S13、提取多粒度特征；

S15、计算多粒度特征中的所有特征向量。

具体而言，在本实施方式中，所述训练样本集包括正负样本集与负样本集。其中，正样本集中的正样本和负样本集中的负样本均为30×30像素的256阶灰度图像。所述正样本为包含行人区域的图像，所述负样本为不包含或者不完全包含行人区域的图像。需要说明是的，为了降低计算机的开销，也可将仅包含完整人头区域的训练样本归入正样本集中，将不包含人头区域或者包含不完整人头区域的训练样本归入负样本集中，并提取训练样本集中的多粒度特征向量。

“粒度”被用来表示特征对于行人数据的抽象能力，精细粒度特征对于行人数据有较低程度的抽象，具有比较好的细节描述能力，适合对行人数据进行确定性的描述；而粗糙粒度特征对于行人数据有较高程度的抽象，其所体现的通常是一种统计特性。因此，多粒度特征描述意味着对行人数据进行不同层次的抽象，从而得到从确定性描述到统计性描述的一系列具有不同描述特征的行人表示，称为“粒度空间表达”。

从定义看，粒度空间和尺度空间相似。两者的共同点在于都是致力于对物体建立多层次的表达和描述。对于尺度空间而言，这种多层次的表达和描述来自于多种分辨率，这个过程类似于在不同距离来看一个物体，它会产生从清晰到模糊的渐变。而对于粒度空间而言，多层次的表达和描述来自于对目标不同统计层次上的抽象，从确定性的表示到统计性的描述。

多粒度特征在霍夫空间定义了直线段的不确定性。精细粒度特征对应的直线段不确定性较低，所以它的几何特征性很明确，可以对目标进行确定性的描述。而粗糙粒度特征对应的直线段具有较高的不确定性，所以这些直线段描述确定的几何结构的能力相对较弱，而统计信息占主导。

在本实施方式中，对训练样本进行梯度计算可通过以下方式实现。

参图2a、图2b及图3所示，对一帧256级灰度的训练样本图像在某个像素点的灰度值设为I(x，y)，对于该像素点的梯度值计算公式如下公式(1)所示：

s (x, y) = \sqrt{I_{x}^{2} + I_{y}^{2}} - - - (1);

其中，s(x，y)为该像素点(x，y)处所求的梯度值，I_x、I_y为利用sobel算子分别计算在x、y方向上的梯度值。其中图2a为Sobel算子计算该像素点(x，y)沿x方向的梯度值的示意图；图2b为Sobel算子计算该像素点(x，y)沿y方向的梯度值的示意图。

I_x、I_y分别表示sobel算子与如图3所示的图像邻域的灰度级做卷积运算。图3中的Z_i(i＝1，2，....，9)表示该像素点(x，y)八邻域周围的像素点的灰度值。I_x及I_y用如下公式(2)与公式(3)计算得到：

I_{x} = [\begin{matrix} 1 & 2 & 1 \\ 0 & 0 & 0 \\ - 1 & - 2 & - 1 \end{matrix}] * [\begin{matrix} Z_{1} & Z_{2} & Z_{3} \\ Z_{4} & (x, y) & Z_{6} \\ Z_{7} & Z_{8} & Z_{9} \end{matrix}] - - - (2);

I_{y} = [\begin{matrix} 1 & 0 & - 1 \\ 2 & 0 & - 2 \\ 1 & 0 & - 1 \end{matrix}] * [\begin{matrix} Z_{1} & Z_{2} & Z_{3} \\ Z_{4} & (x, y) & Z_{6} \\ Z_{7} & Z_{8} & Z_{9} \end{matrix}] - - - (3);

对于训练样本图像在像素点(x，y)处对x、y方向上的梯度值分别为如下公式(4)与公式(5)计算得到：

I_x＝(Z₁+2Z₂+Z₃)-(Z₇+2Z₈+Z₉)(4)；

I_y＝(Z₁+2Z₄+Z₇)-(Z₃+2Z₆+Z₉)(5)。

接下来，执行子步骤S12、根据不同的粒度参数对梯度图像进行描述。

具体而言，对于给定训练样本I，可以根据不同的粒度参数对梯度图像进行描述，具体参公式(6)所示：

其中，是从梯度图像空间I到多粒度特征空间∏_τ的一个映射；τ是粒度参数；是用来控制映射类型的特征参数；是梯度图像的一个多粒度特征的分量。

公式(6)说明在粒度空间下，粒度特征提取过程本身是统一的，而多粒度特征可以通过粒度参数τ来进行控制。

公式(6)的映射方程还可以具体表达为公式(7)所示：

其中，多粒度特征提取方程f(·)被表达为两个方程T(·)和S(·)的联合。称T(·)为图像解析方程，S(·)为图像描述方程。

具体而言，该子步骤S13“提取多粒度特征”主要由两个步骤组成：

首先，通过图像解析方程T(·)把梯度图像解析成预先定义的形状基元和/或结构基元。

然后，利用图像描述方程S(·)对这些形状基元和/或结构基元建立具体的描述。

该子步骤S13中，多粒度特征提取中的形状基元包括广义直线段、广义曲线段、圆环或者椭圆环；多粒度特征提取中的结构基元包括若干重叠的圆环、若干重叠的椭圆环。在本实施方式中，我们仅对利用图像描述方程S(·)对广义直线段建立具体描述为例进行详细阐述。本领域技术人员可知，也可首先通过图像解析方程T(·)把梯度图像解析成预先定义的结构基元、形状基元和结构基元的组合，然后利用图像描述方程S(·)对这些预先定义的结构基元、形状基元和结构基元的组合建立具体的描述的方式提取多粒度特征。

具体的，该图像解析方程可以看作是一个广义直线段检测器。在二维的图像平面上，一条直线段可以通过参数方程解析表达为公式(8)所示：

ρ＝x*cosθ+y*sinθ(8)；

其中：ρ表示原点到直线段L的距离；θ表示直线段L的法线L’与x-轴的夹角。

在广义直线段上的任意一点(x，y)将满足公式(9)所示：

{(x，y)|ρ＝F(x，y；θ)，(x，y)∈χ²}(9)；

其中，F(x，y；θ)＝x*cosθ+y*sinθ为公式(8)表示的广义直线段的参数方程；χ²为坐标(x，y)的取值范围。

参图4所示，在图像空间上的直线段L将对应于霍夫空间中的一个点P(θ₀，ρ₀)。因此，可以用霍夫空间中的一个点来表示图像空间的一条直线段L。进一步，把霍夫空间中的一个点扩展成一个以(θ₀，ρ₀)为中心，(2τ_θ，2τ_ρ)为边长的矩形区域R。这个霍夫空间中的矩形区域R在图像空间上的逆投影为一个蝴蝶状的蝶形区域D。基于这个扩展，可以将霍夫空间中的矩形区域R和图像平面上蝶形区域D之间建立映射与反映射的关系。因此，可以将公式(9)的直线段L定义推广为如下公式(10)所示：

{(x，y)|ρ＝F(x，y；θ)，(x，y)∈χ²，|ρ-ρ₀|≤τ_ρ，|θ-θ₀|≤τ_θ}(10)；

公式(10)所定义的直线段L称为“广义直线段”。这个定义具体为：图像平面上的点(即像素点)经过霍夫变换后，所有的落入霍夫空间中的矩形区域R的点，都可以认为属于同一条广义直线段。因此，广义直线段对于旋转、平移和不连续具有一定的鲁棒性。进一步，广义直线段对于旋转的鲁棒性可以通过参数τ_θ来控制，对于平移的鲁棒性可以通过参数τ_ρ来控制。

公式(10)中对于广义直线段的定义的一个显著的优势在于它可以把狭义上直线段的不确定性控制显式的体现在定义当中。因为对于图像处理和计算机视觉的相关应用而言，受图像内容本身和数字图像离散化表示的影响，在实际应用中很难找到严格遵守公式(9)所表示的直线段(参图4所示)。因此，广义直线段对于实际图像(即训练样本或者输入图像)上的不完全的直线段以及类似的呈直线形状的线条具有更强的描述能力。而且，这种鲁棒性可以用区域尺度(2τ_θ，2τ_ρ)很容易地进行控制，相对较大的区域尺寸对应于更强鲁棒性的广义直线段。

因为每一条广义直线段对于旋转和平移的鲁棒性可以用(τ_θ，τ_ρ)来控制，所以可以通过变化这两个参数来得到一组具有不同表达能力的直线。这个特性正好和前面提到的粒度空间的特性相一致。所以，参数τ_θ和τ_ρ可以看作是粒度参数τ在当前实现中的具体化。一方面，当τ_θ和τ_ρ取值比较小的时候，对于广义直线段的定义是确定的，这是精细粒度特征的基本特性；另一方面，当τ_θ和τ_ρ取值比较大的时候，对于广义直线段的描述只是统计性的，且对于旋转和平移具有较好的鲁棒性，这是粗糙粒度特征应具有的特性。所以，在公式(7)中特征参数可以具体表示为而粒度参数τ可以具体表示为τ＝(τ_θ，τ_ρ)。因此，在公式(7)中的图像解析方程T(·)可以进一步地表示为如下公式(11)所示：

用图像描述方程S(·)来对公式(10)中定义的广义直线段建立描述，即用强度和位置分布信息来对广义直线进行描述。更具体的，对于位置分布，对所有在划分中的梯度不为零的点的位置分布信息进行统计，将“位置分布的均值”和“切向——法向标准差”作为空间分布特征。值得注意的是τ_θ和τ_ρ取比较小的值的时候，在法向上的标准差并没有太大意义。因为，此时广义直线段的形状已经由τ_θ和τ_ρ进行了比较严格的约束；当τ_θ和τ_ρ取比较大的值的时候，形状约束会比较弱，这时法线方向上的分布变化可以用标准差来进行更为良好的描述。

然后，将图像基元在霍夫空间与图像空间之间通过方向划分和/或空间划分的方式建立映射与反映射关系。在本实施方式中，图像基元选定为广义直线段。其中，霍夫变换主要用于来将图像中分离出具有某种相同几何形状(例如圆、椭圆等)。霍夫变换寻找直线与圆的方法相比其他方法可以更好的减少噪声干扰。

广义直线段对应于霍夫空间中的一个以(θ₀，ρ₀)为中心的2τ_θ×2τ_ρ的矩形区域R，而对广义直线段的描述却是在图像空间中进行的。因此，需要把霍夫空间中的矩形区域R映射回到图像平面上的相应区域(即图4中的蝶形区域D)。在本实施方式中是通过方向划分和/或空间划分来实现的。

具体的，子步骤S14中的所述“方向划分”是指，把旋转不确定性参数τ_θ映射回到图像空间中。对于一个给定的训练样本I，训练样本图像上的每一个像素可以用一个三元组[x，y，I(x，y)]表示。这里x和y表示像素的位置，I(x，y)表示像素的灰度值。通过计算图像的梯度，可以得到梯度图像I_(d)，其中的每一个像素都可以用一个五元组[x，y，s，θ，ρ]来表示。其中，表示梯度的强度；θ＝arctan(-I_x/I_y)表示梯度的切线角度；ρ可以参照公式(8)计算；其中，I_x和I_v表示训练样本图像的灰度在x和y方向上的一阶导数。

然后，对角度θ进行量化，量化步长取为在公式(10)中定义的旋转不确定性τ_θ。因此，可以把梯度图像划分成n个互不相交的通道：其中，n＝[π/τ_θ]，θ_i＝i*τ_θ称θ_i为每个通道的主角度。对于每个通道只有那些量化后梯度角度为θ_i的像素点被保留，其它像素点的梯度被置为0。上述操作称之为梯度图像的“方向划分”。

具体的，子步骤S14中的所述“空间划分”是指，把平移不确定性参数τ_ρ映射回到图像空间中。对于梯度图像的每一个通道用一组间距为τ_ρ的平行分割线将这个通道划分成平行的带状的区域，而且每一条分割线的切线方向等于这个通道的主角度θ_i。

通过“方向划分”与“空间划分”，可以对图像空间中的一种划分(即“方向划分”或“空间划分”)与霍夫空间中的一个矩形区域R建立相应的映射与反映射关系(参图4所示)。对于广义直线段的描述可以通过一种划分(即“方向划分”或“空间划分”)或者两种划分(即“方向划分”和“空间划分”)的统计量得到，而且多粒度特征可以通过参数τ＝(τ_θ，τ_ρ)在划分的过程中进行直接控制。

需要说明是的，在子步骤S14中也可以仅仅进行“方向划分”或者“空间划分”，以将图像基元在霍夫空间与图像空间之间建立映射与反映射关系。

在本实施方式中，对于每一个主角度为θ_i的通道，所谓“多粒度特征”是一个七维的异质向量多粒度特征可以用一个矩形区域R和粒度参数(τ_θ，τ_ρ)来指定。

如前所述，首先在矩形区域R内进行“方向划分”，然后对于每一个通道可以得到“空间划分”其中P_i代表每一个独立的“空间划分”，n代表划分的数目。每一个划分内的梯度强度可以表示为{g_i|g_i＝q(P_i)；i＝1，....，n}；其中q(·)计算划分内的梯度的强度和。

具体的，在本实施方式中，所述“多粒度特征”中的各个分量可以采用如下方式计算：

i′max＝argmax(g_i)是具有最大梯度强度的划分的索引值，可以将这个索引值归一化为

i_{\max} = \frac{i_{\max}^{'}}{n} .

g′_max＝max(g_i)是所有划分中的最大梯度响应值，将其归一化为

σ是所有划分的梯度强度的标准差，可以用如下公式计算其中，

\overset{&OverBar;}{g} = \frac{1}{n} Σ_{l = 1}^{n} g_{i} .

m_x和m_y是最大梯度响应划分内所有非零像素点的位置的均值，可以通过如下公式来计算：

m_{x} = \frac{1}{t} Σ_{i = 0}^{t} \frac{(x_{i} - x_{0})}{ω}, m_{x} = \frac{1}{t} Σ_{i = 0}^{t} \frac{(y_{i} - y_{0})}{ω};

其中，t表示非零像素点的数目，(x₀，y₀)表示矩形区域R的中心，(w，h)表示该矩形区域R的尺寸。

v_norm和v_tang是最大梯度响应划分内所有非零像素点的位置分布沿着梯度和法向方向的标准差，可以利用如下公式计算：

v_{norm} = \sqrt{\frac{1}{t} Σ_{i = 1}^{t} {(r_{i, norm} - m_{norm})}^{2}}, v_{\tan g} = \sqrt{\frac{1}{t} Σ_{i = 1}^{t} {(r_{i, \tan g} - m_{\tan g})}^{2}};

其中，

[\begin{matrix} m_{norm} \\ m_{\tan g} \end{matrix}] = A \times [\begin{matrix} m_{x} \\ m_{y} \end{matrix}], [\begin{matrix} r_{i, norm} \\ r_{i, \tan g} \end{matrix}] = A \times [\begin{matrix} x_{i} \\ y_{i} \end{matrix}], A = [\begin{matrix} \cos θ_{i} & - \sin θ_{i} \\ \sin θ_{i} & {\cos θ}_{i} \end{matrix}],

θ_i表示当前通道的主角度。

通过上述多粒度特征的各个分量的计算，一方面能够有效地描述区域内显著的结构或者形状(即图4中“图像空间”中的“广义直线段”)，另一方面也可以有效地描述整体的梯度强度分布信息。

例如，多粒度特征中的分量用来描述具有最大响应的划分。实际上，这个划分也对应于当前区域内在方向θ_i上的最显著的结构或者形状。同时用来描述所有划分的梯度强度分布信息。最终的多粒度特征值是所有方向通道中的多粒度特征分量的联合，并可以表示为因为上述特征的计算可以分解成一系列区域内的求和操作，可以通过积分图的方式加速运算，其时间复杂度为O(n·N)，其中n为“方向划分”的数目，N为检测图像的像素数目。

在多粒度特征所表达的粒度空间里，其粒度变化的两个极端情况为：在最精细粒度情况下，多粒度特征退化成Edgelet特征；在最粗糙粒度情况下，多粒度特征退化成HOG特征。

参图4所示，一个多粒度特征可以用一个矩形区域R(x，y，w，h)和粒度参数(τ_θ，τ_ρ)来指定；其中，τ_θ∈[0，π]。因为用τ_θ来控制量化后的梯度方向的数目，所以只用τ_ρ来实际控制特征的粒度。

在采用最粗糙粒度时，整个矩形区域R内将只有一种“空间划分”，而这唯一的“空间划分”与矩形区域R(x，y，w，h)重合。在这种情况下每个方向通道的多粒度特征向量变为：

其中，g是矩形区域R内的梯度强度之和。如果进一步略去位置和形状信息m_x，m_y，v_norm，v_tang，多粒度特征将只含有一个有效的分量而最终的特征向量变为此时，我们可以看到多粒度特征变成了HOG特征的一个cell。在采用最精细粒度τ_ρ＝1时，多粒度特征可以表示限定所述多粒度特征在霍夫空间中以点(θ₀，ρ₀)为中心所形成的矩形区域R的宽度w∈{4，5，6，8，9，10，12}内的一条切向为θ_i的直线段。而这条直线段的方向用θ_i来表示，强度用来表示，位置用来表示。在这种情况下，多粒度特征退化为Edgelet特征。

在本实施方式中，对于多粒度特征，除了位置和尺寸参数(x，y，w，h)以外，还有两个粒度参数(τ_θ，τ_ρ)。尽管可以同时调整τ_θ和τ_ρ来控制对于旋转和平移的鲁棒性，但在实际应用过程中，设定τ_θ＝π/9为常数，只利用τ_ρ来进行粒度控制。通过这种方式，梯度图像的方向通道的数目是固定的，可以利用积分图来快速计算多粒度特征中的所有特征向量。

另外，在本实施方式中，限定所述多粒度特征在霍夫空间中以点(θ₀，ρ₀)为中心所形成的矩形区域R的宽度w∈{4，5，6，8，9，10，12}，限定多粒度特征的矩形区域R的宽高比w/h∈{1/0.5，1/0.8，1/1.0，1/1.4，1/1.8，1/2.0，1/2.2，1/2.4}。

接下来，执行步骤S2、基于GentleAdaboost级联算法对步骤S1中所得到的多粒度特征向量进行训练，得到行人级联分类器。

其中，该正样本集中的正样本是包含行人头部和/或肩部的样本(即正样本)；该负样本集中的负样本是不包含行人头部和/或肩部的样本(即负样本)。具体的，在本实施方式中，在初始化行人分类器中的正样本集中的正样本的个数为4000，负样本集中的负样本的个数为6000。由于GentleAdaboost级联算法是本技术领域的常规技术手段，故在此不再赘述。

然后，执行步骤S3、利用行人级联分类器对自监控区域获取的输入图像进行行人检测。

参图5所示，在本实施方式中，摄像机10垂直拍摄并可适用于室外环境和室内环境。在本实施方式中，该步骤中的“通过摄像机获取监控区域的视频流图像”具体为：通过摄像机10获取监控区域30的视频流图像作为输入图像，所述监控区域30位于摄像机10的正下方。

具体的，摄像机10设置在出入口20的正上方，行人可沿着箭头201的方向上在出入口20中来回走动。摄像机10所获取的监控区域30可完全覆盖出入口20的全部区域。该出入口20可设置在需要对行人人数进行统计的商场、车库、银行等需要重点监控场所的大门口或者走廊中。

需要说明的是，本发明在摄像机10垂直地正对着监控区域30时的效果最佳，当然可也将摄像机10倾斜地对着需要进行行人人数计数统计的区域，以通过摄像机10覆盖整个监控区域30。

在本实施方式中，该监控区域30为矩形；当然也可以为正方形或圆形或者其他形状。摄像机10位于监控区域30的中心点301的正上方，此时该监控区域30位于摄像机10的正下方。

参图6所示，在本实施方式中，由1到n层次的检测单元构成级联结构，输入待检测区域从第一层检测单元开始，逐步判断待检测区域是否是行人区域。如果在某个层次的检测单元中被判断为“非”，则将该待检测图像归为“非行人区域”一类；如果经过所有层次的检测单元1～n都判断是行人区域后，则输出行人区域。从1到n层次的检测单元均是利用GentleAdaboost级联算法训练得到。

最后，执行步骤S4、基于EKM算法对步骤S3中检测到的行人进行跟踪和计数。

EKM算法是采用Kalman滤波和meanshift算法相结合的方法，其具体为：根据连续的输入图像中前一帧目标位置的坐标，利用Kalman滤波来预测本帧输入图像中目标可能的坐标点，然后利用meanshift算法以估计到的坐标点为起始点进行迭代运算。

Kalman是一种递归的估计，即只要获知上一时刻状态的估计值以及当前状态的观测值就可以计算出当前状态的估计值，因此不需要记录观测或者估计的历史信息。

由于Kalman滤波估计到的目标坐标点相比上一帧目标位置更接引本帧的目标位置，所以在运用meanshift算法对其迭代求解本帧目标位置的时候，可以有效的减少迭代计算的次数，缩短整体的目标识别时间。最后进行计数，得到行人的个数。当然，本实施方式也可通过对检测到的行人轮廓的质心进行跟踪与计数。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种基于多粒度特征的行人检测方法，其特征在于，包括以下步骤：

S1、提取训练样本集中的多粒度特征向量；

S4、基于EKM算法对步骤S3中检测到的行人进行跟踪和计数。

2.根据权利要求1所述的行人检测方法，其特征在于，所述步骤S1具体包括以下子步骤：

S11、对训练样本进行梯度计算以得到梯度图像；

S12、根据不同的粒度参数对梯度图像进行描述；

S13、提取多粒度特征；

S15、计算多粒度特征中的所有特征向量。

3.根据权利要求2所述的行人检测方法，其特征在于，所述子步骤S12中对梯度图像进行描述的计算公式为：

{{\overset{&OverBar;}{d}}_{θ, τ} | {\overset{&OverBar;}{d}}_{θ, τ} = f (I; θ, τ), τ &Element; Γ, {\overset{&OverBar;}{d}}_{θ, τ} &Element; Π_{τ}};

其中，

4.根据权利要求2所述的行人检测方法，其特征在于，所述子步骤S13具体为首先将把梯度图像解析成预先定义的形状基元和/或结构基元，然后对所述形状基元和/或结构基元进行多粒度特征提取操作。

5.根据权利要求4所述的行人检测方法，其特征在于，所述子步骤S13中的多粒度特征包括精细粒度特征与粗糙粒度特征。

6.根据权利要求2所述的行人检测方法，其特征在于，所述子步骤S14中的方向划分具体为：将旋转不确定性参数τ_θ映射回到图像空间中，所述子步骤S14中的空间划分具体为：把平移不确定性参数τ_ρ映射回到图像空间中。

7.根据权利要求2所述的行人检测方法，其特征在于，所述子步骤S15具体为：利用积分图快速计算多粒度特征中的所有特征向量。

8.根据权利要求7所述的行人检测方法，其特征在于，所述积分图计算多粒度特征中的所有特征向量的过程中，限定所多述粒度特征在霍夫空间中以点(θ₀，ρ₀)为中心所形成的矩形区域R的宽度w∈{4，5，6，8，9，10，12}。

9.根据权利要求1所述的行人检测方法，其特征在于，所述训练样本集包括正/负样本集，正/负样本集中的正/负样本为30×30像素的256阶灰度图像，所述正样本为包含行人区域的图像，所述负样本为不包含或者不完全包含行人区域的图像。

10.根据权利要求1所述的行人检测方法，其特征在于，步骤S4中的所述“EKM算法”具体为：根据连续的输入图像中前一帧目标位置的坐标，利用Kalman滤波来预测本帧输入图像中目标可能的坐标点，然后利用meanshift算法以估计到的坐标点为起始点进行迭代运算。