WO2015184764A1

WO2015184764A1 - 行人检测方法及装置

Info

Publication number: WO2015184764A1
Application number: PCT/CN2014/094421
Authority: WO
Inventors: 邓硕; 董振江; 田玉敏; 郑海红
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-11-17
Filing date: 2014-12-19
Publication date: 2015-12-10
Also published as: CN105678347A

Abstract

本发明公开了一种行人检测方法及装置，其中，该方法包括：对监控的视频序列进行处理得到该视频序列的前景图；根据该前景图得到选定区域的边缘图；对该边缘图的边缘点进行处理得到待检测轮廓图；根据预先建立的行人轮廓模板对该待检测轮廓图进行行人检测。通过本发明，解决了相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题，进而达到了检测结果较为准确的效果。

Description

行人检测方法及装置

技术领域

本发明涉及通信领域，具体而言，涉及一种行人检测方法及装置。

背景技术

目前，行人检测广泛应用于智能人机交互、视频监控等各种领域，引起了人们广泛的研究兴趣。现有的行人检测技术主要分为3大类：基于背景模型的行人检测、基于分类器的行人检测和基于模板匹配的行人检测。基于背景模型的行人检测速度快，但准确率比较低。基于分类器的行人检测方法在近几年取得了较大的发展，其核心是选择最能区分不同目标的特征，然后离线训练分类器，该类方法通常都有比较好的检测效果，但在某些情况下会失效，比如：监控摄像头安装比较高，行人在视野中的面积比较小，因此表示行人的特征很少，导致分类效果下降。在这种情况下，轮廓成为行人的典型特征，因此基于模板匹配的行人检测技术有比较大的优势。

在模板匹配算法中，David Schreiber提出的基于GPU和多种线索的行人检测方法效果较好，该方法通过有效计算行人的形状和行人的运动信息，并在概率框架下将两者结合在一起，基于最优化理论确定行人的位置及遮挡情况。该方法适用于监控环境，既使场景比较复杂，也能够取得比较理想的检测结果。大量实验结果表明，该方法存在如下问题：(1)目标边缘基于像素表示，使得不同方向的边缘图有很大的重复性，不仅会导致匹配的准确性降低，而且增加了时间复杂度；(2)没有很好的运用背景模型提取边缘信息，从而降低时间复杂度；(3)高度模型基于CCD的成像原理，通过人工标定数据并将数据带入模型计算建立，建模过程依赖于用户，并且比较复杂，很难应用于实际；(4)匹配模板较多(30个)，时间复杂度较高。

针对相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题，目前尚未提出有效的解决方案。

发明内容

本发明提供了一种行人检测方法及装置，以至少解决相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题。

根据本发明的一个方面，提供了一种行人检测方法，包括：对监控的视频序列进行处理得到所述视频序列的前景图；根据所述前景图得到选定区域的边缘图；对所述边缘图的边缘点进行处理得到待检测轮廓图；根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测。

优选地，在根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测之前还包括：获取行人数据集，根据所述数据集建立所述行人轮廓模板。

优选地，根据所述数据集建立所述行人轮廓模板包括：从标准行人数据库INRIA中随机选择N人，对所述视频序列进行特征点标记，所述特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；对所述形状S进行归一化处理；对进行归一化处理的所述形状S进行主成分分析PCA变换，得到所述视频序列的平均形状S₀，以及前n个特征值对应的形状特征S_i(i＝1,2,…n)；行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到所述行人轮廓模板。

优选地，在对所述边缘图的边缘点进行处理得到所述待检测轮廓图之后还包括：

判断是否存在行人高度模型；在判断结果为是的情况下，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测。

优选地，根据所述前景图得到所述选定区域的边缘图包括：根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,....N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；针对所述选定区域，计算得到第一边缘图；将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图，基于线段拟合技术将所述边缘图表示成线段的集合。

优选地，根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图包括：初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；用第一帧图像初始化码本，将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；读入下一帧图像，将所述图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中， dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；更新码本，逐渐收敛形成背景模型，根据所述背景模型确定所述前景图。

优选地，所述方法还包括：若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

若距离dis_u_v大于阈值d，说明u与v不匹配，则进行如下操作：令该像素为前景；降低该像素位置所有码字的重要性，如果减小重要性后该像素位置的码字重要性参数小于0，则删除该码字；将更新后的所有的码子按重要性由高到低进行排序；若该像素位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1。

优选地，针对所述选定区域，计算得到所述第一边缘图包括：将原始彩色视频帧转换成灰度图；用Sobel算子计算所述灰度图水平方向和垂直方向的梯度，得到梯度图；将所述梯度图二值化，得到所述第一边缘图。

优选地，将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图包括：在进行Chamfer匹配前，将所述第一边缘图和所述前景图按位“与”得到所述选定区域的所述边缘图。

优选地，基于线段拟合技术将所述边缘图表示成线段的集合包括：遍历所述边缘图，记录所有边缘点的坐标及编号，记作edgeMap；判断所述edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录所述第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出所述直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算所述第二邻域中的点与所述直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，所述第一预定距离小于所述第二预定距离；去掉所述已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为所述线段的集合。

优选地，所述方法还包括：利用所述线段的集合，基于多尺度FDCM方法和数据回归方法建立所述行人高度模型。

优选地，所述方法还包括：利用所述多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，得到所述行人高度模型。

优选地，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测包括：将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照所述行人高度模型将匹配模板进行缩放；根据所述距离图计算所述行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果所述检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。

根据本发明的另一方面，还提供了一种行人检测装置，包括：第一处理模块，设置为对监控的视频序列进行处理得到所述视频序列的前景图；第二处理模块，设置为根据所述前景图得到选定区域的边缘图；第三处理模块，设置为对所述边缘图的边缘点进行处理得到待检测轮廓图；第一行人检测模块，设置为根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测。

优选地，所述装置包括：建立模块，设置为获取行人数据集，根据所述数据集建立所述行人轮廓模板。

优选地，所述建立模块包括：标记单元，设置为从标准行人数据库INRIA中随机选择N人，对所述视频序列进行特征点标记，所述特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；归一化处理单元，设置为对所述形状S进行归一化处理；分析处理单元，设置为对进行归一化处理的所述形状S进行主成分分析PCA变换，得到所述视频序列的平均形状S₀，以及前n个特征值对应的形状特征S_i(i＝1,2,…n)；

行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到所述行人轮廓模板。

优选地，所述装置还包括：判断模块，设置为判断是否存在行人高度模型；第二行人检测模块，设置为在判断结果为是的情况下，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测。

优选地，所述第二处理模块包括：命令单元，设置为根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,....N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；第一计算单元，设置为针对所述选定区域，计算得到第一边缘图；表示单元，设置为将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图，基于线段拟合技术将所述边缘图表示成线段的集合。

优选地，所述命令单元包括：初始化子单元，设置为初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；记录子单元，设置为根据第一帧图像初始化码本将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；运算子单元，设置为读入下一帧图像，将所述图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；

更新子单元，设置为更新码本，逐渐收敛形成背景模型，根据所述背景模型确定所述前景图。

优选地，所述装置还包括：第一像素处理单元，设置为若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

第二像素处理单元，设置为若距离dis_u_v大于阈值d，说明u与v不匹配，则进行如下操作：令该像素为前景；降低该像素位置所有码字的重要性，如果减小重要性后该像素位置的码字重要性参数小于0，则删除该码字；将更新后的所有的码子按重要性由高到低进行排序；若该像素位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1。

优选地，所述第一计算单元包括：转换子单元，设置为将原始彩色视频帧转换成灰度图；计算子单元，设置为用Sobel算子计算所述灰度图水平方向和垂直方向的梯度，得到梯度图；二值化子单元，设置为将所述梯度图二值化，得到所述第一边缘图。

优选地，所述表示单元包括：第一处理子单元，设置为在进行Chamfer匹配前，将所述第一边缘图和所述前景图按位“与”得到所述选定区域的所述边缘图。

优选地，所述表示单元包括：遍历子单元，设置为遍历所述边缘图，记录所有边缘点的坐标及编号，记作edgeMap；停止子单元，设置为判断所述edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；拟合子单元，设置为在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录所述第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出所述直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算所述第二邻域中的点与所述直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，所述第一预定距离小于所述第二预定距离；第二处理子单元，设置为去掉所述已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为所述线段的集合。

优选地，所述装置还包括：建立单元，设置为利用所述线段的集合，基于多尺度FDCM方法和数据回归方法建立所述行人高度模型。

优选地，所述装置还包括：记录单元，设置为利用所述多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；拟合行人高度单元，设置为利用线性拟合方法根据行人出现位置拟合行人高度，得到所述行人高度模型。

优选地，所述第二行人检测模块包括：第二计算单元，设置为将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；缩放单元，设置为按照所述行人高度模型将匹配模板进行缩放；扫描单元，设置为根据所述距离图计算所述行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；增加单元，设置为将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果所述检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；确定目标单元，设置为如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。

通过本发明，采用对监控的视频序列进行处理得到所述视频序列的前景图；根据所述前景图得到选定区域的边缘图；对所述边缘图的边缘点进行处理得到待检测轮廓图；根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测，解决了相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题，进而达到了检测结果较为准确的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的行人检测方法的流程图；

图2是根据本发明实施例的行人检测装置的框图；

图3是根据本发明优选实施例的行人检测装置的框图一；

图4是根据本发明优选实施例的行人检测装置的框图二；

图5是根据本发明优选实施例的行人检测装置的框图三；

图6是根据本发明优选实施例的行人检测装置的框图四；

图7是根据本发明优选实施例的行人检测装置的框图五；

图8是根据本发明优选实施例的行人检测装置的框图六；

图9是根据本发明优选实施例的行人检测装置的框图七；

图10是根据本发明实施例的面向远景监控视频的行人检测系统的示意图；

图11是根据本发明实施例的生成的行人轮廓模板集的示意图；

图12是根据本发明优选实施例的行人检测的示意图一；

图13是根据本发明优选实施例的行人检测的示意图二；

图14是根据本发明优选实施例的行人检测的示意图三。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

在本实施例中提供了一种行人检测方法，图1是根据本发明实施例的行人检测方法的流程图，如图1所示，该流程包括如下步骤：

步骤S102，对监控的视频序列进行处理得到该视频序列的前景图；

步骤S104，根据该前景图得到选定区域的边缘图；

步骤S106，对该边缘图的边缘点进行处理得到待检测轮廓图；

步骤S108，根据预先建立的行人轮廓模板对该待检测轮廓图进行行人检测。

通过上述步骤，对监控的视频序列进行处理得到该视频序列的前景图，根据该前景图得到选定区域的边缘图，对该边缘图的边缘点进行处理得到待检测轮廓图，根据预先建立的行人轮廓模板对该待检测轮廓图进行行人检测，解决了相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题，进而达到了检测结果较为准确的效果。

作为一种优选的实施方式，在根据预先建立的行人轮廓模板对该待检测轮廓图进行行人检测之前，获取行人数据集，根据该数据集建立该行人轮廓模板。其中，根据数据集建立该行人轮廓模板包括：从标准行人数据库INRIA中随机选择N人，对该视频序列进行特征点标记，该特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；对该形状S进行归一化处理；对进行归一化处理的该形状S进行主成分分析PCA变换，得到该视频序列的平均形状S₀，以及前n个特征值对应的形状特征 S_i(i＝1,2,…n)；行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到该行人轮廓模板。

作为一种优选的实施方式，在对边缘图的边缘点进行处理得到待检测轮廓图之后，判断是否存在行人高度模型；在判断结果为是的情况下，根据预先建立的该行人轮廓模板和该行人高度模型对该待检测轮廓图进行行人检测。

其中，根据该前景图得到该选定区域的边缘图包括：根据该视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定该前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,....N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；针对该选定区域，计算得到第一边缘图；将该前景图和该第一边缘图进行处理得到该选定区域的边缘图，基于线段拟合技术将该边缘图表示成线段的集合。

本实施例中，根据该视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定该前景图包括：初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；用第一帧图像初始化码本，将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；读入下一帧图像，将该图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；更新码本，逐渐收敛形成背景模型，根据该背景模型确定该前景图。

本实施例中，若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

其中，针对该选定区域，计算得到该第一边缘图包括：将原始彩色视频帧转换成灰度图；用Sobel算子计算该灰度图水平方向和垂直方向的梯度，得到梯度图；将该梯度图二值化，得到该第一边缘图。

作为一种优选的实施方式，在进行Chamfer匹配前，将该第一边缘图和该前景图按位“与”得到该选定区域的该边缘图。

上述的基于线段拟合技术将该边缘图表示成线段的集合包括：遍历该边缘图，记录所有边缘点的坐标及编号，记作edgeMap；判断该edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录该第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出该直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算该第二邻域中的点与该直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，该第一预定距离小于该第二预定距离；去掉该已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为该线段的集合。

本实施例中，还利用该线段的集合，基于多尺度FDCM方法和数据回归方法建立该行人高度模型。

优选地，利用该多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，得到该行人高度模型。

上述的根据预先建立的该行人轮廓模板和该行人高度模型对该待检测轮廓图进行行人检测包括：将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照该行人高度模型将匹配模板进行缩放；根据该距离图计算该行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果该检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。

根据本发明的另一方面，还提供了一种行人检测装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本发明实施例的行人检测装置的框图，如图2所示，包括：第一处理模块22、第二处理模块24、第三处理模块26以及第一行人检测模块28，下面对各个模块进行简要说明。

第一处理模块22，设置为对监控的视频序列进行处理得到该视频序列的前景图；

第二处理模块24，设置为根据该前景图得到选定区域的边缘图；

第三处理模块26，设置为对该边缘图的边缘点进行处理得到待检测轮廓图；

第一行人检测模块28，设置为根据预先建立的行人轮廓模板对该待检测轮廓图进行行人检测。

图3是根据本发明优选实施例的行人检测装置的框图一，如图3所示，该装置包括：

建立模块32，设置为获取行人数据集，根据该数据集建立该行人轮廓模板。

图4是根据本发明优选实施例的行人检测装置的框图二，如图4所示，该建立模块32包括：

标记单元42，设置为从标准行人数据库INRIA中随机选择N人，对该视频序列进行特征点标记，该特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；

归一化处理单元44，设置为对该形状S进行归一化处理；

分析处理单元46，设置为对进行归一化处理的该形状S进行主成分分析PCA变换，得到该视频序列的平均形状S₀，以及前n个特征值对应的形状特征S_i(i＝1,2,…n)；

行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到该行人轮廓模板。

图5是根据本发明优选实施例的行人检测装置的框图三，如图5所示，该装置还包括：

判断模块52，设置为判断是否存在行人高度模型；

第二行人检测模块54，设置为在判断结果为是的情况下，根据预先建立的该行人轮廓模板和该行人高度模型对该待检测轮廓图进行行人检测。

图6是根据本发明优选实施例的行人检测装置的框图四，如图6所示，该第二处理模块24包括：

命令单元62，设置为根据该视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定该前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,....N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；

第一计算单元64，设置为针对该选定区域，计算得到第一边缘图；

表示单元66，设置为将该前景图和该第一边缘图进行处理得到该选定区域的边缘图，基于线段拟合技术将该边缘图表示成线段的集合。

图7是根据本发明优选实施例的行人检测装置的框图五，如图7所示，上述的命令单元62包括：

初始化子单元72，设置为初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；

记录子单元74，设置为根据第一帧图像初始化码本将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；

运算子单元76，设置为读入下一帧图像，将该图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；

更新子单元78，设置为更新码本，逐渐收敛形成背景模型，根据该背景模型确定该前景图。

优选地，该装置还包括：

第一像素处理单元，设置为若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

图8是根据本发明优选实施例的行人检测装置的框图六，如图8所示，上述的第一计算单元64包括：

转换子单元82，设置为将原始彩色视频帧转换成灰度图；

计算子单元84，设置为用Sobel算子计算该灰度图水平方向和垂直方向的梯度，得到梯度图；

二值化子单元86，设置为将该梯度图二值化，得到该第一边缘图。

优选地，上述的表示单元66包括：第一处理子单元，设置为在进行Chamfer匹配前，将该第一边缘图和该前景图按位“与”得到该选定区域的该边缘图。

优选地，该表示单元66还包括：遍历子单元，设置为遍历该边缘图，记录所有边缘点的坐标及编号，记作edgeMap；停止子单元，设置为判断该edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；拟合子单元，设置为在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录该第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出该直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算该第二邻域中的点与该直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，该第一预定距离小于该第二预定距离；第二处理子单元，设置为去掉该已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为该线段的集合。

优选地，该装置还包括：建立单元，设置为利用该线段的集合，基于多尺度FDCM方法和数据回归方法建立该行人高度模型。

优选地，该装置还包括：记录单元，设置为利用该多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；拟合行人高度单元，设置为利用线性拟合方法根据行人出现位置拟合行人高度，得到该行人高度模型。

图9是根据本发明优选实施例的行人检测装置的框图七，如图9所示，上述的第二行人检测模块54包括：

第二计算单元92，设置为将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；

缩放单元94，设置为按照该行人高度模型将匹配模板进行缩放；

扫描单元96，设置为根据该距离图计算该行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；

增加单元98，设置为将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果该检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；

确定目标单元910，设置为如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。

下面结合优选实施例对本发明实施例进行进一步说明。

本发明实施例提供了一种面向远景监控视频的行人检测系统，图10是根据本发明实施例的面向远景监控视频的行人检测系统的示意图，如图10所示，主要包括以下内容：

搜集行人数据集，基于主动形状模型(ASM)构建行人轮廓模板，包括步骤S1001-S1003：

步骤S1001，搜集行人数据库，采集标记行人形状的坐标数据；

步骤S1002，建立主动数据模型ASM；

步骤S1003，构建行人轮廓模板；

图11是根据本发明实施例的生成的行人轮廓模板集的示意图，构建的行人轮廓模型如图11所示，从标准行人数据库(INRIA)中随机选择120人，手工对所选择的训练图像进行特征点标记，每个特征点的坐标是(x,y)，标记好的v个(本文中v＝26)特征点坐标的集合就构成了形状S；对形状进行归一化，归一化是指以某个形状为基准，将其它形状进行旋转、缩放和平移使得其尽可能的与基准形状的整体位置相接近；对归一化的形状进行主成分分析(PCA)变换，得到对应训练集的平均形状S₀，以及前n个(能量达到95％时特征值的个数)特征值对应的形状特征S_i(i＝1,2,…n)。任意行人的形状就可以用线性方程进行表示：

给定30组形状参数之后，得到相应的形状模板集合。

对输入视频序列，允许用户手动选择感兴趣区域(ROI),整幅图像帧为默认的ROI区域；令码本中每个位置的码字为一个4维向量的集合，即ci＝{vi＝(Yi,Cbi,Cri),Si},i＝1,2,....N，其中(Yi,Cbi,Cri)为描述背景的像素值，Si为反映码字重要程度的参数，计算前景图image1。初始化以下参数：重要性参数的上界(Hmax)、重要性参数的学习权重(gama1)、重要性参数的遗忘权重(gama0)、码本每个位置码字的最大长度(Nmax)、匹配的阈值(d)、更新像素值的权重(alpha)、判定前景和背景的参数(T)；用第一帧图像初始化码本，即将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；读入下一帧图像，将其转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本该位置处所有码字v的距离dis_u_v；

其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))

若距离dis_u_v小于等于阈值d，说明u与v匹配，则更新码字：按下式更新码字的值v以及重要性参数s，同时降低该位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码子；将更新后的所有的码子按重要性由高到低进行排序；若当前匹配的码子及其后码字的重要性之和与所有码字的重要性之和的比值小于某一阈值T，则将该位置的像素置为前景(255)，否则为背景(0)；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

若距离dis_u_v大于阈值d，说明u与v不匹配，则进行如下操作：令该像素为前景；降低该位置所有码字的重要性，如果减小重要性后重要性参数小于0，则删除该码子；将更新后的所有的码子按重要性由高到低进行排序；若该位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1；随着每一帧的进入，码本不断被更新，逐渐收敛形成背景模型，利用背景模型，可以得到二值的前景图；由于前景图像中存在大量的噪声点，为去除噪声，同时保证不丢失边缘信息，为模板匹配奠定基础，选用高斯滤波器平滑前景图像，然后在将其量化成二值图像，最后选用3x3全1模板对图进行腐蚀操作，得到前景图，记作image1。

针对输入视频序列的感兴趣区域，计算边缘图image2，先将原始彩色视频帧转换成灰度图；然后用Sobel算子计算图水平方向和垂直方向的梯度，并求梯度图；将梯度图二值化，得到边缘图image2。

将image1和image2的相“与”得到感兴趣区域的边缘图image3，基于线段拟合技术将边缘图表示成线段的集合。在进行Chamfer匹配前，需要首先将边缘图image2和前景图image1按位“与”得到感兴趣的边缘图image3；遍历图像image3，记录所有边缘点的坐标及编号，记作edgeMap；若edgeMap中所剩的边缘点的个数小于阈值，则不再拟合直线，否则进行下一步；现有的直线条数小于某一阈值，则继续拟合直线，如下：随机选择一个点(x0,y0)，并以该点为中心，选定某个小邻域，记录该邻域中所有点的坐标，利用这些点拟合一条直线，并求出其法向量；以(x0,y0)为中心，选择一个更大邻域，计算邻域中的点与上述的直线共线的点的个数；反复进行上述内容，若共线的点数大于某一阈值，则找到一条最优的直线。去掉已拟合直线上的所有点，在剩下的点中重复操作，即可找到所有的直线，将所有拟合的线段存到一个数组中Edge_line，为基于线段的匹配奠定基础。

若高度模型未建立，则利用部分输入视频帧生成的线段集合，基于多尺度快速方向Chamfer匹配(FDCM)和数据回归方法建立行人高度模型。首先判断是否存在高度模型，如果不存在则利用多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标(即脚的位置)以及行人的高度,持续这一过程获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，即为高度模型。

否则基于高度模型、行人轮廓模板和单尺度FDCM方法检测行人。将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照高度模型将匹配模板缩放；根据距离图计算模板在所有位置上的Cost值,扫描所有Cost值，如果Cost小于某一阈值，则检测到一个行人，并输出矩形框；将所有检测到的矩形框按照Cost的值递增排序,扫描每一个检测窗口，如果它与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的该目标增加一票；如果检测的Cost值大于0并且投的票数大于某一阈值，则是一最终的目标。

通过上述内容，在实际应用中，摄像头的安装高度、距离没有统一的要求，视场景而定；用户希望软件安装好就能用，不希望再进行设置、标注、训练等，该系统在设计时考虑了上述因素，如：高度模型的建立、背景建模等，都是自动学习，不需要用户设置，因此更有利于成为企业的产品；本实施例的上述系统吸取了现有算法的优点，弥补了一些不足，在技术上比较先进。

本发明实施例的离线训练行人模板，并将其存成文件以便行人检测系统调用，如图10所示，包括如下内容：

步骤S1004，输入视频序列，选择感兴趣的区域；

步骤S1005，背景建模，包括以下内容：视频的前1000帧用来训练背景模型，首先初始化相关参数；用第一帧图像初始化码本，即将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；以后的每一帧都重复以下操作；读入下一帧图像，将其转换到YCbCr颜色空间，对该帧中每一像素u进行以下运算：比较u与码本该位置处所有码字v的距离dis_u_v，若距离dis_u_v小于等于阈值d，说明u与v匹配，则更新码字的值v 以及重要性参数s，同时降低该位置其它码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有的码子按重要性由高到低排序；若当前匹配的码子及其后码字的重要性之和与所有码字的重要性之和的比值小于某一阈值T，则将该位置的像素置为前景(255)，否则为背景(0)；若距离dis_u_v大于阈值d，说明u与v不匹配，则令该像素为前景；降低该位置所有码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有码子按重要性由高到低排序；若该位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令其权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1。

步骤S1006，预处理1(Smooth,Threshold,Erode)，包括以下内容：利用背景模型，可以得到二值的前景图；由于前景图像中存在大量的噪声点，为去除噪声，同时保证不丢失边缘信息，为模板匹配奠定基础，选用高斯滤波器平滑前景图像，然后在将其量化成二值图像，最后选用3x3全1模板对图进行腐蚀操作，得到预处理后的前景图，记作image1。

步骤S1007，预处理2_{(rgb2gray,Sobel)}，包括以下内容：先将原始视频帧转换成灰度图；然后用Sobel算子计算图水平方向和垂直方向的梯度，并求梯度图；将梯度图二值化，得到边缘图image2；

步骤S1008，线段拟合，首先将边缘图image2和前景图image1按位“与”得到感兴趣的边缘图image3；遍历图像image3，记录所有边缘点的坐标及编号，记作edgeMap,若edgeMap中所剩的边缘点的个数小于阈值，则不再拟合直线，否则进行下一步；若现有的直线条数小于某一阈值，则继续拟合直线，步骤如下：随机选择一个点(x0,y0)，并以该点为中心，选定某个小邻域，记录该邻域中所有点的坐标，利用这些点拟合一条直线，并求出其法向量；然后以(x0,y0)为中心，选择一个更大邻域，计算邻域中的点与刚拟合的直线共线的点的个数；反复进行上述操作，若共线的点数大于某一阈值，则找到一条最优的直线。去掉已拟合直线上的所有点，在剩下的点中重复步骤(105c)即可找到所有的直线，存到数组Edge_line中，为基于线段的匹配奠定基础。

构建行人高度模型包括步骤S1009-S1013，背景建模完成后的后续视频帧用来进行高度建模。首先判断是否存在高度模型，如果不存在，则利用多尺度FDCM方法对线段数组Edge_line进行匹配，记录检测到的行人位置的纵坐标(即脚的位置)以及行人的高度,持续这一过程获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，即为高度模型。

步骤S1009，判断高度模型是否为空，在判断结果为否的情况下，执行步骤S1010，在判断结果为是的情况下，执行步骤S1011；

步骤S1010，判断高度模型是否需要更新，在判断结果为否的情况下，执行步骤S1013，在判断结果为是的情况下，执行步骤S1011；

步骤S1011，进行多尺度FDCM；

步骤S1012，计算高度模型；

步骤S1013，构建行人高度模型；

步骤S1014，进行单尺度FDCM；

步骤S1015，非最大抑制，输出检测结果。

行人检测，包括以下内容：首先判断是否存在高度模型和行人模板文件，如果存在，则将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照高度模型将匹配模板缩放；根据距离图计算模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于某一阈值，则检测到一个行人，并输出矩形框；将所有检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果它与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的该目标增加一票；如果检测的Cost值大于0并且投的票数大于某一阈值，则是最终的目标。

下面通过以下仿真进一步说明。

仿真1，采用不同模板进行行人检测的结果比较

利用构建行人模板模块生成了31个模板，图11是根据本发明实施例的生成的行人形状模板集的示意图，如图11所示，通过选择不同的模板得到行人检测的结果，利用3种指标进行评价，相关数据显示，使用第3个模板效果比较好，因此后续的实验中均采用第3个模板作为行人匹配模板。

仿真2，本发明(采用模板Template3)与David Schreiber提出的算法检测结果对比。经验证本发明(采用模板Template3)可以在大部分数据集上获得较David Schreiber所提算法更好的检测结果，说明本发明比较有优势。

实施例一

本实施例中，在已知行人数据库上构建行人轮廓模板，并对待检测图像进行预处理，通过匹配行人轮廓模板与预处理后的图像实现图像中的行人检测。

本实施例中，图像预处理过程只需实现边缘检测，由于不存在高度模型，因此检测过程中采用固定的单尺度FDCM方法处理，图12是根据本发明优选实施例的行人检测的示意图一，如图12所示，包括以下内容：

步骤S1201-S1203与上述的步骤S1001-S1003相同，在此不再赘述。

步骤S1204，输入待检测图像，对该待检测图像进行预处理2，得到边缘图，先将原始图像转换成灰度图；然后用Sobel算子计算图水平方向和垂直方向的梯度，并求梯度图；将梯度图二值化，得到边缘图image2。

步骤S1205，对边缘图进行线段拟合，遍历边缘图image2，记录所有边缘点的坐标及编号，记作edgeMap,若edgeMap中所剩的边缘点的个数小于阈值，则不再拟合直线，否则进行下一步；若现有的直线条数小于某一阈值，则继续拟合直线，步骤如下：随机选择一个点(x0,y0)，并以该点为中心，选定某个小邻域，记录该邻域中所有点的坐标，利用这些点拟合一条直线，并求出其法向量；然后以(x0,y0)为中心，选择一个更大邻域，计算邻域中的点与刚拟合的直线共线的点的个数；反复进行上述操作，若共线的点数大于某一阈值，则找到一条最优的直线。去掉已拟合直线上的所有点，在剩下的点中重复操作即可找到所有的直线，存到数组Edge_line中，为基于线段的匹配奠定基础。

行人检测，首先判断是否存在行人模板文件，如果存在，则将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；采用固定比例(如1：1)，对匹配模板缩放。对根据距离图计算模板在所有位置上的Cost值,扫描所有Cost值，如果Cost小于某一阈值，则检测到一个行人，并输出矩形框；将所有检测到的矩形框按照Cost的值递增排序,扫描每一个检测窗口，如果它与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的该目标增加一票；如果检测的Cost值大于0并且投的票数大于某一阈值，则是最终的目标。

步骤S1206，进行单尺度FDCM；

步骤S1207，费最大抑制，输出检测结果。

实施例二

本实施例中，在已知行人数据库上构建行人轮廓模板，对输入视频图像构建高度模型，并对待检测视频图像进行预处理，通过将自适应高度行人轮廓模板与预处理后的图像进行匹配实现视频图像中的行人检测。

本实施例中，图像预处理过程采用背景建模结合边缘检测，采用多尺度FDCM构建高度模型，由于已知高度模型，因此检测过程采用单尺度FDCM方法处理，图13是根据本发明优选实施例的行人检测的示意图二，如图13所示，包括以下内容：

步骤S1301-S1303与上述的步骤S1001-S1003相同，在此不再赘述。

步骤S1304，输入视频序列，选择感兴趣的区域；

步骤S1305，背景建模，视频的前1000帧用来训练背景模型，首先初始化相关参数；用第一帧图像初始化码本，即将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；以后的每一帧都重复以下操作；读入下一帧图像，将其转换到YCbCr颜色空间，对该帧中每一像素u进行以下运算：比较u与码本该位置处所有码字v的距离dis_u_v，若距离dis_u_v小于等于阈值d，说明u与v匹配，则更新码字的值v以及重要性参数s，同时降低该位置其它码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有的码子按重要性由高到低排序；若当前匹配的码子及其后码字的重要性之和与所有码字的重要性之和的比值小于某一阈值T，则将该位置的像素置为前景(255)，否则为背景(0)；若距离dis_u_v大于阈值d，说明u与v不匹配，则令该像素为前景；降低该位置所有码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有码子按重要性由高到低排序；若该位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令其权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1；

步骤S1306，预处理1(Smooth,Threshold,Erode)，利用背景模型，可以得到二值的前景图；由于前景图像中存在大量的噪声点，为去除噪声，同时保证不丢失边缘信息，为模板匹配奠定基础，选用高斯滤波器平滑前景图像，然后在将其量化成二值图像，最后选用3x3全1模板对图进行腐蚀操作，得到预处理后的前景图，记作image1。

步骤S1307，预处理2(rgb2gray,Sobel)，先将原始视频帧转换成灰度图；然后用Sobel算子计算图水平方向和垂直方向的梯度，并求梯度图；将梯度图二值化，得到边缘图image2；

步骤S1308，线段拟合，首先将边缘图image2和前景图image1按位“与”得到感兴趣的边缘图image3；遍历图像image3，记录所有边缘点的坐标及编号，记作edgeMap,若edgeMap中所剩的边缘点的个数小于阈值，则不再拟合直线，否则进行下一步；若现有的直线条数小于某一阈值，则继续拟合直线，步骤如下：随机选择一个点(x0,y0)，并以该点为中心，选定某个小邻域，记录该邻域中所有点的坐标，利用这些点拟合一条直线，并求出其法向量；然后以(x0,y0)为中心，选择一个更大邻域，计算邻域中的点与刚拟合的直线共线的点的个数；反复进行上述操作，若共线的点数大于某一阈值，则找到一条最优的直线。去掉已拟合直线上的所有点，在剩下的点中重复即可找到所有的直线，存到数组Edge_line中，为基于线段的匹配奠定基础。

构建行人高度模型包括步骤S1309-S1311，背景建模完成后的后续视频帧用来进行高度建模。由于不存在高度模型，则利用多尺度FDCM方法对线段数组Edge_line进行匹配，记录检测到的行人位置的纵坐标(即脚的位置)以及行人的高度，持续这一过程获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，即为高度模型。

步骤S1309，进行多尺度FDCM行人检测；

步骤S1310，计算高度模型；

步骤S1311，构建行人高度模型；

步骤S1312，单尺度FDCM行人检测，首先判断是否存在高度模型和行人模板文件，如果存在，则将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照高度模型将匹配模板缩放；根据距离图计算模板在所有位置上的Cost值,扫描所有Cost值，如果Cost小于某一阈值，则检测到一个行人，并输出矩形框；将所有检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果它与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的该目标增加一票；如果检测的Cost值大于0并且投的票数大于某一阈值，则是最终的目标。

步骤S1313，非最大抑制，输出检测结果。

实施例三

本实施例中，在已知行人数据库上构建行人轮廓模板，对已知的视频图像高度模型进行更新，并对待检测视频图像进行预处理，通过将自适应高度行人轮廓模板与预处理后的图像进行匹配实现视频图像中的行人检测。图像预处理过程采用背景建模结合边缘检测，采用多尺度FDCM更新高度模型，由于已知高度模型，因此检测过程采用单尺度FDCM方法处理，图14是根据本发明优选实施例的行人检测的示意图三，如图14所示，包括以下内容：

步骤S1401-S1403与上述的步骤S1001-S1003相同，在此不再赘述。

步骤S1404，输入视频序列，选择感兴趣的区域；

步骤S1405，背景建模，视频的前1000帧用来训练背景模型，首先初始化相关参数；用第一帧图像初始化码本，即将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；以后的每一帧都重复以下操作；读入下一帧图像，将其转换到YCbCr颜色空间，对该帧中每一像素u进行以下运算：比较u与码本该位置处所有码字v的距离dis_u_v，若距离dis_u_v小于等于阈值d，说明u与v匹配，则更新码字的值v以及重要性参数s，同时降低该位置其它码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有的码子按重要性由高到低排序；若当前匹配的码子及其后码字的重要性之和与所有码字的重要性之和的比值小于某一阈值T，则将该位置的像素置为前景(255)，否则为背景(0)；若距离dis_u_v大于阈值d，说明u与v不匹配，则令该像素为前景；降低该位置所有码字的重要性，如果重要性参数小于0，则删除该码子；将更新后的所有码子按重要性由高到低排序；若该位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令其权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1；

步骤S1406，预处理1(Smooth,Threshold,Erode)，利用背景模型，可以得到二值的前景图；由于前景图像中存在大量的噪声点，为去除噪声，同时保证不丢失边缘信息，为模板匹配奠定基础，选用高斯滤波器平滑前景图像，然后在将其量化成二值图像，最后选用3x3全1模板对图进行腐蚀操作，得到预处理后的前景图，记作image1。

步骤S1407，预处理2(rgb2gray,Sobel)，先将原始视频帧转换成灰度图；然后用Sobel算子计算图水平方向和垂直方向的梯度，并求梯度图；将梯度图二值化，得到边缘图image2。

步骤S1408，线段拟合，首先将边缘图image2和前景图image1按位“与”得到感兴趣的边缘图image3；遍历图像image3，记录所有边缘点的坐标及编号，记作edgeMap,若edgeMap中所剩的边缘点的个数小于阈值，则不再拟合直线，否则进行下一步；若现有的直线条数小于某一阈值，则继续拟合直线，步骤如下：随机选择一个点(x0,y0)，并以该点为中心，选定某个小邻域，记录该邻域中所有点的坐标，利用这些点拟合一条直线，并求出其法向量；然后以(x0,y0)为中心，选择一个更大邻域，计算邻域中的点与刚拟合的直线共线的点的个数；反复进行上述操作，若共线的点数大于某一阈值，则找到一条最优的直线。去掉已拟合直线上的所有点，在剩下的点中重复操作即可找到所有的直线，存到数组Edge_line中，为基于线段的匹配奠定基础。

,构建行人高度模型包括步骤S1409-S1412，背景建模完成后的后续视频帧用来进行高度建模。首先判断现有高度模型是否需要更新，如果需要更新，则利用多尺度FDCM方法对线段数组Edge_line进行匹配，记录检测到的行人位置的纵坐标(即脚的位置)以及行人的高度,持续这一过程获得行人高度的样本集合；利用线性拟合方法根据行人出现位置拟合行人高度，即为高度模型。

步骤S1409，判断高度模型是否需要更新，在判断结果为是的情况下，执行步骤S1410，在判断结果为否的情况下，执行步骤S1412；

步骤S1410，进行多尺度FDCM行人检测；

步骤S1411，计算高度模型；

步骤S1412，构建行人高度模型；

步骤S1413，单尺度FDCM行人检测，首先判断是否存在高度模型和行人模板文件，如果存在，则将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；按照高度模型将匹配模板缩放；根据距离图计算模板在所有位置上的Cost值,扫描所有Cost值，如果Cost小于某一阈值，则检测到一个行人，并输出矩形框；将所有检测到的矩形框按照Cost的值递增排序,扫描每一个检测窗口，如果它与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的该目标增加一票；如果检测的Cost值大于0并且投的票数大于某一阈值，则是最终的目标。

步骤S1414，非最大抑制，输出检测结果。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

如上所述，本发明实施例中提供了一种行人检测方法及装置。解决了相关技术中对行人进行检测的方法没有考虑到目标边缘的边缘图导致检测结果不准确的问题，进而达到了检测结果较为准确的效果。

Claims

一种行人检测方法，包括：

对监控的视频序列进行处理得到所述视频序列的前景图；

根据所述前景图得到选定区域的边缘图；

对所述边缘图的边缘点进行处理得到待检测轮廓图；

根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测。
根据权利要求1所述的方法，其中，在根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测之前还包括：

获取行人数据集，根据所述数据集建立所述行人轮廓模板。
根据权利要求2所述的方法，其中，根据所述数据集建立所述行人轮廓模板包括：

从标准行人数据库INRIA中随机选择N人，对所述视频序列进行特征点标记，所述特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；

对所述形状S进行归一化处理；

对进行归一化处理的所述形状S进行主成分分析PCA变换，得到所述视频序列的平均形状S₀，以及前n个特征值对应的形状特征S_i(i＝1,2,…n)；

行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到所述行人轮廓模板。
根据权利要求1所述的方法，其中，在对所述边缘图的边缘点进行处理得到所述待检测轮廓图之后还包括：

判断是否存在行人高度模型；

在判断结果为是的情况下，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测。
根据权利要求4所述的方法，其中，根据所述前景图得到所述选定区域的边缘图包括：

根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,….N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；

针对所述选定区域，计算得到第一边缘图；

将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图，基于线段拟合技术将所述边缘图表示成线段的集合。
根据权利要求5所述的方法，其中，根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图包括：

初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；

用第一帧图像初始化码本，将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；

读入下一帧图像，将所述图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；

更新码本，逐渐收敛形成背景模型，根据所述背景模型确定所述前景图。
根据权利要求6所述的方法，其中，所述方法还包括：

若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

若距离dis_u_v大于阈值d，说明u与v不匹配，则进行如下操作：令该像素为前景；降低该像素位置所有码字的重要性，如果减小重要性后该像素位置的码字重要性参数小于0，则删除该码字；将更新后的所有的码子按重要性由高到低进行排序；若该像素位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1。
根据权利要求5所述的方法，其中，针对所述选定区域，计算得到所述第一边缘图包括：

将原始彩色视频帧转换成灰度图；

用Sobel算子计算所述灰度图水平方向和垂直方向的梯度，得到梯度图；

将所述梯度图二值化，得到所述第一边缘图。
根据权利要求5所述的方法，其中，将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图包括：

在进行Chamfer匹配前，将所述第一边缘图和所述前景图按位“与”得到所述选定区域的所述边缘图。
根据权利要求5所述的方法，其中，基于线段拟合技术将所述边缘图表示成线段的集合包括：

遍历所述边缘图，记录所有边缘点的坐标及编号，记作edgeMap；

判断所述edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；

在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录所述第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出所述直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算所述第二邻域中的点与所述直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，所述第一预定距离小于所述第二预定距离；

去掉所述已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为所述线段的集合。
根据权利要求5所述的方法，其中，所述方法还包括：

利用所述线段的集合，基于多尺度FDCM方法和数据回归方法建立所述行人高度模型。
根据权利要求11所述的方法，其中，

利用所述多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；

利用线性拟合方法根据行人出现位置拟合行人高度，得到所述行人高度模型。
根据权利要求4所述的方法，其中，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测包括：

将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；

按照所述行人高度模型将匹配模板进行缩放；

根据所述距离图计算所述行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；

将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果所述检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；

如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。
一种行人检测装置，包括：

第一处理模块，设置为对监控的视频序列进行处理得到所述视频序列的前景图；

第二处理模块，设置为根据所述前景图得到选定区域的边缘图；

第三处理模块，设置为对所述边缘图的边缘点进行处理得到待检测轮廓图；

第一行人检测模块，设置为根据预先建立的行人轮廓模板对所述待检测轮廓图进行行人检测。
根据权利要求14所述的装置，其中，所述装置包括：

建立模块，设置为获取行人数据集，根据所述数据集建立所述行人轮廓模板。
根据权利要求15所述的装置，其中，所述建立模块包括：

标记单元，设置为从标准行人数据库INRIA中随机选择N人，对所述视频序列进行特征点标记，所述特征点的坐标为(x,y)，标记好的v个特征点坐标的集合构成形状S；

归一化处理单元，设置为对所述形状S进行归一化处理；

分析处理单元，设置为对进行归一化处理的所述形状S进行主成分分析PCA变换，得到所述视频序列的平均形状S₀，以及前n个特征值对应的形状特征S_i(i＝1,2,…n)；

行人的轮廓用下述线性方程进行表示：

在得到M组轮廓参数之后，得到所述行人轮廓模板。
根据权利要求14所述的装置，其中，所述装置还包括：

判断模块，设置为判断是否存在行人高度模型；

第二行人检测模块，设置为在判断结果为是的情况下，根据预先建立的所述行人轮廓模板和所述行人高度模型对所述待检测轮廓图进行行人检测。
根据权利要求17所述的装置，其中，所述第二处理模块包括：

命令单元，设置为根据所述视频序列，令码本中每个位置的码字为一个4维向量的集合Ci确定所述前景图，其中，Ci＝{Vi＝(Yi，Cbi，Cri)，Si}，i＝1,2,….N，其中(Yi，Cbi，Cri)为描述背景的像素值，Si为反映码字重要程度的参数；

第一计算单元，设置为针对所述选定区域，计算得到第一边缘图；

表示单元，设置为将所述前景图和所述第一边缘图进行处理得到所述选定区域的边缘图，基于线段拟合技术将所述边缘图表示成线段的集合。
根据权利要求18所述的装置，其中，所述命令单元包括：

初始化子单元，设置为初始化以下参数：重要性参数的上界Hmax、重要性参数的学习权重gama1、重要性参数的遗忘权重gama0、码本每个位置码字的最大长度Nmax、匹配的阈值d、更新像素值的权重alpha、判定前景和背景的参数T；

记录子单元，设置为根据第一帧图像初始化码本将当前帧图像转换到YCbCr颜色空间，令码字为当前像素的值且每个码字的重要性参数Si为gama1，记录码本中每个位置码字的长度N；

运算子单元，设置为读入下一帧图像，将所述图像转换到YCbCr颜色空间，对该帧中每一像素进行以下运算：若新的像素值为u，按下式比较u与码本中该像素位置处所有码字v的距离dis_u_v，其中，dis_u_v＝abs(u(1)-v(1))+abs(u(2)-v(2))+abs(u(3)-v(3))；

更新子单元，设置为更新码本，逐渐收敛形成背景模型，根据所述背景模型确定所述前景图。
根据权利要求19所述的装置，其中，所述装置还包括：

第一像素处理单元，设置为若距离dis_u_v小于等于阈值d，更新码字，按下式更新码字的值v以及重要性参数s，同时降低像素位置其它码字的重要性，即重要性减小gama0，如果重要性减小后重要性参数小于0，则删除该码字；将更新后的所有的码字按重要性由高到低进行排序；若当前匹配的码字及其后码字的重要性之和与该像素位置所有码字的重要性之和的比值小于阈值T，将该像素位置的像素置为前景，否则为背景；

v＝(1-alpha)*v+alpha*u

s＝min([s+gama1,Hmax])

第二像素处理单元，设置为若距离dis_u_v大于阈值d，说明u与v不匹配，则进行如下操作：令该像素为前景；降低该像素位置所有码字的重要性，如果减小重要性后该像素位置的码字重要性参数小于0，则删除该码字；将更新后的所有的码子按重要性由高到低进行排序；若该像素位置码字的长度没有达到最大长度，将当前像素值插入码字末尾，令权重为gama1，否则删除末尾的码子，并将当前像素的值插入到末尾，令权重为gama1。
根据权利要求18所述的装置，其中，所述第一计算单元包括：

转换子单元，设置为将原始彩色视频帧转换成灰度图；

计算子单元，设置为用Sobel算子计算所述灰度图水平方向和垂直方向的梯度，得到梯度图；

二值化子单元，设置为将所述梯度图二值化，得到所述第一边缘图。
根据权利要求18所述的装置，其中，所述表示单元包括：

第一处理子单元，设置为在进行Chamfer匹配前，将所述第一边缘图和所述前景图按位“与”得到所述选定区域的所述边缘图。
根据权利要求18所述的装置，其中，所述表示单元包括：

遍历子单元，设置为遍历所述边缘图，记录所有边缘点的坐标及编号，记作edgeMap；

停止子单元，设置为判断所述edgeMap中所剩的边缘点的个数是否小于第一阈值，在判断结果为是的情况下，停止拟合直线；

拟合子单元，设置为在判断结果为否的情况下，判断现有的直线条数是否小于第二阈值，在判断结果为是的情况下，通过步骤继续拟合直线：随机选择一个点(x0,y0)，并以该点为中心第一预定距离为半径选定第一邻域，记录所述第一邻域中所有点的坐标，利用记录的点拟合直线一，并求出所述直线一的法向量；以(x0,y0)为中心第二预定距离为半径选定第二邻域，计算所述第二邻域中的点与所述直线一共线的点的个数，判断共线的点数是否大于第三阈值，在判断结果为是的情况下，得到已拟合直线，其中，所述第一预定距离小于所述第二预定距离；

第二处理子单元，设置为去掉所述已拟合直线上的所有点，在剩下的点中找到所有的直线，将所有拟合的线段存到一个数组Edge_line中作为所述线段的集合。
根据权利要求18所述的装置，其中，所述装置还包括：

建立单元，设置为利用所述线段的集合，基于多尺度FDCM方法和数据回归方法建立所述行人高度模型。
根据权利要求24所述的装置，其中，所述装置还包括：

记录单元，设置为利用所述多尺度FDCM方法对线段数组Edge_line进行处理，记录检测到的行人位置的纵坐标以及行人的高度获得行人高度的样本集合；

拟合行人高度单元，设置为利用线性拟合方法根据行人出现位置拟合行人高度，得到所述行人高度模型。
根据权利要求17所述的装置，其中，所述第二行人检测模块包括：

第二计算单元，设置为将Edge_line中得到的所有拟合线段按照线段方向分别构成线段图，并计算每幅线段图的距离图；

缩放单元，设置为按照所述行人高度模型将匹配模板进行缩放；

扫描单元，设置为根据所述距离图计算所述行人轮廓模板在所有位置上的Cost值，扫描所有Cost值，如果Cost小于第四阈值，则检测到一个行人，并输出矩形框；

增加单元，设置为将检测到的矩形框按照Cost的值递增排序，扫描每一个检测窗口，如果所述检测窗口与Cost值较小的矩形窗没有重叠或重叠没有达到一定的比例，则认为是一个新的目标，否则给有重叠的目标增加一票；

确定目标单元，设置为如果检测的Cost值大于0并且投的票数大于第五阈值，确定为行人检测的最终目标。