CN103106414A - 一种智能视频监控中行人的检测方法 - Google Patents

一种智能视频监控中行人的检测方法 Download PDF

Info

Publication number
CN103106414A
CN103106414A CN2012105668091A CN201210566809A CN103106414A CN 103106414 A CN103106414 A CN 103106414A CN 2012105668091 A CN2012105668091 A CN 2012105668091A CN 201210566809 A CN201210566809 A CN 201210566809A CN 103106414 A CN103106414 A CN 103106414A
Authority
CN
China
Prior art keywords
pedestrian
passer
window
bys
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105668091A
Other languages
English (en)
Inventor
苏松志
李绍滋
吕艳萍
林贤明
郭锋
曹冬林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Shenzhen Research Institute of Xiamen University
Original Assignee
Xiamen University
Shenzhen Research Institute of Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University, Shenzhen Research Institute of Xiamen University filed Critical Xiamen University
Priority to CN2012105668091A priority Critical patent/CN103106414A/zh
Publication of CN103106414A publication Critical patent/CN103106414A/zh
Pending legal-status Critical Current

Links

Images

Abstract

一种智能视频监控中行人的检测方法,涉及计算机视觉、模式识别和图像处理等领域。提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;3)提取输入图片的行人特征描述子;4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;5)对检测的窗口进行融合,获取最终的行人检测结果。

Description

一种智能视频监控中行人的检测方法
技术领域
本发明涉及计算机视觉、模式识别和图像处理等领域,尤其是涉及一种智能视频监控中行人的检测方法。
背景技术
行人检测是可广泛应用于车辆辅助驾驶(D.Geronimo,A.M.Lopez and A.D.Sappa,et al.Survey of pedestrian detection for advanced driver assistance systems[J].PAMI,2010,32(7):1239-1258.)、人体运动分析和智能视频监控等领域中。由于易受姿态、光照、遮挡和视角等影响,行人检测是计算机视觉中的经典难题。目前大部分的研究者针对复杂场景下的行人检测,提出了各种各样的适合于行人检测的特征和分类器。常见的行人特征有Haar(M.Oren,C.Papageorion,P.Sinha,et al.Pedestrian detection using wavelettemplates[A].In Proc. of CVPR[C],1997.)、梯度方向直方图(N.Dalal and B.Triggs.Histogram of oriented gradient for human detection[A].In Proc. of CVPR[C],2005.)、协方差描述子(O.Tuzel,F.Porikli and P.Meer.Pedestrian detection viaclassification on Riemannian manifolds [J].PAMI,2008,10(30):1-15.)和局部二值模式(X.Wang,X.Han and S.Yan.A HOG-LBP human detector with partial occlusionhandling[A],In Proc. of ICCV[C],2009.)等。
行人检测技术根据定位方法,可分为滑动窗口法和非滑动窗口法。滑动窗口法是目标检测中的常用方法,本质上是将检测器转化为一个二值分类器。滑动窗口法的核心是构建一个鲁棒性较强的分类器,在行人检测中,常用的分类器有模板匹配、神经网络、支持向量机和AdaBoost等。滑动窗口法由于检测速度快且准确率较高,我们采用该方法来检测智能视频监控场景中的行人。非滑动窗口法常见的有隐式形状模型(B.Leibe,A.Leonardis and B.Schiele. Robust object detection with interleaved categorization and segmentation[J].IJCV,2008,77(1-3):259-289.)、高效子窗口搜索(C.H.Lampert,M.B.Blaschkoand T.Hofmann.Efficient subwindow search:a branch and bound framework for objectlocalization[J].PAMI,2009,31(12):2129-2142.)和跳跃窗口法(O.Chum,and A.Zisserman.An exemplar model for learning object classes[A].In Proc.of CVPR[C],2007.)等。
行人检测技术已经取得了一定的进展,Dollar等(P.Dollar,C.Wojek,B.Schiele,etal.Pedestrian detection:an evaluation of the state of the art,PAMI,2012,34(4):743-761.)系统地比较了目前常用的16种行人检测方法在6个公共行人测试集中的性能。目前行人检测技术呈现出这样的发展趋势:检测速度实时化,检测精度接近实用化,测试数据集规模化,应用背景复杂化。
大部分研究者将研究的重心放在复杂背景下的行人检测方法研究,但是在有些监控和人体运动分析等应用中,背景相对简单,行人检测是整个系统中的一个预处理步骤。在这种简单的场景中,要求快速地给出行人的位置,一种简单的处理方法是将复杂背景下的行人检测器直接应用在简单场景中。但是,由于测试集和训练集是非独立同分布的,复杂背景下的检测器不一定能在视频监控中取得很好的检测效果,另外,复杂背景下的行人检测器,检测的时间复杂度往往比较高。
在智能视频监控中,针对测试集和训练集的非独立同分布问题,由于背景相对简单,训练集容易获取且所需样本数目较少,可以针对特定的场景,重新收集样本然后构建分类器;针对检测的时间复杂度高这一问题,我们提出了一种适合于智能视频监控场景下的特征快速计算方法,基于该特征,结合积分图技术,可快速计算出分类器的输出值,大大降低了检测的时间复杂度。
发明内容
本发明的目的在于提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。
本发明包括以下步骤:
1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;
2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;
3)提取输入图片的行人特征描述子;
4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;
5)对检测的窗口进行融合,获取最终的行人检测结果。
在步骤5)中,所述对检测的窗口进行融合可采用非极大值抑制方法。
本发明预先在存储单元中保存行人检测器,即线性支持向量机的参数。在处理输入时,当视频采集单元采集到视频后,通过特征抽取单元对输入图像提取行人特征,然后在目标检测单元中,将提取的特征与线性支持向量机的参数做运算,给出分类器的输出值,最后通过视频输出单元对检测结果进行非极大值抑制,并输出检测结果。
附图说明
图1为本发明所述的行人数据集标注示意图。对输入图片(或者视频中的某一帧)进行检测,给出图片中行人的位置信息,通常用矩形框(x,y,w,h)表示。(x,y,w,h)表示矩形框左上角的x坐标、y坐标、宽和高。
图2为本发明所述的行人特征提取方法示意图:图中的ai(i=0,1,2,…,8)的取值为0或者1,0表示该象素为背景点,1表示该象素点为边缘点;箭头旁边的数字表示该方向的权重,共有4个方向,沿逆时针方向权重分别为1、2、4、8。
具体实施方式
本发明提供一种智能视频监控中的快速人体检测方法,为了使本技术领域的技术人员更好的理解本发明方案,下面结合附图和具体实施方案对本发明作进一步的详细说明。
1)利用图像采集设备建立行人数据库,并对该数据集进行标注
采用的实验器材:普通DV相机;三角架(防止拍摄过程手的抖动引起图像模糊)。
拍摄方法:用DV拍摄avi格式文件,摄像机静止不动,拍摄一个镜头的时间长度约为30秒,然后换角度拍摄;视频库中视频总录制时间约3个小时左右,这样大概有3x3600x25=27万张图片,标注的时候,我们选择其中的1万张做标记就;3个小时的视频180分钟,一个分负责18分钟的话,要派出十个人做。拍摄的时候要选择不同的时间段不同的场景不同的光照拍摄,比如火车站、校园、餐厅、机场、等地方。拍摄的时间要分别选择早上、下午、晚上;天气选择晴朗、阴天等。行人高度的要求,行人的高度大概在80-200pixel左右,不要太大,也不要太小,所以拍摄者拍摄的时候要注意镜头的拉伸;
数据标注方法:如图1所示,用最小的矩形框框住行人,同时记录矩形框的起始点和宽、高信息,并保存在.txt文件中。
2)采用支持向量机训练行人检测器模型
行人检测中,图片中的行人由于身高和拍摄距离等因素的影响,大小变化不一。针对该问题,滑动窗口法采取“以不变应万变”的方法:在训练分类器时首先对收集到的行人样本进行标注,然后将标注的行人区域切割下来并归一化到统一的固定大小。对于不包含行人的图片,从图片中随机抽取若干子图像块,大小与归一化后的行人样本一致。最后将该大小归一化后的行人和非行人样本作为分类器的训练集,利用监督学习方法训练得到一个二值分类器。本发明采用支持向量机,训练工具使用libsvm。
3)提取输入图片的行人特征描述子
如图2所示,利用Canny检测算子获取图像的边缘图,对四个方向和中心点进行编码,因此其取值范围是0~31。设ai,i=0,1,...,8表示3×3窗口中的9个象素点,其模式值(以下记为SLEP)的计算如下:
SLEP=16a0+8(a4||a8)+4(a3||a7)+2(a2||a6)+1(a1||a5)(1)接着,构建SLEP的直方图(以下简称SLEPh)作为局部区域R的特征向量,即,
SLEPh [ i ] = n i n , i = 0,1 , . . . , 31 - - - ( 2 )
其中,ni表示SLEP值为i的象素点数。SLEP的维度为32,同时在式2中,同一方向上只要有一象素为1,则该方向就编码为1,在一定程度上克服了边缘检测过程中部分边缘象素点丢失的问题。
4)利用支持向量机对图片中的每个行人检测窗口进行分类
在构建完二值分类器后,为了得到测试图片中哪个位置包含行人(即所谓的行人定位问题),在测试图片中从左到右,从上到下依次滑动窗口(窗口大小与切割并归一化后的训练图片大小一致),对于当前每一个扫描到的窗口,利用预先训练好的分类器判断其窗口内是否包含行人,最后对所有包含行人的窗口进行融合,常见的窗口融合方法有窗口重叠法、加权集合覆盖法和均值漂移法。另外,由于测试图片中同样包含各种大小的行人,即原始测试图片中行人的大小不一定与滑动窗的大小一致,为了解决该问题,滑动窗口法对测试图片进行各种尺度的缩放,形成尺度空间中的一个图像集,然后分别对图像集中的每一张图像重复如上所述的窗口滑动过程。
另外,在构建基于SLEP的行人特征时,没有对其特征进行归一化处理。这样做有两个好处:其一,省去归一化处理步骤,加快特征的计算速度;其二,可利用积分图快速计算出分类器的输出值。以下描述我们提出的基于积分图的快速分类器值输出方法。
设x表示输入图像,表示图像中的象素点集合,x|y表示图像x中的矩形区域y,h=h(x|y),h∈□K表示区域y的SLEP直方图特征,K为直方图的区间数,这里为32,即SLEP的所有可能取值情况,hk表示SLEP=k的边缘特征在图像区域x|y中出现的次数,若分类器为线性核函数的支持向量机,则判别函数为,
f ( h ) = β + Σ i = 1 L α i ⟨ h , h i ⟩ = β + Σ i = 1 L α i Σ j = 1 K h j h j i = β + Σ j = 1 K h j ( Σ i = 1 L α i h j i ) - - - ( 3 )
w i = Σ i = 1 L α i h j i ,
f ( h ) = β + Σ j = 1 K h j w j = β + Σ d ∈ x | y w c ( d ) - - - ( 4 )
其中,c(d)表示象素点d所对应的SLEP值,wj表示标号为j的象素点为判别函数所贡献的值。可见支持向量机的分类置信值转化为各象素点的权重累加。
在行人检测中,我们将当前的检测窗口划分为N个子窗口(块),为了快速计算当前检测窗口的分类器输出值,构建N张积分图,每张积分图对应着检测窗口中的某一块。因此,计算整个检测窗口的分类器输出值时,只需要计算检测窗口中每个块的权重累加和,然后将每个块的累积和相加。而每个块的权重累积和可通过对应积分图快速计算出来。
5)利用非极大值抑制技术对检测的窗口进行融合,获取最终的行人检测结果
滑动窗口法的检测结果中,通常在目标的周围会有多个窗口,需要对这些窗口进行合并才能准确获取目标的位置。设分类器在测试图片的多尺度空间中检测结果如下,
{ ⟨ bb i weight i ⟩ } i = 1 n , bb i = ⟨ x i , y i , width i , heigh i ⟩ - - - ( 5 )
其中,<xi,yi>表示滑动窗口的左上角坐标,widthi,heighi表示滑动窗口的宽和高,weighti表示分类器的输出值(若将其值归一化到[0,1],则表示该窗口包含行人的概率,这里只对weighti大于某个阈值T的窗口,即分类器认为其窗口内包含行人的窗口进行非极大值抑制处理)。窗口之间是的重叠程度可用如下的公式刻画,
overlap ( bb i , bb j ) = area ( bb i &cap; bb j ) area ( bb i &cup; bb j ) - - - ( 6 )
其中,(1)area(bb)表示窗口bb的面积;
(2)area(bbi∩bbj)表示窗口重叠部分的面积,即area(bbi∩bbj)=dw*dh,
dw=max((min(xi+widthi,xj+widthj)-max(xi,xj)),0)(7)
dh=max((min(yi+heighti,yj+heightj)-max(yi,yj)),0)(8)
(3)area(bbi∪bbj)表示两个窗口的面积和,可采用式(9)计算。
area(bbi∪bbj)=area(bbi)+area(bbj)-area(bbi∩bbj)(9)
本发明采用MeanShift对窗口进行融合。Mean Shift最早是由Fukunaga等提出的一种概率密度梯度函数的估计方法,现广泛应用于聚类、姿态估计和物体跟踪等计算机视觉领域中。随着Mean Shift理论的发展,其含义已由最初的“偏移的均值向量”(名词)转变为“一个迭代的步骤”(动词),即先计算当前点的新位置,将其移动到新的起点,若其偏移的均值向量足够小(如向量的模小于某个数ε),则停止移动,否则寻找新的起点。在非极大值抑制中,可以将窗口的合并视为概率密度估计问题。合并的目的是为了寻找最有可能包含行人的窗口,即寻找概率密度函数的局部最大值,因此可以用Mean Shift算法进行求解。由于图像进行多尺度缩放的时候,缩放的尺度序列通常为2e,2e·2r,...,2e·2ir,...,2n,为确保各维度同质,可做如下变换:
widthi←log2(widthi)    (10)
heighi←log2(heighi)
核函数的带宽也是Mean Shift算法中的一个重要参数,在行人检测中可采取自适应的带宽选择,当窗口较大时其相应的带宽也大,具体步骤如下:
Figure BDA00002639809800061
Figure BDA00002639809800071
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前题下,还可以做出若干改进和润饰,这些改进和润饰也应该视为本发明的保护范围。

Claims (2)

1.一种智能视频监控中行人的检测方法,其特征在于包括以下步骤:
1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;
2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;
3)提取输入图片的行人特征描述子;
4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;
5)对检测的窗口进行融合,获取最终的行人检测结果。
2.如权利要求1所述一种智能视频监控中行人的检测方法,其特征在于在步骤5)中,所述对检测的窗口进行融合采用非极大值抑制方法。
CN2012105668091A 2012-12-24 2012-12-24 一种智能视频监控中行人的检测方法 Pending CN103106414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012105668091A CN103106414A (zh) 2012-12-24 2012-12-24 一种智能视频监控中行人的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012105668091A CN103106414A (zh) 2012-12-24 2012-12-24 一种智能视频监控中行人的检测方法

Publications (1)

Publication Number Publication Date
CN103106414A true CN103106414A (zh) 2013-05-15

Family

ID=48314262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105668091A Pending CN103106414A (zh) 2012-12-24 2012-12-24 一种智能视频监控中行人的检测方法

Country Status (1)

Country Link
CN (1) CN103106414A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345653A (zh) * 2013-06-17 2013-10-09 复旦大学 基于多摄像头融合的上座率统计方法
CN103679196A (zh) * 2013-12-05 2014-03-26 河海大学 视频监控中的人车自动分类方法
CN104090658A (zh) * 2014-07-04 2014-10-08 四川长虹电器股份有限公司 基于hog特征的人体图像检测方法
CN104217206A (zh) * 2013-05-31 2014-12-17 上海亚视信息科技有限公司 基于高清视频的实时上座率统计方法
CN106295636A (zh) * 2016-07-21 2017-01-04 重庆大学 基于多特征融合级联分类器的消防通道车辆检测方法
CN109086681A (zh) * 2018-07-11 2018-12-25 东南大学 一种基于lhi特征的智能视频黑烟车检测方法
CN109409309A (zh) * 2018-11-05 2019-03-01 电子科技大学 一种基于人体检测的智能报警系统和方法
CN110063753A (zh) * 2019-03-18 2019-07-30 深圳蓝韵医学影像有限公司 超声图像中测量胎儿头围的方法与装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872477A (zh) * 2009-04-24 2010-10-27 索尼株式会社 检测图像中的对象的方法、装置,及包括该装置的系统
CN101887524A (zh) * 2010-07-06 2010-11-17 湖南创合制造有限公司 基于视频监控的行人检测方法
CN102609686A (zh) * 2012-01-19 2012-07-25 宁波大学 一种行人检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872477A (zh) * 2009-04-24 2010-10-27 索尼株式会社 检测图像中的对象的方法、装置,及包括该装置的系统
US20100272366A1 (en) * 2009-04-24 2010-10-28 Sony Corporation Method and device of detecting object in image and system including the device
CN101887524A (zh) * 2010-07-06 2010-11-17 湖南创合制造有限公司 基于视频监控的行人检测方法
CN102609686A (zh) * 2012-01-19 2012-07-25 宁波大学 一种行人检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏松志等: "基于结构化局部边缘矩特征的行人检测方法研究", 《第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217206A (zh) * 2013-05-31 2014-12-17 上海亚视信息科技有限公司 基于高清视频的实时上座率统计方法
CN103345653A (zh) * 2013-06-17 2013-10-09 复旦大学 基于多摄像头融合的上座率统计方法
CN103345653B (zh) * 2013-06-17 2016-03-30 复旦大学 基于多摄像头融合的上座率统计方法
CN103679196A (zh) * 2013-12-05 2014-03-26 河海大学 视频监控中的人车自动分类方法
CN104090658A (zh) * 2014-07-04 2014-10-08 四川长虹电器股份有限公司 基于hog特征的人体图像检测方法
CN106295636A (zh) * 2016-07-21 2017-01-04 重庆大学 基于多特征融合级联分类器的消防通道车辆检测方法
CN109086681A (zh) * 2018-07-11 2018-12-25 东南大学 一种基于lhi特征的智能视频黑烟车检测方法
CN109409309A (zh) * 2018-11-05 2019-03-01 电子科技大学 一种基于人体检测的智能报警系统和方法
CN110063753A (zh) * 2019-03-18 2019-07-30 深圳蓝韵医学影像有限公司 超声图像中测量胎儿头围的方法与装置
CN110063753B (zh) * 2019-03-18 2022-03-22 深圳蓝韵医学影像有限公司 超声图像中测量胎儿头围的方法与装置

Similar Documents

Publication Publication Date Title
CN100397410C (zh) 基于视频的面部表情识别方法及装置
CN103106414A (zh) 一种智能视频监控中行人的检测方法
Yang et al. Robust superpixel tracking
Cao et al. Vehicle detection and motion analysis in low-altitude airborne video under urban environment
Yun et al. An automatic hand gesture recognition system based on Viola-Jones method and SVMs
Li et al. Robust people counting in video surveillance: Dataset and system
CN109829467A (zh) 图像标注方法、电子装置及非暂态电脑可读取储存媒体
Kaâniche et al. Recognizing gestures by learning local motion signatures of HOG descriptors
Eweiwi et al. Temporal key poses for human action recognition
CN103208008A (zh) 基于机器视觉的交通视频监控目标检测快速适应方法
Wang et al. Improving human action recognition by non-action classification
CN103310194A (zh) 视频中基于头顶像素点梯度方向的行人头肩部检测方法
CN103605986A (zh) 一种基于局部特征的人体动作识别方法
CN104615986A (zh) 利用多检测器对场景变化的视频图像进行行人检测的方法
CN103632170A (zh) 基于特征组合的行人检测方法及装置
CN103593679A (zh) 一种基于在线机器学习的视觉人手跟踪方法
CN104463232A (zh) 一种基于hog特征和颜色直方图特征的密度人群计数的方法
García-Martín et al. Robust real time moving people detection in surveillance scenarios
CN104123714A (zh) 一种人流量统计中最优目标检测尺度的生成方法
Jiang et al. A unified tree-based framework for joint action localization, recognition and segmentation
Halidou et al. Fast pedestrian detection based on region of interest and multi-block local binary pattern descriptors
Singh et al. Obstacle detection techniques in outdoor environment: process, study and analysis
Li et al. Real-time traffic sign detection: an evaluation study
Feris et al. Boosting object detection performance in crowded surveillance videos
Wali et al. Incremental learning approach for events detection from large video dataset

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130515