CN102169543B - 基于多源信息融合和在线学习的人头计数方法 - Google Patents

基于多源信息融合和在线学习的人头计数方法 Download PDF

Info

Publication number
CN102169543B
CN102169543B CN 201110094338 CN201110094338A CN102169543B CN 102169543 B CN102169543 B CN 102169543B CN 201110094338 CN201110094338 CN 201110094338 CN 201110094338 A CN201110094338 A CN 201110094338A CN 102169543 B CN102169543 B CN 102169543B
Authority
CN
China
Prior art keywords
people
classifier
adaboost
source information
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110094338
Other languages
English (en)
Other versions
CN102169543A (zh
Inventor
刘宝
赵春水
刘文金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FIRS Intelligent Tech (Shenzhen) Co Ltd
Original Assignee
SUZHOU VISION WISE COMMUNICATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU VISION WISE COMMUNICATION TECHNOLOGY Co Ltd filed Critical SUZHOU VISION WISE COMMUNICATION TECHNOLOGY Co Ltd
Priority to CN 201110094338 priority Critical patent/CN102169543B/zh
Publication of CN102169543A publication Critical patent/CN102169543A/zh
Application granted granted Critical
Publication of CN102169543B publication Critical patent/CN102169543B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了基于多源信息融合和在线学习的人头计数方法,它是在数字摄像机作为传感器以及数字信号处理芯片的支持下实现的,其特征在于:其包括以下步骤:利用所述数字摄像机采集行人的数字图像;应用Adaboost级联分类器检测出具有人头纹理特征的人体区域;应用SVM分类器进行筛选,筛选出具有头部和肩部特殊组合形状的人体区域作为最终人体对象并统计其数量。本发明结合纹理特征和形状特征,并且采用两级检测器结构,第一级检测器用来快速排除非人头区域,第二级检测器精确定位人头区域,降低虚警率。本方法还通过在线学习方式,极大增强本方法的环境适应能力。

Description

基于多源信息融合和在线学习的人头计数方法
技术领域
本发明属于视频检测方法,尤其是应用人头检测技术的基于视频的客流计数方法。
背景技术
客流统计是一项重要的市场研究手段,国外几乎所有大型商场和连锁商业网点在进行市场和管理决策前都必须进行的环节。随着商业竞争加剧,商业模式逐步由传统坐商向极具主动性的行商转变,对客流数据的获取以及分析显得尤为重要。客流统计系统是通过对商场、连锁店客流量进行连续精确检测,获取客流量随时间的变化趋势和不同网点间的对比统计,揭示客流量与商场营运策略、营销技术和内部管理间的内在关系,客观评价已有推广效益,规划未来的市场策略,为管理决策者提供极有价值的信息。当前市场上,已经有各种各样的客流统计系统来满足不同使用群体的需求,主要包括红外传感器扫描计数,压力踏板式自动计数,人工统计等统计方式。这几种客流统计方式为客流的管理起到了一定的积极作用,但各自都存在着多种缺点。
其中,红外传感器扫描计数的缺点是不能区分单人还是多人,不能辨别行人的行进方向;同时对于环境温度、日光照射等比较敏感,受外在因素影响大,计数误差大。人工统计是一项非常繁琐和耗费人力、财力的工作,在实际操作过程中,要做到经常性、实时性、系统性基本不可能实现。压力踏板式自动计数不能判别客人的进出方向,客流量大时容易混乱,物理装置易损坏,安装位精度要求高,可维护性差,计数误差太大。
目前基于视频分析的人头检测方法是客流统计领域的研究热门,它的基本原理是利用人头的圆形特征、头发色彩特征等进行检测。
发明内容
本发明提供了一种解决上述问题的方案,提供一种性能更好、鲁棒性更强的基于视频分析的人头计数方法。
本发明的技术方案是提供基于多源信息融合和在线学习的人头计数方法,该方法是在以数字摄像机作为传感器以及数字信号处理芯片的支持下实现的,其特征在于:该方法包括以下步骤:
1)利用所述数字摄像机垂直向下连续拍摄指定区域,采集该指定区域内行人的数字视频;
2)将1)中所述数字视频转换成多帧连续的数字图像;
3)应用Adaboost级联分类器检测2)中所述数字图像,得到具有人头纹理特征的人体区域;
4)应用SVM分类器对3)中所述人体区域进行筛选,筛选出具有头部和肩部特殊组合形状的人体区域作为人体对象,并统计其数量作为最后结果。
优选的,步骤3)中所述Adaboost级联分类器为双纹理特征的组合分类器,前置分类器应用Haar特征进行训练,后置分类器应用局部二元模式LBP特征进行训练。
优选的,步骤4)中所述SVM分类器为基于纹理特征和形状特征的组合特征向量进行训练的验证器。
优选的,步骤3)中所述Adaboost级联分类器和步骤4)中所述SVM分类器要进行在线学习,所述在线学习包括以下步骤:
a)通过步骤1)到步骤4)获取指定区域的所述最后结果;
b)通过a)中得到的所述最后结果和步骤2)中所述数字图像中实际的人头数进行比较;
c)如果b)的比较结果不一致,则调整步骤3)中所述Adaboost级联分类器和步骤4)中所述SVM分类器的参数;
d)重复a)、b)和c),最终获得精度最高时的所述Adaboost级联分类器和所述SVM分类器的参数。
本发明的基于多源信息融合和在线学习的人头计数方法结合纹理特征和形状特征,通过统计学习的方法训练人头检测器,采用两级检测器结构,第一级检测器主要利用人头纹理特征训练得到分类器,用来快速排除非人头区域;第二级采用纹理和形状特征,精确定位人头区域,降低虚警率。为了减轻不同应用场合环境变换的影响,本方法还应用了在线学习技术,通过在线收集人头样本进行训练并相应调整分类器参数,从而大大改进检测器对各种环境:不同摄像头、不同架设角度、不同环境光线下的适应性能。
附图说明
图1是本发明的基于多源信息融合和在线学习的人头计数方法的算法原理框图。
具体实施方式
下面对本发明的具体实施方式作进一步详细的描述。
如图1所示,本发明的基于多源信息融合和在线学习的人头计数方法方法首先进行视频采集,采集到的视频信息依次经过Adaboost级联分类器和SVM分类器,最终得到检测结果。
本发明的基于多源信息融合和在线学习的人头计数方法是在数字摄像机作为传感器的支持下实现的,人头检测原理主要利用了人头纹理特征、头部与肩部的组合形状等特性进行分析。以下结合附图1所示的算法原理图,详细说明本方法的具体实施方式。
Figure DEST_PATH_IMAGE002
 首先采用数字摄像机作为传感器连续采集定点区域图像形成数字视频流作为信号源,数字摄像机采用CCD或者CMOS等A/D芯片;视频图像采集装置垂直安装在待监测区的正上方,与地面的距离保持在2.2~4.8米之间;
Figure DEST_PATH_IMAGE004
 将
Figure 819012DEST_PATH_IMAGE002
中所述数字视频转换成多帧连续的数字图像;
Figure DEST_PATH_IMAGE006
 应用Adaboost级联分类器检测
Figure 571067DEST_PATH_IMAGE004
中所述数字图像,快速得到具有人头纹理特征的人体区域。Adaboost级联分类器为双纹理特征的组合分类器,前置分类器优选Haar特征进行训练,后置分类器优选局部二元模式LBP特征进行训练。
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特征,将注意力放在关键的训练数据上面。
Adaboost训练过程如下: 
  1. 先通过对N个训练样本的学习得到第一个弱分类器; 
  2. 将分错的样本和其他的新数据一起构成一个新的N个的训练样本,通过对这个样本的学习得到第二个弱分类器 ; 
  3. 将1和2都分错了的样本加上其他的新样本构成另一个新的N个的训练样本,通过对这个样本的学习得到第三个弱分类器; 
4. 最终经过提升得到强分类器 。
训练分类器需要先选择特征,基于不同纹理特征描述符对纹理描述能力的不同以及实际应用测试结果,选择Haar特征训练分类器作为前置分类器,选择局部二元模式LBP训练分类器作为后置分类器。以下分别阐明这两个分类器:
Haar对宏观结构纹理特征描述能力较强,因此选择Haar特征训练分类器作为前置分类器,主要用于快速排除非人头区域,为后续筛选保留了较小的候选区域集。Haar特征有如下几种,应用积分图像来快速计算Haar特征。
Haar特征适合于宏观结构纹理特征描述,但抗光照不均的能力较差,对微观纹理特征描述能力不稳定,因此选择具备抗光照不均能力的局部二元模式LBP训练分类器作为后置分类器,增强纹理描述子的细节区分能力,排除更难区分的负样本区域,抗光照不均能力很强,效果很好。LBP算子如下图所示,选取某一个像素为中心,将中心点像素的灰度值作为阀值并与3x3临域的像素灰度值进行数值大小比较,并把大于阀值的点置为1,反之置为0,然后逆时针方向得到一个8位的二进制编码10000011,这就是该像素的LBP特征值。扩展的LBP算子有MB-LBP等。MB-LBP叫宏块局部二元模式,以宏块为最小单元进行计算,宏块直径是可调的,当宏块直径为1时就是经典的基于像素的LBP,因此,MB-LBP能很好的描述细纹理又能很好的描述粗纹理。
Figure DEST_PATH_IMAGE010
   
Figure DEST_PATH_IMAGE012
 应用支持向量机SVM对
Figure 518164DEST_PATH_IMAGE006
中所述人头区域进行严格筛选,筛选出具有头部和肩部特殊组合形状的人体区域作为最终人体对象,进一步降低虚警率。
支持向量机SVM以组合纹理特征和形状特征而成的特征向量进行训练。纹理特征应用Haar纹理特征和LBP纹理特征;形状特征包括人头面积大小和圆形度等,具体计算过程如下:
1) 利用边缘检测算子进行边缘特征提取,边缘检测算子优选Canny或者Sobel。
2) 提取轮廓,抽取形状信息,包括 :
Figure DEST_PATH_IMAGE014
人头面积大小 ;
Figure DEST_PATH_IMAGE016
周长的平方与面积的比值;
Figure DEST_PATH_IMAGE018
各边缘点到中心的距离方差。
以下简述支持向量机SVM:
支持向量机SVM方法建立在统计学习理论的VC维理论和结构风险最小原理的基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳的折衷,以期获得最好的推广能力(或称泛化能力)。SVM的解是全局唯一的最优解。SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其它机器学习问题中。支持向量机SVM应用方向有支持向量分类SVC和支持向量回归SVR等。
SVM主要思想概括为以下两点:
Figure 909831DEST_PATH_IMAGE014
 针对线性可分情况进行分析,对于线性不可分情况则通过非线性映射算法将低维输入空间线性不可分样本转化为高维特征空间使其线性可分;
Figure 295681DEST_PATH_IMAGE016
 基于结构风险最小原理,在高维特征空间中构建最优化分割超平面,使得学习器获得全局最优化,并且使其期望风险满足可控上界。
SVM用于分类的一般特征:
 SVM学习过程是一个凸二次规划问题,可利用已知的有效算法发现目标函数的全局最小值;而如人工神经网络等其它分类方法都是基于贪心学习策略来搜索假设空间,这种方法一般只能获得局部最优解;
Figure 895607DEST_PATH_IMAGE016
 SVM通过最大化决策边界的边缘来控制模型的能力;
 SVM对数据中每个分类属性引入一个哑变量;
Figure DEST_PATH_IMAGE020
 SVM可处理多类问题;
Figure DEST_PATH_IMAGE022
 SVM应用核函数巧妙的解决了从低维样本空间向高维特征空间映射带来的“维数灾难”问题;常用的核函数有下面几种: 
  (1)线性核函数K(x,y)=x·y; 
  (2)多项式核函数K(x,y)=[(x·y)+1]d; 
  (3)径向基函数K(x,y)=exp(-|x-y|^2/d^2) 
(4)二层神经网络核函数K(x,y)=tanh(a(x·y)+b)。
SVM训练过程:
   给定一个n组关系未知样本的数据集H={(xi,yi)}i=1,…n,其中xi是输入向量,yi是期望值,n是数据点的总数。SVM可以利用一个非线性映射,将数据x映射到高维特征空间H,并在这个空间中进行线性逼近。由统计学习理论可知,该函数具有以下形式:
Figure DEST_PATH_IMAGE024
                        (1)
最优的分类函数是通过在一定的约束条件下最小化结构风险:
Figure DEST_PATH_IMAGE026
                    (2)
其中
Figure DEST_PATH_IMAGE028
使得函数更为平坦,称为规则化项;第二项为经验风险泛函,可由不同的损失函数确定,常数C>0,惩罚函数,控制对超出误差的样本的惩罚程度。本文采用的
Figure DEST_PATH_IMAGE030
-不敏感损失函数:
Figure DEST_PATH_IMAGE032
对于
Figure DEST_PATH_IMAGE034
,若估计输出f(xi)与期望输出yi的偏差的绝对值小于时候,它等于0;否则,它等于偏差的绝对值减去,通过引入非负的松弛变量
Figure DEST_PATH_IMAGE036
Figure DEST_PATH_IMAGE038
,则上面的等式可转换为:
Figure DEST_PATH_IMAGE040
引入拉格朗日函数,我们最终可以得到:
Figure DEST_PATH_IMAGE042
由此可得,                         
引入核函数K(xi,xj),上面式子可以变为:
K(xi,xj)是向量xi,xj在特征空间(xi)和(xj)上的内积,即K(xi,xj)=(xi) (xj)。通过核函数所有的运算都可以直接在输入空间上计算,核函数的选择对支持向量机非常重要。
Figure DEST_PATH_IMAGE044
 进行在线学习,通过将本发明得到的人头数的最终结果和实际人头数进行反复比较,逐步调整3)所述的Adaboost级联分类器和4)中所述的SVM分类器的参数,使得两者最终相同。在线学习极大增强本方法的环境适应能力,提高了本发明的鲁棒性,减少了虚警率。
到此,一个人头检测器已经实现。本方法融合了包括Haar纹理特征、LBP纹理特征、人头面积、人头圆形度等多源信息,采用了Adaboost分类器和SVM分类器,即达到快速检测又保证了低虚警率,并通过在线学习以提高环境适应能力。
以上实施例仅为本发明其中的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。 

Claims (3)

1.基于多源信息融合和在线学习的人头计数方法,该方法是在以数字摄像机作为传感器以及数字信号处理芯片的支持下实现的,其特征在于:该方法包括以下步骤:
1)利用所述数字摄像机垂直向下连续拍摄指定区域,采集该指定区域内行人的数字视频;
2)将1)中所述数字视频转换成多帧连续的数字图像;
3)应用Adaboost级联分类器检测2)中所述数字图像,得到具有人头纹理特征的人体区域;
4)应用SVM分类器对3)中所述人体区域进行筛选,筛选出具有头部和肩部特殊组合形状的人体区域作为人体对象,并统计其数量作为最后结果;所述SVM分类器为基于纹理特征和形状特征的组合特征向量进行训练的验证器。
2.根据权利要求1所述的基于多源信息融合和在线学习的人头计数方法,其特征在于:步骤3)中所述Adaboost级联分类器为双纹理特征的组合分类器,前置分类器应用Haar特征进行训练,后置分类器应用局部二元模式LBP特征进行训练。
3.根据权利要求1所述的基于多源信息融合和在线学习的人头计数方法,其特征在于:步骤3)中所述Adaboost级联分类器和步骤4)中所述SVM分类器要进行在线学习,所述在线学习包括以下步骤:
a)通过步骤1)到步骤4)获取指定区域的所述最后结果;
b)通过a)中得到的所述最后结果和步骤2)中所述数字图像中实际的人头数进行比较;
c)如果b)的比较结果不一致,则调整步骤3)中所述Adaboost级联分类器和步骤4)中所述SVM分类器的参数;
d)重复a)、b)和c),最终获得精度最高时的所述Adaboost级联分类器和所述SVM分类器的参数。
CN 201110094338 2011-04-15 2011-04-15 基于多源信息融合和在线学习的人头计数方法 Expired - Fee Related CN102169543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110094338 CN102169543B (zh) 2011-04-15 2011-04-15 基于多源信息融合和在线学习的人头计数方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110094338 CN102169543B (zh) 2011-04-15 2011-04-15 基于多源信息融合和在线学习的人头计数方法

Publications (2)

Publication Number Publication Date
CN102169543A CN102169543A (zh) 2011-08-31
CN102169543B true CN102169543B (zh) 2013-04-03

Family

ID=44490701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110094338 Expired - Fee Related CN102169543B (zh) 2011-04-15 2011-04-15 基于多源信息融合和在线学习的人头计数方法

Country Status (1)

Country Link
CN (1) CN102169543B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136534A (zh) * 2011-11-29 2013-06-05 汉王科技股份有限公司 自适应的区域行人计数方法及装置
CN103150552B (zh) * 2013-02-06 2016-08-17 湖北微驾技术有限公司 一种基于人头计数的驾驶培训管理方法
CN103679136B (zh) * 2013-10-24 2017-12-05 北方工业大学 基于局部宏观特征和微观特征结合的手背静脉身份识别方法
CN104794790B (zh) * 2015-04-23 2017-10-17 南京信息工程大学 一种景区游客统计方法
CN108256481A (zh) * 2018-01-18 2018-07-06 中科视拓(北京)科技有限公司 一种利用身体上下文的行人头部检测方法
CN109446895B (zh) * 2018-09-18 2022-04-08 中国汽车技术研究中心有限公司 一种基于人体头部特征的行人识别方法
CN110096959B (zh) * 2019-03-28 2021-05-28 上海拍拍贷金融信息服务有限公司 人流量计算方法、装置以及计算机存储介质
CN110991372A (zh) * 2019-12-09 2020-04-10 河南中烟工业有限责任公司 一种识别零售商户卷烟牌号陈列情况的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887524A (zh) * 2010-07-06 2010-11-17 湖南创合制造有限公司 基于视频监控的行人检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887524A (zh) * 2010-07-06 2010-11-17 湖南创合制造有限公司 基于视频监控的行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
牛胜石等.基于Adaboost和SVM的人头实时检测.《微型机与应用》.2010,第33-36页. *
陆朝霞.基于Adaboost算法的行人检测方法研究.《中国优秀硕博士学位论文全文数据库(硕士)信息科技辑》.2007,第I138-649页. *

Also Published As

Publication number Publication date
CN102169543A (zh) 2011-08-31

Similar Documents

Publication Publication Date Title
CN102169543B (zh) 基于多源信息融合和在线学习的人头计数方法
CN106599797B (zh) 一种基于局部并行神经网络的红外人脸识别方法
CN108304787A (zh) 基于卷积神经网络的道路目标检测方法
CN105512640B (zh) 一种基于视频序列的人流量统计方法
CN109902590B (zh) 深度多视图特征距离学习的行人重识别方法
CN102117413B (zh) 基于多层特征的不良图像自动过滤方法
CN109447169A (zh) 图像处理方法及其模型的训练方法、装置和电子系统
CN100470581C (zh) 基于轮廓的车型识别方法
CN102708361B (zh) 远距离人脸采集方法
CN110263705A (zh) 面向遥感技术领域两期高分辨率遥感影像变化检测方法
CN108009509A (zh) 车辆目标检测方法
CN108564030A (zh) 面向车载热成像行人检测的分类器训练方法和装置
CN108288033B (zh) 一种基于随机蕨融合多特征的安全帽检测方法
CN108171136A (zh) 一种多任务卡口车辆以图搜图的系统及方法
CN102169544A (zh) 基于多特征融合的人脸遮挡检测方法
Luo et al. Learning high-level features by fusing multi-view representation of MLS point clouds for 3D object recognition in road environments
CN105718866B (zh) 一种视觉目标检测与识别方法
CN110070074A (zh) 一种构建行人检测模型的方法
CN107145845A (zh) 基于深度学习及多特征点融合的行人检测方法
CN102831404A (zh) 手势检测方法及系统
CN104751136A (zh) 一种基于人脸识别的多相机视频事件回溯追踪方法
CN103093215A (zh) 人眼定位方法及装置
CN105303193A (zh) 一种基于单帧图像处理的人数统计系统
CN104036284A (zh) 基于Adaboost算法的多尺度行人检测方法
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: People counting method based on multiple source information fusion and on-line learning

Effective date of registration: 20140113

Granted publication date: 20130403

Pledgee: Bank of Communications Ltd. Wujiang branch

Pledgor: Suzhou Huishi Communication Technology Co.,Ltd.

Registration number: 2014320010001

PLDC Enforcement, change and cancellation of contracts on pledge of patent right or utility model
ASS Succession or assignment of patent right

Owner name: FIRS TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SUZHOU VISION WISE COMMUNICATION TECHNOLOGY CO., LTD.

Effective date: 20150508

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 215215 SUZHOU, JIANGSU PROVINCE TO: 518000 SHENZHEN, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20150508

Address after: Nanshan District Xueyuan Road in Shenzhen city of Guangdong province 518000 No. 1001 Nanshan Chi Park C building 11 floor

Patentee after: FIRS Intelligent Technology (Shenzhen) Co.,Ltd.

Address before: 215215, Suzhou, Jiangsu province Wujiang Fen Lake Town, Lake Avenue, No. 558

Patentee before: Suzhou Huishi Communication Technology Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130403

CF01 Termination of patent right due to non-payment of annual fee