CN105023001A - 一种基于选择性区域的多行人检测方法及系统 - Google Patents

一种基于选择性区域的多行人检测方法及系统 Download PDF

Info

Publication number
CN105023001A
CN105023001A CN201510420279.3A CN201510420279A CN105023001A CN 105023001 A CN105023001 A CN 105023001A CN 201510420279 A CN201510420279 A CN 201510420279A CN 105023001 A CN105023001 A CN 105023001A
Authority
CN
China
Prior art keywords
pedestrian
region
training
double
son
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510420279.3A
Other languages
English (en)
Other versions
CN105023001B (zh
Inventor
胡瑞敏
王晓
方稳华
梁超
陈军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201510420279.3A priority Critical patent/CN105023001B/zh
Publication of CN105023001A publication Critical patent/CN105023001A/zh
Application granted granted Critical
Publication of CN105023001B publication Critical patent/CN105023001B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于选择性区域的多行人检测方法及系统,包括在训练阶段根据训练数据集中各样本图像提取特征,根据所得特征训练分类器构成多人检测子,包括训练单人检测子,训练双人检测子,由训练好的单人检测子和双人检测子组成多人检测子,作为最终检测子;在测试阶段对任一测试图像,对待检测区域提取可变模板特征后输入训练阶段所得多人检测子进行分类,判断是否包含行人。本发明应用在行人检测领域中可以取得很好的效果。

Description

一种基于选择性区域的多行人检测方法及系统
技术领域
本发明涉及目标检测领域,特别涉及一种基于选择性区域的多行人检测技术方案。
背景技术
目标检测在计算机视觉中是一个热点,广泛的应用在刑侦监控、特定目标检索、机器人学和智能车辆中;行人在目标检测中又是尤为重要的因素,因此行人检测在近几年的时间里引起了高度重视和研究。但是在不同场景下光照、噪声以及行人的多种姿态变化使行人检测的研究面临很大的挑战。目前大多的行人检测算法都是借助于Dalal-Triggs在文献(“Histogramsof oriented gradients for human detection.In Computer Vision and Pattern Recognition”,2005.CVPR 2005.IEEE Computer Society Conference on,volume 1,pages 886-893.)中提出的HOG特征。经过多年的研究,该领域取得了很大的改进。在Piotr Dollar的文献(Piotr Dollar,ChristianWojek,Bernt Schiele,and Pietro Perona.Pedestrian detection:An evaluation of the state of the art.Pattern Analysis and Machine Intelligence,IEEE Transactions on,34(4):743-761,2012.)中对目前十六种行人检测算法比对的调研中可以发现,在行人检测过程中仍然存在两个问题以至于检测率低下:一个是穷举扫描带来的大量误检;另一个是遮挡情况下检测率低下问题。检测过程包含训练和测试两个阶段:第一,从训练图像中提取特征,其中特征包含了行人的色彩、纹理及外形等基本属性信息,将提取的特征训练出SVM分类器;第二,从测试集图像中提取特征,将这些特征送入到训练好的分类器,最后给出分类结果。从HOG特征的检测结果中可看出,存在大多误检是当前技术很难解决的;存在遮挡环境下的漏检比较严重。
发明内容
本发明的目的是提出一种基于选择性区域的多行人检测技术方案,解决现有的同类方法有部分遮挡环境中高误检、漏检问题,通过多人检测子得到最佳的结果。
为了达到以上目的,本发明采用的技术方案为一种基于选择性区域的多行人检测方法,包括训练阶段和测试阶段,
所述训练阶段,包括输入训练数据集,所述训练数据集中样本图像包括包含行人的正样本及不包含行人的负样本,所述正样本包含单人正样本和有部分遮挡下的双人正样本,负样本包含单人负样本和有部分遮挡下的双人负样本;根据训练数据集中各样本图像提取特征,根据所得特征训练分类器构成多人检测子,实现包括以下步骤,
步骤1.1,对输入的训练数据集中各样本图像进行颜色空间的归一化;
步骤1.2,训练单人检测子,包括对单人正样本和单人负样本的归一化结果提取可变模板特征后送入SVM分类器,记录单人正负样本的差异,训练单人检测子;
步骤1.3,训练双人检测子,包括对有部分遮挡的双人正样本和部分遮挡的双人负样本的归一化结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子;
步骤1.4,由步骤1.2训练好的单人检测子和步骤1.3训练好的双人检测子组成多人检测子,作为最终检测子;
所述测试阶段,包括对任一测试图像,对待检测区域提取可变模板特征后输入训练阶段所得多人检测子进行分类,判断是否包含行人。
而且,所述测试阶段的实现方式为,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域作为待检测区域,然后提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各待检测区域是否包含行人。
而且,所述测试阶段的实现方式为,以测试图像为输入图像,对输入图像进行特征空间的分割;根据分割结果组成选择性区域,作为待检测区域;对待检测区域进行颜色空间的归一化;提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各待检测区域是否包含行人。
而且,所述对特征空间的分割,包括在颜色特征空间、纹理特征空间和形状特征空间分别进行基层的分割。
而且,所述输入训练阶段所得多人检测子进行分类,实现如下,
如果图片待检测区域中行人的个数为n,
Σ z n p ( R | z n - 1 , z n , c = n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n , w n , m n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n | w n , m n ) p ( w n | m n ) p ( m n ) p ( c = n ) = p ( c = n ) Σ m n p ( m n ) Σ w n p ( w n | m n ) Σ l n p ( R , z n = 1 , l n | w n , m n )
其中,p(c=n)表示行人个数为n时的概率,p(R|zn-1,zn,c=n)为多人监测子,推导过程中的p(R,zn-1,ln,wn,mn)表示的是行人zn-1和行人zn在区域R的联合概率,p(wn|mn)表示的是行人zn-1和行人zn的左右关系mn和行人zn的大小wn的条件概率函数,p(mn)表示行人zn-1和行人zn左右关系概率值,条件概率函数p(R,zn-1,ln,wn,mn)在步骤1.4所得到的多人检测子中计算得到,p(R|zn-1,zn,c=n)大于等于预设阈值表示该区域有行人,否则表示该区域不包含行人。
本发明还相应提供一种基于选择性区域的多行人检测系统,包括训练模块和测试模块,
所述训练模块,用于输入训练数据集,所述训练数据集中样本图像包括包含行人的正样本及不包含行人的负样本,所述正样本包含单人正样本和有部分遮挡下的双人正样本,负样本包含单人负样本和有部分遮挡下的双人负样本;根据训练数据集中各样本图像提取特征,根据所得特征训练分类器构成多人检测子,包括以下单元,
归一化单元,用于对输入的训练数据集中各样本图像进行颜色空间的归一化;
单人检测子训练单元,用于训练单人检测子,包括对单人正样本和单人负样本的归一化结果提取可变模板特征后送入SVM分类器,记录单人正负样本的差异,训练单人检测子;
双人检测子训练单元,用于训练双人检测子,包括对有部分遮挡的双人正样本和部分遮挡的双人负样本的归一化结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子;
多人检测子训练单元,用于由训练好的单人检测子和训练好的双人检测子组成多人检测子,作为最终检测子;
所述测试模块,用于对任一测试图像,对待检测区域提取可变模板特征后输入训练模块所得多人检测子进行分类,判断是否包含行人。
而且,所述测试模块的实现方式为,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域作为待检测区域,然后提取待检测区域的可变模板特征并输入训练模块所得多人检测子进行分类,判断各待检测区域是否包含行人。
而且,所述测试模块的实现方式为,以测试图像为输入图像,对输入图像进行特征空间的分割;根据分割结果组成选择性区域,作为待检测区域;对待检测区域进行颜色空间的归一化;提取待检测区域的可变模板特征并输入训练模块所得多人检测子进行分类,判断各待检测区域是否包含行人。
而且,所述对特征空间的分割,包括在颜色特征空间、纹理特征空间和形状特征空间分别进行基层的分割。
而且,所述输入训练模块所得多人检测子进行分类,实现如下,
如果图片待检测区域中行人的个数为n,
Σ z n p ( R | z n - 1 , z n , c = n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n , w n , m n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n | w n , m n ) p ( w n | m n ) p ( m n ) p ( c = n ) = p ( c = n ) Σ m n p ( m n ) Σ w n p ( w n | m n ) Σ l n p ( R , z n = 1 , l n | w n , m n )
其中,p(c=n)表示行人个数为n时的概率,p(R|zn-1,zn,c=n)为多人监测子,推导过程中的p(R,zn-1,ln,wn,mn)表示的是行人zn-1和行人zn在区域R的联合概率,p(wn|mn)表示的是行人zn-1和行人zn的左右关系mn和行人zn的大小wn的条件概率函数,p(mn)表示行人zn-1和行人zn左右关系概率值,条件概率函数p(R,zn-1,ln,wn,mn)在训练模块所得到的多人检测子中计算得到,p(R|zn-1,zn,c=n)大于等于预设阈值表示该区域有行人,否则表示该区域不包含行人。
本发明的技术方案充分利用了包含分割信息的选择性区域和包含有部分遮挡环境下的双人检测子,将无遮挡下的单人检测子和有部分遮挡下的双人检测子组成多人检测子,应用在行人检测领域中取得了很好的效果,尤其对于多人环境,尤其是存在行人遮挡行人环境的图片有更好的检测效果。并且,由于本发明进一步提出的选择性区域是通过在颜色、纹理特征、形状空间上的分割得到,而不是传统的穷举扫描策略,在检测率有所提高的情况下,大大提高了检测速度。
附图说明
图1为本发明实施例的测试阶段流程图;
图2为本发明实施例的SVM分类器的训练过程图;
图3为本发明实施例的双人模型示例图,包括(a)、(b)、(c)三个示例。
具体实施方式
本发明技术方案可采用软件技术实现自动流程运行。下面结合附图和实施例对本发明技术方案进一步详细说明。
本发明实施例分为训练阶段和测试阶段,具体实现如下:
一、训练阶段
具体实施时,可以预先搜集包含行人的正样本及不包含行人的负样本,构成训练数据集,其中正样本包含单人正样本和有部分遮挡下的双人正样本;负样本包含单人负样本和有部分遮挡下的双人负样本,负样本是对背景图片按照同正样本一样大小规格的尺寸进行扫描得到的。建议选择单人室外照片作为单人正样本、部分遮挡不超过30%的双人室外照片为双人正样本,选取不包含行人的室外照片为负样本:单人负样本指负样本中不包含单个行人;有部分遮挡下的双人负样本指负样本中不包含有遮挡的双人。可先归一化正样本和负样本为预设尺寸,例如单人样本归一化为128×64的矩形图像;双人样本归一化为128×128的图片。分别从正样本和负样本中提取特征作为训练数据,根据训练数据学习训练SVM分类器,从测试数据集中任一测试图像提取以每个像素为中心的局部区域相应特征并输入训练好的分类器,输出各局部区域的分类结果。测试图像中局部区域与正样本和负样本归一化后尺寸一致,例如同样可取128×64的矩形局部区域;双人检测时取128×128的局部区域。
训练阶段包括首先分别将训练数据集中每个正样本或负样本归一化为预设尺寸,实施例中单人检测归一化为128×64的矩形图像;双人检测归一化成128×128的矩形图片,然后作为输入图像提取特征,根据所得特征训练分类器构成多人检测子;
实施例的具体训练过程参见图2,包括以下子步骤:
步骤1.1,对输入的训练数据集中各样本图像进行颜色空间的归一化;
实施例采用Gamma校正法对输入图像进行颜色空间的归一化,目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。
为了减少光照因素的影响,首先需要将整个图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献的比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大,通常先转化为灰度图;
Gamma压缩公式:
I(x,y)=I*(x,y)gamma
其中,I*(x,y)表示的是输入图像的原图像像素,(x,y)为输入图像中像素的位置,gamma是压缩系数(一般取值为0.5),I(x,y)为归一化后的图像像素。
步骤1.2,训练单人检测子;
实施例利用目前已有的SVM(Support Vector Machine)分类器技术,对单人正样本和单人负样本经过步骤1.1的归一化所得结果提取目前行人检测比较成熟的可变模板特征,可变模板的提取过程类似于方向梯度直方图的提取过程(Histogram of Oriented Gradient,HOG),首先提取整个样本的HOG特征,即root HOG(整个行人的纹理特征);再提取5个最具代表性的部分HOG特征(一般为行人的头、左臂、右臂、左腿及右腿5个典型部分),即part HOG;最后将rootHOG、part HOG、以及5个part之间的关联关系一并组成特征向量,这个特征向量也就是可变模板特征。具体过程可以参考文献(P.Felzenszwalb,D.McAllester,and D.Ramanan.Adiscriminativelytrained,multiscale,deformable part model.In CVPR,2008.和Pedro FFelzenszwalb,Ross B Girshick,and David McAllester,“Cascade object detection withdeformablepart models,”in CVPR2010)。把提取的特征送入分类器,记录单人正负样本的差异,训练单人检测子。
步骤1.3,训练双人检测子;
在人群中相邻人之间存在着一定的三维模型,无法从三维空间学习监控视频中行人间存在的关系,但是三维和二维之间同样存在着相辅相成的关联。从中学习行人间二维的关系来表示两个行人间的模型。通过两两关系同理扩展到多人间的模型,例如行人A和行人B是具有两两关系的,行人B和行人C也是具有两两关系,利用AB关系和BC关系就能知道ABC关系。本发明将从两人间的模型出发来介绍双人检测子,从而推广到多人检测子。
参见图3,相邻行人间的关系。多人环境或者有部分行人遮挡行人中,一般包含以下三种情况:两人是肩并肩行走(a)、右侧行人遮挡左侧行人(b)、左侧行人遮挡右侧行人(c)。当图片中出现这些类似现象时,传统的单一行人检测子就会出现误检或者漏检。本发明将这几种情况的行人重新训练或者新的二人检测子,可以避免上述的不足。
对有部分遮挡的双人正样本和部分遮挡的双人负样本经过步骤1.1的归一化所得结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子。
步骤1.4单人检测子可以检测没有遮挡的行人,双人检测子可以检测有部分遮挡的行人(特别是多人环境下的人挡人的情况),因此由步骤1.2训练好的单人检测子和步骤1.3训练好的双人检测子可以并联组成多人检测子,作为本发明的最终检测子。
二、测试阶段
参见图1,测试阶段包括对测试数据集中任一测试图像,可以首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域为待检测区域,然后提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各局部区域是否包含行人。本发明进一步提出,还可以通过特征空间的分割、组合选择待检测区域,相比遍历输入图像的每个像素为中心的局部区域,效率更高。
实施例的测试阶段包括以下子步骤:
步骤2.1,以测试图像为输入图像,对输入图像进行特征空间的分割;
从特征空间划分基层区域,其中ri和rj分别表示两个相邻区域,S(ri,rj)表示区域ri和rj之间在特征空间的近似度,实施例考虑颜色(RGB)特征近似度Scolour(ri,rj)、纹理特征近似度Stexture(ri,rj)以及形状大小近似度Ssize(ri,rj),其范围在[0,1]。
颜色(RGB)特征近似度表示为
S c o l o u r ( r i , r j ) = Σ k = 1 n m i n ( c i k , σ j k )
其中Scolour(ri,rj)表示区域ri和rj之间在颜色空间(RGB)的近似度。可以计算出每个区域在每个颜色通道的一维直方图(用25个bin表示)。区域ri在颜色空间的直方图 分别表示直方图特征向量每维的数值,物理含义指在颜色空间中两个区域在每个色度上的近似度,当三个通道同时使用时,区域ri中维数n=75。
具体实施时,可根据计算结果,Scolour(ri,rj)大于预设的阈值则划分;小于预设的阈值则不划分(例如阈值取0.5)。如果不需要划分就会得到新的组合区域rt。最后结果区域是两个区域的成分之和,新的组合区域rt大小表示为size(rt)=size(ri)+size(rj)。基于纹理特征近似度和形状大小近似度划分的方式类似。
纹理特征近似度表示为
S t e x t u r e ( r i , r j ) = Σ k = 1 n m i n ( t i k , t j k )
其中n是纹理向量总维数、k为处理当前维数、表示区域ri在k维的纹理、表示区域rj在k维的纹理、是区域ri和区域rj在纹理空间中第k维的近似度。同理可以得到划分得到基层区域。
形状大小近似度表示为
S s i z e ( r i , r j ) = 1 - s i z e ( r i ) + s i z e ( r j ) s i z e ( i m )
其中Ssize(ri,rj)是区域ri和rj联合占有的部分,size(im)表示整个输入图像的像素大小。
步骤2.2,根据分割结果组成选择性区域,作为待检测区域;
按照步骤2.1中,三个特征空间(颜色、纹理、形状)进行基层的分割结果,具体实施时可将基层小区域和尽可能相邻的区域做组合一并作为待检测区域,例如图片中的行人上身衣服是蓝色的下身衣服是黑色的,这样图片中代表蓝色的区域就要和代表黑色的区域进行组合连接成新的区域作为待检测区域,也就是本发明所述的选择性区域。对颜色、纹理、形状特征空间的分割结果分别组合得到相应的待检测区域,均进行后续步骤,这样可以确保不会漏检。
步骤2.3,对步骤2.2得到待检测区域进行颜色空间的归一化;
实施例采用Gamma校正法对输入图像进行颜色空间的归一化,目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。
为了减少光照因素的影响,首先需要将整个图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献的比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化,归一化步骤实现同步骤1.1。
步骤2.4,多行人检测,即提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各局部区域是否包含行人。
测试阶段的可变模板特征提取方式和训练阶段一致。
设R是一个矩形的待检测区域,z1表示矩形区域中有一个行人,其后验可以表示为
p ( z 1 | R ) = p ( z 1 , R ) p ( R ) ∝ p ( z 1 , R )
其中p(R)表示检测到区域R的概率、p(z1|R)表示的是区域R和行人z1的条件概率,p(z1,R)为后验函数。
设c表示待检测区域中行人的个数,C=1,…,c,zc表示第C个行人,双人检测子p(R|z1,z2,c=2)表达了行人z1和行人z2的关联关系。
后验函数可以表示为
p ( z 1 , R ) = p ( R , z 1 | c = 1 ) p ( c = 1 ) + Σ C = 1 c Σ z 2 p ( R | z 1 , z 2 , c = 2 ) p ( z 1 , z 2 | c ) p ( c = 2 )
其中p(c=1)表示行人个数为1时的概率、p(z1,z2|c)为行人个数和z1,z2的条件概率、p(c=2)表示的是行人个数为2的概率、p(R,z1|c=1)表示单人检测子。行人z1=(l1,w1),其中l1是行人坐落在图片的位置,w1是行人的大小,w1=(x1,y1,s1)表示的是中心点在坐标(x1,y1)处大小为s1的区域。行人z2=(l2,w2,m2),其中m2表示的是z1和z2的关系(左右关系,z1在z2的左侧或者z1在z2的右侧)。其中的 Σ z 2 p ( R | z 1 , z 2 , c = 2 ) p ( c = 2 ) 可以表示成
Σ z n p ( R | z 1 , z 2 , c = 2 ) p ( c = 2 ) = Σ l 2 , w 2 , m 2 p ( R , z 1 , l 2 , w 2 , m 2 ) p ( c = 2 ) = Σ l 2 , w 2 , m 2 p ( R , z 1 , l 2 | w 2 , m 2 ) p ( w 2 | m 2 ) p ( m 2 ) p ( c = 2 ) = p ( c = 2 ) Σ m 2 p ( m 2 ) Σ w 2 p ( w 2 | m 2 ) Σ l 2 p ( R , z 1 , l 2 | w 2 , m 2 )
其中推导过程中的p(R,z1,l2,w2,m2)表示的是行人z1和行人z2在区域R的联合概率,p(w2|m2)表示的是两行人的左右关系m2和w2(行人z2的大小)的条件概率函数,p(m2)表示行人z1和行人z2左右关系m2的概率值,条件概率函数p(R,z1,l2|w2,m2)可以在步骤1.3训练好的双人检测子p(R|z1,z2,c=2)中计算得到,p(R|z1,z2,c=2)大于等于预设阈值(本领域技术人员可自行预先设置取值,一般取0.5,要求严格也可取0.6)表示该区域有行人,否则表示该区域不包含行人。
如果图片待检测区域中行人的个数为n,上述的函数可以表示成
Σ z n p ( R | z n - 1 , z n , c = n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n , w n , m n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n | w n , m n ) p ( w n | m n ) p ( m n ) p ( c = n ) = p ( c = n ) Σ m n p ( m n ) Σ w n p ( w n | m n ) Σ l n p ( R , z n = 1 , l n | w n , m n )
其中,p(c=n)表示行人个数为n时的概率,p(R|zn-1,zn,c=n)为多人监测子,推导过程中的p(R,zn-1,ln,wn,mn)表示的是行人zn-1和行人zn在区域R的联合概率,p(wn|mn)表示的是行人zn-1和行人zn的左右关系mn和wn(行人zn的大小)的条件概率函数,p(mn)表示行人zn-1和行人zn左右关系概率值,条件概率函数p(R,zn-1,ln,wn,mn)可以在步骤1.4所得到的多人检测子中计算得到,p(R|zn-1,zn,c=n)大于等于预设阈值(本领域技术人员可自行预先设置取值,一般取0.5,要求严格也可取0.6)表示该区域有行人,否则表示该区域不包含行人。
发明人在Pentium(R)、Dual-Core 3.20GHz CPU、2G内存的计算机上运行,使用本实施例方法,使用公开的数据集和文献(“Histograms of oriented gradients for human detection,”inComputer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conferenceon.IEEE,2005,vol.1,pp.886–893.)和文献(Piotr Dollar,Christian Wojek,Bernt Schiele,andPietro Perona,“Pedestrian detection:An evaluation of the state of the art,”Pattern Analysis andMachine Intelligence,IEEE Transactions on,vol.34,no.4,pp.743–761,2012.)中提到行人检测算法做了比较,检测效率有了很大的提升,因此可以应用在多媒体检索、智能交通等领域。
具体实施时,还可采用软件模块化方式实现一种基于选择性区域的多行人检测系统,包括训练模块和测试模块:
所述训练模块,用于输入训练数据集,所述训练数据集中样本图像包括包含行人的正样本及不包含行人的负样本,所述正样本包含单人正样本和有部分遮挡下的双人正样本,负样本包含单人负样本和有部分遮挡下的双人负样本;根据训练数据集中各样本图像提取特征,根据所得特征训练分类器构成多人检测子,包括以下单元,
归一化单元,用于对输入的训练数据集中各样本图像进行颜色空间的归一化;
单人检测子训练单元,用于训练单人检测子,包括对单人正样本和单人负样本的归一化结果提取可变模板特征后送入SVM分类器,记录单人正负样本的差异,训练单人检测子;
双人检测子训练单元,用于训练双人检测子,包括对有部分遮挡的双人正样本和部分遮挡的双人负样本的归一化结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子;
多人检测子训练单元,用于由训练好的单人检测子和训练好的双人检测子组成多人检测子,作为最终检测子;
所述测试模块,用于对任一测试图像,对待检测区域提取可变模板特征后输入训练模块所得多人检测子进行分类,判断是否包含行人。
各模块具体实现与方法步骤一致,本发明不予赘述。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明技术领域的技术人员可以对所描述的具体实施例做各种各样的修改补充或者采用类似的方式替代,但并不会偏离本发明精神或者超越所附权利要求书所定义的范围。

Claims (10)

1.一种基于选择性区域的多行人检测方法,其特征在于:包括训练阶段和测试阶段,
所述训练阶段,包括输入训练数据集,所述训练数据集中样本图像包括包含行人的正样本及不包含行人的负样本,所述正样本包含单人正样本和有部分遮挡下的双人正样本,负样本包含单人负样本和有部分遮挡下的双人负样本;根据训练数据集中各样本图像提取特征,
根据所得特征训练分类器构成多人检测子,实现包括以下步骤,
步骤1.1,对输入的训练数据集中各样本图像进行颜色空间的归一化;
步骤1.2,训练单人检测子,包括对单人正样本和单人负样本的归一化结果提取可变模板特征后送入SVM分类器,记录单人正负样本的差异,训练单人检测子;
步骤1.3,训练双人检测子,包括对有部分遮挡的双人正样本和部分遮挡的双人负样本的归一化结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子;
步骤1.4,由步骤1.2训练好的单人检测子和步骤1.3训练好的双人检测子组成多人检测子,作为最终检测子;
所述测试阶段,包括对任一测试图像,对待检测区域提取可变模板特征后输入训练阶段所得多人检测子进行分类,判断是否包含行人。
2.根据权利要求1所述基于选择性区域的多行人检测方法,其特征在于:所述测试阶段的实现方式为,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域作为待检测区域,然后提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各待检测区域是否包含行人。
3.根据权利要求1所述基于选择性区域的多行人检测方法,其特征在于:所述测试阶段的实现方式为,以测试图像为输入图像,对输入图像进行特征空间的分割;根据分割结果组成选择性区域,作为待检测区域;对待检测区域进行颜色空间的归一化;提取待检测区域的可变模板特征并输入训练阶段所得多人检测子进行分类,判断各待检测区域是否包含行人。
4.根据权利要求3所述基于选择性区域的多行人检测方法,其特征在于:所述对特征空间的分割,包括在颜色特征空间、纹理特征空间和形状特征空间分别进行基层的分割。
5.根据权利要求1或2或3或4所述基于选择性区域的多行人检测方法,其特征在于:所述输入训练阶段所得多人检测子进行分类,实现如下,
如果图片待检测区域中行人的个数为n,
Σ z n p ( R | z n - 1 , z n , c = n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n , w n , m n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n | w n , m n ) p ( w n | m n ) p ( m n ) p ( c = n ) = p ( c = n ) Σ m n p ( m n ) Σ w n p ( w n | m n ) Σ l n p ( R , z n = 1 , l n | w n , m n )
其中,p(c=n)表示行人个数为n时的概率,p(R|zn-1,zn,c=n)为多人监测子,推导过程中的p(R,zn-1,ln,wn,mn)表示的是行人zn-1和行人zn在区域R的联合概率,p(wn|mn)表示的是行人zn-1和行人zn的左右关系mn和行人zn的大小wn的条件概率函数,p(mn)表示行人zn-1和行人zn左右关系概率值,条件概率函数p(R,zn-1,ln,wn,mn)在步骤1.4所得到的多人检测子中计算得到,p(R|zn-1,zn,c=n)大于等于预设阈值表示该区域有行人,否则表示该区域不包含行人。
6.一种基于选择性区域的多行人检测系统,其特征在于:包括训练模块和测试模块,
所述训练模块,用于输入训练数据集,所述训练数据集中样本图像包括包含行人的正样本及不包含行人的负样本,所述正样本包含单人正样本和有部分遮挡下的双人正样本,负样本包含单人负样本和有部分遮挡下的双人负样本;根据训练数据集中各样本图像提取特征,根据所得特征训练分类器构成多人检测子,包括以下单元,
归一化单元,用于对输入的训练数据集中各样本图像进行颜色空间的归一化;
单人检测子训练单元,用于训练单人检测子,包括对单人正样本和单人负样本的归一化结果提取可变模板特征后送入SVM分类器,记录单人正负样本的差异,训练单人检测子;
双人检测子训练单元,用于训练双人检测子,包括对有部分遮挡的双人正样本和部分遮挡的双人负样本的归一化结果提取可变模板特征并送入SVM分类器,记录有部分遮挡的双人正负样本差异,训练双人检测子;
多人检测子训练单元,用于由训练好的单人检测子和训练好的双人检测子组成多人检测子,作为最终检测子;
所述测试模块,用于对任一测试图像,对待检测区域提取可变模板特征后输入训练模块所得多人检测子进行分类,判断是否包含行人。
7.根据权利要求6所述基于选择性区域的多行人检测系统,其特征在于:所述测试模块的实现方式为,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域作为待检测区域,然后提取待检测区域的可变模板特征并输入训练模块所得多人检测子进行分类,判断各待检测区域是否包含行人。
8.根据权利要求6所述基于选择性区域的多行人检测系统,其特征在于:所述测试模块的实现方式为,以测试图像为输入图像,对输入图像进行特征空间的分割;根据分割结果组成选择性区域,作为待检测区域;对待检测区域进行颜色空间的归一化;提取待检测区域的可变模板特征并输入训练模块所得多人检测子进行分类,判断各待检测区域是否包含行人。
9.根据权利要求8所述基于选择性区域的多行人检测系统,其特征在于:所述对特征空间的分割,包括在颜色特征空间、纹理特征空间和形状特征空间分别进行基层的分割。
10.根据权利要求6或7或8或9所述基于选择性区域的多行人检测系统,其特征在于:所述输入训练模块所得多人检测子进行分类,实现如下,
如果图片待检测区域中行人的个数为n,
Σ z n p ( R | z n - 1 , z n , c = n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n , w n , m n ) p ( c = n ) = Σ l n , w n , m n p ( R , z n - 1 , l n | w n , m n ) p ( w n | m n ) p ( m n ) p ( c = n ) = p ( c = n ) Σ m n p ( m n ) Σ w n p ( w n | m n ) Σ l n p ( R , z n = 1 , l n | w n , m n )
其中,p(c=n)表示行人个数为n时的概率,p(R|zn-1,zn,c=n)为多人监测子,推导过程中的p(R,zn-1,ln,wn,mn)表示的是行人zn-1和行人zn在区域R的联合概率,p(wn|mn)表示的是行人zn-1和行人zn的左右关系mn和行人zn的大小wn的条件概率函数,p(mn)表示行人zn-1和行人zn左右关系概率值,条件概率函数p(R,zn-1,ln,wn,mn)在训练模块所得到的多人检测子中计算得到,p(R|zn-1,zn,c=n)大于等于预设阈值表示该区域有行人,否则表示该区域不包含行人。
CN201510420279.3A 2015-07-17 2015-07-17 一种基于选择性区域的多行人检测方法及系统 Active CN105023001B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510420279.3A CN105023001B (zh) 2015-07-17 2015-07-17 一种基于选择性区域的多行人检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510420279.3A CN105023001B (zh) 2015-07-17 2015-07-17 一种基于选择性区域的多行人检测方法及系统

Publications (2)

Publication Number Publication Date
CN105023001A true CN105023001A (zh) 2015-11-04
CN105023001B CN105023001B (zh) 2018-03-27

Family

ID=54412956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510420279.3A Active CN105023001B (zh) 2015-07-17 2015-07-17 一种基于选择性区域的多行人检测方法及系统

Country Status (1)

Country Link
CN (1) CN105023001B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107331118A (zh) * 2017-07-05 2017-11-07 浙江宇视科技有限公司 跌倒检测方法及装置
CN110674787A (zh) * 2019-10-09 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于Hog特征和lgb分类器的视频解压缩方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304740A1 (en) * 2007-06-06 2008-12-11 Microsoft Corporation Salient Object Detection
CN102201059A (zh) * 2011-05-20 2011-09-28 北京大学深圳研究生院 一种行人检测方法及装置
CN104008404A (zh) * 2014-06-16 2014-08-27 武汉大学 一种基于显著直方图特征的行人检测方法及系统
CN104008380A (zh) * 2014-06-16 2014-08-27 武汉大学 一种基于显著区域的行人检测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080304740A1 (en) * 2007-06-06 2008-12-11 Microsoft Corporation Salient Object Detection
CN102201059A (zh) * 2011-05-20 2011-09-28 北京大学深圳研究生院 一种行人检测方法及装置
CN104008404A (zh) * 2014-06-16 2014-08-27 武汉大学 一种基于显著直方图特征的行人检测方法及系统
CN104008380A (zh) * 2014-06-16 2014-08-27 武汉大学 一种基于显著区域的行人检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PEDRO F. FELZENSZWALB 等: "Cascade Object Detection with Deformable Part Models", 《THE TWENTY-THIRD IEEE CONFERENCE ON COMPUTER VISION AND PATTERN》 *
王晓 等: "基于显著区域的行人检测算法", 《计算机工程与设计》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107331118A (zh) * 2017-07-05 2017-11-07 浙江宇视科技有限公司 跌倒检测方法及装置
CN107331118B (zh) * 2017-07-05 2020-11-17 浙江宇视科技有限公司 跌倒检测方法及装置
CN110674787A (zh) * 2019-10-09 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于Hog特征和lgb分类器的视频解压缩方法及系统

Also Published As

Publication number Publication date
CN105023001B (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN107016357B (zh) 一种基于时间域卷积神经网络的视频行人检测方法
CN105046196B (zh) 基于级联卷积神经网络的前车车辆信息结构化输出方法
CN104809443B (zh) 基于卷积神经网络的车牌检测方法及系统
CN104778453B (zh) 一种基于红外行人亮度统计特征的夜间行人检测方法
CN105913003B (zh) 一种多特征多模型的行人检测方法
CN102184419B (zh) 基于敏感部位检测的色情图像识别方法
CN107273832B (zh) 基于积分通道特征与卷积神经网络的车牌识别方法及系统
CN107463892A (zh) 一种结合上下文信息和多级特征的图像中行人检测方法
CN105913040A (zh) 暗视觉条件下的双摄像头实时行人检测系统
CN109446922B (zh) 一种实时鲁棒的人脸检测方法
CN110929593A (zh) 一种基于细节辨别区别的实时显著性行人检测方法
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN103714181A (zh) 一种层级化的特定人物检索方法
CN104008404B (zh) 一种基于显著直方图特征的行人检测方法及系统
CN105138987A (zh) 一种基于聚合通道特征和运动估计的车辆检测方法
Liu et al. Multi-type road marking recognition using adaboost detection and extreme learning machine classification
CN106909883A (zh) 一种基于ros的模块化手部区域检测方法和装置
CN102479329A (zh) 分类器生成装置和方法,检测图像中的对象的装置和方法
CN107315990A (zh) 一种基于xcs‑lbp特征以及级联aksvm的行人检测算法
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN108073940A (zh) 一种非结构化环境中的3d目标实例物体检测的方法
Mitsui et al. Object detection by joint features based on two-stage boosting
CN106446832B (zh) 一种基于视频的实时检测行人的方法
Dong et al. Nighttime pedestrian detection with near infrared using cascaded classifiers
CN105023001A (zh) 一种基于选择性区域的多行人检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant