CN102842045A - 一种基于组合特征的行人检测方法 - Google Patents

一种基于组合特征的行人检测方法 Download PDF

Info

Publication number
CN102842045A
CN102842045A CN2012102758984A CN201210275898A CN102842045A CN 102842045 A CN102842045 A CN 102842045A CN 2012102758984 A CN2012102758984 A CN 2012102758984A CN 201210275898 A CN201210275898 A CN 201210275898A CN 102842045 A CN102842045 A CN 102842045A
Authority
CN
China
Prior art keywords
pedestrian
gradient
sample
training
sorter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102758984A
Other languages
English (en)
Other versions
CN102842045B (zh
Inventor
戴声奎
定志锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN201210275898.4A priority Critical patent/CN102842045B/zh
Publication of CN102842045A publication Critical patent/CN102842045A/zh
Application granted granted Critical
Publication of CN102842045B publication Critical patent/CN102842045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明一种基于组合特征的行人检测方法,将一定数量、尺寸相同的训练样本,该训练样本包括包含行人的正样本和随机截取一些不包含行人的背景的负样本;对所述的训练样本提取统计结构梯度特征,然后送入支持向量机中训练得到一个分类器,然后使用级联结构训练一个n层的级联分类器,得到一个离线的级联分类器作为最终的判别行人的分类器,通过该分类器去检测图像或视频中的行人,并将其标注出来;能准确描述行人且计算简单,能够很好地平衡检测精度与检测速度。

Description

一种基于组合特征的行人检测方法
技术领域
本发明涉及一种基于组合特征的行人检测方法。
背景技术
近年来,在计算机视频监控领域中,后端智能视频分析是一个热门的研究领域。而行人检测技术又是一些智能视频分析技术的先决条件。目前,行人检测有两种方式:一种是基于局部特征的行人检测,一种是基于全局特征的行人检测。基于局部特征的行人检测优点在于计算速度快,实时性较好,但由于行人在图像中是一个宏观表现,不像人脸较小—用局部特征(微观)足以描述,用局部特征(微观)很难对行人进行表征;基于全局特征的行人检测优点在于准确率高,由于提取各种各样的行人全局特征,通过训练缩小类间(行人与行人)差异,增大了两类(目标与背景)差异,对行人的描述较准确,但由于特征计算复杂,因此不能达到实时检测行人的目的。
发明内容
本发明为了克服现有复杂场景中行人检测技术的不足,提出一种能准确描述行人且计算简单的行人检测方法,能够很好地平衡检测精度与检测速度。
一种基于组合特征的行人检测方法,分为训练过程和检测过程,先离线训练一个判别行人的级联分类器,然后通过该级联分类器去检测图像中是否有行人,如果判断有行人则将其标注出来;
所述的训练过程具体包括如下步骤:
步骤11、从包含行人的图像中截取大小为AxB包含行人的窗口作为正样本,该n个正样本形成正训练样本集;随机截取大小为AxB不包含行人的窗口作为负样本,该m个负样本形成初始负训练样本集,选取h张场景较复杂但不包含行人的图片作为负样本替换集的初始内容;
步骤12、在提取正、负训练样本集中所有训练样本的统计结构梯度特征(SSGF)后,将正样本标签置为+1,负样本标签置为-1,设置训练次数初始值t为0;
步骤13、将所有正负训练样本的统计结构梯度特征和对应的样本标签送入支持向量机中进行训练,设定支持向量机的训练参数:C=0.01,核函数kernel(x1,x2)=x1*x2;依照训练次数t,分别得到t个分类器Ht,然后将分类器H1、分类器H2、分类器H3、…、分类器Ht排列组合成级联分类器,每级分类器的判定门限为θ;
步骤14、检测窗口经过级联分类器逐级判断皆为有行人时,则接受该检测窗口,一旦其中一个分类器判断检测窗口内没有行人就拒绝该检测窗口;利用当前级联分类器在预置的负样本替换集中搜寻困难样本,所述的困难样本是指当前级联分类器将无行人的检测窗口判别为有行人时的负样本,终止条件如下:
步骤141、经过步骤13后,若当前m个负样本中被当前级联分类器正确分类的m1个负样本将被丢弃,相应地搜寻m1个困难样本加入负训练样本集中;被当前级联分类器判断为正样本的将被保留下来作为困难样本进入下一轮训练,返回步骤13;当m个负样本全部成为困难样本时停止搜索,终止本轮训练;
步骤142、对负样本替换集中每个替换样本构建一组5种尺度缩放因子为0.8的倍数的金字塔图像,然后让检测窗口在金字塔图像上扫描,使用当前级联分类器判断该检测窗口中是否含有行人,若判断存在行人,则执行步骤141,否则一直搜索到负样本替换集穷尽为止,然后终止本轮训练;
步骤15、训练次数t=t+1,重复步骤13至步骤14,得到最终级联分类器;
所述的检测过程具体包括如下步骤:
步骤21、根据待检测图像构建金字塔图像,尺度缩放因子为0.8;
步骤22、计算金字塔图像中的LBPU结构图和自然梯度图,以及结构特征积分图和梯度特征积分图;
对统计结构梯度特征进行计算并与门限值进行比较,公式为
result=wT*f≥θ
其中,w为分类器,f为特征向量,θ为分类器的判定门限;其中,统计结构梯度特征计算分为结构特征计算和自然梯度特征计算,即
w T * f = [ w 1 w 2 ] T f 1 f 2 = ( w 1 ) T * f 1 + ( w 2 ) T * f 2
其中,w1为结构特征分类器,w2为自然梯度特征分类器,f1为结构特征,f2为自然梯度特征;
所述的结构特征积分图为:
对于图像中任意一点(x0,y0
w 1 * f 1 = Σ i = 1 10 Σ j = 1 5 w i , j 1 f i , j 1
= Σ i = 1 10 Σ j = 1 5 Σ x = 0 2 * h - 1 Σ y = 0 2 * w - 1 w i , j 1 ( val ( x + ( i - 1 ) * h + x 0 , y + ( j - 1 ) * w + y 0 ) )
其中,val(x,y)为(x,y)点的LBPU值,w1 ij(val(x,y))为(x,y)点的权重,令:
A ( x , y ) = Σ i = 1 10 Σ j = 0 5 w i , j 1 ( val ( x , y ) ) - - - ( 4 )
表示对应每个分块中对应(x,y)点的权重都累加到了A(x,y)上,将公式(4)中前后两个求和符号交换可以得到
w 1 * f 1 = Σ x = x 0 x 0 + 2 h - 1 Σ y - y 0 y 0 + 2 w - 1 A ( x , y )
便利一遍该图像形成一个整幅图像的结构特征积分图;
所述的梯度特征积分图为:
任意一点(x,y),可以用一个4维的向量表示
ii ( x , y , i ) = Σ x ′ ≤ x , y ′ ≤ y i ( x ′ , y ′ , i ) , i ∈ { 0,1,2,3 } - - - ( 6 )
因此可以通过式(6)构建一个4维的梯度特征积分图;
步骤23、检测窗口在金字塔图像中滑动,通过训练好的级联分类器对检测窗口进行判断,如果该检测窗口中的计算值result大于等于当前分类器的判定门限θ,则判定为行人,记录此时图像的尺度和位置;
步骤24、扫描完整个金字塔图像后,对判定为行人位置的检测窗口进行融合,最终用矩形框将行人在图像上标注出来。
所述的统计结构梯度特征提取包括如下步骤:
步骤121、对训练样本(I)求取sobel梯度图像(G),并计算梯度图像(G)中的幅值G:
其中sobel模板采用: gx = - 1 0 1 - 2 0 2 - 1 0 1 gy = - 1 - 2 - 1 0 0 0 1 2 1
则幅值 G = max k ∈ channel ( I ) ( gx k * gx k + gy k * gy k )
步骤122、为了实现人体边缘轮廓的连续性,对sobel梯度图像(G)求取LBPU结构图(SG);
LBPU结构图计算公式:
LBP P , R = Σ P = 0 P - 1 s ( g p - g c ) 2 p
s ( x ) = 1 x ≥ 0 0 other
其中P表示邻域像素的个数,gc表示中心像素的灰度值,gp表示中心相邻的像素灰度值,设置p=8,R=2;
步骤123、沿人体边缘轮廓梯度方向,对sobel梯度图像(G)求取自然梯度图(NG):
sobel梯度图像(G)中每一点都存在四个方向的梯度,分别为135°(①),90°(②)、45°(③)、0°(④),每个方向上存在一个标志位Flag,当且仅当同一方向上的三个像素强度按顺序排列时,将Flag=True,否则置为False;
步骤124、按照步骤123的计算方法,sobel梯度图像(G)每一点可以表示为四个方向的梯度向量,将自然梯度图(NG)按四个方向分割开,分别计算四个方向的自然梯度积分图;
步骤125、按照训练样本去除边界后的大小作为检测窗口的大小,对检测窗口进行分块处理,其中每一个块大小为16x20,包含4个cell,大小为8x10;以一个cell大小为步长、一个块大小的窗口在检测窗口中滑动,在每个块中搜集特征,统计一个块中LBPU的直方图,记做一个59维的块结构特征,然后统计对应块中每个cell的自然梯度累加和,每个cell为一个4维的向量,从左到右顺序连接4个cell,形成一个16维的自然梯度直方图,则一个块可以表示为一个75维的向量,按一个cell大小为步长滑动整个检测窗口后得到一个3750维的特征向量,从而融合结构特征与自然梯度特征形成统计结构梯度特征。
本发明将一定数量、尺寸相同的训练样本,该训练样本包括包含行人的正样本和随机截取一些不包含行人的背景的负样本;对所述的训练样本提取统计结构梯度特征(Statistical Structural GradientFeature,SSGF),然后送入支持向量机(Support Vector Machine,SVM)中训练得到一个分类器,然后使用级联结构(bootstrap)训练一个n(一般2~4)层的级联分类器,得到一个离线的级联分类器作为最终的判别行人的分类器,通过该分类器去检测图像中的行人,并将其标注出来。由于本发明利用了图像边缘的多种属性,如边缘的方向特性、结构特性,属于多特征融合方法,因而能更准确描述行人的统计特征,同时因为本发明在进行计算时能够采用积分图等技术提高技术速度,所以说能够很好地平衡检测精度与检测速度。
附图说明
图1为本发明中统计梯度特征示意图;
图2为本发明中梯度积分示意图;
图3为本发明中统计结构梯度算子示意图;
图4为本发明中统计结构特征提取流程图;
图5为本发明中训练框架流程图。
以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
本发明一种基于组合特征的行人检测方法,主要分为训练过程和检测过程,先离线训练一个判别行人的级联分类器,然后通过该级联分类器去检测图像中是否有行人,如果判断有行人则将其标注出来:
如图5所示,所述的训练过程具体包括如下步骤:
步骤11、从包含行人的图像中截取大小为AxB(宽x高)包含行人的窗口作为正样本,该n个正样本形成正训练样本集,本实施例中A=52,B=114;随机截取大小为AxB不包含行人的窗口作为负样本,该m个负样本形成初始负训练样本集,选取h张场景较复杂但不包含行人的图片作为负样本替换集的初始内容;
步骤12、在提取完正、负训练样本集中所有训练样本的统计结构梯度特征(SSGF)后,将正样本标签置为+1,负样本标签置为-1,设置训练次数初始值t为0;
如图4所示,所述的统计结构梯度特征提取包括如下步骤:
步骤121、对训练样本(I:3 channels)(指三通道彩色图像)进行gamma校正,公式为Vout=(Vin)sigma,sigma=0.5,调节图像的对比度,便于行人弱边缘的提取,若考虑到训练速度可以将此步骤去掉,但精度会有所降低;
步骤122、对训练样本(I)求取sobel梯度图像(G),并计算梯度图像(G)中的幅值G:
其中sobel模板采用: gx = - 1 0 1 - 2 0 2 - 1 0 1 gy = - 1 - 2 - 1 0 0 0 1 2 1
则幅值 G = max k ∈ channel ( I ) ( gx k * gx k + gy k * gy k )
步骤123、为了实现人体边缘轮廓的连续性,对sobel梯度图像(G)求取LBPU结构图(SG);
LBPU结构图计算公式:
LBP P , R = Σ P = 0 P - 1 s ( g p - g c ) 2 p
s ( x ) = 1 x ≥ 0 0 other
其中P表示邻域像素的个数,gc表示中心像素的灰度值,gp表示中心相邻的像素灰度值,设置p=8,R=2;
对于一个中心像素的一个3x3的8邻域中,通过上式可以得到一个8位的二进制串(如10010010),总共有28=256种模式(表述R=1模式),定义二进制串中1->0或0->1为一次跳变(10010010,1->0跳变有3次,0->1跳变有2次),那么定义两次跳变为统一模式(表述为R=2模式),变换后有59种模式;
步骤124、沿人体边缘轮廓梯度方向,对sobel梯度图像(G)求取自然梯度图(NG):
图1中sobel梯度图像(G)中每一点都存在四个方向的梯度,分别为135°(①),90°(②)、45°(③)、0°(④),每个方向上存在一个标志位Flag,当且仅当同一方向上的三个像素强度按顺序排列时,将Flag=True,否则置为False,其中,135°方向上的像数强度为56、110和255,按顺序排列,则Flag=True,而0°方向上的像素强度为112、110和255,不按顺序排列,则Flag=False;
步骤125、按照步骤124的计算方法,sobel梯度图像(G)每一点可以表示为四个方向的梯度向量,如图2所示,将自然梯度图(NG)按四个方向分割开,分别计算四个方向的自然梯度积分图;
步骤126、按照训练样本去除边界后的大小作为检测窗口的大小,对检测窗口进行分块处理,如图3所示,其中每一个block大小为16x20,包含4个cell,大小为8x10;以一个cell大小为步长、block大小的窗口在检测窗口中滑动,在每个block中搜集特征,统计一个block中LBPU的直方图,记做一个59维的block结构特征,然后统计对应block中每个cell的自然梯度累加和,每个cell为一个4维的向量,从左到右顺序连接4个cell,形成一个16维的自然梯度直方图,则一个block可以表示为一个59+16=75维的向量,按一个cell大小为步长滑动整个检测窗口后得到一个3750维的特征向量,从而融合结构特征与自然梯度特征形成统计结构梯度特征(SSGF);
步骤13、将所有正负训练样本的统计结构梯度特征和对应的样本标签送入支持向量机(SVM)中进行训练,并设定支持向量机中一个训练参数C=0.01,采用线性的核函数kernel(x1,x2)=x1*x2,依照训练次数t,分别得到t个分类器Ht,逐级将分类器H1、分类器H2、分类器H3、…、分类器Ht排列组合成级联分类器;其中每级的分类器采用的判定门限为θ;
步骤14、检测窗口经过级联分类器依次判断皆为行人时,接受该检测窗口,一旦其中一个分类器判断没有行人就拒绝该检测窗口;这样能快速拒绝背景,有助于提升检测的速度,利用当前级联分类器在预置的负样本替换集中搜寻困难样本,所述的困难样本是指当前级联分类器将检测窗口判别为行人时的负样本,此时表示当前级联分类器没有能力辨别此负样本,因此对当前级联分类器而言,该无法正确辨别的负样本称之为困难样本,终止条件如下:
步骤141、经过步骤13后,若当前m个负样本中被当前级联分类器正确分类的m1个负样本将被丢弃,相应地搜寻m1个困难样本加入负训练样本集中;被当前级联分类器判断为正样本的将被保留下来作为困难样本进入下一轮训练,返回步骤13;当m个负样本全部成为困难样本时停止搜索,终止本轮训练;
步骤142、对负样本替换集中每个替换样本构建一组5种尺度缩放因子为0.8的倍数的金字塔图像,该缩放因子分别为1.0、0.8、0.64、0.512、0.4096,然后让检测窗口在金字塔图像上以Xstep=8,Ystep=10的步长扫描,使用当前级联分类器判断该检测窗口中是否含有行人,若判断存在行人,则执行步骤141,否则一直搜索到负样本替换集穷尽为止,然后终止本轮训练;
步骤15、训练次数t=t+1,重复步骤13至步骤14,得到最终级联分类器。
所述的检测过程具体包括如下步骤:
步骤21、根据待检测图像构建金字塔图像,尺度缩放因子为0.8;
步骤22、计算金字塔图像中的LBPU结构图(SG)和自然梯度图(NG),以及结构特征积分图和梯度特征积分图;
对统计结构梯度特征进行计算并与分类器的判定门限进行比较,公式为:result=wT*f≥θ                        (1)
w为分类器,f为特征向量,θ为分类器的判定门限;其中,统计结构梯度特征计算分为结构特征计算和自然梯度特征计算,即
w T * f = [ w 1 w 2 ] T f 1 f 2 = ( w 1 ) T * f 1 + ( w 2 ) T * f 2 - - - ( 2 )
w1为结构特征分类器(w的一部分),w2为自然梯度特征分类器,f1为结构特征,f2为自然梯度特征;
所述的结构特征积分图:
对于图像中任意一点(x0,y0
w 1 * f 1 = Σ i = 1 10 Σ j = 1 5 w i , j 1 f i , j 1
= Σ i = 1 10 Σ j = 1 5 Σ x = 0 2 * h - 1 Σ y = 0 2 * w - 1 w i , j 1 ( val ( x + ( i - 1 ) * h + x 0 , y + ( j - 1 ) * w + y 0 ) ) - - - ( 3 )
val(x,y)为(x,y)此点的LBPU值,w1 ij(val(x,y))为此点的权重,令:
A ( x , y ) = Σ i = 1 10 Σ j = 0 5 w i , j 1 ( val ( x , y ) ) - - - ( 4 )
表示对应每个分块(block)中对应(x,y)点的权重都累加到了A(x,y)上,将公式(4)中前后两个求和符号交换可以得到
w 1 * f 1 = Σ x = x 0 x 0 + 2 h - 1 Σ y - y 0 y 0 + 2 w - 1 A ( x , y ) - - - ( 5 )
由此可以看出对于结构特征,当确定了起始点的位置时,此点对应的检测窗口的权重和以累加到了此点,因此只要便利一遍该图像,就可以形成一个整幅图像的结构特征积分图;
所述的梯度特征积分图:
对于图2中,任意一点(x,y),可以用一个4维的向量表示
ii ( x , y , i ) = Σ x ′ ≤ x , y ′ ≤ y i ( x ′ , y ′ , i ) , i ∈ { 0,1,2,3 } - - - ( 6 )
因此可以通过式(6)构建一个4维的梯度特征积分图;
步骤23、检测窗口在金字塔图像中滑动,通过训练好的级联分类器对检测窗口进行判断,如果该检测窗口中的计算值result大于等于当前分类器的判定门限θ,则判定为行人,记录此时图像的尺度和位置;窗口滑动的步长为Xstep(1~8),Ystep(1~10);
步骤24、扫描完整个金字塔图像后,对判定为行人位置的检测窗口进行融合(规则为两个窗口覆盖区域大于60%则融合),最终用矩形框将行人在图像上标注出来。
本发明的重点在于将一定数量、尺寸相同的训练样本,该训练样本包括包含行人的正样本和随机截取一些不包含行人的背景的负样本;对所述的训练样本提取统计结构梯度特征,然后送入支持向量机中训练得到一个分类器,然后使用级联结构训练一个n层的级联分类器,得到一个离线的级联分类器作为最终的判别行人的分类器,通过该分类器去检测图像中的行人,并将其标注出来。
以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (2)

1.一种基于组合特征的行人检测方法,其特征在于:分为训练过程和检测过程,先离线训练一个判别行人的级联分类器,然后通过该级联分类器去检测图像中是否有行人,如果判断有行人则将其标注出来;
所述的训练过程具体包括如下步骤:
步骤11、从包含行人的图像中截取大小为AxB包含行人的窗口作为正样本,该n个正样本形成正训练样本集;随机截取大小为AxB不包含行人的窗口作为负样本,该m个负样本形成初始负训练样本集,选取h张场景较复杂但不包含行人的图片作为负样本替换集的初始内容;
步骤12、在提取正、负训练样本集中所有训练样本的统计结构梯度特征(SSGF)后,将正样本标签置为+1,负样本标签置为-1,设置训练次数初始值t为0;
步骤13、将所有正负训练样本的统计结构梯度特征和对应的样本标签送入支持向量机中进行训练,设定支持向量机的训练参数:C=0.01,核函数kernel(x1,x2)=x1*x2;依照训练次数t,分别得到t个分类器Ht,然后将分类器H1、分类器H2、分类器H3、…、分类器Ht排列组合成级联分类器,每级分类器的判定门限为θ;
步骤14、检测窗口经过级联分类器逐级判断皆为有行人时,则接受该检测窗口,一旦其中一个分类器判断检测窗口内没有行人就拒绝该检测窗口;利用当前级联分类器在预置的负样本替换集中搜寻困难样本,所述的困难样本是指当前级联分类器将无行人的检测窗口判别为有行人时的负样本,终止条件如下:
步骤141、经过步骤13后,若当前m个负样本中被当前级联分类器正确分类的m1个负样本将被丢弃,相应地搜寻m1个困难样本加入负训练样本集中;被当前级联分类器判断为正样本的将被保留下来作为困难样本进入下一轮训练,返回步骤13;当m个负样本全部成为困难样本时停止搜索,终止本轮训练;
步骤142、对负样本替换集中每个替换样本构建一组5种尺度缩放因子为0.8的倍数的金字塔图像,然后让检测窗口在金字塔图像上扫描,使用当前级联分类器判断该检测窗口中是否含有行人,若判断存在行人,则执行步骤141,否则一直搜索到负样本替换集穷尽为止,然后终止本轮训练;
步骤15、训练次数t=t+1,重复步骤13至步骤14,得到最终级联分类器;
所述的检测过程具体包括如下步骤:
步骤21、根据待检测图像构建金字塔图像,尺度缩放因子为0.8;
步骤22、计算金字塔图像中的LBPU结构图和自然梯度图,以及结构特征积分图和梯度特征积分图;
对统计结构梯度特征进行计算并与分类器的门限值进行比较,公式为:result=wT*f≥θ
其中,w为分类器,f为特征向量,θ为分类器的判定门限;其中,统计结构梯度特征计算分为结构特征计算和自然梯度特征计算,即:
w T * f = [ w 1 w 2 ] T f 1 f 2 = ( w 1 ) T * f 1 + ( w 2 ) T * f 2
其中,w1为结构特征分类器,w2为自然梯度特征分类器,f1为结构特征,f2为自然梯度特征;
所述的结构特征积分图为:
对于图像中任意一点(x0,y0
w 1 * f 1 = Σ i = 1 10 Σ j = 1 5 w i , j 1 f i , j 1
= Σ i = 1 10 Σ j = 1 5 Σ x = 0 2 * h - 1 Σ y = 0 2 * w - 1 w i , j 1 ( val ( x + ( i - 1 ) * h + x 0 , y + ( j - 1 ) * w + y 0 ) )
其中,val(x,y)为(x,y)点的LBPU值,w1 ij(val(x,y))为(x,y)点的权重,令:
A ( x , y ) = Σ i = 1 10 Σ j = 0 5 w i , j 1 ( val ( x , y ) ) - - - ( 4 )
表示对应每个分块中对应(x,y)点的权重都累加到了A(x,y)上,将公式
(4)中前后两个求和符号交换可以得到
w 1 * f 1 = Σ x = x 0 x 0 + 2 h - 1 Σ y - y 0 y 0 + 2 w - 1 A ( x , y )
便利一遍该图像形成一个整幅图像的结构特征积分图;
所述的梯度特征积分图为:
任意一点(x,y),可以用一个4维的向量表示
ii ( x , y , i ) = Σ x ′ ≤ x , y ′ ≤ y i ( x ′ , y ′ , i ) , i ∈ { 0,1,2,3 } - - - ( 6 )
因此可以通过式(6)构建一个4维的梯度特征积分图;
步骤23、检测窗口在金字塔图像中滑动,通过训练好的级联分类器对检测窗口进行判断,如果该检测窗口中的计算值result大于等于当前分类器的判定门限θ,则判定为行人,记录此时图像的尺度和位置;
步骤24、扫描完整个金字塔图像后,对判定为行人位置的检测窗口进行融合,最终用矩形框将行人在图像上标注出来。
2.根据权利要求1所述的一种基于组合特征的行人检测方法,其特征在于:所述的统计结构梯度特征提取包括如下步骤:
步骤121、对训练样本(I)求取sobel梯度图像(G),并计算梯度图像(G)中的幅值G:
其中sobel模板采用: gx = - 1 0 1 - 2 0 2 - 1 0 1 gy = - 1 - 2 - 1 0 0 0 1 2 1
则幅值 G = max k ∈ channel ( I ) ( gx k * gx k + gy k * gy k )
步骤122、为了实现人体边缘轮廓的连续性,对sobel梯度图像(G)求取LBPU结构图(SG);
LBPU结构图计算公式:
LBP P , R = Σ P = 0 P - 1 s ( g p - g c ) 2 p
s ( x ) = 1 x ≥ 0 0 other
其中P表示邻域像素的个数,gc表示中心像素的灰度值,gp表示中心相邻的像素灰度值,设置p=8,R=2;
步骤123、沿人体边缘轮廓梯度方向,对sobel梯度图像(G)求取自然梯度图(NG):
sobel梯度图像(G)中每一点都存在四个方向的梯度,分别为135°(①),90°(②)、45°(③)、0°(④),每个方向上存在一个标志位Flag,当且仅当同一方向上的三个像素强度按顺序排列时,将Flag=True,否则置为False;
步骤124、按照步骤123的计算方法,sobel梯度图像(G)每一点可以表示为四个方向的梯度向量,将自然梯度图(NG)按四个方向分割开,分别计算四个方向的自然梯度积分图;
步骤125、按照训练样本去除边界后的大小作为检测窗口的大小,对检测窗口进行分块处理,其中每一个块大小为16x20,包含4个cell,大小为8x10;以一个cell大小为步长、一个块大小的窗口在检测窗口中滑动,在每个块中搜集特征,统计一个块中LBPU的直方图,记做一个59维的块结构特征,然后统计对应块中每个cell的自然梯度累加和,每个cell为一个4维的向量,从左到右顺序连接4个cell,形成一个16维的自然梯度直方图,则一个块可以表示为一个75维的向量,按一个cell大小为步长滑动整个检测窗口后得到一个3750维的特征向量,从而融合结构特征与自然梯度特征形成统计结构梯度特征。
CN201210275898.4A 2012-08-03 2012-08-03 一种基于组合特征的行人检测方法 Active CN102842045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210275898.4A CN102842045B (zh) 2012-08-03 2012-08-03 一种基于组合特征的行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210275898.4A CN102842045B (zh) 2012-08-03 2012-08-03 一种基于组合特征的行人检测方法

Publications (2)

Publication Number Publication Date
CN102842045A true CN102842045A (zh) 2012-12-26
CN102842045B CN102842045B (zh) 2016-08-10

Family

ID=47369380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210275898.4A Active CN102842045B (zh) 2012-08-03 2012-08-03 一种基于组合特征的行人检测方法

Country Status (1)

Country Link
CN (1) CN102842045B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198323A (zh) * 2013-03-12 2013-07-10 无锡慧眼电子科技有限公司 一种基于曲线拟合的行人检测方法
CN103279742A (zh) * 2013-05-24 2013-09-04 中国科学院自动化研究所 一种基于多任务模型的多分辨率行人检测方法及其装置
CN103902968A (zh) * 2014-02-26 2014-07-02 中国人民解放军国防科学技术大学 一种基于AdaBoost分类器的行人检测模型训练方法
CN104504394A (zh) * 2014-12-10 2015-04-08 哈尔滨工业大学深圳研究生院 一种基于多特征融合的密集人数估计方法和系统
CN104636713A (zh) * 2013-11-15 2015-05-20 深圳市朗驰欣创科技有限公司 一种基于sobel边缘检测的车窗区域识别方法及装置
CN104680134A (zh) * 2015-02-04 2015-06-03 四川长虹电器股份有限公司 快速人体检测方法
CN105654104A (zh) * 2014-11-28 2016-06-08 无锡慧眼电子科技有限公司 一种基于多粒度特征的行人检测方法
WO2016095068A1 (en) * 2014-12-15 2016-06-23 Xiaoou Tang Pedestrian detection apparatus and method
CN105740862A (zh) * 2014-10-27 2016-07-06 江苏慧眼数据科技股份有限公司 一种基于宏特征点描述的行人轮廓检测方法
CN106022295A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种数据位置的确定方法及装置
CN106156771A (zh) * 2016-06-30 2016-11-23 华南理工大学 一种基于多特征融合的水表读数区域检测算法
CN106529437A (zh) * 2016-10-25 2017-03-22 广州酷狗计算机科技有限公司 一种人脸检测的方法和装置
CN106778603A (zh) * 2016-12-13 2017-05-31 中国科学院信息工程研究所 一种基于梯度式级联svm分类器的行人识别方法
CN106815595A (zh) * 2015-11-27 2017-06-09 展讯通信(天津)有限公司 移动终端及其目标检测方法及装置
CN107122726A (zh) * 2017-04-19 2017-09-01 高新兴科技集团股份有限公司 一种多姿态行人检测方法
CN108197670A (zh) * 2018-01-31 2018-06-22 国信优易数据有限公司 伪标签生成模型训练方法、装置及伪标签生成方法及装置
CN108414734A (zh) * 2018-01-09 2018-08-17 东南大学 一种基于acf的尿沉渣检测方法
CN110674787A (zh) * 2019-10-09 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于Hog特征和lgb分类器的视频解压缩方法及系统
CN110705630A (zh) * 2019-09-27 2020-01-17 聚时科技(上海)有限公司 半监督学习式目标检测神经网络训练方法、装置及应用
CN112651458A (zh) * 2020-12-31 2021-04-13 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质
CN113129337A (zh) * 2021-04-14 2021-07-16 桂林电子科技大学 背景感知跟踪方法、计算机可读存储介质及计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246555A (zh) * 2008-03-11 2008-08-20 中国科学技术大学 一种用于行人检测的基于协同进化的特征优选方法
CN101290660A (zh) * 2008-06-02 2008-10-22 中国科学技术大学 一种用于行人检测的树状组合分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246555A (zh) * 2008-03-11 2008-08-20 中国科学技术大学 一种用于行人检测的基于协同进化的特征优选方法
CN101290660A (zh) * 2008-06-02 2008-10-22 中国科学技术大学 一种用于行人检测的树状组合分类方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198323A (zh) * 2013-03-12 2013-07-10 无锡慧眼电子科技有限公司 一种基于曲线拟合的行人检测方法
CN103198323B (zh) * 2013-03-12 2016-08-17 江苏慧眼数据科技股份有限公司 一种基于曲线拟合的行人检测方法
CN103279742A (zh) * 2013-05-24 2013-09-04 中国科学院自动化研究所 一种基于多任务模型的多分辨率行人检测方法及其装置
CN103279742B (zh) * 2013-05-24 2016-08-10 中国科学院自动化研究所 一种基于多任务模型的多分辨率行人检测方法及其装置
CN104636713A (zh) * 2013-11-15 2015-05-20 深圳市朗驰欣创科技有限公司 一种基于sobel边缘检测的车窗区域识别方法及装置
CN103902968A (zh) * 2014-02-26 2014-07-02 中国人民解放军国防科学技术大学 一种基于AdaBoost分类器的行人检测模型训练方法
CN105740862A (zh) * 2014-10-27 2016-07-06 江苏慧眼数据科技股份有限公司 一种基于宏特征点描述的行人轮廓检测方法
CN105654104A (zh) * 2014-11-28 2016-06-08 无锡慧眼电子科技有限公司 一种基于多粒度特征的行人检测方法
CN104504394A (zh) * 2014-12-10 2015-04-08 哈尔滨工业大学深圳研究生院 一种基于多特征融合的密集人数估计方法和系统
WO2016095068A1 (en) * 2014-12-15 2016-06-23 Xiaoou Tang Pedestrian detection apparatus and method
CN107003834B (zh) * 2014-12-15 2018-07-06 北京市商汤科技开发有限公司 行人检测设备和方法
CN107003834A (zh) * 2014-12-15 2017-08-01 北京市商汤科技开发有限公司 行人检测设备和方法
CN104680134A (zh) * 2015-02-04 2015-06-03 四川长虹电器股份有限公司 快速人体检测方法
CN106815595A (zh) * 2015-11-27 2017-06-09 展讯通信(天津)有限公司 移动终端及其目标检测方法及装置
CN106022295B (zh) * 2016-05-31 2019-04-12 北京奇艺世纪科技有限公司 一种数据位置的确定方法及装置
CN106022295A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种数据位置的确定方法及装置
CN106156771B (zh) * 2016-06-30 2020-01-31 华南理工大学 一种基于多特征融合的水表读数区域检测算法
CN106156771A (zh) * 2016-06-30 2016-11-23 华南理工大学 一种基于多特征融合的水表读数区域检测算法
CN106529437A (zh) * 2016-10-25 2017-03-22 广州酷狗计算机科技有限公司 一种人脸检测的方法和装置
CN106529437B (zh) * 2016-10-25 2020-03-03 广州酷狗计算机科技有限公司 一种人脸检测的方法和装置
CN106778603A (zh) * 2016-12-13 2017-05-31 中国科学院信息工程研究所 一种基于梯度式级联svm分类器的行人识别方法
CN107122726A (zh) * 2017-04-19 2017-09-01 高新兴科技集团股份有限公司 一种多姿态行人检测方法
CN108414734A (zh) * 2018-01-09 2018-08-17 东南大学 一种基于acf的尿沉渣检测方法
CN108197670B (zh) * 2018-01-31 2021-06-15 国信优易数据股份有限公司 伪标签生成模型训练方法、装置及伪标签生成方法及装置
CN108197670A (zh) * 2018-01-31 2018-06-22 国信优易数据有限公司 伪标签生成模型训练方法、装置及伪标签生成方法及装置
CN110705630A (zh) * 2019-09-27 2020-01-17 聚时科技(上海)有限公司 半监督学习式目标检测神经网络训练方法、装置及应用
CN110674787A (zh) * 2019-10-09 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于Hog特征和lgb分类器的视频解压缩方法及系统
CN112651458A (zh) * 2020-12-31 2021-04-13 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质
CN112651458B (zh) * 2020-12-31 2024-04-02 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质
CN113129337A (zh) * 2021-04-14 2021-07-16 桂林电子科技大学 背景感知跟踪方法、计算机可读存储介质及计算机设备
CN113129337B (zh) * 2021-04-14 2022-07-19 桂林电子科技大学 背景感知跟踪方法、计算机可读存储介质及计算机设备

Also Published As

Publication number Publication date
CN102842045B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN102842045A (zh) 一种基于组合特征的行人检测方法
Chadwick et al. Distant vehicle detection using radar and vision
Yuan et al. Large-scale solar panel mapping from aerial images using deep convolutional networks
Kontgis et al. Monitoring peri-urbanization in the greater Ho Chi Minh City metropolitan area
Wu et al. Rapid localization and extraction of street light poles in mobile LiDAR point clouds: A supervoxel-based approach
CN102542289B (zh) 一种基于多高斯计数模型的人流量统计方法
CN110766098A (zh) 基于改进YOLOv3的交通场景小目标检测方法
CN107346420A (zh) 一种基于深度学习的自然场景下文字检测定位方法
CN101339601B (zh) 一种基于sift算法的车牌汉字识别方法
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
CN102043958B (zh) 一种高分辨率遥感图像多类目标检测识别方法
CN103903441B (zh) 一种基于半监督学习的道路交通状态判别方法
CN102214291A (zh) 一种快速准确的基于视频序列的人脸检测跟踪方法
CN101976353B (zh) 低密度人群的统计方法及装置
CN105426905A (zh) 基于梯度直方图和支持向量机的机器人障碍物识别方法
CN105138982A (zh) 一种基于多特征聚类及分类的人群异常检测与评估方法
CN108090911A (zh) 一种光学遥感图像的近岸舰船分割方法
CN102645679A (zh) 一种基于多普勒天气雷达回波图像的中气旋识别方法
CN103400391A (zh) 一种基于改进的随机森林的多目标跟踪方法及装置
CN102930287A (zh) 一种针对俯视行人的检测计数系统及方法
CN104408482A (zh) 一种高分辨率sar图像目标检测方法
CN101694720B (zh) 基于空间关联条件概率融合的多时相sar图像变化检测方法
CN104573811A (zh) 一种红外图像和彩色图像融合的人流量统计方法
CN103902981A (zh) 一种基于字符融合特征的车牌字符识别方法及系统
CN103473785A (zh) 一种基于三值化图像聚类的快速多目标分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant