CN106339686A - 一种基于稀疏判别模板特征的行人检测方法 - Google Patents

一种基于稀疏判别模板特征的行人检测方法 Download PDF

Info

Publication number
CN106339686A
CN106339686A CN201610754485.2A CN201610754485A CN106339686A CN 106339686 A CN106339686 A CN 106339686A CN 201610754485 A CN201610754485 A CN 201610754485A CN 106339686 A CN106339686 A CN 106339686A
Authority
CN
China
Prior art keywords
template
pedestrian
feature
sparse
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610754485.2A
Other languages
English (en)
Inventor
沈继锋
左欣
杨万扣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201610754485.2A priority Critical patent/CN106339686A/zh
Publication of CN106339686A publication Critical patent/CN106339686A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/755Deformable models or variational models, e.g. snakes or active contours
    • G06V10/7553Deformable models or variational models, e.g. snakes or active contours based on shape, e.g. active shape models [ASM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明公开了一种基于稀疏判别模板特征的行人检测方法。该方法利用行人和非行人训练样本自动学习一组具有强判别能力的稀疏模板特征(SDT),并用于行人检测系统。该方法首先采用多通道图作为底层特征,利用行人的形状信息和训练样本统计分布信息,基于稀疏判别分析方法自动学习具有强判别能力的稀疏判别模板作为滤波器;其次利用该滤波器对底层特征进行卷积得到中层特征;最后利用基于Gentle boost算法的软级联框架训练得到最终的行人检测器。通过在INRIA,ETH和Caltech公开数据集上和当前已有多种特征的实验对比发现,本发明提出的特征不但计算复杂度低、判别能力强、检测率高,而且运行检测640×480尺寸的车载视频图像可以达实时。

Description

一种基于稀疏判别模板特征的行人检测方法
技术领域
本发明涉及计算机视觉的目标检测技术领域,特别涉及一种基于稀疏判别模板特征的行人检测方法。
背景技术
行人检测系统涉及模式识别、计算机视觉等领域,其研究是一项复杂而意义深远的项目,在视频监控、人机交互、智能汽车等很多领域有着广泛的应用。尽管近些年行人检测技术有了一些初步的发展,但是由于清晰度、遮挡、光照、视角变化等因素,使行人检测仍是一个复杂且充满挑战的课题。目前行人检测技术主要集中在两个方面的研究:设计具有强判别能力的特征和构建快速有效的模型学习算法。经典的特征主要包含haar、HOG(梯度直方图),LBP(局部二值模式)和积分通道特征(ICF)等,而学习算法主要包含SVM(支持向量机)、随机森林和Adaboost级联分类器。经典特征在实际应用中发现判别能力较弱或者计算复杂度较高等缺点,而设计具有强判别能力的特征提取方法是提高行人检测精度和速度的关键因素。
发明内容
本发明专利提出了一种自动学习强判别模板特征的方法,大大降低了手动设计特征的难度。该方法不仅在公开数据集中具有很好的检测精度和运行速度,在车载视频中的检测具有较好的检测率,运行速度在640x480图像分辨率中的运行速度达到了20帧每秒的速度。
本发明解决技术问题所采用的方案是一种基于稀疏判别模板特征的行人检测方法,包括以下步骤:
1)输入样本,即正负训练样本图像;
2)对步骤1)的样本图像计算多通道特征,包括梯度幅值通道特征、六个梯度方向通道特征、LUV色彩空间三个通道特征;
3)对步骤2)得到的多通道特征进行聚合操作,得到抗干扰能力更强的多通道特征;
4)基于步骤3)得到的多通道特征,对标准行人模板每个通道分别学习稀疏判别模板(SDT),得到最终的SDT模板集合;
5)基于步骤4)求得所有训练样本的特征模板集,利用非对称Gentle Boost算法进行模板选择,并利用软级联方法训练最终行人检测器;
6)利用步骤5)中训练得到的行人检测器对待检图像进行检测。
上述方法中,所述步骤1)中的样本图像是从一些大图像中挖掘的尺寸均为128×64×3的RGB彩色图像,其中正样本是已标注的包含行人的图像,而负样本是不含行人的图像。
上述方法中,所述步骤2)中的样本图像具有多个通道,而我们只选择其中代表性强的十个通道,包括梯度幅值通道、六个梯度方向通道、LUV色彩空间三个通道。
上述方法中,所述步骤3)用了聚合操作众多方法中的一种池化操作(pooling),它以4×4区域,把用三维矩阵128×64×10表示的十个通道特征图像最大化池化(maxPooling)为32×16×10表示的十个通道图像,这里用到池化操作是一种抗噪声干扰措施。
上述方法中,所述步骤4)是生成标准行人区域与背景重叠区域模板,在此基础上利用稀疏判别分析学习正负样本特定位置的特征判别信息,才得到本发明的稀疏判别模板特征。
上述方法中,所述步骤4)包括以下步骤:
4.1)计算标准行人模板;
4.2)在32×16窗口中分别生成s×s的所有可能位置的正方形模板
s∈{3,5,7},并筛选出K个同时包含人体轮廓和背景的模板Ti=(xi,yi,s);
4.3)利用稀疏判别分析方法计算模板中的权重信息
c∈{1,2,..,10}。
上述方法中,所述步骤4.3)用了稀疏线性判别函数 该函数可通过二次规划法求得模板权重的最优值,另外,Sw、m1以及m2的计算用到了正负样本的分布信息。正因用到平均行人模板的模板统计信息以及全部正负训练样本上具有强判别能力的分布信息,所以训练得到的模板权重判别力强,这也大大提高了本发明方法的检测率,而利用稀疏的判别模板权重可以降低分类器计算的复杂度,可以提高本发明方法的检测速度。
上述方法中,所述步骤5)是以二层决策树作为弱分类器,用非对称Gentle Boost算法在全部训练样本的SDT模板集合中进行特征选择,最后用软级联结构来组合被选择的每个弱分类器构成强分类器,其中被选择的模板子集为M<K*10。
上述方法中,所述步骤6)包括以下步骤:
6.1)获取尺寸为W×H的待测试图像;
6.2)对该图像构造图像金字塔,其中最大尺度为原图像大小,最小尺度为128×64;
6.3)对步骤6.2)获得的图像金字塔计算通道特征金字塔,即对图像金字塔中的每一层计算十通道特征;
6.4)对步骤6.3)获得的十通道特征进行聚合操作,得到增强型通道特征;
6.5)对步骤6.4)中的特征金字塔,利用滑动窗口法对每个待选窗口进行判断,具体过程是利用训练模型中被选择的强判别模板子集Tsubset进行卷积得到特征值并且在对应的决策树上获取决策结果;
6.6)保存所有被所有决策树判断为正样本的窗口,并记录他们的累加响应值;
6.7)利用最大响应优先法融合重叠的检测窗口,获得最终检测位置;
6.8)输出所有的检测位置和相应的响应值(xi,yi,wi,hi,scorei)i=1,...,D
本发明的技术效果表现在:与现有方法相比,它不仅用了多通道信息,也用了标准人体模板的模板统计以及训练数据的分布信息,提高了特征判别能力,从而使训练速度加快,也提高了检测率,同时降低了误检率。
附图说明
图1为本发明流程示意图。
图2为原图像与十个通道特征图。
图3为本发明的稀疏判别模板及其行人平均图,平均行人紧凑窗口。其中(a)表示的是尺寸为128×64的行人平均图,是通过计算所有正样本像素平均值得到的;(b)是尺寸为32×16且步长为4像素的胞组网格表示的样本模板,其中标粗的大矩形是平均行人紧凑窗口区域,标粗的6×6的正方形代表一个特征模板;(c)是示例模板与相应的稀疏模板权重。
图4为稀疏判别模板学习过程示意图。
图5为三个公开标准数据集(INRIA,ETH,Caltech)上的部分行人检测结果。
图6为汽车行车记录仪视频图片检测结果图。(a)和(b)分别表示视频中的一帧图片,里面白色矩形框是用来标记检测到的行人。
具体实施方式
本发明的整体操作流程图如图1所示,是一种基于稀疏判别模板特征的行人检测方法。下面结合附图,对本发明进行详细说明。
步骤1:输入样本,即正负训练样本图像;
这里的样本图像是从一些大图像中挖掘的尺寸均为128×64×3的RGB彩色图像,其中正样本是20000幅已标记的包含行人的图像,而负样本是17000幅不含行人的图像。
步骤2:对步骤1的样本图像计算多通道特征,包括梯度幅值通道特征、六个梯度方向通道特征、LUV色彩空间三个通道特征;
原始样本图像有多个通道包括梯度幅值、梯度直方图、边缘图、LBP,LUV色彩空间通道和canny图等,如图2所示是其中的一部分。而这里我们只选择其中代表性强的十个通道特征组成积分通道特征,包括梯度幅值特征、六个梯度方向通道特征和LUV色彩空间三个通道特征。
以下是步骤2的具体实现:
步骤2.1:计算梯度幅值通道特征;
先把彩色RGB图像转化成灰度图I,对原始128×64×3图像中的每一个像素点用下述公式求得其灰度值,
Gray=0.29900*R+0.58700*G+0.11400*B (6)
这样得到的一个128×64的矩阵代表了灰度图I,然后在进行梯度特征相关运算,这里用I(x,y)表示图像I在像素点(x,y)的灰度值,具体计算过程如下:
Gx(x,y)=I(x+1,y)-I(x-1,y) (7)
Gy(x,y)=I(x,y+1)-I(x,y-1) (8)
G ( x , y ) = G x ( x , y ) 2 + G y ( x , y ) 2 - - - ( 9 )
其中,Gx(x,y)、Gy(x,y)分别表示像素点(x,y)处的水平方向和垂直方向的梯度,G(x,y)表示像素点(x,y)的梯度幅值,对于128×64图像中的每一个像素点都求得与之对应的梯度幅值,则我们可以得到一个128×64的矩阵,即梯度幅值通道特征。
步骤2.2:计算六个梯度方向通道特征;
α ( x , y ) = tan - 1 G y ( x , y ) G x ( x , y ) - - - ( 10 )
α(x,y)表示像素点(x,y)处的梯度方向角。这里我们把区间为[0,180]的梯度方向角均匀分成6个区间([0,30]、[30,60]、[60,90]、[90,120]、[120,150]、[150,180]),分别叫梯度方向通道1、2、3、4,5和6。对于128×64图像中的每一个像素点都求得与之对应的梯度方向角,得到一个128×64的矩阵A。
接着进行方向通道的归类,用像素点(x,y)的梯度方向角和其本来所属的区间中点对比,比如该点的梯度方向角为65度,小于75(区间[60,90]的中点)度,则该点同时在方向通道2和3都有作用,其在方向通道2上的值为而在方向通道3上的值为若该点的梯度方向角为80度,大于75度,则该点同时在方向通道3和4都有作用,其两个值可按65度的解法得到。这样对于每一个方向通道,我们遍历一次矩阵A,计算出每个像素点对应的新值,放到新的128×64的矩阵中作为梯度方向通道,一次遍历得到六个梯度方向通道。
步骤2.3:计算LUV色彩空间三个通道特征。
这个过程是RGB颜色空间的两次转换,首先把RGB色彩空间转化到XYZ色彩空间,如式(11)所示:
X Y Z = 1 0.17697 0.49 0.31 0.20 0.17697 0.81240 0.01063 0.00 0.01 0.99 R G B - - - ( 11 )
然后把XYZ色彩空间转化到LUV色彩空间,如式(12-19)所示:
u = 4 X X + 15 Y + 3 Z - - - ( 12 )
v = 9 Y X + 15 Y + 3 Z - - ( 13 )
yn=1 (14)
u n = 4 * 0.950456 0.950456 + 15 * 1 + 3 * 1.088754 - - - ( 15 )
v n = 9 * 1 0.950456 + 15 * 1 + 3 * 1.088754 - - - ( 16 )
最后,由式(12)-(16)得到下式:
L = 116 * ( Y Y n ) 1 3 - 16 , Y Y n > ( 6 29 ) 3 ( 29 3 ) 3 * Y Y n , Y Y n ≤ ( 6 29 ) 3 - - - ( 17 )
U=13L*(u-un) (18)
V=13L*(v-vn) (19)
这样就得到LUV色彩空间的三通道,其中L是亮度,U和V都是色度。
步骤3:对步骤2得到的多通道特征进行聚合操作,得到抗干扰能力更强的多通道特征;
这里用了聚合操作众多方法中的一种池化操作(pooling),它以4×4区域,把用三维矩阵128×64×10表示的十个通道特征图像最大化池化(max Pooling)为32×16×10表示的十个通道图像。也可以理解为以4像素为步长,以为缩放因子,对上一步得到的通道图像进行的一种缩放操作。这里用到池化操作是一种抗噪声干扰措施。
步骤4:基于步骤3得到的多通道特征,对标准行人模板每个通道分别学习稀疏判别模板(SDT),得到最终的SDT模板集合;
这里特征是基于聚合通道特征框架,生成标准行人区域与背景重叠区域模板,在此基础上用了标准行人模板的形状统计信息以及正负样本中的数据分布信息,通过稀疏判别分析学习正负样本特定位置的特征判别信息,才得到本发明的稀疏判别模板特征SDT。
步骤4.1:计算标准行人模板;
步骤4.1.1:取出正样本集所有以三维矩阵128×64×3表示的含有行人的RGB彩色图像;
步骤4.1.2:针对图像中每一个像素点(x,y),计算20000幅正样本图像中该位置处的像素点灰度值之和,再除以20000,得到该像素点灰度值的平均值,最后求得一个以三维矩阵128×64×3表示的标准行人模板,其中每个像素点的灰度值都是平均值,如图3(a)所示。
步骤4.1.3:以4像素为步长,即以为缩放因子,把这个以128×64×3表示的标准行人模板缩放到以32×16×3表示的标准行人模板,如图3(b)所示为一个胞组网格表示图,其中每个小方格代表了4个像素点。
步骤4.2:在32×16窗口中分别生成s×s的所有可能位置的正方形模板s∈{3,5,7},并筛选出K个同时包含人体轮廓和背景的模板Ti=(xi,yi,s);
步骤4.2.1:先计算含有标准行人模板的32×16的图像窗口中所有特征,这里为了缩小并优化特征池的大小,用边长分别为3、5、7的几种正方形代表特征,其左上角坐标(y,x)是从这个窗口左上角(1,1)处开始依次向右和向下变化直到(30,14)处,宽度w和高度h相等,等于边长。这里我们得到了这个窗口中1368个不同坐标和尺寸的特征。
步骤4.2.2:确定平均行人的紧凑窗口位置100×40,左上角坐标为(12,16)。为了加快训练速度同时提高检测精度,我们只考虑这些模板中同时包含背景区域和平均人体区域的模板(即该特征必须包含背景区域,而人体模板的头、躯干和下半身三个部位至少有一个),也即含人体轮廓边界的那些特征,因为这些边界信息往往可以更好地从背景区域判别出行人,如图3(c)所示为一个示例模板。最终筛选出符合要求的843个特征。
步骤4.3:利用稀疏判别分析方法计算模板中的权重信息c∈{1,2,..,10};
步骤4.3.1:任选843个特征中的某一个特征,用w=(w1,w2,...,wd)T表示该特征在某一个正样本下的初始权重,其中w1,w2,...,wd表示特征中包含的每个区域各自的初始权重,该值可以通过对正样本中这d个不同区域学习获得。
步骤4.3.2:由下式
m c = 1 N c Σ j = 1 N c w j c , c = 1,2 - - - ( 20 )
s c = Σ j = 1 N c ( w j c - m c ) ( w j c - m c ) , c = 1,2 - - - ( 21 )
求正负样本对应特征所在区域的平均值向量和协方差矩阵,其中c=1,2分别代表正、负样本,Nc代表正负样本的个数,这里正样本20000个,负样本17000个,j代表样本序号。也即这里Sw、m1以及m2的计算用到了正负样本的分布信息。
步骤4.3.3:再由下式(17)求解类内离散矩阵
Sw=S1+S2 (22)
步骤4.3.4:利用二次规划求解下式稀疏线性判别函数
w * = arg min w w T S w w s . t . w T ( m 1 - m 2 ) = 1 , Σ j = 1 p | w j | ≤ τ - - - ( 23 )
求得模板权重的最优值,即w*=(w1,w2,...,wd)T。如图4所示,是一个训练好的带有最优权重的稀疏判别特征模板。
步骤4.3.5:按照上述方法,求得十个通道上共8430个特征的权重,作为一个特征集保存起来。
步骤5:基于步骤4求得所有训练样本的特征模板集,利用非对称Gentle Boost算法进行模板选择,并利用软级联方法训练最终行人检测器;
这里是以二层决策树作为弱分类器,用非对称Gentle Boost算法在全部训练样本的SDT模板集合中进行特征选择,最后用软级联结构来组合被选择的每个弱分类器构成强分类器,其中被选择的模板子集为M<K*10。
步骤5.1:计算特征集在全部正负样本集上的特征值。如某个特征包含d个区域,且权重为w=(w1,w2,...,wd)T,而d个区域在某个样本中对应区域的特征平均值为f1,f2,...,fd,则该特征值如下所示
F = Σ i = 1 d w i * f i - - - ( 24 )
步骤5.2:因为传统的一层决策树判别能力不是太好,所以这里每一轮用二层决策树形式选出三个分类性能好的特征组成弱分类器。第一次先选出一个特征,保证该特征分类时有着最低的分类误差,这里的分类误差用下式表示
err = &Sigma; j = 1 N 1 + N 2 ws . abs ( ( p * f < p * theta ) - ys ) - - - ( 25 )
其中,N1代表正样本个数,N2代表负样本个数,j代表样本序号,ws是样本初始化权重,是一个向量,为前面1-N1个ws代表正样本权重,初始化为后面1-N2个ws代表负样本权重,初始化为abs为求括号中的绝对值,p代表一种方向,为1或-1,f为某一特征在样本中的特征响应向量前面1-N1个f代表该特征在正样本中的特征响应,后面1-N2个f代表该特征在负样本中的特征响应,ys为样本标志,为(1,...,1,0,...,0)T,这里有N1个1,N2个0,而theta为某一特征下可以尽量把正负样本分开的阈值,可以用以下公式表示
mu _ p = &Sigma; ( ws . * f . * ys ) &Sigma; ( ws . * ys ) - - - ( 26 )
mu _ n = &Sigma; ( ws . * f . * ( 1 - ys ) ) &Sigma; ( ws . * ( 1 - ys ) ) - - - ( 27 )
theta = mu _ p + mu _ n 2 - - - ( 28 )
对于每一个特征,都要计算p为1和-1时的分类误差,取其中小的为该特征分类误差,相应的该特征的p就是那个小的对应的1或者-1。然后计算全部特征集里每一个特征的分类误差,找到最小的,即为第一次挑选的最佳特征,而且该特征把全部样本分成了两类,定义为类1和类2,我们认为类1为正样本、类2为负样本,或者类1为负样本、类2为正样本。然而实际上里面是有误差存在的,两类中都夹杂着一些相反的样本,这样我们在类1和类2中重复上一步骤,在各自类中再挑选一个分类误差最低的特征。这样挑出的三个特征即以一个二层决策树形式作为我们第一次循环得到的弱分类器。
步骤5.3:更新样本的权重,我们把第一轮循环中分错的样本权重加大,分对的样本权重减小,如下式所示
ws_new=ws.*β.^(1-abs((p*f<p*theta)-ys)) (30)
然后进行下一轮的训练,每轮训练完都要更新样本权重。这里我们用软级联的算法,当循环到32轮时,我们会把用当前32层强分类器误检的10000张困难负样本补充到负样本集中进行下一轮的训练,以此来增加分类器的判别能力,继续循环到128轮,512轮和2048轮后用类似的做法补充困难负样本,最终得到的强分类器,即检测模板就是用2048个弱分类器组成。然后调整这2048个弱分类器的阈值,为每一轮中正样本特征值的最小值。
步骤6:利用步骤5中训练得到的行人检测器对待检图像进行检测。
这里是把检测模板用在三个标准数据集INRIA,ETH和Caltech-USA上进行行人检测。
步骤6.1:获取尺寸为W×H的待测试图像;
步骤6.2:对该图像构造图像金字塔,其中最大尺度为原图像大小,最小尺度为128×64;
步骤6.3:对步骤6.2获得的图像金字塔计算通道特征金字塔,即对图像金字塔中的每一层计算十通道特征;
步骤6.4:对步骤6.3获得的十通道特征进行聚合操作,得到增强型通道特征;
步骤6.5:对步骤6.4中的特征金字塔,利用滑动窗口法对每个待选窗口进行判断,具体过程是利用训练模型中被选择的强判别模板子集Tsubset进行卷积得到特征值并且在对应的决策树上获取决策结果;
步骤6.6:保存所有被所有决策树判断为正样本的窗口,并记录他们的累加响应值;
步骤6.7:利用最大响应优先法融合重叠的检测窗口,获得最终检测位置;
步骤6.8:输出所有的检测位置和相应的响应值(xi,yi,wi,hi,scorei)i=1,...,D
如图5所示从上到下依次为我们训练的检测器在这三个数据集上的行人检测结果,用白色矩形框标记行人。
此外,我们又用检测器运行检测了640×480尺寸的车载视频图像,如图6所示,为视频中的两帧图像的检测结果,同样用白色矩形框标记行人。值得注意的是,这里的运行可达实时。
如表1所示,数据集INRIA,ETH和Caltech-USA上,我们提出的SDT特征和当前已有方法技术的对比。从表1中可看到,我们提出的方法有着最高的检测率。
综上所述,本发明提出的基于形状统计与稀疏判别分布特征的行人检测方法相比当前的特征方法,具有计算复杂度低、训练速度快、运行可达实时、正检率高,误检率低的优势。所以本发明是有效的。
表1
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (6)

1.一种基于稀疏判别模板特征的行人检测方法,其特征在于,包括以下步骤:
A)输入样本,即正负训练样本图像;B)对步骤A)的样本图像计算多通道特征,包括梯度幅值通道特征、六个梯度方向通道特征、LUV色彩空间三个通道特征;C)对步骤B)得到的多通道特征进行聚合操作,得到抗干扰能力更强的多通道特征;D)基于步骤C)得到的多通道特征,对标准行人模板每个通道分别学习稀疏判别模板SDT,得到最终的SDT模板集合;E)基于步骤D)求得所有训练样本的特征模板集,利用非对称Gentle Boost算法进行模板选择,并利用软级联方法训练最终行人检测器;F)利用步骤E)中训练得到的行人检测器对待检图像进行检测。
2.如权利要求1所述的一种基于稀疏判别模板特征的行人检测方法,其特征在于:
步骤C)中用了聚合操作众多方法中的一种池化操作,它以4×4区域,把用三维矩阵128×64×10表示的十个通道特征图像最大化池化为32×16×10表示的十个通道图像。
3.如权利要求1所述的一种基于稀疏判别模板特征的行人检测方法,其特征在于:
步骤D)包括以下步骤:
D1)计算标准行人模板;
D2)在32×16窗口中分别生成s×s的所有可能位置的正方形模板s∈{3,5,7},并筛选出K个同时包含人体轮廓和背景的模板Ti=(xi,yi,s);
D3)利用稀疏判别分析方法计算模板中的权重信息c∈{1,2,..,10}。
4.如权利要求3所述的一种基于稀疏判别模板特征的行人检测方法,其特征在于:
步骤D3)用了稀疏线性判别函数该函数可通过二次规划法求得模板权重的最优值,另外,Sw、m1以及m2的计算用到了正负样本的分布信息。
5.如权利要求1所述的一种基于稀疏判别模板特征的行人检测方法,其特征在于:
步骤E)是以二层决策树作为弱分类器,用非对称Gentle Boost算法在全部训练样本的SDT模板集合中进行特征选择,最后用软级联结构来组合被选择的每个弱分类器构成强分类器,其中被选择的模板子集为M<K*10。
6.如权利要求1所述的一种基于稀疏判别模板特征的行人检测方法,其特征在于:
步骤F)包括以下步骤:
F1)获取尺寸为W×H的待测试图像;
F2)对该图像构造图像金字塔,其中最大尺度为原图像大小,最小尺度为128×64;
F3)对步骤F2)获得的图像金字塔计算通道特征金字塔,即对图像金字塔中的每一层计算十通道特征;
F4)对步骤F3)获得的十通道特征进行聚合操作,得到增强型通道特征;
F5)对步骤F4)中的特征金字塔,利用滑动窗口法对每个待选窗口进行判断,具体过程是利用训练模型中被选择的强判别模板子集Tsubset进行卷积得到特征值并且在对应的决策树上获取决策结果;
F6)保存所有被所有决策树判断为正样本的窗口,并记录他们的累加响应值;
F7)利用最大响应优先法融合重叠的检测窗口,获得最终检测位置;
F8)输出所有的检测位置和相应的响应值(xi,yi,wi,hi,scorei)i=1,...,D
CN201610754485.2A 2016-08-29 2016-08-29 一种基于稀疏判别模板特征的行人检测方法 Pending CN106339686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610754485.2A CN106339686A (zh) 2016-08-29 2016-08-29 一种基于稀疏判别模板特征的行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610754485.2A CN106339686A (zh) 2016-08-29 2016-08-29 一种基于稀疏判别模板特征的行人检测方法

Publications (1)

Publication Number Publication Date
CN106339686A true CN106339686A (zh) 2017-01-18

Family

ID=57823180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610754485.2A Pending CN106339686A (zh) 2016-08-29 2016-08-29 一种基于稀疏判别模板特征的行人检测方法

Country Status (1)

Country Link
CN (1) CN106339686A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103325A (zh) * 2017-04-20 2017-08-29 湘潭大学 一种组织病理图像分类方法
WO2017190574A1 (zh) * 2016-05-04 2017-11-09 北京大学深圳研究生院 一种基于聚合通道特征的快速行人检测方法
CN107657225A (zh) * 2017-09-22 2018-02-02 电子科技大学 一种基于聚合通道特征的行人检测方法
CN108320374A (zh) * 2018-02-08 2018-07-24 中南大学 一种基于图像指纹的多国纸币冠字号字符识别方法
CN108932482A (zh) * 2018-06-14 2018-12-04 内蒙古蒙草生态环境(集团)股份有限公司 一种用于调查草原沙化的遥感自动识别方法
CN109840905A (zh) * 2019-01-28 2019-06-04 山东鲁能软件技术有限公司 电力设备锈迹检测方法及系统
CN117493858A (zh) * 2023-12-29 2024-02-02 湖北神龙工程测试技术有限公司 基于人工智能的基桩完整性识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105760858A (zh) * 2016-03-21 2016-07-13 东南大学 一种基于类Haar中间层滤波特征的行人检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105760858A (zh) * 2016-03-21 2016-07-13 东南大学 一种基于类Haar中间层滤波特征的行人检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIFENG SHEN 等: "Learning discriminative shape statistics distribution features for pedestrian detection", 《NEUROCOMPUTING》 *
MICHAEL C. WU 等: "Sparse linear discriminant analysis for simultaneous testing for the significance of a gene set/pathway and gene selection", 《BIOINFORMATICS》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017190574A1 (zh) * 2016-05-04 2017-11-09 北京大学深圳研究生院 一种基于聚合通道特征的快速行人检测方法
CN107103325A (zh) * 2017-04-20 2017-08-29 湘潭大学 一种组织病理图像分类方法
CN107657225A (zh) * 2017-09-22 2018-02-02 电子科技大学 一种基于聚合通道特征的行人检测方法
CN107657225B (zh) * 2017-09-22 2020-05-12 电子科技大学 一种基于聚合通道特征的行人检测方法
CN108320374A (zh) * 2018-02-08 2018-07-24 中南大学 一种基于图像指纹的多国纸币冠字号字符识别方法
CN108932482A (zh) * 2018-06-14 2018-12-04 内蒙古蒙草生态环境(集团)股份有限公司 一种用于调查草原沙化的遥感自动识别方法
CN109840905A (zh) * 2019-01-28 2019-06-04 山东鲁能软件技术有限公司 电力设备锈迹检测方法及系统
CN117493858A (zh) * 2023-12-29 2024-02-02 湖北神龙工程测试技术有限公司 基于人工智能的基桩完整性识别方法
CN117493858B (zh) * 2023-12-29 2024-03-26 湖北神龙工程测试技术有限公司 基于人工智能的基桩完整性识别方法

Similar Documents

Publication Publication Date Title
CN106339686A (zh) 一种基于稀疏判别模板特征的行人检测方法
CN108830188B (zh) 基于深度学习的车辆检测方法
CN103886308B (zh) 一种使用聚合通道特征和软级联分类器的行人检测方法
CN109902806A (zh) 基于卷积神经网络的噪声图像目标边界框确定方法
CN108009518A (zh) 一种基于快速二分卷积神经网络的层次化交通标识识别方法
CN102043945B (zh) 基于车辆实时跟踪和二进指数分类车牌字符识别的方法
CN101763504B (zh) 复杂场景下的人体头部识别方法
CN108805018A (zh) 道路交通标志检测识别方法、电子设备、存储介质及系统
CN107945153A (zh) 一种基于深度学习的路面裂缝检测方法
CN104268528B (zh) 一种人群聚集区域检测方法和装置
CN107330453A (zh) 基于分步识别和融合关键部位检测的色情图像识别方法
CN103824081B (zh) 一种室外恶劣光照条件下的快速鲁棒交通标志检测方法
CN104240256B (zh) 一种基于层次化稀疏建模的图像显著性检测方法
CN104298969B (zh) 基于颜色与haar特征融合的人群规模统计方法
CN106023220A (zh) 一种基于深度学习的车辆外观部件图像分割方法
CN106529448A (zh) 利用聚合通道特征进行多视角人脸检测的方法
CN110163033A (zh) 正样本获取方法、行人检测模型生成方法和行人检测方法
CN105160317A (zh) 一种基于区域分块行人性别识别方法
CN107239762A (zh) 一种基于视觉的公交车内乘客人数统计方法
JPWO2020181685A5 (zh)
CN102163281B (zh) 基于AdaBoost框架和头部颜色的实时人体检测方法
CN106372658A (zh) 车辆分类器的训练方法
CN108280397A (zh) 基于深度卷积神经网络的人体图像头发检测方法
CN107315990A (zh) 一种基于xcs‑lbp特征以及级联aksvm的行人检测算法
CN107273832A (zh) 基于积分通道特征与卷积神经网络的车牌识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170118

RJ01 Rejection of invention patent application after publication