CN111222460B - 一种基于增量误差计算的行人检测器训练方法及系统 - Google Patents

一种基于增量误差计算的行人检测器训练方法及系统 Download PDF

Info

Publication number
CN111222460B
CN111222460B CN202010010662.2A CN202010010662A CN111222460B CN 111222460 B CN111222460 B CN 111222460B CN 202010010662 A CN202010010662 A CN 202010010662A CN 111222460 B CN111222460 B CN 111222460B
Authority
CN
China
Prior art keywords
array
decision
error
sample
pile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010010662.2A
Other languages
English (en)
Other versions
CN111222460A (zh
Inventor
傅红普
刘晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Hunan First Normal University
Original Assignee
Central South University
Hunan First Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University, Hunan First Normal University filed Critical Central South University
Publication of CN111222460A publication Critical patent/CN111222460A/zh
Application granted granted Critical
Publication of CN111222460B publication Critical patent/CN111222460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于增量误差计算的行人检测器训练方法及系统,该方法包括以下步骤:步骤1:构建训练集;步骤2:权重与决策桩序号初始化;步骤3:构建有序特征值数组集合和伴随权重数组集合;步骤4:计算误差数组集合和极性数组集合;步骤5:获得最小误差数组;步骤6:设置决策桩;步骤7:按照决策桩更新样本的权重,更新决策桩序号;步骤8:判断决策桩序号是否超过设定的上限值,若未超过,返回步骤3,否则,利用所有决策桩构建行人检测器。使用增量式误差计算获取误差数组集合,将误差计算的复杂度由O(n)降低为O(1),加快了行人检测器的训练速度。

Description

一种基于增量误差计算的行人检测器训练方法及系统
技术领域
本发明属于计算机视觉目标检测技术领域,特别涉及一种基于增量误差计算的行人检测器训练方法及系统。
背景技术
行人检测任务从图像中检测出行人并画出包围盒,参见文献1,可作为包括步态识别、自动驾驶、服务机器人等任务的计算机视觉关键环节,广受学术界和工业界关注。AdaBoost方法组合多个决策桩构造强分类器,并且只要求决策桩比随机猜测的性能好。AdaBoost并不依赖于决策桩分类精度的任何先验知识,它自适应地根据精度确定决策桩的权重。理论分析和实验研究都表明AdaBoost的泛化能力很强,参加文献2在手工设计特征和深度学习特征框架中,AdaBoost分类器在行人检测上都展现出了优越的性能,参见文献3和文献4。
AdaBoost分类器形式为:
Figure BDA0002357033520000011
其中,x表示样本,ht(x)是决策桩,αt是ht(x)的权重,T是分类器H包含的决策桩个数,
Figure BDA0002357033520000012
为AdaBoost分类器的分类阈值,1表示样本被分类为行人,-1表示样本被分类为背景。
训练通过贪婪地选择最优的决策桩ht(x)和设置相应权重αt来最小化损失函数。开始训练时,给每个训练样本xi一个非负权重wi。每次迭代训练后,AdaBoost方法自适应地降低正确分类样本的权重、提高错误分类样本的权重。每次迭代都在更新了样本权重的训练集上训练一个新决策桩。
训练AdaBoost分类器就是不断迭代训练决策桩直至训练误差达到指定值。决策桩由决策结点和两个保存结果的叶子结点构成。决策桩hj由特征fj、阈值θj、和极性pj∈{-1,1}三个参数描述:hj(x)=pjsign(fj(x)-θj),其中,x是以局部图像特征向量形式描述的样本,sign()是符号函数。
每次训练决策桩都是寻找在当前权重分布下的分类误差∈达到最小的决策桩。对样本权重归一化后,决策桩h的分类误差∈定义为:
Figure BDA0002357033520000013
,∑wi=1,其中,wi是每个样本当前的权重,1{x}是指示函数,自变量x为真时输出1,为假时输出0。
人们提出了很多方法来加快AdaBoost分类器的训练速度。这些方法大致可分为两类:一、基于特征和/或训练样本子采样的方法;二、提高决策桩训练速度的方法。前者如文献5和文献6,后者如文献7和文献8。因为样本集上特征值分布的随机性,现有方法使用顺序查找重复下述五个步骤训练各决策桩。
步骤G1:降低正确分类样本的权重,提高错误分类样本的权重;
步骤G2:对每个候选特征fi,按特征值升序排序得到样本编号序列;
步骤G3:对每个候选特征fi,依次以从小到大的特征值作为阈值,计算所有阈值对应的分类误差序列{εt};将特征值小于等于某个阈值θ的样本分类为正样本,其他样本分类为负样本,可计算出分类误差。也可以相反,就有另一个分类误差。选择误差小的分类方式作为阈值θ的分类,决策桩定义中的极性p记录该选择。
步骤G4:将误差序列{εt}中的最小值作为特征fi的分类误差;
步骤G5:选择误差最小的特征f*、对应分类阈值θ*和分类方向极性p*作为本轮训练出的决策桩。
上述步骤G3计算每个阈值对应的分类误差采用了下面的公式,
∈=min(s-+(z+-s+),s++(z--s-)),其中,以某个特征的特征值作为阈值进行样本分类时,s+和s-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和,z+是全部正样本权重之和,z-是全部负样本权重之和,∈表示分类误差。采用这种方式计算时,每次都需要累加所有权重,时间复杂度为O(n)。
尽管AdaBoost在行人检测上表现出了卓越的性能。但是训练耗时长仍是一个不容忽视的问题。为训练出高性能的AdaBoost行人检测器,需要大量的训练样本和大量的候选特征,该问题越发突出。包括加快训练方法在内的现有方法训练决策桩时都采用了全部权重累加方式计算每个阈值对应的分类误差,训练出高性能的AdaBoost行人检测器往往非常耗时。
发明内容
本发明提供了一种基于增量误差计算的行人检测器训练方法,其目的在于,将训练AdaBoost检测器每个决策桩时计算每个阈值对应误差的方式由全部权重累加方式改进为每次只累加一个权重的增量方式,将该操作的复杂度由O(n)降低为O(1),以加快训练行人检测器的速度。
一种基于增量误差计算的行人检测器训练方法,包括以下步骤:
步骤1:以样本的局部图像特征和对应的类别标签,作为训练集;
样本是矩形图像窗口;类别标签包括行人和背景两种,行人为正样本,背景为负样本,分别以1和-1表示;
步骤2:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;
步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;
对训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
步骤4:计算误差数组集合和极性数组集合;
依次以每个有序特征值数组中的每个元素为阈值,对训练集中的样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素增量式计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
步骤5:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
步骤6:利用最小误差数组中的最小误差,设置决策桩;
步骤7:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;
步骤8:判断决策桩序号是否超过设定的上限值,若未超过,返回步骤3,否则,使用所有决策桩构建行人检测器。
进一步的,所述步骤4中的分类误差采用以下公式增量式计算:
Figure BDA0002357033520000031
其中,ei,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差,wi,j是第i个伴随权重数组的第j个元素,yi,j是对应样本标签,正样本标签为1,负样本标签为-1。
进一步的,所述误差元素的极性值是指当分类误差
Figure BDA0002357033520000032
时,对应误差元素的极性值为1,否则为-1。
进一步的,所述决策桩按照以下方式设置:
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1,m2,决策桩阈值θt=om1,m2,决策桩为
Figure BDA0002357033520000033
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure BDA0002357033520000035
表示训练集中的样本x的第μt维特征,t表示决策桩序号。
进一步的,所述行人检测器如下:
Figure BDA0002357033520000034
其中,
Figure BDA0002357033520000041
进一步的,训练集中每个样本的权重按照以下公式更新:
Figure BDA0002357033520000042
其中,样本xi被分类正确时ei=0,否则ei=1,
Figure BDA0002357033520000043
一种基于增量误差计算的行人检测器训练系统,包括:
训练集:包括样本的局部图像特征和对应的类别标签;
初始化单元:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素以增量方式计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;
行人检测器确定单元:判断决策桩训练单元中决策桩序号是否超过设定的上限值,若未超过,则重新依次调用权重归一化单元、有序特征值数组集合和伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩序号达到设定的上限值后,利用所有的决策桩,构建行人检测器,否则,利用所有的决策桩,构建行人检测器。
有益效果
本发明提出了一种基于增量误差计算的行人检测器训练方法及系统,该方法包括以下步骤:步骤1:以样本的局部图像特征和对应的类别标签,作为训练集;步骤2:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;步骤4:计算分类误差得到误差数组集合和极性数组集合;步骤5:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;步骤6:利用最小误差数组中的最小误差,设置决策桩;步骤7:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;步骤8:判断决策桩序号是否超过设定的上限值,若未超过,返回步骤3,否则,利用所有的决策桩构建行人检测器。
所述步骤4中的分类误差采用以下公式增量式计算:
Figure BDA0002357033520000051
其中,ei,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差,wi,j是第i个伴随权重数组的第j个元素,yi,j是对应样本标签,正样本标签为1,负样本标签为-1。该方法步骤4使用增量误差计算方式,将该运算复杂度由O(n)降低为O(1),加快了行人检测器训练速度。
本发明所述提高了行人检测器的训练速度,训练过程完全与全部权重累加方式计算误差的方法一致,因此检测器的性能也一致。并且,本发明与现有加快训练速度的方法所采取措施是正交的,因此可以叠加到其他方法上进一步加快训练速度。
按照决策桩h的分类误差∈定义
Figure BDA0002357033520000052
,∑wi=1,其中,wi是每个样本当前的权重,1{x}是指示函数,自变量x为真时输出1,为假时输出0;选择了特征fi的分类阈值θ,并指定特征值小于等于该阈值的样本为正样本、即设定极性p=-1,则分类误差∈-1为该阈值之前的负样本权重之和(s-)与之后的正样本权重之和(z+-s+)累加。若做相反的分类极性指定,则参与误差计算的权重的符号也相反,此时误差为s++(z--z-),记为∈+1。∈=min(s-+(z+-s+),s++(z--s-))==min(∈-1,∈+1),其中,以某个特征的特征值作为阈值进行样本分类时,s+和s-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和,z+是全部正样本权重之和,z-是全部负样本权重之和,∈表示分类误差。这种方式计算复杂度为O(n)。
本发明注意到每轮训练决策桩前都对权重进行了归一化处理,则有:
-1+∈+1
=s-+(z+-s+)+s++(z--s-)
=z++z-
=1;
而,
+1=s++(z--s-)
=z-+(s+-s-)
=z-+pres;
将负样本的权重加上负号,则pres就是阈值之前所有样本权重的代数和,该式表明计算∈+1只需考虑阈值θ之前的样本权重。而∈=min(∈+1,1-∈+1),该式表明计算误差∈时只需要累加阈值θ之前的样本权重。基于此,本发明公开了增量误差计算方式。
附图说明
图1为本发明实例所述方法的流程图;
具体实施方式
下面将结合附图和实例对本发明做进一步的说明。
如图1所示流程,一种基于增量误差计算的行人检测器训练方法,包括以下步骤:
步骤1:计算样本的特征;
从Inria行人数据集(参见文献9)提取n=7478个样本,其中正负样本的数量分别是l=2478、m=5000;正样本是包含行人的尺寸为128×64的图像窗口,负样本是不含行人的同样大小的图像窗口;
对提取的n个样本计算低维方向梯度直方图(ELHOG)特征(参见文献1),得到训练集{(x1,y1),…,(xn,yn)},其中xi是样本i的k维特征向量,也直接称之为样本,使用18个梯度方向、维度k=2304,下标i是样本号,正负样本的标签yi分别为1和-1;
步骤2:初始化样本权重和决策桩序号;
初始化正负样本的权重wi分别为
Figure BDA0002357033520000061
Figure BDA0002357033520000062
得到权重数组w={w1,…,wn},其中,下标i是样本号;设定决策桩总数T=2048,初始化决策序号t=1;
步骤3:归一化样本权重
Figure BDA0002357033520000063
步骤4:计算有序特征值数组集合和伴随权重数组集合;
对训练集中每个样本的相同特征的特征值[x1,j,…,xn,j]进行升序排列,xi,j是xi的第j维特征,得到k个有序特征值数组构成的集合{o1,…,ok};
上述排序时,同步对权重数组副本跟随变动重排,得到k个伴随权重数组构成的集合{a1,…,ak},数组ai长度为n,ai的元素ai,j与oi的元素oi,j对应的是同一样本xi
步骤5:计算误差数组集合和极性数组集合;
以每个有序特征值数组oi中的每个元素为阈值,使用对应的伴随权重数组ai以增量方式计算分类误差,得到k个误差数组构成的集合{e1,…,ek},数组ei长度为n;
在以增量方式计算分类误差的同时记录误差计算极性,得到k个极性数组构成的集合{p1,…,pk},数组pi长度为n,pi的元素pi,j∈{1,-1};误差按下式计算,
Figure BDA0002357033520000071
其中,ei,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差,wi,j是第i个伴随权重数组的第j个元素,yi,j是对应样本标签,正样本标签为1,负样本标签为-1。
当分类误差
Figure BDA0002357033520000076
时,对应误差元素的极性值为1,否则为-1。
步骤6:顺序查找误差数组集合,得到最小误差数组;
在每个误差数组ei上顺序查找确定最小误差,得到长度为k的最小误差数组E,记录对应的下标(i,j)得到长度为k的下标数组D=[(d1,1,d1,2),…,(dk,1,dk,2)];
步骤7:确定分类误差,定义决策桩;
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1,m2,决策桩阈值θt=om1,m2,决策桩为
Figure BDA0002357033520000072
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure BDA0002357033520000073
表示训练集中的样本x的第μt维特征,t表示决策桩序号。
步骤8:更新样本权重和决策桩计数;
更新样本权重
Figure BDA0002357033520000074
其中,样本xi分类正确时ei=0,否则ei=1,
Figure BDA0002357033520000075
更新决策序号t=t+1;
步骤9:决策桩数不达上限则跳转到步骤3;
若t>T,执行步骤10,否则跳转到步骤3;
步骤10:输出行人检测器;
输出AdaBoost行人检测器
Figure BDA0002357033520000081
其中,
Figure BDA0002357033520000082
本发明注意到每轮训练决策桩前都对权重进行了归一化处理,将训练AdaBoost检测器每个决策桩时计算每个阈值对应误差的方式由全部权重累加方式改进为每次只累加一个权重的增量方式,将该操作的复杂度由O(n)降低为O(1),加快了训练行人检测器的速度。并且,本发明与现有加快训练速度的方法所采取措施是正交的,因此可以叠加到其他方法上进一步加快训练速度。
实验效果
本发明的方法与全部权重累加误差计算方法训练出的检测器在公开图像集Inria行人数据集上的性能完全一样。使用CPU为i3-4150,内存为20G的PC集,本发明方法叠加在文献8提出的快速训练方法上、在Inria行人数据集上训练耗时为6分30秒,比全部权重累加误差计算方法快25秒左右。
基于上述方法,本实例还提供一种基于增量误差计算的行人检测器训练系统,包括:
训练集:包括样本的局部图像特征和对应的类别标签;
初始化单元:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素以增量方式计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;
行人检测器确定单元:判断决策桩训练单元中决策桩序号是否超过设定的上限值,若未超过,则重新依次调用权重归一化单元、有序特征值数组集合和伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩序号达到设定的上限值后,利用所有的决策桩,构建行人检测器,否则,利用所有的决策桩,构建行人检测器。
应当理解,本发明各个实施例中的功能单元模块可以集中在一个处理单元中,也可以是各个单元模块单独物理存在,也可以是两个或两个以上的单元模块集成在一个单元模块中,可以采用硬件或软件的形式来实现。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
参考文献
[1]傅红普,邹北骥.一种方向梯度直方图的降维方法[J].浙江大学学报(理学版),2017(2):34-138.
[2]Viola P,Jones M J.Robust Real-Time Face Detection[J].InternationalJournal of Computer Vision,2004,57(2):137-154.DOI:10.1023/B:VISI.0000013087.49260.fb.
[3]P.Dollar,R.Appel,S.Belongie and P.Perona.Fast Feature Pyramids forObject Detection[J].PAMI 2014.
[4]Liliang,Zhang,Liang,Lin,Xiaodan,Liang,Kaiming,He.Is Faster RCNNDoing Well for Pedestrian Detection?[C].European Conference on ComputerVision,2016:443-457.
[5]Dollar P,Tu Z,Tao H,et al.Feature Mining for Image Classification[C].computer vision and pattern recognition,Minneapolis,MN,USA.2007:1-8.
[6]Tolba M,Moustafa M.GAdaboost:Accelerating adaboost featureselection with genetic algorithms[C].international conference on evolutionarycomputation theory and applications,Porto,Portugal.2016:156-163.
[7]Mnih V,Audibert J Y.Empirical Bernstein stopping[C].InternationalConference on Machine Learning,2008:672-679.
[8]R.Appel,T.Fuchs,P.Dollar,P.Perona.Quickly Boosting Decision Trees:Pruning Underachieving Features Early[C].ICML 2013.
[9]Dalal,N and Bill Triggs,B.Histograms of oriented gradients forhuman detection[C].CVPR2005:886-893.

Claims (7)

1.一种基于增量误差计算的行人检测器训练方法,其特征在于,包括以下步骤:
步骤1:以样本的局部图像特征和对应的类别标签,作为训练集;
样本是矩形图像窗口;类别标签包括行人和背景两种,行人是正样本,背景是负样本,其标签分别以1和-1表示;
步骤2:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;
步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;
对训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
步骤4:计算误差数组集合和极性数组集合;
依次以每个有序特征值数组中的每个元素为阈值,对训练集中的样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素增量式计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
步骤5:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
步骤6:利用最小误差数组中的最小误差,设置决策桩;
步骤7:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;
步骤8:判断决策桩序号是否超过设定的上限值,若未超过,返回步骤3,否则,使用所有决策桩构建行人检测器。
2.根据权利要求1所述的方法,其特征在于,所述步骤4中的分类误差采用以下公式增量式计算:
Figure FDA0002357033510000011
其中,ei,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差,wi,j是第i个伴随权重数组的第j个元素,yi,j是对应样本标签,正样本标签为1,负样本标签为-1。
3.根据权利要求2所述的方法,其特征在于,所述误差元素的极性值是指当分类误差
Figure FDA0002357033510000012
时,对应误差元素的极性值为1,否则为-1。
4.根据权利要求1所述的方法,其特征在于,所述决策桩按照以下方式设置:
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1,m2,决策桩阈值θt=om1,m2,决策桩为
Figure FDA0002357033510000021
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure FDA0002357033510000022
表示训练集中的样本x的第μt维特征,t表示决策桩序号。
5.根据权利要求4所述的方法,其特征在于,所述行人检测器如下:
Figure FDA0002357033510000023
其中,
Figure FDA0002357033510000024
6.根据权利要求4所述的方法,其特征在于,训练集中每个样本的权重按照以下公式更新:
Figure FDA0002357033510000025
其中,样本xi被正确分类时ei=0,否则ei=1,
Figure FDA0002357033510000026
7.一种基于增量误差计算的行人检测器训练系统,其特征在于,包括:
训练集:包括样本的局部图像特征和对应的类别标签;
初始化单元:对训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号,设定决策桩序号的上限值;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素以增量方式计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行顺序查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新训练集中每个样本的权重,同时,更新决策桩序号;
行人检测器确定单元:判断决策桩训练单元中决策桩序号是否超过设定的上限值,若未超过,则重新依次调用权重归一化单元、有序特征值数组集合和伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩序号达到设定的上限值后,利用所有的决策桩,构建行人检测器,否则,利用所有的决策桩,构建行人检测器。
CN202010010662.2A 2020-01-02 2020-01-06 一种基于增量误差计算的行人检测器训练方法及系统 Active CN111222460B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010002000 2020-01-02
CN2020100020000 2020-01-02

Publications (2)

Publication Number Publication Date
CN111222460A CN111222460A (zh) 2020-06-02
CN111222460B true CN111222460B (zh) 2023-04-18

Family

ID=70828149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010010662.2A Active CN111222460B (zh) 2020-01-02 2020-01-06 一种基于增量误差计算的行人检测器训练方法及系统

Country Status (1)

Country Link
CN (1) CN111222460B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224911A (zh) * 2015-08-27 2016-01-06 湖北文理学院 一种多视角实时行人检测方法及系统
CN105243356A (zh) * 2015-09-10 2016-01-13 北京大学 一种建立行人检测模型的方法及装置及行人检测方法
CN107025284A (zh) * 2017-04-06 2017-08-08 中南大学 网络评论文本情感倾向的识别方法及卷积神经网络模型

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0113263D0 (en) * 2001-05-31 2001-07-25 Univ Surrey Personal identity verification process system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224911A (zh) * 2015-08-27 2016-01-06 湖北文理学院 一种多视角实时行人检测方法及系统
CN105243356A (zh) * 2015-09-10 2016-01-13 北京大学 一种建立行人检测模型的方法及装置及行人检测方法
CN107025284A (zh) * 2017-04-06 2017-08-08 中南大学 网络评论文本情感倾向的识别方法及卷积神经网络模型

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹运珠 ; .混凝土用胶凝材料的烧失机理及硫化物对烧失量测定的影响.铁道建筑技术.2017,(08),全文. *

Also Published As

Publication number Publication date
CN111222460A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN111814584B (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
EP3731154A1 (en) Training a convolutional neural network for image retrieval with a listwise ranking loss function
Opelt et al. Incremental learning of object detectors using a visual shape alphabet
Epshtein et al. Feature hierarchies for object classification
CN110163033B (zh) 正样本获取方法、行人检测模型生成方法和行人检测方法
Maji et al. Classification using intersection kernel support vector machines is efficient
US7519201B2 (en) Detecting humans via their pose
EP2808827B1 (en) System and method for OCR output verification
JP4997178B2 (ja) 物体検出装置
Angelova et al. Fast terrain classification using variable-length representation for autonomous navigation
US8885943B2 (en) Face detection method and apparatus
CN101814147B (zh) 一种实现场景图像的分类方法
US20140219563A1 (en) Label-embedding for text recognition
CN107316036B (zh) 一种基于级联分类器的害虫识别方法
US20080063264A1 (en) Method for classifying data using an analytic manifold
Jørgensen Automatic license plate recognition using deep learning techniques
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
Chevalier et al. Low resolution convolutional neural network for automatic target recognition
CN108960005B (zh) 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统
Poostchi et al. Feature selection for appearance-based vehicle tracking in geospatial video
CN111222460B (zh) 一种基于增量误差计算的行人检测器训练方法及系统
Laroze et al. Active learning to assist annotation of aerial images in environmental surveys
Karlinsky et al. RepMet: Representative-based metric learning for classification and one-shot object detection
Ramya et al. Object recognition and classification based on improved bag of features using surf and mser local feature extraction
Kundur et al. Insect pest image detection and classification using deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: No. 1015, Fenglin Third Road, Yuelu District, Changsha City, Hunan Province, 410205

Patentee after: HUNAN FIRST NORMAL University

Country or region after: China

Patentee after: CENTRAL SOUTH University

Address before: Yuelu District City, Hunan province 410083 Changsha Lushan Road No. 932

Patentee before: CENTRAL SOUTH University

Country or region before: China

Patentee before: HUNAN FIRST NORMAL University