CN111126247A - 一种基于二分查找的行人检测器训练方法及系统 - Google Patents

一种基于二分查找的行人检测器训练方法及系统 Download PDF

Info

Publication number
CN111126247A
CN111126247A CN201911327347.6A CN201911327347A CN111126247A CN 111126247 A CN111126247 A CN 111126247A CN 201911327347 A CN201911327347 A CN 201911327347A CN 111126247 A CN111126247 A CN 111126247A
Authority
CN
China
Prior art keywords
array
error
decision
pile
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911327347.6A
Other languages
English (en)
Other versions
CN111126247B (zh
Inventor
傅红普
刘晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Hunan First Normal University
Original Assignee
Central South University
Hunan First Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University, Hunan First Normal University filed Critical Central South University
Priority to CN201911327347.6A priority Critical patent/CN111126247B/zh
Publication of CN111126247A publication Critical patent/CN111126247A/zh
Application granted granted Critical
Publication of CN111126247B publication Critical patent/CN111126247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于二分查找的行人检测器训练方法及系统,该方法包括以下步骤:步骤1:构建样本训练集;步骤2:权重与决策桩桩号初始化;步骤3:构建有序特征值数组集合和伴随权重数组集合;步骤4:计算误差数组集合和极性数组集合;步骤5:获得最小误差数组;步骤6:利用最小误差数组中的最小误差,设置决策桩;步骤7:按照决策桩更新样本的权重,更新决策桩桩号;步骤8:判断决策桩桩号是否超过设定的最大桩号,若未超过,返回步骤3,否则,利用所有决策桩构建用于行人检测的检测器。使用变种二分查找获取最小误差数组,将查找操作的复杂度由O(n)降低为O(logn),加快了行人检测器的训练速度,且保持检测器性能不降低。

Description

一种基于二分查找的行人检测器训练方法及系统
技术领域
本发明属于计算机视觉目标检测技术领域,特别涉及一种基于二分查找的行人检测器训练方法及系统。
背景技术
行人检测任务从图像中检测出行人的包围盒,参见文献1,可作为包括步态识别、自动驾驶、服务机器人等任务的计算机视觉关键环节,广受学术界和工业界关注。AdaBoost方法组合多个决策桩构造强分类器,并且只要求决策桩比随机猜测的性能好。AdaBoost并不依赖于决策桩分类精度的任何先验知识,它自适应地根据精度确定决策桩的权重。理论分析和实验研究都表明AdaBoost的泛化能力很强,参见文献2。在手工设计特征和深度学习特征框架中,AdaBoost分类器在行人检测上都展现出了优越的性能,参见文献3和文献4。
AdaBoost分类器形式为:
Figure BDA0002328722730000011
其中,x表示样本,ht(x)是决策桩,αt是ht(x)的权重,T是分类器H包含的决策桩个数,
Figure BDA0002328722730000012
为AdaBoost分类器的分类阈值。
训练通过贪婪地选择最优的决策桩ht(x)和设置相应权重αt来最小化损失函数。开始训练时,给每个训练样本xi一个非负权重wi。每次迭代训练后,AdaBoost方法自适应地降低正确分类样本的权重、提高错误分类样本的权重。每次迭代都在更新了样本权重的训练集上训练一个新决策桩。
训练AdaBoost分类器就是不断迭代训练决策桩直至训练误差达到指定值。决策桩由决策结点和两个保存结果的叶子结点构成。决策桩hj由特征fj、阈值θj、和极性pj∈{-1,1}三个参数描述:hj(x)=pjsign(fj(x)-θj),其中,x是以向量形式描述的样本,sign()是符号函数。
每次训练决策桩都是寻找在当前权重分布下的分类误差∈达到最小的决策桩。对样本权重归一化后,决策桩h的分类误差ε定义为:
Figure BDA0002328722730000013
∑wi=1,其中,wi是每个样本当前的权重,1{x}是指示函数,自变量x为真时输出1,为假时输出0。
人们提出了很多方法来加快AdaBoost分类器的训练速度。这些方法大致可分为两类:一、基于特征和/或训练样本子采样的方法;二、提高决策桩训练速度的方法。前者如文献5和文献6,后者如文献7和文献8。因为样本集上特征值分布的随机性,现有方法使用顺序查找重复下述五个步骤训练各决策桩。
步骤G1:降低正确分类样本的权重,提高错误分类样本的权重;
步骤G2:对每个候选特征fi,按特征值升序排序得到样本编号序列;
步骤G3:对每个候选特征fi,依次以从小到大的特征值作为阈值,计算所有阈值对应的分类误差序列{εt};将特征值小于等于某个阈值θ的样本分类为正样本,其他样本分类为负样本,可计算出分类误差。也可以相反,就有另一个分类误差。选择误差小的分类方式作为阈值θ的分类,决策桩定义中的极性p记录该选择。
步骤G4:将误差序列{εt}中的最小值作为特征fi的分类误差;
步骤G5:选择误差最小的特征f*、对应分类阈值θ*和分类方向极性p*作为本轮训练出的决策桩。
上述的步骤G3需要考察所有候选特征,对每个特征需要在每个样本特征值上进行顺序查找。若有n个样本、k个候选特征,训练一个决策桩需要n×k次比较,这种顺序查找的方式是训练AdaBoost分类器耗时的原因之一。
尽管AdaBoost在行人表现出了卓越的性能。但是训练耗时长仍是一个不容忽视的问题。为训练出高性能的AdaBoost行人检测器,需要大量的训练样本和大量的候选特征,该问题越发突出。包括加快训练方法在内的现有方法训练决策桩时都采用了顺序查找法,其计算量随样本数量和候选特征数量的增加成平方级增加,因此训练出高性能的AdaBoost行人检测器往往非常耗时。
发明内容
本发明提供了一种基于二分查找的行人检测器训练方法及系统,其目的在于,将训练AdaBoost检测器每个决策桩时确定每个特征误差序列中最小值的方式由顺序查找法改进为变种二分查找法,将查找操作的复杂度由O(n)降低为O(logn),以加快训练行人检测器的速度。
一种基于二分查找的行人检测器训练方法,包括以下步骤:
步骤1:以图像样本的局部图像特征和对应的类别标签,作为样本训练集;
图像样本的类别包含两个,行人和背景;
样本训练集中包括正、负样本,正样本是行人样本,负样本是背景样本;
步骤2:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;
步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;
对样本训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
步骤4:计算误差数组集合和极性数组集合;
依次以每个有序特征值数组中的每个元素为阈值,对样本训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
两个数组集合的下标记录的都是特征维度序号和特征值的序号,即在第i维特征中的第j个特征值,且所有数组的下标均一一对应;
步骤5:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
即从每个误差数组中寻找最小的误差,所有最小的误差,构成最小误差数组;同时记录每个最小误差对应的下标得到下标数组;
步骤6:利用最小误差数组中的最小误差,设置决策桩;
步骤7:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;
步骤8:判断决策桩桩号是否超过设定的最大桩号,若未超过,返回步骤3,否则,利用所有的决策桩,构建用于行人检测的检测器。
进一步地,所述对误差数组集合中每个误差数组进行变种二分查找最小误差的具体过程如下:
步骤B1:令N=n,n表示样本总数;
步骤B2:设定l=2,r=N-1,m=(r+l)/2,l、r以及m均表示中间变量;
步骤B3:如果l≥r,跳转到步骤B8;
步骤B4:如果ei,l≥ei,m,跳转到步骤B6;
步骤B5:若ei,l<ei,r,r=m-1,否则l=m-1;跳转到步骤B7;
步骤B6:l=l+(m-l)/2,r=m+(r-m)/2;
步骤B7:m=(r+l)/2;
步骤B8:输出ei,l及下标(i,l),获得每个误差数组中的最小误差和对应的数组下标;其中,ei,l、ei,m以及ei,r分别表示第i个误差数组中的第l、m、r个误差元素。
进一步地,所述决策桩按照以下方式设置:
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1m2,决策桩阈值θt=om1m2,决策桩为
Figure BDA0002328722730000031
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure BDA0002328722730000041
表示样本训练集中的样本x的第μt维特征,t表示决策桩桩号。
进一步地,所述用于行人检测的检测器如下:
Figure BDA0002328722730000042
其中,
Figure BDA0002328722730000043
进一步地,样本训练集中每个样本的权重按照以下公式更新:
Figure BDA0002328722730000044
其中,样本xi被分类正确时ei=0,否则ei=1,
Figure BDA0002328722730000045
进一步地,所述步骤4中的分类误差采用以下公式计算:
∈=min(s-+(z+-s+),s++(z--s-))
其中,以某个特征的特征值作为阈值进行样本分类时,s+和s-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和,z+是全部正样本权重之和,z-是全部负样本权重之和,∈表示分类误差。
进一步地,所述误差元素的极性值是指当分类误差∈=s-+(z+-s+)时,对应误差元素的极性值为1,否则为-1。
一种基于二分查找的行人检测器训练系统,包括:
样本训练集:包括行人图像样本的局部图像特征和对应的类别标签;
初始化单元:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对样本训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对样本训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;
行人检测器确定单元:判断决策桩训练单元中决策桩桩号是否超过设定的最大桩号,若未超过,则重新依次调用权重归一化单元、伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩桩号达到设定的最大桩号后,利用所有的决策桩,构建用于行人检测的检测器,否则,利用所有的决策桩,构建用于行人检测的检测器。
其中,对误差数组集合中每个误差数组进行变种二分查找最小误差采用上述方法中提及的变种二分查找法。
有益效果
本发明提出了一种基于二分查找的行人检测器训练方法及系统,该方法包括以下步骤:步骤1:以图像样本的局部图像特征和对应的类别标签,作为样本训练集;步骤2:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;步骤4:计算误差数组集合和极性数组集合;步骤5:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;步骤6:利用最小误差数组中的最小误差,设置决策桩;步骤7:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;步骤8:判断决策桩桩号是否超过设定的最大桩号,若未超过,返回步骤3,否则,利用所有的决策桩,构建用于行人检测的检测器。
基于样本集上特征值分布的随机性,现有方法使用顺序查找法训练决策桩;而本发明发现分类误差很小的决策桩对应的优秀特征具有以下显著特点:利用本发明所述方法得到的误差数组ei可视为以误差为纵坐标、以阈值为横坐标的阈值-误差(Threshold-Error)平面上的曲线采样,这里称之为T-E曲线。优秀特征的T-E曲线非常光滑,并非常接近凸曲线。而一般特征对应的T-E曲线不具有这个特点。
本发明正是发现了该特点后,设计了变种二分查找法,将变种二分查找法代替最小误差查找中惯用的顺序查找。相较于现有方法采用的顺序查找,该方法使用的变种二分查找,将查找操作的复杂度由O(n)降低为O(logn),加快了行人检测器的训练速度,同时维持训练出的检测器性能不降低。并且,本发明与现有加快训练速度的方法所采取措施是正交的,因此可以叠加到其他方法上进一步加快训练速度。
附图说明
图1为本发明实例所述方法的流程图;
图2是Inria行人数据集上第一轮训练时误差从小到大排列第十对应的优秀特征的T-E曲线图;
图3是Inria行人数据集上第一轮训练时某个一般特征的T-E曲线图;
图4是Inria行人数据集上两个方法训练出来的检测器的性能比较结果示意图。
具体实施方式
下面将结合附图和实例对本发明做进一步的说明。
如图1所示流程,一种基于二分查找的行人检测器训练方法,包括以下步骤:
步骤1:计算图像样本的特征;
从Inria行人数据集(参见文献9)提取n=7478个图像样本,其中正负样本的数量分别是l=2478、m=5000;正样本是包含行人的尺寸为128×64的图像窗口,负样本是不含行人的同样大小的图像窗口;
对提取的n个样本计算低维方向梯度直方图(ELHOG)特征(参见文献1),得到样本训练集{(x1,y1),…,(xn,yn)},其中xi是样本i的k维特征向量,也直接称之为样本,使用18个梯度方向、维度k=2304,下标i是样本号,正负样本的标签yi分别为1和0;
步骤2:初始化样本权重和决策桩桩号;
初始化正负样本的权重wi分别为
Figure BDA0002328722730000061
Figure BDA0002328722730000062
得到权重数组w={w1,…,wn},其中,下标i是样本号;设定决策桩总数T=2048,初始化决策桩号t=1;
步骤3:归一化样本权重
Figure BDA0002328722730000063
步骤4:计算有序特征值数组集合和伴随权重数组集合;
对样本训练集中每个样本的相同特征的特征值[x1,j,…,xn,j]进行升序排列,xi,j是xi的第j维特征,得到k个有序特征值数组构成的集合{o1,…,ok};
上述排序时,同步对权重数组副本跟随变动重排,得到k个伴随权重数组构成的集合{a1,…,ak},数组ai长度为n,ai的元素ai,j与oi的元素oi,j对应的是同一样本xi
步骤5:计算误差数组集合和极性数组集合;
以每个有序特征值数组oi中的每个元素为阈值,使用对应的伴随权重数组ai计算分类误差,得到k个误差数组构成的集合{e1,…,ek},数组ei长度为n;
在计算分类误差的同时记录误差计算极性,得到k个极性数组构成的集合{p1,…,pk},数组pi长度为n,pi的元素pi,j∈{1,-1};
按下列公式计算分类误差,∈=min(s-+(z+-s+),s++(z--s-)),其中,以某个特征的特征值作为阈值进行样本分类时,s+和s-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和,z+是全部正样本权重之和,z-是全部负样本权重之和,∈表示分类误差;当分类误差∈=s-+(z+-s+)时,所述步骤5误差计算极性为1,否则为-1;
步骤6:变种二分查找误差数组集合,得到最小误差数组;
在每个误差数组ei上变种二分查找确定最小误差,得到长度为k的最小误差数组E,记录对应的下标(i,j)得到长度为k的下标数组D=[(d1,1,d1,2),…,(dk,1,dk,2)];
在长度为n,起始下标为1,终止下标为n的数组ei上变种二分查找包含以下步骤:
步骤B1:令N=n,n表示样本总数;
步骤B2:设定l=2,r=N-1,m=(r+l)/2,l、r以及m均表示中间变量;
步骤B3:如果l≥r,跳转到步骤B8;
步骤B4:如果ei,l≥ei,m,跳转到步骤B6;
步骤B5:若ei,l<ei,r,r=m-1,否则l=m-1;跳转到步骤B7;
步骤B6:l=l+(m-l)/2,r=m+(r-m)/2;
步骤B7:m=(r+l)/2;
步骤B8:输出ei,l及下标(i,l),获得每个误差数组中的最小误差和对应的数组下标;其中,ei,l、ei,m以及ei,r分别表示第i个误差数组中的第l、m、r个误差元素。
步骤7:确定分类误差,定义决策桩;
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1,m2,决策桩阈值θt=om1,m2,决策桩为
Figure BDA0002328722730000071
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure BDA0002328722730000081
表示样本训练集中的样本x的第μt维特征,t表示决策桩桩号。
步骤8:更新样本权重和决策桩计数;
更新样本权重
Figure BDA0002328722730000082
其中,样本xi分类正确时ei=0,否则ei=1,
Figure BDA0002328722730000083
更新决策桩号t=t+1;
步骤9:决策桩数不达上限则跳转到步骤3;
若t>T,执行步骤10,否则跳转到步骤3;
步骤10:输出行人检测器;
输出AdaBoost行人检测器
Figure BDA0002328722730000084
其中,
Figure BDA0002328722730000085
基于样本集上特征值分布的随机性,现有方法使用顺序查找法训练决策桩;而本发明发现分类误差很小的决策桩对应的优秀特征具有以下显著特点:利用本发明所述方法得到的误差数组ei可视为以误差为纵坐标、以阈值为横坐标的阈值-误差(Threshold-Error)平面上的曲线采样,这里称之为T-E曲线。优秀特征的T-E曲线非常光滑,并非常接近凸曲线。而一般特征对应的T-E曲线不具有这个特点。图2展示了在第一趟训练时某个行人数据集上误差从小到大排列第十对应的优秀特征的T-E曲线,图3展示了同一数据集某个一般特征的T-E曲线。
本发明正是发现了该特点后,设计了变种二分查找法,将变种二分查找法代替最小误差查找中惯用的顺序查找。相较于现有方法采用的顺序查找,该方法使用的变种二分查找,将查找操作的复杂度由O(n)降低为O(logn),加快了行人检测器的训练速度,同时维持训练出的检测器性能不降低。并且,本发明与现有加快训练速度的方法所采取措施是正交的,因此可以叠加到其他方法上进一步加快训练速度。
实验效果
图4是本发明的方法与普通顺序查找方法训练出的检测器在公开图像集Inria行人数据集上的性能比较结果。水平轴代表每幅图像检测出的假正率,垂直轴代表正样本遗漏率。性能曲线与水平轴之间的面积越小平均遗漏率越小,对应检测器性能越好,图例旁的数值是平均遗漏率。fastInr代表采用本发明方法训练出来的检测器的性能,normInr代表采用普通顺序查找方法训练出来的检测器的性能。从图中可以看出,本发明的方法与普通顺序查找方法训练出的检测器的性能相当。
基于上述方法,本实例还提供一种基于二分查找的行人检测器训练系统,包括:
样本训练集:包括图像样本的局部图像特征和对应的类别标签;
初始化单元:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对样本训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对样本训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;
行人检测器确定单元:判断决策桩训练单元中决策桩桩号是否超过设定的最大桩号,若未超过,则重新依次调用权重归一化单元、伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩桩号达到设定的最大桩号后,利用所有的决策桩,构建用于行人检测的检测器,否则,利用所有的决策桩,构建用于行人检测的检测器。
其中,对误差数组集合中每个误差数组进行变种二分查找最小误差采用上述方法中提及的变种二分查找法。
应当理解,本发明各个实施例中的功能单元模块可以集中在一个处理单元中,也可以是各个单元模块单独物理存在,也可以是两个或两个以上的单元模块集成在一个单元模块中,可以采用硬件或软件的形式来实现。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
参考文献
[1]傅红普,邹北骥.一种方向梯度直方图的降维方法[J].浙江大学学报(理学版),2017(2):34-138.
[2]Viola P,Jones M J.Robust Real-Time Face Detection[J].InternationalJournal of Computer Vision,2004,57(2):137-154.DOI:10.1023/B:VISI.0000013087.49260.fb.
[3]P.Dollar,R.Appel,S.Belongie and P.Perona.Fast Feature Pyramids forObject Detection[J].PAMI 2014.
[4]Liliang,Zhang,Liang,Lin,Xiaodan,Liang,Kaiming,He.Is Faster RCNNDoing Well for Pedestrian Detection?[C].European Conference on ComputerVision,2016:443-457.
[5]Dollar P,Tu Z,Tao H,et al.Feature Mining for Image Classification[C].computer vision and pattern recognition,Minneapolis,MN,USA.2007:1-8.
[6]Tolba M,Moustafa M.GAdaboost:Accelerating adaboost featureselection with genetic algorithms[C].international conference on evolutionarycomputation theory and applications,Porto,Portugal.2016:156-163.
[7]Mnih V,Audibert J Y.Empirical Bernstein stopping[C].InternationalConference on Machine Learning,2008:672-679.
[8]R.Appel,T.Fuchs,P.Dollar,P.Perona.Quickly Boosting Decision Trees:Pruning Underachieving Features Early[C].ICML 2013.
[9]Dalal,N and Bill Triggs,B.Histograms of oriented gradients forhuman detection[C].CVPR2005:886-893.

Claims (8)

1.一种基于二分查找的行人检测器训练方法,其特征在于,包括以下步骤:
步骤1:以图像样本的局部图像特征和对应的类别标签,作为样本训练集;
步骤2:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;
步骤3:对权重进行归一化处理,并构建有序特征值数组集合和伴随权重数组集合;
对样本训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
步骤4:计算误差数组集合和极性数组集合;
依次以每个有序特征值数组中的每个元素为阈值,对样本训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
步骤5:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
步骤6:利用最小误差数组中的最小误差,设置决策桩;
步骤7:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;
步骤8:判断决策桩桩号是否超过设定的最大桩号,若未超过,返回步骤3,否则,利用所有的决策桩,构建用于行人检测的检测器。
2.根据权利要求1所述的方法,其特征在于,所述对误差数组集合中每个误差数组进行变种二分查找最小误差的具体过程如下:
步骤B1:令N=n,n表示样本总数;
步骤B2:设定l=2,r=N-1,m=(r+l)/2,l、r以及m均表示中间变量;
步骤B3:如果l≥r,跳转到步骤B8;
步骤B4:如果ei,l≥ei,m,跳转到步骤B6;
步骤B5:若ei,l<ei,r,r=m-1,否则l=m-1;跳转到步骤B7;
步骤B6:l=l+(m-l)/2,r=m+(r-m)/2;
步骤B7:m=(r+l)/2;
步骤B8:输出ei,l及下标(i,l),获得每个误差数组中的最小误差和对应的数组下标;其中,ei,l、ei,m以及ei,r分别表示第i个误差数组中的第l、m、r个误差元素。
3.根据权利要求1所述的方法,其特征在于,所述决策桩按照以下方式设置:
令决策桩对应的特征维度序号μt=m1,决策桩分类误差εt=mine,决策桩极性ρt=pm1,m2,决策桩阈值θt=om1,m2,决策桩为
Figure FDA0002328722720000021
其中,mine为最小误差数组中的最小误差,(m1,m2)为mine在下标数组中的对应下标,pm1,m2和om1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素,
Figure FDA0002328722720000026
表示样本训练集中的样本x的第μt维特征,t表示决策桩桩号。
4.根据权利要求3所述的方法,其特征在于,所述用于行人检测的检测器如下:
Figure FDA0002328722720000022
其中,
Figure FDA0002328722720000023
5.根据权利要求3所述的方法,其特征在于,样本训练集中每个样本的权重按照以下公式更新:
Figure FDA0002328722720000024
其中,样本xi被分类正确时ei=0,否则ei=1,
Figure FDA0002328722720000025
6.根据权利要求1所述的方法,其特征在于,所述步骤4中的分类误差采用以下公式计算:
∈=min(s-+(z+-s+),s++(z--s-))
其中,以某个特征的特征值作为阈值进行样本分类时,s+和s-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和,z+是全部正样本权重之和,z-是全部负样本权重之和,∈表示分类误差。
7.根据权利要求1所述的方法,其特征在于,所述误差元素的极性值是指当分类误差∈=s-+(z+-s+)时,对应误差元素的极性值为1,否则为-1。
8.一种基于二分查找的行人检测器训练系统,其特征在于,包括:
样本训练集:包括图像样本的局部图像特征和对应的类别标签;
初始化单元:对样本训练集中的每个样本的权重进行初始设置,且初始化用于行人检测的决策桩序号;
权重归一化单元:对权重进行归一化处理;
有序特征值数组集合和伴随权重数组集合构建单元:对样本训练集中每个样本的相同特征的特征值进行升序排列,获取有序特征值数组集合;同时,对每个特征值对应的权重按照特征值的排序进行重排,获得与有序特征值数组集合对应的伴随权重数组集合;
误差数组集合和极性数组集合计算单元:依次以每个有序特征值数组中的每个元素为阈值,对样本训练集中的每个样本进行分类,使用与有序特征值数组对应的伴随权重数组中权重元素计算分类误差,得到误差数组集合;同时,以误差数组中每个误差元素的极性值,构建对应的极性数组,得到极性数组集合;
最小误差数组获取单元:对误差数组集合中每个误差数组进行变种二分查找最小误差,获得最小误差数组,并以最小误差所在的误差数组的下标构成下标数组;
决策桩设置单元:利用最小误差数组中的最小误差,设置决策桩;
决策桩训练单元:按照决策桩更新样本训练集中每个样本的权重,同时,更新决策桩桩号;
行人检测器确定单元:判断决策桩训练单元中决策桩桩号是否超过设定的最大桩号,若未超过,则重新依次调用权重归一化单元、伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元,重新设置决策桩,再调用决策桩训练单元重新训练,直到决策桩桩号达到设定的最大桩号后,利用所有的决策桩,构建用于行人检测的检测器,否则,利用所有的决策桩,构建用于行人检测的检测器。
CN201911327347.6A 2019-12-20 2019-12-20 一种基于二分查找的行人检测器训练方法及系统 Active CN111126247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911327347.6A CN111126247B (zh) 2019-12-20 2019-12-20 一种基于二分查找的行人检测器训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911327347.6A CN111126247B (zh) 2019-12-20 2019-12-20 一种基于二分查找的行人检测器训练方法及系统

Publications (2)

Publication Number Publication Date
CN111126247A true CN111126247A (zh) 2020-05-08
CN111126247B CN111126247B (zh) 2021-11-05

Family

ID=70500728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911327347.6A Active CN111126247B (zh) 2019-12-20 2019-12-20 一种基于二分查找的行人检测器训练方法及系统

Country Status (1)

Country Link
CN (1) CN111126247B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2413543A1 (en) * 2010-07-30 2012-02-01 Institut National De Recherche En Informatique Et En Automatique Binary search method for congestion avoidance
CN103902968A (zh) * 2014-02-26 2014-07-02 中国人民解放军国防科学技术大学 一种基于AdaBoost分类器的行人检测模型训练方法
CN107103308A (zh) * 2017-05-24 2017-08-29 武汉大学 一种基于由粗到细深度尺度学习的行人重识别方法
US20180165552A1 (en) * 2016-12-12 2018-06-14 National Chung Shan Institute Of Science And Technology All-weather thermal-image pedestrian detection method
CN109766860A (zh) * 2019-01-16 2019-05-17 安徽工程大学 基于改进的Adaboost算法的人脸检测方法
CN110516102A (zh) * 2019-07-18 2019-11-29 杭州电子科技大学 一种基于语谱图识别的歌词时间戳生成方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2413543A1 (en) * 2010-07-30 2012-02-01 Institut National De Recherche En Informatique Et En Automatique Binary search method for congestion avoidance
CN103902968A (zh) * 2014-02-26 2014-07-02 中国人民解放军国防科学技术大学 一种基于AdaBoost分类器的行人检测模型训练方法
US20180165552A1 (en) * 2016-12-12 2018-06-14 National Chung Shan Institute Of Science And Technology All-weather thermal-image pedestrian detection method
CN107103308A (zh) * 2017-05-24 2017-08-29 武汉大学 一种基于由粗到细深度尺度学习的行人重识别方法
CN109766860A (zh) * 2019-01-16 2019-05-17 安徽工程大学 基于改进的Adaboost算法的人脸检测方法
CN110516102A (zh) * 2019-07-18 2019-11-29 杭州电子科技大学 一种基于语谱图识别的歌词时间戳生成方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PAUL VIOLA 等: "Robust Real-Time Face Detection", 《INTERNATIONAL JOURNAL OF COMPUTER VISION》 *
YI TAN 等: "An Aerial change detection system using multiple detector fusion and adaboost classification", 《2017 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
刘晴 等: "一种基于颜色特征的感兴趣目标提取方法", 《计算机辅助设计与图形学学报》 *
杨笑 等: "基于参数优化AdaBoost算法的酸性火山岩岩性分类", 《石油学报》 *

Also Published As

Publication number Publication date
CN111126247B (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN107679078B (zh) 一种基于深度学习的卡口图像车辆快速检索方法及系统
Epshtein et al. Feature hierarchies for object classification
US9008429B2 (en) Label-embedding for text recognition
Agarwal et al. Hyperfeatures–multilevel local coding for visual recognition
Tao et al. Supervised tensor learning
Maji et al. Classification using intersection kernel support vector machines is efficient
CN110163033B (zh) 正样本获取方法、行人检测模型生成方法和行人检测方法
Angelova et al. Fast terrain classification using variable-length representation for autonomous navigation
CN107316036B (zh) 一种基于级联分类器的害虫识别方法
CN111814584A (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
WO2018052587A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
US8023701B2 (en) Method, apparatus, and program for human figure region extraction
Agarwal et al. Multilevel image coding with hyperfeatures
CN107315990A (zh) 一种基于xcs‑lbp特征以及级联aksvm的行人检测算法
CN113205026A (zh) 一种基于Faster RCNN深度学习网络改进的车型识别方法
Li et al. Learning cascaded shared-boost classifiers for part-based object detection
Kustikova et al. A survey of deep learning methods and software for image classification and object detection
Jubair et al. A simplified method for handwritten character recognition from document image
CN111126247B (zh) 一种基于二分查找的行人检测器训练方法及系统
Sharma et al. A deep cnn model for student learning pedagogy detection data collection using ocr
Sulistyaningrum et al. Vehicle detection using histogram of oriented gradients and real adaboost
CN107145894B (zh) 一种基于方向梯度特征学习的目标检测方法
CN111222460B (zh) 一种基于增量误差计算的行人检测器训练方法及系统
Fraz et al. Exploiting Color Information for Better Scene Text Recognition.
Wen et al. An algorithm based on SVM ensembles for motorcycle recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 1015, Fenglin Third Road, Yuelu District, Changsha City, Hunan Province, 410205

Patentee after: HUNAN FIRST NORMAL University

Country or region after: China

Patentee after: CENTRAL SOUTH University

Address before: Yuelu District City, Hunan province 410083 Changsha Lushan Road No. 932

Patentee before: CENTRAL SOUTH University

Country or region before: China

Patentee before: HUNAN FIRST NORMAL University

CP03 Change of name, title or address