CN111222460B

CN111222460B - 一种基于增量误差计算的行人检测器训练方法及系统

Info

Publication number: CN111222460B
Application number: CN202010010662.2A
Authority: CN
Inventors: 傅红普; 刘晴
Original assignee: Central South University; Hunan First Normal University
Current assignee: Central South University; Hunan First Normal University
Priority date: 2020-01-02
Filing date: 2020-01-06
Publication date: 2023-04-18
Anticipated expiration: 2040-01-06
Also published as: CN111222460A

Abstract

本发明公开了一种基于增量误差计算的行人检测器训练方法及系统，该方法包括以下步骤：步骤1：构建训练集；步骤2：权重与决策桩序号初始化；步骤3：构建有序特征值数组集合和伴随权重数组集合；步骤4：计算误差数组集合和极性数组集合；步骤5：获得最小误差数组；步骤6：设置决策桩；步骤7：按照决策桩更新样本的权重，更新决策桩序号；步骤8：判断决策桩序号是否超过设定的上限值，若未超过，返回步骤3，否则，利用所有决策桩构建行人检测器。使用增量式误差计算获取误差数组集合，将误差计算的复杂度由O(n)降低为O(1)，加快了行人检测器的训练速度。

Description

一种基于增量误差计算的行人检测器训练方法及系统

技术领域

本发明属于计算机视觉目标检测技术领域，特别涉及一种基于增量误差计算的行人检测器训练方法及系统。

背景技术

行人检测任务从图像中检测出行人并画出包围盒，参见文献1，可作为包括步态识别、自动驾驶、服务机器人等任务的计算机视觉关键环节，广受学术界和工业界关注。AdaBoost方法组合多个决策桩构造强分类器，并且只要求决策桩比随机猜测的性能好。AdaBoost并不依赖于决策桩分类精度的任何先验知识,它自适应地根据精度确定决策桩的权重。理论分析和实验研究都表明AdaBoost的泛化能力很强，参加文献2在手工设计特征和深度学习特征框架中，AdaBoost分类器在行人检测上都展现出了优越的性能，参见文献3和文献4。

AdaBoost分类器形式为：

其中，x表示样本，h_t(x)是决策桩，α_t是h_t(x)的权重，T是分类器H包含的决策桩个数，

为AdaBoost分类器的分类阈值，1表示样本被分类为行人，-1表示样本被分类为背景。

训练通过贪婪地选择最优的决策桩h_t(x)和设置相应权重α_t来最小化损失函数。开始训练时，给每个训练样本x_i一个非负权重w_i。每次迭代训练后，AdaBoost方法自适应地降低正确分类样本的权重、提高错误分类样本的权重。每次迭代都在更新了样本权重的训练集上训练一个新决策桩。

训练AdaBoost分类器就是不断迭代训练决策桩直至训练误差达到指定值。决策桩由决策结点和两个保存结果的叶子结点构成。决策桩h_j由特征f_j、阈值θ_j、和极性p_j∈{-1，1}三个参数描述：h_j(x)＝p_jsign(f_j(x)-θ_j)，其中，x是以局部图像特征向量形式描述的样本，sign()是符号函数。

每次训练决策桩都是寻找在当前权重分布下的分类误差∈达到最小的决策桩。对样本权重归一化后，决策桩h的分类误差∈定义为：

，∑w_i＝1，其中，w_i是每个样本当前的权重，1_{x}是指示函数，自变量x为真时输出1，为假时输出0。

人们提出了很多方法来加快AdaBoost分类器的训练速度。这些方法大致可分为两类：一、基于特征和/或训练样本子采样的方法；二、提高决策桩训练速度的方法。前者如文献5和文献6，后者如文献7和文献8。因为样本集上特征值分布的随机性，现有方法使用顺序查找重复下述五个步骤训练各决策桩。

步骤G1：降低正确分类样本的权重，提高错误分类样本的权重；

步骤G2：对每个候选特征f_i，按特征值升序排序得到样本编号序列；

步骤G3：对每个候选特征f_i，依次以从小到大的特征值作为阈值，计算所有阈值对应的分类误差序列{ε_t}；将特征值小于等于某个阈值θ的样本分类为正样本，其他样本分类为负样本，可计算出分类误差。也可以相反，就有另一个分类误差。选择误差小的分类方式作为阈值θ的分类，决策桩定义中的极性p记录该选择。

步骤G4：将误差序列{ε_t}中的最小值作为特征f_i的分类误差；

步骤G5：选择误差最小的特征f^*、对应分类阈值θ^*和分类方向极性p^*作为本轮训练出的决策桩。

上述步骤G3计算每个阈值对应的分类误差采用了下面的公式，

∈＝min(s^-+(z⁺-s⁺)，s⁺+(z^--s^-))，其中，以某个特征的特征值作为阈值进行样本分类时，s⁺和s^-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和，z⁺是全部正样本权重之和，z^-是全部负样本权重之和，∈表示分类误差。采用这种方式计算时，每次都需要累加所有权重，时间复杂度为O(n)。

尽管AdaBoost在行人检测上表现出了卓越的性能。但是训练耗时长仍是一个不容忽视的问题。为训练出高性能的AdaBoost行人检测器，需要大量的训练样本和大量的候选特征，该问题越发突出。包括加快训练方法在内的现有方法训练决策桩时都采用了全部权重累加方式计算每个阈值对应的分类误差，训练出高性能的AdaBoost行人检测器往往非常耗时。

发明内容

本发明提供了一种基于增量误差计算的行人检测器训练方法，其目的在于，将训练AdaBoost检测器每个决策桩时计算每个阈值对应误差的方式由全部权重累加方式改进为每次只累加一个权重的增量方式，将该操作的复杂度由O(n)降低为O(1)，以加快训练行人检测器的速度。

一种基于增量误差计算的行人检测器训练方法，包括以下步骤：

步骤1：以样本的局部图像特征和对应的类别标签，作为训练集；

样本是矩形图像窗口；类别标签包括行人和背景两种，行人为正样本，背景为负样本，分别以1和-1表示；

步骤2：对训练集中的每个样本的权重进行初始设置，且初始化用于行人检测的决策桩序号，设定决策桩序号的上限值；

步骤3：对权重进行归一化处理，并构建有序特征值数组集合和伴随权重数组集合；

对训练集中每个样本的相同特征的特征值进行升序排列，获取有序特征值数组集合；同时，对每个特征值对应的权重按照特征值的排序进行重排，获得与有序特征值数组集合对应的伴随权重数组集合；

步骤4：计算误差数组集合和极性数组集合；

依次以每个有序特征值数组中的每个元素为阈值，对训练集中的样本进行分类，使用与有序特征值数组对应的伴随权重数组中权重元素增量式计算分类误差，得到误差数组集合；同时，以误差数组中每个误差元素的极性值，构建对应的极性数组，得到极性数组集合；

步骤5：对误差数组集合中每个误差数组进行顺序查找最小误差，获得最小误差数组，并以最小误差所在的误差数组的下标构成下标数组；

步骤6：利用最小误差数组中的最小误差，设置决策桩；

步骤7：按照决策桩更新训练集中每个样本的权重，同时，更新决策桩序号；

步骤8：判断决策桩序号是否超过设定的上限值，若未超过，返回步骤3，否则，使用所有决策桩构建行人检测器。

进一步的，所述步骤4中的分类误差采用以下公式增量式计算：

其中，e_i,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差，w_i,j是第i个伴随权重数组的第j个元素，y_i,j是对应样本标签，正样本标签为1，负样本标签为-1。

进一步的，所述误差元素的极性值是指当分类误差

时，对应误差元素的极性值为1，否则为-1。

进一步的，所述决策桩按照以下方式设置：

令决策桩对应的特征维度序号μ_t＝m1，决策桩分类误差ε_t＝mine，决策桩极性ρ_t＝p_m1,m2，决策桩阈值θ_t＝o_m1,m2，决策桩为

其中，mine为最小误差数组中的最小误差，(m1,m2)为mine在下标数组中的对应下标，p_m1,m2和o_m1,m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素，

表示训练集中的样本x的第μ_t维特征，t表示决策桩序号。

进一步的，所述行人检测器如下：

其中，

进一步的，训练集中每个样本的权重按照以下公式更新：

其中，样本x_i被分类正确时e_i＝0，否则e_i＝1，

一种基于增量误差计算的行人检测器训练系统，包括：

训练集：包括样本的局部图像特征和对应的类别标签；

初始化单元：对训练集中的每个样本的权重进行初始设置，且初始化用于行人检测的决策桩序号，设定决策桩序号的上限值；

权重归一化单元：对权重进行归一化处理；

有序特征值数组集合和伴随权重数组集合构建单元：对训练集中每个样本的相同特征的特征值进行升序排列，获取有序特征值数组集合；同时，对每个特征值对应的权重按照特征值的排序进行重排，获得与有序特征值数组集合对应的伴随权重数组集合；

误差数组集合和极性数组集合计算单元：依次以每个有序特征值数组中的每个元素为阈值，对训练集中的每个样本进行分类，使用与有序特征值数组对应的伴随权重数组中权重元素以增量方式计算分类误差，得到误差数组集合；同时，以误差数组中每个误差元素的极性值，构建对应的极性数组，得到极性数组集合；

最小误差数组获取单元：对误差数组集合中每个误差数组进行顺序查找最小误差，获得最小误差数组，并以最小误差所在的误差数组的下标构成下标数组；

决策桩设置单元：利用最小误差数组中的最小误差，设置决策桩；

决策桩训练单元：按照决策桩更新训练集中每个样本的权重，同时，更新决策桩序号；

行人检测器确定单元：判断决策桩训练单元中决策桩序号是否超过设定的上限值，若未超过，则重新依次调用权重归一化单元、有序特征值数组集合和伴随权重数组集合构建单元、误差数组集合和极性数组集合计算单元、最小误差数组获取单元以及决策桩设置单元，重新设置决策桩，再调用决策桩训练单元重新训练，直到决策桩序号达到设定的上限值后，利用所有的决策桩，构建行人检测器，否则，利用所有的决策桩，构建行人检测器。

有益效果

本发明提出了一种基于增量误差计算的行人检测器训练方法及系统，该方法包括以下步骤：步骤1：以样本的局部图像特征和对应的类别标签，作为训练集；步骤2：对训练集中的每个样本的权重进行初始设置，且初始化用于行人检测的决策桩序号，设定决策桩序号的上限值；步骤3：对权重进行归一化处理，并构建有序特征值数组集合和伴随权重数组集合；步骤4：计算分类误差得到误差数组集合和极性数组集合；步骤5：对误差数组集合中每个误差数组进行顺序查找最小误差，获得最小误差数组，并以最小误差所在的误差数组的下标构成下标数组；步骤6：利用最小误差数组中的最小误差，设置决策桩；步骤7：按照决策桩更新训练集中每个样本的权重，同时，更新决策桩序号；步骤8：判断决策桩序号是否超过设定的上限值，若未超过，返回步骤3，否则，利用所有的决策桩构建行人检测器。

所述步骤4中的分类误差采用以下公式增量式计算：

其中，e_i,j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差，w_i,j是第i个伴随权重数组的第j个元素，y_i,j是对应样本标签，正样本标签为1，负样本标签为-1。该方法步骤4使用增量误差计算方式，将该运算复杂度由O(n)降低为O(1)，加快了行人检测器训练速度。

本发明所述提高了行人检测器的训练速度，训练过程完全与全部权重累加方式计算误差的方法一致，因此检测器的性能也一致。并且，本发明与现有加快训练速度的方法所采取措施是正交的，因此可以叠加到其他方法上进一步加快训练速度。

按照决策桩h的分类误差∈定义

，∑w_i＝1，其中，w_i是每个样本当前的权重，1_{x}是指示函数，自变量x为真时输出1，为假时输出0；选择了特征f_i的分类阈值θ，并指定特征值小于等于该阈值的样本为正样本、即设定极性p＝-1，则分类误差∈_-1为该阈值之前的负样本权重之和(s^-)与之后的正样本权重之和(z⁺-s⁺)累加。若做相反的分类极性指定，则参与误差计算的权重的符号也相反，此时误差为s⁺+(z^--z^-)，记为∈₊₁。∈＝min(s^-+(z⁺-s⁺),s⁺+(z^--s^-))＝＝min(∈_-1,∈₊₁)，其中，以某个特征的特征值作为阈值进行样本分类时，s⁺和s^-分别是指相同特征中特征值小于阈值的所有正样本的权重之和与相同特征中特征值小于阈值的所有负样本权重之和，z⁺是全部正样本权重之和，z^-是全部负样本权重之和，∈表示分类误差。这种方式计算复杂度为O(n)。

本发明注意到每轮训练决策桩前都对权重进行了归一化处理，则有：

∈_-1+∈₊₁

＝s^-+(z⁺-s⁺)+s⁺+(z^--s^-)

＝z⁺+z^-

＝1；

而，

∈₊₁＝s⁺+(z^--s^-)

＝z^-+(s⁺-s^-)

＝z^-+pres；

将负样本的权重加上负号，则pres就是阈值之前所有样本权重的代数和，该式表明计算∈₊₁只需考虑阈值θ之前的样本权重。而∈＝min(∈₊₁,1-∈₊₁)，该式表明计算误差∈时只需要累加阈值θ之前的样本权重。基于此，本发明公开了增量误差计算方式。

附图说明

图1为本发明实例所述方法的流程图；

具体实施方式

下面将结合附图和实例对本发明做进一步的说明。

如图1所示流程，一种基于增量误差计算的行人检测器训练方法，包括以下步骤：

步骤1：计算样本的特征；

从Inria行人数据集(参见文献9)提取n＝7478个样本，其中正负样本的数量分别是l＝2478、m＝5000；正样本是包含行人的尺寸为128×64的图像窗口，负样本是不含行人的同样大小的图像窗口；

对提取的n个样本计算低维方向梯度直方图(ELHOG)特征(参见文献1)，得到训练集{(x₁,y₁),…,(x_n,y_n)}，其中x_i是样本i的k维特征向量，也直接称之为样本，使用18个梯度方向、维度k＝2304，下标i是样本号，正负样本的标签y_i分别为1和-1；

步骤2：初始化样本权重和决策桩序号；

初始化正负样本的权重w_i分别为

和

得到权重数组w＝{w₁,…,w_n}，其中，下标i是样本号；设定决策桩总数T＝2048，初始化决策序号t＝1；

步骤3：归一化样本权重

步骤4：计算有序特征值数组集合和伴随权重数组集合；

对训练集中每个样本的相同特征的特征值[x_1,j,…,x_n,j]进行升序排列，x_i,j是x_i的第j维特征，得到k个有序特征值数组构成的集合{o₁,…,o_k}；

上述排序时，同步对权重数组副本跟随变动重排，得到k个伴随权重数组构成的集合{a₁,…,a_k}，数组a_i长度为n，a_i的元素a_i,j与o_i的元素o_i,j对应的是同一样本x_i；

步骤5：计算误差数组集合和极性数组集合；

以每个有序特征值数组o_i中的每个元素为阈值，使用对应的伴随权重数组a_i以增量方式计算分类误差，得到k个误差数组构成的集合{e₁,…,e_k}，数组e_i长度为n；

在以增量方式计算分类误差的同时记录误差计算极性，得到k个极性数组构成的集合{p₁,…,p_k}，数组p_i长度为n，p_i的元素p_i,j∈{1,-1}；误差按下式计算，

当分类误差

时，对应误差元素的极性值为1，否则为-1。

步骤6：顺序查找误差数组集合，得到最小误差数组；

在每个误差数组e_i上顺序查找确定最小误差，得到长度为k的最小误差数组E，记录对应的下标(i,j)得到长度为k的下标数组D＝[(d_1,1,d_1,2),…,(d_k,1,d_k,2)]；

步骤7：确定分类误差，定义决策桩；

表示训练集中的样本x的第μ_t维特征，t表示决策桩序号。

步骤8：更新样本权重和决策桩计数；

更新样本权重

其中，样本x_i分类正确时e_i＝0，否则e_i＝1，

更新决策序号t＝t+1；

步骤9：决策桩数不达上限则跳转到步骤3；

若t＞T，执行步骤10，否则跳转到步骤3；

步骤10：输出行人检测器；

输出AdaBoost行人检测器

其中，

本发明注意到每轮训练决策桩前都对权重进行了归一化处理，将训练AdaBoost检测器每个决策桩时计算每个阈值对应误差的方式由全部权重累加方式改进为每次只累加一个权重的增量方式，将该操作的复杂度由O(n)降低为O(1)，加快了训练行人检测器的速度。并且，本发明与现有加快训练速度的方法所采取措施是正交的，因此可以叠加到其他方法上进一步加快训练速度。

实验效果

本发明的方法与全部权重累加误差计算方法训练出的检测器在公开图像集Inria行人数据集上的性能完全一样。使用CPU为i3-4150，内存为20G的PC集，本发明方法叠加在文献8提出的快速训练方法上、在Inria行人数据集上训练耗时为6分30秒，比全部权重累加误差计算方法快25秒左右。

基于上述方法，本实例还提供一种基于增量误差计算的行人检测器训练系统，包括：

训练集：包括样本的局部图像特征和对应的类别标签；

权重归一化单元：对权重进行归一化处理；

应当理解，本发明各个实施例中的功能单元模块可以集中在一个处理单元中，也可以是各个单元模块单独物理存在，也可以是两个或两个以上的单元模块集成在一个单元模块中，可以采用硬件或软件的形式来实现。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

参考文献

[1]傅红普,邹北骥.一种方向梯度直方图的降维方法[J].浙江大学学报(理学版),2017(2):34-138.

[2]Viola P,Jones M J.Robust Real-Time Face Detection[J].InternationalJournal of Computer Vision,2004,57(2):137-154.DOI:10.1023/B:VISI.0000013087.49260.fb.

[3]P.Dollar,R.Appel,S.Belongie and P.Perona.Fast Feature Pyramids forObject Detection[J].PAMI 2014.

[4]Liliang,Zhang,Liang,Lin,Xiaodan,Liang,Kaiming,He.Is Faster RCNNDoing Well for Pedestrian Detection？[C].European Conference on ComputerVision,2016:443-457.

[5]Dollar P,Tu Z,Tao H,et al.Feature Mining for Image Classification[C].computer vision and pattern recognition,Minneapolis,MN,USA.2007:1-8.

[6]Tolba M,Moustafa M.GAdaboost:Accelerating adaboost featureselection with genetic algorithms[C].international conference on evolutionarycomputation theory and applications,Porto,Portugal.2016:156-163.

[7]Mnih V,Audibert J Y.Empirical Bernstein stopping[C].InternationalConference on Machine Learning,2008:672-679.

[8]R.Appel,T.Fuchs,P.Dollar,P.Perona.Quickly Boosting Decision Trees:Pruning Underachieving Features Early[C].ICML 2013.

[9]Dalal,N and Bill Triggs,B.Histograms of oriented gradients forhuman detection[C].CVPR2005:886-893.

Claims

1.一种基于增量误差计算的行人检测器训练方法，其特征在于，包括以下步骤：

样本是矩形图像窗口；类别标签包括行人和背景两种，行人是正样本，背景是负样本，其标签分别以1和-1表示；

步骤4：计算误差数组集合和极性数组集合；

步骤6：利用最小误差数组中的最小误差，设置决策桩；

2.根据权利要求1所述的方法，其特征在于，所述步骤4中的分类误差采用以下公式增量式计算：

其中，e_i，j是以第i个有序特征值数组的第j个元素为阈值对应的分类误差，w_i，j是第i个伴随权重数组的第j个元素，y_i，j是对应样本标签，正样本标签为1，负样本标签为-1。

3.根据权利要求2所述的方法，其特征在于，所述误差元素的极性值是指当分类误差

时，对应误差元素的极性值为1，否则为-1。

4.根据权利要求1所述的方法，其特征在于，所述决策桩按照以下方式设置：

令决策桩对应的特征维度序号μ_t＝m1，决策桩分类误差ε_t＝mine，决策桩极性ρ_t＝p_m1，m2，决策桩阈值θ_t＝o_m1，m2，决策桩为

其中，mine为最小误差数组中的最小误差，(m1，m2)为mine在下标数组中的对应下标，p_m1，m2和o_m1，m2分别是极性数组集合和有序特征值数组集合中第m1个数组中的第m2个元素，

表示训练集中的样本x的第μ_t维特征，t表示决策桩序号。

5.根据权利要求4所述的方法，其特征在于，所述行人检测器如下：

其中，

6.根据权利要求4所述的方法，其特征在于，训练集中每个样本的权重按照以下公式更新：

其中，样本x_i被正确分类时e_i＝0，否则e_i＝1，

7.一种基于增量误差计算的行人检测器训练系统，其特征在于，包括：

训练集：包括样本的局部图像特征和对应的类别标签；

权重归一化单元：对权重进行归一化处理；