CN109325423A

CN109325423A - 一种针对行人检测的优化ssd算法

Info

Publication number: CN109325423A
Application number: CN201810996115.9A
Authority: CN
Inventors: 王培青; 陈力; 魏洪伟
Original assignee: Anhui Ultra Clear Polytron Technologies Inc
Current assignee: Anhui Ultra Clear Polytron Technologies Inc
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2019-02-12
Anticipated expiration: 2038-08-29
Also published as: CN109325423B

Abstract

本发明公开了一种针对行人检测的优化SSD算法。本专利提出的行人检测算法，在SSD物体检测算法的基础上，引入交通场景下行人的先验信息并调整神经网络的连接方式，可有效缓解SSD算法对于小目标的漏检问题。算法首先利用调整后的网络得到初步的行人位置信息与行人特征信息，之后采用AdaBoost(adaptive boosting)决策森林算法对行人框做进一步的分类，增强算法对难分辨样例的判别能力。所提出的算法在检测速度上有着一定的优势。

Description

一种针对行人检测的优化SSD算法

技术领域

本发明涉及行人检测技术领域，尤其涉及一种针对行人检测的优化SSD算法。

背景技术

行人检测在自动驾驶、视频监控、智能机器人等众多领域有着广阔的应用前景，从图像数据中准确、快速的检测行人是保证行人安全、维护社会稳定、为人类提供更高级服务的基础保障。

行人属于非刚体目标，存在光照变化、行人姿态变化、尺寸变化、部分遮挡和复杂背景等问题，检测难度大。近十年来出现的行人检测算法主要分为三类，基于可变形组件模型(DPM)及其变种、深度神经网络(DN)模型，决策森林(DF)模型。

通过总结近年来的算法发现，提高检测质量主要有三种途径，表达能力更丰富的特征、更多的数据以及上下文信息，其中最流行的方法是从输入图像中，提取更丰富的特征，多种特征类型已应用于行人检测，包括边特征、颜色特征、纹理特征、局部形状特征、协方差特征等。卷积网络在自动提取特征方面有着先天优势，多个基于卷积网络的检测算法陆续出现，其中存在的问题是，这些算法在检测质量和检测速度之间，无法平衡。物体检测领域的SSD算法，在通用物体检测任务中，检测质量和速度上都表现优异，但是在行人检测任务上表现不佳。

发明内容

本发明目的就是为了弥补已有技术的缺陷，提供一种针对行人检测的优化SSD算法。

本发明是通过以下技术方案实现的：

一种针对行人检测的优化SSD算法，具体内容如下：利用行人检测训练数据中的每一个样本进行训练，并给每个样本分配一个系数，这些系数构成了向量D，初始时刻，这些系数都初始化成相等值，首先在训练数据上训练出一个弱分类器并计算该分类器的错误率，然后在同一数据集上再次训练弱分类器，在分类器的第二次训练中，重新调整每个样本的系数，其中第一次分类正确的样本对应系数降低，而第一次分类错误的样本对应系数提高，为了从所有弱分类器中得到最终的分类器，为每一个分类器都分配了一个权重值α，α的值是基于每个弱分类器的错误率进行计算得到的，假设错误分类的样本数目为w，总的样本数目为y，则错误率ε的定义为：

而α的计算公式如下：

计算出α值之后，对系数向量D进行更新，系数向量D的计算方法如下：

如果样本被正确分类，那么该样本的权重更改为：

而如果样本被错分，那么该样本的权重更改为：

在计算出系数向量D之后，又进入下一轮迭代，每一次迭代分离中需要损失函数，采用加法模型计算损失函数，迭代完成之后更新系数向量D，不断地重复训练和调整权重的过程，直到训练错误率为0或者弱分类器的数目达到指定值为止。

算法的加法模型：

其中，b(x；γ_m)代表基函数；γ_m代表基函数的变量；β_m代表基函数的系数。训练数据和损失函数L(y,f(x))确定的情况下，训练加法模型转换为经验风险最小化问题，用公式可表示为：

利用分步计算的思路简化该问题的求解过程，即每一步仅学习一个基函数和对应系数：

逐渐累计、不断接近原始的损失函数；

(1)输入：

训练样本集合T＝{(x₁,y₁),(x₂,y₂)...(x_N,y_N)}

基函数集合{b(x；γ)}

损失函数L(y,f(x))

(2)输出：

加法模型f(x)

(3)算法流程：

初始化f₀(x)＝0

令m分别取值1,2,3...M

求解损失函数：

得到变量β_m和γ_m的值

更新模型：

f_m(x)＝f_m-1(x)+β_mb(x；γ_m)

得到最终的加法模型：

证明过程如下：

假定通过m-1轮的循环，我们已经得到f_m-1(x)：

f_m-1(x)＝f_m-2(x)+α_m-1G_m-1(x)＝α₁G₁(x)+...+α_m-1G_m-1(x)

最后一轮迭代我们得到α_m，G_m(x)以及f_m(x)，我们的目标是利用α_m，G_m(x)使得最终模型在训练样本集合中的损失函数最小，如下式：

令则上述公式可变换为：

参数α和参数G不影响因此与最小化损失函数无关。而与f_m-1(x)有关联，因此每次循环都会产生变化；

(4)基础分类器：

本步骤求解分类器G^*(x)，对于任意α>0，依据以下公式可以求得最小的G(x)：

其中，

(5)计算权重：

将带入上式当中，求导可得到

(6)分类错误率：

可计算分类错误率为：

(7)更新权值：

根据模型f_m(x)＝f_m-1(x)+α_mG_m(x)以及权重可计算得到：

两个公式做除法，可以得到从而可以计算出

本发明的优点是：本发明在SSD物体检测算法的基础上，引入交通场景下行人的先验信息并调整神经网络的连接方式，可有效缓解SSD算法对于小目标的漏检问题。算法首先利用调整后的网络得到初步的行人位置信息与行人特征信息，之后采用AdaBoost决策森林算法对行人框做进一步的分类，增强算法对难分辨样例的判别能力，所提出的算法在检测速度上有着一定的优势。

附图说明

图1为行人检测算法性能比较图。

图2为跨层连接对性能的影响图。

具体实施方式

而α的计算公式如下：

如果样本被正确分类，那么该样本的权重更改为：

而如果样本被错分，那么该样本的权重更改为：

算法的加法模型：

逐渐累计、不断接近原始的损失函数；

(1)输入：

训练样本集合T＝{(x₁,y₁),(x₂,y₂)...(x_N,y_N)}

基函数集合{b(x；γ)}

损失函数L(y,f(x))

(2)输出：

加法模型f(x)

(3)算法流程：

初始化f₀(x)＝0

令m分别取值1,2,3...M

求解损失函数：

得到变量β_m和γ_m的值

更新模型：

f_m(x)＝f_m-1(x)+β_mb(x；γ_m)

得到最终的加法模型：

证明过程如下：

假定通过m-1轮的循环，我们已经得到f_m-1(x)：

f_m-1(x)＝f_m-2(x)+α_m-1G_m-1(x)＝α₁G₁(x)+...+α_m-1G_m-1(x)

令则上述公式可变换为：

(4)基础分类器：

其中，

(5)计算权重：

将带入上式当中，求导可得到

(6)分类错误率：

可计算分类错误率为：

(7)更新权值：

根据模型f_m(x)＝f_m-1(x)+α_mG_m(x)以及权重可计算得到：

两个公式做除法，可以得到从而可以计算出

对于检测结果与ground truth的匹配，我们采用PASCAL竞赛的方法：

其中BB_dt表示detection box，BB_gt表示ground truth box，即检测框与真实行人框两者的IoU大于0.5时，我们认为成功检测到该行人。为保证detection box和groundtruth box最多匹配一次，执行贪心匹配。具有最高可信度的检测框优先匹配，如果detection box匹配多个ground truth box，优先与具有最高重叠度的ground truth box匹配。

本专利的对比实验使用对数平均漏检率评估检测器的性能。在(10^-3,10^-1)范围的对数空间中，绘制Miss Rate-FPPI曲线，并以横轴等于10^-1时对应漏检率作为算法的性能指标。图1是本专利所提算法SSD+Skip+Adaboost与已有行人检测算法的Miss Rate-FPPI曲线；图2对比了是否添加跨层连接，对检测效果的影响；下表从运行环境、检测效果和运行时间三方面全面对比了多个算法。

从上述在数据集Caltech的对比实验可以看出，本专利提出的SSD+Skip+Adaboost算法在保证较低漏检率的条件下，在检测速度上具有一定优势。首先在漏检率上，能够取得10.4％的漏检率，在所对比的算法中排在第三位。在检测时间上，每帧处理需要0.08秒，在对比算法中速度最快。去掉跨层连接，检测速度有所提升，但检测质量下降，这是因为丢失了一部分细节信息的缘故。

Claims

1.一种针对行人检测的优化SSD算法，其特征在于：具体内容如下：利用行人检测训练数据中的每一个样本进行训练，并给每个样本分配一个系数，这些系数构成了向量D，初始时刻，这些系数都初始化成相等值，首先在训练数据上训练出一个弱分类器并计算该分类器的错误率，然后在同一数据集上再次训练弱分类器，在分类器的第二次训练中，重新调整每个样本的系数，其中第一次分类正确的样本对应系数降低，而第一次分类错误的样本对应系数提高，为了从所有弱分类器中得到最终的分类器，为每一个分类器都分配了一个权重值α，α的值是基于每个弱分类器的错误率进行计算得到的，假设错误分类的样本数目为w，总的样本数目为y，则错误率ε的定义为：

而α的计算公式如下：

如果样本被正确分类，那么该样本的权重更改为：

而如果样本被错分，那么该样本的权重更改为：

2.根据权利要求1所述的一种针对行人检测的优化SSD算法，其特征在于：所述的采用加法模型计算损失函数具体如下：

加法模型

其中，b(x；γ_m)代表基函数；γ_m代表基函数的变量；β_m代表基函数的系数，在训练数据和损失函数L(y,f(x))确定的情况下，训练加法模型用公式表示为：

利用分步计算的方法简化求解过程，即每一步仅学习一个基函数和对应系数：

逐渐累计、不断接近原始的损失函数。

3.根据权利要求2所述的一种针对行人检测的优化SSD算法，其特征在于：具体的加法模型流程如下：

(1)输入：

训练样本集合T＝{(x₁,y₁),(x₂,y₂)...(x_N,y_N)}；

基函数集合{b(x；γ)}；

损失函数L(y,f(x))；

(2)输出：加法模型f(x)；

(3)算法流程：

初始化f₀(x)＝0，令m分别取值1,2,3...M，求解损失函数：

得到变量β_m和γ_m的值，

更新模型：

f_m(x)＝f_m-1(x)+β_mb(x；γ_m)

得到最终的加法模型：

证明过程如下：

假定通过m-1轮的循环，得到f_m-1(x)：

f_m-1(x)＝f_m-2(x)+α_m-1G_m-1(x)＝α₁G₁(x)+...+α_m-1G_m-1(x)

最后一轮迭代得到α_m、G_m(x)以及f_m(x)，利用α_m，G_m(x)使得最终模型在训练样本集合中的损失函数最小，如下式：

令则上述公式可变换为：

参数α和参数G不影响因此与最小化损失函数无关，而与f_m-1(x)有关联，因此每次循环都会产生变化；

(4)基础分类器：

求解分类器G^*(x)，对于任意α>0，依据以下公式可以求得最小的G(x)：

其中，

(5)计算权重：

将带入上式当中，求导可得到

(6)分类错误率：

计算分类错误率为：

(7)更新权值：

根据模型f_m(x)＝f_m-1(x)+α_mG_m(x)以及权重计算得到：

两个公式做除法，得到从而计算出