CN109325423A - 一种针对行人检测的优化ssd算法 - Google Patents
一种针对行人检测的优化ssd算法 Download PDFInfo
- Publication number
- CN109325423A CN109325423A CN201810996115.9A CN201810996115A CN109325423A CN 109325423 A CN109325423 A CN 109325423A CN 201810996115 A CN201810996115 A CN 201810996115A CN 109325423 A CN109325423 A CN 109325423A
- Authority
- CN
- China
- Prior art keywords
- sample
- follows
- algorithm
- training
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种针对行人检测的优化SSD算法。本专利提出的行人检测算法,在SSD物体检测算法的基础上,引入交通场景下行人的先验信息并调整神经网络的连接方式,可有效缓解SSD算法对于小目标的漏检问题。算法首先利用调整后的网络得到初步的行人位置信息与行人特征信息,之后采用AdaBoost(adaptive boosting)决策森林算法对行人框做进一步的分类,增强算法对难分辨样例的判别能力。所提出的算法在检测速度上有着一定的优势。
Description
技术领域
本发明涉及行人检测技术领域,尤其涉及一种针对行人检测的优化SSD算法。
背景技术
行人检测在自动驾驶、视频监控、智能机器人等众多领域有着广阔的应用前景,从图像数据中准确、快速的检测行人是保证行人安全、维护社会稳定、为人类提供更高级服务的基础保障。
行人属于非刚体目标,存在光照变化、行人姿态变化、尺寸变化、部分遮挡和复杂背景等问题,检测难度大。近十年来出现的行人检测算法主要分为三类,基于可变形组件模型(DPM)及其变种、深度神经网络(DN)模型,决策森林(DF)模型。
通过总结近年来的算法发现,提高检测质量主要有三种途径,表达能力更丰富的特征、更多的数据以及上下文信息,其中最流行的方法是从输入图像中,提取更丰富的特征,多种特征类型已应用于行人检测,包括边特征、颜色特征、纹理特征、局部形状特征、协方差特征等。卷积网络在自动提取特征方面有着先天优势,多个基于卷积网络的检测算法陆续出现,其中存在的问题是,这些算法在检测质量和检测速度之间,无法平衡。物体检测领域的SSD算法,在通用物体检测任务中,检测质量和速度上都表现优异,但是在行人检测任务上表现不佳。
发明内容
本发明目的就是为了弥补已有技术的缺陷,提供一种针对行人检测的优化SSD算法。
本发明是通过以下技术方案实现的:
一种针对行人检测的优化SSD算法,具体内容如下:利用行人检测训练数据中的每一个样本进行训练,并给每个样本分配一个系数,这些系数构成了向量D,初始时刻,这些系数都初始化成相等值,首先在训练数据上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器,在分类器的第二次训练中,重新调整每个样本的系数,其中第一次分类正确的样本对应系数降低,而第一次分类错误的样本对应系数提高,为了从所有弱分类器中得到最终的分类器,为每一个分类器都分配了一个权重值α,α的值是基于每个弱分类器的错误率进行计算得到的,假设错误分类的样本数目为w,总的样本数目为y,则错误率ε的定义为:
而α的计算公式如下:
计算出α值之后,对系数向量D进行更新,系数向量D的计算方法如下:
如果样本被正确分类,那么该样本的权重更改为:
而如果样本被错分,那么该样本的权重更改为:
在计算出系数向量D之后,又进入下一轮迭代,每一次迭代分离中需要损失函数,采用加法模型计算损失函数,迭代完成之后更新系数向量D,不断地重复训练和调整权重的过程,直到训练错误率为0或者弱分类器的数目达到指定值为止。
算法的加法模型:
其中,b(x;γm)代表基函数;γm代表基函数的变量;βm代表基函数的系数。训练数据和损失函数L(y,f(x))确定的情况下,训练加法模型转换为经验风险最小化问题,用公式可表示为:
利用分步计算的思路简化该问题的求解过程,即每一步仅学习一个基函数和对应系数:
逐渐累计、不断接近原始的损失函数;
(1)输入:
训练样本集合T={(x1,y1),(x2,y2)...(xN,yN)}
基函数集合{b(x;γ)}
损失函数L(y,f(x))
(2)输出:
加法模型f(x)
(3)算法流程:
初始化f0(x)=0
令m分别取值1,2,3...M
求解损失函数:
得到变量βm和γm的值
更新模型:
fm(x)=fm-1(x)+βmb(x;γm)
得到最终的加法模型:
证明过程如下:
假定通过m-1轮的循环,我们已经得到fm-1(x):
fm-1(x)=fm-2(x)+αm-1Gm-1(x)=α1G1(x)+...+αm-1Gm-1(x)
最后一轮迭代我们得到αm,Gm(x)以及fm(x),我们的目标是利用αm,Gm(x)使得最终模型在训练样本集合中的损失函数最小,如下式:
令则上述公式可变换为:
参数α和参数G不影响因此与最小化损失函数无关。而与fm-1(x)有关联,因此每次循环都会产生变化;
(4)基础分类器:
本步骤求解分类器G*(x),对于任意α>0,依据以下公式可以求得最小的G(x):
其中,
(5)计算权重:
将带入上式当中,求导可得到
(6)分类错误率:
可计算分类错误率为:
(7)更新权值:
根据模型fm(x)=fm-1(x)+αmGm(x)以及权重可计算得到:
两个公式做除法,可以得到从而可以计算出
本发明的优点是:本发明在SSD物体检测算法的基础上,引入交通场景下行人的先验信息并调整神经网络的连接方式,可有效缓解SSD算法对于小目标的漏检问题。算法首先利用调整后的网络得到初步的行人位置信息与行人特征信息,之后采用AdaBoost决策森林算法对行人框做进一步的分类,增强算法对难分辨样例的判别能力,所提出的算法在检测速度上有着一定的优势。
附图说明
图1为行人检测算法性能比较图。
图2为跨层连接对性能的影响图。
具体实施方式
一种针对行人检测的优化SSD算法,具体内容如下:利用行人检测训练数据中的每一个样本进行训练,并给每个样本分配一个系数,这些系数构成了向量D,初始时刻,这些系数都初始化成相等值,首先在训练数据上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器,在分类器的第二次训练中,重新调整每个样本的系数,其中第一次分类正确的样本对应系数降低,而第一次分类错误的样本对应系数提高,为了从所有弱分类器中得到最终的分类器,为每一个分类器都分配了一个权重值α,α的值是基于每个弱分类器的错误率进行计算得到的,假设错误分类的样本数目为w,总的样本数目为y,则错误率ε的定义为:
而α的计算公式如下:
计算出α值之后,对系数向量D进行更新,系数向量D的计算方法如下:
如果样本被正确分类,那么该样本的权重更改为:
而如果样本被错分,那么该样本的权重更改为:
在计算出系数向量D之后,又进入下一轮迭代,每一次迭代分离中需要损失函数,采用加法模型计算损失函数,迭代完成之后更新系数向量D,不断地重复训练和调整权重的过程,直到训练错误率为0或者弱分类器的数目达到指定值为止。
算法的加法模型:
其中,b(x;γm)代表基函数;γm代表基函数的变量;βm代表基函数的系数。训练数据和损失函数L(y,f(x))确定的情况下,训练加法模型转换为经验风险最小化问题,用公式可表示为:
利用分步计算的思路简化该问题的求解过程,即每一步仅学习一个基函数和对应系数:
逐渐累计、不断接近原始的损失函数;
(1)输入:
训练样本集合T={(x1,y1),(x2,y2)...(xN,yN)}
基函数集合{b(x;γ)}
损失函数L(y,f(x))
(2)输出:
加法模型f(x)
(3)算法流程:
初始化f0(x)=0
令m分别取值1,2,3...M
求解损失函数:
得到变量βm和γm的值
更新模型:
fm(x)=fm-1(x)+βmb(x;γm)
得到最终的加法模型:
证明过程如下:
假定通过m-1轮的循环,我们已经得到fm-1(x):
fm-1(x)=fm-2(x)+αm-1Gm-1(x)=α1G1(x)+...+αm-1Gm-1(x)
最后一轮迭代我们得到αm,Gm(x)以及fm(x),我们的目标是利用αm,Gm(x)使得最终模型在训练样本集合中的损失函数最小,如下式:
令则上述公式可变换为:
参数α和参数G不影响因此与最小化损失函数无关。而与fm-1(x)有关联,因此每次循环都会产生变化;
(4)基础分类器:
本步骤求解分类器G*(x),对于任意α>0,依据以下公式可以求得最小的G(x):
其中,
(5)计算权重:
将带入上式当中,求导可得到
(6)分类错误率:
可计算分类错误率为:
(7)更新权值:
根据模型fm(x)=fm-1(x)+αmGm(x)以及权重可计算得到:
两个公式做除法,可以得到从而可以计算出
对于检测结果与ground truth的匹配,我们采用PASCAL竞赛的方法:
其中BBdt表示detection box,BBgt表示ground truth box,即检测框与真实行人框两者的IoU大于0.5时,我们认为成功检测到该行人。为保证detection box和groundtruth box最多匹配一次,执行贪心匹配。具有最高可信度的检测框优先匹配,如果detection box匹配多个ground truth box,优先与具有最高重叠度的ground truth box匹配。
本专利的对比实验使用对数平均漏检率评估检测器的性能。在(10-3,10-1)范围的对数空间中,绘制Miss Rate-FPPI曲线,并以横轴等于10-1时对应漏检率作为算法的性能指标。图1是本专利所提算法SSD+Skip+Adaboost与已有行人检测算法的Miss Rate-FPPI曲线;图2对比了是否添加跨层连接,对检测效果的影响;下表从运行环境、检测效果和运行时间三方面全面对比了多个算法。
从上述在数据集Caltech的对比实验可以看出,本专利提出的SSD+Skip+Adaboost算法在保证较低漏检率的条件下,在检测速度上具有一定优势。首先在漏检率上,能够取得10.4%的漏检率,在所对比的算法中排在第三位。在检测时间上,每帧处理需要0.08秒,在对比算法中速度最快。去掉跨层连接,检测速度有所提升,但检测质量下降,这是因为丢失了一部分细节信息的缘故。
Claims (3)
1.一种针对行人检测的优化SSD算法,其特征在于:具体内容如下:利用行人检测训练数据中的每一个样本进行训练,并给每个样本分配一个系数,这些系数构成了向量D,初始时刻,这些系数都初始化成相等值,首先在训练数据上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器,在分类器的第二次训练中,重新调整每个样本的系数,其中第一次分类正确的样本对应系数降低,而第一次分类错误的样本对应系数提高,为了从所有弱分类器中得到最终的分类器,为每一个分类器都分配了一个权重值α,α的值是基于每个弱分类器的错误率进行计算得到的,假设错误分类的样本数目为w,总的样本数目为y,则错误率ε的定义为:
而α的计算公式如下:
计算出α值之后,对系数向量D进行更新,系数向量D的计算方法如下:
如果样本被正确分类,那么该样本的权重更改为:
而如果样本被错分,那么该样本的权重更改为:
在计算出系数向量D之后,又进入下一轮迭代,每一次迭代分离中需要损失函数,采用加法模型计算损失函数,迭代完成之后更新系数向量D,不断地重复训练和调整权重的过程,直到训练错误率为0或者弱分类器的数目达到指定值为止。
2.根据权利要求1所述的一种针对行人检测的优化SSD算法,其特征在于:所述的采用加法模型计算损失函数具体如下:
加法模型
其中,b(x;γm)代表基函数;γm代表基函数的变量;βm代表基函数的系数,在训练数据和损失函数L(y,f(x))确定的情况下,训练加法模型用公式表示为:
利用分步计算的方法简化求解过程,即每一步仅学习一个基函数和对应系数:
逐渐累计、不断接近原始的损失函数。
3.根据权利要求2所述的一种针对行人检测的优化SSD算法,其特征在于:具体的加法模型流程如下:
(1)输入:
训练样本集合T={(x1,y1),(x2,y2)...(xN,yN)};
基函数集合{b(x;γ)};
损失函数L(y,f(x));
(2)输出:加法模型f(x);
(3)算法流程:
初始化f0(x)=0,令m分别取值1,2,3...M,求解损失函数:
得到变量βm和γm的值,
更新模型:
fm(x)=fm-1(x)+βmb(x;γm)
得到最终的加法模型:
证明过程如下:
假定通过m-1轮的循环,得到fm-1(x):
fm-1(x)=fm-2(x)+αm-1Gm-1(x)=α1G1(x)+...+αm-1Gm-1(x)
最后一轮迭代得到αm、Gm(x)以及fm(x),利用αm,Gm(x)使得最终模型在训练样本集合中的损失函数最小,如下式:
令则上述公式可变换为:
参数α和参数G不影响因此与最小化损失函数无关,而与fm-1(x)有关联,因此每次循环都会产生变化;
(4)基础分类器:
求解分类器G*(x),对于任意α>0,依据以下公式可以求得最小的G(x):
其中,
(5)计算权重:
将带入上式当中,求导可得到
(6)分类错误率:
计算分类错误率为:
(7)更新权值:
根据模型fm(x)=fm-1(x)+αmGm(x)以及权重计算得到:
两个公式做除法,得到从而计算出
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996115.9A CN109325423B (zh) | 2018-08-29 | 2018-08-29 | 一种针对行人检测的优化ssd方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996115.9A CN109325423B (zh) | 2018-08-29 | 2018-08-29 | 一种针对行人检测的优化ssd方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325423A true CN109325423A (zh) | 2019-02-12 |
CN109325423B CN109325423B (zh) | 2021-09-21 |
Family
ID=65264350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810996115.9A Active CN109325423B (zh) | 2018-08-29 | 2018-08-29 | 一种针对行人检测的优化ssd方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325423B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2624653A (en) * | 2022-11-24 | 2024-05-29 | Continental Autonomous Mobility Germany GmbH | A system and method for object detection from a curved mirror |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170228177A1 (en) * | 2016-02-10 | 2017-08-10 | Kabushiki Kaisha Toshiba | Storage controller, storage device, data processing method, and computer program product |
CN107564034A (zh) * | 2017-07-27 | 2018-01-09 | 华南理工大学 | 一种监控视频中多目标的行人检测与跟踪方法 |
CN107590452A (zh) * | 2017-09-04 | 2018-01-16 | 武汉神目信息技术有限公司 | 一种基于步态与人脸融合的身份识别方法及装置 |
CN108154076A (zh) * | 2017-11-16 | 2018-06-12 | 北京遥感设备研究所 | 一种机器学习算法级联的铁轨行人检测方法 |
-
2018
- 2018-08-29 CN CN201810996115.9A patent/CN109325423B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170228177A1 (en) * | 2016-02-10 | 2017-08-10 | Kabushiki Kaisha Toshiba | Storage controller, storage device, data processing method, and computer program product |
CN107564034A (zh) * | 2017-07-27 | 2018-01-09 | 华南理工大学 | 一种监控视频中多目标的行人检测与跟踪方法 |
CN107590452A (zh) * | 2017-09-04 | 2018-01-16 | 武汉神目信息技术有限公司 | 一种基于步态与人脸融合的身份识别方法及装置 |
CN108154076A (zh) * | 2017-11-16 | 2018-06-12 | 北京遥感设备研究所 | 一种机器学习算法级联的铁轨行人检测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2624653A (en) * | 2022-11-24 | 2024-05-29 | Continental Autonomous Mobility Germany GmbH | A system and method for object detection from a curved mirror |
Also Published As
Publication number | Publication date |
---|---|
CN109325423B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107145889B (zh) | 基于具有RoI池化的双CNN网络的目标识别方法 | |
CN109949317A (zh) | 基于逐步对抗学习的半监督图像实例分割方法 | |
CN105844295B (zh) | 一种基于颜色模型与运动特征的视频烟雾精细分类方法 | |
CN110929848B (zh) | 基于多挑战感知学习模型的训练、跟踪方法 | |
CN110458022B (zh) | 一种基于域适应的可自主学习目标检测方法 | |
CN114724007A (zh) | 训练分类模型、数据分类方法、装置、设备、介质及产品 | |
CN112507778B (zh) | 一种基于线特征的改进词袋模型的回环检测方法 | |
CN107067022B (zh) | 图像分类模型的建立方法、建立装置和设备 | |
CN112784929A (zh) | 一种基于双元组扩充的小样本图像分类方法及装置 | |
CN112923523A (zh) | 一种基于物联网数据链的智能型新风系统调控方法 | |
Xiao et al. | Traffic sign detection based on histograms of oriented gradients and boolean convolutional neural networks | |
CN116184972A (zh) | 空气分离装置的控制系统及其方法 | |
CN113298186A (zh) | 融合流模型对抗生成网络和聚类算法的网络异常流量检测方法 | |
CN111191742A (zh) | 一种用于多源异构数据流的滑动窗口长度自适应调整方法 | |
CN109325423A (zh) | 一种针对行人检测的优化ssd算法 | |
CN113033345B (zh) | 基于公共特征子空间的v2v视频人脸识别方法 | |
CN114693607A (zh) | 基于多域块特征标志点配准的篡改视频检测方法及系统 | |
CN112597979B (zh) | 一种实时更新余弦夹角损失函数参数的人脸识别方法 | |
CN107564013B (zh) | 融合局部信息的场景分割修正方法与系统 | |
CN109191485A (zh) | 一种基于多层超图模型的多视频目标协同分割方法 | |
CN112990371A (zh) | 一种基于特征扩增的无监督夜间图像分类方法 | |
CN109919235B (zh) | 一种基于人工干预样本集权重的深度学习图像分类模型训练方法 | |
CN103366163A (zh) | 基于增量学习的人脸检测系统和方法 | |
Yin et al. | An improved algorithm based on convolutional neural network for smoke detection | |
CN112560651B (zh) | 基于深度网络和目标分割结合的目标跟踪方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |