CN106570564A - 基于深度网络的多尺度行人检测方法 - Google Patents

基于深度网络的多尺度行人检测方法 Download PDF

Info

Publication number
CN106570564A
CN106570564A CN201610954990.1A CN201610954990A CN106570564A CN 106570564 A CN106570564 A CN 106570564A CN 201610954990 A CN201610954990 A CN 201610954990A CN 106570564 A CN106570564 A CN 106570564A
Authority
CN
China
Prior art keywords
pedestrian
network
depth
row
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610954990.1A
Other languages
English (en)
Other versions
CN106570564B (zh
Inventor
庞彦伟
尚楚博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610954990.1A priority Critical patent/CN106570564B/zh
Publication of CN106570564A publication Critical patent/CN106570564A/zh
Application granted granted Critical
Publication of CN106570564B publication Critical patent/CN106570564B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度网络的多尺度行人检测方法,包括下列步骤:搭建Caffe深度学习框架,使用ImageNet数据库训练好的VGG模型;构造大,中,小尺度的三列卷积神经网络,三列并联网络最后的特征通道大小相同,数目不同,尺度越大,数目越多,以使得各列卷积网络所学习到的特征能适应于不同尺度的行人;利用Caltech行人数据库对三列卷积神经网络进行微调;调整不同尺度并联网络的深度,尺度越大所对应的网络深度越深;利用Caltech行人数据库对深浅网络进行微调。本发明能充分挖掘图像中不同尺度行人的特征,增强大尺度行人和低尺度行人的特征区分力,从而显著的提高行人检测性能。

Description

基于深度网络的多尺度行人检测方法
技术领域
本发明涉及人工智能、模式识别、计算机视觉等领域中的行人检测方法,具体而言,特别是采用深度学习模型进行行人检测的方法。
背景技术
行人检测是计算机视觉研究领域的一个重要部分,在视频监控、智能交通以及人机交互等领域具有十分重要的应用价值。近年来,基于计算机硬件设备的快速发展,工业界对行人检测的性能提出了更加苛刻的要求。
由于行人具有刚性物体和非刚性物体的特性,如行人拍摄角度的多变性,光照以及遮挡等因素的存在,行人的漏检以及误检一直是影响行人检测性能的关键问题。因此,近年来,科研人员在行人特征设计方面开展了大量工作,以增大行人样本和非行人样本之间的特征差异,从而提高行人检测率,降低误检率。在当前行人检测方法中,主要可以分为两类方法:1.决策森林(ChnFtrs[1],InformedHarr[2],NNNF[3]等)。2.基于深度网络的方法(ConvNet[4],DeepParts[5],CompACT-Deep[6]等)。
基于决策树的行人检测方法主要采用手工设计的特征。2009年,Dollar提出积分通道[4]的方法,该方法通过线性变换和非线性变换计算输入图像的多个通道(HOG[7],GradientMagnitude,LUV),然后利用积分图像计算其局部特征。这种方法的优点是能够自然的整合异构信息源且参数较少,检测过程中空间定位精确度高。在此基础上,国内外学者利用行人的众多先验特征,设计了丰富的行人特征,从而很大程度提高了行人检测的性能。然而,手工设计的特征在表达能力上仍存在很强的局限性。
如今,大量训练数据的出现和计算机运算能力的提升,促进了深度网络结构在不同计算机视觉任务的成功,如大尺度分类和检测,其中典型方法有卷积神经网络。其中,在物体检测领域中使用最为广泛的模型如R-CNN[8]系列,它主要的方法是:1)候选框提取。采用selective-search方法从图像中提取候选区域;2)特征提取。通过卷积神经网络提取候选区域的特征;3)利用分类器进行判定。在三个步骤中,特征提取起到最为关键的作用,它利用卷积网络模拟出高维的函数来计算特征,这是手工设计的特征无法实现的。因此,卷积神经网络所学习的特征对图像本质的表达能力有了显著的提高。在R-CNN[8]后,Fast-RCNN[9],Faster-R-CNN[10]在原始基础上,检测性能和计算速度都有了显著的提高。因此,利用卷积神经网络进行物体检测得到了广泛的关注。这同时也促进了深度网络结构在行人检测上的应用。DeepPart[5]利用深度网络训练出行人多个部分的模型,增强了行人检测的鲁棒性。CompACT-Deep[6]结合传统手工设计特征和深度网络,使行人检测的性能得到了显著提高。
尽管如此,行人检测依然存在很多未被解决的问题。如在检测图像中,由于图像拍摄角度和透视关系的问题,会存在很多行人角度多变,行人尺度差异性明显的问题。其中,图像中“大人”和“小人”特征差异化过大,“小人”分辨率过低,特征区分力弱,从而导致“小人”漏检的问题,这是当前检测性能提高的瓶颈。即使当前采用深度学习的方法,低分辨率行人漏检的问题依然显著。所以,有效的解决低分辨行人检测的问题,是充分提高行人检测性能的关键。
当前,采用深度网络进行行人检测的方法主要采用单一网络,固定网络深度,虽然该类方法在检测性能上有了显著提高,但是该类方法并没有很好的区分不同尺度行人的检测问题,因此该类方法对于多分辨率行人检测的效果并不显著。主要存在以下问题:
1)网络单一,没有区分对待不同尺度的行人,致使学习出的特征的更倾向于大分辨率行人,从而致使低分辨率的“小人”漏检。
2)网络深度固定。由于不同尺度的行人的特征表达能力不同,深度网络能有效的学习高分辨行人的特征,但会存在很大概率使表达低分辨率行人的特征出现过拟合情况,失去局部表达能力。
参考文献:
[1]P.Dollar,Z.Tu,P.Perona,and S.Belongie,“Integral channel features,”in Proc.Brit.Mach.
Vis.Conf.,2009.
[2]S.Zhang,C.Bauckhage,and A.B.Cremers,“Informed Haar-likefeaturesimprove pedestrian detection,”in Proc.IEEE Conf.Comput.Vis.Pattern Recognit.,2014.
[3]Jiale Cao,Yanwei Pang,and Xuelong Li,“Pedestrian detectioninspiredby appearance constancy and shape symmetry,”in Proc.IEEEConf.Comput.Vis.Pattern Recognit.,2016.
[4]Sermanet,P.,Kavukcuoglu,K.,Chintala,S.,LeCun,Y.“Pedestriandetection withunsupervised multi-stage feature learning.”in Proc.IEEEIntl.Conf.Comput.Vis.,2013.
[5]Y.Tian,P.Luo,X.Wang,and X.Tang,“Deep learning strong partsforpedestrian detection,”in Proc.IEEE Intl.Conf.Comput.Vis.,2015.
[6]Z.Cai,M.Saberian,and N.Vasconcelos,“Learning complexity-awarecascades for deep pedestrian detection,”arXiv preprint arXiv:1507.05348,2015.
[7]Dalal,N.,Triggs,B.“Histograms of oriented gradients for humandetection.”in Proc.IEEE Conf.Comput.Vis.Pattern Recognit.,2005.
[8]R.Girshick,J.Donahue,T.Darrell,and J.Malik.Rich featurehierarchiesfor accurate object detection and semanticsegmentation.In CVPR,2014.
[9]Girshick R.Fast R-CNN[C].ICCV,2015.
[10]Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time ObjectDetection with Region Proposal Networks.NIPS,2015
发明内容
本发明的目的是提供一种能够提高行人检测性能的多尺度检测方法。本发明可以本发明针对不同尺度行人,提高深度网络所学特征的区分性和有效性,从而进一步提高行人检测的性能。技术方案如下:
一种基于深度网络的多尺度行人检测方法,包括下列步骤:
步骤1:搭建Caffe深度学习框架,使用ImageNet数据库训练好的VGG模型;
步骤2:构造大,中,小尺度的三列卷积神经网络,三列并联网络最后的特征通道大小相同,数目不同,尺度越大,数目越多,三列卷积神经网络分别对应不同尺寸感受野的滤波器,以使得各列卷积网络所学习到的特征能适应于不同尺度的行人;
步骤3:利用Caltech行人数据库对三列卷积神经网络进行微调;
步骤4:调整不同尺度并联网络的深度,尺度越大所对应的网络深度越深,尺度越小对应的网络深度越浅;
步骤5:利用Caltech行人数据库对深浅网络进行微调,训练好用于行人检测的三列卷积神经网络。
采用本发明所述方法,能充分挖掘图像中不同尺度行人的特征,增强大尺度行人和低尺度行人的特征区分力,从而显著的提高行人检测性能。
附图说明
图1是多列卷积神经网络模型示意图。
图2是合并深、浅网络的模型示意图。
具体实施方式
1.多列卷积神经网络
由于透视现象,图像中会含有不同大小的行人,因此,具有相同大小感受野的滤波器不可能捕捉到不同尺度行人的特性。因此,采用不同大小的局部感受野可以更好的捕捉到不同尺度行人的特征。因此,本专利提出了一种多列的卷积神经网络去学习不同尺度行人的特征。在本专利提出的多列卷积神经网络中,对于每一列网络,都采用不同大小尺寸的滤波模板去生成滤波通道。其中,具有较大感受野的滤波器对于获取大尺度行人更加有效,较小感受野的滤波器对于获取小尺度行人更加有帮助。
本专利采用三列卷积神经网络,三列卷积神经网络分别对应不同尺寸感受野的滤波器(大,中,小),以至于每列卷积网络所学习到的特征能适应于不同尺度的行人。虽然,三列不同的卷积神经网络具有不同尺度的感受野,但是三层网络最后的特征通道的长宽比是相同的,只是每一列最后的特征图的数量是不同的。此外,本专利采用1×1的滤波器取代了全连接层。因此,为了避免形变,本专利的模型可以输入任意大小的图像。
2.合并深,浅网络
卷积神经网络的深度是影响性能的关键因素。一般而言,较深的网络能较好的表达高维函数,能充分挖掘图像的特点,增强特征的区分力。然而,并非网络的深度越深越好,卷积神经网络深度过深不仅会提高模型的复杂度,降低检测效率,而且会带来过拟合的情况。对于行人检测而言,由于透视现象的存在,图像会存在不同尺度的行人,对于大尺度行人,较深的网络能充分挖掘大尺度行人的信息,增强特征区分力。但是对于小尺度行人而言,“小人”存在分辨率低,特征区分力小的问题,如果采用很深的网络去学习特征,特征会倾向于“大人”,容易产生过拟合表达的问题。
因此,针对以上问题,本专利提出了一种有效的解决措施,即并行的结合深、浅网络共同学习。这样的结合不仅能有效的区分学习“大人”和“小人”的特征,而且能更好的捕捉到高阶的显著性信息,同时也不会忽略低阶的局部性特征。深度固定的深度网络往往忽略了低阶的局部性特征,而这部分特征是对图像表达起到非常重要的作用。
具体步骤如下:
步骤1:搭建Caffe深度学习框架,使用ImageNet数据库训练好的VGG模型;
步骤2:构造大,中,小尺度的三列卷积神经网络,三列并联网络最后的特征通道大小相同,数目不同,尺度越大,数目越多,三列卷积神经网络分别对应不同尺寸感受野的滤波器,以使得各列卷积网络所学习到的特征能适应于不同尺度的行人;
步骤3:利用Caltech行人数据库对三列卷积神经网络进行fine-tune(微调);
步骤4:调整不同尺度并联网络的深度,尺度越大所对应的网络深度越深,尺度越小对应的网络深度越浅;
步骤5:利用Caltech行人数据库对深浅网络进行fine-tune(微调)。
采用本发明所述方法,能充分挖掘图像中不同尺度行人的特征,增强大尺度行人和低尺度行人的特征区分力,从而显著的提高行人检测性能。

Claims (1)

1.一种基于深度网络的多尺度行人检测方法,包括下列步骤:
步骤1:搭建Caffe深度学习框架,使用ImageNet数据库训练好的VGG模型。
步骤2:构造大,中,小尺度的三列卷积神经网络,三列并联网络最后的特征通道大小相同,数目不同,尺度越大,数目越多,三列卷积神经网络分别对应不同尺寸感受野的滤波器,以使得各列卷积网络所学习到的特征能适应于不同尺度的行人;
步骤3:利用Caltech行人数据库对三列卷积神经网络进行微调;
步骤4:调整不同尺度并联网络的深度,尺度越大所对应的网络深度越深,尺度越小对应的网络深度越浅;
步骤5:利用Caltech行人数据库对深浅网络进行微调,训练好用于行人检测的三列卷积神经网络。
CN201610954990.1A 2016-11-03 2016-11-03 基于深度网络的多尺度行人检测方法 Expired - Fee Related CN106570564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610954990.1A CN106570564B (zh) 2016-11-03 2016-11-03 基于深度网络的多尺度行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610954990.1A CN106570564B (zh) 2016-11-03 2016-11-03 基于深度网络的多尺度行人检测方法

Publications (2)

Publication Number Publication Date
CN106570564A true CN106570564A (zh) 2017-04-19
CN106570564B CN106570564B (zh) 2019-05-28

Family

ID=58535420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610954990.1A Expired - Fee Related CN106570564B (zh) 2016-11-03 2016-11-03 基于深度网络的多尺度行人检测方法

Country Status (1)

Country Link
CN (1) CN106570564B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9940548B2 (en) * 2015-03-06 2018-04-10 Panasonic Intellectual Property Management Co., Ltd. Image recognition method for performing image recognition utilizing convolution filters
CN108596013A (zh) * 2018-01-29 2018-09-28 清华大学 基于多粒度深度特征学习的行人检测方法及装置
CN109376637A (zh) * 2018-10-15 2019-02-22 齐鲁工业大学 基于视频监控图像处理的人数统计系统
CN109388663A (zh) * 2018-08-24 2019-02-26 中国电子科技集团公司电子科学研究院 一种面向社会安全领域的大数据智能分析平台
CN109784194A (zh) * 2018-12-20 2019-05-21 上海图森未来人工智能科技有限公司 目标检测网络构建方法和训练方法、目标检测方法
CN109977793A (zh) * 2019-03-04 2019-07-05 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
CN110210603A (zh) * 2019-06-10 2019-09-06 长沙理工大学 人群的计数模型构建方法、计数方法和装置
WO2020220126A1 (en) * 2019-04-30 2020-11-05 Modiface Inc. Image processing using a convolutional neural network to track a plurality of objects
CN113269038A (zh) * 2021-04-19 2021-08-17 南京邮电大学 一种基于多尺度的行人检测方法
JP7053836B2 (ja) 2017-12-19 2022-04-12 中国科学院深▲チェン▼先進技術研究院 心房細動信号の識別方法、装置及び機器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063719A (zh) * 2014-06-27 2014-09-24 深圳市赛为智能股份有限公司 基于深度卷积网络的行人检测方法及装置
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN105868689A (zh) * 2016-02-16 2016-08-17 杭州景联文科技有限公司 一种基于级联卷积神经网络的人脸遮挡检测方法
CN106022237A (zh) * 2016-05-13 2016-10-12 电子科技大学 一种端到端的卷积神经网络的行人检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063719A (zh) * 2014-06-27 2014-09-24 深圳市赛为智能股份有限公司 基于深度卷积网络的行人检测方法及装置
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN105868689A (zh) * 2016-02-16 2016-08-17 杭州景联文科技有限公司 一种基于级联卷积神经网络的人脸遮挡检测方法
CN106022237A (zh) * 2016-05-13 2016-10-12 电子科技大学 一种端到端的卷积神经网络的行人检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冀中: "《基于卷积神经网络的纹理分类方法研究》", 《计算机科学与探索》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9940548B2 (en) * 2015-03-06 2018-04-10 Panasonic Intellectual Property Management Co., Ltd. Image recognition method for performing image recognition utilizing convolution filters
JP7053836B2 (ja) 2017-12-19 2022-04-12 中国科学院深▲チェン▼先進技術研究院 心房細動信号の識別方法、装置及び機器
CN108596013A (zh) * 2018-01-29 2018-09-28 清华大学 基于多粒度深度特征学习的行人检测方法及装置
CN108596013B (zh) * 2018-01-29 2020-08-28 清华大学 基于多粒度深度特征学习的行人检测方法及装置
CN109388663A (zh) * 2018-08-24 2019-02-26 中国电子科技集团公司电子科学研究院 一种面向社会安全领域的大数据智能分析平台
CN109376637A (zh) * 2018-10-15 2019-02-22 齐鲁工业大学 基于视频监控图像处理的人数统计系统
CN109784194A (zh) * 2018-12-20 2019-05-21 上海图森未来人工智能科技有限公司 目标检测网络构建方法和训练方法、目标检测方法
CN109977793A (zh) * 2019-03-04 2019-07-05 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
CN109977793B (zh) * 2019-03-04 2022-03-04 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
WO2020220126A1 (en) * 2019-04-30 2020-11-05 Modiface Inc. Image processing using a convolutional neural network to track a plurality of objects
US11410314B2 (en) 2019-04-30 2022-08-09 L'oreal Image processing using a convolutional neural network to track a plurality of objects
CN110210603A (zh) * 2019-06-10 2019-09-06 长沙理工大学 人群的计数模型构建方法、计数方法和装置
CN113269038B (zh) * 2021-04-19 2022-07-15 南京邮电大学 一种基于多尺度的行人检测方法
CN113269038A (zh) * 2021-04-19 2021-08-17 南京邮电大学 一种基于多尺度的行人检测方法

Also Published As

Publication number Publication date
CN106570564B (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN106570564A (zh) 基于深度网络的多尺度行人检测方法
Ge et al. Facial expression recognition based on deep learning
Wang et al. Autonomous garbage detection for intelligent urban management
CN104217214B (zh) 基于可配置卷积神经网络的rgb‑d人物行为识别方法
CN106446933B (zh) 基于上下文信息的多目标检测方法
CN104021375B (zh) 一种基于机器学习的车型识别方法
CN104050471B (zh) 一种自然场景文字检测方法及系统
CN106096602A (zh) 一种基于卷积神经网络的中文车牌识别方法
CN111709311B (zh) 一种基于多尺度卷积特征融合的行人重识别方法
CN106557774B (zh) 多通道核相关滤波的实时跟踪方法
CN108304873A (zh) 基于高分辨率光学卫星遥感影像的目标检测方法及其系统
CN106909887A (zh) 一种基于cnn和svm的动作识别方法
CN105574510A (zh) 一种步态识别方法及装置
CN106650806A (zh) 一种用于行人检测的协同式深度网络模型方法
CN106650690A (zh) 基于深度卷积‑反卷积神经网络的夜视图像场景识别方法
CN103854016B (zh) 基于方向性共同发生特征的人体行为分类识别方法及系统
CN102521616B (zh) 基于稀疏表示的行人检测方法
CN108154102A (zh) 一种道路交通标志识别方法
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN105913053B (zh) 一种基于稀疏融合的单演多特征的人脸表情识别方法
CN107301376B (zh) 一种基于深度学习多层刺激的行人检测方法
CN104680193B (zh) 基于快速相似性网络融合算法的在线目标分类方法与系统
CN105760858A (zh) 一种基于类Haar中间层滤波特征的行人检测方法及装置
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
CN106874825A (zh) 人脸检测的训练方法、检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190528

Termination date: 20201103

CF01 Termination of patent right due to non-payment of annual fee