CN103198332B - 一种实时鲁棒的远红外车载行人检测方法 - Google Patents

一种实时鲁棒的远红外车载行人检测方法 Download PDF

Info

Publication number
CN103198332B
CN103198332B CN201310104777.8A CN201310104777A CN103198332B CN 103198332 B CN103198332 B CN 103198332B CN 201310104777 A CN201310104777 A CN 201310104777A CN 103198332 B CN103198332 B CN 103198332B
Authority
CN
China
Prior art keywords
pedestrian
sample
grader
training
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310104777.8A
Other languages
English (en)
Other versions
CN103198332A (zh
Inventor
刘琼
庄家俊
王国华
魏澄
廖永贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201310104777.8A priority Critical patent/CN103198332B/zh
Publication of CN103198332A publication Critical patent/CN103198332A/zh
Application granted granted Critical
Publication of CN103198332B publication Critical patent/CN103198332B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种实时鲁棒的远红外车载行人检测方法。该方法利用像素梯度的垂直投影捕捉输入图像中潜在的行人预选区域,采用局部阈值化方法和形态学后处理技术从行人预选区域中搜索感兴趣区域;提取多级熵加权梯度方向直方图特征描述感兴趣区域并输入支持向量机行人分类器进行在线感兴趣区域判断,通过多帧校验筛选行人分类器判断结果实现行人检测。根据样本高度分布划分训练样本空间,构建三分支结构的分类框架;结合自举法和提前终止法迭代收集困难样本和训练行人分类器。本发明不仅提高了行人检测的准确率,还能降低虚警率、改善输入图像处理速度和分类器泛化能力,提供了一种有效的夜间车载辅助行人预警方法。

Description

一种实时鲁棒的远红外车载行人检测方法
技术领域
本发明涉及计算机视觉与模式识别、智能交通系统(intelligent transportation systems, ITS)领域,具体为一种基于远红外视频的车载行人检测方法。
背景技术
汽车驾驶辅助系统中的车载行人检测是智能交通系统的一个重要组成部分,该研究主题直接来源于社会与市场需求,具有较好的应用前景和市场价值。因夜间所致机动车辆交通事故而造成的人员伤亡约为白天的3~4倍(C. Fors, S.-O. Lundkvist, Night-time trafficin urban areas: a literature review on road useraspects, Technical Report, VTI rapport 650A, 2009)。
公路运输在我国综合运输市场中发挥着举足轻重的作用,承担着90%以上的份额。随着汽车市场的快速发展和安防意识的日益强化,人们对汽车安全保障技术的需求越来越高。在雨夜、雪天或大雾等能见度较低的情况下,现有汽车照明系统视距不远、效果不佳的弊端已成为汽车行驶的安全隐患之一;减少道路交通事故和人员伤亡已成为全社会广为关注的问题。
探索车载夜间行人检测方法尤为迫切。目前,基于远红外探测器的车载夜间行人检测辅助系统已被少数发达国家应用于高档豪华轿车,在国内,已有相关的技术研究和少量应用,但是,不仅缺乏系统的基础性工作,而且多个技术挑战亟待解决。
红外行人检测方法主要包括感兴趣区域提取和行人识别两个部分。根据行人目标区域往往比背景亮度高的特点,提取红外图像的感兴趣区域通常首选阈值分割法。全局阈值分割法(如M. Bertozzi, A. Broggi, C.H. Gomez, R.I. Fedriga, G. Vezzoni, M. DelRose, Pedestrian detection in far infrared images based on the use of probabilistic templates, in: Proceedings of IEEE Intelligent Vehicles Symposium, 2007)计算简单,执行速度快,但未能较好处理不同图像帧的行人目标在外观表象上的差异,经常导致目标分割结果不完整。为此,出现了更为鲁棒的局部阈值分割法(如J.F. Ge, Y.P. Luo, G.M. Tei, Real-time pedestrian detection and tracking at nighttime for driver-assistance systems, IEEE Transactions on Intelligent Transportation Systems, 2009),这类方法通过局部邻域像素的灰度统计分布规律确定每一个像素的划分阈值。受可见光图像中滑窗方法的启发,Sun(H. Sun, C. Wang, B.L. Wang, N.El-Sheimy, Pyramid binary pattern features for real-time pedestrian detection from infrared videos, Neurocomputing, 2011)针对基于红外视频的实时行人检测提出一种局部滑窗法,通过扫描图像中的关键点,在所有关键点邻域范围内利用滑窗法搜索行人候选区域。
然而,已有的感兴趣区域提取方法大多针对整个图像空间进行搜索,搜索空间较大造成计算开销较高,直接影响检测系统的实时性。即使利用了局部滑窗法,关键点的提取仍然依赖于对整幅输入图像进行扫描,获得关键点数量也较为可观,时间开销问题仍然未得到较好解决。
常用的行人识别方法主要分为模板匹配法和学习判别法。模板匹配法(如D. Olmeda, A. de la Escalera, J.M. Armingol, Detection and tracking of pedestrians in infrared images,in: Proceedings of International Conference on Signals, Circuits and Systems, 2009)通过归纳表征行人的外观模式、运动规律和特征的判断规则或描述性知识,构造相应的行人模板,进而采用这些模板对感兴趣区域进行匹配识别。学习判别法(如R. O'Malley, E. Jones, M. Glavin, Detection of pedestrians in far-infrared automotive night vision using region-growing and clothing distortion compensation, Infrared Physics & Technology, 2010)结合不同的行人描述特征和学习算法,对大量样本进行学习获得行人分类器,再利用行人分类器进行在线行人识别。
在模板匹配法中,由于行人外观模式和某些规律、特征的多变性和复杂性,对其进行归纳、描述的准确程度受到限制,很难设计鲁棒可行的行人模板库,且规模庞大的行人模板库将明显增加识别环节的计算开销,影响检测系统的实时性。所以一个时期以来,学习判别法较为流行,这类方法利用行人和背景在外观表象方面体现出来的统计规律,通过提取目标的抽象特征,离线训练行人分类器,从而对在线感兴趣区域进行判断。
在学习判别法中,行人目标的特征表示方法对行人识别效果有显著性影响。梯度方向直方图特征能够有效描述行人的局部边缘轮廓特性,能够在一定程度上保证行人检测的准确率,已成为目前行人检测的主流特征提取方法之一(D. Gerónimo, A.M. López, A.D. Sappa, T. Graf, Survey of pedestrian detection for advanced driver assistance systems, IEEE Transactions onPattern Analysis and Machine Intelligence, 2010)。然而,不同于可见光图像中的行人目标,远红外图像中的行人目标一般具有较为显著的边缘轮廓,但缺乏丰富的内部纹理信息;梯度方向直方图特征长于描述目标的局部形状特征,而不擅提取目标内部的纹理特征。传统的梯度方向直方图特征多半有效描述了红外行人目标的边缘轮廓区域;但是,尚未涉及深入针对红外图像的特性和梯度方向直方图特征不擅提取目标纹理信息的特性,进一步发掘强化梯度方向直方图特征对红外行人的表征能力的新方法。
支持向量机和各类boosting方法(D. Gerónimo, A.M. López,A.D. Sappa, T. Graf, Survey of pedestrian detectionfor advanced driver assistance systems, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010)是行人检测中经常使用的学习算法。但是,行人分类器的离线训练机制的研究(S. Walk, N. Majer, K. Schindler, B. Schiele, New features and insights for pedestrian detection, in: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2010)目前尚未得到足够重视。研究表明,在初始训练样本集和判别规则已经确定的前提下,训练机制将影响行人分类器的泛化能力。尤其对于汽车驾驶辅助系统中行人检测这类开放性的目标检测问题,行人和背景模式都存在由大范围的外观/尺度变化等因素造成的差异性,仅通过简单方式获取训练样本集,而对样本集容量的选取、样本的代表性考虑尚缺乏充分的依据,分类器泛化能力明显受到影响。
综上所述,尽管目前的红外车载行人检测方法已经初有成效,但在检测准确率、检测效率和鲁棒性方面仍然迫切需要进一步改进。
发明内容
本发明的在于提供一种实时鲁棒的远红外车载行人检测方法,旨在促进解决已有的远红外行人检测方法的检测准确率不达标和/或不尽如人意、实时性需要提高、鲁棒性不强等问题,改善夜间车载行人检测系统的可用性。
一种实时鲁棒的远红外车载行人检测方法,其包括如下步骤:
(1)通过基于像素梯度垂直投影法捕捉输入图像序列中的行人预选区域;
(2)采用局部阈值化方法和形态学后处理技术从行人预选区域中提取感兴趣区域 (regions of interest, ROIs);
(3)提取多级熵加权梯度方向直方图特征(pyramid entropy weighted histograms of oriented gradients, PEWHOG)描述感兴趣区域;
(4)利用支持向量机(support vector machine, SVM)算法离线训练行人分类器;
(5)利用行人分类器在线判断感兴趣区域,并通过多帧校验方法筛选行人分类器的判断结果,实现行人检测。
进一步的,步骤(1)所述行人预选区域通过以下方法获得:利用远红外图像中行人垂直边缘区域呈现像素灰度快速变化的特性,通过基于像素梯度的垂直投影捕捉输入图像中亮度发生突变的区域作为行人预选区域,改善提取感兴趣区域的实时性。
进一步的,步骤(2)所述局部阈值化方法是根据输入图像中每个像素水平邻域的像素灰度值的统计特性确定划分阈值,对输入图像进行二值化处理得到二值图像;步骤(2)所述形态学后处理技术具体是通过形态学腐蚀运算滤除二值图像中的噪声像素,并利用形态学膨胀运算填补弱连接区域(weakly connected regions),再利用8-连通标记法提取所述二值图像中的所有连通区域作为感兴趣区域。
进一步的,步骤(4)所述离线训练行人分类器具体指:收集含有行人的图片样本和仅含有背景的图片样本构成训练样本空间,根据所述含有行人的图片样本的三个高度区间划分训练样本空间,构成三个互不相交的训练子集;所述高度是指含有行人的图片样本在垂直方向上包含的像素数;分别提取各个训练子集的多级熵加权梯度方向直方图特征,采用迭代收集困难样本的训练机制对各个训练子集进行学习;所述学习采用基于直方图交叉核 (histogram intersection kernel,HIK)的支持向量机学习算法,获得三分支结构的支持向量机行人分类器。
进一步的,通过手工裁剪和/或步骤(1)~步骤(2)所述的方法获取含有行人的图片样本和仅含有背景的图片样本,组成所述训练样本空间;所有图片样本的高度均大于或等于12个像素:高度大于或等于64个像素的归为近距离样本子集,并将近距离样本子集中的样本尺度调整为32像素×80像素;高度大于或等于32个像素且小于64个像素的归为中等距离样本子集,并将中距离样本子集中的样本尺度调整为24像素×64像素;其余归为远距离样本子集,并将远距离样本子集中的样本尺度调整为12像素×32像素;所述尺度调整均采用双线性插值法实现。
进一步的,在多种单元格(cell)粒度划分方式下提取熵加权梯度方向直方图特征(entropy weighted histograms of oriented gradients, EWHOG),通过并接方式组成步骤(3)所述的多级熵加权梯度方向直方图特征;所述多种单元格(cell)粒度划分方式是指通过由粗到细的分级方式对图片样本进行单元格划分;步骤(3)所述多级熵加权梯度方向直方图特征用于显著表征远红外行人边缘轮廓的空间分布特性;所述熵加权梯度方向直方图特征是利用信息熵对经典梯度方向直方图特征 (histograms of oriented gradients, HOG)中不同块(block)提供的梯度方向直方图特征分量进行加权得到的特征。
进一步的,所述迭代收集困难样本的训练机制为:行人分类器的离线训练过程结合自举法(bootstrapping)和提前终止法(early-stoppingstrategy),迭代收集困难样本并进行行人分类器训练,当行人分类器在验证集上的全局分类准确率的增量小于预定的阈值时停止迭代过程;所述迭代指反复收集困难样本和调整分类器的决策超平面,输出泛化能力较强的行人分类器;所述验证集为与训练集不相交的图片样本集和/或视频集;所述验证集与训练集均属于图片样本集;所述视频集是包含客观标准的视频集,且训练集不从这个视频集中获取。
进一步的,步骤(5)分两步实现行人检测,第一步是利用行人分类器在线判断感兴趣区域,第二步是通过多帧校验方法筛选行人分类器的判断结果;所述通过多帧校验方法筛选行人分类器的判断结果是指:对连续多帧图像中均出现的同一目标且被行人分类器连续判断为行人的结果给予保留,而对连续多帧图像中均出现的同一目标而未被行人分类器连续判断为行人的结果给予排除。
与现有远红外夜间车载行人检测技术相比,本发明具有如下优点和效果:本发明的步骤(1)和步骤(2)所述的方法既能够更准确地搜索感兴趣区域,又能明显提高感兴趣区域提取阶段的处理速度;步骤(3)所述的多级熵加权梯度方向直方图特征能够更为精细地描述远红外行人目标,明显提高远红外行人检测的准确率;行人分类器的离线迭代训练机制有利于收集难以通过手工方式获得的困难负样本,有效改善行人分类器的鲁棒性;且这种迭代训练机制适合但不限于远红外夜间车载行人检测分类器的训练过程。本发明行人分类器的训练过程在两个独立的远红外视频集上进行,分别用作产生困难样本的原始视频集和验证视频集,两个视频集中都包含经人工标记的客观标准(ground truth)。因此,该方法并非单纯依赖通过人工收集和/或随机筛选的正负图片样本集产生困难样本,由此可以避免人工收集和/或随机筛选的样本过于简单而无助于提高行人分类器的鲁棒性的问题。
本发明的另一个优势在于不仅能检测处于静止、行走或者跑步等运动方式下的直立行人,还适合检测骑自行车或摩托车的人体。
附图说明
图1为实施方式中远红外车载行人检测方法的原理流程实施例图。
图2为实施方式中提取多级熵加权梯度方向直方图特征过程中由粗到细进行多级单元格多粒度划分的实施例示意图。
图3为实施方式中基于熵加权梯度方向直方图特征EWHOG、多级熵加权梯度方向直方图特征PEWHOG,以及基于经典梯度方向直方图特征HOG的描述方法下行人分类器分类效果的接收器工作曲线(receiver operating characteristic, ROC)对比实施例图。
图4为实施方式中三分支结构支持向量机行人分类器的结构实施例图。
图5a为实施方式中迭代训练机制下迭代次数与系统性能之间的关系实施例图。
图5b为实施方式中迭代训练机制下迭代次数与总的误检次数之间的关系实施例图。
图6a为实施方式中一帧原始输入图像的实施例图。
图6b为实施方式中图6a所示输入图像的二值梯度图像的实施例图。
图6c为实施方式中所得梯度垂直投影曲线实施例图。
图6d为实施方式中所得行人预选区域实施例图。
图6e为实施方式中经局部阈值化方法和形态学后处理技术处理后的二值分割结果实施例图。
图6f为实施方式中感兴趣区域ROIs的提取结果实施例图。
具体实施方式
以下结合附图给出详细的实施例操作过程。附图所示实施例以本发明技术方案为前提,附图所述的实施例属于但不限于本发明保护范围。
本发明方法的整体流程如图1所示,本发明方法主体包括两部分:行人分类器的离线训练和行人的在线检测。
(1)行人分类器的离线训练
训练样本准备:所有训练样本均取自实拍的远红外视频,其中,为数约1/2的训练样本通过人工裁剪的方式从远红外视频中获得,其余训练样本通过本发明步骤(1)和步骤(2)所述的方法获得,所有训练样本均为图片样本,其中,正样本为包含行人的图片样本,具体为处于静止、行走或者跑步等运动状态的直立行人或骑自行车/摩托车的人体;负样本为仅包含背景的图片样本。
根据正样本高度区间将训练样本空间划分为三个互不相交的子空间(训练子集),并分别采用双线性插值法对图片样本进行相应的尺度调整。所有训练样本高度均大于或等于12个像素,所述训练样本高度是指图片样本在垂直方向上包含的像素数。高度大于或等于64个像素的归为近距离训练样本子集,并将该子集中的样本尺度调整为32像素×80像素;高度大于或等32个像素且小于64个像素的归为中等距离训练样本子集,并将该子集中的样本尺度调整为24像素×64像素;其余归为远距离训练样本子集,并将该子集中的样本尺度调整为12像素×32像素。
(2)提取所有样本的多级熵加权梯度方向直方图特征
在计算经典的梯度方向直方图特征的基础上,利用熵(entropy)的概念对局部块(block)内像素梯度的分布特性进行描述,并以此作为权重对相应块(block)提供的梯度方向直方图特征分量进行加权。第k个块(block)提供的熵Wk
W k = - Σ m = 1 c × r P m log 2 P m - - - ( 1 )
P m = h m / Σ m = 1 c × r h m - - - ( 2 )
其中,hm为第k个块(block)内提取的梯度方向直方图特征分量在第m个维度上的特征值,c为该块(block)内包含的单元格(cell)数目,r为每个单元格(cell)中划分的梯度方向区间数(bins),m为方向梯度直方图特征分量维度的序号(m=1,2, …, c×r)。熵Wk的计算需在局部梯度方向直方图特征分量归一化之前完成,而熵的加权计算则在局部梯度方向直方图特征分量归一化之后完成。梯度方向直方图特征计算步骤中的三线性插值可能避免产生稀疏特征向量,但是,这里仍规定,若Pm=0,有
Pmlog2Pm=0(3)
梯度方向直方图特征能够表征目标的局部形状特性,但并不表征目标内部的纹理特征,故源自目标边缘轮廓区域的梯度方向直方图特征分量是最为有效的区分特征;而远红外行人通常具有较为显著的边缘轮廓,而缺乏丰富的纹理信息。为此,引入信息熵描述目标局部区域的梯度分布特性,即利用目标局部区域携带的信息熵加权从该区域提取的梯度方向直方图特征分量,组成熵加权梯度方向直方图特征EWHOG,以提高经典梯度方向直方图特征对远红外目标局部边缘形状的描述能力。同时在此基础上引入由粗到细分级的多单元格粒度划分方式,逐一提取多种单元格粒度划分方式下的熵加权梯度方向直方图特征,将不同单元格粒度划分下得到的熵加权梯度方向直方图特征通过并接的方式组成多级熵加权梯度方向直方图特征。
图2为本实施例中所采用的分级单元格多粒度划分方式示意图,图2(a)为原始行人图片样本示例,图2(b)~图2(d)为由粗到细的三级单元格多粒度划分方式实施例。
图3为利用多级熵加权梯度方向直方图特征在自行拍摄/整理的远红外行人数据库上采用操作者接受特性曲线进行分类效果验证评价的实施例图。
图3为本发明基于熵加权梯度方向直方图特征EWHOG、多级熵加权梯度方向直方图特征PEWHOG,以及基于经典梯度方向直方图特征HOG的描述方法下的接收器工作曲线(receiver operating characteristic,ROC)对比图;以作为对行人分类器的分类效果进行验证和评价的实施例;所述方法分别对自行采集的远红外行人数据进行描述和分类。
(3)训练行人分类器
分别从三个训练子集中提取样本的多级熵加权梯度方向直方图特征后,采用基于直方图交叉核的支持向量机学习算法分别训练三个子分类器。本发明行人分类器的训练过程结合了自举法(bootstrapping)和提前终止法的迭代训练机制,该机制适合收集困难样本,从而增强行人分类器的鲁棒性。
具体迭代过程即通过当前行人分类器在原始视频集中搜索被错分的样本,将其作为新增训练样本并再次训练行人分类器,从而调整支持向量机行人分类器的决策超平面;提前终止法旨为上述迭代过程提供终止判定条件,当所得行人分类器在验证集上的全局分类准确率的当前值增量小于预定阈值时终止迭代训练过程,并输出行人分类器。其中,验证集必须与训练样本集和/或原始视频互不相交;以此类推,得到三分支结构的支持向量机行人分类器。图4所示是三分支结构的支持向量机行人分类器的具体实施例。
图5为利用本发明提出的迭代收集困难样本的训练机制所得的训练效果实施例图,其中,图5a为实施方式中迭代训练机制下迭代次数与系统性能之间的关系实施例图;图5b为实施方式中迭代训练机制下迭代次数与总的误检次数之间的关系实施例图。
本实施例中采用自定义的加权准确率(weighted accuracy, WA),加权准确率的计算公式如式(4)所示。
WA=ωTp+(1-ω)Tn(4)
其中,Tp和Tn分别代表行人分类器在验证集上测试得到的检测率和虚警率(亦称误检率),ω为权重系数,且0<ω<1,用于平衡Tp和Tn,图5所示的实施例中取ω=0.5。
值得注意的是,本发明在迭代收集困难样本的训练机制适合收集难以通过人工方式收集的困难负样本。而本发明行人分类器的训练过程是在两个独立的远红外视频集上进行的,这两个视频集分别用作产生困难样本的原始视频集和验证视频集,两个视频集中都包含经人工标记的客观标准(ground truth)。因此,该方法并非单纯依赖通过人工收集和/或随机筛选的正负图片样本集产生困难样本,由此可以避免人工收集和/或随机筛选的样本过于简单而无助于提高行人分类器的鲁棒性的问题。
梯度方向直方图特征本质上属于一类直方图特征,直方图交叉核可有效地反映两个d维直方图特征向量x和z之间的相似度,本发明采用直方图交叉核作为支持向量机的映射函数,其表达如式(5)所示。
K ( x , z ) = &Sigma; i = 1 d min ( x ( i ) , z ( i ) ) - - - ( 5 )
(4)行人的在线检测
(4.1)感兴趣区域的提取
读入远红外视频数据的一帧图像,利用本发明步骤(1)和步骤(2)所述的方法提取该图像中所有的感兴趣区域,具体实施流程如下:
1)对一帧输入图像,计算其梯度图像,本实施例中采用中心对称的一阶差分掩膜,如计算水平方向的梯度分量时所用的掩膜为[−1,0,1]。图6a为实施方式中一帧原始输入图像的实施例图。
2)为所得梯度图像设定一个像素梯度归类阈值Tg,在本实施例中取Tg=20,用于抑制输入图像中灰度平坦区域,得到一个二值梯度图像。图6b为实施方式中图6a所示输入图像的二值梯度图像的实施例图。
3)将所得二值梯度图像向垂直方向投影,得到梯度垂直投影曲线,图6c为实施方式中所得梯度垂直投影曲线实施例图。该曲线统计了所得二值梯度图像中垂直方向上每一列存在的像素数xi, i=1,2,..,l,其中,l为输入图像的宽度,所述宽度是指输入图像在水平方向上包含的像素数,即为所得梯度垂直投影曲线拥有的列数。
4)为了适当抑制干扰边缘的影响,根据所得的梯度垂直投影曲线,检查该曲线上的每一列,剔除统计像素数目少于Ts的图像列, Ts通过式(6~7)获得,其中,λ为权系数,本实施例中取λ=1.1,图6(c)中所示的水平点划线即为所得的Ts
T s = &lambda; 1 l &Sigma; i = 1 l ( x i - &mu; x ) 2 - - - ( 6 )
&mu; x = 1 l &Sigma; i = 1 l x i - - - ( 7 )
5)搜索梯度投影曲线中的各个波峰,所述波峰是指取值大于Ts的连续曲线段 (即所有波峰均位于如图6c所示的点划线上方),记录所有波峰曲线的位置,提取其所对应的原始输入图像区域作为行人预选区域,图6d为实施方式中所得行人预选区域实施例图(也即图6d为图6a所示输入图像的行人预选区域);特别指出,由于行人预选区域应满足一定宽度w的限制,因此本发明不考虑宽度小于w的波峰曲线。w由离线训练阶段正样本宽度的统计分布规律确定,所述宽度是指图片样本在水平方向上包含的像素数,本实施例中直接取训练样本中最小的正样本宽度作为w的取值。
6)在上一步获得的行人预选区域中,采用局部阈值化方法和形态学后处理技术提取感兴趣区域。本发明为行人预选区域中的每个像素I(i,j)分别计算两个分割阈值,即高阈值TH和低阈值TL,其值由该像素局部水平邻域的像素灰度统计特性获得,详见式(8~10)。
T L ( i , j ) = &Sigma; s = i - a i + a I ( s , j ) / ( 2 a + 1 ) - - - ( 8 )
TH(i,j)=TL(i,j)+λσ(i,j)(9)
&sigma; ( i , j ) = 1 2 a + 1 &Sigma; s = i - a i + a [ I ( s , j ) - T L ( i , j ) ] 2 4 - - - ( 10 )
其中,a为该像素局部水平邻域的半宽度,I′(i,j)为对该像素的二值分割结果,通过式(11)获得。在所得二值图像上首先通过形态学腐蚀运算滤除部分噪声像素,继而利用形态学膨胀运算填补图像中的弱连接区域(weakly connected regions),图6e为实施方式中经局部阈值化方法和形态学后处理技术处理后的二值分割结果实施例图。继而采用8-连通标记从所得分割结果图中提取连通区域,并选取满足一定宽高比分布规律且高度大于或等于12个像素的连通区域为感兴趣区域,本实施例由正样本集的宽高比分布情况确定。图6f为实施方式中感兴趣区域ROIs的提取结果实施例图。
(4.2)模式分类
基于所得感兴趣区域的高度,根据所述训练样本准备方法对所得感兴趣区域进行尺度调整,提取其多级熵加权梯度方向直方图特征,并输入由所得行人分类器进行判断。若判断结果为真,相应感兴趣区域的标记值L将自动增加1。
(4.3)多帧校验
在连续多帧图像中均出现的同一目标如果能够被行人分类器连续判断为真,则给予保留,而在连续多帧图像中均出现的同一目标如果未能够被行人分类器连续判断为真,则给予排除,通过上述多帧校验裁决行人分类器的判断结果以实现行人检测。实施例即:若某感兴趣区域对应的连续帧标记值L大于某预设值,例如:5,即表明行人分类器在连续5帧图像中对该感兴趣区域的判断结果具有一致性,则认为该感兴趣区域中确实存在行人,在当前帧输入图像的相应位置用矩形框标识出目标。
转向下一帧图像并重复上述处理流程,以此类推。
由于当今的交通工具和道路设施越来越发达,交通状况的复杂度也随之增大,而相对地,驾驶员的信息判断能力却越来越受到局限,尤其在视野受到较大限制的夜间,这样便造成了交通事故频发,驾驶员和行人的安全受到威胁的现状。本发明为车载驾驶辅助系统提供一种实时鲁棒的夜间行人检测方法,有助于在夜间或光照不足的场景中利用远红外探测器对行人进行检测,防患于未然,避免或减少夜间交通事故的发生,辅助保障行人和驾驶员的生命财产安全。
上述内容是结合具体的实施方式对本发明进行的详细说明,但并不能认定本发明的具体实施只限于这些内容。对于本发明所属技术领域的普通技术人员而言,在不脱离本发明的原理和精神的前提下,还可以对这些实施进行若干调整、修改、替换和/或变型,本发明的保护范围由所附权利要求及其等同内容限定。

Claims (7)

1.一种实时鲁棒的远红外车载行人检测方法,其特征在于包括如下步骤:
(1)通过基于像素梯度垂直投影法捕捉输入图像序列中的行人预选区域;
(2)采用局部阈值化方法和形态学后处理技术从行人预选区域中提取感兴趣区域(regions of interest,ROIs);
(3)提取多级熵加权梯度方向直方图特征(pyramid entropy weighted histograms of oriented gradients,PEWHOG)描述感兴趣区域;多种单元格(cell)粒度划分方式下提取熵加权梯度方向直方图特征(entropy weighted histograms of oriented gradients,EWHOG),通过并接方式组成所述的多级熵加权梯度方向直方图特征;所述多种单元格(cell)粒度划分方式是指通过由粗到细的分级方式对图片样本进行单元格划分;所述多级熵加权梯度方向直方图特征用于显著表征远红外行人边缘轮廓的空间分布特性;所述熵加权梯度方向直方图特征是利用信息熵对经典梯度方向直方图特征(histograms of oriented gradients,HOG)中不同块(block)提供的梯度方向直方图特征分量进行加权得到的特征;在计算经典的梯度方向直方图特征的基础上,利用熵(entropy)的概念对局部块(block)内像素梯度的分布特性进行描述,并以此作为权重对相应块(block)提供的梯度方向直方图特征分量进行加权 ;第k个块(block)提供的熵Wk
其中,hm为第k个块(block)内提取的梯度方向直方图特征分量在第m个维度上的特征值,c为该块(block)内包含的单元格(cell)数目,r为每个单元格(cell)中划分的梯度方向区间数(bins),m为方向梯度直方图特征分量维度的序号(m=1,2,…,c×r);熵Wk的计算需在局部梯度方向直方图特征分量归一化之前完成,而熵的加权计算则在局部梯度方向直方图特征分量归一化之后完成;梯度方向直方图特征计算步骤中的三线性插值可能避免产生稀疏特征向量,但是,这里仍规定,若Pm=0,有
Pmlog2Pm=0 (3);
(4)利用支持向量机(support vector machine,SVM)算法离线训练行人分类器;
(5)利用行人分类器在线判断感兴趣区域,并通过多帧校验方法筛选行人分类器的判断结果,实现行人检测。
2.根据权利要求1所述实时鲁棒的远红外车载行人检测方法,其特征在于,步 骤(1)所述行人预选区域通过以下方法获得:利用远红外图像中行人垂直边缘区域呈现像素灰度快速变化的特性,通过基于像素梯度的垂直投影捕捉输入图像中亮度发生突变的区域作为行人预选区域,改善提取感兴趣区域的实时性。
3.根据权利要求1所述实时鲁棒的远红外车载行人检测方法,其特征在于,步骤(2)所述局部阈值化方法是根据输入图像中每个像素水平邻域的像素灰度值的统计特性确定划分阈值,对输入图像进行二值化处理得到二值图像;步骤(2)所述形态学后处理技术具体是通过形态学腐蚀运算滤除二值图像中的噪声像素,并利用形态学膨胀运算填补弱连接区域(weakly connected regions),再利用8-连通标记法提取所述二值图像中的所有连通区域作为感兴趣区域。
4.根据权利要求1所述实时鲁棒的远红外车载行人检测方法,其特征在于,步骤(4)所述离线训练行人分类器具体指:收集含有行人的图片样本和仅含有背景的图片样本构成训练样本空间,根据所述含有行人的图片样本的三个高度区间划分训练样本空间,构成三个互不相交的训练子集;所述高度是指含有行人的图片样本在垂直方向上包含的像素数;分别提取各个训练子集的多级熵加权梯度方向直方图特征,采用迭代收集困难样本的训练机制对各个训练子集进行学习;所述学习采用基于直方图交叉核(histogram intersection kernel,HIK)的支持向量机学习算法,获得三分支结构支持向量机行人分类器。
5.根据权利要求4所述实时鲁棒的远红外车载行人检测方法,其特征在于通过手工裁剪和/或步骤(1)~步骤(2)所述的方法获取含有行人的图片样本和仅含有背景的图片样本,组成所述训练样本空间;所有图片样本的高度均大于或等于12个像素:高度大于或等于64个像素的归为近距离样本子集,并将近距离样本子集中的样本尺度调整为32像素×80像素;高度大于或等于32个像素且小于64个像素的归为中等距离样本子集,并将中距离样本子集中的样本尺度调整为24像素×64像素;其余归为远距离样本子集,并将远距离样本子集中的样本尺度调整为12像素×32像素;所述尺度调整均采用双线性插值法实现。
6.根据权利要求4所述实时鲁棒的远红外车载行人检测方法,其特征在于所述迭代收集困难样本的训练机制为:行人分类器的离线训练过程结合自举法(bootstrapping)和提前终止法(early-stopping strategy),迭代收集困难样本并进行行人分类器训练,当行人分类器在验证集上的全局分类准确率的增量小于预定的阈 值时停止迭代过程;所述迭代指反复收集困难样本和调整分类器的决策超平面,输出泛化能力较强的行人分类器;所述验证集为与训练集不相交的图片样本集和/或视频集。
7.根据权利要求1所述实时鲁棒的远红外车载行人检测方法,其特征在于,步骤(5)分两步实现行人检测,第一步是利用行人分类器在线判断感兴趣区域,第二步是通过多帧校验方法筛选行人分类器的判断结果;所述通过多帧校验方法筛选行人分类器的判断结果是指:对连续多帧图像中均出现的同一目标且被行人分类器连续判断为行人的结果给予保留,而对连续多帧图像中均出现的同一目标而未被行人分类器连续判断为行人的结果给予排除。
CN201310104777.8A 2012-12-14 2013-03-28 一种实时鲁棒的远红外车载行人检测方法 Expired - Fee Related CN103198332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310104777.8A CN103198332B (zh) 2012-12-14 2013-03-28 一种实时鲁棒的远红外车载行人检测方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201210546333 2012-12-14
CN2012105463335 2012-12-14
CN201210546333.5 2012-12-14
CN201310104777.8A CN103198332B (zh) 2012-12-14 2013-03-28 一种实时鲁棒的远红外车载行人检测方法

Publications (2)

Publication Number Publication Date
CN103198332A CN103198332A (zh) 2013-07-10
CN103198332B true CN103198332B (zh) 2016-08-03

Family

ID=48720863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310104777.8A Expired - Fee Related CN103198332B (zh) 2012-12-14 2013-03-28 一种实时鲁棒的远红外车载行人检测方法

Country Status (1)

Country Link
CN (1) CN103198332B (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5886809B2 (ja) * 2013-09-27 2016-03-16 富士重工業株式会社 車外環境認識装置
KR101543105B1 (ko) * 2013-12-09 2015-08-07 현대자동차주식회사 보행자 인식 장치 및 그의 처리 방법과 이를 지원하는 차량
CN103886286A (zh) * 2014-03-11 2014-06-25 奇瑞汽车股份有限公司 车辆的检测方法及装置
CN103984965A (zh) * 2014-04-10 2014-08-13 杭州电子科技大学 基于多分辨率特征关联的行人检测方法
CN104952060B (zh) * 2015-03-19 2017-10-31 杭州电子科技大学 一种红外行人感兴趣区域自适应分割提取方法
KR101569411B1 (ko) * 2015-04-01 2015-11-27 주식회사 피엘케이 테크놀로지 보행자 인식 장치 및 그 방법
CN105187785B (zh) * 2015-08-31 2018-05-11 桂林电子科技大学 一种基于动态选取显著特征的跨卡口行人识别系统与方法
CN105303159A (zh) * 2015-09-17 2016-02-03 中国科学院合肥物质科学研究院 一种基于显著性特征的远红外行人检测方法
CN105260712B (zh) * 2015-10-03 2019-02-01 上海大学 一种车辆前方行人检测方法及系统
CN105404857A (zh) * 2015-11-04 2016-03-16 北京联合大学 一种基于红外的夜间智能车前方行人检测方法
CN105787456A (zh) * 2016-03-02 2016-07-20 江苏大学 一种夜间远红外图像中的行人检测方法
CN106022279A (zh) * 2016-05-26 2016-10-12 天津艾思科尔科技有限公司 一种视频图像中里切克检测的方法及系统
CN106096499A (zh) * 2016-05-26 2016-11-09 天津艾思科尔科技有限公司 一种视频图像中星月图案检测的方法及系统
CN106407926B (zh) * 2016-09-09 2019-09-20 东软集团股份有限公司 一种行人检测方法及装置
GB201621438D0 (en) * 2016-12-16 2017-02-01 Trw Ltd Method of determining the boundary of drivable space
CN109241985B (zh) * 2017-07-11 2021-05-25 普天信息技术有限公司 一种图像识别方法及装置
CN108509262B (zh) * 2018-03-19 2022-03-29 华南理工大学 面向车载行人检测系统的dm6437软件结构设计方法
CN108681691A (zh) * 2018-04-09 2018-10-19 上海大学 一种基于无人水面艇的海上船艇快速检测方法
CN108921056A (zh) * 2018-06-18 2018-11-30 上海大学 基于神经网络面向汽车辅助驾驶的行人检测方法
CN109671090B (zh) * 2018-11-12 2024-01-09 深圳佑驾创新科技股份有限公司 基于远红外线的图像处理方法、装置、设备和存储介质
CN109784216B (zh) * 2018-12-28 2023-06-20 华南理工大学 基于概率图的车载热成像行人检测RoIs提取方法
CN109886133B (zh) * 2019-01-25 2020-11-03 北京市遥感信息研究所 一种基于光学遥感图像的船只检测方法及系统
CN110211323A (zh) * 2019-05-29 2019-09-06 广州澳盾智能科技有限公司 基于级联分类的森林火灾识别方法
CN110837769B (zh) * 2019-08-13 2023-08-29 中山市三卓智能科技有限公司 一种图像处理与深度学习的嵌入式远红外行人检测方法
CN110490116A (zh) * 2019-08-13 2019-11-22 广州三木智能科技有限公司 一种选择性搜索与机器学习分类的远红外行人检测方法
CN110866534B (zh) * 2019-08-13 2023-09-12 广州三木智能科技有限公司 一种梯度幅度分布梯度朝向直方图的远红外行人训练方法
CN110706235B (zh) * 2019-08-30 2023-05-23 华南农业大学 一种基于双级级联分割的远红外行人检测方法
CN110598654B (zh) * 2019-09-18 2022-02-11 合肥工业大学 多粒度交叉模态特征融合行人再识别方法和再识别系统
CN110826396B (zh) * 2019-09-18 2022-04-22 云知声智能科技股份有限公司 一种视频中眼睛状态检测方法及装置
CN111311507B (zh) * 2020-01-21 2022-09-23 山西大学 基于多粒度合作网络的极低光成像方法
CN111382718B (zh) * 2020-03-17 2023-08-11 电子科技大学中山学院 一种夜间行人检测系统及基于该系统的行人检测方法
CN112819988A (zh) * 2020-12-25 2021-05-18 朗坤智慧科技股份有限公司 基于5g的无人机电站智能巡检方法、系统和网络侧服务端
CN113129337B (zh) * 2021-04-14 2022-07-19 桂林电子科技大学 背景感知跟踪方法、计算机可读存储介质及计算机设备
CN113815531A (zh) * 2021-10-28 2021-12-21 贵州省交通规划勘察设计研究院股份有限公司 一种夜间道路行人智能检测车载装置及检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102147869A (zh) * 2011-03-31 2011-08-10 上海交通大学 基于前景分析和模式识别的行人检测方法
CN102722712A (zh) * 2012-01-02 2012-10-10 西安电子科技大学 基于连续度的多尺度高分辨图像目标检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102147869A (zh) * 2011-03-31 2011-08-10 上海交通大学 基于前景分析和模式识别的行人检测方法
CN102722712A (zh) * 2012-01-02 2012-10-10 西安电子科技大学 基于连续度的多尺度高分辨图像目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
城区复杂背景条件下的目标识别算法研究;杨镇宇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20091215;I138-671 *

Also Published As

Publication number Publication date
CN103198332A (zh) 2013-07-10

Similar Documents

Publication Publication Date Title
CN103198332B (zh) 一种实时鲁棒的远红外车载行人检测方法
CN102708356B (zh) 一种基于复杂背景下的车牌自动定位和识别方法
Yin et al. Hot region selection based on selective search and modified fuzzy C-means in remote sensing images
CN104361343B (zh) 车辆类型识别方法及其装置
CN103971097B (zh) 一种基于多尺度笔画模型的车牌识别方法与系统
CN101859382B (zh) 一种基于最大稳定极值区域的车牌检测与识别的方法
CN105335716A (zh) 一种基于改进udn提取联合特征的行人检测方法
Derpanis et al. Classification of traffic video based on a spatiotemporal orientation analysis
CN107122777A (zh) 一种基于视频文件的车辆分析系统及分析方法
CN105404857A (zh) 一种基于红外的夜间智能车前方行人检测方法
CN103903018A (zh) 一种复杂场景中对车牌进行定位的方法和系统
CN102163278B (zh) 一种公交车道非法车辆闯入检测方法
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN1996346A (zh) 基于轮廓的车型识别方法
Li et al. Research on vehicle license plate location based on neural networks
CN109583305A (zh) 一种基于关键部件识别和细粒度分类的车辆重识别的先进方法
CN103714181A (zh) 一种层级化的特定人物检索方法
CN107273852A (zh) 基于机器视觉的手扶电梯楼层板物件及乘客行为检测算法
CN107092884A (zh) 一种快速粗精级联行人检测方法
CN107480585A (zh) 基于dpm算法的目标检测方法
CN103971106A (zh) 多视角人脸图像性别识别方法及装置
CN109313699A (zh) 用于对一车辆的输入图像进行目标识别的装置和方法
CN108108703A (zh) 减速带缺失检测方法、装置及电子设备
CN105893960A (zh) 基于相位对称性的道路交通标志检测方法
CN107704833A (zh) 一种基于机器学习的前方车辆检测与跟踪方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160803