CN104008404B - 一种基于显著直方图特征的行人检测方法及系统 - Google Patents
一种基于显著直方图特征的行人检测方法及系统 Download PDFInfo
- Publication number
- CN104008404B CN104008404B CN201410268777.6A CN201410268777A CN104008404B CN 104008404 B CN104008404 B CN 104008404B CN 201410268777 A CN201410268777 A CN 201410268777A CN 104008404 B CN104008404 B CN 104008404B
- Authority
- CN
- China
- Prior art keywords
- pixel
- feature
- notable
- gradient
- regional area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
一种基于显著直方图特征的行人检测方法及系统,训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;测试阶段包括对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果。提取特征时,将梯度的幅值和相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和梯度的方向形成显著直方图;通过统计显著直方图,形成特征描述。
Description
技术领域
本发明涉及目标检测领域,特别涉及一种基于显著直方图特征的行人检测技术方案。
背景技术
目标检测在计算机视觉中是一个热点,广泛的应用在刑侦监控、特定目标检索、机器人学和智能车辆中;行人在目标检测中又是尤为重要的因素,因此行人检测在近几年的时间里引起了高度重视和研究。但是在不同场景下光照、噪声以及行人的多种姿态变化使行人检测的研究面临很大的挑战。目前大多的行人检测算法都是借助于Dalal-Triggs在文献(“Histograms of oriented gradients for human detection.In Computer Visionand Pattern Recognition”,2005.CVPR2005.IEEE Computer Society Conference on,volume1,pages886-893.)中提出的HOG特征。经过多年的研究,该领域取得了很大的改进。在Piotr Dollar的文献(Piotr Dollar,Christian Wojek,Bernt Schiele,and PietroPerona.Pedestrian detection:An evaluation of the state of the art.PatternAnalysis and Machine Intelligence,IEEE Transactions on,34(4):743-761,2012.)中对目前十六种行人检测算法比对的调研中可以发现,在行人检测过程中有两个重要的元素:特征和分类器。检测过程包含训练和测试两个阶段:第一,从训练图像中提取特征,其中特征包含了行人的色彩、纹理及外形等基本属性信息,将提取的特征训练出SVM分类器;第二,从测试集图像中提取特征,将这些特征送入到训练好的分类器,最后给出分类结果。从HOG特征的检测结果中可以看出,大部分的误检大多出现在背景的区域;而这些背景区域都是图像的非显著区域。
发明内容
本发明的目的是提出一种基于显著直方图特征的行人检测技术方案,解决现有的同类算法中高误检问题,通过滑动窗口法得到最佳的结果。
为了达到以上目的,本发明采用的技术方案提供了一种基于显著直方图特征的行人检测方法,包括训练阶段和测试阶段,
训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;提取特征包括进行以下步骤,
步骤1.1,对输入图像进行颜色空间的归一化;
步骤1.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
步骤1.3,对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
步骤1.4,采集每个像素的梯度的幅值和方向;
步骤1.5,对每个像素,将步骤1.4中所得梯度的幅值和步骤1.2中得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和步骤1.4中得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,得到各大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,得到该输入图像的特征描述子;
测试阶段包括对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;提取特征包括进行以下步骤,
步骤2.1,对输入图像进行颜色空间的归一化;
步骤2.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
步骤2.3,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
步骤2.4,采集每个像素的梯度的幅值和方向;
步骤2.5,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征如下,
对局部区域中每个像素,将步骤2.4中所得梯度的幅值和步骤2.2中得到的显著概率值结合成带有显著信息的梯度幅值,然后和步骤2.4中得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,便得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到各大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,作为该局部区域的特征。
而且,步骤1.2和2.2中,设归一化后的输入图像记为图像I,图像I的每个像素Ik的显著度Y(Ik)通过下式获得,
其中,Ii是图像I的一个像素,d(Ik,Ii)是图像I的两个像素Ik和Ii在色彩LUV空间的距离,N是图像I的像素个数;
将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果,新的显著度计为S(Ik),
设局部区域的显著概率值符合高斯分布,计算显著概率值的式子如下,
其中,和σ2分布代表高斯分布的均值和方差,Rk代表以像素Ik为中心的预设尺寸的局部区域;代表矩形区域的显著度,σ代表高斯分布的标准方差。
而且,步骤1.4和步骤2.4中,采集每个像素单元中各像素点的梯度的幅值和方向如下,提取位置(x,y)处像素的梯度如下,
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
其中,Gx(x,y)、Gy(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度,H(x,y)为在位置(x,y)处像素的像素值,该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为,
而且,步骤1.4和步骤2.4中,每个像素单元的显著信息的梯度幅值提取如下,
Gs(x,y)=G(x,y)F(s(x,y))
其中,F(s(x,y))是以位置(x,y)处像素为中心的预设尺寸的局部区域相应显著概率值F(s(x,y))。
本发明还相应提供了一种基于显著直方图特征的行人检测系统,包括以下模块,训练模块,用于首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;
分类模块,用于对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;
训练模块包括以下子模块,
第一归一化子模块,用于对输入图像进行颜色空间的归一化;
第一显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第一图像划分子模块,用于对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第一梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第一特征生成子模块,用于对每个像素,将第一梯度采集子模块所得梯度的幅值和第一显著概率值获取子模块得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和第一梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,得到各大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,得到该输入图像的特征描述子;
分类模块包括以下子模块,
第二归一化子模块,用于对输入图像进行颜色空间的归一化;
第二显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第二图像划分子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第二梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第二特征生成子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征如下,
对局部区域中每个像素,将第二梯度采集子模块所得梯度的幅值和第二显著概率值获取子模块得到的显著概率值结合成带有显著信息的梯度幅值,然后和第二梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,便得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到各大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,作为该局部区域的特征。
本发明充分利用了包含显著信息的局部区域,形成了包含有显著度的特征描述子,将显著信息,梯度信息有机的结合成显著直方图特征描述子,应用在行人检测领域中取得了很好的效果。
附图说明
图1为实施例的基于显著直方图特征的行人检测方法的流程图。
具体实施方式
本发明技术方案可采用软件技术实现自动流程运行。下面结合附图和实施例对本发明技术方案进一步详细说明。预先搜集包含行人的正样本及不包含行人的负样本的样本数据集,建议选择单人室外照片作为正样本,选取不包含行人的室外照片为负样本。可先归一化正样本和负样本为预设尺寸,例如实施例归一化为128×64的矩形图像。分别从正样本和负样本中提取特征作为训练数据,根据训练数据学习训练SVM分类器,从测试数据集中任一测试图像提取以每个像素为中心的局部区域相应特征并输入训练好的分类器,输出各局部区域的分类结果。测试图像中局部区域与正样本和负样本归一化后尺寸一致,例如测试图像中局部区域可取128×64的矩形局部区域,和正样本和负样本归一化为128×64的矩形图像符合,以便提取相应的特征。
本发明实施例分为训练阶段和测试阶段,
训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,实施例归一化为128×64的矩形图像,然后作为输入图像提取特征,根据所得特征训练分类器;提取特征包括进行以下步骤,
步骤1.1,对输入图像进行颜色空间的归一化;
实施例采用Gamma校正法对输入图像进行颜色空间的归一化,目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。
为了减少光照因素的影响,首先需要将整个图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献的比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大,通常先转化为灰度图;
Gamma压缩公式:
I(x,y)=I*(x,y)gamma
其中I*(x,y)表示的是输入图像的原图像像素,(x,y)为输入图像中像素的位置,gamma是压缩系数(一般取值为0.5),I(x,y)为归一化后的图像像素。
步骤1.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
设步骤1.1归一化后的输入图像记为图像I,对图像I的每种色彩的统计信息可以算出图像I每个像素的显著度,假设像素的局部区域中的显著度符合高斯分布,计算出高斯分布的均值和方差,这样便可以把显著度转换成概率值。
按照一般方式,图像I的每个像素Ik的显著度Y(Ik)通过下式获得,
其中Ii是图像I的一个像素,d(Ik,Ii)是图像I的两个像素Ik和Ii在色彩LUV空间的距离,N是图像I的像素个数。本发明实施例将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果,新的显著度计为S(Ik),从而得到局部区域的显著度的统计信息,其中局部区域的显著概率值符合高斯分布,显著概率值如下,
其中代表的是局部区域内显著度的概率分布,和σ2分布代表高斯分布的均值和方差,Rk代表以像素Ik为中心的矩形的局部区域,同样采用预定尺寸的局部区域,例如128×64的矩形局部区域,超出图像I的部分假设像素值为0,相应像素显著度也为0;代表的是矩形的局部区域Rk的显著度,根据局部区域Rk内每个像素新的显著度求平均得到,σ代表的是高斯分布的标准方差。
步骤1.3,对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素;
a和b为预设参数,本领域技术人员可自行根据预设尺寸设定取值;实施例将步骤1归一化后的图像I划分成多个大块,每个大块包括2×2的小块(Block),每个小块中包含8×8个像素(Cell)。
步骤1.4,采集每个像素的梯度的幅值和方向;
采集步骤1.1归一化后的图像I中各像素点的梯度(包含梯度的幅值和方向)。计算图像像素的梯度,通过求导不仅能够捕获轮廓和纹理信息,还能弱化光照。提取图像I中位置(x,y)处像素的梯度方法如下:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
其中Gx(x,y)、Gy(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度,H(x,y)为在位置(x,y)处像素的像素值。该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为:
步骤1.5,对每个像素,将步骤1.4中所得梯度的幅值和步骤1.2中得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值;然后和步骤1.4中得到的梯度的方向形成直方图,称为显著直方图特征。统计每个像素的显著直方图,即可形成每个像素的特征描述子,将每个小块中所有像素的特征描述子串联起来,便得到该小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到该大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,便得到该输入图像的特征描述子,即该正样本或负样本的特征。
每个像素的显著梯度幅值表示为:
Gs(x,y)=G(x,y)F(s(x,y))
其中G(x,y)可以从步骤1.4中得到,对以位置(x,y)处像素为中心的矩形的局部区域,同样采用预定尺寸,相应显著概率值F(s(x,y))可以从步骤1.2得到,即假设位置(x,y)处像素为像素Ik,取即可。带有显著信息的幅值和方向投影成直方图,可称之为显著直方图,作为行人检测的描述子。具体投影实现方式为现有技术。显著直方图特征可以把图像中的显著部分直观的用直方图表示出了,为后期的直方图特征检测提供了很优越的检测条件,降低了把背景检测成行人的误检。
参见图1,测试阶段包括对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;提取特征包括进行以下步骤,
步骤2.1,对输入图像进行颜色空间的归一化;
实施例采用Gamma校正法对输入图像进行颜色空间的归一化,目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。
为了减少光照因素的影响,首先需要将整个图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献的比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。因为颜色信息作用不大,通常先转化为灰度图;
Gamma压缩公式:
I(x,y)=I*(x,y)gamma
其中I*(x,y)表示的是输入图像的原图像像素,(x,y)为输入图像中像素的位置,gamma是压缩系数(一般取值为0.5),I(x,y)为归一化后的图像像素。
步骤2.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
设步骤2.1归一化后的输入图像记为图像I,对图像I的每种色彩的统计信息可以算出图像I每个像素的显著度,假设像素的局部区域中的显著度符合高斯分布,计算出高斯分布的均值和方差,这样便可以把显著度转换成概率值。
按照一般方式,图像I的每个像素Ik的显著度Y(Ik)通过下式获得,
其中Ii是图像I的一个像素,d(Ik,Ii)是图像I的两个像素Ik和Ii在色彩LUV空间的距离,N是图像I的像素个数。本发明实施例将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果,新的显著度计为S(Ik),从而得到局部区域的显著度的统计信息,其中局部区域的显著概率值符合高斯分布,显著概率值如下,
其中代表的是局部区域内显著度的概率分布,和σ2分布代表高斯分布的均值和方差,Rk代表以像素Ik为中心的矩形的局部区域,同样采用预定尺寸,例如128×64的矩形局部区域,超出图像I的部分假设像素值为0,相应像素显著度也为0;代表的是矩形的局部区域Rk的显著度,根据局部区域Rk内每个像素新的显著度求平均得到,σ代表的是高斯分布的标准方差。可得到相应显著图。
步骤2.3,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素;
对每个局部区域的划分方式和步骤1.3对样本图像的划分方式一致。实施例将每个局部区域划分成多个大块,每个大块包括2×2的小块(Block),每个小块中包含8×8个像素(Cell),实现图像分块。
步骤2.4,采集每个像素的梯度的幅值和方向;
采集步骤1归一化后的图像I中各像素点的梯度(包含梯度的幅值和方向)。计算图像像素的梯度,通过求导不仅能够捕获轮廓和纹理信息,还能弱化光照。提取图像I中位置(x,y)处像素的梯度方法如下:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
其中Gx(x,y)、Gy(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度,H(x,y)为在位置(x,y)处像素的像素值。该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为:
步骤2.5,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征:包括对局部区域中每个像素,将步骤2.4中所得梯度的幅值和步骤2.2中得到的显著概率值结合成带有显著信息的梯度幅值;然后和步骤2.4中得到的梯度的方向形成直方图,称为显著直方图特征。统计每个像素的显著直方图,即可形成每个像素的特征描述子,将每个小块中所有像素的特征描述子串联起来,便得到该小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到该大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,即该局部区域的特征,形成显著特征。
每个像素的显著梯度幅值表示为:
Gs(x,y)=G(x,y)F(s(x,y))
其中G(x,y)可以从步骤2.4中得到,对以位置(x,y)处像素为中心的矩形的局部区域,同样采用预定尺寸,相应显著概率值F(s(x,y))可以从步骤2.2得到,即假设位置(x,y)处像素为像素Ik,取即可。
可见,从样本数据集的正样本和负样本和从测试数据集的测试图片内局部区域中提取特征的方式一致。按此方式,针对测试图片内任何局部区域均可得到是否包含行人的分类结果。无需预先确认测试图片内行人位置,适用于测试图片内多个位置存在行人的情况。
发明人在Pentium(R)、Dual-Core3.20GHz CPU、2G内存的计算机上运行,使用本实施例方法,使用公开的数据集和文献(“Histograms of oriented gradients for humandetection,”in Computer Vision and Pattern Recognition,2005.CVPR2005.IEEEComputer Society Conference on.IEEE,2005,vol.1,pp.886–893.)和文献(PiotrDollar,Christian Wojek,Bernt Schiele,and Pietro Perona,“Pedestrian detection:An evaluation of the state of the art,”Pattern Analysis and MachineIntelligence,IEEE Transactions on,vol.34,no.4,pp.743–761,2012.)中提到行人检测算法做了比较,检测效率有了很大的提升,因此可以应用在多媒体检索、智能交通等领域。
具体实施时,还可采用软件模块化方式实现一种基于显著直方图特征的行人检测系统,实施例提供的系统包括以下模块,
训练模块,用于首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;
分类模块,用于对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;
训练模块包括以下子模块,
第一归一化子模块,用于对输入图像进行颜色空间的归一化;
第一显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第一图像划分子模块,用于对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第一梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第一特征生成子模块,用于对每个像素,将第一梯度采集子模块所得梯度的幅值和第一显著概率值获取子模块得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和第一梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,得到各大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,得到该输入图像的特征描述子;
分类模块包括以下子模块,
第二归一化子模块,用于对输入图像进行颜色空间的归一化;
第二显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第二图像划分子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第二梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第二特征生成子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征如下,
对局部区域中每个像素,将第二梯度采集子模块所得梯度的幅值和第二显著概率值获取子模块得到的显著概率值结合成带有显著信息的梯度幅值,然后和第二梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,便得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到各大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,作为该局部区域的特征。
各模块具体实现与方法步骤相应,本发明不予赘述。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明技术领域的技术人员可以对所描述的具体实施例做各种各样的修改补充或者采用类似的方式替代,但并不会偏离本发明精神或者超越所附权利要求书所定义的范围。
Claims (5)
1.一种基于显著直方图特征的行人检测方法,其特征在于:包括训练阶段和测试阶段,
训练阶段包括首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;提取特征包括进行以下步骤,
步骤1.1,对输入图像进行颜色空间的归一化;
步骤1.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
步骤1.3,对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
步骤1.4,采集每个像素的梯度的幅值和方向;
步骤1.5,对每个像素,将步骤1.4中所得梯度的幅值和步骤1.2中得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和步骤1.4中得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,得到各大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,得到该输入图像的特征描述子;
测试阶段包括对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;提取特征包括进行以下步骤,
步骤2.1,对输入图像进行颜色空间的归一化;
步骤2.2,以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
步骤2.3,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
步骤2.4,采集每个像素的梯度的幅值和方向;
步骤2.5,基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征如下,
对局部区域中每个像素,将步骤2.4中所得梯度的幅值和步骤2.2中得到的显著概率值结合成带有显著信息的梯度幅值,然后和步骤2.4中得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,便得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到各大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,作为该局部区域的特征。
2.根据权利要求1所述基于显著直方图特征的行人检测方法,其特征在于:步骤1.2和2.2中,设归一化后的输入图像记为图像I,图像I的每个像素Ik的显著度Y(Ik)通过下式获得,
其中,Ii是图像I的一个像素,d(Ik,Ii)是图像I的两个像素Ik和Ii在色彩LUV空间的距离,N是图像I的像素个数;
将每个像素的显著度重新定义为该像素与周围最近的八个像素的显著度求和取平均值的结果,新的显著度计为S(Ik),
设局部区域的显著概率值符合高斯分布,计算显著概率值的式子如下,
其中,和σ2分布代表高斯分布的均值和方差,Rk代表以像素Ik为中心的预设尺寸的局部区域;代表局部区域的显著度,σ代表高斯分布的标准方差。
3.根据权利要求2所述基于显著直方图特征的行人检测方法,其特征在于:步骤1.4和步骤2.4中,采集每个像素单元中各像素点的梯度的幅值和方向如下,
提取位置(x,y)处像素的梯度如下,
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
其中,Gx(x,y)、Gy(x,y)表示图像I中位置(x,y)处的水平方向梯度、垂直方向梯度,H(x,y)为在位置(x,y)处像素的像素值,该像素处的梯度的幅值G(x,y)和方向θ(x,y)分别表示为,
4.根据权利要求3所述基于显著直方图特征的行人检测方法,其特征在于:步骤1.4和步骤2.4中,每个像素的显著信息的梯度幅值提取如下,
Gs(x,y)=G(x,y)F(s(x,y))
其中,F(s(x,y))是以位置(x,y)处像素为中心的预设尺寸的局部区域相应显著概率值F(s(x,y))。
5.一种基于显著直方图特征的行人检测系统,其特征在于:包括以下模块,
训练模块,用于首先分别将样本数据集中每个正样本或负样本归一化为预设尺寸,然后作为输入图像提取特征,根据所得特征训练分类器;正样本的图像包含行人,负样本的图像不包含行人;
分类模块,用于对测试数据集中任一测试图像,首先以测试图像为输入图像,分别以输入图像的每个像素为中心建立预设尺寸的局部区域,并提取每个局部区域的特征,然后将每个局部区域的特征输入训练阶段所得分类器,得到各局部区域是否包含行人的分类结果;
训练模块包括以下子模块,
第一归一化子模块,用于对输入图像进行颜色空间的归一化;
第一显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第一图像划分子模块,用于对输入图像进行划分,划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第一梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第一特征生成子模块,用于对每个像素,将第一梯度采集子模块所得梯度的幅值和第一显著概率值获取子模块得到的相应局部区域显著概率值结合成带有显著信息的梯度幅值,然后和第一梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,得到各大块的特征描述子;将输入图像中所有大块的特征描述子串联起来,得到该输入图像的特征描述子;
分类模块包括以下子模块,
第二归一化子模块,用于对输入图像进行颜色空间的归一化;
第二显著概率值获取子模块,用于以输入图像的每个像素为中心建立预设尺寸的局部区域,获取每个局部区域的显著概率值;
第二图像划分子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,将每个局部区域分别划分成多个大块,每个大块包括a×a个小块,每个小块中包含b×b个像素,a和b为预设参数;
第二梯度采集子模块,用于采集每个像素的梯度的幅值和方向;
第二特征生成子模块,用于基于以输入图像的每个像素为中心建立的预设尺寸的局部区域,对每个局部区域分别提取特征如下,
对局部区域中每个像素,将第二梯度采集子模块所得梯度的幅值和第二显著概率值获取子模块得到的显著概率值结合成带有显著信息的梯度幅值,然后和第二梯度采集子模块得到的梯度的方向形成显著直方图;统计每个像素的显著直方图,形成每个像素的特征描述子;将每个小块中所有像素的特征描述子串联起来,便得到各小块的特征描述子;将每个大块中所有小块的特征描述子串联起来,便得到各大块的特征描述子;将局部区域中所有大块的特征描述子串联起来,便得到该局部区域的特征描述子,作为该局部区域的特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410268777.6A CN104008404B (zh) | 2014-06-16 | 2014-06-16 | 一种基于显著直方图特征的行人检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410268777.6A CN104008404B (zh) | 2014-06-16 | 2014-06-16 | 一种基于显著直方图特征的行人检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104008404A CN104008404A (zh) | 2014-08-27 |
CN104008404B true CN104008404B (zh) | 2017-04-12 |
Family
ID=51369053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410268777.6A Expired - Fee Related CN104008404B (zh) | 2014-06-16 | 2014-06-16 | 一种基于显著直方图特征的行人检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104008404B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809182B (zh) * | 2014-12-31 | 2019-12-13 | 中国科学院深圳先进技术研究院 | 一种图像分类的方法及装置 |
CN104978574B (zh) * | 2015-07-10 | 2019-04-05 | 鲲鹏通讯(昆山)有限公司 | 一种基于杂乱背景中的手势跟踪方法 |
CN105023001B (zh) * | 2015-07-17 | 2018-03-27 | 武汉大学 | 一种基于选择性区域的多行人检测方法及系统 |
CN106919889B (zh) * | 2015-12-25 | 2021-04-13 | 株式会社日立制作所 | 对视频图像中的人头进行检测的方法和装置 |
CN106127164B (zh) * | 2016-06-29 | 2019-04-16 | 北京智芯原动科技有限公司 | 基于显著性检测和卷积神经网络的行人检测方法及装置 |
CN106971158B (zh) * | 2017-03-23 | 2019-07-16 | 南京邮电大学 | 一种基于CoLBP共生特征与GSS特征的行人检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070237387A1 (en) * | 2006-04-11 | 2007-10-11 | Shmuel Avidan | Method for detecting humans in images |
CN102682287B (zh) * | 2012-04-17 | 2014-02-26 | 电子科技大学 | 基于显著度信息的行人检测方法 |
-
2014
- 2014-06-16 CN CN201410268777.6A patent/CN104008404B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN104008404A (zh) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104008404B (zh) | 一种基于显著直方图特征的行人检测方法及系统 | |
WO2019196130A1 (zh) | 面向车载热成像行人检测的分类器训练方法和装置 | |
Overett et al. | Large scale sign detection using HOG feature variants | |
Dev et al. | Categorization of cloud image patches using an improved texton-based approach | |
CN106056071B (zh) | 一种驾驶员打电话行为的检测方法及装置 | |
CN105335716B (zh) | 一种基于改进udn提取联合特征的行人检测方法 | |
CN103198332B (zh) | 一种实时鲁棒的远红外车载行人检测方法 | |
CN105913003B (zh) | 一种多特征多模型的行人检测方法 | |
CN104504395A (zh) | 基于神经网络实现人车分类的方法和系统 | |
CN107092884B (zh) | 一种快速粗精级联行人检测方法 | |
CN105512684A (zh) | 基于主成分分析卷积神经网络的车标自动识别方法 | |
CN105913040A (zh) | 暗视觉条件下的双摄像头实时行人检测系统 | |
CN102495998B (zh) | 基于视觉选择性注意计算模型的静态目标检测方法 | |
CN103632170A (zh) | 基于特征组合的行人检测方法及装置 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
CN102881160B (zh) | 一种低照度场景下的户外交通标志识别方法 | |
CN107704853A (zh) | 一种基于多分类器的交通信号灯的识别方法 | |
CN111915583B (zh) | 复杂场景中基于车载红外热像仪的车辆和行人检测方法 | |
CN105138987A (zh) | 一种基于聚合通道特征和运动估计的车辆检测方法 | |
CN105930803A (zh) | 一种基于Edge Boxes的前车检测方法及装置 | |
KR101178333B1 (ko) | 웨이블릿 기반의 중심대칭-국부이진 패턴과 계층적 랜덤 포레스트를 이용한 사람 검출 방법 | |
CN107315990A (zh) | 一种基于xcs‑lbp特征以及级联aksvm的行人检测算法 | |
CN109190456A (zh) | 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法 | |
Su et al. | A new local-main-gradient-orientation HOG and contour differences based algorithm for object classification | |
CN106919939A (zh) | 一种交通标识牌跟踪识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170412 Termination date: 20210616 |