CN102521616B - 基于稀疏表示的行人检测方法 - Google Patents
基于稀疏表示的行人检测方法 Download PDFInfo
- Publication number
- CN102521616B CN102521616B CN201110447411.1A CN201110447411A CN102521616B CN 102521616 B CN102521616 B CN 102521616B CN 201110447411 A CN201110447411 A CN 201110447411A CN 102521616 B CN102521616 B CN 102521616B
- Authority
- CN
- China
- Prior art keywords
- image
- vector
- color
- rarefaction
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开一种基于稀疏表示的行人检测方法,该方法分为模型训练和比较识别两个阶段,在所述两个阶段分别对训练图像和检测图像进行归一化处理,提取颜色、纹理和形状三种特征向量,对所述三种特征向量进行稀疏表示并组合成稀疏化的混合特征向量;在所述模型训练阶段,根据训练图像稀疏化的混合特征向量通过支持向量机的模型训练方法训练分类器;在所述比较识别阶段,根据检测图像稀疏化的混合特征向量通过所述分类器进行识别。此方法具有良好的检测性能,对较多的数据集具有更好的效果,并且对于有遮挡的困难图像的检测也有较好的鲁棒性。
Description
技术领域
本发明属于模式识技术领域,具体涉及基于稀疏表示的行人检测方法。
背景技术
行人检测在视频控制、机器人学、智能交通、多媒体检索等领域有广泛的应用前景,也是近年来计算机视觉领域的热门研究对象。但是,行人的衣着、身体姿势、视角以及复杂的背景和光照变化等因素都会影响检测的效果,这都是行人检测问题的难点。
行人检测可以看作是一个行人/非行人的两类分类问题,而目前其分类方法可以分成两大类:
(1)基于形状信息的分类。包括基于显示人体模型的方法,基于模版匹配的方法以及基于统计分类的方法。这类方法是通过分析图像的灰度、边缘和纹理等信息对目标进行识别。对于基于显示人体模型的方法,其优点是有明确的模型,可以处理困难图像,并且能够推断人的姿态,但缺点是模型难以构造,求解比较复杂。而基于模版匹配的方法,其优点是计算简单,易于实现,但缺点是由于人的姿态千变万化,很难构造出所有的姿态模版。基于统计分类方法的优点是具有较好的鲁棒性,而缺点是需要大量的训练数据,并且难以处理多姿态和遮挡问题。
(2)基于运动信息的分类。这类方法指通过分析行人运动时的步态(Gait)特征来检测行人,其优点是不受纹理和光线变化的影响,缺点是只能识别出运动的行人,并且需要多帧才能给出判决结果,影响系统的实时性。。
发明内容
本发明的目的在于克服上述现有技术的缺陷,在已有的统计分类方法的基础上,根据稀疏表示,提出一种基于稀疏表示的行人检测方法,此方法具有良好的检测性能,对较多的数据集具有更好的效果,并且对于有遮挡的困难图像的检测也有较好的鲁棒性。
本发明采用的技术方案:基于稀疏表示的行人检测方法,分为模型训练和比较识别两个阶段,在所述两个阶段分别对训练图像和检测图像进行归一化处理,提取颜色、纹理和形状三种特征向量,对所述三种特征向量进行稀疏表示并组合成稀疏化的混合特征向量;在所述模型训练阶段,根据训练图像稀疏化的混合特征向量通过支持向量机的模型训练方法训练分类器;在所述比较识别阶段,根据检测图像稀疏化的混合特征向量通过所述分类器进行识别。
所述其中颜色特征向量采用HSV颜色模型,纹理特征向量采用Tamura纹理特征向量中的粗糙度、对比度和方向度这三个特征向量,形状特征向量采用是Hu提出的七个无关矩。
所述稀疏表示的具体步骤为:
1) 对字典 A的列向量以及所述颜色、纹理和形状特征向量进行2-范数等于1的归一化;
2) 根据字典A和颜色、纹理和形状特征向量向量通过EFLA算法得到其稀疏表示。
本发明的有益效果是:
1、本发明与传统的行人检测方法相比,通过对行人图像特征向量的稀疏表示和没有用稀疏表示的方法相比较体现出更好的识别率,尤其是在大量的数据集下,其效果表现的更为明显;
2、本发明将有遮挡的行人图像看作是原始图像和噪声(如遮挡物)的相加,对于原始图像和噪声分别用不同的基来稀疏表示,这样可以有效地分离原图像和噪声,从而取得较好的识别率,具有很好的鲁棒性。
附图说明
下面结合附图和具体实施方式对本发明进一步详细说明:
图1是本发明所述基于稀疏表示的行人检测方法流程示意图;
图2是本发明稀疏表示流程示意图;
图3是本发明方法和分别采用颜色、纹理、形状特征向量的SVM识别结果比较图;
图4是本发明方法和直接采用混合特征向量的SVM识别结果比较图;
图5是本发明方法和直接采用混合特征向量识别有遮挡图像的实验结果比较图。
具体实施方式
以下结合附图对发明的实施做出进一步说明。
图1为本发明提出的基于稀疏表示的行人检测方法流程示意图。首先将样本集中的行人图像分割之后并进行尺度归一化后得到行人训练图像。
第一步:对训练图像进行特征向量提取,分别得到颜色特征向量向量,纹理特征向量向量和形状特征向量向量。根据HSV颜色模型,Tamura纹理特征向量中的粗糙度、对比度和方向度这三个特征向量,以及Hu提出的七个无关矩对行人训练图像进行颜色、纹理和形状特征向量提取。
其中颜色特征向量提取的算法流程如下:
步骤1):将RGB空间转换到HSV空间;
步骤2):把色调H空间分成8份,饱和度S和亮度V空间分别分成3份;
步骤3):并根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为H,S,V;
纹理特征向量提取的算法流程如下:
粗糙度计算:
对比度计算:
方向度计算:
步骤1):计算每个像素处的梯度向量;
步骤2):构建方向角局部边缘概率直方图;
步骤3):通过计算概率直方图中峰值的尖锐程度来得到图像的方向性。
形状特征向量提取的算法流程如下:
步骤1): 将彩图图像灰度化,并用Canny边缘检测提取边缘保留边缘灰度图像,在用类判别分析法自动为每一幅廓图像选定阈值,然后用该阈值对图像二值化;
步骤2):计算图像的中心矩,其中x,y是数字图像f(x,y)的空间坐标,分别为 ,是数字图像f(x,y)的二维(i+j)阶矩,其定义为:,(i,j=0,1,2,... ,)。然后归一化(i+j)阶中心矩,,其中,i+j=2,3,… ,;
第二步:对得到的颜色、纹理和形状特征向量进行稀疏表示得到稀疏化的颜色特征向量,稀疏化的纹理特征向量和稀疏化的形状特征向量。将稀疏化的颜色特征向量,稀疏化的纹理特征向量和稀疏化的形状特征向量串联起来存放组成稀疏化的颜色纹理形状混合特征向量。如图2所示,为稀疏表示流程示意图,其中字典由所有正反行人训练样例集的特征向量组合成的矩阵,字典A=,其中为行人图像中正例的第k个图像的特征向量,为行人图像中反例的第k个图像的特征向量,稀疏表示的具体步骤如下:
(1)对字典 A的列向量,以及特征向量进行2-范数等于1的归一化:
(2)用EFLA(Efficient Fused Lasso Algorithm,效率索套算法)算法解决问题: 在稀疏惩罚模型中,为了求解其解,我们采用EFLA算法。其中,y是特征向量,x是要求解的稀疏向量,平滑凸损失loss(x)函数为 ,惩罚项fl(x)=,和为惩罚系数。
在EFLA算法中,定义,每次迭代,一个关键的构建机块是与非平滑部分fl相关联的近端算子。我们根据在点x处逼近的复合函数P()构造如下模型:。其中L是正则化项的系数,当L大于0时,在中我们对平滑函数loss()用一阶泰勒公式在点x处展开(包含在方括号中的所有内容),然后直接将非平滑函数fl()加入模型中,正则化项是为了防止y远离x,因此这个模型在x的临域可以很好的逼近P(y)。
我应用两个序列和,其中是近似解的序列,是搜索点的序列。搜索点是和的结合,即,其中是一个选择适当的系数。这个逼近解是通过计算的极小值得到的,即。其中是根据阿米霍-戈尔茨坦规则使用线搜索确定的,而且应于相适应。
EFLA算法如下:
步骤2):for i =1 to k do
步骤6):end for
根据字典A和特征向量通过EFLA算法即可得到特征向量的稀疏表示,即为稀疏化特征向量。
(3)混合特征向量是将提取得到的颜色特征向量,纹理特征向量和形状特征向量串联起来组成颜色纹理形状混合特征向量。
第三步:将是行人的图像标注为正例,非行人图像为反例,由第一步和第二步得到具有明确标签的行人训练图像的稀疏化特征向量,把所有的这些正反稀疏化特征向量输入到支持向量机训练得到一个可以区分行人与非行人的支持向量机分类器。
第四步:将归一化后的检测图像按照上述的第一步和第二步方法,先经过特征向量提取,然后再将得到的检测图像的特征向量稀疏表示,得到稀疏化的颜色、纹理、形状混合特征向量,最后把稀疏化混合特征向量输入支持向量机分类器,得到最终的识别结果。
本发明将所有行人训练样例的特征向量组合成字典A,然后分别对训练样例和测试样例进行稀疏表示,得到稀疏化后的特征向量,最后通过SVM对其进行识别,与没有对样例进行稀疏表示直接用SVM对其识别相比较,可以提高分类准确率(Accuracy),并且在样例集越大时,越能体现稀疏表示的优势,而对于有遮挡的行人图像,我们把这样的图像看作是原始图像和噪声(如遮挡物)的相加,对于原始图像和噪声分别用不同的基来稀疏表示,这样可以有效地分离原图像和噪声,从而取得较好的识别率,具有很好的鲁棒性。
在实验中,训练集选择100到400张不同数量的行人图像,测试集选择100张行人图像,如图3是用本发明方法和没用稀疏学习而直接分别通过颜色,纹理,形状特征向量用SVM进行识别的实验结果,其中横轴为训练样本数目,纵轴为识别率,实线代表本文提出的行人检测方法,虚线代表没用稀疏学习而直接分别通过颜色,纹理,形状特征向量用SVM进行行人检测的方法,从图中可以看出,本发明方法普遍比没用稀疏学习而直接分别通过颜色,纹理,形状特征向量运用SVM进行识别的分类准确率要高并且当训练集逐渐扩大时。图4是使用混合特征向量比较这两种方法。我们选用融合14维颜色特征向量,3维纹理特征向量和7维形状特征向量的24维混合特征向量,实验表明,本发明的方法分类准确率为92%,而没有进行稀疏表示的传统方法分类准确率为89%,本发明方法普遍比没用稀疏学习而直接分别通过颜色,纹理,形状特征向量运用SVM进行识别的分类准确率要高,并且在训练样本数目增加时,更能体现本文方法的优势。图5是对有遮挡行人图像采用本发明方法和直接采用颜色、纹理、形状混合特征向量利用SVM进行识别的实验结果比较。实验结果表明,在有遮挡的行人图像识别中,使用本发明方法与传统方法相比,具有更好的识别精度,体现出较好的鲁棒性。
Claims (1)
1.基于稀疏表示的行人检测方法,分为模型训练和比较识别两个阶段,其特征在于,在所述两个阶段分别对训练图像和检测图像进行归一化处理,提取颜色、纹理和形状三种特征向量,对所述三种特征向量进行稀疏表示并组合成稀疏化的混合特征向量;在所述模型训练阶段,根据训练图像稀疏化的混合特征向量通过支持向量机的模型训练方法训练分类器;在所述比较识别阶段,根据检测图像稀疏化的混合特征向量通过所述分类器进行识别;
所述稀疏表示的具体步骤为:
1) 对字典 A的列向量以及所述颜色、纹理和形状特征向量进行2-范数等于1的归一化,其中字典A由所有正反行人为所述特征向量组合成的矩阵;
2) 根据字典A和颜色、纹理和形状特征向量通过EFLA算法得到其稀疏表示,稀疏惩罚模型为 ,其中y是特征向量,x是要求解的稀疏向量,平滑凸损失loss(x)函数为 ,惩罚项fl(x)=,和为惩罚系数;
所述颜色特征向量采用的是HSV颜色模型,其提取步骤为:
1) 将RGB空间转换到HSV空间;
2) 把色调H空间分成8份,饱和度S和亮度V空间分别分成3份;
3) 根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为H,S,V;
所述纹理特征向量使用的是Tamura纹理特征中的粗糙度、对比度和方向度这三个特征向量;所述粗糙度的提取步骤为:
所述对比度的提取步骤为:
所述方向度的提取步骤为:
1) 计算每个像素处的梯度向量;
2) 构建方向角局部边缘概率直方图;
3) 通过计算概率直方图中峰值的尖锐程度来得到图像的方向性;
所述形状特征向量的提取步骤为:
1) 将彩图图像灰度化,用Canny边缘检测提取边缘保留边缘灰度图像,在用类判别分析法自动为每一幅廓图像选定阈值,然后用该阈值对图像二值化;
2) 计算图像的中心矩Hij,归一化(i+j)阶中心矩;
3) 计算Hu提出的具有旋转、缩放和平移无关的7个矩特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110447411.1A CN102521616B (zh) | 2011-12-28 | 2011-12-28 | 基于稀疏表示的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110447411.1A CN102521616B (zh) | 2011-12-28 | 2011-12-28 | 基于稀疏表示的行人检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102521616A CN102521616A (zh) | 2012-06-27 |
CN102521616B true CN102521616B (zh) | 2014-04-09 |
Family
ID=46292527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110447411.1A Active CN102521616B (zh) | 2011-12-28 | 2011-12-28 | 基于稀疏表示的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521616B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077376B (zh) * | 2012-12-30 | 2016-07-20 | 信帧电子技术(北京)有限公司 | 基于视频图像中的人体图像再识别的方法 |
CN103729462B (zh) * | 2014-01-13 | 2016-09-14 | 武汉大学 | 一种基于稀疏表示处理遮挡的行人检索方法 |
CN104834933B (zh) * | 2014-02-10 | 2019-02-12 | 华为技术有限公司 | 一种图像显著性区域的检测方法和装置 |
CN104318269A (zh) * | 2014-11-19 | 2015-01-28 | 四川大学 | 基于子空间学习与稀疏编码的真迹鉴定方法 |
CN104657717B (zh) * | 2015-02-12 | 2018-02-02 | 合肥工业大学 | 一种基于分层核稀疏表示的行人检测方法 |
CN107273899B (zh) * | 2016-04-07 | 2020-08-14 | 富士通株式会社 | 对象分类方法和对象分类设备 |
CN107392115B (zh) * | 2017-06-30 | 2021-01-12 | 中原智慧城市设计研究院有限公司 | 一种基于分层特征提取的交通标志识别方法 |
CN108764338B (zh) * | 2018-05-28 | 2021-05-04 | 上海应用技术大学 | 一种应用于视频分析的行人跟踪方法 |
CN109002851B (zh) * | 2018-07-06 | 2021-04-02 | 东北大学 | 一种基于图像多特征融合的水果分类方法及应用 |
CN110263687A (zh) * | 2019-06-06 | 2019-09-20 | 深圳职业技术学院 | 一种基于稀疏表示的多视角行人目标检测方法 |
CN115880614B (zh) * | 2023-01-19 | 2023-05-12 | 清华大学 | 一种宽视场高分辨视频高效智能检测方法及系统 |
-
2011
- 2011-12-28 CN CN201110447411.1A patent/CN102521616B/zh active Active
Non-Patent Citations (7)
Title |
---|
《Textural Features Corresponding to Visual Perception》;HIDEYUKI TAMURA el at.;《IEEE Xplore digital library》;19780630;第8卷(第6期);第465页左侧第26行-468页左侧第20行 * |
《基于HSV 空间中密码本模型的行人视频检测》;李琦等;《交通运输系统工程与信息》;20110831;第11卷(第4期);第47页左侧第8-30行、第48页左侧第11-33行 * |
《基于动态反馈的标志位线性分析算法》;唐锋等;《Journal of Software》;20070731;第18卷(第7期);第1603-1611页 * |
HIDEYUKI TAMURA el at..《Textural Features Corresponding to Visual Perception》.《IEEE Xplore digital library》.1978,第8卷(第6期),第465页左侧第26行-468页左侧第20行. |
唐锋等.《基于动态反馈的标志位线性分析算法》.《Journal of Software》.2007,第18卷(第7期),第1603-1611页. |
李琦等.《基于HSV 空间中密码本模型的行人视频检测》.《交通运输系统工程与信息》.2011,第11卷(第4期),第47页左侧第8-30行、第48页左侧第11-33行. |
谢尧芳等.《基于稀疏编码的迁移学习及其在行人检测中的应用》.《厦门大学学报(自然科学版)》.2010,第49卷(第2期),第186页左侧第7行-右侧第20行、第187页右侧第6行-第188页左侧第14行、第189页右侧第16-39行. * |
Also Published As
Publication number | Publication date |
---|---|
CN102521616A (zh) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521616B (zh) | 基于稀疏表示的行人检测方法 | |
CN105528794B (zh) | 基于混合高斯模型与超像素分割的运动目标检测方法 | |
CN106778604B (zh) | 基于匹配卷积神经网络的行人再识别方法 | |
CN108154102B (zh) | 一种道路交通标志识别方法 | |
Yuan et al. | Robust traffic sign recognition based on color global and local oriented edge magnitude patterns | |
CN105389550B (zh) | 一种基于稀疏指引与显著驱动的遥感目标检测方法 | |
CN104599275B (zh) | 基于概率图模型的非参数化的rgb-d场景理解方法 | |
WO2017101434A1 (zh) | 一种多摄像机间人体目标再识别的方法及系统 | |
CN107301378B (zh) | 图像中多分类器集成的行人检测方法和系统 | |
Hu et al. | Exploring structural information and fusing multiple features for person re-identification | |
CN104021375B (zh) | 一种基于机器学习的车型识别方法 | |
CN102663411B (zh) | 一种目标人体识别方法 | |
CN107169985A (zh) | 一种基于对称帧间差分和背景更新的运动目标检测方法 | |
CN107657225B (zh) | 一种基于聚合通道特征的行人检测方法 | |
CN103854016B (zh) | 基于方向性共同发生特征的人体行为分类识别方法及系统 | |
CN104268583A (zh) | 基于颜色区域特征的行人重识别方法及系统 | |
CN104966054B (zh) | 无人机可见光图像中的弱小目标检测方法 | |
CN103295009B (zh) | 基于笔画分解的车牌字符识别方法 | |
CN104036284A (zh) | 基于Adaboost算法的多尺度行人检测方法 | |
CN103886619A (zh) | 一种融合多尺度超像素的目标跟踪方法 | |
CN103955949A (zh) | 基于Mean-shift算法的运动目标检测方法 | |
CN105654085A (zh) | 一种基于图像技术的弹孔识别方法 | |
CN108614991A (zh) | 一种基于Hu不变矩的深度图像手势识别方法 | |
DU et al. | Face detection in video based on AdaBoost algorithm and skin model | |
Wang et al. | Use fast R-CNN and cascade structure for face detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20191227 Address after: Room 333, 3 / F, science and technology innovation center, No.1, Xiankun Road, Jianye District, Nanjing City, Jiangsu Province Patentee after: Nanjing Zhaoshi Intelligent Technology Co., Ltd Address before: Zhenjiang City, Jiangsu Province, 212013 Jingkou District Road No. 301 Patentee before: jiangsu university |
|
TR01 | Transfer of patent right |