CN104008389A - 结合Gabor小波和SVM进行物体识别的方法 - Google Patents

结合Gabor小波和SVM进行物体识别的方法 Download PDF

Info

Publication number
CN104008389A
CN104008389A CN201410264158.XA CN201410264158A CN104008389A CN 104008389 A CN104008389 A CN 104008389A CN 201410264158 A CN201410264158 A CN 201410264158A CN 104008389 A CN104008389 A CN 104008389A
Authority
CN
China
Prior art keywords
gabor
svm
image
object recognition
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410264158.XA
Other languages
English (en)
Inventor
张蕾
史恒亮
向菲
赵旭辉
赵海霞
普杰信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN201410264158.XA priority Critical patent/CN104008389A/zh
Publication of CN104008389A publication Critical patent/CN104008389A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

结合Gabor小波和SVM进行物体识别的方法。首先用Gabor小波变换对图像进行处理,然后用PCA进行降维,最后用SVM分类器进行分类识别。并将该方法应用于哥伦比亚图像库COIL-20进行实验,提高三维物体的识别率和降低识别时间。

Description

结合Gabor小波和SVM进行物体识别的方法
技术领域
本发明涉及物体识别,尤其涉及一种结合Gabor小波和SVM进行物体识别的方法。
背景技术
三维物体识别是模式识别和计算机视觉的重要研究领域之一。其主要任务是识别出图像中有什么类型的物体,并反映出物体在具体场景中的位置和方向。在实际的场景中,物体的观测数据受多因素的影响,会发生显著的变化,如:物体的形状、尺寸、光照和视角变化;噪声干扰;部分遮挡等。对计算机视觉系统而言,排除这些干扰,快速而准确地识别出物体的类别是比较困难的。三维物体识别主要包括两个关键步骤:特征提取和分类识别。对于特征提取,当前主要提取物体的颜色特征、形状特征、纹理特征。颜色是物体最直接、最重要的视觉特性之一,并且计算量较小,但其信息量比较简单,一般和其它特征联合使用。形状特征主要是指物体的不变矩特征,因不变矩比较复杂,计算量较大,所以现在用的不多。纹理特征是对图像空间信息进行定量描述,具有旋转不变性,并对噪声有较好的鲁棒性。
发明内容
为解决上述技术问题,一种结合Gabor小波和SVM进行物体识别方法。首先用Gabor小波变换对图像进行处理,然后用PCA进行降维,最后用SVM分类器进行分类识别。并将该方法应用于哥伦比亚图像库COIL-20进行实验,提高三维物体的识别率和降低识别时间。
为实现上述技术目的,本发明所采用的技术方案是:结合Gabor小波和SVM进行物体识别的方法:
步骤一、对原始图像进行Gabor特征提取,得到的48维特征矢量;
步骤二、对步骤一中的得到的48维特征矢量,采用PCA消除特征维间的冗余信息,得到多维主特征矢量;
步骤三、利用SVM对多维主特征矢量进行分类识别。
所述的48维特征矢量的提取方法是,Gabor滤波器的特性主要由尺度                                                和方向两个参数决定,改变尺度和方向的值,就可得到一组方向和尺度不同的Gabor滤波器,选取共六个方向能满足物体识别的要求,对于一个N*N的纹理图像,选择四个尺度,这样就得到24个Gabor通道滤波器,采用双重卷积,纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积,将两个卷积后图像的和取平方根,得到每个通道的输出图像,其结果与相位无关,每个通道输出图像的均值和标准差用来表示纹理特征,从每幅图像中提取出48个特征,形成48维特征矢量。
所述的选取六个方向为0°、30°、60°、90°、120°和150°。
所述的所述的Gabor滤波器函数的一般形式为
     (1)
                (2)
其中:分别是在x和y方向的标准差,确定了函数的空间扩展,把g(x,y)作为母小波,对g(x,y)进行适当的尺度和旋转变换,可得一组自相似的滤波器;
                     (3)
其中,m, n为整数,,K为方向总数,为尺度因子;
为一幅给定的图像,则其Gabor小波变换可定义为:
      (4)
其中*代表共轭复数。纹理区域具有空间相似性,所以变换参数的均值可表示该区域的纹理特征并进行分类。的计算公式如下
                     (5)
             (6)
设采用了P个方向和Q个尺度,则特征向量可表示为
                      (7)。
本发明的有益效果是:本文提出的方法不仅提高了物体的正确识别率,而且降低了识别时间。
附图说明
图1为物体识别流程图;
图2 为COIL-20中部分物体的不同视角图;
图3 为图2各物体Gabor特征提取图;
图4为不同特征向量的维数对识别率的影响对比图。
具体实施方式
Gabor小波是D.Gabor最早在20世纪40年代提出的,它在提取物体的局部空间和频率域信息方面具有较好的特性。后来J.Daugman提出了二维Gabor滤波器,并把该滤波器应用于计算机视觉研究中。二维Gabor小波对于图像的边缘敏感,能够提供较好的方向选择和尺度选择特性,是图像的多尺度和多方向表示及分析的重要工具;Gabor小波对于光照变化不敏感,能够提供对光照变化良好的适应性,因此其被广泛应用于图像处理和模式识别领域。通常使用的二维Gabor滤波器函数的一般形式为
     (1)
                (2)
其中:分别是在x和y方向的标准差,确定了函数的空间扩展。把作为母小波,对进行适当的尺度和旋转变换,可得一组自相似的滤波器。
                     (3)
其中,m, n为整数,,K为方向总数,为尺度因子。
为一幅给定的图像,则其Gabor小波变换可定义为:
      (4)
其中*代表共轭复数。纹理区域具有空间相似性,所以变换参数的均值可表示该区域的纹理特征并进行分类。的计算公式如下
                     (5)
             (6)
设采用了P个方向和Q个尺度,则特征向量可表示为
                      (7)
(一)Gabor特征提取
在特征提取方面,Gabor小波与其它方法相比有以下优势:第一,其具有优良的空间局部性和方向选择性,能够抓住图像局部区域内多个方向的空间频率(尺度)和局部性结构特征;第二,其处理的数据量较少,能满足实时性要求;第三,小波变换对光照变化不敏感,且能容忍一定程度的图像旋转和变形,能提高算法的鲁棒性。因此,Gabor特征被广泛应用于人脸识别、文字识别、车牌识别、虹膜识别和物体识别等方面。
在Gabor特征提取算法中,Gabor滤波器的特性主要由尺度和方向两个参数决定,改变尺度和方向的值,就可得到一组方向和尺度不同的Gabor滤波器。考虑到算法的处理时间和有效性,选取0°、30°、60°、90°、120°、150°共六个方向能满足物体识别的要求。除此之外,对于一个N*N的纹理图像,选择四个尺度,这样就得到24个Gabor通道滤波器。
采用双重卷积,纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积,将两个卷积后图像的和取平方根,得到每个通道的输出图像,其结果与相位无关。每个通道输出图像的均值和标准差用来表示纹理特征。这样就可以从每幅图像中提取出48个特征,形成48维特征矢量。
(二)基于SVM的三维物体识别
通过以上特征提取方法,得到的48维特征矢量中存在大量冗余信息,会对物体识别带来一些不利影响,导致计算复杂度增加,识别准确率下降。主成分分析(PCA)[14]选择最具有代表性的特征,有效地消除特征维间的冗余信息,加快学习速度。因此本文采用PCA对物体特征进行冗余信息的消除,减少要输入的特征矢量的维数。
消除冗余信息后,就可根据这些保留的特征矢量利用SVM对物体进行分类识别。 
设线性可分样本集为是类别号,则D维空间中线性判别函数为
                    (8)
其中,为n维法向量,b为偏移量。
分类面方程为
                       (9)
将判别函数归一化,使两类样本都满足,也就是使距离分类面最近的样本满足,这样分类间隔等于,该值越大,分类效果越好。间隔最大也就是使最小。要满足分类面对所有样本都正确分类,就是要满足
               (10)
满足以上公式,并且使最小的分类面即是最优分类面,样本中离分类面最近的点且平行于最优分类面的超平面上的样本,即是使式(10)等号成立的样本,称为支持向量。用Lagrange乘子,构造拉格朗日函数
          (11)
式中,为Lagrange乘子且满足。考虑到满足KKT条件,有
                  (12)
于是求得最优超平面的决策函数
             (13)
式中,为确定最优超平面的参数。对样本x,计算就可以判断x所属的分类。对非支持向量,都为0。
在线性不可分的情况下,可在式(10)中引入松弛变量
                (14)
因此,目标函数和约束条件变为
             (15)
式中,C为惩罚参数,控制对错分样本的惩罚程度。
物体识别属于非线性问题,根据模式识别的原理,可将低维空间的非线性不可分问题投影到高维空间,将其转化为线性可分问题。为了求最优分类面,用核函数代替点积,SVM的分类决策函数变为
           (16)
经常用到的核函数[15]有:线性核函数,径向基(RBF)核函数,多项式核函数,Sigmoid核函数。本算法中选择RBF核函数作为SVM的核函数。
                  (17)
其中
三维物体的识别流程如图1所示。
(三)实验结果及分析
为了验证本文物体识别算法的有效性,采用COIL-20图像数据库的物体进行实验。算法采用matlab7.0进行设计。COIL-20图像数据库是目前广泛用来测试物体识别算法的图像库,其包含20个外形差异很大、日常生活中的物体, 每个物体有72个不同视角的图像,一共1440幅,图像分辨率为。其中部分图像如图2所示,同一物体的两幅图像视角差为30°。对每一个物体,每隔10°选择一幅图像,这样每个物体共有36个视角图像(0°、10°、20°、…、350°),20个物体共720幅图像组成训练样本集,用于训练;剩下的720幅图像组成测试样本集,用于测试。
对每幅图像,采用Gabor特征提取方法获取其48维特征矢量,图2中各物体的Gabor特征提取结果如图3所示。然后用PCA降维后作为输入向量,进入SVM中训练和识别。我们实验了不同的RBF参数、不同的惩罚参数和不同的特征向量的维数对识别结果的影响。经过大量实验发现,当时,分类效果较好。提取的特征向量的维数n,可通过控制PCA来实现,n取不同的值,识别率不同。对相同的训练样本和测试样本,采用BP神经网络和SVM的方法分别进行识别,其对比结果如图4所示。为了更好的评价算法的性能,我们从识别率和识别时间两方面,进行多种算法的比较,其结果如表1所示。其中识别时间包括读取图像时间、提取Gabor特征的时间、PCA处理时间和用BPNN或SVM进行识别分类的时间。
表1 不同方法的识别率比较
算法 BPNN SVM PCA+BPNN PCA+SVM
正确识别率(%) 89.3 90.7 90.5 92.8
错误识别率(%) 10.7 9.3 9.5 7.2
识别时间(s) 7.25 6.31 9.98 8.54
从图4的识别结果可以看出:
不同的特征向量维数,识别率不同。n的值太小,很多重要的特征没有统计上来,导致识别率明显下降;n的值太大,会存在冗余的信息,对识别率没有贡献,这样识别率不会有太大的提高。因此n的值要选择适当,既不会造成重要信息的遗漏,也不会存在冗余信息。本文通过多次实验,发现n=20是比较合理的。
从表1的识别结果可以看出:
(1)识别率方面,用SVM的方法识别率要高于用BPNN的方法,主要是因为SVM能够很好地克服BPNN的局部最小和过拟合等缺陷,其泛化能力更强,正确识别率有所提高,错误识别率相应降低;基于PCA方法的识别率高于基于无PCA的方法,主要是因为经过主成分分析后,特征之间的冗余信息被消除了,不仅减少了该算法输入向量的维数,而且还加快了该算法的学习速度,使得正确识别率相应提高。
(2)识别时间方面,用SVM的方法所用时间少于用BPNN的方法,主要是因为用BPNN方法处理过程复杂,所用时间较长;基于PCA的方法所用时间多于基于无PCA的方法,主要是因为用PCA进行降维处理,也需要一定的时间。
物体识别是计算机视觉的研究热点之一,如何提高物体的正确识别率和降低识别时间是众多学者最关心的问题。本文提出一种结合Gabor小波和SVM的物体识别方法,首先提取物体的Gabor特征,然后用PCA来消除冗余的特征信息,加快运算速度,最后利用SVM分类器对提取的重要特征进行分类识别。因此,将二者结合具有很好的可行性和实际意义。并将该方法应用于哥伦比亚图像库COIL-20进行实验。并将本文所提的方法与BPNN的方法进行比较,实验结果表明,本文提出的方法不仅提高了物体的正确识别率,而且降低了识别时间,验证了本文方法的可行性和有效性。

Claims (4)

1.结合Gabor小波和SVM进行物体识别的方法,其特征在于:
步骤一、对原始图像进行Gabor特征提取,得到的48维特征矢量;
步骤二、对步骤一中的得到的48维特征矢量,采用PCA消除特征维间的冗余信息,得到多维主特征矢量;
步骤三、利用SVM对多维主特征矢量进行分类识别。
2.如权利要求1所述的结合Gabor小波和SVM进行物体识别的方法,其特征在于:所述的48维特征矢量的提取方法是,Gabor滤波器的特性主要由尺度                                                和方向两个参数决定,改变尺度和方向的值,就可得到一组方向和尺度不同的Gabor滤波器,选取共六个方向能满足物体识别的要求,对于一个N*N的纹理图像,选择四个尺度,这样就得到24个Gabor通道滤波器,采用双重卷积,纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积,将两个卷积后图像的和取平方根,得到每个通道的输出图像,其结果与相位无关,每个通道输出图像的均值和标准差用来表示纹理特征,从每幅图像中提取出48个特征,形成48维特征矢量。
3.如权利要求2所述的结合Gabor小波和SVM进行物体识别的方法,其特征在于:所述的选取六个方向为0°、30°、60°、90°、120°和150°。
4.如权利要求2所述的结合Gabor小波和SVM进行物体识别的方法,其特征在于:所述的所述的Gabor滤波器函数的一般形式为
     (1)
                (2)
其中:分别是在x和y方向的标准差,确定了函数的空间扩展,把作为母小波,对进行适当的尺度和旋转变换,可得一组自相似的滤波器;
                     (3)
其中,m, n为整数,,K为方向总数,为尺度因子;
为一幅给定的图像,则其Gabor小波变换可定义为:
      (4)
其中*代表共轭复数,纹理区域具有空间相似性,所以变换参数的均值可表示该区域的纹理特征并进行分类,的计算公式如下
                     (5)
             (6)
设采用了P个方向和Q个尺度,则特征向量可表示为
                      (7)。
CN201410264158.XA 2014-06-16 2014-06-16 结合Gabor小波和SVM进行物体识别的方法 Pending CN104008389A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410264158.XA CN104008389A (zh) 2014-06-16 2014-06-16 结合Gabor小波和SVM进行物体识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410264158.XA CN104008389A (zh) 2014-06-16 2014-06-16 结合Gabor小波和SVM进行物体识别的方法

Publications (1)

Publication Number Publication Date
CN104008389A true CN104008389A (zh) 2014-08-27

Family

ID=51369038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410264158.XA Pending CN104008389A (zh) 2014-06-16 2014-06-16 结合Gabor小波和SVM进行物体识别的方法

Country Status (1)

Country Link
CN (1) CN104008389A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268535A (zh) * 2014-10-10 2015-01-07 上海海事大学 一种二维图像的特征提取方法
CN105139003A (zh) * 2015-09-17 2015-12-09 桂林远望智能通信科技有限公司 一种动态人脸识别系统及方法
CN106485278A (zh) * 2016-10-13 2017-03-08 河南科技大学 一种基于剪切波和高斯混合模型的图像纹理分类方法
CN107817461A (zh) * 2016-09-12 2018-03-20 中国电力科学研究院 电力仪表自动校对装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523533A (zh) * 2002-12-06 2004-08-25 ���ǵ�����ʽ���� 人的检测方法和设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523533A (zh) * 2002-12-06 2004-08-25 ���ǵ�����ʽ���� 人的检测方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHEN LIN-LIN ETC.: ""Gabor Wavelet Selection and SVM Classification for Object Recognition"", 《ACTA AUTOMATICA SINICA》 *
赵娟: ""基于Gabor小波变换与支持向量机的纹理图像分割"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268535A (zh) * 2014-10-10 2015-01-07 上海海事大学 一种二维图像的特征提取方法
CN104268535B (zh) * 2014-10-10 2017-12-19 上海海事大学 一种二维图像的特征提取方法
CN105139003A (zh) * 2015-09-17 2015-12-09 桂林远望智能通信科技有限公司 一种动态人脸识别系统及方法
CN105139003B (zh) * 2015-09-17 2018-07-06 桂林远望智能通信科技有限公司 一种动态人脸识别系统及方法
CN107817461A (zh) * 2016-09-12 2018-03-20 中国电力科学研究院 电力仪表自动校对装置
CN106485278A (zh) * 2016-10-13 2017-03-08 河南科技大学 一种基于剪切波和高斯混合模型的图像纹理分类方法

Similar Documents

Publication Publication Date Title
Yuan et al. Tensor ring decomposition with rank minimization on latent space: An efficient approach for tensor completion
Yang et al. Feature selection in face recognition: A sparse representation perspective
Ebied Feature extraction using PCA and Kernel-PCA for face recognition
Hotta Robust face recognition under partial occlusion based on support vector machine with local Gaussian summation kernel
CN103268497B (zh) 一种人脸姿态检测方法与在人脸识别中的应用
Yuan et al. Fractional-order embedding canonical correlation analysis and its applications to multi-view dimensionality reduction and recognition
CN103136520B (zh) 基于pca-sc算法的形状匹配和目标识别方法
Choi et al. Face recognition based on 2D images under illumination and pose variations
CN107273926A (zh) 一种基于余弦相似度加权的线性判别分析降维方法
CN105138998A (zh) 基于视角自适应子空间学习算法的行人重识别方法及系统
CN102930300B (zh) 一种飞机目标识别方法及系统
CN101872424A (zh) 基于Gabor变换最优通道模糊融合的人脸表情识别方法
Zhou et al. Kernel-based sparse representation for gesture recognition
CN103530645A (zh) 基于局部二值模式和Zernike矩的纹理图像分类方法及系统
CN102708364A (zh) 基于分级分类器的指纹图像分类方法
CN104008389A (zh) 结合Gabor小波和SVM进行物体识别的方法
Ma et al. VoD: a novel image representation for head yaw estimation
CN112818779A (zh) 一种基于特征优选与多种特征融合的人体行为识别方法
CN109815440B (zh) 联合图优化和投影学习的维数约简方法
CN104573717B (zh) 有监督的流形学习算法
Ergin et al. Face Recognition by Using 2D Orthogonal Subspace Projections.
CN101877065B (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
CN104008383A (zh) 基于流形学习线性化的高光谱图像特征提取算法
Jiang et al. Face recognition in global harmonic subspace
CN104573727B (zh) 一种手写体数字图像降维方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140827