CN104008389A

CN104008389A - 结合Gabor小波和SVM进行物体识别的方法

Info

Publication number: CN104008389A
Application number: CN201410264158.XA
Authority: CN
Inventors: 张蕾; 史恒亮; 向菲; 赵旭辉; 赵海霞; 普杰信
Original assignee: Henan University of Science and Technology
Current assignee: Henan University of Science and Technology
Priority date: 2014-06-16
Filing date: 2014-06-16
Publication date: 2014-08-27

Abstract

结合Gabor小波和SVM进行物体识别的方法。首先用Gabor小波变换对图像进行处理，然后用PCA进行降维，最后用SVM分类器进行分类识别。并将该方法应用于哥伦比亚图像库COIL-20进行实验，提高三维物体的识别率和降低识别时间。

Description

结合Gabor小波和SVM进行物体识别的方法

技术领域

本发明涉及物体识别，尤其涉及一种结合Gabor小波和SVM进行物体识别的方法。

背景技术

三维物体识别是模式识别和计算机视觉的重要研究领域之一。其主要任务是识别出图像中有什么类型的物体，并反映出物体在具体场景中的位置和方向。在实际的场景中，物体的观测数据受多因素的影响，会发生显著的变化，如：物体的形状、尺寸、光照和视角变化；噪声干扰；部分遮挡等。对计算机视觉系统而言，排除这些干扰，快速而准确地识别出物体的类别是比较困难的。三维物体识别主要包括两个关键步骤：特征提取和分类识别。对于特征提取，当前主要提取物体的颜色特征、形状特征、纹理特征。颜色是物体最直接、最重要的视觉特性之一，并且计算量较小，但其信息量比较简单，一般和其它特征联合使用。形状特征主要是指物体的不变矩特征，因不变矩比较复杂，计算量较大，所以现在用的不多。纹理特征是对图像空间信息进行定量描述，具有旋转不变性，并对噪声有较好的鲁棒性。

发明内容

为解决上述技术问题，一种结合Gabor小波和SVM进行物体识别方法。首先用Gabor小波变换对图像进行处理，然后用PCA进行降维，最后用SVM分类器进行分类识别。并将该方法应用于哥伦比亚图像库COIL-20进行实验，提高三维物体的识别率和降低识别时间。

为实现上述技术目的，本发明所采用的技术方案是：结合Gabor小波和SVM进行物体识别的方法：

步骤一、对原始图像进行Gabor特征提取，得到的48维特征矢量；

步骤二、对步骤一中的得到的48维特征矢量，采用PCA消除特征维间的冗余信息，得到多维主特征矢量；

步骤三、利用SVM对多维主特征矢量进行分类识别。

所述的48维特征矢量的提取方法是，Gabor滤波器的特性主要由尺度和方向两个参数决定，改变尺度和方向的值，就可得到一组方向和尺度不同的Gabor滤波器，选取共六个方向能满足物体识别的要求，对于一个N*N的纹理图像，选择四个尺度，这样就得到24个Gabor通道滤波器，采用双重卷积，纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积，将两个卷积后图像的和取平方根，得到每个通道的输出图像，其结果与相位无关，每个通道输出图像的均值和标准差用来表示纹理特征，从每幅图像中提取出48个特征，形成48维特征矢量。

所述的选取六个方向为0°、30°、60°、90°、120°和150°。

所述的所述的Gabor滤波器函数的一般形式为

（1）

（2）

其中：，，和分别是在x和y方向的标准差，确定了函数的空间扩展，把g(x，y)作为母小波，对g(x，y)进行适当的尺度和旋转变换，可得一组自相似的滤波器；

（3）

其中，m, n为整数，，K为方向总数，为尺度因子；

设为一幅给定的图像，则其Gabor小波变换可定义为：

（4）

其中*代表共轭复数。纹理区域具有空间相似性，所以变换参数的均值和可表示该区域的纹理特征并进行分类。和的计算公式如下

（5）

（6）

设采用了P个方向和Q个尺度，则特征向量可表示为

（7）。

本发明的有益效果是：本文提出的方法不仅提高了物体的正确识别率，而且降低了识别时间。

附图说明

图1为物体识别流程图；

图2 为COIL-20中部分物体的不同视角图；

图3 为图2各物体Gabor特征提取图；

图4为不同特征向量的维数对识别率的影响对比图。

具体实施方式

Gabor小波是D.Gabor最早在20世纪40年代提出的，它在提取物体的局部空间和频率域信息方面具有较好的特性。后来J.Daugman提出了二维Gabor滤波器，并把该滤波器应用于计算机视觉研究中。二维Gabor小波对于图像的边缘敏感，能够提供较好的方向选择和尺度选择特性，是图像的多尺度和多方向表示及分析的重要工具；Gabor小波对于光照变化不敏感，能够提供对光照变化良好的适应性，因此其被广泛应用于图像处理和模式识别领域。通常使用的二维Gabor滤波器函数的一般形式为

（1）

（2）

其中：，，和分别是在x和y方向的标准差，确定了函数的空间扩展。把作为母小波，对进行适当的尺度和旋转变换，可得一组自相似的滤波器。

（3）

其中，m, n为整数，，K为方向总数，为尺度因子。

设为一幅给定的图像，则其Gabor小波变换可定义为：

（4）

（5）

（6）

设采用了P个方向和Q个尺度，则特征向量可表示为

（7）

（一）Gabor特征提取

在特征提取方面，Gabor小波与其它方法相比有以下优势：第一，其具有优良的空间局部性和方向选择性，能够抓住图像局部区域内多个方向的空间频率（尺度）和局部性结构特征；第二，其处理的数据量较少，能满足实时性要求；第三，小波变换对光照变化不敏感，且能容忍一定程度的图像旋转和变形，能提高算法的鲁棒性。因此，Gabor特征被广泛应用于人脸识别、文字识别、车牌识别、虹膜识别和物体识别等方面。

在Gabor特征提取算法中，Gabor滤波器的特性主要由尺度和方向两个参数决定，改变尺度和方向的值，就可得到一组方向和尺度不同的Gabor滤波器。考虑到算法的处理时间和有效性，选取0°、30°、60°、90°、120°、150°共六个方向能满足物体识别的要求。除此之外，对于一个N*N的纹理图像，选择四个尺度，这样就得到24个Gabor通道滤波器。

采用双重卷积，纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积，将两个卷积后图像的和取平方根，得到每个通道的输出图像，其结果与相位无关。每个通道输出图像的均值和标准差用来表示纹理特征。这样就可以从每幅图像中提取出48个特征，形成48维特征矢量。

（二）基于SVM的三维物体识别

通过以上特征提取方法，得到的48维特征矢量中存在大量冗余信息，会对物体识别带来一些不利影响，导致计算复杂度增加，识别准确率下降。主成分分析（PCA）[14]选择最具有代表性的特征，有效地消除特征维间的冗余信息，加快学习速度。因此本文采用PCA对物体特征进行冗余信息的消除，减少要输入的特征矢量的维数。

消除冗余信息后，就可根据这些保留的特征矢量利用SVM对物体进行分类识别。

设线性可分样本集为，，，是类别号，则D维空间中线性判别函数为

（8）

其中，为n维法向量，b为偏移量。

分类面方程为

（9）

将判别函数归一化，使两类样本都满足，也就是使距离分类面最近的样本满足，这样分类间隔等于，该值越大，分类效果越好。间隔最大也就是使最小。要满足分类面对所有样本都正确分类，就是要满足

（10）

满足以上公式，并且使最小的分类面即是最优分类面，样本中离分类面最近的点且平行于最优分类面的超平面上的样本，即是使式（10）等号成立的样本，称为支持向量。用Lagrange乘子，构造拉格朗日函数

（11）

式中，为Lagrange乘子且满足。考虑到满足KKT条件，有

（12）

于是求得最优超平面的决策函数

（13）

式中，，为确定最优超平面的参数。对样本x，计算就可以判断x所属的分类。对非支持向量，都为0。

在线性不可分的情况下，可在式（10）中引入松弛变量

（14）

因此，目标函数和约束条件变为

（15）

式中，C为惩罚参数，控制对错分样本的惩罚程度。

物体识别属于非线性问题，根据模式识别的原理，可将低维空间的非线性不可分问题投影到高维空间，将其转化为线性可分问题。为了求最优分类面，用核函数代替点积，SVM的分类决策函数变为

（16）

经常用到的核函数[15]有：线性核函数，径向基（RBF）核函数，多项式核函数，Sigmoid核函数。本算法中选择RBF核函数作为SVM的核函数。

（17）

其中。

三维物体的识别流程如图1所示。

（三）实验结果及分析

为了验证本文物体识别算法的有效性，采用COIL-20图像数据库的物体进行实验。算法采用matlab7.0进行设计。COIL-20图像数据库是目前广泛用来测试物体识别算法的图像库，其包含20个外形差异很大、日常生活中的物体, 每个物体有72个不同视角的图像，一共1440幅，图像分辨率为。其中部分图像如图2所示,同一物体的两幅图像视角差为30°。对每一个物体，每隔10°选择一幅图像，这样每个物体共有36个视角图像（0°、10°、20°、…、350°），20个物体共720幅图像组成训练样本集，用于训练；剩下的720幅图像组成测试样本集，用于测试。

对每幅图像，采用Gabor特征提取方法获取其48维特征矢量，图2中各物体的Gabor特征提取结果如图3所示。然后用PCA降维后作为输入向量，进入SVM中训练和识别。我们实验了不同的RBF参数、不同的惩罚参数和不同的特征向量的维数对识别结果的影响。经过大量实验发现，当，时，分类效果较好。提取的特征向量的维数n，可通过控制PCA来实现，n取不同的值，识别率不同。对相同的训练样本和测试样本，采用BP神经网络和SVM的方法分别进行识别，其对比结果如图4所示。为了更好的评价算法的性能，我们从识别率和识别时间两方面，进行多种算法的比较，其结果如表1所示。其中识别时间包括读取图像时间、提取Gabor特征的时间、PCA处理时间和用BPNN或SVM进行识别分类的时间。

表1 不同方法的识别率比较

算法	BPNN	SVM	PCA+BPNN	PCA+SVM
					正确识别率（%）	89.3	90.7	90.5	92.8
错误识别率（%）	10.7	9.3	9.5	7.2
					识别时间（s）	7.25	6.31	9.98	8.54

从图4的识别结果可以看出：

不同的特征向量维数，识别率不同。n的值太小，很多重要的特征没有统计上来，导致识别率明显下降；n的值太大，会存在冗余的信息，对识别率没有贡献，这样识别率不会有太大的提高。因此n的值要选择适当，既不会造成重要信息的遗漏，也不会存在冗余信息。本文通过多次实验，发现n=20是比较合理的。

从表1的识别结果可以看出：

（1）识别率方面，用SVM的方法识别率要高于用BPNN的方法，主要是因为SVM能够很好地克服BPNN的局部最小和过拟合等缺陷，其泛化能力更强，正确识别率有所提高，错误识别率相应降低；基于PCA方法的识别率高于基于无PCA的方法，主要是因为经过主成分分析后，特征之间的冗余信息被消除了，不仅减少了该算法输入向量的维数，而且还加快了该算法的学习速度，使得正确识别率相应提高。

（2）识别时间方面，用SVM的方法所用时间少于用BPNN的方法，主要是因为用BPNN方法处理过程复杂，所用时间较长；基于PCA的方法所用时间多于基于无PCA的方法，主要是因为用PCA进行降维处理，也需要一定的时间。

物体识别是计算机视觉的研究热点之一，如何提高物体的正确识别率和降低识别时间是众多学者最关心的问题。本文提出一种结合Gabor小波和SVM的物体识别方法，首先提取物体的Gabor特征，然后用PCA来消除冗余的特征信息，加快运算速度，最后利用SVM分类器对提取的重要特征进行分类识别。因此，将二者结合具有很好的可行性和实际意义。并将该方法应用于哥伦比亚图像库COIL-20进行实验。并将本文所提的方法与BPNN的方法进行比较，实验结果表明，本文提出的方法不仅提高了物体的正确识别率，而且降低了识别时间，验证了本文方法的可行性和有效性。

Claims

1.结合Gabor小波和SVM进行物体识别的方法，其特征在于：

步骤三、利用SVM对多维主特征矢量进行分类识别。

2.如权利要求1所述的结合Gabor小波和SVM进行物体识别的方法，其特征在于：所述的48维特征矢量的提取方法是，Gabor滤波器的特性主要由尺度和方向两个参数决定，改变尺度和方向的值，就可得到一组方向和尺度不同的Gabor滤波器，选取共六个方向能满足物体识别的要求，对于一个N*N的纹理图像，选择四个尺度，这样就得到24个Gabor通道滤波器，采用双重卷积，纹理图像与其对应每个通道的奇、偶对称Gabor滤波器分别进行卷积，将两个卷积后图像的和取平方根，得到每个通道的输出图像，其结果与相位无关，每个通道输出图像的均值和标准差用来表示纹理特征，从每幅图像中提取出48个特征，形成48维特征矢量。

3.如权利要求2所述的结合Gabor小波和SVM进行物体识别的方法，其特征在于：所述的选取六个方向为0°、30°、60°、90°、120°和150°。

4.如权利要求2所述的结合Gabor小波和SVM进行物体识别的方法，其特征在于：所述的所述的Gabor滤波器函数的一般形式为

（1）

（2）

其中：，，和分别是在x和y方向的标准差，确定了函数的空间扩展，把作为母小波，对进行适当的尺度和旋转变换，可得一组自相似的滤波器；

（3）

其中，m, n为整数，，K为方向总数，为尺度因子；

设为一幅给定的图像，则其Gabor小波变换可定义为：

（4）

其中*代表共轭复数，纹理区域具有空间相似性，所以变换参数的均值和可表示该区域的纹理特征并进行分类，和的计算公式如下

（5）

（6）

设采用了P个方向和Q个尺度，则特征向量可表示为

（7）。