CN103177265B

CN103177265B - 基于核函数与稀疏编码的高清图像分类方法

Info

Publication number: CN103177265B
Application number: CN201310097406.1A
Authority: CN
Inventors: 徐颂华; 周凡; 邓伟财; 盛建强
Original assignee: National Sun Yat Sen University
Current assignee: National Sun Yat Sen University
Priority date: 2013-03-25
Filing date: 2013-03-25
Publication date: 2016-09-14
Anticipated expiration: 2033-03-25
Also published as: CN103177265A

Abstract

本发明公开了一种基于核函数与稀疏编码的高清图像分类方法，包括以下步骤：提取每张高清图像的视觉特征；对所述的视觉特征进行核函数映射，将视觉特征的欧氏空间变换成度量空间；根据所述变换后的视觉特征生成高清图像类别的稀疏编码；依据所述的高清图像类别的稀疏编码建立图像非线性分类器，对每个特征赋予权值，确定所述高清图像所属的类别。本发明能够通过视觉特征的核函数映射，自动地根据特征的相关性赋予权值，提高强相关性的特征对分类能力的影响，并利用核方法减少分类过程的运算时间，大大减少了计算量，有效地提高分类的效率，使分类方法对高清图像数据集的样本空间分布具有较强的自适应性，对复杂的图像具有更好的鲁棒性。

Description

基于核函数与稀疏编码的高清图像分类方法

技术领域

本发明涉及数字图像处理领域，具体涉及一种基于核函数与稀疏编码的高清图像分类方法。

背景技术

目前，随着计算机网络的迅速发展、数字媒体技术及智能信息处理技术的发展和广泛应用，大规模图像资源不断出现。面对着海量的图像信息，如何对图像进行分类或标注以便快速地、有效地从海量图像数据中检索出所感兴趣的图像已经人工智能和模式识别中的研究热点，在科学研究、国防军事、工业生产、航空航天、生物医学、交通监控等领域有着广泛的应用。

传统的方法是通过关键字对图像进行人工标注，但这种方法是非常耗时的，并具有较大的主观性，对于相同的图像，不同的人可能产生不同的标注结果，因此这个方法在当今“信息灾难”的时代是不可行的。

对图像分类的研究的几十年历史，期间涌现了各种基于不同理论的分类方法，但是，该领域一直没有形成一个统一的理论体系指导新的分类方法的设计与实现。近几年来，图像分类的常用方法包括统计方法和结构方法，但统计方法在图像分类领域中表现活跃，产生了很多新的方法，如神经网络方法、支持向量机（Support Vector Machine，SVM）方法及Boosting方法。根据实现方法的不同，统计方法可以分为：

1）非监督分类法：又称聚类分析法，根据模式之间的相似性进行类别划分，将相似性强的模式划分为同一个类别。该方法不需要对分类数据有较深入的了解，自适应地形成分类数据集，但分类效果在复杂数据中不太理想。

2）监督分类法：根据预先已知类别的训练样本，得到各类在特征空间的分布规模，并利用这个分布规律对未知数据进行分类方法。该方法充分利用分类数据的先验知识，并可通过反复检验训练样本，提高分类精度，因此该方法在高清图像分类中广泛应用。

目前支持向量机(SVM)广泛应用于图像分类领域并取得良好的分类效果，最早的支持向量机(SVM)方法是由Vapnik和Chervonenkis在“Support-Vector Networks,MachineLearning,20,1995.”一文中提出。支持向量机(SVM)是新型机器学习方法，具有完备的统计学习理论基础，它采用结构风险最小化原则代替传统统计学中的基于大样本的经验风险最小化原则，克服了神经网络受到网络结构复杂性和样本容量的影响大，容易出现过学习或低泛化能力的不足，对于小样本数据分析具有出色的学习能力和推广能力，在模式识别和函数估计中得到了有效的应用，但该方法仍存在以下问题：

（1）SVM方法对大规模训练样本难以实施，由于SVM是借助二次规划来求解支持向量，而求解二次规划将涉及m阶矩阵的计算（m为样本的个数），当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。

（2）SVM方法的复杂度会随特征个数的增加而快速增加，用来训练分类器和测试结果的样本数量会随着特征的数量呈指数关系增长；若增加适应性不强的特征或者与已有特征有较强相关性的特征，反而会使分类器的分类能力下降，降低系统识别分类的能力。

发明内容

本发明的目的是对高清图像提供一种分类方法，该方法能够解决目前监督分类方法的分类速度慢、复杂度随着特征个数增加而指数增长、相关性不强的特征影响分类精度的问题。

本发明提供一种基于核函数与稀疏编码的高清图像分类方法，包括以下步骤：提取每张高清图像的视觉特征；对视觉特征的欧氏空间进行核函数映射；根据变换后的视觉特征生成高清图像类别的稀疏编码；依据所述的高清图像类别的稀疏编码建立图像非线性分类器，确定所述高清图像所属的类别。

较佳地，所述提取每张高清图像的视觉特征包括：提取每张图像的颜色、纹理、形状、方向梯度直方图、尺度不变特征转换特征作为其视觉特征X=[X¹,…,X^K]，其中，K为视觉特征的数量。

较佳地，所述对视觉特征的欧氏空间进行核函数映射包括：对所述的视觉特征进行核函数映射将视觉特征的欧氏空间变换成度量空间。

较佳地，所述根据变换后的视觉特征生成高清图像类别的稀疏编码包括：定义高清图像相互间的线性表示为

定义高清图像的重构误差为

根据重构误差最优化和编码尽量稀疏原则，确定高清图像类别的稀疏编码。

较佳地，所述根据重构误差最优化和编码尽量稀疏原则，确定高清图像类别的稀疏编码的步骤包括：

高清图像的稀疏编码矩阵

R = [r_{j}^{k}], k = 1,2, \cdot \cdot \cdot K; j = 1,2, \cdot \cdot \cdot, J,

为第j个类别的第k个特征的稀疏编码，K为所述视觉特征的数量，J为高清图像的类别数，则稀疏编码矩阵R应满足

其中，为第k个视觉特征的核函数映射，为第j个类别的高清图像训练样本集的第k个视觉特征的特征向量，为第j个类别的高清图像的稀疏编码，μ为平衡参数，y^k为某个高清图像的第k个视觉特征的特征向量。

较佳地，所述依据所述的高清图像类别的稀疏编码建立图像非线性分类器，确定所述高清图像所属的类别的步骤包括：确定高清图像的K个视觉特征的权重w^k(k=1,2,…K)；根据所述的稀疏编码矩阵R和视觉特征的权重向量w^k(k=1,2,…K)，构建高清图像非线性分类器为：

其中，y^k为待分类的高清图像样本的第k个视觉特征的特征向量。

较佳地，所述高清图像的K个视觉特征的权重w^k(k=1,2,…K)应满足：

\min_{σ, ϵ, w} - σ + \frac{1}{N} Σ_{i = 1}^{N} ϵ_{i},

s . t . \underset{&ForAll; i = 1,2, \cdot \cdot \cdot, N, j = 1,2, \cdot \cdot \cdot, J, j &NotEqual; l_{i}}{Σ_{k = 1}^{K} w^{k} λ_{i, l_{i}}^{k} - ϵ_{i} \leq Σ_{k = 1}^{K} w^{k} λ_{i, j}^{k} - σ,}

Σ_{k = 1}^{K} w^{k} = 1, σ &GreaterEqual; 0, ϵ_{i} &GreaterEqual; 0, &ForAll; i, k

其中，ε为松弛变量，σ为差额参数，

V_{val} = {(v_{i}^{1}, \cdot \cdot \cdot, v_{i}^{K}), l_{i}}_{i = 1}^{N}, l_{i} &Element; {1, \cdot \cdot \cdot, J}

为高清图像的验证样本集，l为相应的高清图像的类别，为第i个高清图像样本的重构误差。

本发明的技术方案与现有技术相比具有以下优点：

（1）本发明由于使用核函数方法对视觉特征进行空间变换，避免高维特征空间的内积运算，解决了在高维特征空间中计算的“维数灾难”和减少分类过程的时间等问题；

（2）本发明由于使用了稀疏编码方法对图像相互之间进行表示，充分考虑了同类图像之间潜在的关联，有效地提高了分类的精度；

（3）本发明由于根据特征的相关性对各个视觉特征进行赋予权值，解决了适应性不强的或者与已有特征有较强相关性的特征对分类精度的反作用效果，进一步提高了分类的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明的基于核函数与稀疏编码的高清图像分类方法流程图；

图2是本发明与现有的最近子空间法（NS）和支持向量机（SVM）在标准图像集the17category Oxford Flowers data set上的不同视觉特征的对比实验结果图；

图3是本发明与现有特征结合方法NS、SRC、MKL在标准图像集the17categoryOxford Flowers data set的对比实验结果图；

图4是本发明与现有的最近子空间法（NS）和支持向量机（SVM）在标准图像集the102category Oxford Flowers data set上的不同视觉特征是对比较实验结果图；

图5是本发明与现有特征结合方法NS、SRC、MKL在标准图像集the102categoryOxford Flowers data set上的对比实验结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明方案基于现有技术分类方法所存在的不足，提出了基于核方法与稀疏编码的非线性分类方法，能够自动地根据特征的相关性赋予权值，提高强相关性的特征对分类能力的影响，并利用核方法减少分类过程的运算时间，有效地提高分类的效率。

参照图1，本技术方案的基于核函数与稀疏编码的高清图像分类方法包括以下的步骤：

步骤S001：提取每张高清图像的视觉特征。

首先，提取每张图像的特征（颜色、纹理、形状、方向梯度直方图(HOG)、尺度不变特征转换（SIFT）等）Xⁱ,i=1,…,K，K为视觉特征的数量；

然后，根据S1.1得到图像的视觉特征为X=[X¹,…,X^K]。

步骤S002：对视觉特征的欧氏空间进行核函数映射。

对视觉特征进行核函数映射，将视觉特征的欧氏空间变换成其它的度量空间（如再生核希尔伯特空间）。

步骤S003：根据变换后的视觉特征生成高清图像类别的稀疏编码。

首先，定义高清图像相互间的线性表示为

其次，定义高清图像的重构误差为

然后，根据重构误差最优化和编码尽量稀疏原则，确定高清图像类别的稀疏编码。

高清图像的稀疏编码矩阵

R = [r_{j}^{k}], k = 1,2, \cdot \cdot \cdot K; j = 1,2, \cdot \cdot \cdot, J,

为第j个类别的第k个特征的稀疏编码，K为所述视觉特征的个数，J为高清图像的类别数，则稀疏编码矩阵R应满足

其中，为第k个视觉特征的核函数映射，为第j个类别的高清图像训练样本集的第k个视觉特征的特征向量，为第j个类别的高清图像的稀疏编码，μ为平衡参数，y^k为某个高清图像的第k个视觉特征的特征向量；

步骤S004：依据所述的高清图像类别的稀疏编码建立图像非线性分类器，确定所述高清图像所属的类别。

首先，根据高清图像的K个视觉特征的重构误差对分类效果的影响程度，确定该特征的权重w^k(k=1,2,…K)。

这K个视觉特征的权重w^k(k=1,2,…K)应满足：

\min_{σ, ϵ, w} - σ + \frac{1}{N} Σ_{i = 1}^{N} ϵ_{i},

s . t . \underset{&ForAll; i = 1,2, \cdot \cdot \cdot, N, j = 1,2, \cdot \cdot \cdot, J, j &NotEqual; l_{i}}{Σ_{k = 1}^{K} w^{k} λ_{i, l_{i}}^{k} - ϵ_{i} \leq Σ_{k = 1}^{K} w^{k} λ_{i, j}^{k} - σ,}

Σ_{k = 1}^{K} w^{k} = 1, σ &GreaterEqual; 0, ϵ_{i} &GreaterEqual; 0, &ForAll; i, k

其中，ε为松弛变量，σ为差额参数，

V_{val} = {(v_{i}^{1}, \cdot \cdot \cdot, v_{i}^{K}), l_{i}}_{i = 1}^{N}, l_{i} &Element; {1, \cdot \cdot \cdot, J}

为高清图像的验证样本集，l为相应的高清图像的类别；

其次，根据所述的稀疏编码矩阵R和视觉特征的权重向量w^k(k=1,2,…K)，构建高清图像非线性分类器为：

以下通过仿真实验验证本发明方法的有效性和实用性。

仿真内容：

（1）采用对比实验的形式，选择两个具有代表性的分类方法在同样的图像集上进行测试，以验证本发明的有效性。具体选择的是由Li等人提出的最近子空间（nearestsubspace，NS）方法，具体参考文献“Li,S.Z.:Face recognition based onnearest linear combinations.In:Proceedings of the IEEE Computer SocietyConference on Computer Vision and Pattern Recognition,pp.839–844.IEEEComputer Society,Washington,DC,USA(1998)”、由Vapnik和Chervonenkis提出的支持向量机（SVM）方法，具体参考文献“Vapnik,Chervonenkis.Support-Vector Networks,Machine Learning,20,1995.”和由P.Gehler和S.Nowozin提出的特征组合方法，具体参考文献“P.Gehler and S.Nowozin.On feature combination for multiclass objectclassification.In International Conference on Computer Vision.IEEE,2009”。

（2）使用标准图像集the17category Oxford Flowers data set、the102categoryOxford Flowers data set进行仿真实验，以验证本发明对不同图像集的分类效果。

实验一：图像集the17category Oxford Flowers data set是英国常见的花卉的图像数据集，它包括17类花卉，每一类包含80幅图像，本实验分别在单个特征情况、多个特征情况上对本发明的方法进行精度对比。在单个特征情况下，本实验分别在颜色（Color）、形状（Shape）、纹理（Texture）、HSV（hue saturation value）颜色空间（HSV）、方向梯度直方图(Histogram of Oriented Gradient，HOG)、尺度不变特征转换（Scale-invariantfeature transform,SIFT）等特征上对最近子空间法（NS）、支持向量机（SVM）和本发明方法进行分类精度对比，其分类结果如图2所示，仿真结果表明：本发明方法在不同特征下的分类精度都比NS和SVM方法高；在多个特征情况下，本实验分别对不同特征结合方法NS、SRC(sparse representation-based classifier)、MKL（Multiple Kernel Learning）和本发明方法进行分类精度对比，其分类结果如图3所示，仿真结果表明：本发明方法在相同特征情况下的分类效果均优于NS、SRC、MKL特征结合方法。

实验二：图像集the102category Oxford Flowers data set是英国常见的花卉的图像数据集，它包括102类花卉，每一类包含40到258幅图像，本实验分别在单个特征情况、多个特征情况上对本发明的方法进行精度对比。在单个特征情况下，本实验分别在HSV颜色空间（HSV）、方向梯度直方图(HOG)、尺度不变特征转换（SIFT）等特征上对最近子空间法（NS）、支持向量机（SVM）和本发明方法进行分类精度对比，其分类结果如图4所示，仿真结果表明：本发明方法在不同特征下的分类精度都比NS和SVM方法高；在多个特征情况下，本实验分别对不同特征结合方法NS、SRC、MKL和本发明方法进行分类精度对比，其分类结果如图5所示，仿真结果表明：本发明方法在相同特征情况下的分类效果均优于NS、SRC、MKL特征结合方法。

实验结果表明，本发明的方法的分类精度无论是在单个特征或者多特征情况下均比高于现有的监督分类方法。本发明的技术方案与现有技术相比具有以下优点：

（3）本发明由于根据特征的相关性对各个视觉特征进行赋予权值，解决了适应性不强的或者与已有特征有较强相关性的特征对分类精度的反作用效果，进一步提高了分类的精度；

以上对本发明实施例所提供的基于核函数与稀疏编码的高清图像分类方法，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于核函数与稀疏编码的高清图像分类方法，其特征在于，包括以下步骤：

提取每张高清图像的视觉特征；

对视觉特征的欧氏空间进行核函数映射；

根据变换后的视觉特征生成高清图像类别的稀疏编码；

依据所述的高清图像类别的稀疏编码建立图像非线性分类器，确定所述高清图像所属的类别；

其中：根据变换后的视觉特征生成高清图像类别的稀疏编码包括：

定义高清图像相互间的线性表示为

定义高清图像的重构误差为

根据重构误差最优化和编码尽量稀疏原则，确定高清图像类别的稀疏编码；

根据重构误差最优化和编码尽量稀疏原则，确定高清图像类别的稀疏编码的步骤包括：

高清图像的稀疏编码矩阵

R = [r_{j}^{k}], k = 1, 2, ... K; j = 1, 2, ..., J,

依据所述的高清图像类别的稀疏编码建立图像非线性分类器，确定所述高清图像所属的类别的步骤包括：

确定高清图像的K个视觉特征的权重w^k(k＝1,2,…K)；

根据所述的稀疏编码矩阵R和视觉特征的权重向量w^k(k＝1,2,…K)，构建高清图像非线性分类器为：

其中，y^k为待分类的高清图像样本的第k个视觉特征的特征向量；为第i个高清图像样本的重构误差。

2.如权利要求1所述的基于核函数与稀疏编码的高清图像分类方法，其特征在于，提取每张高清图像的视觉特征包括：

提取每张图像的颜色、纹理、形状、方向梯度直方图、尺度不变特征转换特征作为其视觉特征X＝[X¹,…,X^K]，其中，K为视觉特征的数量。

3.如权利要求1所述的基于核函数与稀疏编码的高清图像分类方法，其特征在于，所述对视觉特征的欧氏空间进行核函数映射包括：

对所述的视觉特征进行核函数映射将视觉特征的欧氏空间变换成度量空间。