CN104915684A

CN104915684A - 一种基于鲁棒多平面支持向量机的图像识别方法及装置

Info

Publication number: CN104915684A
Application number: CN201510372326.1A
Authority: CN
Inventors: 张召; 顾震峰; 李凡长; 张莉
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2015-06-30
Filing date: 2015-06-30
Publication date: 2015-09-16
Anticipated expiration: 2035-06-30
Also published as: CN104915684B

Abstract

本发明公开了一种基于鲁棒多平面支持向量机的图像识别方法及装置，包括：将测试图像向鲁棒线性分类器进行投影，获取测试图像对应各个类别的第一投影特征；其中，鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，紧凑类内散度矩阵与分离类间散度矩阵确定得到；将训练样本集中的样本图像的均值向鲁棒线性分类器进行投影，获取所述训练样本集均值在各个类别的第二投影特征；分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离；将所述距离的最小值所对应的类别确定为所述测试图像的类别。本发明所提供的图像识别方法及装置，有效提升了图像识别的鲁棒性。

Description

一种基于鲁棒多平面支持向量机的图像识别方法及装置

技术领域

本发明涉及计算机视觉和图像识别技术领域，特别是涉及一种基于鲁棒多平面支持向量机的图像识别方法及装置。

背景技术

随着计算机技术和智能化的不断发展，图像识别与分类已经发展成为计算机视觉与模式识别研究中的重要研究课题之一。图像识别通过计算机将纸质图像数字化，结合图像分析与描述，获取图像特征，在图像检索、人脸识别和机器人等研究领域中有着重大的意义，一旦研究成功并投入应用，将产生巨大的社会和经济效益。但是抽取图像特征的过程具有一定难度，到目前为止，图像识别方法距实用要求还有一定距离。目前，大部分研究工作集中在处理图像特征提取和识别问题，且也已取得一定的成果。但是真实世界中的图像(例如人脸图像、手写体等)通常包含噪音、数据破坏、数据缺失等问题，因此如何有效减少数据中的噪音或异类对图像特征提取和图像识别结果的不利影响需要进一步深入探讨。

近年来，鉴于传统支持向量机(SVM)的优越性能和泛化能力，被广泛应用于数据分类和图像识别等领域。但是SVM只输出一个超平面，对一些特殊分布的数据(如XOR)处理效果较差。鉴于此，近年来基于多平面的支持向量机学习技术被广泛关注。最具代表性的多平面SVM学习方法有GEPSVM(Generalized Proximal SVM)、TWSVM(TWIN SVM)和MVSVM(Multi-weight Vector Projection SVM)等。但是目前的多平面SVM方法均基于传统的2-范数距离度量，对数据中噪音非常敏感。另外，MVSVM还会受模型最优参数选择的困扰，且泛化特征值分析过程易遭遇奇异性问题。

因此，本发明提出一种将1-范数度量应用于多平面支持向量机的图像识别方法及装置，通过对训练样本进行鲁棒的判别学习，优化得到最具鉴别性的鲁棒线性分类器，对图像数据中可能包含的噪音或异类数据具有较强的鲁棒性和抗干扰性，且延续了多平面支持向量的优点。

发明内容

本发明的目的是提供一种基于鲁棒多平面支持向量机的图像识别方法及装置，目的在于解决现有技术中容易受到噪声干扰、易因参数选择造成误差以及学习系统不稳定等问题。

为解决上述技术问题，本发明提供一种基于鲁棒多平面支持向量机的图像识别方法，包括：

将测试图像向鲁棒线性分类器进行投影，获取所述测试图像对应各个类别的第一投影特征；其中，所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，紧凑类内散度矩阵与分离类间散度矩阵，确定得到的鲁棒投影最优向量；

将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影，获取所述训练样本集均值在各个类别的第二投影特征；

分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离；

将所述距离的最小值所对应的类别确定为所述测试图像的类别。

可选地，所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，紧凑类内散度矩阵与分离类间散度矩阵，确定得到的鲁棒投影最优向量包括：

建立基于1-范数度量的多平面支持向量机分类器模型；

对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。

可选地，所述建立基于1-范数度量的多平面支持向量机分类器模型包括：

获取预设的图像数据向量集合X＝[x₁,x₂,...,x_N]∈R^n×N，所述集合包括：有类别标签的训练样本集X_L＝[x₁,x₂,...,x_l]∈R^n×l以及无类别标签的测试样本集X_U＝[x₁,x₂,...,x_u]∈R^n×u，且满足样本数量l+u＝N；

所述训练样本集包括两个类别的样本集，A类样本集

X_{a} = [x_{1}, x_{2}, ..., x_{l a}] &Element; R^{n \times l_{1}} &Element; X_{L}

以及为B类样本集

X_{b} = [x_{1}, x_{2}, ..., x_{l b}] &Element; R^{n \times l_{2}} &Element; X_{L},

且满足训练样本数量l₁+l₂＝l。

可选地，所述对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括：

通过迭代优化，对鲁棒投影最优向量w₁、w₂的值不断更新，使得F(w₁)、F(w₂)的目标函数值最大；在F(w₁)、F(w₂)最大化到趋于不变时，对应的w₁、w₂为鲁棒投影最优向量；

其中，w₁＝arg max F(w₁)，w₁ ^Tw₁＝1，w₂＝arg max F(w₂)，w₂ ^Tw₂＝1，

F (w_{1}) = \frac{{|| {w_{1}}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - {w_{1}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}}{Σ_{i = 1}^{l_{a}} {|| {w_{1}}^{T} x_{a i} - {w_{1}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}, F (w_{2}) = \frac{{|| {w_{2}}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - {w_{2}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}{Σ_{i = 1}^{l_{b}} {|| {w_{2}}^{T} x_{b i} - {w_{2}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}},

n是图像数据样本的维度，N是样本的数量，w₁和w₂为所需求得的鲁棒投影最优向量w₁∈R^n×1，w₂∈R^n×1，l_a、l_b分别为两类样本的数量，x_i为样本集合中的单个样本，||·||₁为1-范数度量，F(w₁)的分母为实现类内距离最小、分子为实现类间距离最大。

本发明提供了一种基于鲁棒多平面支持向量机的图像识别装置，包括：

第一获取模块，用于将测试图像向鲁棒线性分类器进行投影，获取所述测试图像对应各个类别的第一投影特征；其中，所述鲁棒线性分类器中的投影向量为通过训练模块对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，确定得到的鲁棒投影最优向量；

第二获取模块，将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影，获取所述训练样本集均值在各个类别的第二投影特征；

计算模块，用于分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离；

确定模块，用于将所述距离的最小值所对应的类别确定为所述测试图像的类别。

可选地，所述训练模块包括：

建立模型单元，用于建立基于1-范数度量的多平面支持向量机分类器模型；

确定单元，用于对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。

可选地，所述建立模型单元用于建立基于1-范数度量的多平面支持向量机分类器模型包括：

所述建立模型单元具体用于获取预设的图像数据向量集合X＝[x₁,x₂,...,x_N]∈R^n×N，所述集合包括：有类别标签的训练样本集X_L＝[x₁,x₂,...,x_l]∈R^n×l以及无类别标签的测试样本集X_U＝[x₁,x₂,...,x_u]∈R^n×u，且满足样本数量l+u＝N；

所述训练样本集包括两个类别的样本集，A类样本集

X_{a} = [x_{1}, x_{2}, ..., x_{l a}] &Element; R^{n \times l_{1}} &Element; X_{L}

以及为B类样本集

X_{b} = [x_{1}, x_{2}, ..., x_{l b}] &Element; R^{n \times l_{2}} &Element; X_{L},

且满足训练样本数量l₁+l₂＝l。

可选地，所述确定单元用于对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括：

所述确定单元具体用于通过迭代优化，对鲁棒投影最优向量w₁、w₂的值不断更新，使得F(w₁)、F(w₂)的目标函数值最大；在F(w₁)、F(w₂)最大化到趋于不变时，对应的w₁、w₂为鲁棒投影最优向量；

F (w_{1}) = \frac{{|| {w_{1}}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - {w_{1}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}}{Σ_{i = 1}^{l_{a}} {|| {w_{1}}^{T} x_{a i} - {w_{1}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}, F (w_{2}) = \frac{{|| {w_{2}}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - {w_{2}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}{Σ_{i = 1}^{l_{b}} {|| {w_{2}}^{T} x_{b i} - {w_{2}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}},

n是图像数据样本的维度，N是样本的数量，w₁和w₂为所需求得的鲁棒投影最优向量，w₁∈R^n×1，w₂∈R^n×1，l_a、l_b分别为两类样本的数量，x_i为样本集合中的单个样本，||·||₁为1-范数度量，F(w₁)的分母为实现类内距离最小、分子为实现类间距离最大。

可选地，所述训练模块还包括：

训练预处理单元，用于对提取到的样本图像进行预处理操作。

可选地，所述预处理包括尺寸压缩和/或数据归一化处理。

本发明所提供的基于鲁棒多平面支持向量机的图像识别方法及装置，通过对图像训练样本进行判别学习，紧凑类内散度矩阵与分离类间散度矩阵。通过计算得到的最具鉴别性的鲁棒线性分类器，将样本外的测试图像进行投影，取与均值投影后的距离的最小值对应的类别，以对该测试图像进行类别鉴定，得到最准确的识别结果。本发明所提供的图像识别方法及装置，将1-范数度量应用于多平面支持向量机，有效提升了图像识别的鲁棒性，并且能够有效避免模型参数估计，稳定性更好。

附图说明

图1为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式的方法流程图；

图2为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式中确定鲁棒投影最优向量的过程的流程图；

图3为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的另一种具体实施方式的方法流程图；

图4为本发明所提供的基于鲁棒多平面支持向量机的图像识别装置的一种具体实施方式的结构框图；

图5为本发明实施例公开的一种基于鲁棒多平面支持向量机的图像识别过程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式的方法流程图如图1所示，该方法包括：

步骤S101：将测试图像向鲁棒线性分类器进行投影，获取所述测试图像对应各个类别的第一投影特征；其中，所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，紧凑类内散度矩阵与分离类间散度矩阵，确定得到的鲁棒投影最优向量；

步骤S102：将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影，获取所述训练样本集均值在各个类别的第二投影特征；

步骤S103：分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离；

步骤S104：将所述距离的最小值所对应的类别确定为所述测试图像的类别。

本发明所提供的图像识别方法，通过对图像训练样本进行判别学习，紧凑类内散度矩阵与分离类间散度矩阵。通过计算得到的最具鉴别性的鲁棒线性分类器，将样本外的测试图像进行投影，取与均值投影后的距离的最小值对应的类别，以对该测试图像进行类别鉴定，得到最准确的识别结果。本发明所提供的图像识别方法，将1-范数度量应用于多平面支持向量机，有效提升了图像识别的鲁棒性，并且能够有效避免模型参数估计，稳定性更好。

可选地，如图2所示，本发明所提供的基于鲁棒多平面支持向量机的图像识别方法中确定鲁棒投影最优向量的过程可以具体为：

步骤S201：建立基于1-范数度量的多平面支持向量机分类器模型；

步骤S202：对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。

本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的另一种具体实施方式的方法流程图如图3所示，该方法包括：

步骤S301：建立基于1-范数度量的多平面支持向量机分类器模型，对训练样本数据进行学习，同时紧凑类内离散度和分离类间离散度。

步骤S301可以具体为：

对于给定的一个图像数据向量集合X＝[x₁,x₂,...,x_N]∈R^n×N(其中，n是图像数据样本的维度，N是样本的数量)，其中包含有类别标签(共2个类别)的训练样本集X_L＝[x₁,x₂,...,x_l]∈R^n×l(其中

X_{a} = [x_{1}, x_{2}, ..., x_{l a}] &Element; R^{n \times l_{1}} &Element; X_{L}

为A类样本集，

X_{b} = [x_{1}, x_{2}, ..., x_{l b}] &Element; R^{n \times l_{2}} &Element; X_{L}

为B类样本集，且满足训练样本数量l₁+l₂＝l)和无任何标签的测试样本集X_U＝[x₁,x₂,...,x_u]∈R^n×u，且满足样本数量l+u＝N。

根据原始训练集计算得到一对最具鉴别性的鲁棒投影最优向量w₁∈R^n×1和w₂∈R^n×1，具体可以通过下式来实现：

w₁＝arg max F(w₁),其中w₁ ^Tw₁＝1,w₂＝arg max F(w₂),其中w₂ ^Tw₂＝1

F (w_{1}) = \frac{{|| {w_{1}}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - {w_{1}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}}{Σ_{i = 1}^{l_{a}} {|| {w_{1}}^{T} x_{a i} - {w_{1}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}, F (w_{2}) = \frac{{|| {w_{2}}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - {w_{2}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}{Σ_{i = 1}^{l_{b}} {|| {w_{2}}^{T} x_{b i} - {w_{2}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}},

其中，w₁和w₂即为所需求得的鲁棒投影最优向量，l_a、l_b分别为两类样本的数量，x_i为样本集合中的单个样本，||·||₁为1-范数度量，F(w₁)的分母为实现类内距离最小、分子为实现类间距离最大。

步骤S302：通过不断优化得到一对最优的最具鉴别性的鲁棒投影子空间或鲁棒线性分类器，提取出样本外图像的显著特征，进而用于样本外测试图像的鲁棒归纳和识别过程；

具体可以为：

令迭代周期t＝0，t为迭代周期，每迭代一次t加一，对w₁、w₂初始化操作，w₁(0)＝m₁，w₂(0)＝m₂，其中m₁、m₂分别为第一类和第二类样本的均值，并且令w₁(0)＝w₁(0)/||w₁(0)||₂、w₂(0)＝w₂(0)/||w₂(0)||₂。进而完成目标函数值初始化：

F (w_{1} (0)) = \frac{| w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(0)}^{T} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}, F (w_{2} (0)) = \frac{| w_{2} {(0)}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - w_{2} {(0)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{Σ_{i = 1}^{l_{b}} | w_{2} {(0)}^{T} x_{b i} - w_{2} {(0)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}

在迭代过程中，每一次迭代都是分别对w₁、w₂进行w₁(t+1)＝w₁(t)+βd₁(t)、w₂(t+1)＝w₂(t)+βd₂(t)操作，其中，β是用于投影向量w₁和w₂更新的步长系数。其中，用于迭代更新d₁(0)和d₂(0)初始化如下：

d_{1} (0) = \frac{| \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{| w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |} - \frac{Σ_{i = 1}^{l_{a}} | x_{a i} - \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(0)}^{T} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}

d_{2} (0) = \frac{| \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{| w_{2} {(0)}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - w_{2} {(0)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |} - \frac{Σ_{i = 1}^{l_{b}} | x_{b i} - \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{b}} | w_{2} {(0)}^{T} x_{b i} - w_{2} {(0)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}

其中，d₁(t)、d₂(t)的值也随投影向量w₁、w₂的更新而不断迭代更新。由此可得，当迭代次数不断变大后，有

F (w_{1} (t)) = \frac{| w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(t)}^{T} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}, F (w_{2} (t)) = \frac{| w_{2} {(t)}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - w_{2} {(t)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{Σ_{i = 1}^{l_{b}} | w_{2} {(t)}^{T} x_{b i} - w_{2} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}

而

d_{1} (t) = \frac{| \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{| w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |} - \frac{Σ_{i = 1}^{l_{a}} | x_{a i} - \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(t)}^{T} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{a}} x_{a j} |}

d_{2} (t) = \frac{| \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{| w_{2} {(t)}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - w_{2} {(t)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |} - \frac{Σ_{i = 1}^{l_{b}} | x_{b i} - \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{b}} | w_{2} {(t)}^{T} x_{b i} - w_{2} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}

最终，F(w₁)、F(w₂)最大化到趋于不变时，此时的w₁、w₂即可作为最优解。由此，我们得到了可提取鉴别性的图像特征的鲁棒投影向量对w₁∈R^n×1和w₂∈R^n×1。从而，利用优化得到的这对鲁棒图像子空间或鲁棒线性分类器，实现图像数据训练样本的最具鉴别性的显著特征提取。

步骤S303：将测试图像向系统输出的一对线性分类器进行投影，取与均值投影后的距离的最小值对应的类别，用于测试图像的类别鉴定，具体为：

给定一个图像样本集合，首先划分为训练集和测试集，分别包含原始的训练样本和测试样本。基于训练集，可通过所述优化过程计算得到最具鉴别性的鲁棒投影向量对w₁∈R^n×1和w₂∈R^n×1，再将测试样本放入得到的鲁棒投影空间，完成具鉴别性的显著特征提取，从而进行分类。

本发明所提供的图像识别方法，通过对图像训练样本进行判别学习，紧凑类内散度矩阵与分离类间散度矩阵。为了有效提升系统的鲁棒性，将1-范数度量应用于多平面支持向量机，设计出性能鲁棒的图像识别装置。最终，计算得到一对最具描述性的鲁棒图像子空间或一对最具鉴别性的鲁棒线性分类器，可用于样本外图像的鲁棒归纳和识别过程。样本外图像的归纳过程主要通过将测试样本向系统输出的一对线性分类器进行投影，取与均值投影后距离的最小值对应的类别，用于测试图像的类别鉴定，得到最准确的系统识别结果。此外，本发明通过建立基于比率的1-范数支持向量机分类模型，有效避免了模型参数估计，系统稳定性好。

上述本发明公开的实施例中详细描述了方法，对于本发明的方法可采用多种形式的系统实现，因此本发明还公开了一种装置，下面给出具体的实施例进行详细说明。

本发明所提供的基于鲁棒多平面支持向量机的图像识别装置的一种具体实施方式的结构框图如图4所示，该装置包括：

第一获取模块100，用于将测试图像向鲁棒线性分类器进行投影，获取所述测试图像对应各个类别的第一投影特征；其中，所述鲁棒线性分类器中的投影向量为通过训练模块500对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，确定得到的鲁棒投影最优向量；

第二获取模块200，将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影，获取所述训练样本集均值在各个类别的第二投影特征；

计算模块300，用于分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离；

确定模块400，用于将所述距离的最小值所对应的类别确定为所述测试图像的类别。

本发明所提供的基于鲁棒多平面支持向量机的图像识别装置，通过对图像训练样本进行判别学习，紧凑类内散度矩阵与分离类间散度矩阵。通过计算得到的最具鉴别性的鲁棒线性分类器，将样本外的测试图像进行投影，取与均值投影后的距离的最小值对应的类别，以对该测试图像进行类别鉴定，得到最准确的识别结果。本发明所提供的图像识别装置，将1-范数度量应用于多平面支持向量机，有效提升了图像识别的鲁棒性，并且能够有效避免模型参数估计，稳定性更好。

可选地，所述训练模块500包括：

建立模型单元501，用于建立基于1-范数度量的多平面支持向量机分类器模型；

确定单元502，用于对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。

具体地，训练模块500能够进行基于1-范数度量的鲁棒多平面支持向量机学习，提高系统鲁棒性，同时降低噪声干扰。通过建立比率形式的模型，有效避免参数选择造成的误差影响，通过迭代优化，获得一对最佳的线性投影分类器。对于给定的一个图像数据向量集合X＝[x₁,x₂,...,x_N]∈R^n×N(其中，n是图像数据样本的维度，N是样本的数量)，其中包含有类别标签(共2个类别)的训练样本集X_L＝[x₁,x₂,...,x_l]∈R^n×l(其中A类样本B类样本且满足训练样本数量l₁+l₂＝l)和无任何标签的测试样本集X_U＝[x₁,x₂,...,x_u]∈R^n×u，且满足样本数量l+u＝N。所述根据原始训练集计算得到一对最具鉴别性的鲁棒投影向量w₁∈R^n×1和w₂∈R^n×1。

可选地，上述训练模块500还可以进一步包括：

训练预处理单元503，用于对提取到的样本图像进行预处理操作。

其中，预处理包括尺寸压缩和/或数据归一化。

下面对利用本发明所提供的基于鲁棒多平面支持向量机的图像识别装置进行图像识别的具体过程进行详细描述：

对鲁棒多平面支持向量机学习模型，

输入：原始训练数据矩阵X_L＝[x₁,x₂,...,x_l]∈R^n×l。

输出：鲁棒投影矩阵最优向量对w₁∈R^n×1和w₂∈R^n×1。

初始化：

先得出第一类的投影向量：A类样本B类样本令迭代周期t＝0，t为迭代周期，每迭代一次t加一，对w₁初始化操作，w₁(0)＝m₁，其中m₁分别为第一类训练图像样本数据的均值，并且令w₁(0)＝w₁(0)/||w₁(0)||₂。则

F (w_{1} (0)) = \frac{| w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(0)}^{T} x_{a i} - w_{1} {(0)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}

while F(w₁(t))还未收敛时；do

修正并更新w₁(t+1)：w₁(t+1)＝w₁(t)+βd(t)

修正并更新d(t)：

d_{1} (t) = \frac{| \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{| w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |} - \frac{Σ_{i = 1}^{l_{a}} | x_{a i} - \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(t)}^{T} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}

修正并更新F(w₁(t))：

F (w_{1} (t)) = \frac{| w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} |}{Σ_{i = 1}^{l_{a}} | w_{1} {(t)}^{T} x_{a i} - w_{1} {(t)}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} |}

检查是否收敛：(收敛条件为前后F(w₁(t))结果之差的绝对值不大于10^-7)；

若是，则停止；

否则继续迭代；

end while

其中，w₁即为所需求得的鲁棒投影最优向量，l_a为对应类的样本数，x_i为样本类中的单个样本，||·||₁为1-范数度量。

在算法最后一步迭代中，w₁即为所需求得的第一类样本数据的鲁棒线性分类器。同理，根据该算法步骤，可得出第二类样本数据的鲁棒线性分类器w₂。

利用迭代优化得到一对最具鉴别性的鲁棒投影子空间或鲁棒线性分类器进行样本外图像的显著特征提取，为下一步样本外图像的鲁棒归纳和识别做好准备。

将测试样本输入系统获得的分类器，取与均值投影后的距离的最小值对应的类别，用于测试图像的类别鉴定，获得训练样本的类别标签，得到最准确的系统识别结果。

具体过程如下：

将测试样本输入系统获得的分类器，获取投影结果。分别为w₁ ^Tx和w₂ ^Tx，其中x为待测试样本。将测试样本在各类投影向量上的投影结果与对应各类样本训练集均值在对应分类器上的投影结果，分别为和进行比较，其中，为训练集A和B中的样本均值。即和取与距离的最小值即对应的类别作为分类结果。图5示出了本发明实施例公开的一种基于鲁棒多平面支持向量机的图像识别过程示意图。请参阅表1，为本发明方法和GEPSVM(Generalized ProximalSVM)、MVSVM(Multi-weight Vector Projection SVM)、TWSVM(TWINSVM)方法识别结果对比表，给出了各方法实验的平均和最高识别率。

本发明在三个数据库中进行了测试，即AR、JAFFE、Indian人脸图像数据库。AR人脸数据库是美国普渡大学(Purdue University)的人脸数据库，包含超过126人的4000个彩色图像，每个人有26张两会期间拍摄的图像，包括更多的面部表情变化，例如在不同光照条件下，表情，以及面部的“伪装”(太阳镜和围巾)。以下标准评估程序，我们使用的AR数据库包括五十个男人和五十个女人的2600个人脸图像的子集。JAFFE是日本ATR(Advanced TelecommunicationResearch Institute International)的专门用于表情识别研究的基本表情数据库，包含了213幅(每幅图像的分辨率：256像素×256像素)日本女性的脸相，每幅图像都有原始的表情定义。表情库中共有10个人，每个人有7种表情(中性脸、高兴、悲伤、惊奇、愤怒、厌恶、恐惧)。JAFFE数据库均为正面脸相，且把原始图像进行重新调整和修剪，使得眼睛在数据库图像中的位置大致相同，脸部尺寸基本一致，光照均为正面光源，但光照强度有差异。Indian face database是苏黎世联邦理工学院的计算机视觉实验室的人脸数据库，包含了40个不同的人的11个不同的图像。有些人有一些额外的照片。所有的图片都与直立人明亮均匀背景，正面的位置。该图像数据库是由男性和女性两个主要目录构成。在这些目录中，有十一种不同的图像。

实验中，首先设定训练集占总数均为70％。分类实验设置如下：1、Indian女性人脸图像vs.Indian男性人脸图像；2、Japanese女性人脸图像vs.Indian女性人脸图像；3、AR女性人脸图像vs.男性人脸图像；4、AR女性人脸图像vs.Japanese女性人脸图像。在本发明的分类实验中，为了验证分类器模型对于数据中噪音的敏感性和鲁棒性，均人工加入了不同浓度的高斯噪声(均值为0,方差分别为0.01和0.02)。

本实施例中，参与比较的GEPSVM、MVSVM和TWSVM方法(采用各文献中算法使用的默认参数)使用各自的线性分类器进行测试样本的类别鉴定。

表1本发明和GEPSVM、MVSVM、TWSVM方法识别结果对比

通过实验结果我们可以看出本发明的图像识别方法效果明显优于相关的GEPSVM、MVSVM以及TWSVM方法，且表现出了较强的系统稳定性和对噪音的鲁棒性，具有一定的优势。

综上所述：本发明公开了一种基于鲁棒多平面支持向量机的图像识别方法与装置，通过对图像训练样本进行判别学习，紧凑类内散度矩阵与分离类间散度矩阵。为了有效提升系统的鲁棒性，将1-范数度量应用于多平面支持向量机，设计出性能鲁棒的图像识别装置。最终，计算得到一对最具描述性的鲁棒图像子空间或一对最具鉴别性的鲁棒线性分类器，可用于样本外图像的鲁棒归纳和识别过程。样本外图像的归纳过程主要通过将测试样本向系统输出的一对线性分类器进行投影，取与均值投影后的距离的最小值对应的类别，用于测试图像的类别鉴定，得到最准确的系统识别结果。此外，本发明通过建立基于比率的1-范数支持向量机分类模型，有效避免了模型参数估计，系统稳定性更好。

对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于鲁棒多平面支持向量机的图像识别方法，其特征在于，包括：

2.如权利要求1所述的图像识别方法，其特征在于，所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练，将1-范数度量应用于多平面支持向量机，紧凑类内散度矩阵与分离类间散度矩阵，确定得到的鲁棒投影最优向量包括：

建立基于1-范数度量的多平面支持向量机分类器模型；

3.如权利要求2所述的图像识别方法，其特征在于，所述建立基于1-范数度量的多平面支持向量机分类器模型包括：

所述训练样本集包括两个类别的样本集，A类样本集

X_{a} = [x_{1}, x_{2}, ..., x_{l a}] &Element; R^{n \times l_{1}} &Element; X_{L}

以及为B类样本集

X_{b} = [x_{1}, x_{2}, ..., x_{l b}] &Element; R^{n \times l_{2}} &Element; X_{L},

且满足训练样本数量l₁+l₂＝l。

4.如权利要求3所述的图像识别方法，其特征在于，所述对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括：

F (w_{1}) = \frac{{|| {w_{1}}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - {w_{1}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}}{Σ_{i = 1}^{l_{a}} {|| {w_{1}}^{T} x_{a i} - {w_{1}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}, F (w_{2}) = \frac{{|| {w_{2}}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - {w_{2}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}{Σ_{i = 1}^{l_{b}} {|| {w_{2}}^{T} x_{b i} - {w_{2}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}},

n是图像数据样本的维度，N是样本的数量，w₁和w₂为所需求得的鲁棒投影最优向量w₁∈R^n×1，w₂∈R^n×1，l_a、l_b分别为两类样本的数量，x_i为样本集合中的单个样本，||.||₁为1-范数度量，F(w₁)的分母为实现类内距离最小、分子为实现类间距离最大。

5.一种基于鲁棒多平面支持向量机的图像识别装置，其特征在于，包括：

6.如权利要求5所述的图像识别装置，其特征在于，所述训练模块包括：

7.如权利要求6所述的图像识别装置，其特征在于，所述建立模型单元用于建立基于1-范数度量的多平面支持向量机分类器模型包括：

所述训练样本集包括两个类别的样本集，A类样本集

X_{a} = [x_{1}, x_{2}, ..., x_{l a}] &Element; R^{n \times l_{1}} &Element; X_{L}

以及为B类样本集

X_{b} = [x_{1}, x_{2}, ..., x_{l b}] &Element; R^{n \times l_{2}} &Element; X_{L},

且满足训练样本数量l₁+l₂＝l。

8.如权利要求7所述的图像识别装置，其特征在于，所述确定单元用于对样本图像进行学习，确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括：

F (w_{1}) = \frac{{|| {w_{1}}^{T} \frac{1}{l_{a}} Σ_{i = 1}^{l_{a}} x_{a i} - {w_{1}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}}{Σ_{i = 1}^{l_{a}} {|| {w_{1}}^{T} x_{a i} - {w_{1}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}, F (w_{2}) = \frac{{|| {w_{2}}^{T} \frac{1}{l_{b}} Σ_{i = 1}^{l_{b}} x_{b i} - {w_{2}}^{T} \frac{1}{l_{a}} Σ_{j = 1}^{l_{a}} x_{a j} ||}_{1}}{Σ_{i = 1}^{l_{b}} {|| {w_{2}}^{T} x_{b i} - {w_{2}}^{T} \frac{1}{l_{b}} Σ_{j = 1}^{l_{b}} x_{b j} ||}_{1}},

n是图像数据样本的维度，N是样本的数量，w₁和w₂为所需求得的鲁棒投影最优向量，w₁∈R^n×1，w₂∈R^n×1，l_a、l_b分别为两类样本的数量，x_i为样本集合中的单个样本，||.||₁为1-范数度量，F(w₁)的分母为实现类内距离最小、分子为实现类间距离最大。

9.如权利要求5至8任一项所述的图像识别装置，其特征在于，所述训练模块还包括：

10.如权利要求9所述的图像识别装置，其特征在于，所述预处理包括尺寸压缩和/或数据归一化处理。