CN104881682A

CN104881682A - 一种基于保局映射与主成分分析的图像分类方法

Info

Publication number: CN104881682A
Application number: CN201510274498.5A
Authority: CN
Inventors: 达臻; 伍家松; 姜龙玉; 孔佑勇; 杨淳沨; 舒华忠
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2015-05-26
Filing date: 2015-05-26
Publication date: 2015-09-02
Anticipated expiration: 2035-05-26
Also published as: CN104881682B

Abstract

本发明公开了一种基于保局映射与主成分分析的图像分类方法，包括以下步骤：1、输入训练对象；2、建立一层或两层的流形学习网络，对于每一种具体的网络，学习得到每一层的滤波器；3、建立流形学习网络的输出层得到最终特征向量；4、将步骤3中最终得到的所有的特征向量输入支持向量机分类器进行训练；5、用校验图像集进行校验，调整到最佳网络参数；6、对测试图像进行测试，统计分类结果，计算识别率。本发明通过构造三种结构相似但不同网络层的网络，应用一种流形方法即保局映射获得图像更加本质的局部结构，使得在各种分类任务中，构造的网络更加具有分辨力，获得更高的图像的分类准确率。

Description

一种基于保局映射与主成分分析的图像分类方法

技术领域

本发明涉及数字图像领域，具体涉及一种基于保局映射与主成分分析结合的图像分类方法。

背景技术

对于图像的分类问题，由于图像本身存在的维数高的问题，通常需要对初步提取到的图像特征进行降维处理。在本方法中，主要使用的是两种降维方法：1、保局映射2、主成分分析。保局映射是一种提取能够保持图像空间局部流形结构的性质的降维方法，主成分分析法能够使用较少的矩阵维度保持原始图像最大限度的信息。两者用于深度学习都是属于无监督的降维方法。

1、主成分分析(PCA)

PCA是一种线性降维方法，它通过找出样本空间变化较大的一些正交的坐标方向，可认为就是样本的主成分，然后将样本投影到这些坐标从而降维到一个线性子空间。

假设有N个样本X_i,i＝1,2,...,N，

{\overset{&OverBar;}{X}}_{i} = X_{i} - \frac{1}{N} Σ_{j = 1}^{N} X_{j}

是去均值后的样本列向量。表示去均值后的所有样本的协方差矩阵。

则按照最大化投影后方差的原则，PCA的优化目标是：

max w^TSw s.t.w^Tw＝I_d (1)

其中w表示投影方向，d表示降维后的样本的维数。

具体算法为：

(a)对样本中每一个维度去均值。即

(b)求样本的协方差矩阵。即

(c)对S作奇异值分解，求得它的特征值与特征向量，选取最大的前d个特征值所对应的特征向量作为新的样本空间的基向量。

2、保局映射(Locality Preserving Projection,LPP)

保局映射的一个直接出发点是用于图像的降维，直接考虑了图像流形结构，也就是说通过构造一个图像的近邻图作为图像的流形结构，这个流形结构能够保持图像中的局部特征。

这里假设原始的样本向量为X＝[x₁,x₂,...,x_n],降维后的向量为Y＝[y₁,y₂,...,y_n],LPP的目标函数是：

\min \underset{ij}{Σ} {| | y_{i} - y_{j} | |}^{2} S_{ij} - - - (2)

其中y_i是x_i的低维表示，而S_ij是一个相似性矩阵，其中的矩阵元素可以看做是流形结构中节点x_i和节点x_j的之间的权值。它的定义如下：

S_{ij} = \{\begin{matrix} \exp (- {| | x_{i} - x_{j} | |}^{2} / t), & {| | x_{i} - x_{j} | |}^{2} < ϵ \\ 0, & otherwise \end{matrix} - - - (3)

这里ε＞0足够小，它决定了流形结构中的的局部性质，在实际应用中我们人为的选用的是KNN的构造方法，使得每个图像空间中的点都有K个邻居点。

进一步地，(2)式的优化问题经过等价的代数推导可变为：

\begin{matrix} \underset{w}{\arg \min} & w^{T} {XLX}^{T} w & s . t . w^{T} {XDX}^{T} w = 1 \end{matrix} - - - (4)

其中D_ii＝∑_jS_ji，是一个对角矩阵；L＝D-S被成为拉普拉斯矩阵，w是投影向量。通过求解如下广义特征值问题，可以得到w向量：

XLX^Tw＝λXDX^Tw (5)

这里，我们选取的特征向量是前k个最小的特征值对应的特征向量作为整个投影矩阵W_LPP。

这里要注意的是矩阵XDX^T可能是奇异的，这是由于训练的样本数小于图像的维数导致的，为了避免这个问题，我们确保训练的样本数大于等于图像维数。事实上，在我们这个深度学习的框架中，我们输入到LPP算法中的是一个方阵(协方差矩阵)。

发明内容

为了克服现有技术中存在的不足，利用深度学习与流形学习在图像分类中的优势，提高图像分类识别的准确率与鲁棒性，本发明提出了一种基于保局映射与主成分分析的图像分类方法。

为实现上述目的，本发明采用的技术方案为：

一种基于保局映射与主成分分析的图像分类方法，包括以下步骤：

步骤1：对N幅大小均为m×n像素的输入图像进行预处理，得到输入图像特征矩阵X，其中N、m、n为正整数，i＝1,2...,N；

步骤2：建立一层或两层的流形学习网络，得到每一层网络中训练图像卷积所用的滤波器，其中第一层的滤波器V¹用保局映射降维方法构造，如果有第二层网络，第二层的滤波器V₂可选用主成分分析法或者继续选用保局映射降维方法构造，将输入图像与第一层的滤波器V¹进行卷积，得到第一层输出图像其中V_l ¹表示第一层中的第l个滤波器，L₁表示第一层的滤波器的个数；如果有第二层网络，再将第一层输出图像与第二层的滤波器V₂进行卷积，得到第二层输出图像其中V_i ²表示第二层中的第l个滤波器，L₂表示第二层的滤波器的个数；得到的最终输出图像为最后一层网络的输出图像；

步骤3：建立流形学习网络的输出层；即将步骤2得到的最终输出图像进行二值化操作，并对二值化后的图像分块并统计每一块图像上的直方图，将此直方图作为特征向量f_i，i＝1,2...,N；

步骤4：将步骤4中最终得到的所有的特征向量f_i输入支持向量机分类器进行训练；

步骤5：用校验图像集进行校验，调整到最佳网络参数；

步骤6：对测试图像进行测试，统计分类结果，计算识别率。

进一步地，步骤1中所述的预处理操作具体为：

对于每一幅输入图像使用大小为k₁×k₂像素的滑块遍历其每个像素，每个像素所在的滑块区域重新排列成一个列向量，其中k₁,k₂均为奇数，这样每一幅图像都能得到一个行数为k₁k₂，列数为m′n′的重采样矩阵，其中代表大小为k₁×k₂像素的滑块以行间隔为b₁进行取样所能得到的行数，代表大小为k₁×k₂像素的滑块以列间隔为b₂进行取样所能得到的列数，b₁,b₂分别表示的是滑块每次滑动的行间隔和列间隔，默认设置都为1；此采样矩阵记为

然后对采样矩阵的每个元素都减去其行均值，得到去均值化重采样矩阵其中

{\overset{&OverBar;}{x}}_{i, j} = x_{i, j} - \frac{1}{m^{'} n^{'}} Σ_{k = 1}^{m^{'} n^{'}} x_{i, k}, j = 1,2, . . ., m^{'} n^{'};

将N幅输入图像所得到的去均值化采样矩阵放置在一起得到输入图像特征矩阵

进一步地，步骤2所述的中使用保局映射降维方法得到第一层的滤波器V¹的操作具体为：

首先，求出输入图像特征矩阵X的协方差矩阵

其次，根据保局映射的算法求出保局映射中协方差矩阵C的投影向量矩阵L₁表示第一层中滤波器的个数；

再次将中的第l个列向量重新排列成一个k₁×k₂的矩阵作为第一层第l个滤波器V_l ¹；第一层的滤波器

V^{1} = {V_{j}^{1}, j = 1,2, . . ., L_{1}} .

进一步地，采用两层的流形学习网络，所述步骤2中第二层选用主成分分析法构造第二层滤波器V₂，其具体操作为：

首先，对于每一幅第一层输出图像再进行步骤1所述的相同的预处理步骤，得到第二层输入特征矩阵其中

Y^{l} = [{\overset{&OverBar;}{Y}}_{1}^{l}, {\overset{&OverBar;}{Y}}_{2}^{l}, . . ., {\overset{&OverBar;}{Y}}_{N}^{l}],

而表示第i幅输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵；表示在经过第l个滤波器滤波后的第i幅输入图像中第j列去均值化后的列向量；

然后，求出第二层输入特征矩阵Y的协方差矩阵C'，并对其进行主成分分析，求出L₂个主特征向量，将这些主特征向量分别重新排列成L₂个k₁×k₂的小矩阵，得到第二层的滤波器V₂。

进一步地，采用两层的流形学习网络，所述步骤2中第二层继续选用保局映射降维法构造第二层滤波器，则以第一层的输出图像作为第二层的输入图像重复步骤1与步骤2中的具体操作，得到第二层的滤波器V₂。

进一步地，步骤3中所述的二值化具体操作为：对于每一幅输入图像经过两层网络后，都会产生出L₁L₂幅最终输出图像，每一幅最终输出图像的尺寸都是m×n；特别地，对于第一层输出的图像第二层网络就会有L₂幅输出图像l＝1,2,…,L₂，将图像进行二值化操作，即该像素点灰度值若大于零则重置为1，否则重置为0；之后将这L₂幅图像对应像素点的值加权求和，合并为一张图像，即其中函数H(·)表示二值化函数，表示将输入矩阵的元素大于零的值重置为1，否则的话置为0；这样对于每一幅输入图像I_i，就对应了L₁幅输出图像，一共就有NL₁幅输出图像。

进一步地，步骤3中所述的得到特征向量f_i具体操作为：将每一幅T_i ^l分成B块，B为正整数，每一块大小为HistBlockSize，块与块之间可以有重叠，重叠率为OverlapRatio，OverlapRatio的值大于等于0小于1，分别统计这B块的直方图，并将其连接成一个向量，记为Bhist(T_i ^l)，则由输入图像的最终的得到的训练分类用的特征向量可以表示为

进一步地，所述步骤4具体操作为：将所有N幅训练图像的特征向量f_i连接成一个特征向量矩阵，记为将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。

进一步地，所述步骤5中调整到最佳网络参数的方法为：对于一个较大的数据集，分割成三部分，一部分数据集为训练集，一部分为校验集，另一部分为测试集，当采用训练集得到所构造的网络的滤波器后，再采用校验集进行参数的调优，获得最佳网络参数。

进一步地，步骤6具体操作为：采用经过调优后的网络参数，输入测试集及其标签信息，统计出识别率。

本发明的基于保局映射与主成分分析的图像分类方法具有以下有益效果：

(1)本方法通过在第一层使用流形学习的方式，将重采样得到的数据映射到一个较低维的子空间中进行分析，这个子空间并不是传统的欧式空间而是保持了图像本征的流形结构的子空间。

(2)本方法构造了一个两层的或者仅使用流形方法的一层网络，利用深度学习的优势，自动学习图像的有着更多语义更加抽象的高维特征，充分利用了原始图像的信息。

(3)本方法构造的网络对于光照、遮盖、形变都具有相当的鲁棒性，尤其是对于各种情况下的人脸的识别特别有效。

附图说明

图1为本发明基于保局映射与主成分分析(两层)的图像分类方法示意图；

图2为本发明中仅有一层保局映射层网络的图像分类方法示意图；

图3为本发明中基于保局映射与主成分分析的图像分类方法总体流程示意图；

图4为本发明中训练滤波器与分类器的流程图；

图5为4种子类型的AR数据集人脸示例图；

图6为一幅人脸图像通过一层LPP网络和一层PCA网络后的效果图。

具体实施方式

下面对本发明技术方案结合附图和实施例进行详细说明。

本发明中基于保局映射与主成分分析的图像分类方法通过在两层或一层的网络中训练图像卷积所用的滤波器来提取图像最终的特征向量，其中第一层使用保局映射降维方法得到滤波器向量；第二层网络为可选层，也就是，可以构建具有两层的网络而第二层可以继续选用保局映射降维方法构造滤波器，或者使用主成分分析法构造第二层的滤波器，如图3所示，可以看出整体流程主要包含两个阶段：训练阶段和校验测试阶段。

(1)训练阶段：

此阶段包含步骤1-4，具体如下：

步骤1：输入N幅图像，每一幅图像的尺寸为m×n。首先进行图像的预处理，即使用一个k₁×k₂的滑块对原图像重采样，之后去均值化得到初步的输入图像特征矩阵X。

对于每一幅图像i＝1,2...,N，使用大小为k₁×k₂的滑块遍历每一个像素，每个像素所在的滑块区域重新排列成一个列向量，其中k₁,k₂均为奇数，这样每一幅图像都能得到一个k₁k₂行，列的矩阵，其中b₁,b₂分别表示的是滑块每次滑动的行间隔和列间隔，默认设置都为1。这个矩阵记为：

然后对这个矩阵的每个元素都减去其行均值，得到：

其中

{\overset{&OverBar;}{x}}_{i, j} = x_{i, j} - \frac{1}{m^{'} n^{'}} Σ_{k = 1}^{m^{'} n^{'}} x_{i, k}, j = 1,2, . . ., m^{'} n^{'}

这样对所有的N幅图像都进行这样一种过程建立类似的矩阵，并将其放置在一起得到所有输入图像特征矩阵：

步骤2：建立流形学习网络的的第一层，LPP层。根据输入特征矩阵X，求出协方差矩阵，再根据保局映射的算法，对此协方差矩阵进行投影得到特征投影矩阵从而构成第一层LPP层的滤波器V¹，将此滤波器与每一幅输入图像进行卷积得到第一层的输出图像。

具体操作如下：

首先求出所有输入图像特征矩阵的协方差矩阵C：

C = {XX}^{T} = \frac{1}{N m^{'} n^{'}} Σ_{i = 1}^{N} X_{i} X_{i}^{T} - - - (4)

其次，根据保局映射的算法求出保局映射中的投影向量矩阵

其中，L₁表示第一层中的滤波器个数。

再次将中的第l个列向量重新排列成一个k₁×k₂的矩阵作为第一层第l个滤波器。可以用如下式子表示为：

其中，q_l(·)表示取第l个列向量。最后将原始输入的图像与每一个滤波器进行卷积注意卷积前要进行要对零填充以保证卷积完后与输入图像的尺寸相同)，得到第一阶段的输出，即：

I_{i}^{1} = I_{i}^{In} * {V_{l}}^{1}, i = 1,2, . . ., N - - - (7)

然后建立流形学习网络的第二层(可选)，主成分分析层(PCA层)或LPP层。

(1)若第二层选用主成分分析，则把第一层训练输出的图像再次进行预处理，得到新的输入图像特征矩阵Y，对Y计算出协方差矩阵，再进行主成分分析得到若干主特征向量，构成第二层的滤波器V²，将这些滤波器与第一层的输出图像再次进行卷积得到第二层的输出图像。

其具体操作如下：

对于第一层输出的每一幅图像再进行与权利要求2中所述的相同的预处理步骤，得到第二层的初步的输入特征矩阵Y：

令表示第i幅原始输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵。其中，表示在经过第l个滤波器滤波后的第i幅图像中第j列去均值化后的列向量。于是，可以这样表示Y：

接下来，求出第二层输入特征矩阵的协方差矩阵C'，并对其进行主成分分析，求出L₂个主特征向量，将这些主特征向量再进行与权利要求3中所述(6)式的类似步骤，即重新排列成L₂个k₁×k₂的小矩阵，于是得到第二层网络的滤波器V²。

再将第一层中得到的输出图像与V²进行卷积(注意卷积前要进行要对零填充以保证卷积完后与输入图像的尺寸相同)，即：

O_{i}^{l} = I_{i}^{l} * {V_{l}}^{2}, l = 1,2, . . ., L_{2} - - - (9)

这里L₂是第二层设置的滤波器个数。

(2)若第二层选用的是LPP层，则把第一层训练输出的图像再次进行预处理，得到新的输入特征矩阵Y，再进行与步骤2同样的步骤，得到第二层的特征投影矩阵从而构成第二层的滤波器V²，将这些滤波器与第一层的输出图像再次进行卷积得到第二层的输出图像。

步骤3：建立流形学习网络的输出层。也就是，将第二层中的所有输出图像二值化，并对二值化后的图像分块并统计每一块上的直方图，将此直方图作为特征向量。其具体操作如下：

对于每一幅原始图像经过两层网络后，都会产生出L₁L₂幅输出图像，每一幅图像的尺寸都是m×n。特别地，对于第一层输出的图像第二层网络就会有L₂幅输出图像l＝1,2,…,L₂，将图像进行二值化操作，即该像素点灰度值若大于零则重置为1，否则重置为0。之后将这L₂幅图像对应像素点的值加权求和，合并为一张图像，即：

{T_{i}}^{l} = Σ_{k = 1}^{L_{2}} 2^{k - 1} H (O_{i}^{k}), l = 1,2, . . ., L_{1} - - - (11)

其中H(·)表示二值化函数，表示将输入矩阵的元素大于零的值重置为1，否则的话置为0。这样对于每一幅原始图像I_i，就对应了L₁幅输出图像，一共就有NL₁幅输出图像。

接下来，将每一幅T_i ^l分成B块，每一块大小为HistBlockSize，块与块之间可以有重叠，重叠率为OverlapRatio(0≤OverlapRatio＜1)，分别统计这B块的直方图，并将其连接成一个向量，记为Bhist(T_i ^l)，则的最终的得到的训练分类用的特征向量可以表示为：

步骤4：将步骤3中得到的最终的所有图像的特征向量输入支持向量机分类器进行训练。具体为：将所有N幅训练图像的f特征连接成一个矩阵，即：

将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。

如图4所示流程图，经过步骤1-4，得到关键的两个滤波器和V²＝{V_l ²,l＝1,2,...,L₂}以及一个分类器。

(2)校验测试阶段(包含以上步骤5-6)：

此阶段包含步骤5-6，具体操作如下：

步骤5：对于一个较大的数据集，分割成三部分，一部分数据集为训练集，一部分为校验集，另一部分为测试集，当采用训练集得到所构造的网络的滤波器后，再采用校验集进行参数的调优，获得最佳网络参数。

:步骤6为：采用经过调优后的网络参数，输入测试集及其标签信息，统计出识别率。

考虑到本方法的第一层必须选用保局映射来构造滤波器，因此先在仅有一层LPP的网络中进行参数的调优，首先是决定滑块尺寸Patchsize的尺寸，Patchsize的尺寸要求为奇数，图像的大小也对最优Patchsize的尺寸有着影响，对于AR数据集，先固定其他参数，我们分别测试了如下尺寸：

5×5,7×7,9×9,11×11,13×13,15×15,17×17

在得到最优的Patchsize后，我们就把整个网络的第一层的滑块固定为此尺寸，接着我们仍对仅有LPP层的网络进行测试，调整分块统计直方图时的最佳分块大小Patchsize，我们对相当于原始图像尺寸的1/2,1/4,1/8,1/16,进行测试，并做了适当微调。

这样，经过以上两个阶段，能够进行图像分类识别的网络就已经构造完毕。两层网络的识别过程如下：如图1所示，正方形方块表示一幅图像，若要进行任意一张图像的识别，则首先在LPP层中将与V_l ¹,l＝1,2,...,L₁进行卷积操作，注意卷积前须对I_i图像的四周进行零填充以保证卷积后的图像尺寸与原图保持一致；这样得到进入第二层，第二层的滤波器可以选用LPP滤波器或者PCA滤波器，经过V_l ²,l＝1,2,...,L₂的卷积后，每一幅j＝1,2,...,L₁都能得到L₂幅输出图像，记为k＝1,2,...,L₂，这样最原始的一幅I_i经过两层滤波后，变为L₁L₂幅图像；接着进入输出层，即将每L₂幅图像二值化为像素点的值只有0和1的图像，加权求和(权值为)后成为T_i ^l,l＝1,2,...,L₁，此后需要对这L₁幅图像进行分块，如图中虚线所示，实际情况中块与块之间可以有重叠，重叠率为OverlapRatio(0≤OverlapRatio＜1)，最后在每一块中进行直方图统计，得到直方图向量(如图中的小圆圈所示)，需要将所有向量排成一个列向量，得到最终的特征向量f_i。在分类器训练阶段，只要将此向量输入支持向量机分类器即可输出预测的图像类别。

对于只有一层的图像分类网络的识别过程，如图2所示：

相比于图1，第二层省略了，直接对第一层得到的进行加权求和(权值为)，之后同样进行分块直方图统计的过程。

实施例：下面以AR数据集为例来详细说明本发明的步骤。

实验条件：现选取一台计算机进行图像分类，该计算机的配置有Intel(R)处理器(3.2GHz)和20GB随机存取存储器(RAM)，64位操作系统，编程语言用的是Matlab(R2014b版本)。

实验对象：AR数据集是一个人脸数据集，包含了不同光照、表情以及遮挡条件下的人脸图像，它一共含有126种人脸，包含男性70名，女性56名，共2600幅图像，每一幅图像的尺寸为120×165，高165。现选取50名男性与50名女性，每人2幅图像用于训练，即一共200幅图像用于训练，在表情、光照、戴眼镜，带围巾遮住脸这四种情况下每种情况都选取600幅图像进行测试，并且在测试集中又选取300幅图像进行参数校验调优。

本发明一共提出了3种构造网络的方法，现仅以第一层设置为LPP层，第二层设置为PCA层为例进行说明，其余两种类似。

实验步骤：

步骤1：提取所需的训练图像数据以及测试用图像数据矩阵，训练矩阵为标签为不同表情图像数据矩阵为标签为不同光照人脸图像的数据矩阵为标签为戴眼镜的人脸图像数据矩阵为标签为带围巾的人脸数据图像矩阵为标签为然后将训练数据保存到一个165×120×200的一个元胞中，暂时Patchsize的尺寸设置为7×7，用这小滑块遍历元胞内所有的图像，得到初步的特征矩阵再减去行均值得到

步骤2：

(a)求得的协方差矩阵

(b)设置两层滤波器个数都是8，调用LPP降维算法，使用KNN构造流形结构，K(也就是周围点的个数)设置为12，t值设置为2，按照LPP算法，为了求解投影矩阵对XLX^T w＝λXDX^T w进行奇异值分解，这样将协方差矩阵C的维数降为了8，同时也能得到第一层LPP层的8个滤波器V_l ¹,l＝1,2,...,8，滤波器的尺寸与滑块的尺寸Patchsize一样，都是7×7。

(c)将原始输入图像I^In与该滤波器卷积，每一幅图像都可以得到8幅图像，这样一共能得到1600幅图像，卷积后的结果i＝1,2,...,200,l＝1,2,...,8保存在一个165×120×1600的元胞中。

(d)将上一步得到的输出图像i＝1,2,...,200,l＝1,2,...,8作为第二层的输入，同样的用相同大小的滑块遍历所有图像，得到去均值之后的特征矩阵

(e)求得的协方差矩阵

(f)根据主成分分析，求出C'的前8个最大的特征值对应的特征向量作为第二层的滤波器V_l ²,l＝1,2,...,8，同样的，滤波器的大小为7×7。

(g)将步骤2中所得到的图像i＝1,2,...,200,l＝1,2,...,8与此滤波器卷积，卷积后将会得到12800幅图像，

O_{i}^{l} = I_{i}^{l} * {V_{l}}^{2}, l = 1,2, . . ., 8, i = 1,2, . . ., 200 .

步骤3：

将最终输出的图像

O_{i}^{l} = I_{i}^{l} * {V_{l}}^{2}, l = 1,2, . . ., 8, i = 1,2, . . ., 200

作二值化处理并且每8幅图像加权求和，最后分块统计直方图向量，这里HistBlockSize暂时设置为[86],重叠率设置为0.5，这样就能得到最终的特征向量的稀疏表示。

步骤4：

将得到的训练数据的最终特征向量以及代入支持向量机分类器，得到支持向量机模型的参数。

步骤5：

根据经验，PCA层7×7的Patchsize和8×6的HistBlockSize比较合适。因此我们这里仅校验一层LPP情况下的最优参数。将以上测试数据集例如降采样得到300个校验数据集，用于调整参数Patchsize与HistBlockSize。用于校验的数据集只需要提取到最终的特征矩阵。正如图1所示的过程，只需要和两个滤波器层层卷积得到最终的F向量即可。我们测试比较如下几对值：

Patchsize:5×5,7×7,9×9,11×11,13×13,15×15,17×17

HistBlockSize:1/2,1/4,1/8,1/16,以及适当的微调。

在此例中，对于这个Expressionfea校验集，可以得到最优的Patchsize在LPP层时是13×13，HistBlockSize取为原图像的1/8比较合适，也就是[2015]可以达到最优识别率。全部的校验数据集的参数测试结果如表1和表2所示，可以对照此表选择网络的参数进行测试集的测试。

表1 不同情况下小滑块(滤波器尺寸)的选择

表2 不同情况下分块尺寸的选择

步骤6：

测试所有情况下的人脸的识别率，采用校验集验证得到的最优参数，每一小类测试集都是600个样例。

测试结果如下表3所示：

表3 AR数据集3种分类方法的测试结果

从表3的结果可以看到，提出的基于保局映射与主成分分析的图像分类方法在进行人脸的识别时非常有效，对于不同情况下如不同表情的人脸，不同光照条件下的人脸以及有遮挡的人脸的识别率都很高而且具有鲁棒性，因此也证明了本方法的有效性。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于保局映射与主成分分析的图像分类方法，其特征在于：包括以下步骤

步骤5：用校验图像集进行校验，调整到最佳网络参数；

步骤6：对测试图像进行测试，统计分类结果，计算识别率。

2.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法，其特征在于，步骤1中所述的预处理操作具体为：

{\overset{&OverBar;}{x}}_{i, j} = x_{i, j} - \frac{1}{m^{'} n^{'}} Σ_{k = 1}^{m^{'} n^{'}} x_{i, k}, j = 1,2, . . ., m^{'} n^{'};

3.根据权利要求2所述的基于保局映射与主成分分析的图像分类方法，其特征在于，步骤2所述的中使用保局映射降维方法得到第一层的滤波器V¹的操作具体为：

首先，求出输入图像特征矩阵X的协方差矩阵

V^{1} = {V_{j}^{1}, j = 1,2, . . ., L_{1}} .

4.根据权利要求3所述的基于保局映射与主成分分析的图像分类方法，其特征在于：采用两层的流形学习网络，所述步骤2中第二层选用主成分分析法构造第二层滤波器V₂，其具体操作为：

Y^{l} = [{\overset{&OverBar;}{Y}}_{1}^{l}, {\overset{&OverBar;}{Y}}_{2}^{l}, . . ., {\overset{&OverBar;}{Y}}_{N}^{l}],

而L₁表示第i幅输入图像经过第l个第一层滤波器卷积后再进行滑块预处理后的输入特征矩阵；表示在经过第l个滤波器滤波后的第i幅输入图像中第j列去均值化后的列向量；

5.根据权利要求3所述的基于保局映射与主成分分析的图像分类方法，其特征在于：采用两层的流形学习网络，所述步骤2中第二层继续选用保局映射降维法构造第二层滤波器，则以第一层的输出图像作为第二层的输入图像重复步骤1与步骤2中的具体操作，得到第二层的滤波器V₂。

6.根据权利要求4或5所述的基于保局映射与主成分分析的图像分类方法，其特征在于，步骤3中所述的二值化具体操作为：对于每一幅输入图像经过两层网络后，都会产生出L₁L₂幅最终输出图像，每一幅最终输出图像的尺寸都是m×n；特别地，对于第一层输出的图像第二层网络就会有L₂幅输出图像将图像进行二值化操作，即该像素点灰度值若大于零则重置为1，否则重置为0；之后将这L₂幅图像对应像素点的值加权求和，合并为一张图像，即其中函数H(·)表示二值化函数，表示将输入矩阵的元素大于零的值重置为1，否则的话置为0；这样对于每一幅输入图像I_i，就对应了L₁幅输出图像，一共就有NL₁幅输出图像。

7.根据权利要求6所述的基于保局映射与主成分分析的图像分类方法，其特征在于，步骤3中所述的得到特征向量f_i具体操作为：将每一幅T_i ^l分成B块，B为正整数，每一块大小为HistBlockSize，块与块之间可以有重叠，重叠率为OverlapRatio，OverlapRatio的值大于等于0小于1，分别统计这B块的直方图，并将其连接成一个向量，记为则由输入图像的最终的得到的训练分类用的特征向量可以表示为

8.根据权利要求1或7所述的基于保局映射与主成分分析的图像分类方法，其特征在于，所述步骤4具体操作为：将所有N幅训练图像的特征向量f_i连接成一个特征向量矩阵，记为将此特征向量矩阵加上原始图像类别标记共同输入到支持向量机分类器中进行训练。

9.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法，其特征在于：所述步骤5中调整到最佳网络参数的方法为：对于一个较大的数据集，分割成三部分，一部分数据集为训练集，一部分为校验集，另一部分为测试集，当采用训练集得到所构造的网络的滤波器后，再采用校验集进行参数的调优，获得最佳网络参数。

10.根据权利要求1所述的基于保局映射与主成分分析的图像分类方法，其特征在于，步骤6具体操作为：采用经过调优后的网络参数，输入测试集及其标签信息，统计出识别率。