CN113239917B

CN113239917B - 一种基于奇异值分解的鲁棒人脸识别方法

Info

Publication number: CN113239917B
Application number: CN202110788826.9A
Authority: CN
Inventors: 龙显忠; 张智猗
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-07-12
Filing date: 2021-07-12
Publication date: 2021-09-28
Anticipated expiration: 2041-07-12
Also published as: CN113239917A

Abstract

本发明涉及人脸识别技术领域，公开一种基于奇异值分解的鲁棒人脸识别方法，包括步骤如下：1、对由灰度图像组成的训练样本矩阵中的每列进行归一化；2、对每类训练样本分别进行奇异值分解；3、提取左奇异矩阵中的前列作为一个投影矩阵；4、利用测试样本和上一步中得到的投影矩阵计算出编码向量；5、计算出相应的残差，最小残差所对应的类别即为测试样本的类别，作为识别结果输出。本发明是在基于稀疏表示的分类方法和基于协同表示的分类方法基础上结合了奇异值分解，利用奇异值分解得到编码向量，代替原来的稀疏表示或者协同表示，不仅使识别精度得到提升，更解决了稀疏表示“计算代价昂贵”和协同表示“对噪声等干扰的鲁棒性差”等问题。

Description

一种基于奇异值分解的鲁棒人脸识别方法

技术领域

本发明涉及人脸识别技术领域，特别涉及了一种基于奇异值分解的鲁棒人脸识别方法。

背景技术

随着我国经济的不断增长和信息科学的快速发展，人们越来越重视自身的信息安全。特别是人工智能和大数据时代的到来，让用户的个人隐私保护和数据安全越来越成为迫切需求，所以研究安全有效的身份识别成为了当务之急。人脸是人体最明显的生物特征之一，具有极强的稳定性、唯一性和难以复制等特点，可以作为身份鉴别的理想依据。现实中我们识别一个人，主要通过观察他的脸部、体型、说话方式等特征，其中脸部特征起到关键性作用。人脸识别系统具有可靠、快速、无需用户进行复杂操作和不易使人抵触等特点，逐渐得到人们的接收和认可，并且现在已经广泛应用于交通、社会安全、智能检索、移动支付等领域。在可预见的未来里，人脸识别将存在于人们生活的方方面面，为人类提供更加安全、可靠、便捷有效的服务。未来随着我国智慧城市的建设以及智慧家居的发展，人脸识别将会拥有更加广阔的发展空间和应用前景。云计算和人脸图像重建技术将会推动人脸识别的深入研究，促进人脸识别行业的快速发展。

人脸识别中的一个基本问题是使用有标签的训练样本来确定一个新的未知标签样本的类别。作为数字图像处理与计算机、模式识别等学科交叉的产物，人脸识别的研究最早可以追溯到上个世纪60年代。早期的研究人员只是从人脸的几何特征入手，将人脸识别问题划分到多分类领域并以此为理论基础进行研究，由于种种原因，一直没有显著成果。到现在已经经历了半个多世纪的发展，计算机技术无论是在硬件还是软件方面都有了日新月异的变化，人们对人脸识别的研究也越来越深入。现阶段，人们已经着手研究不同场景下针对姿态、噪声、遮挡、光照等约束条件下的鲁棒性人脸识别，这也是目前人脸识别领域的研究重点。在过去的几十年里，研究人员们已经提出了许多人脸识别方法，而其中最流行的就是基于表示的分类。

在基于表示的分类框架中，基于稀疏表示的分类（Sparse Representation BasedClassification，SRC）做出了开创性的工作。SRC提出直接将训练集作为字典，并将测试样本表示为给定训练样本的线性组合，然后计算编码向量，最后将测试样本分配给具有最小残差的相应类别。随后的相关研究工作都继承了这个思想。SRC提出测试样本在所有训练样本上的线性表示是稀疏的，因此对编码向量施加

范数稀疏性，获得了良好的分类结果，但是对于高维数据，计算时间非常长。虽然SRC在人脸识别领域取得了成功，但对于是否是稀疏表示提高了人脸识别的准确性，仍然存在争议。有研究人员认为，SRC的成功在很大程度上归功于通过使用所有类别的训练样本进行的协同表示。因此，他们提出了一种利用

范数正则化的基于协同表示的分类（Collaborative Representation BasedClassification，CRC）方法，该算法能够以较低的计算复杂度获得相似的性能。CRC之所以比SRC快，是因为CRC中的表示系数具有解析解。然而，有相关研究人员通过实验表明，稀疏表示比非稀疏表示对遮挡和噪声具有更好的鲁棒性。虽然之后提出了很多SRC和CRC的变体、改进和应用，但是真正提高人脸识别准确率始终是一个亟待解决的问题。

发明内容

为了解决现有技术中的不足，本发明提供了一种基于奇异值分解的鲁棒人脸识别方法，针对SRC对编码向量施加

范数稀疏性，虽然获得了良好的分类结果和鲁棒性，但是对于高维数据，计算时间非常长。而利用

范数正则化的CRC方法，虽然能够以较低的计算复杂度获得相似的识别精度，但是针对噪声、遮挡等干扰的鲁棒性较差。针对SRC和CRC的缺点，将奇异值分解用于人脸识别，通过对训练样本进行奇异值分解来计算编码向量，针对原有的表示方法进行改进以提高人脸识别的精度和对噪声等干扰的鲁棒性。

本发明通过如下技术方案实现：一种基于奇异值分解的鲁棒人脸识别方法，包括下列步骤：步骤一、对由灰度图像组成的训练样本矩阵中的每列进行

归一化；

步骤二、对每类样本进行奇异值分解；

所述步骤一中对于经过

归一化处理后的样本矩阵

，它可以分解为：

；

其中，其中阵和

是正交矩阵，它们的列分别是

的左奇异向量和右奇异向量；

是对角矩阵，其主对角线上存放的是

的奇异值，从大到小排列；

在引入奇异值分解的基础上，对每类训练样本进行奇异值分解；对于从每一类中构造出来的样本矩阵

，将其分解为如下表示：

；

步骤三、提取左奇异矩阵中的前

列作为投影矩阵；

取左奇异矩阵的前

列向量形成一个投影矩阵

；

步骤四、使用上述步骤得到的投影矩阵和测试样本计算出编码向量；

使用步骤三中取得的投影矩阵

，它将被用于计算编码向量：

；

指的是一个未知类别的测试样本，在得到编码向量

后，根据SRC或CRC，

表示为

；

步骤五、将投影矩阵和编码向量结合得到测试样本的近似线性表示，计算其与测试样本的残差；通过实验验证，用

代替

会获得更高的识别率，因此，使用下面的残差计算方法：

；

将编码向量与相应类别的投影矩阵结合，计算出与测试样本之间的残差向量，再将残差向量的

范数作为残差值，其中最小的残差对应的类别即为测试的类别，用于人脸识别任务。

进一步，所述步骤二中对每类构造的训练样本矩阵进行奇异值分解，即首先从每一类中随机选取若干张图像组成每一类对应的训练集，然后在每一类构造得到的训练集上执行奇异值分解算法。实验表明，相比在由所有类构造的整个训练集上进行奇异值分解而言，在每一类对应构造的训练集上进行奇异值分解得到的类别投影矩阵能够取得更好的降维效果，更能保存原始数据的判别性能。

进一步，所述步骤三的提取左奇异矩阵中的前

列作为投影矩阵，左奇异矩阵是由上一步的奇异值分解操作得到，提取其前

列，

为该类别的样本数量，组成一个投影矩阵；在所述步骤三中，如果某个数据集有

个类别，那么此处能够得到

个投影矩阵；则该投影矩阵的主要目的是对测试样本进行降维。有别于其他传统的分类算法，本发明是在每一类构造的训练集上进行奇异值分解后得到投影矩阵，而不是对所有类构造的训练集进行操作，之所以这样做的原因在于根据每一类训练集得到的投影矩阵能更好地反映本类别中所有样本的特点。

进一步，所述步骤四的编码向量，通过将上述步骤三得到的投影矩阵进行转置并与测试样本相乘计算得出；使用步骤三中得到的每个类别的投影矩阵对测试样本进行降维，处理后的测试样本维数为

，对应的是从第i类中构造训练集时选取的样本个数；如果数据集中有

个类别，那么对于同一个测试样本

，最后会得到

个编码向量

。

进一步，所述步骤四所计算的编码向量，将每类得到的编码向量与对应类别的投影矩阵进行相乘得到重构的测试样本，并计算重构的测试样本和实际测试样本

之间的残差向量，再将残差向量的

范数作为残差值；对于同一个测试样本

，会得到

个残差值，将其中最小的残差值对应的类别作为该测试样本

的类别，最后将所有测试样本的预测标签和它的实际标签进行对比，从而得到正确的识别精度。

进一步，所述步骤二中

的主对角线元素由大到小排列，值越大，维数越重要，在使用奇异值分解得到的奇异矩阵时，往往只取前几个列向量作为投影矩阵。这样得到的投影矩阵更能够反映出原始数据中潜在的特性，并使用每类训练样本得到的投影矩阵对测试样本进行降维得到对应的编码向量。根据每类得到的编码向量和每类对应的投影矩阵计算出重构的测试样本，将其与实际测试样本进行对比得到残差向量和残差值，寻找最小残差值对应的类别即为测试样本的预测标签。

进一步，所述步骤一中假设

的灰度图像表示为实数域的列向量

，训练样本共有

个类别且

是由

个类别为

的样本组成的样本矩阵；则整个训练样本矩阵可以表示为

；给定一个未知类别的测试样本

，SRC的识别步骤如下：

S1、对样本矩阵

的每列都进行

归一化；

S2、通过施加

范数稀疏性约束获取稳定的解，即编码向量：

这里的常数

是考虑到真实样本中存在噪声或计算时有编码误差而设置的误差容忍，列向量c表示编码向量；编码向量

，其中，

为类别

所对应的编码向量；

S3、计算近似残差

：

S4、最小近似残差所对应的类别即作为测试样本

的类别输出。

本发明相对于现有技术，具有以下有益效果：

本发明所提出的基于奇异值分解的鲁棒人脸识别方法，能够有效地提高人脸识别的精度并增强了对光照、噪声及遮挡等干扰的鲁棒性。本发明对每一类中构造的训练样本进行奇异值分解；根据左奇异矩阵生成投影矩阵并对测试样本进行降维得到编码向量；使用投影矩阵和编码向量重构测试样本得到对应的残差，将最小残差对应的类别作为测试样本的标签；相较于对编码向量施加

范数稀疏性的SRC和施加

范数协同性的CRC方法，本发明有效地提升了人脸识别的准确性和鲁棒性，降低了对于高维数据的计算时间。

附图说明

图1为本发明数据集PIE_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图2为本发明数据集UMIST_40x40上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图3为本发明数据集YaleB_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图4为本发明加入高斯噪声的数据集PIE_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图5为本发明加入高斯噪声的数据集UMIST_40x40上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图6为本发明加入高斯噪声的数据集YaleB_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图7为本发明加入椒盐噪声的数据集PIE_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图8为本发明加入椒盐噪声的数据集UMIST_40x40上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图9为本发明加入椒盐噪声的数据集YaleB_32x32上不同算法的平均分类精度及时间随每类训练样本数量变化的情况；

图10为本发明基于奇异值分解的鲁棒人脸识别算法框图；

图11为本发明图1、图2、图3中所涉及的数据集情况说明；

图12为本发明图1、图2、图3中所涉及的数据集图像示例；

在上述图1-图9表格中，呈现出的数据所表示的意思是：平均正确识别精度

标准偏差（%）（平均时间（单位为：秒））；

说明书附图中所涉及的方法名称解释如下：

LRC：Linear Regression Based Classification，基于线性回归的分类；

CROC：Collaborative Representation Optimized Classification，协同表示最优化分类；

ProCRC：Probabilistic Collaborative Representation BasedClassification，基于概率协同表示的分类；

NRC：Non-negative Representation Based Classification，基于非负表示的分类；

ANCR：Affine Non-negative Collaborative Representation BasedClassification，基于仿射非负协同表示的分类；

LSRC：Local Sparse Representation Based Classification，基于局部稀疏表示的分类；

SVDVR：Singular Value Decomposition Based Virtual Representation，基于奇异值分解的虚拟表示；

ADWF： Adaptive Weighted Fusion，适应权重融合；

SVDVR2020：Singular Value Decomposition-Based Virtual Representation2020，基于奇异值分解的虚拟表示，2020年版本。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

并且，本发明各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

如图1-12所示，本发明在Matlab上进行实现，对数据集中的图像进行分类。

本发明的技术方案包括以下几个部分：

（1）基于稀疏表示的分类

在SRC中，测试样本可以近似表示为训练样本的线性组合，对编码向量施加

范数稀疏性并计算残差，最后将测试样本分配给具有最小残差的相应类别。

假设

的灰度图像表示为实数域的列向量

，训练样本共有

个类别且

是由

个类别为

的样本组成的样本矩阵。则整个训练样本矩阵可以表示为

。

给定一个未知类别的测试样本

，SRC的识别步骤如下：

1、对样本矩阵

的每列都进行

归一化。

2、通过施加

范数稀疏性约束获取稳定的解，即编码向量：

这里的常数

是考虑到真实样本中存在噪声或计算时有编码误差而设置的误差容忍，列向量c表示编码向量，编码向量

，其中，

为类别

所对应的编码向量。

3、计算近似残差

：

4、最小近似残差所对应的类别即作为测试样本

的类别输出。

然而，SRC虽然获得了良好的分类结果和鲁棒性，但是对于高维数据，计算时间非常长。而CRC方法利用

范数正则化求解编码向量，虽然能够以较低的计算复杂度获得相似的识别精度，但是针对噪声、遮挡等干扰的鲁棒性较差。

（2）奇异值分解

奇异值分解（Singular Value Decomposition，SVD）是一种强大的工具，在降维、求解线性方程组、降噪等领域得到了广泛的应用；对于经过

归一化处理后的样本矩阵

，它可以分解为：

其中，其中阵

是正交矩阵，它们的列分别是

的左奇异向量和右奇异向量，

是对角矩阵，其主对角线上存放的是

的奇异值，从大到小排列。

左（或右）奇异矩阵常用于求矩阵的主成分，

的主对角线元素由大到小排列，值越大，维数越重要；因此，在使用奇异值分解得到的奇异矩阵时，往往只取前几个行向量（或列向量）。

（3）基于奇异值分解的鲁棒人脸识别

在引入奇异值分解的基础上，本发明首先对每类训练样本进行奇异值分解。对于从每一类中构造出来的训练样本矩阵

，将其分解为如下表示：

取左奇异矩阵的前

列向量形成一个投影矩阵

，它将被用于获得该类别的编码向量：

上述公式中，

指的是一个未知类别的测试样本，在得到编码向量

后，根据SRC（或CRC），

应该近似表示为

，然而通过实验验证，用

代替

会获得更高的识别率，因此，使用下面的残差计算方法：

将编码向量与相应类别的投影矩阵结合，在这里相应类别的投影矩阵是指公式（5）中的矩阵

，它是取公式（4）计算得到的

中的前

列，对于每一类构造出来的训练样本矩阵

都会计算得到一个不同的投影矩阵

，所以此处的相应类别的投影矩阵是指根据对应某一类训练样本得到的投影矩阵，通过编码向量与相应类别的投影矩阵计算出与测试样本之间的残差向量，再将残差向量的

范数作为残差值，其中最小的残差对应的类别即为测试的类别，用于人脸识别任务；最小的残差对应的类别即为测试的类别，作为识别结果输出。简单举个用于人脸识别任务的实例场景，例如南京邮电大学在新冠疫情期间为了方便教职工和学生进出校园，采用人脸识别系统，每当有人经过门禁时，摄像头会自动捕捉人脸信息并与数据库中存放的标准人脸数据进行对比，找到重构误差最小时对应的类别即为该样本的标签信息。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种基于奇异值分解的鲁棒人脸识别方法，其特征在于：包括下列步骤：

步骤一、对由灰度图像组成的训练样本矩阵中的每列进行

归一化；

步骤二、对每类样本进行奇异值分解；

所述步骤一中对于经过

归一化处理后的样本矩阵

，它可以分解为：

其中，矩阵

是正交矩阵，它们的列分别是

的左奇异向量和右奇异向量；

是对角矩阵，其主对角线上存放的是

的奇异值，从大到小排列；

，将其分解为如下表示：

；

步骤三、提取左奇异矩阵中的前

列作为投影矩阵；

取左奇异矩阵的前

列向量形成一个投影矩阵

；所述步骤三的提取左奇异矩阵中的前

列，

个类别，那么此处能够得到

个投影矩阵；

使用步骤三中取得的投影矩阵

，它将被用于计算编码向量：

；

指的是一个未知类别的测试样本，在得到编码向量

后，根据SRC或CRC，

表示为

；所述步骤四所计算的编码向量，将每类得到的编码向量与对应类别的投影矩阵进行相乘得到重构的测试样本，并计算重构的测试样本和实际测试样本

之间的残差向量，再将残差向量的

范数作为残差值；对于同一个测试样本

，会得到

个残差值，将其中最小的残差值对应的类别作为该测试样本

的类别，最后将所有测试样本的预测标签和它的实际标签进行对比，从而得到正确的识别精度；

步骤五、将投影矩阵和编码向量结合得到测试样本的近似线性表示，计算其与测试样本的残差；

通过用

代替

，使用下面的残差计算方法：

；

2.根据权利要求 1所述的一种基于奇异值分解的鲁棒人脸识别方法，其特征在于：所述步骤二中对每类构造的训练样本矩阵进行奇异值分解，即首先从每一类中随机选取若干张图像组成每一类对应的训练集，然后在每一类构造得到的训练集上执行奇异值分解算法。

3.根据权利要求 1所述的一种基于奇异值分解的鲁棒人脸识别方法，其特征在于：所述步骤四的编码向量，通过将上述步骤三得到的投影矩阵进行转置并与测试样本相乘计算得出；使用步骤三中得到的每个类别的投影矩阵对测试样本进行降维，处理后的测试样本维数为

个类别，那么对于同一个测试样本

，最后会得到

个编码向量

。

4.根据权利要求 1所述的一种基于奇异值分解的鲁棒人脸识别方法，其特征在于：所述步骤二中

的主对角线元素由大到小排列，值越大，维数越重要，在使用奇异值分解得到的奇异矩阵时，取前几个列向量作为投影矩阵；使用每类训练样本得到的投影矩阵对测试样本进行降维得到对应的编码向量；根据每类得到的编码向量和每类对应的投影矩阵计算出重构的测试样本，将其与实际测试样本进行对比得到残差向量和残差值，寻找最小残差值对应的类别即为测试样本的预测标签。