CN111931665B

CN111931665B - 一种基于类内变化字典建模的欠采样人脸识别方法

Info

Publication number: CN111931665B
Application number: CN202010813209.5A
Authority: CN
Inventors: 栾晓; 孔艳; 唐秘
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-08-13
Filing date: 2020-08-13
Publication date: 2023-02-21
Anticipated expiration: 2040-08-13
Also published as: CN111931665A

Abstract

本发明涉及一种基于类内变化字典建模的欠采样人脸识别方法，属于数字图像和模式识别领域。该方法包括：字典学习阶段：通过鲁棒主成分分析法获得通用数据集的稀疏误差图像，将其作为类内变化字典，提供更多的类内变化信息；人脸识别阶段：将学习到的字典添加到扩展的基于稀疏表示分类的框架中以完成人脸识别过程。本发明通过鲁棒主成分分析法提取类内变化字典，相较于扩展的基于稀疏表示分类法，欠采样人脸识别的结果更有效，更具有鲁棒性，尤其是在跨数据库上的识别。

Description

一种基于类内变化字典建模的欠采样人脸识别方法

技术领域

本发明属于数字图像和模式识别领域，涉及鲁棒主成分分析等技术，主要针对欠采样人脸识别的问题。

背景技术

近年来，人脸识别技术已经成功地应用了稀疏编码技术，最典型的工作是用于面部识别的基于稀疏表示的分类(SRC)。它需要大量的训练样本，否则其性能将下降。但是，在许多应用中，比如法律实施、护照验证、身份证验证等，每人只有很少甚至一张图像可供训练人脸识别系统，这被称为欠采样人脸识别问题，并且测试图像会包含各种变化，例如光照，表情和面部遮挡(比如围巾和墨镜)，这些额外的面部干扰会使面部识别率下降。

为了解决欠采样问题，一些现有文献提出了一种通用的学习框架，这个框架从通用集合中提取判别性信息。如邓伟洪等人在SRC的框架中增加了通用性，提出了扩展的基于稀疏表示的分类(ESRC)，该分类假设一类的类内变化可以通过其他类的类内变化的稀疏线性组合来近似。尽管ESRC的结果在某些情况下良好，但当类内差异很大时，其性能不是很好。这是因为它类内字典的构建过程相对简单，所以很难捕获到复杂的类内变化。

发明内容

有鉴于此，本发明的目的在于提供一种基于类内变化字典建模的欠采样人脸识别方法，解决实际生活中每个人只有很少甚至一张训练图像的人脸识别问题，提高基于少样本图像的识别效果。

为达到上述目的，本发明提供如下技术方案：

一种基于类内变化字典建模的欠采样人脸识别方法，包括以下步骤：

S1：字典学习阶段：通过鲁棒主成分分析法获得通用数据集的稀疏误差图像，将其作为类内变化字典，提供了更多的类内变化信息；

S2：人脸识别阶段：将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中以完成人脸识别过程。

进一步，所述步骤S1具体包括以下步骤：

S11：选取用于构造字典的样本M；

S12：通过鲁棒主成分分析法获得稀疏误差图像S，计算公式为：

min_L，S(||L||_*+γ||S||₁)，s.t. M＝L+S

其中，γ是正则化参数，L是图像的低秩成分，S是图像的稀疏成分，‖·‖_*表示核范数。

S13：用基于增广拉格朗日乘数的方法求解步骤S12的凸优化问题，从而得到稀疏误差图像S，将其作为类内变化字典。

进一步，所述步骤S2具体包括以下步骤：

S21：选取训练和测试样本进行人脸识别；

S22：将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中学习表示系数；

S23：计算每一类的表示误差，将最小误差的那一类确定为测试样本的类别。

进一步，所述步骤S22具体包括以下步骤：

S221：定义y为测试样本，A为训练矩阵，S为通过鲁棒主成分分析得到的类内变化字典，x，β为表示系数，则表示系数的计算公式为：

其中，

是表示系数，λ是正则化系数。

S222：通过同伦法求解步骤S221中的1范数最小化问题，从而计算出表示系数。

本发明的有益效果在于：与扩展的基于稀疏表示分类方法相比，本发明构造的字典可以提供类内差异的更多信息，识别的结果更有效，更具有鲁棒性，尤其是跨数据库上的欠采样人脸识别。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为本发明方法的基本构思示意图；

图2为本发明方法的流程框图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

请参阅图1～图2，本发明优选了一种基于类内变化字典建模的欠采样人脸识别方法，为了使类内变化字典更多的包含类内变化信息，本实施例引入了鲁棒性主成分分析法，该方法得到的稀疏误差图像可作为类内变化字典，将此字典添加到扩展的基于稀疏表示分类的框架中进行人脸识别，可提升识别性能。

首先我们定义

为一个含有n个训练样本的训练集，其中a_i为第i个样本，d为图像的维数；定义

为一个含有m个样本的类内变化字典，y为测试样本。扩展的基于稀疏表示分类方法通过如下模型来实现图像分类：

其中x和β是表示系数，D_I可以通过从相同类别的图像减去自然图像或类质心图像得到。该方法中类内变化字典的构造过程相对简单，不易获得复杂的类内变化信息，进而导致识别的性能下降。为了解决这个缺陷，本实施例提出如下改进的模型来提高识别性能：

其中，S是由鲁棒主成分分析方法获得的稀疏误差图像矩阵。输入一张图像

鲁棒主成分分析方法通过解决如下模型获得稀疏误差图像：

min_L，S(||L||_*+γ||S||₁)，s.t. M＝L+S (5)

其中，γ是正则化参数，被固定为

从公式(3)可以看到，本模型是一个1范数最小化问题，可用同伦法求解，我们将λ设为0.02。公式(5)是一个凸优化问题，可用基于增广拉格朗日乘数的方法求解。

为了验证本发明的效果，进行了以下实验：

1、训练样本不足的实验。

2、跨数据库上的实验。

对于实验1，分别在AR数据库和EYB数据库上进行了训练样本不足的实验。在AR数据库上，选取了一个子集，该子集包含来自于100类的900张人脸。随机选取80类，其中每类1张自然图像用于训练，其他包含光照，表情，遮挡的8张图像用于测试。剩余的20类用于构造类内变化字典。实验结果如表1所示。

表1每人一个训练样本在AR数据库上的识别准确性(％)

在EYB数据库上，选取第一类的64张图像用于构造类内变化字典，其余37类中子集1的7张图像用于训练，子集2-5的图像用于测试。实验结果如表2所示。

表2使用一类的类内字典在EYB数据库上的识别率(％)

对于实验2，在AR数据库上学习光照变化下的类内字典，在EYB数据库上进行训练和测试。实验结果如表3所示。

表3使用AR数据库的类内字典在EYB数据库上的识别率(％)

从以上三个表的实验对比结果可以看出，本发明所设计的欠采样人脸识别方法能够提高识别率。特别是在跨数据库实验上，ESRC相较于SRC识别率没什么提升，而本发明依然有提升，说明本发明相较于ESRC来说更具有鲁棒性。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。