CN108171216A - 一种用于人脸识别的稀疏噪声矩阵分解方法 - Google Patents
一种用于人脸识别的稀疏噪声矩阵分解方法 Download PDFInfo
- Publication number
- CN108171216A CN108171216A CN201810081211.0A CN201810081211A CN108171216A CN 108171216 A CN108171216 A CN 108171216A CN 201810081211 A CN201810081211 A CN 201810081211A CN 108171216 A CN108171216 A CN 108171216A
- Authority
- CN
- China
- Prior art keywords
- face
- matrix
- object function
- noise
- present
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
- G06F18/21322—Rendering the within-class scatter matrix non-singular
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种用于人脸识别的稀疏噪声矩阵分解方法。本发明把数据集X表示成X=WH+S,其中为基矩阵,为低维权重矩阵,为噪声矩阵,构造目标函数,并把目标函数转化为易于求解的形式,更新软阈值,并构造软阈值函数,求解W和H,重构训练集和测试集中的人脸图像。本发明克服了过去主成分分析(PCA)、非负矩阵分解(NMF)和鲁棒非负矩阵分解(RNMF)算法各自存在的缺陷。本发明在数据表达阶段引入了噪声矩阵使得算法能够分离噪声,增加算法的鲁棒性,由于W和H的秩在编程中确定,目标函数仅需采用一范数,运算量大大减小,迭代次数少,处理速度快,软间隔运算函数中的λ每次迭代都重新赋值,一方面,X‑WH是变化的,λ需要采用非固定值随其改变,另一方面,采用均值达到缩小列维度均值的效果。
Description
技术领域
本发明涉及人脸识别技术领域,特别涉及一种用于人脸识别的稀疏噪声矩阵分解方法。
背景技术
近几年来,计算机技术、通信技术和互联网技术发展迅猛,身份认证需要被用在众多领域。人脸图像的使用可以被认为是最流行的。虽然目前已经有很多关于人脸识别的研究成果,但是如何克服光照、表情、遮挡、等变化因素的影响仍然是一个严峻的问题。
在本发明之前,传统算法研究如何对人脸进行降维从而使人脸便于识别。有主成分分析(PCA)、非负矩阵分解(NMF)和鲁棒非负矩阵分解(RNMF)算法。主成分分析主要提取贡献量大的主成分,一方面此做法有损失有用信息的风险,另一方面,被提取的主成分需符合实际背景,否则是无意义的;非负矩阵分解是假设噪声为高斯噪声或泊松噪声,但是实际采集人脸往往不满足该算法的噪声假设。鲁棒非负矩阵分解是非负矩阵分解算法是的改进,但其限制条件多,运算效率低,且对于光照、表情、遮挡、等变化因素的影响,识别精度会不能具备很强的鲁棒性。
发明内容
本发明的目的就在于克服上述缺陷,提供一种用于人脸识别的稀疏噪声矩阵分解方法。
本发明的技术方案是:
一种用于人脸识别的稀疏噪声矩阵分解方法,具体步骤如下所述:
1)数据表达式
对一个人脸数据库,要挖掘其潜在的数据特性;将每一个人脸表示成一个m维向量,则n个人脸就为x1,x2,…,xn,表示成矩阵形式就是X=[x1,x2,…,xn]T∈in×m。SCMF目的是把数据集X分解为基矩阵W∈in×r和低维权重矩阵H∈ir×m的乘积形式加噪声矩阵S∈in×m的形式X=WH+S;
2)目标函数
我们的目的就是求解W和H,因此需要选择恰当的目标函数;由于S是稀疏的,所以SCMF方法用稀疏性的约束项作为目标函数,从而使目标函数变为:
考虑到l0范数的求解是NP难问题,因此将其凸松弛为l1范数,于是问题可转化成如下形式:
这里||·||1表示对矩阵中所有的元素求和;
3)一范数的求解
定义软间隔运算函数:
直观地来看,软间隔运算函数就是将X-WH的每一元素值(即噪声矩阵每一元素缩小),对于(-λj,λj)范围内的数值点,将其变为0,范围右侧的点,将其减小,左侧的点,增大数值,从而使得噪声矩阵S逐步趋于稀疏;
每次迭代中,λ中的每一列取X-WH中相应列的均值;
经过化简,最终得到:
W=(X-ρ)pinv(H)
H=pinv(W)(X-ρ)
4)人脸重构
对于测试集中没有经过训练的被污染的人脸,采用下式进行恢复;
xi′←xipinv(H)H
式中xi表示被污染的人脸,xi′表示经过恢复的人脸。
本发明的优点和效果在于:
首先在数据表达阶段,引入了噪声矩阵S∈in×m,使得算法能够分离噪声,增加算法的鲁棒性;
其次,由于W和H的秩在编程中确定,目标函数仅需采用一范数,运算量大大减小,迭代次数少,处理速度快。
再次,软间隔运算函数中的λ每次迭代都重新赋值。一方面,X-WH是变化的,λ需要采用非固定值随其改变,另一方面,采用均值达到缩小列维度均值的效果。
最后,用训练出的H还能对训练集外的人脸进行重构。
附图说明
图1——本发明流程示意图。
图2——本发明中腐败的Yale人脸库上的平均识别率随每类训练样本个数变化的情况示意图。
图3——本发明SCMF对训练集人脸的恢复情况示意图,其中a是Yale人脸数据库中的15幅加噪声图像,b是重建的人脸图,c是分离出的噪声图,d是包含在H中的15个基本向量。
图4——本发明测试集中的人脸恢复效果图,其中e是恢复前的人脸图像,f是恢复后的人脸图像。
具体实施方式
本发明的技术思路是:
一方面,该算法能够有效地还原出训练集中有噪声的人脸图像人脸,另一方面,通过得到的低维权重矩阵能够对测试集中的样本进行重构。实验证明,该算法具有很高的鲁棒性并且处理速度很快。
在人脸识别过程中,传统的识别方法会因为环境因素(如光照、表情、遮挡)的变化而影响识别率。本发明提出了一种基于稀疏噪声矩阵分解方法来增加人脸识别的鲁棒性和准确性。在本发明中,主要由以下几个方面组成:1)是把数据集X表示成X=WH+S,其中W∈in ×r为基矩阵,H∈ir×m为低维权重矩阵,S∈in×m为噪声矩阵;2)构造目标函数,并把目标函数转化为易于求解的形式;3)更新软阈值,并构造软阈值函数,求解W和H;4)重构训练集和测试集中的人脸图像。
本发明流程图如图1所示,具体的操作如下所述:
1)数据表达式
以Yale数据库为例,数据库包含15个对象,每个对象11张图片共计165张面部图像,每张图像的尺寸是112×92像素,因此,每张图像被表示为一个10304维向量,即m=10304。每个对象选取6张图像测试,分解后的矩阵取秩为15。则训练集有90张图像,测试集有75张图像。训练数据X=[x1,x2,…,x90]T∈i90×10304,初始化时矩阵中每个数值在0到1间任取,初始化W∈i90×15,初始化H∈i15×10304,噪声通过S=X-WH初始化。
2)目标函数
明确所要求解的问题是:
这里||·||1表示对矩阵中所有的元素求和。
3)一范数的求解
通过S得到阈值,即λj为S矩阵每一列均值:
λj←mean(Skj),(k=1,2,…,n)
将其带入软间隔运算函数:
求出的ρ带入下方公式,即可求解出W和H。
W=(X-ρ)pinv(H)
H=pinv(W)(X-ρ)
需要说明的是:W和H是非方阵,不可用一般的方法求逆,要用广义的逆矩阵求逆。
4)人脸重构
对于训练集中的90个人脸,采用下式重构:
X′=WH
重构出的X′∈i90×10304的每一行代表一个人脸向量,将向量按照本节步骤1)相同的方式展开成一幅图像,就是显示出一张人脸。
对于测试集中的75个人脸,某张脸被表示成xi∈i1×10304,采用下式重构:
xi′←xipinv(H)H
重构出的x′∈i1×10304代表一个人脸向量,同样将向量按照本节步骤1)相同的方式展开成一幅人脸图像。
为了验证所提算法的性能,我们将在国际标准的Yale人脸数据库上进行实验。实验中,为了减小实验误差,所有实验运行20次,取20次结果的平均值作为最终结果。为了模拟图像严重损坏的情况,我们将Yale面部数据库中的所有图像加上噪声,在这些图像上叠加三个10×10白色块将原图破坏。
实验采用最小欧式距离分类,随机选择每个人的k(k=1,2,3,…,8,9)张图片作为已知样本集,其余图片作为测试集。将所提的SCMF算法与NMF算法、RNMF算法进行比较,图2展示了三种算法在每类不同训练样本数目下的平均识别率变化趋势。从识别精度来看,SCMF算法显著高于经典的NMF算法,并且高于从NMF改进而来的RNMF算法,因此所提算法在提高人脸识别精度上有显著效果。
图3和图4是人脸重构效果展示。
训练集中的人脸,重构效果如图3。由图可知,(a)中人脸明显被破坏,SCMF算法能从(a)中分离噪声,并且重构出人脸,重构结果清晰、辨识度很高。(d)是包含在H中的15个基本向量,即特征脸,在重构测试集人脸时,会使用到H。
图4是测试集人脸的重构效果。由图可知,重构后的人脸能去除表情和恶意添加的白块,效果显著,这为人脸识别提供了较好的重构人脸数据。
Claims (1)
1.一种用于人脸识别的稀疏噪声矩阵分解方法,其特征在于步骤如下:
(1)数据表达式
对一个人脸数据库,挖掘其潜在的数据特性;将每一个人脸表示成一个m维向量,则n个人脸就为x1,x2,…,xn,表示成矩阵形式就是SCMF目的是把数据集X分解为基矩阵和低维权重矩阵的乘积形式加噪声矩阵的形式X=WH+S;
(2)目标函数
求解W和H,选择恰当的目标函数;由于S是稀疏的,所以SCMF方法用稀疏性的约束项作为目标函数,从而使目标函数变为:
考虑到l0范数的求解是NP难问题,因此将其凸松弛为l1范数,于是问题可转化成如下形式:
这里||·||1表示对矩阵中所有的元素求和;
(3)一范数的求解
定义软间隔运算函数:
直观地来看,软间隔运算函数就是将X-WH的每一元素值(即噪声矩阵每一元素缩小),对于(-λj,λj)范围内的数值点,将其变为0,范围右侧的点,将其减小,左侧的点,增大数值,从而使得噪声矩阵S逐步趋于稀疏;
每次迭代中,λ中的每一列取X-WH中相应列的均值;
经过化简,最终得到:
W=(X-ρ)pinv(H)
H=pinv(W)(X-ρ)
(4)人脸重构
对于测试集中没有经过训练的被污染的人脸,采用下式进行恢复;
xi′←xipinv(H)H
式中xi表示被污染的人脸,xi′表示经过恢复的人脸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810081211.0A CN108171216A (zh) | 2018-01-22 | 2018-01-22 | 一种用于人脸识别的稀疏噪声矩阵分解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810081211.0A CN108171216A (zh) | 2018-01-22 | 2018-01-22 | 一种用于人脸识别的稀疏噪声矩阵分解方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108171216A true CN108171216A (zh) | 2018-06-15 |
Family
ID=62516110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810081211.0A Pending CN108171216A (zh) | 2018-01-22 | 2018-01-22 | 一种用于人脸识别的稀疏噪声矩阵分解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108171216A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004008391A1 (ja) * | 2002-07-16 | 2004-01-22 | Nec Corporation | パターン特徴抽出方法及びその装置 |
CN103971132A (zh) * | 2014-05-27 | 2014-08-06 | 重庆大学 | 应用二维非负稀疏偏最小二乘进行人脸识别的方法 |
CN104200194A (zh) * | 2014-08-06 | 2014-12-10 | 北京工业大学 | 一种人脸识别方法 |
US20160034789A1 (en) * | 2014-08-01 | 2016-02-04 | TCL Research America Inc. | System and method for rapid face recognition |
CN105469034A (zh) * | 2015-11-17 | 2016-04-06 | 西安电子科技大学 | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 |
CN106326871A (zh) * | 2016-08-26 | 2017-01-11 | 中国计量大学 | 一种基于字典分解和稀疏表示的鲁棒人脸识别方法 |
US20170116481A1 (en) * | 2015-10-23 | 2017-04-27 | Beihang University | Method for video matting via sparse and low-rank representation |
-
2018
- 2018-01-22 CN CN201810081211.0A patent/CN108171216A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004008391A1 (ja) * | 2002-07-16 | 2004-01-22 | Nec Corporation | パターン特徴抽出方法及びその装置 |
CN103971132A (zh) * | 2014-05-27 | 2014-08-06 | 重庆大学 | 应用二维非负稀疏偏最小二乘进行人脸识别的方法 |
US20160034789A1 (en) * | 2014-08-01 | 2016-02-04 | TCL Research America Inc. | System and method for rapid face recognition |
CN104200194A (zh) * | 2014-08-06 | 2014-12-10 | 北京工业大学 | 一种人脸识别方法 |
US20170116481A1 (en) * | 2015-10-23 | 2017-04-27 | Beihang University | Method for video matting via sparse and low-rank representation |
CN105469034A (zh) * | 2015-11-17 | 2016-04-06 | 西安电子科技大学 | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 |
CN106326871A (zh) * | 2016-08-26 | 2017-01-11 | 中国计量大学 | 一种基于字典分解和稀疏表示的鲁棒人脸识别方法 |
Non-Patent Citations (1)
Title |
---|
江明阳等: "基于鲁棒主成分分析的人脸子空间重构方法", 《计算机辅助设计与图形学学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chalasani et al. | A fast proximal method for convolutional sparse coding | |
Sagong et al. | Pepsi: Fast image inpainting with parallel decoding network | |
Chang et al. | HSI-DeNet: Hyperspectral image restoration via convolutional neural network | |
Xu et al. | Vector sparse representation of color image using quaternion matrix analysis | |
Zeiler et al. | Adaptive deconvolutional networks for mid and high level feature learning | |
Wang et al. | Deepfont: Identify your font from an image | |
Mahendran et al. | Understanding deep image representations by inverting them | |
CN109886881B (zh) | 人脸妆容去除方法 | |
CN108520503A (zh) | 一种基于自编码器和生成对抗网络修复人脸缺损图像的方法 | |
CN109583298A (zh) | 基于集合的跨视角步态识别方法 | |
Xu et al. | Denoising convolutional neural network | |
Bibi et al. | High order tensor formulation for convolutional sparse coding | |
Chen et al. | Explicit filterbank learning for neural image style transfer and image processing | |
Hurault et al. | EPLL: an image denoising method using a Gaussian mixture model learned on a large set of patches | |
Bounsaythip et al. | Genetic algorithms in image processing-a review | |
Gan et al. | A PCA-based convolutional network | |
CN113221660B (zh) | 一种基于特征融合的跨年龄人脸识别方法 | |
CN113592728A (zh) | 一种图像复原方法、系统、处理终端及计算机介质 | |
Salem et al. | A vertex chain code approach for image recognition | |
Bahri et al. | Robust Kronecker-decomposable component analysis for low-rank modeling | |
CN108171216A (zh) | 一种用于人脸识别的稀疏噪声矩阵分解方法 | |
CN111508043A (zh) | 一种基于判别共享字典的机织物纹理重构方法 | |
Tu et al. | Texture pattern separation for hyperspectral image classification | |
Mohamed et al. | Artificial face recognition using Wavelet adaptive LBP with directional statistical features | |
Versteegen et al. | Texture modelling with nested high-order Markov–Gibbs random fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180615 |