CN108509833B - 一种基于结构化分析字典的人脸识别方法、装置及设备 - Google Patents

一种基于结构化分析字典的人脸识别方法、装置及设备 Download PDF

Info

Publication number
CN108509833B
CN108509833B CN201711393942.0A CN201711393942A CN108509833B CN 108509833 B CN108509833 B CN 108509833B CN 201711393942 A CN201711393942 A CN 201711393942A CN 108509833 B CN108509833 B CN 108509833B
Authority
CN
China
Prior art keywords
sub
face
sample set
face recognition
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711393942.0A
Other languages
English (en)
Other versions
CN108509833A (zh
Inventor
张召
孙玉林
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201711393942.0A priority Critical patent/CN108509833B/zh
Publication of CN108509833A publication Critical patent/CN108509833A/zh
Application granted granted Critical
Publication of CN108509833B publication Critical patent/CN108509833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质。其中,方法包括将人脸训练样本集和人脸测试样本集输入人脸识别模型中,并对人脸识别模型进行参数初始化,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,得到各类别数据集的子字典和相对应的子稀疏编码;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集进行分类识别。本申请的技术方案有效的提升了人脸识别的效率和准确度。

Description

一种基于结构化分析字典的人脸识别方法、装置及设备
技术领域
本发明实施例涉及计算机视觉和图像识别技术领域,特别是涉及一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质。
背景技术
随着计算机技术和智能化的不断发展,人脸识别已经发展成为计算机视觉与模式识别中非常重要的一个研究课题。人脸识别通过计算机将人脸图像电子化,然后分析人脸图像定位人脸,获取人脸的面部特征,在门禁系统、摄像监视系统和智能手机等领域有着重大的意义,一旦研究成功并投入应用,将会产生巨大的社会和经济效益。
但是,人脸识别的过程具有一定难度,现有的基于字典学习的人脸识别方法在训练和识别过程中耗时巨大,不利于具体应用的投入。目前大多数字典学习都使用l0/l1范数进行稀疏编码时的约束,虽然取得了一定的成果,但是耗时巨大。真实世界中的图像(包括人脸图像)不仅仅只是图像重建,且采集的图像通常包含破坏、丢失数据,或设备或光线问题造成的图像差异,因此在考虑字典学习的同时,如何有效排除干扰,训练出具有很强辨别能力和快速识别能力的分类器是值得探讨和深入的问题。
近年来,一个最具代表性的字典学习重建数据方法KSVD可对原始数据进行较为准确的复原。当数据有噪声时,KSVD可以很大程度地恢复数据,但它本质上是一种数据重建的线性方法,能够对非稀疏的数据重建,但是不能对数字图像进行识别和分类。为了克服此缺点,KSVD的推广D-KSVD被提出。IRPCA目标是基于字典学习和稀疏编码训练一个由判别能力的分类器,但在判别过程中并没有考虑不同类别之间相关性的处理问题。同时LC-KSVD考虑标签的约束来增强判别能力,FDDL算法考虑使用结构化字典来进一步提高判别能力。上面的这些方法虽然有不错的效果,但是没有考虑不同的类别数据间的关系,导致人脸识别的准确率不高。
因此,如何得到具有强判别能力的分类器,缩短识别的时间与识别的准确度,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质,缩短了人脸识别的时间,有效的提升人脸图像表示和识别效率和准确度。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种基于结构化分析字典的人脸识别方法,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
可选的,所述对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
Figure GDA0001752045690000031
式中,
Figure GDA0001752045690000032
为学习得到的子字典集,c为所述人脸训练样本集包含的类别数目,
Figure GDA0001752045690000033
为第l类的子字典,
Figure GDA0001752045690000034
为第l类的子字典对应的子稀疏编码,
Figure GDA0001752045690000035
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
可选的,所述对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影包括:
根据下述公式从各子稀疏编码中提取相对应的子投影:
Figure GDA0001752045690000036
式中,所述人脸训练样本集为
Figure GDA0001752045690000037
c为所述人脸训练样本集包含的类别数目,
Figure GDA0001752045690000038
为子投影集,
Figure GDA0001752045690000039
是第l类子稀疏编码的子投影。
可选的,所述根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器包括:
根据各子投影及所述人脸训练样本集,利用下述公式作为训练函数对所述人脸识别模型中的各子分类器进行训练:
Figure GDA00017520456900000310
式中,所述人脸训练样本集为
Figure GDA00017520456900000311
c为所述人脸训练样本集包含的类别数目,
Figure GDA00017520456900000312
为子投影集,
Figure GDA00017520456900000313
是第l类子稀疏编码的子投影,Hl,i=[0,…,1,…,0]∈Rc,Hl=[hl,1,…,hl,i,…,hl,N1],为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
可选的,所述人脸识别模型的目标函数为:
Figure GDA0001752045690000041
式中,
Figure GDA0001752045690000042
Figure GDA0001752045690000043
为子字典的约束,所述人脸训练样本集为
Figure GDA0001752045690000044
c为所述人脸训练样本集包含的类别数目,
Figure GDA0001752045690000045
为学习得到的子字典集,
Figure GDA0001752045690000046
为子投影集,
Figure GDA0001752045690000047
是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
本发明实施例另一方面提供了一种基于结构化分析字典的人脸识别装置,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
可选的,所述模型训练模块为将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
Figure GDA0001752045690000051
式中,
Figure GDA0001752045690000052
为学习得到的子字典集,c为所述人脸训练样本集包含的类别数目,
Figure GDA0001752045690000053
为第l类的子字典,
Figure GDA0001752045690000054
为第l类的子字典对应的子稀疏编码,
Figure GDA0001752045690000055
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
可选的,所述模型训练模块为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
Figure GDA0001752045690000056
式中,所述人脸训练样本集为
Figure GDA0001752045690000057
c为所述人脸训练样本集包含的类别数目,
Figure GDA0001752045690000058
为子投影集,
Figure GDA0001752045690000059
是第l类子稀疏编码的子投影。
本发明实施例还提供了一种基于结构化分析字典的人脸识别装置,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例最后还提供了一种计算机存储介质,所述计算机可读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时实现如前任一项所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例提供了一种基于结构化分析字典的人脸识别方法,将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化,人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
本申请提供的技术方案的优点在于,将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而使得各子分类器具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短了人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
此外,本发明实施例还针对基于结构化分析字典的人脸识别方法提供了相应的实现装置、设备及计算机存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机存储介质具有相应的优点。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于结构化分析字典的人脸识别方法的流程示意图;
图2为本发明实施例提供的一种基于结构化分析字典的人脸识别算法的求解流程图;
图3为本发明实施例提供的基于结构化分析字典的人脸识别装置的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种基于结构化分析字典的人脸识别方法的流程示意图,本发明实施例可包括以下内容:
S101:将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化。
人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别。
人脸训练样本集包括少量有标签样本和适量无标签样本,人脸测试样本集的数据均为无标签样本。人脸训练样本集用于模型优化的投影学习,第一预设个数和第二预设个数可为任意数据,本申请对此不做任何限定。
S102:对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影。
S103:根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器。
S104:利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
本申请提出一种基于结构化判别字典学习模型的分析机制,通过联和学习结构化分析字典、一组分析稀疏编码投影和分析多类线性分类器进行表示和分类,因此本申请需要求解以下模型:
Figure GDA0001752045690000081
式中,
Figure GDA0001752045690000082
v∈{1,……,K},f(Dl)为非相干性提升函数,r(Pl,Sl)为分析稀疏编码投影函数,g(Hl,Wl,Pl)为分类器训练函数。
对上述模型进行求解的具体过程可为:
对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
子稀疏编码Sl能对人脸训练样本集Xl很好的表示,即Xl≈DlSl,但是,Sl和非对应的类别l是独立的,所以需要
Figure GDA0001752045690000083
尽可能的小,这样DlSj就不在近似等于Xl,所以基于结构化分析字典的人脸识别方法的不连续提升函数,即将下述公式作为人脸识别模型中的提升函数,对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
Figure GDA0001752045690000084
式中,
Figure GDA0001752045690000085
为学习得到的子字典集,c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000086
为人脸训练样本集的第l类,
Figure GDA0001752045690000087
为第l类的子字典,
Figure GDA0001752045690000088
为第l类的子字典对应的子稀疏编码,
Figure GDA0001752045690000089
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
系数编码在人脸训练样本集上的投影提取,可采用近似分析方法,获得子稀疏编码的子投影,具体为:
根据上述计算得到的子稀疏编码矩阵S=[S1,…,Sl,…Sc],定义
Figure GDA0001752045690000091
为子稀疏编码提取的投影,
Figure GDA0001752045690000092
是第l类子稀疏编码的子投影,将子投影Pl作为从人脸训练样本集中计算特殊特征和稀疏编码的桥梁,故有:
PlXl≈Sl
且PlXj≈0,
Figure GDA0001752045690000093
同时本申请的Sl是尽可能稀疏的,可以使用l2,1范数进行约束,本申请可以将本申请的子稀疏编码提取函数定义为:
Figure GDA0001752045690000094
式中,||Sl||2,1为l2,1范数约束,
Figure GDA0001752045690000095
是稀疏编码的提取项;人脸训练样本集为
Figure GDA0001752045690000096
c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000097
为子投影集,
Figure GDA0001752045690000098
是第l类子稀疏编码的子投影。根据上述公式从各子稀疏编码中提取相对应的子投影,得到人脸训练样本集中每一类别的子稀疏编码在对应训练数据集下的投影
Figure GDA0001752045690000099
根据各子投影、人脸训练样本集及人脸训练样本集中各类别标签对各子分类器进行训练。
对于类别标签向量,有Hl≈WlPlXl,Wl∈Rc×k为子分类器。本申请让Wl能够预测类别j的时候接近0空间,即WlPlXj≈0,
Figure GDA00017520456900000910
因此本申请可以得到分析多类分类器训练函数,即利用下述公式作为训练函数对人脸识别模型中的各子分类器进行训练:
Figure GDA00017520456900000911
式中,
Figure GDA00017520456900000912
为一个子分类器训练项;人脸训练样本集为
Figure GDA00017520456900000913
c为人脸训练样本集包含的类别数目,
Figure GDA00017520456900000914
为子投影集,
Figure GDA00017520456900000915
是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
人脸识别模型的目标函数可为:
Figure GDA0001752045690000101
式中,
Figure GDA0001752045690000102
v∈{1,……,K},
Figure GDA0001752045690000103
为子字典的约束,人脸训练样本集为
Figure GDA0001752045690000104
c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000105
为学习得到的子字典集,
Figure GDA0001752045690000106
为子投影集,
Figure GDA0001752045690000107
是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc ×k为子分类器。
在本发明实施例提供的技术方案中,将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
为了进一步证实本申请提供的技术方案具有好的人脸识别效果,且具有普遍说明性,本申请在4个现实人脸图像数据库(CMU PIE、MIT CBCL、AR及UMIST)、1个目标数据库ETH80以及1个15场景分类数据库进行了算法测试。CMU PIE人脸数据库有11554张样本图片,包含68个类别;MIT CBCL人脸数据库有3240张样本图片,包含10个类别;AR人脸数据库有2600张样本图片,包含100个类别;UMIST人脸数据库有1012张样本图片,包含20个类别;ETH80目标数据库有3280张样本图片,包含80个类别,15场景分类数据库有44885张样本图片,包含15个类别。测试内容广泛,测试数据充足,因而测试结果具有普遍说明性。
下面将结合附图2,对本申请提供的算法具体求解方法进行说明。本申请提出的人脸识别模型需要确定并求解的参数有4个,分别是D,S,P,W,对于4个参数的优化,本申请可由下面方式来确定:
输入训练数据集X、标签矩阵向量H、参数α、τ、λ及字典数目K;
使用单位F范数的随机矩阵来初始化D,S,P,W,即D(0),S(0),P(0),W(0);Λ=I,t=0;
固定D,P来求解S,Λ,通过定义的l2,1范数可知||S||2,1=2tr(STΛS)。其中Λ是一个对角矩阵,Λii=1/2||Si||2,Si是S的第i行。将ADDL简化可得到:
Figure GDA0001752045690000111
其中,
Figure GDA0001752045690000112
并且每个Λ′≠0,
通过求解导数
Figure GDA0001752045690000113
可以得到如下结果:
Figure GDA0001752045690000114
然后,可以根据Λii=1/2||Si||2更新Λ。
固定S,W来最优化P,需要求解如下最优化问题:
Figure GDA0001752045690000115
其中,
Figure GDA0001752045690000116
通过求解
Figure GDA0001752045690000117
P的求解算法为:
Figure GDA0001752045690000121
其中,γ=1e-4为一个很小的数,以防止XXT是奇异矩阵。
固定P最优化求解W,即需要求解下面的公式:
Figure GDA0001752045690000122
其中,
Figure GDA0001752045690000123
通过求解
Figure GDA0001752045690000124
W的求解算法为:
Figure GDA0001752045690000125
固定S最优化求解D,根据下面的公式来更新字典D:
Figure GDA0001752045690000126
其中,
Figure GDA0001752045690000127
s.t.
Figure GDA0001752045690000128
v∈{1,…,K}。
根据拉格朗日微分算法函数求解,可以得到:
Figure GDA0001752045690000129
其中,ηi
Figure GDA00017520456900001210
的第i个约束的拉格朗日乘数。本申请创建一个
Figure GDA00017520456900001211
为对角矩阵,并且(Ml)ii=ηi,可得到下面的公式:
Figure GDA00017520456900001212
通过求解
Figure GDA00017520456900001213
能够得到Dl的求解结果为:
Figure GDA00017520456900001214
上述过程交替求解,直到达到本申请需要的精度或者模型收敛,输出D,S,P,W。
请参阅表1为本申请提供的技术方案和SRC、DLSI、KSVD、D-KSVD、FDDL、LC-KSVD1、LC-KSVD2、DPL在CMU PIE数据集上的预测结果。本申请需要先将数据变化到32×32像素大小,然后使用主成分分析对数据降维处理,分别使用每人训练照片数量为10、15、20、25、30,剩下的作为测试集。可以发现,本申请的方法比其他的方法效果更好。
表1在CMU PIE数据集上PCA降维后识别结果
Figure GDA0001752045690000131
请参阅表2为本发明方法和SRC、DLSI、KSVD、D-KSVD、FDDL、LC-KSVD1、LC-KSVD2、DPL在MIT CBL人脸数据集上的预测结果。本发明将会随机选择2、4、6中标签数据,切分训练集和测试集10次来评价本发明的识别效果,计算出每次训练得到准确率的均值和标准差,可以发现本发明的方法比其他方法有更好的识别效果。
表2 MIT CBL人脸数据集上的识别效果
Figure GDA0001752045690000132
Figure GDA0001752045690000141
由上可知,本发明实施例通过引入字典学习和稀疏编码,将结构化分析字典、稀疏编码投影提取、分析多类别分类器结合在一起。利用不一致提升函数对每类原始数据训练处相应的子字典,然后使用范数约束得到子稀疏编码,并且不同类之间字典和编码是独立的。利用稀疏编码投影技术,提取每类的子稀疏编码在原始数据下的子投影,并且不同类的原始数据和子投影也是独立的,训练得到人脸识别模型也是由一个个子分类器构成的。基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效。通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
本发明实施例还针对基于结构化分析字典的人脸识别方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的基于结构化分析字典的人脸识别装置进行介绍,下文描述的基于结构化分析字典的人脸识别装置与上文描述的基于结构化分析字典的人脸识别方法可相互对应参照。
参见图3,图3为本发明实施例提供的基于结构化分析字典的人脸识别装置在一种具体实施方式下的结构图,该装置可包括:
模型预处理模块301,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化,人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别。
模型训练模块302,用于对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器。
人脸识别模块303,用于利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
可选的,在本实施例的一些实施方式中,模型训练模块302可为将下述公式作为人脸识别模型中的提升函数,对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
Figure GDA0001752045690000151
式中,
Figure GDA0001752045690000152
为学习得到的子字典集,c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000153
为第l类的子字典,
Figure GDA0001752045690000154
为第l类的子字典对应的子稀疏编码,
Figure GDA0001752045690000155
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
在本实施例的另一些实施方式中,模型训练模块还可为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
Figure GDA0001752045690000156
式中,人脸训练样本集为
Figure GDA0001752045690000157
c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000158
为子投影集,
Figure GDA0001752045690000159
是第l类子稀疏编码的子投影。
此外,在本实施例的一些具体的实施方式中,模型训练模块302仍可为根据各子投影及人脸训练样本集,利用下述公式作为训练函数对人脸识别模型中的各子分类器进行训练的模块:
Figure GDA00017520456900001510
式中,人脸训练样本集为
Figure GDA0001752045690000161
c为人脸训练样本集包含的类别数目,
Figure GDA0001752045690000162
为子投影集,
Figure GDA0001752045690000163
是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
本发明实施例所述基于结构化分析字典的人脸识别装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
本发明实施例还提供了一种基于结构化分析字典的人脸识别设备,可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例所述基于结构化分析字典的人脸识别设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率,还有效提升人脸图像表示和识别准确率。
本发明实施例还提供了一种计算机可读存储介质,存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时如上任意一实施例所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率,还有效提升人脸图像表示和识别准确率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种基于结构化分析字典的人脸识别方法,其特征在于,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签;
其中,所述对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
Figure FDA0003215363310000011
式中,
Figure FDA0003215363310000012
为学习得到的子字典集,K为字典数目,c为所述人脸训练样本集包含的类别数目,
Figure FDA0003215363310000013
为第l类的子字典,
Figure FDA0003215363310000014
为第l类的子字典对应的子稀疏编码,
Figure FDA0003215363310000015
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
2.根据权利要求1所述的基于结构化分析字典的人脸识别方法,其特征在于,所述对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影包括:
根据下述公式从各子稀疏编码中提取相对应的子投影:
Figure FDA0003215363310000016
式中,所述人脸训练样本集为
Figure FDA0003215363310000021
Figure FDA0003215363310000022
为子投影集,
Figure FDA0003215363310000023
是第l类子稀疏编码的子投影;||Sl||2,1为l2,1范数约束。
3.根据权利要求1所述的基于结构化分析字典的人脸识别方法,其特征在于,所述根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器包括:
根据各子投影及所述人脸训练样本集,利用下述公式作为训练函数对所述人脸识别模型中的各子分类器进行训练:
Figure FDA0003215363310000024
式中,所述人脸训练样本集为
Figure FDA0003215363310000025
Figure FDA0003215363310000026
为子投影集,
Figure FDA0003215363310000027
是第l类子稀疏编码的子投影,
Figure FDA0003215363310000028
hl,i=[0,…,1,…,0]∈Rc为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
4.根据权利要求1至3任意一项所述的基于结构化分析字典的人脸识别方法,其特征在于,所述人脸识别模型的目标函数为:
Figure FDA0003215363310000029
式中,
Figure FDA00032153633100000210
为子字典的约束,所述人脸训练样本集为
Figure FDA00032153633100000211
为子投影集,
Figure FDA00032153633100000212
是第l类子稀疏编码的子投影,
Figure FDA00032153633100000213
hl,i=[0,…,1,…,0]∈Rc为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器,||Sl||2,1为l2,1范数约束,α、τ、λ为参数。
5.一种基于结构化分析字典的人脸识别装置,其特征在于,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签;
其中,所述模型训练模块为将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
Figure FDA0003215363310000031
式中,
Figure FDA0003215363310000032
为学习得到的子字典集,K为字典数目,c为所述人脸训练样本集包含的类别数目,
Figure FDA0003215363310000033
为第l类的子字典,
Figure FDA0003215363310000034
为第l类的子字典对应的子稀疏编码,
Figure FDA0003215363310000035
为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
6.根据权利要求5所述的基于结构化分析字典的人脸识别装置,其特征在于,所述模型训练模块为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
Figure FDA0003215363310000036
式中,所述人脸训练样本集为
Figure FDA0003215363310000037
Figure FDA0003215363310000038
为子投影集,
Figure FDA0003215363310000039
是第l类子稀疏编码的子投影;||Sl||2,1为l2,1范数约束。
7.一种基于结构化分析字典的人脸识别设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至4任一项所述基于结构化分析字典的人脸识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时实现如权利要求1至4任一项所述基于结构化分析字典的人脸识别方法的步骤。
CN201711393942.0A 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备 Active CN108509833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711393942.0A CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711393942.0A CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108509833A CN108509833A (zh) 2018-09-07
CN108509833B true CN108509833B (zh) 2021-11-05

Family

ID=63374791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711393942.0A Active CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108509833B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492523A (zh) * 2018-09-17 2019-03-19 深圳壹账通智能科技有限公司 人脸识别系统性能测试方法、装置、设备和存储介质
CN109241928B (zh) * 2018-09-19 2021-02-26 释码融和(上海)信息科技有限公司 一种识别异质虹膜的方法及计算设备
CN109492610B (zh) * 2018-11-27 2022-05-10 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN109948735B (zh) * 2019-04-02 2021-11-26 广东工业大学 一种多标签分类方法、系统、装置及存储介质
CN110147782B (zh) * 2019-05-29 2023-06-13 苏州大学 一种基于投影字典对学习的人脸识别方法及装置
CN110579967B (zh) * 2019-09-23 2020-06-30 中南大学 基于同时降维和字典学习的过程监控方法
CN111160102B (zh) * 2019-11-29 2024-02-23 北京爱笔科技有限公司 人脸防伪识别模型的训练方法、人脸防伪识别方法及装置
CN114220156A (zh) * 2021-12-23 2022-03-22 成都臻识科技发展有限公司 结构化人脸识别方法、装置、设备及存储介质
CN114943862B (zh) * 2022-06-07 2024-09-17 南京工业大学 一种基于结构性解析字典学习的两阶段图像分类方法
CN115984946A (zh) * 2023-02-01 2023-04-18 浙江大学 一种基于集成学习的人脸识别模型遗忘方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616027A (zh) * 2015-02-06 2015-05-13 华东交通大学 一种非相邻的图结构稀疏人脸识别方法
CN106991355A (zh) * 2015-09-10 2017-07-28 天津中科智能识别产业技术研究院有限公司 基于拓扑保持的解析型字典学习模型的人脸识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616027A (zh) * 2015-02-06 2015-05-13 华东交通大学 一种非相邻的图结构稀疏人脸识别方法
CN106991355A (zh) * 2015-09-10 2017-07-28 天津中科智能识别产业技术研究院有限公司 基于拓扑保持的解析型字典学习模型的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Kernel class specific centralized dictionary learning for face recognition;Zhiming Gao等;《2016 IEEE 13th International Conference on Signal Processing》;20161110;第837-842页 *
基于深度学习特征的稀疏表示的人脸识别方法;马晓 等;《智能系统学报》;20160630;第11卷(第3期);第279-286页 *

Also Published As

Publication number Publication date
CN108509833A (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN108509833B (zh) 一种基于结构化分析字典的人脸识别方法、装置及设备
CN110532920B (zh) 基于FaceNet方法的小数量数据集人脸识别方法
CN103136516B (zh) 可见光与近红外信息融合的人脸识别方法及系统
CN105469063B (zh) 鲁棒的人脸图像主成分特征提取方法及识别装置
CN105528620B (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及系统
CN109902662B (zh) 一种行人重识别方法、系统、装置和存储介质
CN105117708A (zh) 人脸表情识别的方法和装置
CN113255557B (zh) 一种基于深度学习的视频人群情绪分析方法及系统
CN106980825B (zh) 一种基于归一化像素差特征的人脸姿势分类方法
Ivanovsky et al. Facial expression recognition algorithm based on deep convolution neural network
Li et al. Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes
CN108229432A (zh) 人脸标定方法及装置
CN111325275A (zh) 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置
CN111079811A (zh) 一种针对多标签分类数据不均衡问题的采样方法
CN109508640A (zh) 一种人群情感分析方法、装置和存储介质
CN103745242A (zh) 一种跨设备生物特征识别方法
CN113989577A (zh) 图像分类方法及装置
Rasel et al. An efficient framework for hand gesture recognition based on histogram of oriented gradients and support vector machine
Kailash et al. Deep learning based detection of mobility aids using yolov5
Si Analysis of calligraphy Chinese character recognition technology based on deep learning and computer-aided technology
CN114330535B (zh) 一种基于支持向量正则化字典对学习的模式分类方法
CN115512340A (zh) 基于图片的意图检测方法及装置
CN104778479B (zh) 一种基于稀疏编码提取子的图像分类方法及系统
CN108121965A (zh) 基于鲁棒联合稀疏特征提取的图像识别方法
Li Special character recognition using deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant