CN108509833B - 一种基于结构化分析字典的人脸识别方法、装置及设备 - Google Patents
一种基于结构化分析字典的人脸识别方法、装置及设备 Download PDFInfo
- Publication number
- CN108509833B CN108509833B CN201711393942.0A CN201711393942A CN108509833B CN 108509833 B CN108509833 B CN 108509833B CN 201711393942 A CN201711393942 A CN 201711393942A CN 108509833 B CN108509833 B CN 108509833B
- Authority
- CN
- China
- Prior art keywords
- sub
- face
- sample set
- face recognition
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000004458 analytical method Methods 0.000 title claims abstract description 74
- 238000012549 training Methods 0.000 claims abstract description 135
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 230000006870 function Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 241000764238 Isis Species 0.000 claims 1
- 238000009423 ventilation Methods 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 8
- 238000010276 construction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 102100034004 Gamma-adducin Human genes 0.000 description 1
- 101000799011 Homo sapiens Gamma-adducin Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- RFHAOTPXVQNOHP-UHFFFAOYSA-N fluconazole Chemical compound C1=NC=NN1CC(C=1C(=CC(F)=CC=1)F)(O)CN1C=NC=N1 RFHAOTPXVQNOHP-UHFFFAOYSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明实施例公开了一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质。其中,方法包括将人脸训练样本集和人脸测试样本集输入人脸识别模型中,并对人脸识别模型进行参数初始化,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,得到各类别数据集的子字典和相对应的子稀疏编码;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集进行分类识别。本申请的技术方案有效的提升了人脸识别的效率和准确度。
Description
技术领域
本发明实施例涉及计算机视觉和图像识别技术领域,特别是涉及一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质。
背景技术
随着计算机技术和智能化的不断发展,人脸识别已经发展成为计算机视觉与模式识别中非常重要的一个研究课题。人脸识别通过计算机将人脸图像电子化,然后分析人脸图像定位人脸,获取人脸的面部特征,在门禁系统、摄像监视系统和智能手机等领域有着重大的意义,一旦研究成功并投入应用,将会产生巨大的社会和经济效益。
但是,人脸识别的过程具有一定难度,现有的基于字典学习的人脸识别方法在训练和识别过程中耗时巨大,不利于具体应用的投入。目前大多数字典学习都使用l0/l1范数进行稀疏编码时的约束,虽然取得了一定的成果,但是耗时巨大。真实世界中的图像(包括人脸图像)不仅仅只是图像重建,且采集的图像通常包含破坏、丢失数据,或设备或光线问题造成的图像差异,因此在考虑字典学习的同时,如何有效排除干扰,训练出具有很强辨别能力和快速识别能力的分类器是值得探讨和深入的问题。
近年来,一个最具代表性的字典学习重建数据方法KSVD可对原始数据进行较为准确的复原。当数据有噪声时,KSVD可以很大程度地恢复数据,但它本质上是一种数据重建的线性方法,能够对非稀疏的数据重建,但是不能对数字图像进行识别和分类。为了克服此缺点,KSVD的推广D-KSVD被提出。IRPCA目标是基于字典学习和稀疏编码训练一个由判别能力的分类器,但在判别过程中并没有考虑不同类别之间相关性的处理问题。同时LC-KSVD考虑标签的约束来增强判别能力,FDDL算法考虑使用结构化字典来进一步提高判别能力。上面的这些方法虽然有不错的效果,但是没有考虑不同的类别数据间的关系,导致人脸识别的准确率不高。
因此,如何得到具有强判别能力的分类器,缩短识别的时间与识别的准确度,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质,缩短了人脸识别的时间,有效的提升人脸图像表示和识别效率和准确度。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种基于结构化分析字典的人脸识别方法,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
可选的,所述对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
可选的,所述对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影包括:
根据下述公式从各子稀疏编码中提取相对应的子投影:
可选的,所述根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器包括:
根据各子投影及所述人脸训练样本集,利用下述公式作为训练函数对所述人脸识别模型中的各子分类器进行训练:
式中,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影,Hl,i=[0,…,1,…,0]∈Rc,Hl=[hl,1,…,hl,i,…,hl,N1],为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
可选的,所述人脸识别模型的目标函数为:
式中, 为子字典的约束,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为学习得到的子字典集,为子投影集,是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
本发明实施例另一方面提供了一种基于结构化分析字典的人脸识别装置,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
可选的,所述模型训练模块为将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
可选的,所述模型训练模块为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
本发明实施例还提供了一种基于结构化分析字典的人脸识别装置,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例最后还提供了一种计算机存储介质,所述计算机可读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时实现如前任一项所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例提供了一种基于结构化分析字典的人脸识别方法,将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化,人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
本申请提供的技术方案的优点在于,将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而使得各子分类器具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短了人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
此外,本发明实施例还针对基于结构化分析字典的人脸识别方法提供了相应的实现装置、设备及计算机存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机存储介质具有相应的优点。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于结构化分析字典的人脸识别方法的流程示意图;
图2为本发明实施例提供的一种基于结构化分析字典的人脸识别算法的求解流程图;
图3为本发明实施例提供的基于结构化分析字典的人脸识别装置的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种基于结构化分析字典的人脸识别方法的流程示意图,本发明实施例可包括以下内容:
S101:将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化。
人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别。
人脸训练样本集包括少量有标签样本和适量无标签样本,人脸测试样本集的数据均为无标签样本。人脸训练样本集用于模型优化的投影学习,第一预设个数和第二预设个数可为任意数据,本申请对此不做任何限定。
S102:对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影。
S103:根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器。
S104:利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
本申请提出一种基于结构化判别字典学习模型的分析机制,通过联和学习结构化分析字典、一组分析稀疏编码投影和分析多类线性分类器进行表示和分类,因此本申请需要求解以下模型:
对上述模型进行求解的具体过程可为:
对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
子稀疏编码Sl能对人脸训练样本集Xl很好的表示,即Xl≈DlSl,但是,Sl和非对应的类别l是独立的,所以需要尽可能的小,这样DlSj就不在近似等于Xl,所以基于结构化分析字典的人脸识别方法的不连续提升函数,即将下述公式作为人脸识别模型中的提升函数,对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
式中,为学习得到的子字典集,c为人脸训练样本集包含的类别数目,为人脸训练样本集的第l类,为第l类的子字典,为第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
系数编码在人脸训练样本集上的投影提取,可采用近似分析方法,获得子稀疏编码的子投影,具体为:
PlXl≈Sl;
式中,||Sl||2,1为l2,1范数约束,是稀疏编码的提取项;人脸训练样本集为c为人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影。根据上述公式从各子稀疏编码中提取相对应的子投影,得到人脸训练样本集中每一类别的子稀疏编码在对应训练数据集下的投影
根据各子投影、人脸训练样本集及人脸训练样本集中各类别标签对各子分类器进行训练。
对于类别标签向量,有Hl≈WlPlXl,Wl∈Rc×k为子分类器。本申请让Wl能够预测类别j的时候接近0空间,即WlPlXj≈0,因此本申请可以得到分析多类分类器训练函数,即利用下述公式作为训练函数对人脸识别模型中的各子分类器进行训练:
式中,为一个子分类器训练项;人脸训练样本集为c为人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
人脸识别模型的目标函数可为:
式中,v∈{1,……,K},为子字典的约束,人脸训练样本集为c为人脸训练样本集包含的类别数目,为学习得到的子字典集,为子投影集,是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc ×k为子分类器。
在本发明实施例提供的技术方案中,将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
为了进一步证实本申请提供的技术方案具有好的人脸识别效果,且具有普遍说明性,本申请在4个现实人脸图像数据库(CMU PIE、MIT CBCL、AR及UMIST)、1个目标数据库ETH80以及1个15场景分类数据库进行了算法测试。CMU PIE人脸数据库有11554张样本图片,包含68个类别;MIT CBCL人脸数据库有3240张样本图片,包含10个类别;AR人脸数据库有2600张样本图片,包含100个类别;UMIST人脸数据库有1012张样本图片,包含20个类别;ETH80目标数据库有3280张样本图片,包含80个类别,15场景分类数据库有44885张样本图片,包含15个类别。测试内容广泛,测试数据充足,因而测试结果具有普遍说明性。
下面将结合附图2,对本申请提供的算法具体求解方法进行说明。本申请提出的人脸识别模型需要确定并求解的参数有4个,分别是D,S,P,W,对于4个参数的优化,本申请可由下面方式来确定:
输入训练数据集X、标签矩阵向量H、参数α、τ、λ及字典数目K;
使用单位F范数的随机矩阵来初始化D,S,P,W,即D(0),S(0),P(0),W(0);Λ=I,t=0;
固定D,P来求解S,Λ,通过定义的l2,1范数可知||S||2,1=2tr(STΛS)。其中Λ是一个对角矩阵,Λii=1/2||Si||2,Si是S的第i行。将ADDL简化可得到:
然后,可以根据Λii=1/2||Si||2更新Λ。
固定S,W来最优化P,需要求解如下最优化问题:
其中,γ=1e-4为一个很小的数,以防止XXT是奇异矩阵。
固定P最优化求解W,即需要求解下面的公式:
固定S最优化求解D,根据下面的公式来更新字典D:
根据拉格朗日微分算法函数求解,可以得到:
上述过程交替求解,直到达到本申请需要的精度或者模型收敛,输出D,S,P,W。
请参阅表1为本申请提供的技术方案和SRC、DLSI、KSVD、D-KSVD、FDDL、LC-KSVD1、LC-KSVD2、DPL在CMU PIE数据集上的预测结果。本申请需要先将数据变化到32×32像素大小,然后使用主成分分析对数据降维处理,分别使用每人训练照片数量为10、15、20、25、30,剩下的作为测试集。可以发现,本申请的方法比其他的方法效果更好。
表1在CMU PIE数据集上PCA降维后识别结果
请参阅表2为本发明方法和SRC、DLSI、KSVD、D-KSVD、FDDL、LC-KSVD1、LC-KSVD2、DPL在MIT CBL人脸数据集上的预测结果。本发明将会随机选择2、4、6中标签数据,切分训练集和测试集10次来评价本发明的识别效果,计算出每次训练得到准确率的均值和标准差,可以发现本发明的方法比其他方法有更好的识别效果。
表2 MIT CBL人脸数据集上的识别效果
由上可知,本发明实施例通过引入字典学习和稀疏编码,将结构化分析字典、稀疏编码投影提取、分析多类别分类器结合在一起。利用不一致提升函数对每类原始数据训练处相应的子字典,然后使用范数约束得到子稀疏编码,并且不同类之间字典和编码是独立的。利用稀疏编码投影技术,提取每类的子稀疏编码在原始数据下的子投影,并且不同类的原始数据和子投影也是独立的,训练得到人脸识别模型也是由一个个子分类器构成的。基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效。通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
本发明实施例还针对基于结构化分析字典的人脸识别方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的基于结构化分析字典的人脸识别装置进行介绍,下文描述的基于结构化分析字典的人脸识别装置与上文描述的基于结构化分析字典的人脸识别方法可相互对应参照。
参见图3,图3为本发明实施例提供的基于结构化分析字典的人脸识别装置在一种具体实施方式下的结构图,该装置可包括:
模型预处理模块301,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化,人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别。
模型训练模块302,用于对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器。
人脸识别模块303,用于利用人脸识别模型中的各子分类器对人脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
可选的,在本实施例的一些实施方式中,模型训练模块302可为将下述公式作为人脸识别模型中的提升函数,对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
在本实施例的另一些实施方式中,模型训练模块还可为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
此外,在本实施例的一些具体的实施方式中,模型训练模块302仍可为根据各子投影及人脸训练样本集,利用下述公式作为训练函数对人脸识别模型中的各子分类器进行训练的模块:
式中,人脸训练样本集为c为人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
本发明实施例所述基于结构化分析字典的人脸识别装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数据上是保持独立的,从而具有更强的判别性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分类过程非常高效,缩短人脸识别的时间,从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表示和识别准确率。
本发明实施例还提供了一种基于结构化分析字典的人脸识别设备,可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例所述基于结构化分析字典的人脸识别设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率,还有效提升人脸图像表示和识别准确率。
本发明实施例还提供了一种计算机可读存储介质,存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时如上任意一实施例所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率,还有效提升人脸图像表示和识别准确率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (8)
1.一种基于结构化分析字典的人脸识别方法,其特征在于,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签;
其中,所述对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
5.一种基于结构化分析字典的人脸识别装置,其特征在于,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签;
其中,所述模型训练模块为将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
7.一种基于结构化分析字典的人脸识别设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至4任一项所述基于结构化分析字典的人脸识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时实现如权利要求1至4任一项所述基于结构化分析字典的人脸识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711393942.0A CN108509833B (zh) | 2017-12-21 | 2017-12-21 | 一种基于结构化分析字典的人脸识别方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711393942.0A CN108509833B (zh) | 2017-12-21 | 2017-12-21 | 一种基于结构化分析字典的人脸识别方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509833A CN108509833A (zh) | 2018-09-07 |
CN108509833B true CN108509833B (zh) | 2021-11-05 |
Family
ID=63374791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711393942.0A Active CN108509833B (zh) | 2017-12-21 | 2017-12-21 | 一种基于结构化分析字典的人脸识别方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509833B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492523A (zh) * | 2018-09-17 | 2019-03-19 | 深圳壹账通智能科技有限公司 | 人脸识别系统性能测试方法、装置、设备和存储介质 |
CN109241928B (zh) * | 2018-09-19 | 2021-02-26 | 释码融和(上海)信息科技有限公司 | 一种识别异质虹膜的方法及计算设备 |
CN109492610B (zh) * | 2018-11-27 | 2022-05-10 | 广东工业大学 | 一种行人重识别方法、装置及可读存储介质 |
CN109948735B (zh) * | 2019-04-02 | 2021-11-26 | 广东工业大学 | 一种多标签分类方法、系统、装置及存储介质 |
CN110147782B (zh) * | 2019-05-29 | 2023-06-13 | 苏州大学 | 一种基于投影字典对学习的人脸识别方法及装置 |
CN110579967B (zh) * | 2019-09-23 | 2020-06-30 | 中南大学 | 基于同时降维和字典学习的过程监控方法 |
CN111160102B (zh) * | 2019-11-29 | 2024-02-23 | 北京爱笔科技有限公司 | 人脸防伪识别模型的训练方法、人脸防伪识别方法及装置 |
CN114220156A (zh) * | 2021-12-23 | 2022-03-22 | 成都臻识科技发展有限公司 | 结构化人脸识别方法、装置、设备及存储介质 |
CN114943862B (zh) * | 2022-06-07 | 2024-09-17 | 南京工业大学 | 一种基于结构性解析字典学习的两阶段图像分类方法 |
CN115984946A (zh) * | 2023-02-01 | 2023-04-18 | 浙江大学 | 一种基于集成学习的人脸识别模型遗忘方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616027A (zh) * | 2015-02-06 | 2015-05-13 | 华东交通大学 | 一种非相邻的图结构稀疏人脸识别方法 |
CN106991355A (zh) * | 2015-09-10 | 2017-07-28 | 天津中科智能识别产业技术研究院有限公司 | 基于拓扑保持的解析型字典学习模型的人脸识别方法 |
-
2017
- 2017-12-21 CN CN201711393942.0A patent/CN108509833B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616027A (zh) * | 2015-02-06 | 2015-05-13 | 华东交通大学 | 一种非相邻的图结构稀疏人脸识别方法 |
CN106991355A (zh) * | 2015-09-10 | 2017-07-28 | 天津中科智能识别产业技术研究院有限公司 | 基于拓扑保持的解析型字典学习模型的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
Kernel class specific centralized dictionary learning for face recognition;Zhiming Gao等;《2016 IEEE 13th International Conference on Signal Processing》;20161110;第837-842页 * |
基于深度学习特征的稀疏表示的人脸识别方法;马晓 等;《智能系统学报》;20160630;第11卷(第3期);第279-286页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108509833A (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509833B (zh) | 一种基于结构化分析字典的人脸识别方法、装置及设备 | |
CN110532920B (zh) | 基于FaceNet方法的小数量数据集人脸识别方法 | |
CN103136516B (zh) | 可见光与近红外信息融合的人脸识别方法及系统 | |
CN105469063B (zh) | 鲁棒的人脸图像主成分特征提取方法及识别装置 | |
CN105528620B (zh) | 一种联合鲁棒主成分特征学习与视觉分类方法及系统 | |
CN109902662B (zh) | 一种行人重识别方法、系统、装置和存储介质 | |
CN105117708A (zh) | 人脸表情识别的方法和装置 | |
CN113255557B (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
CN106980825B (zh) | 一种基于归一化像素差特征的人脸姿势分类方法 | |
Ivanovsky et al. | Facial expression recognition algorithm based on deep convolution neural network | |
Li et al. | Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes | |
CN108229432A (zh) | 人脸标定方法及装置 | |
CN111325275A (zh) | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 | |
CN111079811A (zh) | 一种针对多标签分类数据不均衡问题的采样方法 | |
CN109508640A (zh) | 一种人群情感分析方法、装置和存储介质 | |
CN103745242A (zh) | 一种跨设备生物特征识别方法 | |
CN113989577A (zh) | 图像分类方法及装置 | |
Rasel et al. | An efficient framework for hand gesture recognition based on histogram of oriented gradients and support vector machine | |
Kailash et al. | Deep learning based detection of mobility aids using yolov5 | |
Si | Analysis of calligraphy Chinese character recognition technology based on deep learning and computer-aided technology | |
CN114330535B (zh) | 一种基于支持向量正则化字典对学习的模式分类方法 | |
CN115512340A (zh) | 基于图片的意图检测方法及装置 | |
CN104778479B (zh) | 一种基于稀疏编码提取子的图像分类方法及系统 | |
CN108121965A (zh) | 基于鲁棒联合稀疏特征提取的图像识别方法 | |
Li | Special character recognition using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |