CN108509833A - 一种基于结构化分析字典的人脸识别方法、装置及设备 - Google Patents

一种基于结构化分析字典的人脸识别方法、装置及设备 Download PDF

Info

Publication number
CN108509833A
CN108509833A CN201711393942.0A CN201711393942A CN108509833A CN 108509833 A CN108509833 A CN 108509833A CN 201711393942 A CN201711393942 A CN 201711393942A CN 108509833 A CN108509833 A CN 108509833A
Authority
CN
China
Prior art keywords
sub
face
training sample
dictionary
sparse coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711393942.0A
Other languages
English (en)
Other versions
CN108509833B (zh
Inventor
张召
孙玉林
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201711393942.0A priority Critical patent/CN108509833B/zh
Publication of CN108509833A publication Critical patent/CN108509833A/zh
Application granted granted Critical
Publication of CN108509833B publication Critical patent/CN108509833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储介质。其中,方法包括将人脸训练样本集和人脸测试样本集输入人脸识别模型中,并对人脸识别模型进行参数初始化,人脸识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,得到各类别数据集的子字典和相对应的子稀疏编码;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集进行分类识别。本申请的技术方案有效的提升了人脸识别的效率和准确度。

Description

一种基于结构化分析字典的人脸识别方法、装置及设备
技术领域
本发明实施例涉及计算机视觉和图像识别技术领域,特别是涉及 一种基于结构化分析字典的人脸识别方法、装置、设备及计算机存储 介质。
背景技术
随着计算机技术和智能化的不断发展,人脸识别已经发展成为计 算机视觉与模式识别中非常重要的一个研究课题。人脸识别通过计算 机将人脸图像电子化,然后分析人脸图像定位人脸,获取人脸的面部 特征,在门禁系统、摄像监视系统和智能手机等领域有着重大的意义, 一旦研究成功并投入应用,将会产生巨大的社会和经济效益。
但是,人脸识别的过程具有一定难度,现有的基于字典学习的人 脸识别方法在训练和识别过程中耗时巨大,不利于具体应用的投入。 目前大多数字典学习都使用l0/l1范数进行稀疏编码时的约束,虽然取 得了一定的成果,但是耗时巨大。真实世界中的图像(包括人脸图像) 不仅仅只是图像重建,且采集的图像通常包含破坏、丢失数据,或设 备或光线问题造成的图像差异,因此在考虑字典学习的同时,如何有 效排除干扰,训练出具有很强辨别能力和快速识别能力的分类器是值 得探讨和深入的问题。
近年来,一个最具代表性的字典学习重建数据方法KSVD可对原 始数据进行较为准确的复原。当数据有噪声时,KSVD可以很大程度 地恢复数据,但它本质上是一种数据重建的线性方法,能够对非稀疏 的数据重建,但是不能对数字图像进行识别和分类。为了克服此缺点, KSVD的推广D-KSVD被提出。IRPCA目标是基于字典学习和稀疏编 码训练一个由判别能力的分类器,但在判别过程中并没有考虑不同类 别之间相关性的处理问题。同时LC-KSVD考虑标签的约束来增强判 别能力,FDDL算法考虑使用结构化字典来进一步提高判别能力。上 面的这些方法虽然有不错的效果,但是没有考虑不同的类别数据间的 关系,导致人脸识别的准确率不高。
因此,如何得到具有强判别能力的分类器,缩短识别的时间与识 别的准确度,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种基于结构化分析字典的人脸识 别方法、装置、设备及计算机存储介质,缩短了人脸识别的时间,有 效的提升人脸图像表示和识别效率和准确度。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种基于结构化分析字典的人脸识 别方法,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别 模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本 集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样 本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所 述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化 字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结 构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性 增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏 编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中 的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集 进行分类,输出所述人脸测试样本集的所属类别标签。
可选的,所述对所述人脸训练样本集中包含的每一类别的数据集 进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀 疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训 练样本集中包含的每一类别的数据集进行结构化字典学习:
式中,为学习得到的子字典集,c为所 述人脸训练样本集包含的类别数目,为第l类的子字典,为第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵 S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
可选的,所述对各类别数据集的子稀疏编码进行近似分析,得到 各子稀疏编码的子投影包括:
根据下述公式从各子稀疏编码中提取相对应的子投影:
式中,所述人脸训练样本集为c为所 述人脸训练样本集包含的类别数目,为子投 影集,是第l类子稀疏编码的子投影。
可选的,所述根据各子投影及所述人脸训练样本集训练所述人脸 识别模型中的各子分类器包括:
根据各子投影及所述人脸训练样本集,利用下述公式作为训练函 数对所述人脸识别模型中的各子分类器进行训练:
式中,所述人脸训练样本集为c为所 述人脸训练样本集包含的类别数目,为子投 影集,是第l类子稀疏编码的子投影,Hl,i=[0,…,1,…,0]∈Rc, Hl=[hl,1,…,hl,i,…,hl,N1],为所述人脸训练样本集的类别标签向量, 非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
可选的,所述人脸识别模型的目标函数为:
式中,v∈{1,……,K},为子字典的约束,所述人 脸训练样本集为c为所述人脸训练样本集 包含的类别数目,为学习得到的子字典集, 为子投影集,是第l类子稀疏编码的子 投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为所述人脸 训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为 子分类器。
本发明实施例另一方面提供了一种基于结构化分析字典的人脸 识别装置,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入 预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化, 所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预 设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每 个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的 数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应 的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项 和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分 析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本 集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所 述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标 签。
可选的,所述模型训练模块为将下述公式作为所述人脸识别模型 中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进 行结构化字典学习的模块:
式中,为学习得到的子字典集,c为所 述人脸训练样本集包含的类别数目,为第l类的子字典,为第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵 S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
可选的,所述模型训练模块为根据下述公式从各子稀疏编码中提 取相对应的子投影的模块:
式中,所述人脸训练样本集为c为所 述人脸训练样本集包含的类别数目,为子投 影集,是第l类子稀疏编码的子投影。
本发明实施例还提供了一种基于结构化分析字典的人脸识别装 置,包括处理器,所述处理器用于执行存储器中存储的计算机程序时 实现如前任一项所述基于结构化分析字典的人脸识别方法的步骤。
本发明实施例最后还提供了一种计算机存储介质,所述计算机可 读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于 结构化分析字典的人脸识别程序被处理器执行时实现如前任一项所述 基于结构化分析字典的人脸识别方法的步骤。
本发明实施例提供了一种基于结构化分析字典的人脸识别方法, 将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型 中,并对人脸识别模型进行参数初始化,人脸训练样本集包括第一预 设个数的类别标签样本图像和第二预设个数的无标签样本图像,人脸 识别模型包括多个子分类器,每个子分类器对应人脸训练样本集中的 一个类别;对人脸训练样本集中包含的每一类别的数据集进行结构化 字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结 构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性 增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏 编码的子投影;根据各子投影及人脸训练样本集训练人脸识别模型中 的各子分类器;利用人脸识别模型中的各子分类器对人脸测试样本集 进行分类,输出人脸测试样本集的所属类别标签。
本申请提供的技术方案的优点在于,将判别字典学习、分析稀疏 表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学 习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不 同类人脸数据上是保持独立的,从而使得各子分类器具有更强的判别 性,有利于提升人脸识别的准确度;此外,基于近似的稀疏编码系数 进行分类器学习,可使得分类过程非常高效,缩短了人脸识别的时间, 从而提升人脸识别的效率,通过将分类器构造和字典学习进行联合优 化,可有效提升人脸图像表示和识别准确率。
此外,本发明实施例还针对基于结构化分析字典的人脸识别方法 提供了相应的实现装置、设备及计算机存储介质,进一步使得所述方 法更具有实用性,所述装置、设备及计算机存储介质具有相应的优点。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将 对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易 见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普 通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附 图获得其他的附图。
图1为本发明实施例提供的一种基于结构化分析字典的人脸识别 方法的流程示意图;
图2为本发明实施例提供的一种基于结构化分析字典的人脸识别 算法的求解流程图;
图3为本发明实施例提供的基于结构化分析字典的人脸识别装置 的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图 和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施 例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得 的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们 任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单 元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元, 而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的 各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种基于结构化分析 字典的人脸识别方法的流程示意图,本发明实施例可包括以下内容:
S101:将人脸训练样本集和人脸测试样本集输入预先构建的人脸 识别模型中,并对人脸识别模型进行参数初始化。
人脸训练样本集包括第一预设个数的类别标签样本图像和第二 预设个数的无标签样本图像,人脸识别模型包括多个子分类器,每个 子分类器对应人脸训练样本集中的一个类别。
人脸训练样本集包括少量有标签样本和适量无标签样本,人脸测 试样本集的数据均为无标签样本。人脸训练样本集用于模型优化的投 影学习,第一预设个数和第二预设个数可为任意数据,本申请对此不 做任何限定。
S102:对人脸训练样本集中包含的每一类别的数据集进行结构化 字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结 构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性 增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏 编码的子投影。
S103:根据各子投影及人脸训练样本集训练人脸识别模型中的各 子分类器。
S104:利用人脸识别模型中的各子分类器对人脸测试样本集进行 分类,输出人脸测试样本集的所属类别标签。
本申请提出一种基于结构化判别字典学习模型的分析机制,通过 联和学习结构化分析字典、一组分析稀疏编码投影和分析多类线性分 类器进行表示和分类,因此本申请需要求解以下模型:
式中,v∈{1,……,K},f(Dl)为非相干性提升函数, r(Pl,Sl)为分析稀疏编码投影函数,g(Hl,Wl,Pl)为分类器训练函数。
对上述模型进行求解的具体过程可为:
对人脸训练样本集中包含的每一类别的数据集进行结构化字典 学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包 括:
子稀疏编码Sl能对人脸训练样本集Xl很好的表示,即Xl≈DlSl,但 是,Sl和非对应的类别l是独立的,所以需要尽可能的小,这样 DlSj就不在近似等于Xl,所以基于结构化分析字典的人脸识别方法的 不连续提升函数,即将下述公式作为人脸识别模型中的提升函数,对 人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
式中,为学习得到的子字典集,c为人 脸训练样本集包含的类别数目,为人脸训练样本集的第l类, 为第l类的子字典,为第l类的子字典对应的子稀疏编 码,为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
系数编码在人脸训练样本集上的投影提取,可采用近似分析方 法,获得子稀疏编码的子投影,具体为:
根据上述计算得到的子稀疏编码矩阵S=[S1,…,Sl,…Sc],定义为子稀疏编码提取的投影,是第l类子 稀疏编码的子投影,将子投影Pl作为从人脸训练样本集中计算特殊特 征和稀疏编码的桥梁,故有:
PlXl≈Sl
且PlXj≈0,同时本申请的Sl是尽可能稀疏的,可以使用l2,1范 数进行约束,本申请可以将本申请的子稀疏编码提取函数定义为:
式中,||Sl||2,1为l2,1范数约束,是稀疏编码的提取项;人脸训练 样本集为c为人脸训练样本集包含的类别 数目,为子投影集,是第l类子稀疏编 码的子投影。根据上述公式从各子稀疏编码中提取相对应的子投影, 得到人脸训练样本集中每一类别的子稀疏编码在对应训练数据集下的 投影
根据各子投影、人脸训练样本集及人脸训练样本集中各类别标签 对各子分类器进行训练。
对于类别标签向量,有Hl≈WlPlXl,Wl∈Rc×k为子分类器。本申请让 Wl能够预测类别j的时候接近0空间,即WlPlXj≈0,因此本申请 可以得到分析多类分类器训练函数,即利用下述公式作为训练函数对 人脸识别模型中的各子分类器进行训练:
式中,为一个子分类器训练项;人脸训练样本集为c为人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子 投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hli=[0,…,1,…,0]∈Rc为人脸训练 样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分 类器。
人脸识别模型的目标函数可为:
式中,v∈{1,……,K},为子字典的约束,人脸训 练样本集为c为人脸训练样本集包含的类 别数目,为学习得到的子字典集, 为子投影集,是第l类子稀疏编码的子 投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为人脸训练 样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分 类器。
在本发明实施例提供的技术方案中,将判别字典学习、分析稀疏 表示和分析多类分类器无缝地集成到一个统一的模型中。基于联合学 习,能够保证判别字典学习、分析稀疏表示和分析多类分类器基于不 同类人脸数据上是保持独立的,从而具有更强的判别性,有利于提升 人脸识别的准确度;此外,基于近似的稀疏编码系数进行分类器学习, 可使得分类过程非常高效,缩短人脸识别的时间,从而提升人脸识别 的效率,通过将分类器构造和字典学习进行联合优化,可有效提升人 脸图像表示和识别准确率。
为了进一步证实本申请提供的技术方案具有好的人脸识别效果, 且具有普遍说明性,本申请在4个现实人脸图像数据库(CMU PIE、 MIT CBCL、AR及UMIST)、1个目标数据库ETH80以及1个15场 景分类数据库进行了算法测试。CMU PIE人脸数据库有11554张样本 图片,包含68个类别;MIT CBCL人脸数据库有3240张样本图片, 包含10个类别;AR人脸数据库有2600张样本图片,包含100个类 别;UMIST人脸数据库有1012张样本图片,包含20个类别;ETH80 目标数据库有3280张样本图片,包含80个类别,15场景分类数据库 有44885张样本图片,包含15个类别。测试内容广泛,测试数据充足, 因而测试结果具有普遍说明性。
下面将结合附图2,对本申请提供的算法具体求解方法进行说明。 本申请提出的人脸识别模型需要确定并求解的参数有4个,分别是 D,S,P,W,对于4个参数的优化,本申请可由下面方式来确定:
输入训练数据集X、标签矩阵向量H、参数α、τ、λ及字典数目K;
使用单位F范数的随机矩阵来初始化D,S,P,W,即D(0),S(0),P(0), W(0);Λ=I,t=0;
固定D,P来求解S,Λ,通过定义的l2,1范数可知||S||2,1=2tr(STΛS)。其 中Λ是一个对角矩阵,Λii=1/2||Si||2,Si是S的第i行。将ADDL简化可 得到:
其中,并且每个Λ′≠0,
通过求解导数可以得到如下结果:
然后,可以根据Λii=1/2||Si||2更新Λ。
固定S,W来最优化P,需要求解如下最优化问题:
其中,通过 求解P的求解算法为:
其中,γ=1e-4为一个很小的数,以防止XXT是奇异矩阵。
固定P最优化求解W,即需要求解下面的公式:
其中,通过求解W的 求解算法为:
固定S最优化求解D,根据下面的公式来更新字典D:
其中,
根据拉格朗日微分算法函数求解,可以得到:
其中,ηi的第i个约束的拉格朗日乘数。本申请创建一 个为对角矩阵,并且(Ml)ii=ηi,可得到下面的公式:
通过求解能够得到Dl的求解结果为:
上述过程交替求解,直到达到本申请需要的精度或者模型收敛, 输出D,S,P,W。
请参阅表1为本申请提供的技术方案和SRC、DLSI、KSVD、 D-KSVD、FDDL、LC-KSVD1、LC-KSVD2、DPL在CMU PIE数据集 上的预测结果。本申请需要先将数据变化到32×32像素大小,然后使用 主成分分析对数据降维处理,分别使用每人训练照片数量为10、15、 20、25、30,剩下的作为测试集。可以发现,本申请的方法比其他的 方法效果更好。
表1在CMU PIE数据集上PCA降维后识别结果
请参阅表2为本发明方法和SRC、DLSI、KSVD、D-KSVD、FDDL、 LC-KSVD1、LC-KSVD2、DPL在MIT CBL人脸数据集上的预测结果。 本发明将会随机选择2、4、6中标签数据,切分训练集和测试集10 次来评价本发明的识别效果,计算出每次训练得到准确率的均值和标 准差,可以发现本发明的方法比其他方法有更好的识别效果。
表2MIT CBL人脸数据集上的识别效果
由上可知,本发明实施例通过引入字典学习和稀疏编码,将结构 化分析字典、稀疏编码投影提取、分析多类别分类器结合在一起。利 用不一致提升函数对每类原始数据训练处相应的子字典,然后使用范 数约束得到子稀疏编码,并且不同类之间字典和编码是独立的。利用 稀疏编码投影技术,提取每类的子稀疏编码在原始数据下的子投影, 并且不同类的原始数据和子投影也是独立的,训练得到人脸识别模型 也是由一个个子分类器构成的。基于近似的稀疏编码系数进行分类器 学习,可使得分类过程非常高效。通过将分类器构造和字典学习进行 联合优化,可有效提升人脸图像表示和识别准确率。
本发明实施例还针对基于结构化分析字典的人脸识别方法提供 了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发 明实施例提供的基于结构化分析字典的人脸识别装置进行介绍,下文 描述的基于结构化分析字典的人脸识别装置与上文描述的基于结构化 分析字典的人脸识别方法可相互对应参照。
参见图3,图3为本发明实施例提供的基于结构化分析字典的人 脸识别装置在一种具体实施方式下的结构图,该装置可包括:
模型预处理模块301,用于将人脸训练样本集和人脸测试样本集 输入预先构建的人脸识别模型中,并对人脸识别模型进行参数初始化, 人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个 数的无标签样本图像,人脸识别模型包括多个子分类器,每个子分类 器对应人脸训练样本集中的一个类别。
模型训练模块302,用于对人脸训练样本集中包含的每一类别的 数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应 的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项 和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分 析,得到各子稀疏编码的子投影;根据各子投影及人脸训练样本集训 练人脸识别模型中的各子分类器。
人脸识别模块303,用于利用人脸识别模型中的各子分类器对人 脸测试样本集进行分类,输出人脸测试样本集的所属类别标签。
可选的,在本实施例的一些实施方式中,模型训练模块302可为 将下述公式作为人脸识别模型中的提升函数,对人脸训练样本集中包 含的每一类别的数据集进行结构化字典学习的模块:
式中,为学习得到的子字典集,c为人 脸训练样本集包含的类别数目,为第l类的子字典,为 第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵 S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
在本实施例的另一些实施方式中,模型训练模块还可为根据下述 公式从各子稀疏编码中提取相对应的子投影的模块:
式中,人脸训练样本集为c为人脸训 练样本集包含的类别数目,为子投影集, 是第l类子稀疏编码的子投影。
此外,在本实施例的一些具体的实施方式中,模型训练模块302 仍可为根据各子投影及人脸训练样本集,利用下述公式作为训练函数 对人脸识别模型中的各子分类器进行训练的模块:
式中,人脸训练样本集为c为人脸训 练样本集包含的类别数目,为子投影集, 是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1], Hl,i=[0,…,1,…,0]∈Rc为人脸训练样本集的类别标签向量,非0数值代 表Xl所属的类别,Wl∈Rc×k为子分类器。
本发明实施例所述基于结构化分析字典的人脸识别装置的各功 能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现 过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析 多类分类器无缝地集成到一个统一的模型中。基于联合学习,能够保 证判别字典学习、分析稀疏表示和分析多类分类器基于不同类人脸数 据上是保持独立的,从而具有更强的判别性,有利于提升人脸识别的 准确度;此外,基于近似的稀疏编码系数进行分类器学习,可使得分 类过程非常高效,缩短人脸识别的时间,从而提升人脸识别的效率, 通过将分类器构造和字典学习进行联合优化,可有效提升人脸图像表 示和识别准确率。
本发明实施例还提供了一种基于结构化分析字典的人脸识别设 备,可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述基于 结构化分析字典的人脸识别方法的步骤。
本发明实施例所述基于结构化分析字典的人脸识别设备的各功 能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现 过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析 多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的 判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学 习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率, 还有效提升人脸图像表示和识别准确率。
本发明实施例还提供了一种计算机可读存储介质,存储有基于结 构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别 程序被处理器执行时如上任意一实施例所述基于结构化分析字典的人 脸识别方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可 根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上 述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例将判别字典学习、分析稀疏表示和分析 多类分类器无缝地集成到一个统一的模型中,各子分类器具有更强的 判别性,有利于提升人脸识别的准确度,通过将分类器构造和字典学 习进行联合优化,缩短了人脸识别的时间,不仅提升人脸识别的效率, 还有效提升人脸图像表示和识别准确率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说 明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分 互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的 方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述 的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者 的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明 中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟 以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束 条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所 描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接 用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块 可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程 ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种基于结构化分析字典的人脸识别方 法、装置、设备及计算机存储介质进行了详细介绍。本文中应用了具 体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只 是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术 领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对 本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求 的保护范围内。

Claims (10)

1.一种基于结构化分析字典的人脸识别方法,其特征在于,包括:
将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;
根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
2.根据权利要求1所述的基于结构化分析字典的人脸识别方法,其特征在于,所述对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码的过程包括:
将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习:
式中,为学习得到的子字典集,c为所述人脸训练样本集包含的类别数目,为第l类的子字典,为第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
3.根据权利要求1所述的基于结构化分析字典的人脸识别方法,其特征在于,所述对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影包括:
根据下述公式从各子稀疏编码中提取相对应的子投影:
式中,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影。
4.根据权利要求1所述的基于结构化分析字典的人脸识别方法,其特征在于,所述根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器包括:
根据各子投影及所述人脸训练样本集,利用下述公式作为训练函数对所述人脸识别模型中的各子分类器进行训练:
式中,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影,Hl,i=[0,…,1,…,0]∈Rc,Hl=[hl,1,…,hl,i,…,hl,N1],为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
5.根据权利要求1至4任意一项所述的基于结构化分析字典的人脸识别方法,其特征在于,所述人脸识别模型的目标函数为:
式中, 为子字典的约束,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为学习得到的子字典集,为子投影集,是第l类子稀疏编码的子投影,Hl=[hl,1,…,hl,i,…,hl,N1],Hl,i=[0,…,1,…,0]∈Rc为所述人脸训练样本集的类别标签向量,非0数值代表Xl所属的类别,Wl∈Rc×k为子分类器。
6.一种基于结构化分析字典的人脸识别装置,其特征在于,包括:
模型预处理模块,用于将人脸训练样本集和人脸测试样本集输入预先构建的人脸识别模型中,并对所述人脸识别模型进行参数初始化,所述人脸训练样本集包括第一预设个数的类别标签样本图像和第二预设个数的无标签样本图像,所述人脸识别模型包括多个子分类器,每个子分类器对应所述人脸训练样本集中的一个类别;
模型训练模块,用于对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习,以得到各类别数据集的子字典和相对应的子稀疏编码;结构化字典学习的过程为通过最小化样本重建误差项和解析的非相干性增强项;对各类别数据集的子稀疏编码进行近似分析,得到各子稀疏编码的子投影;根据各子投影及所述人脸训练样本集训练所述人脸识别模型中的各子分类器;
人脸识别模块,用于利用所述人脸识别模型中的各子分类器对所述人脸测试样本集进行分类,输出所述人脸测试样本集的所属类别标签。
7.根据权利要求6所述的基于结构化分析字典的人脸识别装置,其特征在于,所述模型训练模块为将下述公式作为所述人脸识别模型中的提升函数,对所述人脸训练样本集中包含的每一类别的数据集进行结构化字典学习的模块:
式中,为学习得到的子字典集,c为所述人脸训练样本集包含的类别数目,为第l类的子字典,为第l类的子字典对应的子稀疏编码,为子稀疏编码矩阵S=[S1,…,Sl,…,Sc]中Sj的互补矩阵。
8.根据权利要求6所述的基于结构化分析字典的人脸识别装置,其特征在于,所述模型训练模块为根据下述公式从各子稀疏编码中提取相对应的子投影的模块:
式中,所述人脸训练样本集为c为所述人脸训练样本集包含的类别数目,为子投影集,是第l类子稀疏编码的子投影。
9.一种基于结构化分析字典的人脸识别设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至5任一项所述基于结构化分析字典的人脸识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于结构化分析字典的人脸识别程序,所述基于结构化分析字典的人脸识别程序被处理器执行时实现如权利要求1至5任一项所述基于结构化分析字典的人脸识别方法的步骤。
CN201711393942.0A 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备 Active CN108509833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711393942.0A CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711393942.0A CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108509833A true CN108509833A (zh) 2018-09-07
CN108509833B CN108509833B (zh) 2021-11-05

Family

ID=63374791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711393942.0A Active CN108509833B (zh) 2017-12-21 2017-12-21 一种基于结构化分析字典的人脸识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108509833B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241928A (zh) * 2018-09-19 2019-01-18 释码融和(上海)信息科技有限公司 一种识别异质虹膜的方法及计算设备
CN109492523A (zh) * 2018-09-17 2019-03-19 深圳壹账通智能科技有限公司 人脸识别系统性能测试方法、装置、设备和存储介质
CN109492610A (zh) * 2018-11-27 2019-03-19 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN109948735A (zh) * 2019-04-02 2019-06-28 广东工业大学 一种多标签分类方法、系统、装置及存储介质
CN110147782A (zh) * 2019-05-29 2019-08-20 苏州大学 一种基于投影字典对学习的人脸识别方法及装置
CN110579967A (zh) * 2019-09-23 2019-12-17 中南大学 基于同时降维和字典学习的过程监控方法
CN111160102A (zh) * 2019-11-29 2020-05-15 北京爱笔科技有限公司 人脸防伪识别模型的训练方法、人脸防伪识别方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616027A (zh) * 2015-02-06 2015-05-13 华东交通大学 一种非相邻的图结构稀疏人脸识别方法
CN106991355A (zh) * 2015-09-10 2017-07-28 天津中科智能识别产业技术研究院有限公司 基于拓扑保持的解析型字典学习模型的人脸识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616027A (zh) * 2015-02-06 2015-05-13 华东交通大学 一种非相邻的图结构稀疏人脸识别方法
CN106991355A (zh) * 2015-09-10 2017-07-28 天津中科智能识别产业技术研究院有限公司 基于拓扑保持的解析型字典学习模型的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHIMING GAO等: "Kernel class specific centralized dictionary learning for face recognition", 《2016 IEEE 13TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING》 *
马晓 等: "基于深度学习特征的稀疏表示的人脸识别方法", 《智能系统学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492523A (zh) * 2018-09-17 2019-03-19 深圳壹账通智能科技有限公司 人脸识别系统性能测试方法、装置、设备和存储介质
CN109241928A (zh) * 2018-09-19 2019-01-18 释码融和(上海)信息科技有限公司 一种识别异质虹膜的方法及计算设备
CN109241928B (zh) * 2018-09-19 2021-02-26 释码融和(上海)信息科技有限公司 一种识别异质虹膜的方法及计算设备
CN109492610A (zh) * 2018-11-27 2019-03-19 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN109492610B (zh) * 2018-11-27 2022-05-10 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN109948735A (zh) * 2019-04-02 2019-06-28 广东工业大学 一种多标签分类方法、系统、装置及存储介质
CN109948735B (zh) * 2019-04-02 2021-11-26 广东工业大学 一种多标签分类方法、系统、装置及存储介质
CN110147782A (zh) * 2019-05-29 2019-08-20 苏州大学 一种基于投影字典对学习的人脸识别方法及装置
CN110147782B (zh) * 2019-05-29 2023-06-13 苏州大学 一种基于投影字典对学习的人脸识别方法及装置
CN110579967A (zh) * 2019-09-23 2019-12-17 中南大学 基于同时降维和字典学习的过程监控方法
CN111160102A (zh) * 2019-11-29 2020-05-15 北京爱笔科技有限公司 人脸防伪识别模型的训练方法、人脸防伪识别方法及装置
CN111160102B (zh) * 2019-11-29 2024-02-23 北京爱笔科技有限公司 人脸防伪识别模型的训练方法、人脸防伪识别方法及装置

Also Published As

Publication number Publication date
CN108509833B (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN108509833A (zh) 一种基于结构化分析字典的人脸识别方法、装置及设备
Yang et al. Learning face age progression: A pyramid architecture of gans
CN109558832B (zh) 一种人体姿态检测方法、装置、设备及存储介质
WO2020258668A1 (zh) 基于对抗网络模型的人脸图像生成方法及装置、非易失性可读存储介质、计算机设备
CN107391703B (zh) 图像库的建立方法及系统、图像库和图像分类方法
CN108875904A (zh) 图像处理方法、图像处理装置和计算机可读存储介质
CN110084281A (zh) 图像生成方法、神经网络的压缩方法及相关装置、设备
CN106570521B (zh) 多语言场景字符识别方法及识别系统
CN109299716A (zh) 神经网络的训练方法、图像分割方法、装置、设备及介质
CN108776983A (zh) 基于重建网络的人脸重建方法和装置、设备、介质、产品
CN111160533A (zh) 一种基于跨分辨率知识蒸馏的神经网络加速方法
CN106295591A (zh) 基于人脸图像的性别识别方法及装置
CN106326857A (zh) 基于人脸图像的性别识别方法及装置
CN105469063B (zh) 鲁棒的人脸图像主成分特征提取方法及识别装置
CN106778852A (zh) 一种修正误判的图像内容识别方法
CN110503076A (zh) 基于人工智能的视频分类方法、装置、设备和介质
CN109376663A (zh) 一种人体姿态识别方法及相关装置
CN109299663A (zh) 手写字体识别方法、系统以及终端设备
CN107944398A (zh) 基于深度特征联合表示图像集人脸识别方法、装置和介质
CN106250811B (zh) 基于hog特征稀疏表示的非约束人脸识别方法
CN111160350A (zh) 人像分割方法、模型训练方法、装置、介质及电子设备
CN109446873A (zh) 手写字体识别方法、系统以及终端设备
CN110008961A (zh) 文字实时识别方法、装置、计算机设备及存储介质
CN104298974A (zh) 一种基于深度视频序列的人体行为识别方法
CN110188673A (zh) 表情识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant