CN112052781A - 特征提取模型训练方法、人脸识别方法、装置、设备及介质 - Google Patents

特征提取模型训练方法、人脸识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN112052781A
CN112052781A CN202010906610.3A CN202010906610A CN112052781A CN 112052781 A CN112052781 A CN 112052781A CN 202010906610 A CN202010906610 A CN 202010906610A CN 112052781 A CN112052781 A CN 112052781A
Authority
CN
China
Prior art keywords
face image
image
feature extraction
extraction model
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010906610.3A
Other languages
English (en)
Other versions
CN112052781B (zh
Inventor
孙太武
周超勇
刘玉宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010906610.3A priority Critical patent/CN112052781B/zh
Priority to PCT/CN2020/125033 priority patent/WO2021174880A1/zh
Publication of CN112052781A publication Critical patent/CN112052781A/zh
Application granted granted Critical
Publication of CN112052781B publication Critical patent/CN112052781B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供一种特征提取模型训练方法、人脸识别方法、装置、设备及介质,该训练方法包括:获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像分为被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像;对所述样本数据集进行数据增强处理;对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域;根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。本发明可提高部分遮挡人脸识别的准确性。

Description

特征提取模型训练方法、人脸识别方法、装置、设备及介质
技术领域
本发明涉及人脸识别领域,尤其涉及一种特征提取模型训练方法、人脸识别方法、装置、设备及介质。
背景技术
受新冠肺炎的影响,目前人们无论进出公司还是小区通常都佩戴有口罩,这给基于人脸识别的门禁系统等带来了极大的挑战。因为口罩遮挡了部分人脸,而遮挡的人脸区域很难提取出真实准确的特征描述,而特征描述的不准确性大幅度增加了人脸识别技术的难度。对此情况,现有人脸识别方法无法满足准确识别要求。
发明内容
针对上述现有技术的不足,本发明的目的在于提供一种特征提取模型训练方法、人脸识别方法、装置、设备及介质,以提高部分遮挡人脸识别的准确性。
为了实现上述目的,本发明提供一种特征提取模型训练方法,包括:
获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像分为被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像;
对所述样本数据集进行数据增强处理;
对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域;
根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。
在本发明一个优选实施例中,所述对所述样本数据集进行数据增强处理的步骤包括采用以下方式中的任何一种或多种得到新的人脸图像:
改变所述人脸图像的属性参数;
将所述人脸图像进行翻转;
从部分遮挡的人脸图像中提取遮挡物,并将提取到的遮挡物进行仿射变换后覆盖至未遮挡的人脸图像的对应位置;
学习所述人脸图像的特征,并利用部分遮挡的人脸图像中遮挡区域的特征替换未遮挡的人脸图像中对应区域的特征;
当某部分遮挡的人脸图像和某未遮挡的人脸图像标注有相同的身份标签时,从所述某未遮挡的人脸图像中截取与所述某部分遮挡的人脸图像中遮挡位置对应的图像,并将截取到的图像覆盖至所述某部分遮挡的人脸图像中的遮挡物上。
在本发明一个优选实施例中,所述根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练的步骤包括:
将所述人脸图像的局部区域输入所述特征提取模型进行处理,得到所述人脸图像的局部特征;
将所述人脸图像的局部特征输入预先训练的分类器,得到所述人脸图像的身份识别结果;
基于所述人脸图像对应的身份识别结果和身份标签,获取第一损失函数;
根据所述第一损失函数对所述特征提取模型进行迭代训练。
在本发明一个优选实施例中,在得到所述人脸图像的局部特征后,所述方法还包括:
将所述人脸图像的局部特征输入预设的二分类网络,以得到所述人脸图像是否被遮挡的遮挡判定结果;
基于所述人脸图像的遮挡判定结果和实际遮挡情况,获取第二损失函数;
所述根据所述第一损失函数对所述特征提取模型进行迭代训练的步骤包括:
根据所述第一损失函数和第二损失函数,对所述特征提取模型进行迭代训练。
在本发明一个优选实施例中,在根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练之前,所述方法还包括:对所述特征提取模型进行预训练。
为了实现上述目的,本发明还提供一种人脸识别方法,该方法包括:
获取目标人脸图像;
利用所述目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征;
将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对;
根据比对结果获取所述目标人脸图像的身份识别结果。
为了实现上述目的,本发明还提供一种特征提取模型训练装置,包括:
样本获取模块,用于获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像分为被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像;
样本增强模块,用于对所述样本数据集进行数据增强处理;
图像截取模块,用于对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域;
模型训练模块,用于根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。
在本发明一个优选实施例中,所述样本增强模块采用以下方式中的任何一种或多种得到新的人脸图像:
改变所述人脸图像的属性参数;
将所述人脸图像进行翻转;
从部分遮挡的人脸图像中提取遮挡物,并将提取到的遮挡物进行仿射变换后覆盖至未遮挡的人脸图像的对应位置;
学习所述人脸图像的特征,并利用部分遮挡的人脸图像中遮挡区域的特征替换未遮挡的人脸图像中对应区域的特征;
当某部分遮挡的人脸图像和某未遮挡的人脸图像标注有相同的身份标签时,从所述某未遮挡的人脸图像中截取与所述某部分遮挡的人脸图像中遮挡位置对应的图像,并将截取到的图像覆盖至所述某部分遮挡的人脸图像中的遮挡物上。
在本发明一个优选实施例中,所述模型训练模块包括:
处理单元,用于将截取到的所述人脸图像的局部区域输入所述特征提取模型进行处理,得到所述人脸图像的局部特征;
分类单元,用于将所述人脸图像的局部特征输入预先训练的分类器,得到所述人脸图像的身份识别结果;
第一损失函数获取单元,用于基于所述人脸图像对应的身份识别结果和身份标签,获取第一损失函数;
迭代训练单元,用于根据所述第一损失函数对所述特征提取模型进行迭代训练。
在本发明一个优选实施例中,所述模型训练模块还包括:
二分类单元,用于在得到所述人脸图像的局部特征后,将所述人脸图像的局部特征输入预设的二分类网络,以得到所述人脸图像是否被遮挡的遮挡判定结果;
第二损失函数获取单元,用于基于所述人脸图像的遮挡判定结果和实际遮挡情况,获取第二损失函数;
其中,所述迭代训练单元具体用于根据所述第一损失函数和第二损失函数,对所述特征提取模型进行迭代训练。
在本发明一个优选实施例中,所述装置还包括预训练模块,用于在所述模型训练模块执行相应操作之前,对所述特征提取模型进行预训练。
为了实现上述目的,本发明还提供一种人脸识别装置,该装置包括:
目标图像获取模块,用于获取目标人脸图像;
模型处理模块,用于利用所述目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征;
比对模块,用于将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对;
识别模块,用于根据比对结果获取所述目标人脸图像的身份识别结果。
为了实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述特征提取模型训练方法或人脸识别方法的步骤。
为了实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述特征提取模型训练方法或人脸识别方法的步骤。
通过采用上述技术方案,本发明具有如下有益效果:
本发明一方面对样本数据集进行增强,从而可以得到更多的样本对特征提取模型进行训练,使训练得到的模型准确性更高;本发明另一方面根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域对特征提取模型进行训练,从而可以通过配置截取规则使训练得到的模型更关注于未被遮挡物遮挡的区域,进面使得人脸图像被部分遮挡与不被遮挡时模型提取到的特征尽可能相似。因此,当训练得到的特征提取模型应用于部分遮挡的人脸图像识别时,可以提高识别准确率。
附图说明
图1为本发明实施例1的征提取模型训练方法的流程图;
图2为本发明实施例2的人脸识别方法的流程图;
图3为本发明实施例3的征提取模型训练装置的流程图;
图4为本发明实施例4的人脸识别装置的流程图;
图5为本发明实施例5的计算机设备的硬件架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
实施例1
本实施例提供一种特征提取模型训练方法,如图1所示,该方法包括以下步骤:
S1,获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像包含被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像。
在本实施例中,遮挡物可以是口罩、话筒、墨镜等中的任何一种,在此不做具体限制。
S2,对所述样本数据集进行数据增强处理。
在本实施例中,数据增强处理可以采用以下方式中的任何一种或多种实现:
(1)改变所述人脸图像的属性参数,如尺寸、像素、灰度、饱和度、色度等,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与原人脸图像一致。
(2)将所述人脸图像进行翻转,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与原人脸图像一致。
(3)从部分遮挡的人脸图像中提取遮挡物图像,并将提取到的遮挡物图像进行仿射变换后覆盖至未遮挡的人脸图像的对应位置,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与覆盖前未遮挡的人脸图像一致。例如,以遮挡物为口罩为例,从戴口罩的人脸图像中提取口罩图像,并将提取的口罩图像进行仿射变换后覆盖至未戴口罩的人脸图像的下半脸区域,以构造新的未戴口罩人脸图像。此处进行仿射变换的目的是为了使提取的遮挡物图像与未遮挡的人脸图像适配。
(4)采用GAN(Generative Adversarial Networks,生成式对抗网络)学习部分遮挡的人脸图像以及未遮挡的人脸图像的特征,并利用部分遮挡的人脸图像中遮挡区域的特征替换未遮挡的人脸图像中对应区域的特征,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与替换前未遮挡的人脸图像一致。例如,以遮挡物为口罩为例,利用戴口罩人脸图像中口罩区域的特征替换未戴口罩人脸图像中与所述口罩区域位置对应的特征,以构造新的未戴口罩人脸图像。
当某部分遮挡的人脸图像和某未遮挡的人脸图像标注有相同的身份标签(即两者为同一人的人脸图像)时,从所述某未遮挡的人脸图像中截取与所述某部分遮挡的人脸图像中遮挡位置对应的图像,并将截取到的图像覆盖至所述某部分遮挡的人脸图像中的遮挡物上,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与覆盖前所述某部分遮挡的人脸图像一致。例如,以遮挡物为口罩为例,假设样本数据集中存在用户A戴口罩的人脸图像和未戴口罩的人脸图像,则从其未戴口罩的人脸图像中截取与戴口罩人脸图像中口罩位置对应区域的图像,并将截取到的图像覆盖至其戴口罩人脸图像中的口罩上,以构造新的戴口罩人脸图像。
通过上述方式得到新的人脸图像将扩充样本数据集中训练样本的数量。
S3,对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域。例如,以遮挡物为口罩为例,截取规则可以配置为按照预设概率进行随机截取,其中,截取上半脸的概率设为M%,截取下半脸的概率设为N%,为了使训练得到的模型更关注口罩以外的区域(即上半脸),M应设置为大于N。当遮挡物为墨镜或话筒等时,根据相似的思路进行规则配置,首先按遮挡物性质将人脸图像划分为容易遮挡区域和不容易遮挡区域,而后将容易遮挡区域的截取概率设置为小于不容易遮挡区域的截取概率,最后根据配置的截取概率随机截取所述样本数据集中各人脸图像的局部区域。其中,截取的尺寸大小可根据试验得到。
S4,根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。在本实施例中,特征提取模型优选采用CNN(Convolutional NeuralNetworks,卷积神经网络)模型。本步骤的具体训练过程如下:
S41,将所述人脸图像的局部区域输入所述特征提取模型进行处理,得到所述人脸图像的局部特征。
S42,将所述人脸图像的局部特征输入预先训练的分类器,得到所述人脸图像的身份识别结果。
S43,基于所述人脸图像对应的身份识别结果和身份标签,获取第一损失函数。在本实施例中,第一损失函数可以采用交叉损失函数。
S44,根据所述第一损失函数对所述特征提取模型进行迭代训练,直至所述第一损失函数满足预定条件,如收敛至最小。
优选地,本实施例在特征提取模型的输出端还设置有二分类网络。在步骤S41得到所述人脸图像的局部特征后,本实施例的方法还可以包括:将所述人脸图像的局部特征输入预设的二分类网络,以得到所述人脸图像是否被遮挡的遮挡判定结果;基于所述人脸图像的遮挡判定结果和实际遮挡情况,获取第二损失函数。在此情况下,所述步骤S44包括:根据所述第一损失函数和第二损失函数,对所述特征提取模型进行迭代训练。具体来说,可以将所述第一损失函数和第二损失函数加权求和(加权求和的权重根据需要设置)得到最终损失函数,而后根据最终损失函数对所述特征提取模型进行迭代训练,直至所述最终损失函数满足预定条件,如收敛至最小。
优选地,在执行步骤S4之前,本实施例的方法还可以包括:对所述特征提取模型进行预训练。例如,首先利用二分类网络对图像截取处理后的样本数据集进行处理,以将样本数据集中的若干人脸图像分类为部分遮挡的人脸图像和未遮挡的人脸图像,而后利用所述部分遮挡的人脸图像或未遮挡的人脸图像对所述特征提取模型进行预训练。而后当执行步骤S4时,特征提取模型的初始权重即可设置为经过预训练得到的权重。
此外,为了增强模型泛化性,本实施例的方法还可以包括:在训练时,按照预设删除规则,随机删除所述人脸图像中的部分特征。
可见,本实施例一方面对样本数据集进行增强,从而得到更多的训练图像对特征提取模型进行训练,使训练得到的模型准确率更高;另一方面根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域对特征提取模型进行训练,从而可以通过配置截取规则使训练得到的模型更关注于未被遮挡物遮挡的部分,使得人脸图像被部分遮挡与不被遮挡时模型提取到的特征尽可能相似。因此,当特征提取模型应用于部分遮挡人脸识别时,可以提高识别的准确率。
实施例2
为了实现上述目的,本发明提供一种人脸识别方法,如图2所示,该方法包括以下步骤:
S5,获取待识别的目标人脸图像。
S6,利用实施例1训练得到的目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征。
S7,将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对。
S8,根据比对结果获取所述目标人脸图像的身份识别结果。具体来说,将预设图像库中与目标人脸图像的特征匹配度最高的存储图像对应的身份标签,作为所述目标人脸图像的身份识别结果。
由于采用了实施例1得到的目标特征提取模型进行识别,本实施例可以提高识别部分遮挡的人脸图像的准确性。此外,本实施例还可以将经过识别的目标人脸图像自动加入图像库,通过不断迭代提升识别精度。
优选地,所述预设图像库可以包括用于存储被遮挡物部分遮挡的人脸图像的第一图像库、以及用于存储未遮挡的人脸图像的第二图像库。本实施例在执行步骤S7之前,还可以包括:将所述目标人脸图像对应的特征输入预设的二分类网络以得到所述目标人脸图像的遮挡判定结果,当所述目标人脸图像为部分遮挡的人脸图像时,则步骤S7将所述目标人脸图像对应的特征与第一图像库中存储图像的特征进行比对,当所述目标人脸图像为未遮挡的人脸图像时,所述步骤S7将所述目标人脸图像对应的特征与第二图像库中存储图像的特征进行比对,从而可进一步提高识别准确性。
实施例3
本实施例提供一种特征提取模型训练装置,如图3所示,该装置10包括样本获取模块11、样本增强模块12、图像截取模块13和模型训练模块14。下面分别对各模块进行详细描述:
样本获取模块11用于获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像包含被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像。
在本实施例中,遮挡物可以是口罩、话筒、墨镜等中的任何一种,在此不做具体限制。
样本增强模块12用于对所述样本数据集进行数据增强处理。
在本实施例中,数据增强处理可以采用以下方式中的任何一种或多种实现:
(1)改变所述人脸图像的属性参数,如尺寸、像素、灰度、饱和度、色度等,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与原人脸图像一致。
(2)将所述人脸图像进行翻转,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与原人脸图像一致。
(3)从部分遮挡的人脸图像中提取遮挡物图像,并将提取到的遮挡物图像进行仿射变换后覆盖至未遮挡的人脸图像的对应位置,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与覆盖前未遮挡的人脸图像一致。例如,以遮挡物为口罩为例,从戴口罩的人脸图像中提取口罩图像,并将提取的口罩图像进行仿射变换后覆盖至未戴口罩的人脸图像的下半脸区域,以构造新的未戴口罩人脸图像。此处进行仿射变换的目的是为了使提取的遮挡物图像与未遮挡的人脸图像适配。
(4)采用GAN(Generative Adversarial Networks,生成式对抗网络)学习部分遮挡的人脸图像以及未遮挡的人脸图像的特征,并利用部分遮挡的人脸图像中遮挡区域的特征替换未遮挡的人脸图像中对应区域的特征,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与替换前未遮挡的人脸图像一致。例如,以遮挡物为口罩为例,利用戴口罩人脸图像中口罩区域的特征替换未戴口罩人脸图像中与所述口罩区域位置对应的特征,以构造新的未戴口罩人脸图像。
当某部分遮挡的人脸图像和某未遮挡的人脸图像标注有相同的身份标签(即两者为同一人的人脸图像)时,从所述某未遮挡的人脸图像中截取与所述某部分遮挡的人脸图像中遮挡位置对应的图像,并将截取到的图像覆盖至所述某部分遮挡的人脸图像中的遮挡物上,以得到新的人脸图像,其中新的人脸图像标注的身份标签应与覆盖前所述某部分遮挡的人脸图像一致。例如,以遮挡物为口罩为例,假设样本数据集中存在用户A戴口罩的人脸图像和未戴口罩的人脸图像,则从其未戴口罩的人脸图像中截取与戴口罩人脸图像中口罩位置对应区域的图像,并将截取到的图像覆盖至其戴口罩人脸图像中的口罩上,以构造新的戴口罩人脸图像。
通过上述方式得到新的人脸图像将扩充样本数据集中训练样本的数量。
图像截取模块13用于对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域。例如,以遮挡物为口罩为例,截取规则可以配置为按照预设概率进行随机截取,其中,截取上半脸的概率设为M%,截取下半脸的概率设为N%,为了使训练得到的模型更关注口罩以外的区域(即上半脸),M应设置为大于N。当遮挡物为墨镜或话筒等时,根据相似的思路进行规则配置,首先按遮挡物性质将人脸图像划分为容易遮挡区域和不容易遮挡区域,而后将容易遮挡区域的截取概率设置为小于不容易遮挡区域的截取概率,最后根据配置的截取概率随机截取所述样本数据集中各人脸图像的局部区域。其中,截取的尺寸大小可根据试验得到。
模型训练模块14用于根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。在本实施例中,特征提取模型优选采用CNN(Convolutional Neural Networks,卷积神经网络)模型。
本实施例的模型训练模块具体可以包括:
处理单元,用于将所述人脸图像的局部区域输入所述特征提取模型进行处理,得到所述人脸图像的局部特征。
分类单元,用于将所述人脸图像的局部特征输入预先训练的分类器,得到所述人脸图像的身份识别结果。
第一损失函数获取单元,用于基于所述人脸图像对应的身份识别结果和身份标签,获取第一损失函数。在本实施例中,第一损失函数可以采用交叉损失函数。
迭代训练单元,用于根据所述第一损失函数对所述特征提取模型进行迭代训练,直至所述第一损失函数满足预定条件,如收敛至最小。
优选地,本实施例在特征提取模型的输出端设置有二分类网络。所述模型训练模块还可以包括:二分类单元,用于在得到所述人脸图像的局部特征后,将所述人脸图像的局部特征输入预设的二分类网络,以得到所述人脸图像是否被遮挡的遮挡判定结果;第二损失函数获取单元,用于基于所述人脸图像的遮挡判定结果和实际遮挡情况,获取第二损失函数。在此情况下,所述迭代训练单元具体用于:根据所述第一损失函数和第二损失函数,对所述特征提取模型进行迭代训练。具体来说,可以将所述第一损失函数和第二损失函数加权求和(加权求和的权重根据需要设置)得到最终损失函数,而后根据最终损失函数对所述特征提取模型进行迭代训练,直至所述最终损失函数满足预定条件,如收敛至最小。
优选地,本实施例的装置还可以包括预训练模块,用于在所述模型训练模块根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练之前,对所述特征提取模型进行预训练。例如,首先利用二分类网络对图像截取处理后的样本数据集进行处理,以将样本数据集中的若干人脸图像分类为部分遮挡的人脸图像和未遮挡的人脸图像,而后利用所述部分遮挡的人脸图像或未遮挡的人脸图像对所述特征提取模型进行预训练。而后当所述模型训练模块14训练特征提取模型,初始权重即可设置为经过预训练得到的权重。
此外,为了增强模型泛化性,本实施例的装置还可以包括:特征删除模块,用于在训练时,按照预设删除规则,随机删除所述人脸图像中的部分特征。
可见,本实施例一方面对样本数据集进行增强,从而得到更多的训练图像对特征提取模型进行训练,使训练得到的模型准确率更高;另一方面根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域对特征提取模型进行训练,从而可以通过配置截取规则使训练得到的模型更关注于未被遮挡物遮挡的部分,使得人脸图像被部分遮挡与不被遮挡时模型提取到的特征尽可能相似。因此,当特征提取模型应用于部分遮挡人脸识别时,可以提高识别的准确率。
实施例4
为了实现上述目的,本发明提供一种人脸识别装置,如图4所示,该装置20包括:
目标图像获取模块21,用于获取待识别的目标人脸图像。
模型处理模块22,用于利用实施例3训练得到的目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征。
比对模块23,用于将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对。
识别模块24,用于根据比对结果获取所述目标人脸图像的身份识别结果。具体来说,将预设图像库中与目标人脸图像的特征匹配度最高的存储图像对应的身份标签,作为所述目标人脸图像的身份识别结果。
由于采用了实施例3得到的目标特征提取模型进行识别,本实施例可以提高识别部分遮挡的人脸图像的准确性。此外,本实施例的装置还可以将经过识别的目标人脸图像自动加入图像库,通过不断迭代提升识别精度。
优选地,所述预设图像库可以包括用于存储被遮挡物部分遮挡的人脸图像的第一图像库、以及用于存储未遮挡的人脸图像的第二图像库。本实施例的装置还可以包括:遮挡判定模块,用于在所述比对模块执行相应操作之前,将所述目标人脸图像对应的特征输入预设的二分类网络以得到所述目标人脸图像的遮挡判定结果,当所述目标人脸图像为部分遮挡的人脸图像时,则所述比对模块将所述目标人脸图像对应的特征与第一图像库中存储图像的特征进行比对,当所述目标人脸图像为未遮挡的人脸图像时,所述比对模块将所述目标人脸图像对应的特征与第二图像库中存储图像的特征进行比对,从而可进一步提高识别准确性。
实施例5
本实施例提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22,如图5所示。需要指出的是,图5仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作系统和各类应用软件,例如实施例3或4的特征提取模型训练装置10或人脸识别装置20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行特征提取模型训练装置10或人脸识别装置20,以实现实施例1或2的特征提取模型训练方法或人脸识别方法。
实施例6
本实施例提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储特征提取模型训练装置10或人脸识别装置20,被处理器执行时实现实施例1或2的特征提取模型训练方法或人脸识别方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种特征提取模型训练方法,其特征在于,包括:
获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像分为被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像;
对所述样本数据集进行数据增强处理;
对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域;
根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。
2.根据权利要求1所述的特征提取模型训练方法,其特征在于,所述对所述样本数据集进行数据增强处理的步骤包括采用以下方式中的任何一种或多种得到新的人脸图像:
改变所述人脸图像的属性参数;
将所述人脸图像进行翻转;
从部分遮挡的人脸图像中提取遮挡物,并将提取到的遮挡物进行仿射变换后覆盖至未遮挡的人脸图像的对应位置;
学习所述人脸图像的特征,并利用部分遮挡的人脸图像中遮挡区域的特征替换未遮挡的人脸图像中对应区域的特征;
当某部分遮挡的人脸图像和某未遮挡的人脸图像标注有相同的身份标签时,从所述某未遮挡的人脸图像中截取与所述某部分遮挡的人脸图像中遮挡位置对应的图像,并将截取到的图像覆盖至所述某部分遮挡的人脸图像中的遮挡物上。
3.根据权利要求1所述的特征提取模型训练方法,其特征在于,所述根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练的步骤包括:
将所述人脸图像的局部区域输入所述特征提取模型进行处理,得到所述人脸图像的局部特征;
将所述人脸图像的局部特征输入预先训练的分类器,得到所述人脸图像的身份识别结果;
基于所述人脸图像对应的身份识别结果和身份标签,获取第一损失函数;
根据所述第一损失函数对所述特征提取模型进行迭代训练。
4.根据权利要求3所述的特征提取模型训练方法,其特征在于,在得到所述人脸图像的局部特征后,所述方法还包括:
将所述人脸图像的局部特征输入预设的二分类网络,以得到所述人脸图像是否被遮挡的遮挡判定结果;
基于所述人脸图像的遮挡判定结果和实际遮挡情况,获取第二损失函数;
所述根据所述第一损失函数对所述特征提取模型进行迭代训练的步骤包括:
根据所述第一损失函数和第二损失函数,对所述特征提取模型进行迭代训练。
5.根据权利要求1所述的特征提取模型训练方法,其特征在于,在根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练之前,所述方法还包括:对所述特征提取模型进行预训练。
6.一种人脸识别方法,其特征在于,该方法包括:
获取目标人脸图像;
利用权利要求1-5任一项得到的所述目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征;
将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对;
根据比对结果获取所述目标人脸图像的身份识别结果。
7.一种特征提取模型训练装置,其特征在于,包括:
样本获取模块,用于获取样本数据集,所述样本数据集包含标注有对应身份标签的若干人脸图像,所述若干人脸图像分为被遮挡物部分遮挡的人脸图像、以及未遮挡的人脸图像;
样本增强模块,用于对所述样本数据集进行数据增强处理;
图像截取模块,用于对数据增强处理后的所述样本数据集进行图像截取处理,以根据预设截取规则,随机截取所述样本数据集中各人脸图像的局部区域;
模型训练模块,用于根据图像截取处理后的样本数据集对预先建立的特征提取模型进行训练,得到目标特征提取模型。
8.一种人脸识别装置,其特征在于,该装置包括:
目标图像获取模块,用于获取目标人脸图像;
模型处理模块,用于利用权利要求7得到的所述目标特征提取模型对所述目标人脸图像进行处理,得到所述目标人脸图像对应的特征;
比对模块,用于将所述目标人脸图像对应的特征与预设图像库中存储图像的特征进行比对;
识别模块,用于根据比对结果获取所述目标人脸图像的身份识别结果。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
CN202010906610.3A 2020-09-01 2020-09-01 特征提取模型训练方法、人脸识别方法、装置、设备及介质 Active CN112052781B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010906610.3A CN112052781B (zh) 2020-09-01 2020-09-01 特征提取模型训练方法、人脸识别方法、装置、设备及介质
PCT/CN2020/125033 WO2021174880A1 (zh) 2020-09-01 2020-10-30 征提取模型训练方法、人脸识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010906610.3A CN112052781B (zh) 2020-09-01 2020-09-01 特征提取模型训练方法、人脸识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112052781A true CN112052781A (zh) 2020-12-08
CN112052781B CN112052781B (zh) 2024-07-16

Family

ID=73607938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010906610.3A Active CN112052781B (zh) 2020-09-01 2020-09-01 特征提取模型训练方法、人脸识别方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN112052781B (zh)
WO (1) WO2021174880A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597913A (zh) * 2020-12-26 2021-04-02 中国农业银行股份有限公司 一种人脸标注方法及装置
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113255617A (zh) * 2021-07-07 2021-08-13 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备和计算机可读存储介质
CN113537151A (zh) * 2021-08-12 2021-10-22 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113673470A (zh) * 2021-08-30 2021-11-19 广州虎牙科技有限公司 人脸检测模型训练方法、电子设备及计算机可读存储介质
CN113837015A (zh) * 2021-08-31 2021-12-24 艾普工华科技(武汉)有限公司 一种基于特征金字塔的人脸检测方法及系统
CN113963426A (zh) * 2021-12-22 2022-01-21 北京的卢深视科技有限公司 模型训练、戴口罩人脸识别方法、电子设备及存储介质
CN114170662A (zh) * 2021-12-07 2022-03-11 上海瑾盛通信科技有限公司 人脸识别方法及装置、存储介质、电子设备
CN115810214A (zh) * 2023-02-06 2023-03-17 广州市森锐科技股份有限公司 基于ai人脸识别核验管理方法、系统、设备及存储介质

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963374A (zh) * 2021-10-19 2022-01-21 中国石油大学(华东) 基于多层次特征与身份信息辅助的行人属性识别方法
CN113963417A (zh) * 2021-11-08 2022-01-21 盛视科技股份有限公司 人脸属性识别方法、终端及存储介质
CN114220143B (zh) * 2021-11-26 2024-04-19 华南理工大学 一种佩戴口罩的人脸识别方法
CN113963183B (zh) * 2021-12-22 2022-05-31 合肥的卢深视科技有限公司 模型训练、人脸识别方法、电子设备及存储介质
CN114299595A (zh) * 2022-01-29 2022-04-08 北京百度网讯科技有限公司 人脸识别方法、装置、设备、存储介质和程序产品
CN114581984B (zh) * 2022-03-07 2024-04-16 桂林理工大学 一种基于低秩注意力机制的口罩人脸识别算法
CN114694231B (zh) * 2022-04-18 2024-09-06 深圳市同为数码科技股份有限公司 基于离线类中心的人脸识别方法、装置、设备及介质
CN115063863A (zh) * 2022-06-27 2022-09-16 中国平安人寿保险股份有限公司 人脸识别方法、装置、计算机设备及存储介质
CN114972930B (zh) * 2022-08-02 2022-12-06 四川大学 面部图像的皮损标注方法、系统、计算机设备和存储介质
CN115457624B (zh) * 2022-08-18 2023-09-01 中科天网(广东)科技有限公司 一种局部与整体人脸特征交叉融合的戴口罩人脸识别方法、装置、设备和介质
CN115622730B (zh) * 2022-08-25 2024-08-30 支付宝(杭州)信息技术有限公司 人脸攻击检测模型的训练方法、人脸攻击检测方法和装置
CN115527254B (zh) * 2022-09-21 2023-06-20 合肥的卢深视科技有限公司 人脸识别、模型训练方法、装置、电子设备及存储介质
CN117576766B (zh) * 2024-01-16 2024-04-26 杭州魔点科技有限公司 一种跨时空兼容性无监督自学习人脸识别方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609481A (zh) * 2017-08-14 2018-01-19 百度在线网络技术(北京)有限公司 为人脸识别生成训练数据的方法、装置和计算机存储介质
EP3428843A1 (en) * 2017-07-14 2019-01-16 GB Group plc Improvements relating to face recognition
CN109886167A (zh) * 2019-02-01 2019-06-14 中国科学院信息工程研究所 一种遮挡人脸识别方法及装置
CN110334615A (zh) * 2019-06-20 2019-10-15 湖北亮诚光电科技有限公司 一种有遮挡的人脸识别的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346721B2 (en) * 2017-11-01 2019-07-09 Salesforce.Com, Inc. Training a neural network using augmented training datasets
CN111353411A (zh) * 2020-02-25 2020-06-30 四川翼飞视科技有限公司 一种基于联合损失函数的遮挡人脸的识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3428843A1 (en) * 2017-07-14 2019-01-16 GB Group plc Improvements relating to face recognition
CN107609481A (zh) * 2017-08-14 2018-01-19 百度在线网络技术(北京)有限公司 为人脸识别生成训练数据的方法、装置和计算机存储介质
CN109886167A (zh) * 2019-02-01 2019-06-14 中国科学院信息工程研究所 一种遮挡人脸识别方法及装置
CN110334615A (zh) * 2019-06-20 2019-10-15 湖北亮诚光电科技有限公司 一种有遮挡的人脸识别的方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597913A (zh) * 2020-12-26 2021-04-02 中国农业银行股份有限公司 一种人脸标注方法及装置
CN112597913B (zh) * 2020-12-26 2024-07-05 中国农业银行股份有限公司 一种人脸标注方法及装置
CN113012176A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113012176B (zh) * 2021-03-17 2023-12-15 阿波罗智联(北京)科技有限公司 样本图像的处理方法、装置、电子设备及存储介质
CN113255617A (zh) * 2021-07-07 2021-08-13 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备和计算机可读存储介质
CN113537151B (zh) * 2021-08-12 2023-10-17 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113537151A (zh) * 2021-08-12 2021-10-22 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113673470A (zh) * 2021-08-30 2021-11-19 广州虎牙科技有限公司 人脸检测模型训练方法、电子设备及计算机可读存储介质
CN113837015A (zh) * 2021-08-31 2021-12-24 艾普工华科技(武汉)有限公司 一种基于特征金字塔的人脸检测方法及系统
CN114170662A (zh) * 2021-12-07 2022-03-11 上海瑾盛通信科技有限公司 人脸识别方法及装置、存储介质、电子设备
CN113963426A (zh) * 2021-12-22 2022-01-21 北京的卢深视科技有限公司 模型训练、戴口罩人脸识别方法、电子设备及存储介质
CN113963426B (zh) * 2021-12-22 2022-08-26 合肥的卢深视科技有限公司 模型训练、戴口罩人脸识别方法、电子设备及存储介质
CN115810214A (zh) * 2023-02-06 2023-03-17 广州市森锐科技股份有限公司 基于ai人脸识别核验管理方法、系统、设备及存储介质

Also Published As

Publication number Publication date
WO2021174880A1 (zh) 2021-09-10
CN112052781B (zh) 2024-07-16

Similar Documents

Publication Publication Date Title
CN112052781B (zh) 特征提取模型训练方法、人脸识别方法、装置、设备及介质
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
WO2020098250A1 (zh) 字符识别方法、服务器及计算机可读存储介质
CN114119676B (zh) 基于多特征信息融合的目标检测跟踪识别方法和系统
CN111401371A (zh) 一种文本检测识别方法、系统及计算机设备
CN112329811B (zh) 异常账号识别方法、装置、计算机设备和存储介质
CN110348331B (zh) 人脸识别方法及电子设备
CN109993201B (zh) 一种图像处理方法、装置和可读存储介质
CN109829396B (zh) 人脸识别运动模糊处理方法、装置、设备及存储介质
CN112329779B (zh) 一种基于mask提高证件识别准确率的方法和相关装置
CN107844742B (zh) 人脸图像眼镜去除方法、装置及存储介质
KR20160075509A (ko) 생체 인식 인증을 위한 특징 추출 및 정합과 템플릿 갱신
CA3052248C (en) Detecting orientation of textual documents on a live camera feed
CN110147708B (zh) 一种图像数据处理方法和相关装置
CN110969046B (zh) 人脸识别方法、设备及计算机可读存储介质
KR20220076398A (ko) Ar장치를 위한 객체 인식 처리 장치 및 방법
CN111695462A (zh) 一种人脸识别方法、装置、存储介质和服务器
CN116110100B (zh) 一种人脸识别方法、装置、计算机设备及存储介质
CN113705294A (zh) 一种基于人工智能的图像识别方法、装置
CN111860582B (zh) 图像分类模型构建方法、装置、计算机设备和存储介质
CN111275051A (zh) 字符识别方法、装置、计算机设备和计算机可读存储介质
CN110874570A (zh) 面部识别方法、装置、设备及计算机可读存储介质
CN110175500B (zh) 指静脉比对方法、装置、计算机设备及存储介质
CN112907206A (zh) 一种基于视频对象识别的业务审核方法、装置及设备
CN113837006A (zh) 一种人脸识别方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant