CN111340013B - 人脸识别方法、装置、计算机设备及存储介质 - Google Patents

人脸识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111340013B
CN111340013B CN202010438831.2A CN202010438831A CN111340013B CN 111340013 B CN111340013 B CN 111340013B CN 202010438831 A CN202010438831 A CN 202010438831A CN 111340013 B CN111340013 B CN 111340013B
Authority
CN
China
Prior art keywords
feature
image
face image
face
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010438831.2A
Other languages
English (en)
Other versions
CN111340013A (zh
Inventor
许剑清
沈鹏程
李绍欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010438831.2A priority Critical patent/CN111340013B/zh
Publication of CN111340013A publication Critical patent/CN111340013A/zh
Application granted granted Critical
Publication of CN111340013B publication Critical patent/CN111340013B/zh
Priority to PCT/CN2021/085978 priority patent/WO2021232985A1/zh
Priority to US17/744,260 priority patent/US11816880B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请实施例公开了一种人脸识别方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取目标人脸图像对应的第一特征图像以及第一特征图像对应的第一特征向量和第一特征数值,根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下确定目标人脸图像与模板人脸图像匹配。由于在获取相似度时考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征向量,可以避免人脸图像中存在干扰因素导致特征向量无法准确表示人脸特征的情况,可以提高人脸识别的准确率,能够保证人脸识别进行身份验证的安全性。

Description

人脸识别方法、装置、计算机设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种人脸识别方法、装置、计算机设备及存储介质。
背景技术
人脸识别是基于人的脸部特征进行身份识别的一种生物特征识别技术,随着人工智能技术的飞速发展,基于人工智能的人脸识别在日常生活中的应用越来越广泛,可以在人脸识别支付、人脸识别登录应用等场景下对用户身份进行监控。
相关技术中,调用人脸识别模型,分别提取采集的目标人脸图像对应的第一特征向量和模板人脸图像对应的第二特征向量,根据第一特征向量和第二特征向量获取目标人脸图像和模板人脸图像之间的相似度,根据该相似度确定目标人脸图像与模板人脸图像是否匹配,从而确定人脸识别是否通过。
但是,由于人脸图像中存在干扰因素,例如人脸图像中存在遮挡物或者人脸图像本身比较模糊等,导致提取的特征向量不够准确,进而导致人脸识别的准确率较低。
发明内容
本申请实施例提供了一种人脸识别方法、装置、计算机设备及存储介质,可以提高人脸识别的准确率。所述技术方案包括如下内容。
一方面,提供了一种人脸识别方法,所述方法包括:对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量;对所述第一特征图像进行处理,得到所述第一特征图像对应的第一特征数值,所述第一特征数值用于表示所述第一特征图像描述所述目标人脸图像中人脸特征的不确定度;根据所述第一特征向量、所述第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、所述第二特征图像对应的第二特征数值,获取所述目标人脸图像和所述模板人脸图像之间的相似度,所述第二特征数值用于表示所述第二特征图像描述所述模板人脸图像中人脸特征的不确定度;在所述相似度大于预设阈值的情况下,确定所述目标人脸图像与所述模板人脸图像匹配。
可选地,所述根据所述预测特征向量和所述样本特征向量之间的差异,训练所述特征提取子模型,包括:获取所述预测特征向量和所述样本特征向量之间的第一损失值,所述第一损失值表示所述预测特征向量和所述样本特征向量之间的差异;根据所述第一损失值,训练所述特征提取子模型。
可选地,所述根据所述第一特征向量、所述第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、所述第二特征图像对应的第二特征数值,获取所述目标人脸图像和所述模板人脸图像之间的相似度之前,所述方法还包括:对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量;对所述第二特征图像进行处理,得到所述第二特征图像对应的第二特征数值。
可选地,所述对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量,包括:调用所述人脸识别模型中的特征提取子模型,对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量。
可选地,所述对所述第二特征图像进行处理,得到所述第二特征图像对应的第二特征数值,包括:调用所述人脸识别模型中的预测子模型,对所述第二特征图像进行处理,得到所述第二特征图像对应的第二特征数值。
可选地,所述特征提取子模型包括特征提取层和特征映射层,所述调用所述特征提取子模型,对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量,包括:调用所述特征提取层,对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像;调用所述特征映射层,对所述第二特征图像进行特征映射,得到所述第二特征图像对应的第二特征向量。
另一方面,提供了一种人脸识别装置,所述装置包括:特征提取模块,用于对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量;特征数值获取模块,用于对所述第一特征图像进行处理,得到所述第一特征图像对应的第一特征数值,所述第一特征数值用于表示所述第一特征图像描述所述目标人脸图像中人脸特征的不确定度;相似度获取模块,用于根据所述第一特征向量、所述第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、所述第二特征图像对应的第二特征数值,获取所述目标人脸图像和所述模板人脸图像之间的相似度,所述第二特征数值用于表示所述第二特征图像描述所述模板人脸图像中人脸特征的不确定度;确定模块,用于在所述相似度大于预设阈值的情况下,确定所述目标人脸图像与所述模板人脸图像匹配。
可选地,所述特征提取模块,包括:第一特征提取单元,用于调用人脸识别模型中的特征提取子模型,对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量。
可选地,所述特征数值获取模块,包括:特征数值获取单元,用于调用所述人脸识别模型中的预测子模型,对所述第一特征图像进行处理,得到所述第一特征图像对应的第一特征数值。
可选地,所述特征提取子模型包括特征提取层和特征映射层,所述第一特征提取单元,用于:调用所述特征提取层,对所述目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像;调用所述特征映射层,对所述第一特征图像进行特征映射,得到所述第一特征图像对应的第一特征向量。
可选地,所述装置还包括:第一训练模块,用于根据样本人脸图像和所述样本人脸图像对应的样本特征向量,训练所述特征提取子模型;第二训练模块,用于在保持训练后的特征提取子模型不变的情况下,根据所述样本特征向量和所述样本人脸图像所属人脸标识的中心特征向量,训练所述预测子模型。
可选地,所述第一训练模块,包括:第一获取单元,用于获取所述样本人脸图像和所述样本人脸图像对应的样本特征向量;第二特征提取单元,用于调用所述特征提取子模型,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像及所述预测特征图像对应的预测特征向量;第一训练单元,用于根据所述预测特征向量和所述样本特征向量之间的差异,训练所述特征提取子模型。
可选地,所述特征提取子模型包括特征提取层和特征映射层,所述第二特征提取单元,还用于:调用所述特征提取层,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像;调用所述特征映射层,对所述预测特征图像进行特征映射,得到所述预测特征图像对应的预测特征向量。
可选地,所述第一训练单元,还用于:获取所述预测特征向量和所述样本特征向量之间的第一损失值,所述第一损失值表示所述预测特征向量和所述样本特征向量之间的差异;根据所述第一损失值,训练所述特征提取子模型。
可选地,所述人脸识别模型还包括损失获取子模型,所述损失获取子模型包括每个人脸标识对应的权重向量,所述第一训练单元,还用于:调用所述损失获取子模型,按照所述样本人脸图像所属人脸标识对应的权重向量对所述预测特征向量进行加权处理,得到所述预测特征向量对应的加权特征向量;获取所述加权特征向量和所述样本特征向量之间的第二损失值,所述第二损失值表示所述加权特征向量和所述样本特征向量之间的差异;根据所述第二损失值,训练所述特征提取子模型和所述损失获取子模型。
可选地,所述第二训练模块,包括:第二获取单元,用于获取所述样本人脸图像所属人脸标识的中心特征向量,所述中心特征向量表示所述人脸标识对应的人脸特征;特征数值获取单元,用于调用所述预测子模型,对所述预测特征图像进行处理,得到所述预测特征图像对应的预测特征数值,所述预测特征数值用于表示所述预测特征图像描述所述样本人脸图像中人脸特征的不确定度;损失值获取单元,用于根据所述预测特征向量、所述中心特征向量和所述预测特征数值,获取第三损失值,所述第三损失值表示所述预测特征图像对应的预测特征数值的损失;第二训练单元,用于根据所述第三损失值,训练所述预测子模型。
可选地,所述损失值获取单元,还用于:根据所述预测特征向量和所述中心特征向量之间的距离,获取目标特征数值;根据所述目标特征数值和所述预测特征数值之间的差异,获取所述第三损失值。
可选地,所述第二获取单元,还用于:获取所述样本人脸图像所属人脸标识的多个人脸图像对应的特征向量;根据获取到的多个特征向量,确定所述中心特征向量。
可选地,所述第二获取单元,还用于:获取所述样本人脸图像所属人脸标识对应的权重向量; 将所述样本人脸图像对应的权重向量确定为所述中心特征向量。
可选地,所述特征提取模块,还用于对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量;所述特征数值获取模块,还用于对所述第二特征图像进行处理,得到所述第二特征图像对应的第二特征数值。
可选地,所述第一特征提取单元,还用于调用所述人脸识别模型中的特征提取子模型,对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像及所述第二特征图像对应的第二特征向量。
可选地,所述特征数值获取单元,还用于调用所述人脸识别模型中的预测子模型,对所述第二特征图像进行处理,得到所述第二特征图像对应的第二特征数值。
可选地,所述特征提取子模型包括特征提取层和特征映射层,所述第一特征提取单元,还用于:调用所述特征提取层,对所述模板人脸图像进行特征提取,得到所述模板人脸图像对应的第二特征图像;调用所述特征映射层,对所述第二特征图像进行特征映射,得到所述第二特征图像对应的第二特征向量。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如所述人脸识别方法中所执行的操作。
再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行,以实现如所述人脸识别方法中所执行的操作。
本申请实施例提供的方法、装置、计算机设备及存储介质,获取目标人脸图像对应的第一特征图像以及第一特征图像对应的第一特征向量和第一特征数值,根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下确定目标人脸图像与模板人脸图像匹配。由于第一特征数值表示第一特征图像描述目标人脸图像中人脸特征的不确定度,第二特征数值表示第二特征图像描述模板人脸图像中人脸特征的不确定度,因此在获取目标人脸图像和模板人脸图像的相似度时,还考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
并且,本申请实施例中,将目标人脸图像的特征映射到超球面空间中,得到该目标人脸图像对应的第一特征图像。由于相比于二维的欧式空间,超球面空间更加符合人脸的特征空间,因此在超球面空间上对人脸进行特征提取可以使提取到的人脸特征更加准确,可以进一步提高人脸识别的准确率。
并且,获取样本人脸图像和样本人脸图像对应的样本特征向量,调用特征提取子模型提取样本人脸图像的预测特征图像和预测特征向量,根据预测特征向量和样本特征向量之间的差异,训练特征提取子模型。获取样本人脸图像所属人脸标识的中心特征向量,调用预测子模型获取预测特征图像对应的预测特征数值,根据预测特征向量、中心特征向量和预测特征数值获取第三损失值, 根据第三损失值训练预测子模型。后续即可通过包括该特征提取子模型和预测子模型的人脸识别模型进行人脸识别,由于引入预测子模型,因此在获取目标人脸图像和模板人脸图像之间的相似度时,还考虑了预测子模型输出的特征数值对相似度的影响,也即是考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
并且,根据样本人脸图像和样本人脸图像对应的样本特征向量,训练特征提取子模型,在保持训练后的特征提取子模型不变的情况下,根据样本特征向量和样本人脸图像所属人脸标识的中心特征向量,训练预测子模型。因此对人脸识别模型的训练过程可以分为特征提取子模型的训练阶段和预测子模型的训练阶段,则在特征提取子模型训练好的情况下,仅需获取训练该特征提取子模型的样本人脸图像,对预测子模型进行训练即可,无需重新训练新的特征提取子模型,也无需重新收集样本人脸图像。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种人脸识别模型的示意图;
图2是本申请实施例提供的另一种人脸识别模型的示意图;
图3是本申请实施例提供的一种人脸识别方法的流程图;
图4是本申请实施例提供的另一种人脸识别方法的流程图;
图5是本申请实施例提供的另一种人脸识别方法的流程图;
图6是本申请实施例提供的一种人脸识别的结果以及相关技术提供的一种人脸识别的结果;
图7是本申请实施例提供的一种人脸识别模型训练方法的流程图;
图8是本申请实施例提供的一种训练模型和部署模型的流程图;
图9是本申请实施例提供的一种训练特征提取子模型的流程图;
图10是本申请实施例提供的一种训练预测子模型的流程图;
图11是本申请实施例提供的一种人脸识别装置的结构示意图;
图12是本申请实施例提供的另一种人脸识别装置的结构示意图;
图13是本申请实施例提供的一种终端的结构示意图;
图14是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一特征图像称为第二特征图像,且类似地,可将第二特征图像称为第一特征图像。其中,多个是指两个或者两个以上,例如,多个人脸图像可以是两个人脸图像、三个人脸图像等任一大于等于二的整数个人脸图像。每个是指至少一个中的每一个,例如,每个人脸标识是指多个人脸标识中的每一个人脸标识,若多个人脸标识为3个人脸标识,则每个人脸标识是指3个人脸标识中的每一个人脸标识。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术包括自然语言处理技术和机器学习。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请实施例提供的人脸识别方法涉及人工智能技术和计算机视觉技术,通过下述实施例提供的人脸识别方法进行说明。
本申请实施例提供了一种人脸识别方法,执行主体为计算机设备。该计算机设备调用人脸识别模型实现了对人脸图像中人脸的识别。在一种可能实现方式中,该计算机设备为终端,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等。在另一种可能实现方式中,该计算机设备为服务器,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云存储、网络服务、云通信、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例提供的方法,可以应用于人脸识别的任一场景下,
例如,在通过人脸识别进行网上支付的场景下,终端预先存储用户的模板人脸图像,当终端检测到要进行网上支付时,需要对当前用户的身份进行验证,则终端采集当前输入的目标人脸图像,调用本申请实施例提供的人脸识别模型,分别对采集到的目标人脸图像和预先存储的模板人脸图像进行处理,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下,确定目标人脸图像与模板人脸图像匹配,也即是该目标人脸图像对应的用户是该模板人脸图像对应的用户,则当前用户的身份验证通过,可以完成网上支付。在相似度不大于预设阈值的情况下,确定目标人脸图像与模板人脸图像不匹配,也即是该目标人脸图像对应的用户不是该模板人脸图像对应的用户,则当前用户的身份验证不通过,网上支付失败。除此之外,本申请实施例提供的人脸识别方法,还可以应用于门禁系统、通过人脸识别完成登录的应用或者需要人脸识别来认证用户身份的其他系统中等,来通过人脸识别对用户的身份进行验证。
在一种可能实现方式中,如图1所示,本申请实施例提供的人脸识别模型11可以包括特征提取子模型101和预测子模型102。其中,特征提取子模型101和预测子模型102连接,特征提取子模型101用于提取人脸图像对应的特征图像和特征向量,预测子模型102用于根据特征图像获取对应的特征数值。
可选地,该特征提取子模型101包括特征提取层111和特征映射层121,特征提取层111与特征映射层121连接,特征提取层111用于根据人脸图像提取对应的特征图像,特征映射层121用于根据特征图像获取对应的特征向量。
在另一种可能实现方式中,如图2所示,本申请实施例提供的人脸识别模型22可以包括特征提取子模型201、预测子模型202和损失获取子模型203。
其中,特征提取子模型201与预测子模型202连接,特征提取子模型201还与损失获取子模型203连接,特征提取子模型201用于提取人脸图像对应的特征图像和特征向量,预测子模型202用于根据特征图像获取对应的特征数值,损失获取子模型203用于根据特征向量获取对应的损失值。
可选地,该特征提取子模型201包括特征提取层211和特征映射层221,特征提取层211与特征映射层221连接,特征提取层211用于根据人脸图像提取对应的特征图像,特征映射层221用于根据特征图像获取对应的特征向量。
图3是本申请实施例提供的一种人脸识别方法的流程图。本申请实施例的执行主体为计算机设备,参见图3,该方法包括以下步骤。
301、对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像及第一特征图像对应的第一特征向量。
计算机设备获取到目标人脸图像时,对该目标人脸图像进行特征提取,得到该目标人脸图像对应的第一特征图像,以及该第一特征图像对应的第一特征向量。
其中,第一特征图像是指表示目标人脸图像的特征的图像,例如人脸图像的特征可以包括人脸图像的深度特征、纹理特征、色彩特征等。第一特征向量是指表示目标人脸图像的特征的向量,例如该第一特征向量可以为多维向量。
302、对第一特征图像进行处理,得到第一特征图像对应的第一特征数值。
当计算机设备获取到目标人脸图像对应的第一特征图像,对该第一特征图像进行处理,得到该第一特征图像对应的第一特征数值。其中,第一特征数值用于表示第一特征图像描述目标人脸图像中人脸特征的不确定度。不确定度是指由于处理过程中存在误差,对处理结果的不可信赖的程度,能一定程度上代表第一特征图像能准确描述人脸特征的程度。该第一特征数值越小,表示该第一特征图像描述目标人脸图像中人脸特征的准确程度越大,该第一特征数值越大,表示该第一特征图像描述该目标人脸图像中人脸特征的准确程度越小。
303、根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、第二特征图像对应的第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度。
本申请实施例的人脸识别过程,是指对目标人脸图像和模板人脸图像进行识别,以确定该目标人脸图像是否与模板人脸图像匹配,其中模板人脸图像是指预先存储的人脸图像,目标人脸图像是指当前获取的、需要进行人脸识别的图像。为了将目标人脸图像与模板人脸图像进行匹配,计算机设备获取模板人脸图像的第二特征图像对应的第二特征向量以及该第二特征图像对应的第二特征数值,根据第一特征向量、第一特征数值、第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度。
其中,第二特征图像是指表示模板人脸图像的特征的图像,第一特征向量是指表示模板人脸图像的特征的向量。第二特征数值用于表示第二特征图像描述模板人脸图像中人脸特征的不确定度。
其中,目标人脸图像和模板人脸图像之间的相似度越大,表示目标人脸图像与模板人脸图像匹配的概率越大,目标人脸图像和模板人脸图像之间的相似度越小,表示目标人脸图像与模板人脸图像匹配的概率越小。
304、在相似度大于预设阈值的情况下,确定目标人脸图像与模板人脸图像匹配。
当计算机设备获取到目标人脸图像和模板人脸图像之间的相似度,将该相似度与预设阈值进行比较,若相似度大于该预设阈值,则确定目标人脸图像与模板人脸图像匹配,则人脸识别通过。若相似度不大于该预设阈值,则确定目标人脸图像与模板人脸图像不匹配,此时可以继续将目标人脸图像与下一个模板人脸图像进行匹配,直至确定目标人脸图像与某一模板人脸图像匹配,则人脸识别通过,或者直至确定目标人脸图像与存储的每个模板人脸图像均不匹配,则人脸识别失败。其中,该预设阈值可以由计算机设备默认设置,或者由开发人员通过计算机设备自行设置。
本申请实施例提供的方法,获取目标人脸图像对应的第一特征图像以及第一特征图像对应的第一特征向量和第一特征数值,根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下确定目标人脸图像与模板人脸图像匹配。由于第一特征数值表示第一特征图像描述目标人脸图像中人脸特征的不确定度,第二特征数值表示第二特征图像描述模板人脸图像中人脸特征的不确定度,因此在获取目标人脸图像和模板人脸图像之间的相似度时,还考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
图4是本申请实施例提供的另一种人脸识别方法的流程图。本申请实施例的执行主体为计算机设备,参见图4,该方法包括以下步骤。
401、计算机设备调用人脸识别模型中的特征提取层,对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像。
其中,该人脸识别模型可以为该计算机设备预先训练的模型,或者由其他设备训练好之后上传至该计算机设备中的模型。人脸识别模型是用于进行人脸识别的模型,该人脸识别模型包括特征提取子模型和预测子模型,特征提取子模型和预测子模型连接,特征提取子模型用于提取人脸图像的特征图像和特征向量,预测子模型用于根据特征图像获取特征数值。该特征提取子模型包括特征提取层和特征映射层,特征提取层与特征映射层连接,特征提取层用于根据人脸图像提取对应的特征图像,特征映射层用于根据特征图像获取对应的特征向量。
当计算机设备获取到待识别的目标人脸图像时,调用该人脸识别模型中的特征提取层,对该目标人脸图像进行特征提取,得到该目标人脸图像对应的第一特征图像。其中,本申请实施例中的特征提取层,可以将目标人脸图像的特征映射到超球面空间中,得到该目标人脸图像对应的第一特征图像,使得该第一特征图像中所表示的特征符合超球面空间的分布。超球面空间是指高于二维的球面空间,该超球面空间的半径可以由计算机设备默认设置。由于相比于二维的欧式空间,超球面空间更加符合人脸的特征空间,因此在超球面空间上对人脸图像进行特征提取可以使提取到的人脸特征更加准确。
在一种可能实现方式中,该特征提取层可以为卷积神经网络(CNN,ConvolutionalNeural Network),该卷积神经网络可以执行卷积(Convolution)计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。或者,该特征提取层还可以为其他形式的网络,本申请实施例对此不做限定。
其中,第一特征图像是指表示目标人脸图像的特征的图像,例如人脸图像的特征可以包括人脸图像的深度特征、纹理特征、色彩特征等。
在一种可能实现方式中,计算机设备通过配置的摄像头采集当前场景下的人脸图像,将该人脸图像作为目标人脸图像,或者将人脸图像进行裁剪处理得到目标人脸图像。可选地,当用户需要进行人脸识别时,触发对人脸识别的操作,计算机设备检测到对人脸识别的触发操作,通过配置的摄像头进行拍摄,从而获取包括人脸的目标人脸图像。
在另一种可能实现方式中,计算机设备获取其他设备上传的目标人脸图像,或者该计算机设备可以从其他设备中下载该目标人脸图像,或者,还可以采用其他方式获取该目标人脸图像,本申请实施例对此不做限定。
402、计算机设备调用人脸识别模型中的特征映射层,对第一特征图像进行特征映射,得到第一特征图像对应的第一特征向量。
人脸识别模型中的特征映射层和特征提取层连接,该特征映射层用于根据特征图像获取对应的特征向量。可选地,该特征映射层可以为全连接映射网络,或者该特征映射层还可以为其他形式的网络,本申请实施例对此不做限定。
当计算机设备获取到目标人脸图像对应的第一特征图像,则调用人脸识别模型中的特征映射层,对该第一特征图像进行特征映射,得到该第一特征图像对应的第一特征向量。其中,该第一特征向量由该第一特征图像映射得到,该第一特征向量是指用于表示目标人脸图像的特征的向量,可以为多维向量,例如该第一特征向量为1×n维的向量,则第一特征向量中包括n个维度的特征值。
需要说明的是,本申请实施例中,人脸识别模型中的特征提取子模型包括特征提取层和特征映射层,因此上述步骤401-402,以特征提取层对目标人脸图像进行处理和特征映射层对第一特征图像进行处理为例,说明得到目标人脸图像对应的第一特征图像及第一特征图像对应的第一特征向量的过程。而在另一实施例中,特征提取子模型还可以为其他形式的子模型,仅需保证通过调用该特征提取子模型对目标人脸图像进行特征提取,可以得到第一特征图像以及第一特征向量即可。
403、计算机设备调用人脸识别模型中的预测子模型,对第一特征图像进行处理,得到第一特征图像对应的第一特征数值。
其中,人脸识别模型中的预测子模型与特征提取子模型连接,该预测子模型用于对特征图像进行处理得到对应的特征数值。本申请实施例中,特征提取子模型包括特征提取层和特征映射层,则该预测子模型与该特征提取子模型中的特征提取层连接。可选地,该预测子模型可以为卷积神经网络(CNN,Convolutional Neural Network),该卷积神经网络可以为多个全连接层相连接的网络,或者该卷积神经网络可以为ResNet(Residual Net,残差网络)形式的网络等,本申请实施例对此不做限定。
当计算机设备获取到目标人脸图像对应的第一特征图像,则调用该预测子模型对第一特征图像进行处理,得到该第一特征图像对应的第一特征数值。其中,第一特征数值用于表示第一特征图像描述目标人脸图像中人脸特征的不确定度,不确定度是指由于处理过程中存在误差,对处理结果的不可信赖的程度,能一定程度上代表第一特征图像能准确描述人脸特征的程度。该第一特征数值越小,表示该第一特征图像描述目标人脸图像中人脸特征的准确程度越大,该第一特征数值越大,表示该第一特征图像描述该第一人脸图像中人脸特征的准确程度越小。可选地,该第一特征图像为人脸图像映射在超球面空间的特征图像,该第一特征图像中所表示的特征符合超球面空间的分布,则该第一特征数值也为符合超球面空间的分布的第一特征数值,用于表示超球面空间的第一特征图像描述目标人脸图像中人脸特征的不确定度。
需要说明的是,本申请实施例中,仅以先执行步骤402再执行步骤403为例进行说明,也即是先获取第一特征图像对应的第一特征向量,再获取第一特征图像对应的第一特征数值。而在另一实施例中,还可以先执行步骤403再执行步骤402,也即是先获取第一特征图像对应的第一特征数值,再获取第一特征图像对应的第一特征向量。
404、计算机设备调用特征提取层,对模板人脸图像进行特征提取,得到模板人脸图像对应的第二特征图像。
本申请实施例的人脸识别过程,是指对目标人脸图像和模板人脸图像进行识别,以确定该目标人脸图像是否与模板人脸图像匹配。其中模板人脸图像是指计算机设备预先存储的人脸图像,目标人脸图像是指计算机设备当前获取的需要进行人脸识别的图像。目标人脸图像与模板人脸图像匹配是指目标人脸图像中的人脸与模板人脸图像中的人脸属于同一个人。例如,以计算机设备中运行通过人脸识别进行登录的应用为例,当用户在该应用中注册帐号时,该用户输入人脸图像,则计算机设备将该人脸图像作为模板人脸图像并存储下来,后续通过该应用登录该帐号时即可根据该模板人脸图像对用户身份进行验证。或者,以通过人脸识别进行网上支付为例,当用户将网上支付的验证方式设置为人脸识别时,该用户输入人脸图像,则计算机设备将该人脸图像作为模板人脸图像并存储下来,后续进行网上支付时即可根据该模板人脸图像对用户身份进行验证。
因此,计算机设备获取预先存储的模板人脸图像,调用该人脸识别模型中的特征提取层,对该模板人脸图像进行特征提取,得到该模板人脸图像对应的第二特征图像,其中,第二特征图像是指表示模板人脸图像的特征的图像。其中,本申请实施例中的特征提取层,可以将模板人脸图像的特征映射到超球面空间中,得到该模板人脸图像对应的第二特征图像。该步骤404中的超球面空间与上述步骤401中的超球面空间相同。
405、计算机设备调用特征映射层,对第二特征图像进行特征映射,得到第二特征图像对应的第二特征向量。
当计算机设备获取到模板人脸图像对应的第二特征图像,则调用人脸识别模型中的特征映射层,对该第二特征图像进行特征映射,得到该第二特征图像对应的第二特征向量。其中,该第二特征向量是指用于表示模板人脸图像的特征的向量,可以为多维向量,例如该第二特征向量为1×n维的向量,则第二特征向量中包括n个维度的特征值。该第二特征向量由该第二特征图像映射得到。
需要说明的是,本申请实施例中人脸识别模型中的特征提取子模型包括特征提取层和特征映射层,因此步骤404-405以特征提取层对模板人脸图像进行处理和特征映射层对第二特征图像进行处理为例,说明得到模板人脸图像对应的第二特征图像及第二特征图像对应的第二特征向量的过程,而在另一实施例中,特征提取子模型还可以为其他形式的子模型,仅需保证通过该特征提取子模型对模板人脸图像进行特征提取,可以得到第二特征图像以及第二特征向量即可。
406、计算机设备调用预测子模型,对第二特征图像进行处理,得到第二特征图像对应的第二特征数值。
第二特征数值用于表示第二特征图像描述模板人脸图像中人脸特征的不确定度。该步骤406和上述步骤403类似,在此不再一一赘述。
需要说明的是,本申请实施例中,仅以先执行步骤405再执行步骤406为例进行说明,也即是先获取第二特征图像对应的第二特征向量,再获取第二特征图像对应的第二特征数值。而在另一实施例中,还可以先执行步骤406再执行步骤405,也即是先获取第二特征图像对应的第二特征数值,再获取第二特征图像对应的第二特征向量。
需要说明的是,本申请实施例中,仅以先执行步骤401-403再执行步骤404-406为例进行说明。而在另一实施例中,可以先执行步骤404-406,再执行步骤401-403。或者计算机设备在本次人脸识别之前,可以预先对模板人脸图像进行处理,得到模板人脸图像对应的第二特征向量和第二特征数值,将该第二特征向量和第二特征数值存储下来,则计算机无需再执行上述步骤404-406,直接获取存储的第二特征向量和第二特征数值即可。或者,计算机设备获取到待识别的目标人脸图像后,获取预先存储的模板人脸图像,将该目标人脸图像和模板人脸图像以图像对的形式同时输入至人脸识别模型中,由该人脸识别模型中分别对目标人脸图像和模板人脸图像进行处理,得到第一特征向量、第一特征数值、第二特征向量和第二特征数值。其中,该人脸识别模型的各个子模型可以对目标人脸图像和模板人脸图像进行并行处理,例如在人脸识别模型中的特征提取模型对目标人脸图像进行处理的同时,该人脸识别模型中的预测子模型可以对模板人脸图像进行处理,由此达到对目标人脸图像和模板人脸图像并行处理的效果,提高人脸识别模型的处理效率。
407、计算机设备根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、第二特征图像对应的第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度。
当计算机设备获取到第一特征向量、第一特征数值、第二特征向量和第二特征数值,则根据该第一特征向量、第一特征数值、第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度。其中,目标人脸图像和模板人脸图像之间的相似度越大,表示目标人脸图像中的人脸和模板人脸图像中的人脸属于同一个人的概率越大,也即是目标人脸图像与模板人脸图像匹配的概率越大;目标人脸图像和模板人脸图像之间的相似度越小,表示目标人脸图像中的人脸和模板人脸图像中的人脸属于同一个人的概率越小,也即是目标人脸图像与模板人脸图像匹配的概率越小。
在一种可能实现方式中,计算机设备采用相似度算法对第一特征向量、第一特征数值、第二特征向量和第二特征数值进行计算,得到目标人脸图像和模板人脸图像之间的相似度。可选地,该相似度算法如下:
Figure 823186DEST_PATH_IMAGE001
Figure 636945DEST_PATH_IMAGE002
表示目标人脸图像和模板人脸图像之间的相似度,
Figure 234149DEST_PATH_IMAGE003
表示目标人脸图像对应的第一特征数值,
Figure 409915DEST_PATH_IMAGE004
表示模板人脸图像对应的第二特征数值,i和j可以为正整数,用于指示目标人脸图像或者模板人脸图像,d表示特征映射层输出的特征向量的维数,r表示人脸图像的特征映射到的超球面空间中的半径。
其中,
Figure 725359DEST_PATH_IMAGE005
;其中,
Figure 746405DEST_PATH_IMAGE006
Figure 460764DEST_PATH_IMAGE007
Figure 73011DEST_PATH_IMAGE008
表示目标人脸图像对应的第一特征向量,
Figure 79013DEST_PATH_IMAGE009
表示模板人脸图像对应的第二特征向量。其中,
Figure 966067DEST_PATH_IMAGE010
为贝塞尔函数,该贝塞尔函数为
Figure 537862DEST_PATH_IMAGE011
,x表示目标人脸图像,m和
Figure 120678DEST_PATH_IMAGE012
均为该贝塞尔函数的预设参数,
Figure 348397DEST_PATH_IMAGE013
表示m的阶乘,
Figure 570300DEST_PATH_IMAGE014
表示伽玛函数。
408、计算机设备在相似度大于预设阈值的情况下,确定目标人脸图像与模板人脸图像匹配。
当计算机设备获取到目标人脸图像和模板人脸图像之间的相似度,将该相似度与预设阈值进行比较,若相似度大于该预设阈值,则确定目标人脸图像中的人脸和模板人脸图像中的人脸属于同一个人,也即是目标人脸图像与模板人脸图像匹配。若相似度不大于该预设阈值,则确定目标人脸图像中的人脸和模板人脸图像中的人脸不属于同一个人,也即是目标人脸图像与模板人脸图像不匹配。其中,该预设阈值可以根据实际应用场景中要求的人脸识别的误报率来确定,或者该预设阈值可以由计算机设备默认设置,或者由开发人员通过计算机设备自行设置。
在一种可能实现方式中,计算机设备采用判断算法对相似度进行判断,来确定目标人脸图像是否与模板人脸图像匹配。可选地,该判断算法如下:
Figure 199864DEST_PATH_IMAGE015
Figure 947722DEST_PATH_IMAGE016
为计算机设备的判断结果,
Figure 725054DEST_PATH_IMAGE017
为预设阈值。
需要说明的是,本申请实施例仅以计算机设备对目标人脸图像与一个模板人脸图片进行识别为例,说明人脸识别的过程。在另一实施例中,计算机设备存储有多个模板人脸图像,则计算机设备获取到待识别的目标人脸图像后,对多个模板人脸图像进行遍历,对遍历的每一个模板人脸图像执行图4所示的实施例的步骤,直至确定目标人脸图像与多个模板人脸图像中的某一模板人脸图像匹配,或者直至确定目标人脸图像与多个模板人脸图像中的任一模板人脸图像均不匹配。
图5为本申请实施例提供的另一种人脸识别方法的流程图,参见图5,将目标人脸图像5101输入特征提取层5201中得到第一特征图像5103,将模板人脸图像5102输入特征提取层5201中得到第二特征图像5104。
将第一特征图像5103输入至预测子模型5202中得到第一特征数值5105,将第二特征图像5104输入至预测子模型5202中得到第二特征数值5106。
将第一特征图像5103输入至特征映射层5203中得到第一特征向量5107,将第二特征图像5104输入至特征映射层5203中得到第二特征向量5108。
根据第一特征数值5105、第二特征数值5106、第一特征向量5107和第二特征向量5108,获取目标人脸图像5101和模板人脸图像5102之间的相似度5109,根据该相似度5109得出识别结果5110,即相似度5109大于预设阈值时,识别结果5110为目标人脸图像5101和模板人脸图像5102匹配;相似度5109不大于预设阈值时,识别结果5110为目标人脸图像5101和模板人脸图像5102不匹配。可选地,模板人脸图像对应人脸标识,人脸标识用于表示用户的身份,则当识别结果5110为目标人脸图像5101和模板人脸图像5102匹配时,识别结果5110中还包括该模板人脸图像5102对应的人脸标识,来表示该目标人脸图像5101为该人脸标识对应的用户的人脸图像。
图6为根据本申请实施例提供的方法以及根据相关技术提供的方法进行人脸识别的结果。参见图6,人脸图像601与人脸图像602匹配,人脸图像603与人脸图像604匹配,人脸图像605与人脸图像606匹配,人脸图像607与人脸图像608匹配。相关技术中的预设阈值为0.179,本申请中的预设阈值为-1373.377。
相关技术的方法得到人脸图像601与人脸图像602之间的相似度为
Figure 157172DEST_PATH_IMAGE018
,确定人脸图像601与人脸图像602不匹配,因此识别错误;本申请实施例的方法得到人脸图像601的特征数值为
Figure 437981DEST_PATH_IMAGE019
,人脸图像602的特征数值为
Figure 159336DEST_PATH_IMAGE020
,人脸图像601与人脸图像602之间的相似度为
Figure 627227DEST_PATH_IMAGE021
,确定人脸图像601与人脸图像602匹配,因此识别正确。相关技术的方法得到人脸图像603与人脸图像604之间的相似度为
Figure 190932DEST_PATH_IMAGE022
,确定人脸图像603与人脸图像604不匹配,因此识别错误;本申请实施例的方法得到人脸图像603的特征数值为
Figure 60668DEST_PATH_IMAGE023
,人脸图像604的特征数值为
Figure 150328DEST_PATH_IMAGE024
,人脸图像603与人脸图像604之间的相似度为
Figure 167832DEST_PATH_IMAGE025
,确定人脸图像603与人脸图像604匹配,因此识别正确。相关技术的方法得到人脸图像605与人脸图像606之间的相似度为
Figure 738490DEST_PATH_IMAGE026
,确定人脸图像605与人脸图像606不匹配,因此识别错误;本申请实施例的方法得到人脸图像605的特征数值为
Figure 728312DEST_PATH_IMAGE027
,人脸图像606的特征数值为
Figure 322629DEST_PATH_IMAGE028
,人脸图像605与人脸图像606之间的相似度为
Figure 561849DEST_PATH_IMAGE029
,确定人脸图像605与人脸图像606匹配,因此识别正确。相关技术的方法得到人脸图像607与人脸图像608之间的相似度为
Figure 550182DEST_PATH_IMAGE030
,确定人脸图像607与人脸图像608不匹配,因此识别错误;本申请实施例的方法得到人脸图像607的特征数值为
Figure 253565DEST_PATH_IMAGE031
,人脸图像608的特征数值为
Figure 750274DEST_PATH_IMAGE032
,人脸图像607与人脸图像608之间的相似度为
Figure 682982DEST_PATH_IMAGE033
,确定人脸图像607与人脸图像608匹配,因此识别正确。根据上述识别结果可知,与相关技术相比,采用本申请实施例提供的方法进行人脸识别,可以提高人脸识别的准确率。
需要说明的是,本申请实施例仅以计算机设备调用人脸识别模型中的特征提取子模型和预测子模型对图像进行处理为例来说明。在另一实施例中,计算机设备可采用其他方式,实现对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像及第一特征图像对应的第一特征向量,对第一特征图像进行处理,得到第一特征图像对应的第一特征数值。
本申请实施例提供的方法,调用人脸识别模型中的特征提取子模型和预测子模型,获取第一特征图像对应的第一特征向量和第一特征数值,根据第一特征向量、第一特征数值以及模板人脸图像对应的第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下,确定目标人脸图像与模板人脸图像匹配。由于第一特征数值表示第一特征图像描述目标人脸图像中人脸特征的不确定度,第二特征数值表示第二特征图像描述模板人脸图像中人脸特征的不确定度,因此在获取目标人脸图像和模板人脸图像之间的相似度时,还考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
并且,本申请实施例中,将目标人脸图像的特征映射到超球面空间中,得到该目标人脸图像对应的第一特征图像。由于相比于二维的欧式空间,超球面空间更加符合人脸的特征空间,因此在超球面空间上对人脸进行特征提取可以使提取到的人脸特征更加准确,可以进一步提高人脸识别的准确率。
在通过人脸识别模型进行人脸识别之前,需要先训练出人脸识别模型,训练过程详见下述实施例。
图7是本申请实施例提供的一种人脸识别模型训练方法的流程图。本申请实施例的执行主体为计算机设备,参见图7,该方法包括以下步骤。
701、计算机设备获取样本人脸图像和样本人脸图像对应的样本特征向量。
计算机设备获取用于训练人脸识别模型的样本人脸图像和样本人脸图像对应的样本特征向量。其中,样本人脸图像为包括人脸的图像,样本人脸图像对应的样本特征向量为用于表示样本人脸图像的特征的向量。例如,该样本特征向量可用于表示样本人脸图像所属的人脸标识,以用户1和用户2为例,包括用户1的人脸的任一样本人脸图像对应的样本特征向量均为样本特征向量a,包括用户2的人脸的任一样本人脸图像对应的样本特征向量均为样本特征向量b。
其中,样本人脸图像可以为计算机设备中预先存储的样本人脸图像,或者由计算机设备从其他设备中下载的样本人脸图像,还可以为开发人员或者其他设备上传至该计算机设备中的样本人脸图像。其中样本人脸图像对应的样本特征向量可以为开发人员为样本人脸图像所标注的样本特征向量,或者由其他方式得到的样本特征向量,本申请实施例对此不做限定。
702、计算机设备调用人脸识别模型中的特征提取层,对样本人脸图像进行特征提取,得到样本人脸图像对应的预测特征图像。
人脸识别模型是用于进行人脸识别的模型,该人脸识别模型包括特征提取子模型和预测子模型。其中,特征提取子模型与预测子模型连接,特征提取子模型用于提取人脸图像对应的特征图像和特征向量,预测子模型用于根据特征图像获取对应的特征数值。其中,该特征提取子模型包括特征提取层和特征映射层,特征提取层与特征映射层连接,特征提取层用于根据人脸图像提取对应的特征图像,特征映射层用于根据特征图像获取对应的特征向量。在一种可能实现方式中,该特征提取层可以为卷积神经网络,该卷积神经网络可以执行卷积计算、非线性激活函数计算、池化计算等操作。或者,该特征提取层还可以为其他形式的网络,本申请实施例对此不做限定。
当计算机设备获取到样本人脸图像,则调用人脸识别模型中的特征提取层,对该样本人脸图像进行特征提取,得到该样本人脸图像对应的预测特征图像。该预测特征图像是指表示样本人脸图像的特征的图像。
其中,本申请实施例中的特征提取层,将样本人脸图像的特征映射到超球面空间中,得到该样本人脸图像对应的预测特征图像。超球面空间是指高于二维的球面空间。相比于二维的欧式空间,超球面空间更加符合人脸的特征空间,在超球面空间上对人脸进行特征提取可以使提取到的人脸特征更加准确。
703、计算机设备调用人脸识别模型中的特征映射层,对预测特征图像进行特征映射,得到预测特征图像对应的预测特征向量。
人脸识别模型中的特征映射层和特征提取层连接,该特征映射层用于根据特征图像获取对应的特征向量。可选地,该特征映射层可以为全连接映射网络,或者该特征映射层还可以为其他形式的网络,本申请实施例对此不做限定。
当计算机设备获取到样本人脸图像对应的预测特征图像,则调用人脸识别模型中的特征映射层,对该预测特征图像进行特征映射,得到该预测特征图像对应的预测特征向量。其中,该预测特征向量是指用于表示样本人脸图像的特征的向量,该预测特征向量由该预测特征图像映射得到。
需要说明的是,本申请实施例中,人脸识别模型中的特征提取子模型包括特征提取层和特征映射层,因此上述步骤702-703,以特征提取层对样本人脸图像进行处理和特征映射层对预测特征图像进行处理为例,说明得到样本人脸图像对应的预测特征图像及预测特征图像对应的预测特征向量的过程。而在另一实施例中,特征提取子模型还可以为其他形式的子模型,仅需保证通过该特征提取子模型对样本人脸图像进行特征提取,可以得到预测特征图像以及预测特征向量即可。
704、计算机设备根据预测特征向量和样本特征向量之间的差异,训练特征提取子模型。
其中,预测特征向量为通过人脸识别模型预测的表示样本人脸图像的特征的向量,样本特征向量为真实的表示样本人脸图像的特征的向量。因此,当计算机设备获取到预测特征向量和样本特征向量,则根据预测特征向量和样本特征向量之间的差异,来训练人脸识别模型中的特征提取子模型,也即是训练特征提取层和特征映射层,以使通过特征提取层和特征映射层得到的预测特征向量与样本特征向量的差异越来越小。
在一种可能实现方式中,计算机设备获取预测特征向量和样本特征向量之间的第一损失值,根据该第一损失值,训练特征提取子模型。其中,第一损失值表示预测特征向量和样本特征向量之间的差异。
可选地,计算机设备获取第一损失函数,根据第一损失函数对预测特征向量和样本特征向量进行计算,得到第一损失值。其中,第一损失函数是指用于获取预测特征向量和样本特征向量之间的损失的函数。
在另一种可能实现方式中,人脸识别模型还包括损失获取子模型,损失获取子模型与特征提取子模型连接。该损失获取子模型包括每个人脸标识对应的权重向量。计算机设备调用损失获取子模型,按照样本人脸图像所属人脸标识对应的权重向量对预测特征向量进行加权处理,得到预测特征向量对应的加权特征向量,获取加权特征向量和样本特征向量之间的第二损失值,根据第二损失值,训练特征提取子模型和损失获取子模型。其中,第二损失值表示加权特征向量和样本特征向量之间的差异。
损失获取子模型用于根据特征向量获取对应的损失值,该损失获取子模型与特征提取子模型连接,本申请实施例中,特征提取子模型包括特征提取层和特征映射层,则该损失获取子模型与该特征提取子模型中的特征映射层连接。该损失获取子模型可以为分类网络,如该分类网络可以为softmax(逻辑回归)网络或者各类添加margin(差额)类型的softmax网络,或者损失获取子模型还可以为其他形式,本申请实施例对此不做限定。
其中,每个人脸标识对应的权重向量用于表示该人脸标识对应的人脸图像对应的特征向量的权重,可选地,样本人脸图像对应的预测特征向量为1×n维的向量,则预测特征向量中包括n个维度的特征值。则人脸标识对应的权重向量也为1×n维的向量,权重向量中包括n个维度的权重值,n个维度的权重值分别表示对应的预测特征向量中每个维度的特征值的权重。
则计算机设备获取到样本人脸图像对应的预测特征图像后,在损失获取子模型包括的多个权重向量中,确定该样本人脸图像所属人脸标识对应的权重向量,调用损失获取子模型,按照该样本人脸图像所属人脸标识对应的权重向量,对预测特征向量进行加权处理,得到预测特征向量对应的加权特征向量。也即是将预测特征向量中每个维度的特征值,分别与权重向量中对应的权重值进行相乘,得到加权特征向量。可选地,损失获取子模型还包括第二损失函数。计算机设备获取第二损失函数,根据第二损失函数对加权特征向量和样本特征向量进行计算,得到第二损失值。其中,第二损失函数是指用于获取加权特征向量和样本特征向量之间的损失的函数。
在另一种可能实现方式中,计算机设备采用梯度下降法,对特征提取子模型和损失获取子模型进行优化,以达到训练特征提取子模型和损失获取子模型的目的。其中,该梯度下降法可以为随机梯度下降法、带动量项的随机梯度下降法、Adagrad法(AdaptiveGradient,自适应梯度下降法)等,本申请实施例对此不做限定。
需要说明的是,步骤701-704仅说明根据样本人脸图像获取预测特征向量,根据预测特征向量和样本特征向量之间的差异,训练特征提取子模型和损失获取子模型,由此实现根据样本人脸图像和样本人脸图像对应的样本特征向量,训练特征提取子模型。在另一实施例中计算机设备还可以采用其他方式,实现根据样本人脸图像和样本人脸图像对应的样本特征向量,训练特征提取子模型。
需要说明的是,本申请实施例中仅以根据一个样本特征图像和该样本特征图像对应的样本特征向量训练特征提取子模型和损失获取子模型为例进行说明。在实际训练过程中,计算机设备会根据多个样本人脸图像和该多个样本人脸图像对应的样本特征向量,训练特征提取子模型和损失获取子模型。其中,多个样本人脸图像之间的任两个样本人脸图像所属的人脸标识可以相同也可以不同。
在一种可能实现方式中,计算机设备获取多个样本人脸图像和该多个样本人脸图像对应的样本特征向量,将多个样本人脸图像同时输入至人脸识别模型中的特征提取层,由该人脸识别模型中分别对多个样本人脸图像进行处理,根据得到的预测特征向量和对应的样本特征向量,训练特征提取子模型和损失获取子模型。其中,该人脸识别模型中的特征提取子模型和损失获取子模型可以对多个样本人脸图像进行并行处理。例如多个样本人脸图像中包括第一样本人脸图像和第二样本人脸图像,在人脸识别模型中的损失获取子模型对第一样本人脸图像进行处理的同时,该人脸识别模型中的特征提取子模型可以对第二样本人脸图像进行处理,由此达到对多个样本人脸图像并行处理的效果,提高人脸识别模型的处理效率。
在另一种可能实现方式中,当训练特征提取子模型和损失获取子模型的迭代次数达到预设次数时,完成对特征提取子模型和损失获取子模型的训练。或者,当计算机设备获取的第一损失值或者第二损失值小于第一预设数值时,表示特征提取子模型和损失获取子模型的损失值收敛,则完成对特征提取子模型和损失获取子模型的训练。
需要说明的是,在另一实施例中,计算机设备中预先存储有训练好的特征提取子模型以及训练该特征提取子模型所用到的样本人脸图像,则计算机设备无需执行上述步骤701-704,仅需获取训练该特征提取子模型所用到的样本人脸图像,执行下述步骤705-707,完成对预测子模型的训练即可。
705、计算机设备获取样本人脸图像所属人脸标识的中心特征向量。
其中,每个人脸标识对应一个中心特征向量,该中心特征向量表示人脸标识对应的人脸特征。当计算机设备完成对人脸识别模型中的特征提取子模型和损失获取子模型的训练之后,计算机设备获取该样本人脸图像所属人脸标识的中心特征向量,该中心特征向量可用于表示该样本人脸图像中的人脸特征。
在一种可能实现方式中,计算机设备获取样本人脸图像所属人脸标识的多个人脸图像对应的特征向量,根据获取到的多个特征向量,确定中心特征向量。在训练特征提取子模型和损失获取子模型的过程中,计算机设备得到多个人脸图像对应的特征向量,则计算机设备确定该样本特征图像所属人脸标识的多个人脸图像,获取该多个人脸图像对应的多个特征向量,对获取到的该多个特征向量进行取均值操作,得到该样本人脸图像所属人脸标识对应的中心特征向量。
在另一种可能实现方式中,计算机设备获取样本人脸图像所属人脸标识对应的权重向量,将该样本人脸图像对应的权重向量确定为中心特征向量。
损失获取子模型包括每个人脸标识对应的权重向量。在训练特征提取子模型和损失获取子模型的过程中,会不断调整损失获取子模型中的每个权重向量,当训练完成时,损失获取子模型中包括训练后的每个权重向量。则计算机设备可以确定该样本人脸图像所属的人脸标识,从损失获取子模型中的多个权重向量中获取该人脸标识对应的权重向量,将该权重向量确定为该样本人脸图像所属人脸标识对应的中心特征向量。
706、计算机设备调用预测子模型,对预测特征图像进行处理,得到预测特征图像对应的预测特征数值。
预测特征数值用于表示预测特征图像描述样本人脸图像中人脸特征的不确定度。该步骤706与上述步骤403类似,在此不再一一赘述。
需要说明的是,本申请实施例仅以先执行步骤705,再执行步骤706为例进行说明,在另一实施例中,也可以先步骤执行706,再执行步骤705。
707、计算机设备根据预测特征向量、中心特征向量和预测特征数值,获取第三损失值,根据第三损失值,训练预测子模型。
当计算机设备获取到样本人脸图像对应的预测特征向量、中心特征向量和预测特征数值,根据预测特征向量、中心特征向量和预测特征数值获取第三损失值,根据该第三损失值训练人脸识别模型中的预测子模型,以使该预测子模型输出的预测特征图像对应的预测特征数值更加准确。其中,第三损失值表示预测特征图像对应的预测特征数值的损失。
在一种可能实现方式中,计算机设备获取第三损失函数,根据第三损失函数对预测特征向量、中心特征向量和预测特征数值进行计算,得到第三损失值。其中,第三损失函数是指用于获取预测特征数值的损失的函数。可选地,该第三损失函数的公式如下:
Figure 126602DEST_PATH_IMAGE034
其中,
Figure 294278DEST_PATH_IMAGE035
表示第三损失值,k表示预测特征数值,r表示人脸图像的特征映射到的超球空间中的半径,
Figure 165151DEST_PATH_IMAGE036
表示预测特征向量,
Figure 48138DEST_PATH_IMAGE037
表示预测特征向量的转置,
Figure 561028DEST_PATH_IMAGE038
表示样本人脸图像对应的中心特征向量,x表示当前的样本人脸图像,c表示样本人脸图像所属人脸标识对应的至少一个人脸图像,d表示特征映射层输出的特征向量的维数,
Figure 848789DEST_PATH_IMAGE039
为贝塞尔函数。
在另一种可能实现方式中,计算机设备根据预测特征向量和中心特征向量之间的距离,获取目标特征数值,根据目标特征数值和预测特征数值之间的差异,获取第三损失值。
由于预测特征数值用于表示样本特征图像描述人脸图像中人脸特征的不确定度,而实际应用场景中,计算机设备会根据特征图像对应的特征向量和特征数值获取人脸图像之间的相似度。因此,预测特征数值实质是需要表示样本人脸图像对应的预测特征向量与样本人脸图像对应的中心特征向量相匹配的不确定度,预测特征向量与中心特征向量之间的距离越小,预测特征向量与中心特征向量越相似,也即是预测特征向量与中心特征向量越匹配。
其中,计算机设备可以根据预测特征向量和中心特征向量之间的距离,获取目标特征数值,则该目标特征数值即可表示预测特征向量和中心特征向量相匹配的不确定度。预测特征向量和中心特征向量之间的距离越大,预测特征向量和中心特征向量相匹配的不确定度越大,也即是目标特征数值越大;预测特征向量和中心特征向量之间的距离越小,预测特征向量和中心特征向量相匹配的不确定度越小,也即是目标特征数值越小。
而在实际应用场景中无法得知待识别的人脸图像所属的人脸标识,因此也无法得知人脸图像对应的中心特征向量,因此计算机设备根据特征图像来获取特征数值。因此在预测子模型的训练过程中,需要保证预测子模型得到的预测特征数值可以表示样本人脸图像对应的预测特征向量与样本人脸图像对应的中心特征向量相匹配的不确定度,也即是需要保证预测特征数值与目标特征数值之间的差异较小。因此计算机设备可根据目标特征数值和预测特征数值之间的差异获取第三损失值,根据第三损失值训练预测子模型,以使该目标特征数值和预测特征数值之间的差异越来越小,使该预测子模型输出的预测特征数值越来越准确。
在另一种可能实现方式中,计算机设备采用梯度下降法,对预测子模型进行优化,以达到训练预测子模型的目的。其中,该梯度下降法可以为随机梯度下降法、带动量项的随机梯度下降法、Adagrad法(Adaptive Gradient,自适应梯度下降法)等,本申请实施例对此不做限定。其中,特征数值的优化梯度,可以为如下公式:
Figure 624984DEST_PATH_IMAGE040
,r表示人脸图像的特征映射到的超球空间中的半径,
Figure 998197DEST_PATH_IMAGE036
表示样本人脸图像对应的预测特征向量,
Figure 786549DEST_PATH_IMAGE037
表示预测特征向量的转置,
Figure 663238DEST_PATH_IMAGE041
表示样本人脸图像对应的中心特征向量,x表示当前的样本人脸图像,c表示样本人脸图像所属人脸标识对应的至少一个人脸图像,d表示特征映射层输出的特征向量的维数,
Figure 141493DEST_PATH_IMAGE042
Figure 533160DEST_PATH_IMAGE043
为贝塞尔函数。
需要说明的是,通过执行上述步骤705-707,实现了在保持训练后的特征提取子模型不变的情况下,根据样本特征向量和样本人脸图像所属人脸标识的中心特征向量,训练预测子模型。在另一实施例中,计算机设备还可以采用其他方式,根据样本特征向量和中心特征向量,训练预测子模型。
需要说明的是,本申请实施例还可以采用其他具有闭式解的空间分布对超球面空间的特征分布进行建模,来减少人脸识别模型的训练过程。
本申请实施例提供的方法中,将训练人脸识别模型分为特征提取子模型的训练阶段和预测子模型的训练阶段。在一种可能实现方式中,将获取相似度的功能封装为相似度获取模块,将比较相似度与预设阈值的功能封装为阈值比较模块,则计算机设备可以将训练好的特征提取子模型、预测子模型以及相似度获取模块和阈值比较模块进行部署,得到人脸识别模型。图8是本申请实施例提供的一种训练模型和部署模型的流程图,参见图8,步骤如下:801、训练特征提取层与特征映射层;802、训练预测子模型;803、将特征提取层、特征映射层、预测子模型、相似度获取模块、阈值比较模块进行组合,构成人脸识别模型。
图9是本申请实施例提供的一种训练特征提取子模型的流程图,其中图9将训练特征提取子模型的步骤分为多个模块来进行说明,参见图9,样本数据准备模块901用于获取样本人脸图像和样本人脸图像对应的样本特征向量;特征提取模块902用于调用特征提取层对样本特征图像进行处理得到预测特征图像,特征映射模块903用于调用特征映射层对预测特征图像进行处理得到预测特征向量,损失获取模块904用于对预测特征向量和样本特征向量进行处理得到损失值。获取到损失值时判断当前是否满足终止训练模型的条件,若满足,则完成对特征提取子模型的训练,若不满足,则通过优化模块905对特征提取模块902中的特征提取层的参数以及特征映射模块903中的特征映射层的参数进行优化。其中,终止训练模型的条件为迭代次数达到预设次数或者损失值小于预设数值。
图10本申请实施例提供的一种训练预测子模型的流程图,其中图10将训练预测子模型的步骤分为多个模块来进行说明,参见图10,中心特征向量获取模块1001用于获取样本人脸图像所属人脸标识对应的中心特征向量,样本数据准备模块1002用于获取样本人脸图像,特征提取模块1003用于调用特征提取层对样本人脸图像进行处理得到预测特征图像,特征映射模块1004用于调用特征映射层对预测特征图像进行处理得到预测特征向量,预测模块1005用于调用预测子模型对预测特征图像进行处理得到预测特征数值,损失值获取模块1006用于根据中心特征向量、预测特征向量和预测特征数值,获取预测特征数值对应的损失值。获取到损失值时判断当前是否满足终止训练模型的条件,若满足,则完成对预测子模型的训练,若不满足,则通过优化模块1007对预测模块1005中的预测子模型的参数进行优化。其中,终止训练模型的条件为迭代次数达到预设次数或者损失值小于预设数值。
本申请实施例提供的方法,获取样本人脸图像和样本人脸图像对应的样本特征向量,调用特征提取子模型提取样本人脸图像的预测特征图像和预测特征向量,根据预测特征向量和样本特征向量之间的差异,训练特征提取子模型。获取样本人脸图像所属人脸标识的中心特征向量,调用预测子模型获取预测特征图像对应的预测特征数值,根据预测特征向量、中心特征向量和预测特征数值获取第三损失值, 根据第三损失值训练预测子模型。后续即可通过包括该特征提取子模型和预测子模型的人脸识别模型进行人脸识别,由于引入预测子模型,因此在获取目标人脸图像和模板人脸图像之间的相似度时,还考虑了预测子模型输出的特征数值对相似度的影响,也即是考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
并且,根据样本人脸图像和样本人脸图像对应的样本特征向量,训练特征提取子模型,在保持训练后的特征提取子模型不变的情况下,根据样本特征向量和样本人脸图像所属人脸标识的中心特征向量,训练预测子模型。因此对人脸识别模型的训练过程可以分为特征提取子模型的训练阶段和预测子模型的训练阶段,则在特征提取子模型训练好的情况下,仅需获取训练该特征提取子模型的样本人脸图像,对预测子模型进行训练即可,无需重新训练新的特征提取子模型,也无需重新收集样本人脸图像。
并且,本申请实施例中,将样本人脸图像的特征映射到超球面空间中,得到该样本人脸图像对应的预测特征图像。由于相比于二维的欧式空间,超球面空间更加符合人脸的特征空间,因此在超球面空间上对人脸进行特征提取可以使提取到的人脸特征更加准确,可以提高训练得到的人脸识别模型进行人脸识别时的准确率。
图11是本申请实施例提供的一种人脸识别装置的结构示意图。参见图11,该装置包括:
特征提取模块1101,用于对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像及第一特征图像对应的第一特征向量;
特征数值获取模块1102,用于对第一特征图像进行处理,得到第一特征图像对应的第一特征数值,第一特征数值用于表示第一特征图像描述目标人脸图像中人脸特征的不确定度;
相似度获取模块1103,用于根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、第二特征图像对应的第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,第二特征数值用于表示第二特征图像描述模板人脸图像中人脸特征的不确定度;
确定模块1104,用于在相似度大于预设阈值的情况下,确定目标人脸图像与模板人脸图像匹配。
本申请实施例提供的装置,获取目标人脸图像对应的第一特征图像以及第一特征图像对应的第一特征向量和第一特征数值,根据第一特征向量、第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量和第二特征数值,获取目标人脸图像和模板人脸图像之间的相似度,在相似度大于预设阈值的情况下确定目标人脸图像与模板人脸图像匹配。由于第一特征数值表示第一特征图像描述目标人脸图像中人脸特征的不确定度,第二特征数值表示第二特征图像描述模板人脸图像中人脸特征的不确定度,因此在获取目标人脸图像和模板人脸图像之间的相似度时,还考虑了特征图像的不确定度对相似度的影响,而不是仅考虑特征图像对应的特征向量,因此可以有效避免由于人脸图像中存在干扰因素导致特征向量无法准确表示人脸的特征的情况,可以提高人脸识别的准确率,降低人脸识别的误判率。
可选地,参见图12,特征提取模块1101,包括:第一特征提取单元1111,用于调用人脸识别模型中的特征提取子模型,对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像及第一特征图像对应的第一特征向量。
可选地,参见图12,特征数值获取模块1102,包括:特征数值获取单元1112,用于调用人脸识别模型中的预测子模型,对第一特征图像进行处理,得到第一特征图像对应的第一特征数值。
可选地,参见图12,特征提取子模型包括特征提取层和特征映射层,第一特征提取单元1111,用于:调用特征提取层,对目标人脸图像进行特征提取,得到目标人脸图像对应的第一特征图像;调用特征映射层,对第一特征图像进行特征映射,得到第一特征图像对应的第一特征向量。
可选地,参见图12,装置还包括:第一训练模块1105,用于根据样本人脸图像和样本人脸图像对应的样本特征向量,训练特征提取子模型;第二训练模块1106,用于在保持训练后的特征提取子模型不变的情况下,根据样本特征向量和样本人脸图像所属人脸标识的中心特征向量,训练预测子模型。
可选地,参见图12,第一训练模块1105,包括:第一获取单元1115,用于获取样本人脸图像和样本人脸图像对应的样本特征向量;第二特征提取单元1125,用于调用特征提取子模型,对样本人脸图像进行特征提取,得到样本人脸图像对应的预测特征图像及预测特征图像对应的预测特征向量;第一训练单元1135,用于根据预测特征向量和样本特征向量之间的差异,训练特征提取子模型。
可选地,参见图12,特征提取子模型包括特征提取层和特征映射层,第二特征提取单元1125,还用于:调用特征提取层,对样本人脸图像进行特征提取,得到样本人脸图像对应的预测特征图像;调用特征映射层,对预测特征图像进行特征映射,得到预测特征图像对应的预测特征向量。
可选地,参见图12,第一训练单元1135,还用于:获取预测特征向量和样本特征向量之间的第一损失值,第一损失值表示预测特征向量和样本特征向量之间的差异;根据第一损失值,训练特征提取子模型。
可选地,参见图12,人脸识别模型还包括损失获取子模型,损失获取子模型包括每个人脸标识对应的权重向量,第一训练单元1135,还用于:调用损失获取子模型,按照样本人脸图像所属人脸标识对应的权重向量对预测特征向量进行加权处理,得到预测特征向量对应的加权特征向量;获取加权特征向量和样本特征向量之间的第二损失值,第二损失值表示加权特征向量和样本特征向量之间的差异;根据第二损失值,训练特征提取子模型和损失获取子模型。
可选地,参见图12,第二训练模块1106,包括:第二获取单元1116,用于获取样本人脸图像所属人脸标识的中心特征向量,中心特征向量表示人脸标识对应的人脸特征;特征数值获取单元1126,用于调用预测子模型,对预测特征图像进行处理,得到预测特征图像对应的预测特征数值,预测特征数值用于表示预测特征图像描述样本人脸图像中人脸特征的不确定度;损失值获取单元1136,用于根据预测特征向量、中心特征向量和预测特征数值,获取第三损失值,第三损失值表示预测特征图像对应的预测特征数值的损失;第二训练单元1146,用于根据第三损失值,训练预测子模型。
可选地,参见图12,损失值获取单元1136,还用于:根据预测特征向量和中心特征向量之间的距离,获取目标特征数值;根据目标特征数值和预测特征数值之间的差异,获取第三损失值。
可选地,参见图12,第二获取单元1116,还用于:获取样本人脸图像所属人脸标识的多个人脸图像对应的特征向量;根据获取到的多个特征向量,确定中心特征向量。
可选地,参见图12,第二获取单元1116还用于:获取样本人脸图像所属人脸标识对应的权重向量; 将样本人脸图像对应的权重向量确定为中心特征向量。
可选地,参见图12,特征提取模块1101,还用于对模板人脸图像进行特征提取,得到模板人脸图像对应的第二特征图像及第二特征图像对应的第二特征向量;特征数值获取模块1102,还用于对第二特征图像进行处理,得到第二特征图像对应的第二特征数值。
可选地,参见图12,第一特征提取单元1111,还用于调用人脸识别模型中的特征提取子模型,对模板人脸图像进行特征提取,得到模板人脸图像对应的第二特征图像及第二特征图像对应的第二特征向量。
可选地,参见图12,特征数值获取单元1112,还用于调用人脸识别模型中的预测子模型,对第二特征图像进行处理,得到第二特征图像对应的第二特征数值。
可选地,参见图12,特征提取子模型包括特征提取层和特征映射层,第一特征提取单元1111还用于:调用特征提取层,对模板人脸图像进行特征提取,得到模板人脸图像对应的第二特征图像;调用特征映射层,对第二特征图像进行特征映射,得到第二特征图像对应的第二特征向量。
需要说明的是:上述实施例提供的人脸识别装置在进行人脸识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的人脸识别装置与人脸识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图13示出了本申请一个示例性实施例提供的终端1300的结构示意图。终端1300可以用于执行上述人脸识别方法中计算机设备所执行的步骤。
通常,终端1300包括有:处理器1301和存储器1302。
处理器1301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1301可以在集成有GPU(Graphics Processing Unit,图像处理的交互器), GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1302还包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中存储器1302中的非暂态的计算机可读存储介质用于存储至少一条指令,该至少一条指令用于被处理器1301所具有以实现本申请中方法实施例提供的人脸识别方法。
在一些实施例中,终端1300还可选包括有:外围设备接口1303和至少一个外围设备。处理器1301、存储器1302和外围设备接口1303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1303相连。具体地,外围设备包括:射频电路1304、摄像头组件1305和电源1306中的至少一种。
外围设备接口1303可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器1301和存储器1302。在一些实施例中,处理器1301、存储器1302和外围设备接口1303被集成在同一芯片或电路板上;在一些其他实施例中,处理器1301、存储器1302和外围设备接口1303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1304包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1304可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
摄像头组件1305用于采集图像或视频。可选地,摄像头组件1305包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端1300的前面板,后置摄像头设置在终端1300的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1305还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
电源1306用于为终端1300中的各个组件进行供电。电源1306可以是交流电、直流电、一次性电池或可充电电池。当电源1306包括可充电电池时该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图13中示出的结构并不构成对终端1300的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图14是本申请实施例提供的一种服务器的结构示意图,该服务器1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)1401和一个或一个以上的存储器1402,其中,所述存储器1402中存储有至少一条指令,所述至少一条指令由所述处理器1401加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器1400可以用于执行上述人脸识别方法中计算机设备所执行的步骤。
本申请实施例还提供了一种用于人脸识别的计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条指令,该至少一条指令由处理器加载并执行,以实现上述实施例的人脸识别方法中所具有的操作。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,该至少一条指令由处理器加载并执行,以实现上述实施例的人脸识别方法中所具有的操作。
本申请实施例还提供了一种计算机程序,该计算机程序包括至少一条指令,该至少一条指令由处理器加载并执行,以实现上述实施例的人脸识别方法中所具有的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种人脸识别方法,其特征在于,所述方法包括:
根据样本人脸图像和所述样本人脸图像对应的样本特征向量,训练人脸识别模型中的特征提取子模型;
在保持训练后的特征提取子模型不变的情况下,根据所述样本特征向量和所述样本人脸图像所属人脸标识的中心特征向量,训练所述人脸识别模型中的预测子模型,所述中心特征向量表示所述人脸标识对应的人脸特征;
调用所述特征提取子模型,对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量;
调用所述预测子模型,对所述第一特征图像进行处理,得到所述第一特征图像对应的第一特征数值,所述第一特征数值用于表示所述第一特征图像描述所述目标人脸图像中人脸特征的不确定度;
根据所述第一特征向量、所述第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、所述第二特征图像对应的第二特征数值,获取所述目标人脸图像和所述模板人脸图像之间的相似度,所述第二特征数值用于表示所述第二特征图像描述所述模板人脸图像中人脸特征的不确定度;
在所述相似度大于预设阈值的情况下,确定所述目标人脸图像与所述模板人脸图像匹配。
2.根据权利要求1所述的方法,其特征在于,所述特征提取子模型包括特征提取层和特征映射层,所述调用所述特征提取子模型,对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量,包括:
调用所述特征提取层,对所述目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像;
调用所述特征映射层,对所述第一特征图像进行特征映射,得到所述第一特征图像对应的第一特征向量。
3.根据权利要求1所述的方法,其特征在于,所述根据样本人脸图像和所述样本人脸图像对应的样本特征向量,训练人脸识别模型中的特征提取子模型,包括:
获取所述样本人脸图像和所述样本人脸图像对应的样本特征向量;
调用所述特征提取子模型,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像及所述预测特征图像对应的预测特征向量;
根据所述预测特征向量和所述样本特征向量之间的差异,训练所述特征提取子模型。
4.根据权利要求3所述的方法,其特征在于,所述特征提取子模型包括特征提取层和特征映射层,所述调用所述特征提取子模型,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像及所述预测特征图像对应的预测特征向量,包括:
调用所述特征提取层,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像;
调用所述特征映射层,对所述预测特征图像进行特征映射,得到所述预测特征图像对应的预测特征向量。
5.根据权利要求3所述的方法,其特征在于,所述人脸识别模型还包括损失获取子模型,所述损失获取子模型包括每个人脸标识对应的权重向量,所述根据所述预测特征向量和所述样本特征向量之间的差异,训练所述特征提取子模型,包括:
调用所述损失获取子模型,按照所述样本人脸图像所属人脸标识对应的权重向量对所述预测特征向量进行加权处理,得到所述预测特征向量对应的加权特征向量;
获取所述加权特征向量和所述样本特征向量之间的第二损失值,所述第二损失值表示所述加权特征向量和所述样本特征向量之间的差异;
根据所述第二损失值,训练所述特征提取子模型和所述损失获取子模型。
6.根据权利要求3所述的方法,其特征在于,所述在保持训练后的特征提取子模型不变的情况下,根据所述样本特征向量和所述样本人脸图像所属人脸标识的中心特征向量,训练所述人脸识别模型中的预测子模型,包括:
获取所述样本人脸图像所属人脸标识的中心特征向量,所述中心特征向量表示所述人脸标识对应的人脸特征;
调用所述预测子模型,对所述预测特征图像进行处理,得到所述预测特征图像对应的预测特征数值,所述预测特征数值用于表示所述预测特征图像描述所述样本人脸图像中人脸特征的不确定度;
根据所述预测特征向量、所述中心特征向量和所述预测特征数值,获取第三损失值,所述第三损失值表示所述预测特征图像对应的预测特征数值的损失;
根据所述第三损失值,训练所述预测子模型。
7.根据权利要求6所述的方法,其特征在于,所述根据所述预测特征向量、所述中心特征向量和所述预测特征数值,获取第三损失值,包括:
根据所述预测特征向量和所述中心特征向量之间的距离,获取目标特征数值;
根据所述目标特征数值和所述预测特征数值之间的差异,获取所述第三损失值。
8.根据权利要求6所述的方法,其特征在于,所述获取所述样本人脸图像所属人脸标识的中心特征向量,包括:
获取所述样本人脸图像所属人脸标识的多个人脸图像对应的特征向量;
根据获取到的多个特征向量,确定所述中心特征向量。
9.根据权利要求6所述的方法,其特征在于,所述获取所述样本人脸图像所属人脸标识的中心特征向量,包括:
获取所述样本人脸图像所属人脸标识对应的权重向量;
将所述样本人脸图像对应的权重向量确定为所述中心特征向量。
10.一种人脸识别装置,其特征在于,所述装置包括:
第一训练模块,用于根据样本人脸图像和所述样本人脸图像对应的样本特征向量,训练人脸识别模型中的特征提取子模型;
第二训练模块,用于在保持训练后的特征提取子模型不变的情况下,根据所述样本特征向量和所述样本人脸图像所属人脸标识的中心特征向量,训练所述人脸识别模型中的预测子模型,所述中心特征向量表示所述人脸标识对应的人脸特征;
特征提取模块,用于调用所述特征提取子模型,对目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像及所述第一特征图像对应的第一特征向量;
特征数值获取模块,用于调用所述预测子模型,对所述第一特征图像进行处理,得到所述第一特征图像对应的第一特征数值,所述第一特征数值用于表示所述第一特征图像描述所述目标人脸图像中人脸特征的不确定度;
相似度获取模块,用于根据所述第一特征向量、所述第一特征数值以及模板人脸图像的第二特征图像对应的第二特征向量、所述第二特征图像对应的第二特征数值,获取所述目标人脸图像和所述模板人脸图像之间的相似度,所述第二特征数值用于表示所述第二特征图像描述所述模板人脸图像中人脸特征的不确定度;
确定模块,用于在所述相似度大于预设阈值的情况下,确定所述目标人脸图像与所述模板人脸图像匹配。
11.根据权利要求10所述的装置,其特征在于,所述特征提取子模型包括特征提取层和特征映射层,所述特征提取模块,包括:
第一特征提取单元,用于:调用所述特征提取层,对所述目标人脸图像进行特征提取,得到所述目标人脸图像对应的第一特征图像;调用所述特征映射层,对所述第一特征图像进行特征映射,得到所述第一特征图像对应的第一特征向量。
12.根据权利要求10所述的装置,其特征在于,所述第一训练模块,包括:
第一获取单元,用于获取所述样本人脸图像和所述样本人脸图像对应的样本特征向量;
第二特征提取单元,用于调用所述特征提取子模型,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像及所述预测特征图像对应的预测特征向量;
第一训练单元,用于根据所述预测特征向量和所述样本特征向量之间的差异,训练所述特征提取子模型。
13.根据权利要求12所述的装置,其特征在于,所述特征提取子模型包括特征提取层和特征映射层,所述第二特征提取单元,还用于:调用所述特征提取层,对所述样本人脸图像进行特征提取,得到所述样本人脸图像对应的预测特征图像;调用所述特征映射层,对所述预测特征图像进行特征映射,得到所述预测特征图像对应的预测特征向量。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行,以实现如权利要求1至9任一所述的人脸识别方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行,以实现如权利要求1至9任一所述的人脸识别方法。
CN202010438831.2A 2020-05-22 2020-05-22 人脸识别方法、装置、计算机设备及存储介质 Active CN111340013B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010438831.2A CN111340013B (zh) 2020-05-22 2020-05-22 人脸识别方法、装置、计算机设备及存储介质
PCT/CN2021/085978 WO2021232985A1 (zh) 2020-05-22 2021-04-08 人脸识别方法、装置、计算机设备及存储介质
US17/744,260 US11816880B2 (en) 2020-05-22 2022-05-13 Face recognition method and apparatus, computer device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010438831.2A CN111340013B (zh) 2020-05-22 2020-05-22 人脸识别方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111340013A CN111340013A (zh) 2020-06-26
CN111340013B true CN111340013B (zh) 2020-09-01

Family

ID=71184961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010438831.2A Active CN111340013B (zh) 2020-05-22 2020-05-22 人脸识别方法、装置、计算机设备及存储介质

Country Status (3)

Country Link
US (1) US11816880B2 (zh)
CN (1) CN111340013B (zh)
WO (1) WO2021232985A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340013B (zh) 2020-05-22 2020-09-01 腾讯科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质
CN111985310B (zh) * 2020-07-08 2023-06-30 华南理工大学 一种用于人脸识别的深度卷积神经网络的训练方法
CN111915480B (zh) * 2020-07-16 2023-05-23 抖音视界有限公司 生成特征提取网络的方法、装置、设备和计算机可读介质
CN111767900B (zh) * 2020-07-28 2024-01-26 腾讯科技(深圳)有限公司 人脸活体检测方法、装置、计算机设备及存储介质
CN111931153B (zh) * 2020-10-16 2021-02-19 腾讯科技(深圳)有限公司 基于人工智能的身份验证方法、装置和计算机设备
CN112241764B (zh) * 2020-10-23 2023-08-08 北京百度网讯科技有限公司 图像识别方法、装置、电子设备及存储介质
CN114580948B (zh) * 2022-03-15 2022-11-04 河北雄安睿天科技有限公司 一种水务年度预算分析系统
CN115424330B (zh) * 2022-09-16 2023-08-11 郑州轻工业大学 一种基于dfmn和dsd的单模态人脸活体检测方法
CN117522951B (zh) * 2023-12-29 2024-04-09 深圳市朗诚科技股份有限公司 鱼类监测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1886748A (zh) * 2003-10-01 2006-12-27 奥森泰克公司 用于手指生物测量处理的方法以及相关的手指生物测量传感器
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN102254192A (zh) * 2011-07-13 2011-11-23 北京交通大学 基于模糊k近邻的三维模型半自动标注方法及系统
CN108805185A (zh) * 2018-05-29 2018-11-13 腾讯科技(深圳)有限公司 模型的训练方法、装置、存储介质及计算机设备
CN110232678A (zh) * 2019-05-27 2019-09-13 腾讯科技(深圳)有限公司 一种图像不确定度预测方法、装置、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059197A (ja) * 2006-08-30 2008-03-13 Canon Inc 画像照合装置、画像照合方法、コンピュータプログラム及び記憶媒体
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
JP5787845B2 (ja) * 2012-08-24 2015-09-30 株式会社東芝 画像認識装置、方法、及びプログラム
US9576221B2 (en) * 2014-07-09 2017-02-21 Ditto Labs, Inc. Systems, methods, and devices for image matching and object recognition in images using template image classifiers
CN104899579A (zh) * 2015-06-29 2015-09-09 小米科技有限责任公司 人脸识别方法和装置
US10043058B2 (en) * 2016-03-09 2018-08-07 International Business Machines Corporation Face detection, representation, and recognition
CN107633207B (zh) * 2017-08-17 2018-10-12 平安科技(深圳)有限公司 Au特征识别方法、装置及存储介质
FR3087032B1 (fr) * 2018-10-03 2020-09-25 Idemia Identity & Security France Procedes d'apprentissage de parametres d'un reseau de neurones a convolution, de detection d'elements d'interet visibles dans une image et d'association d'elements d'interet visibles dans une image
CN109522872A (zh) * 2018-12-04 2019-03-26 西安电子科技大学 一种人脸识别方法、装置、计算机设备及存储介质
CN110956079A (zh) * 2019-10-12 2020-04-03 深圳壹账通智能科技有限公司 人脸识别模型构建方法、装置、计算机设备和存储介质
CN111340013B (zh) * 2020-05-22 2020-09-01 腾讯科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1886748A (zh) * 2003-10-01 2006-12-27 奥森泰克公司 用于手指生物测量处理的方法以及相关的手指生物测量传感器
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN102254192A (zh) * 2011-07-13 2011-11-23 北京交通大学 基于模糊k近邻的三维模型半自动标注方法及系统
CN108805185A (zh) * 2018-05-29 2018-11-13 腾讯科技(深圳)有限公司 模型的训练方法、装置、存储介质及计算机设备
CN110232678A (zh) * 2019-05-27 2019-09-13 腾讯科技(深圳)有限公司 一种图像不确定度预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111340013A (zh) 2020-06-26
US11816880B2 (en) 2023-11-14
US20220270348A1 (en) 2022-08-25
WO2021232985A1 (zh) 2021-11-25

Similar Documents

Publication Publication Date Title
CN111340013B (zh) 人脸识别方法、装置、计算机设备及存储介质
CN109492627B (zh) 一种基于全卷积网络的深度模型的场景文本擦除方法
CN111914812B (zh) 图像处理模型训练方法、装置、设备及存储介质
CN111444826B (zh) 视频检测方法、装置、存储介质及计算机设备
CN111695596A (zh) 一种用于图像处理的神经网络以及相关设备
CN111598168B (zh) 图像分类方法、装置、计算机设备及介质
CN112329826A (zh) 图像识别模型的训练方法、图像识别方法和装置
CN111476783A (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN110472582B (zh) 基于眼部识别的3d人脸识别方法、装置和终端
CN114332530A (zh) 图像分类方法、装置、计算机设备及存储介质
CN113011387B (zh) 网络训练及人脸活体检测方法、装置、设备及存储介质
CN110866469A (zh) 一种人脸五官识别方法、装置、设备及介质
CN113569607A (zh) 动作识别方法、装置、设备以及存储介质
CN114783070A (zh) 活体检测模型的训练方法、装置、电子设备及存储介质
CN111597944B (zh) 活体检测方法、装置、计算机设备及存储介质
CN116152938A (zh) 身份识别模型训练和电子资源转移方法、装置及设备
CN111652878B (zh) 图像检测方法、装置、计算机设备及存储介质
CN112037305B (zh) 对图像中的树状组织进行重建的方法、设备及存储介质
CN114140841A (zh) 点云数据的处理方法、神经网络的训练方法以及相关设备
CN116704264B (zh) 动物分类方法、分类模型训练方法、存储介质及电子设备
CN113723164A (zh) 获取边缘差异信息的方法、装置、设备及存储介质
CN111008622A (zh) 一种图像对象检测方法、装置以及计算机可读存储介质
US20230419722A1 (en) Simulated capacitance measurements for facial expression recognition training
CN117011449A (zh) 三维面部模型的重构方法和装置、存储介质及电子设备
CN116824686A (zh) 一种动作识别方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024912

Country of ref document: HK