CN113033476B - 一种跨姿态人脸识别方法 - Google Patents

一种跨姿态人脸识别方法 Download PDF

Info

Publication number
CN113033476B
CN113033476B CN202110419091.2A CN202110419091A CN113033476B CN 113033476 B CN113033476 B CN 113033476B CN 202110419091 A CN202110419091 A CN 202110419091A CN 113033476 B CN113033476 B CN 113033476B
Authority
CN
China
Prior art keywords
face
image
recognized
face image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110419091.2A
Other languages
English (en)
Other versions
CN113033476A (zh
Inventor
鲁继文
王国利
周杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110419091.2A priority Critical patent/CN113033476B/zh
Publication of CN113033476A publication Critical patent/CN113033476A/zh
Application granted granted Critical
Publication of CN113033476B publication Critical patent/CN113033476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种跨姿态人脸识别方法,其中涉及人工智能技术领域,尤其涉及一种计算机视觉技术,方法包括:采集第一待识别人脸图像;将待识别人脸图像输入至预先构建的人脸生成网络,通过人脸生成网络获取第一待识别人脸图像的语义信息,并对第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,第二待识别人脸图像包含的人脸特征信息多于第一待识别人脸图像包含的人脸特征信息;将第二待识别人脸图像输入至人脸识别网络,通过人脸识别网络对第二待识别人脸图像进行人脸识别,以获得第二待识别人脸图像对应的人脸识别结果,解决现有技术中人脸识别方法在大角度情况下性能受限的问题的技术问题。

Description

一种跨姿态人脸识别方法
技术领域
本发明涉及人工智能技术领域,尤其涉及一种计算机视觉技术。
背景技术
人脸识别,是人工智能领域的重要研究课题,在智慧安防、智慧城市、智慧商业、智能金融和智能家居等领域,具有重要的应用前景和商业价值。日常生活中,低头、转脸等头部运动会造成姿态过大,从而造成人脸显著特征的缺失,会严重损害人脸识别方法的性能。
现如今,有代表性的跨姿态人脸识别方法,主要分为三类:
人脸旋转:
代表性工作有TP-GAN、FF-GAN、CAPG-GAN、PIM、3D-PIM和FFWM等。这类工作期望通过将侧脸转正的方式,一方面减小侧脸与正脸之间的差异,另一方面期望生成器能够在转正的过程中补充侧脸丢失的信息。然而,将大角度侧脸转正,涉及到巨大的几何形变和像素改变,在这样剧烈的变化过程中保持住身份信息是一件非常困难的事情。同时,为了提升效果,这类方法的生成器网络通常非常复杂。这两点极大地限制了人脸旋转方法的落地。
人脸几何校正:
代表性工作有Alignment Learning和GridFace等。这类工作往往在人脸识别模型前加入一个人脸几何校正网络,并和后端人脸识别模型同时进行end-to-end训练。由于后端人脸识别模型需要同时进行优化,需要在大规模人脸数据上重新进行训练,因此训练成本较高。同时,大角度人脸进行几何变换时保持住身份信息仍然较为困难。
特征映射:
代表性工作有DREAM。该方法从人脸识别模型学到的特征出发,对已经学错的特征重新进行变换,最终识别性能提升有限。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种一种跨姿态人脸识别方法,解决了现有人脸识别方法在大角度情况下性能受限的问题,极大的提升后端人脸识别模型的性能;
本发明的第二个目的在于提出一种跨姿态人脸识别装置;
本发明的第三个目的在于提出一种计算机设备;
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种跨姿态人脸识别方法,包括:
采集第一待识别人脸图像;
将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果。
可选地,在本申请实施例中,在所述将所述待识别人脸图像输入至预先构建的人脸生成网络之前,还包括:
获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络。
可选地,在本申请实施例中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
可选地,在本申请实施例中,所述人脸信息保持损失函数为:
Figure BDA0003027186030000021
其中,
Figure BDA0003027186030000022
分别表示输入图像
Figure BDA0003027186030000023
Figure BDA0003027186030000024
经过后端人脸识别网络提取到的特征。
Figure BDA0003027186030000025
Figure BDA0003027186030000026
经过人脸生成网络后生成的图像,
Figure BDA0003027186030000027
Figure BDA0003027186030000028
具有相同的人脸id信息,但是
Figure BDA0003027186030000029
是小角度人脸或正脸图像,
Figure BDA00030271860300000210
是大角度人脸图像。
为达上述目的,本发明第二方面实施例提出了一种跨姿态人脸识别装置,包括:
采集模块,用于采集第一待识别人脸图像;
处理模块,用于将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
识别模块,用于将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果。
可选地,在本申请实施例中,所述采集模块还用于获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络。
可选地,在本申请实施例中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
可选地,在本申请实施例中,所述人脸信息保持损失函数为:
Figure BDA0003027186030000031
其中,
Figure BDA0003027186030000032
分别表示输入图像
Figure BDA0003027186030000033
Figure BDA0003027186030000034
经过后端人脸识别网络提取到的特征。
Figure BDA0003027186030000035
Figure BDA0003027186030000036
经过人脸生成网络后生成的图像,
Figure BDA0003027186030000037
Figure BDA0003027186030000038
具有相同的人脸id信息,但是
Figure BDA0003027186030000039
是小角度人脸或正脸图像,
Figure BDA00030271860300000310
是大角度人脸图像。
为达上述目的,本申请的第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本申请实施例所述的方法。
为达上述目的,本申请的第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例所述的方法。
由此,本申请实施例提出的一种跨姿态人脸识别方法预先构建的人脸生成网络,通过预先构建的人脸生成网络获取第一待识别人脸图像的语义信息,并对第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,第二待识别人脸图像包含的人脸特征信息多于第一待识别人脸图像包含的人脸特征信息;将第二待识别人脸图像输入至人脸识别网络,通过人脸识别网络对第二待识别人脸图像进行人脸识别,以获得第二待识别人脸图像对应的人脸识别结果,从而解决现有技术中人脸识别方法在大角度情况下性能受限的问题的技术问题,提升已有的训练好的人脸识别器的识别精度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图;以及
图2是构建本发明实施例中人脸生成网络的一种构建实例。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的一种跨姿态人脸识别方法方法和装置。
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图。
针对这一问题,本发明实施例提供了一种跨姿态人脸识别方法,以解决现有人脸识别方法在大角度情况下性能受限的问题,如图1所示,该跨姿态人脸识别方法包括以下步骤:
采集第一待识别人脸图像;
将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果。
可选地,在本申请实施例中,在所述将所述待识别人脸图像输入至预先构建的人脸生成网络之前,还包括:
获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络。
可选地,在本申请实施例中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
可选地,在本申请实施例中,所述人脸信息保持损失函数为:
Figure BDA0003027186030000051
其中,
Figure BDA0003027186030000052
分别表示输入图像
Figure BDA0003027186030000053
Figure BDA0003027186030000054
经过后端人脸识别网络提取到的特征。
Figure BDA0003027186030000055
Figure BDA0003027186030000056
经过人脸生成网络后生成的图像,
Figure BDA0003027186030000057
Figure BDA0003027186030000058
具有相同的人脸id信息,但是
Figure BDA0003027186030000059
是小角度人脸或正脸图像,
Figure BDA00030271860300000510
是大角度人脸图像。
为了实现上述实施例,本发明还提出一种跨姿态人脸识别装置,包括:
采集模块,用于采集第一待识别人脸图像;
处理模块,用于将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
识别模块,用于将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果。
可选地,在本申请实施例中,所述采集模块还用于获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络。
可选地,在本申请实施例中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像。
可选地,在本申请实施例中,所述人脸信息保持损失函数为:
Figure BDA0003027186030000061
其中,
Figure BDA0003027186030000062
分别表示输入图像
Figure BDA0003027186030000063
Figure BDA0003027186030000064
经过后端人脸识别网络提取到的特征。
Figure BDA0003027186030000065
Figure BDA0003027186030000066
经过人脸生成网络后生成的图像,
Figure BDA0003027186030000067
Figure BDA0003027186030000068
具有相同的人脸id信息,但是
Figure BDA0003027186030000069
是小角度人脸或正脸图像,
Figure BDA00030271860300000610
是大角度人脸图像。
为了使本领域技术人员更好的理解本申请,现以一种基于图上下文学习的异常点检测方法为例;
下面参考附图描述本申请实施例的方法:
本申请的目的是解决现有人脸识别方法在大角度情况下性能受限的问题。通过在人脸识别模型前端加入一个轻量级的人脸生成网络,利用人脸信息保持损失函数监督、修正人脸生成网络输出的人脸图像语义信息,进而提升后端人脸识别模型的性能。
本申请提出了利用人脸生成网络提升跨姿态人脸识别性能的方法,可以有效提升已有方法在大角度下人脸识别的性能。
图1为本发明实施例所提供的一种跨姿态人脸识别方法的流程示意图;
本申请提出一种基于人脸生成的跨姿态人脸识别方法。具体地,首先构建一个前端人脸生成网络,在尽可能保持原像素的情况下修正输入人脸图像的语义信息;然后将重新生成后的人脸图像送入后端人脸识别方法进行人脸识别。训练过程中,后端识别网络保持不变,只利用人脸信息保持损失函数对前端人脸生成网络进行监督训练。
具体步骤如下:
S1:构建前端人脸生成网络
本发明首先构建一个前端网络,在尽可能保持原像素的情况下修正输入人脸图像的语义信息,如图1所示。图2是一种人脸生成网络的构建实例,可以采用更复杂的卷积神经网络构建方式。
S2:人脸识别
将重新生成的人脸图像送入已有的人脸识别方法,即可提升后端人脸识别方法对大角度人脸的识别精度。
S3:训练过程
训练过程中,后端人脸识别网络保持不变,使用人脸信息保持损失函数监督前端人脸生成网络的训练。具体地,人脸信息保持损失函数定义如下:
Figure BDA0003027186030000071
其中,
Figure BDA0003027186030000072
分别表示输入图像
Figure BDA0003027186030000073
Figure BDA0003027186030000074
经过后端人脸识别网络提取到的特征。
Figure BDA0003027186030000075
Figure BDA0003027186030000076
经过人脸生成网络后生成的图像,
Figure BDA0003027186030000077
Figure BDA0003027186030000078
具有相同的人脸id信息,但是
Figure BDA0003027186030000079
是小角度人脸或正脸图像,
Figure BDA00030271860300000710
是大角度人脸图像。
本申请构建轻量级的人脸生成网络,在尽可能保持原像素的情况下修正输入人脸图像的语义信息;
本申请利用人脸生成网络辅助后端人脸识别方法,训练过程中后端识别模型保持不变,只利用人脸信息保持损失函数对前端人脸生成网络进行监督训练。
图2是构建本发明实施例中人脸生成网络的一种构建实例;
在本申请实施例中,所述前端人脸生成网络可以进一步变化,如加宽、加深,预期可以获得更好的性能。
其中,所述前端人脸生成网络主要是由编码器、解码器和处理器构成;
进一步地,所述编码器将所述第一待识别人脸图像映射到一个高维特征图,所述解码器再将高维特征图恢复至与所述第一待识别人脸图像大小相同的所述第二待识别人脸图像,获得人脸图像需要修正的语义信息;
最后Processor对所述第一待识别人脸图像和修正的语义信息进行处理,获得修正后的所述第二待识别人脸图像;
所述Processor使用逐像素减法操作,但加法或其他方式也可以获得类似效果。
其中,图2中的参数解释如下:
Conv3x3 Block是一个核函数为3x3大小的卷积层,后面跟一个Leaky ReLU;Deconv2x2 Block是一个核函数为2x2大小的反卷积层,后面跟一个Leaky ReLU;Conv2D,1x1是一个核函数为1x1大小的卷积层;Inverted Residual Block是MobileNet v2提出的一种结构,膨胀因子设为1;Sigmoid就是Sigmoid激活函数;Subtraction是逐像素相减。
为了实现上述实施例,本申请的第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本申请实施例所述的方法。
为了实现上述实施例,本申请的第四方面实施例一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (4)

1.一种跨姿态人脸识别方法,其特征在于,包括:
采集第一待识别人脸图像;
将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果;
其中,在所述将所述待识别人脸图像输入至预先构建的人脸生成网络之前,还包括:
获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络;
其中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像;
其中,所述人脸信息保持损失函数为:
Figure FDA0003619089630000011
其中,
Figure FDA0003619089630000012
分别表示输入图像
Figure FDA0003619089630000013
Figure FDA0003619089630000014
经过后端人脸识别网络提取到的特征,
Figure FDA0003619089630000015
Figure FDA0003619089630000016
经过人脸生成网络后生成的图像,
Figure FDA0003619089630000017
Figure FDA0003619089630000018
具有相同的人脸id信息,但是
Figure FDA0003619089630000019
是小角度人脸或正脸图像,
Figure FDA00036190896300000110
是大角度人脸图像。
2.一种跨姿态人脸识别装置,其特征在于,包括:
采集模块,用于采集第一待识别人脸图像;
处理模块,用于将所述待识别人脸图像输入至预先构建的人脸生成网络,通过所述人脸生成网络获取所述第一待识别人脸图像的语义信息,并对所述第一待识别人脸图像的语义信息进行修正,根据修正后的语义信息生成第二待识别人脸图像,其中,所述第二待识别人脸图像包含的人脸特征信息多于所述第一待识别人脸图像包含的人脸特征信息;
识别模块,用于将所述第二待识别人脸图像输入至人脸识别网络,通过所述人脸识别网络对所述第二待识别人脸图像进行人脸识别,以获得所述第二待识别人脸图像对应的人脸识别结果;
其中,所述采集模块,还用于:
获取第一人脸图像样本和第二人脸图像样本,其中,所述第一人脸图像样本和第二人脸图像样本所属的用户ID信息相同;
将所述第一人脸图像样本和第二人脸图像样本输入至人脸识别网络,通过所述人脸识别网络对所述第一人脸图像样本和第二人脸图像样本进行人脸识别,以分别获得所述第一人脸图像样本对应的第一人脸特征,以及所述第二人脸图像样本对应的第二人脸特征;
根据所述第一人脸特征和所述第二人脸特征,采用人脸信息保持损失函数构建所述人脸生成网络;
其中,所述第一人脸图像样本包括用户的正面图像或小角度图像,所述第二人脸图像样本包括与所述用户的正面图像或小角度图像具有不同姿态的图像;
其中,所述人脸信息保持损失函数为:
Figure FDA0003619089630000021
其中,
Figure FDA0003619089630000022
分别表示输入图像
Figure FDA0003619089630000023
Figure FDA0003619089630000024
经过后端人脸识别网络提取到的特征,
Figure FDA0003619089630000025
Figure FDA0003619089630000026
经过人脸生成网络后生成的图像,
Figure FDA0003619089630000027
Figure FDA0003619089630000028
具有相同的人脸id信息,但是
Figure FDA0003619089630000029
是小角度人脸或正脸图像,
Figure FDA00036190896300000210
是大角度人脸图像。
3.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1中所述的方法。
4.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1中所述的方法。
CN202110419091.2A 2021-04-19 2021-04-19 一种跨姿态人脸识别方法 Active CN113033476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110419091.2A CN113033476B (zh) 2021-04-19 2021-04-19 一种跨姿态人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110419091.2A CN113033476B (zh) 2021-04-19 2021-04-19 一种跨姿态人脸识别方法

Publications (2)

Publication Number Publication Date
CN113033476A CN113033476A (zh) 2021-06-25
CN113033476B true CN113033476B (zh) 2022-08-12

Family

ID=76456876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110419091.2A Active CN113033476B (zh) 2021-04-19 2021-04-19 一种跨姿态人脸识别方法

Country Status (1)

Country Link
CN (1) CN113033476B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113689324B (zh) * 2021-07-06 2024-04-26 清华大学 一种基于二分类标签的人像物件的自动增删方法及装置
CN113392822B (zh) * 2021-08-18 2021-10-29 华中科技大学 基于特征分离表征学习的面部运动单元检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287880A (zh) * 2019-06-26 2019-09-27 西安电子科技大学 一种基于深度学习的姿态鲁棒性人脸识别方法
CN111860362A (zh) * 2020-07-24 2020-10-30 北京百度网讯科技有限公司 生成人脸图像校正模型及校正人脸图像的方法和装置
WO2021036436A1 (zh) * 2019-08-26 2021-03-04 苏宁易购集团股份有限公司 一种人脸识别方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287880A (zh) * 2019-06-26 2019-09-27 西安电子科技大学 一种基于深度学习的姿态鲁棒性人脸识别方法
WO2021036436A1 (zh) * 2019-08-26 2021-03-04 苏宁易购集团股份有限公司 一种人脸识别方法及装置
CN111860362A (zh) * 2020-07-24 2020-10-30 北京百度网讯科技有限公司 生成人脸图像校正模型及校正人脸图像的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
VarGFaceNet: An Efficient Variable Group Convolutional Neural Network for Lightweight Face Recognition;Mengjia Yan et al.;《IEEE Xplore》;20200305;全文 *
多姿态人脸识别综述;邹国锋等;《模式识别与人工智能》;20150715(第07期);全文 *

Also Published As

Publication number Publication date
CN113033476A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN111062880B (zh) 一种基于条件生成对抗网络的水下图像实时增强方法
Logeshwaran et al. SVPA-the segmentation based visual processing algorithm (SVPA) for illustration enhancements in digital video processing (DVP)
EP4145384A1 (en) Image denoising method and apparatus, electronic device and storage medium
CN113033476B (zh) 一种跨姿态人脸识别方法
CN112132156A (zh) 多深度特征融合的图像显著性目标检测方法及系统
WO2021238420A1 (zh) 图像去雾方法、终端及计算机存储介质
CN114936605A (zh) 基于知识蒸馏的神经网络训练方法、设备及存储介质
US11574500B2 (en) Real-time facial landmark detection
CN110782406B (zh) 一种基于信息蒸馏网络的图像去噪方法及装置
CN114119987A (zh) 基于卷积神经网络的特征提取和描述子生成方法及系统
CN117809123B (zh) 一种双阶段图像的异常检测与重构方法及系统
CN113807354B (zh) 图像语义分割方法、装置、设备和存储介质
CN109829857A (zh) 一种基于生成对抗网络的倾斜图像的矫正方法及装置
CN116630286B (zh) 一种图像异常检测与定位的方法、装置、设备及存储介质
CN114862866B (zh) 标定板的检测方法、装置、计算机设备和存储介质
CN116524508A (zh) 表格类图像的矫正方法及装置、存储介质、计算机设备
CN110533749B (zh) 一种动态纹理视频生成方法、装置、服务器及存储介质
CN115861740A (zh) 工业检测中的样本生成方法、样本生成装置
CN115937825A (zh) 在线俯仰角估计的bev下鲁棒车道线生成方法及装置
CN111539462B (zh) 模仿生物视觉神经元的图像分类方法、系统、装置及介质
CN111435448B (zh) 图像显著性物体检测方法、装置、设备及介质
CN112464948A (zh) 一种基于仿生学的自然场景目标轮廓提取方法及系统
CN112329915A (zh) 模型训练方法、装置、计算机设备和存储介质
CN118226421B (zh) 基于反射率图的激光雷达-相机在线标定方法及系统
CN114494640B (zh) 一种用于三维识别的旋转不变性点云表示方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant