CN115359574A - 人脸活体检测及相应模型的训练方法、装置及存储介质 - Google Patents

人脸活体检测及相应模型的训练方法、装置及存储介质 Download PDF

Info

Publication number
CN115359574A
CN115359574A CN202210834250.XA CN202210834250A CN115359574A CN 115359574 A CN115359574 A CN 115359574A CN 202210834250 A CN202210834250 A CN 202210834250A CN 115359574 A CN115359574 A CN 115359574A
Authority
CN
China
Prior art keywords
face image
face
training
target
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210834250.XA
Other languages
English (en)
Inventor
王珂尧
张国生
岳海潇
冯浩城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210834250.XA priority Critical patent/CN115359574A/zh
Publication of CN115359574A publication Critical patent/CN115359574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • G06V40/45Detection of the body part being alive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/169Holistic features and representations, i.e. based on the facial image taken as a whole
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种人脸活体检测及相应模型的训练方法、装置及存储介质。涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别等场景。具体实现方案为:对待检测人脸图像进行预处理,获取目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;获取所述目标人脸图像的全局特征;基于全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。本公开的技术,能够有效地提高人脸活体检测的准确性。

Description

人脸活体检测及相应模型的训练方法、装置及存储介质
技术领域
本公开涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别等场景。尤其涉及一种人脸活体检测及相应模型的训练方法、装置及存储介质。
背景技术
人脸活体检测即区分一张图像是否为真人拍摄,是人脸识别系统的基础组成模块,保证人脸识别系统的安全性。
使用深度学习技术的人脸活体检测模型是当前该领域的主流方法,相比传统算法在精度上有大幅提升。现有技术中,人脸活体检测模型一个二分类的模型,可以预测输入的待检测图像为活体人脸的概率,进而可以依据概率的大小,确定该待检测图像为活体人脸还是攻击。例如,概率大于或者等于预设阈值时,认为该待检测图像为活体人脸,否则,若概率小于预设概率阈值时,认为该待检测图像为攻击。
发明内容
本公开提供了一种人脸活体检测及相应模型的训练方法、装置及存储介质。
根据本公开的一方面,提供了一种人脸活体检测方法,包括:
对待检测人脸图像进行预处理,得到目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;
获取所述目标人脸图像的全局特征;
基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。
根据本公开的另一方面,提供了一种活体人脸检测模型的训练方法,包括:
获取包括至少两条训练数据的训练数据组,所述训练数据包括训练人脸图像、以及对应的标签,所述标签用于标识真实人脸或者攻击,且所述标签用于标识攻击时,包括至少两级标签;
对所述训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;所述训练目标人脸图像中人脸区域的占比大于所述训练人脸图像中人脸区域的占比;
基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练。
根据本公开的再一方面,提供了一种人脸活体检测装置,包括:
预处理模块,用于对待检测人脸图像进行预处理,得到目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;
特征获取模块,用于获取所述目标人脸图像的全局特征;
人脸活体检测模块,用于基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。
根据本公开的又一方面,提供了一种活体人脸检测模型的训练装置,包括:
获取模块,用于获取包括至少两条训练数据的训练数据组,所述训练数据包括训练人脸图像、以及对应的标签,所述标签用于标识真实人脸或者攻击,且所述标签用于标识攻击时,包括至少两级标签;
预处理模块,用于对所述训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;所述训练目标人脸图像中人脸区域的占比大于所述训练人脸图像中人脸区域的占比;
训练模块,用于基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练。
根据本公开的再另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的再又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的又另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
根据本公开的技术,能够有效地提高人脸活体检测的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是根据本公开第三实施例的示意图;
图4是根据本公开第四实施例的示意图;
图5是根据本公开第五实施例的示意图;
图6是根据本公开第六实施例的示意图;
图7是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(TabletComputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
现有的技术的活体人脸检测模型为一个二分类的模型,非常容易过拟合。例如,在一张图经过压缩或其他方式扰动后再进行活体检测,活体人脸检测模型的输出分数波动很大。因此,现有的活体人脸检测模型进行活体人脸检测时准确性较差。
图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种人脸活体检测方法,包括:
S101、对待检测人脸图像进行预处理,得到目标人脸图像;目标人脸图像中人脸区域的占比大于待检测人脸图像中人脸区域的占比;
S102、获取目标人脸图像的全局特征;
S103、基于全局特征和预建立的特征库,对待检测人脸图像进行人脸活体检测。
本实施例中,可以对待检测的人脸图像进行预处理,得到目标人脸图像,可以使得目标人脸图像中人脸区域的占比大于待检测人脸图像中人脸区域的占比,进而能够提高后续人脸活体检测的准确性。
本实施例中预建立的特征库,可以包括很多条特征,每一条特征也是基于已知的真实人脸图像或者攻击人脸图像提取的全局特征。本实施例的攻击人脸图像的类型,可以包括电子屏幕攻击、纸质照片攻击、2D面具攻击和3D面具/头模/头套攻击等等。同时,本实施例的特征库中还可以包括每条特征对应的标签,标签可以为活体人脸、攻击和攻击类型。也就是说,在特征库中部分特征对应的标签为攻击类型。
本实施例中,以预建立的特征库中的特征为参考,可以基于目标人脸图像的全局特征,对该待检测人脸图像进行人脸活体检测。
本实施例的人脸活体检测方法,通过基于目标人脸图像的全局特征和预建立的特征库,对待检测的人脸图像进行人脸活体检测,能够避免现有的二分类人脸活体检测模型的过拟合的问题,有效地提高人脸活体检测的准确性。
图2是根据本公开第二实施例的示意图;如图1所示,本实施例提供一种人脸活体检测方法,在上述图1所示实施例的技术方案的基础上,进一步更加详细地描述本公开的技术方案。如图2所示,具体可以包括如下步骤:
S201、采用活体人脸检测模型提取至少两张人脸图像模板中各人脸图像模板的特征;
S202、基于各人脸图像模板的特征和对应的标签,建立特征库;
该步骤S201-S202为基于活体人脸检测模型、至少两张人脸图像模板与各人脸图像模板对应的第一标签,建立特征库的一种具体实现方式。其中该第一标签指示以下任意项:包括活体人脸、攻击、攻击类型。例如,若某个人脸图像模板的第一标签仅仅标注是攻击,而有的人脸图像模板的第一标签标注的是攻击的具体类型。
基于上述得到的特征库中包括有很多的人脸图像模板的特征以及对应的第一标签,为后续人脸活体检测提供了有效地支持。
S203、采用预先训练的人脸检测模型,获取待检测人脸图像中的人脸区域图像;
该人脸检测模型为预先训练好的,使用时,将待检测的人脸图像输入至该人脸检测模型中,该人脸检测模型可以去除人脸区域的背景,输出待检测的人脸图像中的人脸区域图像,得到的该人脸区域图像也是一张图片,该人脸区域图像可以直接作为目标人脸图像进行后续的人脸活体检测,能够减少背景信息的影响,提高后续人脸活体检测的准确性。
S204、将人脸区域图像输入人脸关键点检测模型进行关键点检测,得到待检测人脸图像的人脸区域中人脸关键点坐标;
本实施例中的人脸关键点检测模型用于对人脸中的预设数量的关键点进行检测。例如根据实际需求,可以设置人脸关键点检测模型能够检测出72个关键点,或者也可以检测出98个关键点,当然也可以设置其他数量的关键点,总之设置的关键点的预设数量越多,检测的目标人脸图像越准确。
具体使用时,将待检测的人脸图像的人脸区域的图片,输入至人脸关键点检测模型,该人脸关键点检测模型可以预测并输出该人脸区域中的预设数量的人脸关键点坐标。
可选地,本实施例中,也可以省去步骤S203,直接将待检测人脸图像输入人脸关键点检测模型进行关键点检测,得到待检测人脸图像的人脸区域中人脸关键点坐标。
S205、基于人脸关键点的坐标,对对应的目标人脸进行人脸对齐,得到对齐人脸图像;
S206、基于对齐人脸图像获取目标人脸图像;
例如,本实施例的人脸对齐,可以对人脸区域扩大预设数量倍数如三倍,同时根据指定的关键点如眼睛关键点进行旋正,使得人脸区域为正视镜头方向的人脸,可以提高后续人脸活体检测的准确性。
例如,本实施例中,步骤S206在具体实现时,可以直接将对齐人脸图像,作为目标人脸图像进行人脸活体检测。
或者步骤S206在具体实现时,还可以包括如下步骤:
(a)通过仿射变换截取对齐人脸图像中的第一人脸图像;
(b)将第一人脸图像的尺寸配置为预设尺寸,得到第二人脸图像;
(c)根据第二人脸图像获取所述目标人脸图像。
由于人脸对齐的过程中,对人脸区域扩大倍数了,对应的背景信息也会被放大,此时还可以进一步截去背景,提高人脸图像在目标人脸图像中的占比,与上述步骤S203的目的相似,能够进一步提高目标人脸图像的准确性。
本实施例中,为了便于统一处理,需要将得到人脸图像都调整到预设尺寸,如224x224,此时人脸关键点坐标也根据仿射变换矩阵重新映射到新的坐标。本实施例中,可以直接将得到的预设尺寸的第二人脸图像作为目标人脸图像。
进一步地,为了提高目标人脸图像的准确性,本实施例中,还可以第二人脸图像进行归一化处理,得到目标人脸图像。
本实施例中,图像归一化处理,指的是将图像中的每一个像素依次进行归一化处理。归一化处理的方法是:将图像中的每个像素减去第一数值,再除以第二数值,第二数值大于第一数值,目的是将图像中的所有像素的值固定在一个较小的范围内。如可以将每个像素的像素值减128再除以256,使每个像素的像素值在[-0.5,0.5]之间。通过上述图像归一化处理,可以将目标人脸图像中的像素值都限定在一个较小的区域范围内,进而可以提高后续人脸活体检测的准确性。
S207、基于预先训练的活体人脸检测模型,获取目标人脸区域图像的全局特征;
本实施例中,将目标人脸区域图像输入至该活体人脸检测模型中,该活体人脸检测模型可以输出全连接层之前得到的特征,即目标人脸区域图像的全局特征。目标人脸图像的全局特征可以为矩阵形式或者向量形式,能够准确地表征该目标人脸图像的特征信息。
例如本实施例中的全局特征可以为256维的特征。采用该方式获取的目标人脸区域图像的全局特征准确性较高。
S208、获取目标人脸图像的全局特征和特征库中的各目标特征之间的第一相似度;
S209、从多个第一相似度中获取最大的作为第二相似度;
S210、检测第二相似度是否大于或者等于预设阈值;若是,执行步骤S211;否则,执行步骤S212;
S211、响应于第二相似度大于或者等于预设阈值,待检测人脸图像的标签为第二相似度对应的目标特征的第一标签。
本实施例的预设阈值可以根据实际需求来设置,例如可以为90%、95%,或者其他百分比。
由于特征库中的各特征均为已知的真实人脸、已知攻击或者已知攻击类型的攻击,通过将待检测的人脸图像对应的全局特征与特征库中的各特征进行相似度计算,得到多个第一相似度,取其中最大的作为第二相似度。并在第二相似度大于或者等于预设阈值时,可以认为该第二相似度对应的特征与该全局特征最相似,那么,便可以将第二相似度对应的特征的标签,作为待检测人脸图像的标签,通过该方式,能够对待检测人脸图像金进行准确地人脸活体检测,且能够确保检测结果的准确性非常高。
S212、响应于第二相似度小于预设阈值,向审核平台发送待检测人脸图像;
S213、接收审核平台发送的待检测人脸图像的攻击类型;
S214、将待检测人脸图像的全局特征和对应的攻击类型,加入特征库。
本实施例的人脸活体检测方法,通过采用上述方式,能够避免现有的二分类人脸活体检测模型的过拟合的问题,有效地提高人脸活体检测的准确性。而且,还可以将无法识别的人脸图像发送至审核平台,以便于及时发现特征库检测不到的新的攻击类型。并将该新的攻击类型加入至特征库中,以便于后续能够给迅速防御相似类型的攻击,大大提高了对新型攻击的防御能力。
图3是根据本公开第三实施例的示意图;如图3所示,本实施例提供一种活体人脸检测模型的训练方法,包括:
S301、获取包括至少两条训练数据的训练数据组,训练数据训练人脸图像、以及对应的标签,标签用于标识真实人脸或者攻击,且标签用于标识攻击时,包括至少两级标签;
也就是说,本实施例的训练人脸图像中包括的标签若是攻击,至少包括两级标签,如第一级攻击类型仅标识属于攻击,第二级攻击类型可以具体的攻击类型,如电子屏幕攻击、纸质照片攻击、2D面具攻击和3D面具/头模/头套攻击等等;若还包括第三级攻击类型时,是基于第二级攻击类型的细化的攻击类型,如电子屏幕攻击下还可以分不同操作系统的电子屏幕攻击等等。需要说明的是,本实施例的训练数据组中既要包括标签为真实人脸的正样本数据,又要包括标签为攻击的负样本数据。
S302、对训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;训练目标人脸图像中人脸区域的占比大于训练人脸图像中人脸区域的占比;
具体地,该步骤的具体实现方式,可以参考上述图2所示实施例的步骤S203-S206的相关记载。
S303、基于各训练目标人脸图像以及对应的标签,对活体人脸检测模型进行训练。
本实施例的活体人脸检测模型的训练方法,采用的训练数据中,若对应的标签用于标识攻击是,包括至少两级标签,进而可以实现更加精细的监督训练,能够训练到准确性更高的活体人脸检测模型。
下面以训练数据中的标签用于标识攻击时,仅包括两级标签为例,来描述活体人脸检测模型的训练。
对应地,此时步骤S303,具体可以包括如下步骤:
(1)将训练目标人脸图像输入至采用活体人脸检测模型,得到训练目标人脸图像的全局特征;
(2)基于训练目标人脸图像的全局特征和第一分类数量的全连接层,预测训练人脸图像对应的第一预测结果;
例如本实施例的第一分类数量可以为2分类。
(3)基于训练目标人脸图像的全局特征和第二分类数量的全连接层,预测训练人脸图像对应的第二预测结果;
第二分类数量可以为大于第一分类数量的其他数量,如可以为3、4、5或者其他数值,在此不做限定。具体根据第二级攻击标签的数量来确定。
(4)分别基于训练人脸图像的第一预测结果、第二预测结果和标签,构建第一损失函数和第二损失函数;
(5)基于训练数据组的不同训练目标人脸图像的全局特征,构建三元损失函数;
例如,可以基于第一预测结果和训练数据的第一级攻击标签构建第一损失函数,基于第二预测结果和训练数据的第二级攻击标签,构建第二损失函数。构建的三元损失函数,是为了让使得正样本之间的差距更小,正负样本之间的差距更大。其中正样本指的是标签是真实人脸的训练数据,负样本指的是标签标识的是攻击的训练数据。
对于训练数据组中的每一条训练数据,都需要采用上述步骤(1)-(4),获取每一条训练数据对应的第一损失函数和第二损失函数。对于训练数据组中的任意两条正负样本的训练数据,都需要采用步骤(5)计算相应的第三损失函数。
(6)检测第一损失函数、第二损失函数和第三损失函数之和得到的总损失函数是否收敛;若不收敛,执行步骤(7);若收敛,检测是否满足训练终止条件,若满足,则训练结束,确定活体人脸检测模型的参数,进而确定活体人脸检测模型。若不满足,返回步骤(1)选取下一组训练数据组开始进行训练。
这里的总损失函数,可以该训练数据组中的所有第一损失函数、第二损失函数和第三损失函数求和得到。当然,可以可选地,也可以为不同的损失函数配置不同的权重,进行加权求和得到。当然也可以基于训练数据组中的所有第一损失函数、第二损失函数和第三损失函数,按照其他数学计算方式,得到总损失函数,在此不做限定。
这里的训练终止条件可以为训练次数达到预设次数阈值,或者连续预设轮数的训练中,总损失函数始终收敛。
(7)调整活体人脸检测模型的参数,使得总损失函数朝向收敛的方向;返回步骤(1),继续选择下一组训练数据组,继续进行训练。
该训练方式,通过三个损失函数来监督活体人脸检测模型的训练,能够对活体人脸检测模型进行更好地监督训练,使得训练得到的活体人脸检测模型的准确性更高。
图4是根据本公开第四实施例的示意图;如图4所示,本实施例提供一种人脸活体检测装置400,包括:
预处理模块401,用于对待检测人脸图像进行预处理,得到目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;
特征获取模块402,用于获取目标人脸图像的全局特征;
人脸活体检测模块403,用于基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。
本实施例的人脸活体检测装置,通过采用上述模块实现人脸活体检测的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图5是根据本公开第五实施例的示意图;如图5所示,本实施例提供一种人脸活体检测装置500,包括上述图4所示的同名同功能模块:预处理模块501、特征获取模块502和人脸活体检测模块503。
在本实施例中,预处理模块501,用于:
将所述待检测人脸图像输入人脸关键点检测模型进行关键点检测,得到所述待检测人脸图像的人脸区域中人脸关键点坐标;
基于所述人脸关键点坐标,对对应的目标人脸进行人脸对齐,得到对齐人脸图像;
基于所述对齐人脸图像获取所述目标人脸图像。
进一步可选地,在本实施例中,预处理模块501,还用于:
通过仿射变换截取所述对齐人脸图像中的第一人脸图像;
将所述第一人脸图像的尺寸配置为预设尺寸,得到第二人脸图像;
根据所述第二人脸图像获取所述目标人脸图像通过仿射变换截取包含人脸区域的人脸图像,并调整到预设尺寸,作为所述目标人脸图像。
进一步可选地,在本实施例中,预处理模块501,还用于:
对所述第二人脸图像进行归一化处理,得到所述目标人脸图像。
进一步可选地,如图5所示,本实施例的人脸活体检测模型的训练装置500还包括:
建立模块504,用于基于预先训练的活体人脸检测模型、至少两张人脸图像模板和所述模板对应的第一标签,建立所述特征库,所述第一标签指示以下任意项:活体人脸、攻击、攻击类型。
进一步可选地,本实施例的建立模块504,用于:
采用所述活体人脸检测模型提取各所述人脸图像模板的特征;
基于各所述人脸图像模板的特征和对应的所述标签,建立所述特征库采用所述活体人脸检测模型提取所述模板的模板特征;
基于所述模板特征和对应的所述第一标签,建立所述特征库。
进一步可选地,本实施例的人脸活体检测模块503,用于:
获取所述全局特征和所述特征库中的各目标特征之间的第一相似度;
在所述第一相似度中获取最大的第二相似度;
响应于所述第二相似度大于或者等于预设阈值,所述待检测人脸图像的标签为所述第二相似度对应的所述目标特征的所述第一标签。
进一步可选地,如图5所示,本实施例的人脸活体检测模型的训练装置500还包括:
收发模块505,用于响应于所述第二相似度小于所述预设阈值,向审核平台发送所述待检测人脸图像;
收发模块505,用于接收所述审核平台发送的所述待检测人脸图像的攻击类型;
更新模块506,用于将所述全局特征和所述攻击类型,加入所述特征库。
本实施例的人脸活体检测装置,通过采用上述模块实现人脸活体检测的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图6是根据本公开第六实施例的示意图;如图6所示,本实施例提供一种活体人脸检测模型的训练装置600,包括:
获取模块601,用于获取包括至少两条训练数据的训练数据组,所述训练数据包括训练人脸图像、以及对应的标签,所述标签用于标识真实人脸或者攻击,且所述标签用于标识攻击时,包括至少两级标签;
预处理模块602,用于对所述训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;所述训练目标人脸图像中人脸区域的占比大于所述训练人脸图像中人脸区域的占比;
训练模块603,用于基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练。
本实施例的人脸活体检测模型的训练装置,通过采用上述模块实现人脸活体检测模型的训练的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
进一步地,在本公开的一个实施例中,训练模块603,用于:
将所述训练目标人脸图像输入至所述活体人脸检测模型,得到所述训练目标人脸图像的全局特征;
基于所述训练目标人脸图像的全局特征和第一分类数量的全连接层,预测所述训练人脸图像对应的第一预测结果;
基于所述训练目标人脸图像的全局特征和第二分类数量的全连接层,预测所述训练人脸图像对应的第二预测结果;
分别基于所述第一预测结果、所述第二预测结果和所述训练人脸图像的标签,构建第一损失函数和第二损失函数;
基于所述训练数据组的不同的所述训练目标人脸图像的全局特征,构建三元损失函数;
检测所述第一损失函数、所述第二损失函数和所述第三损失函数之和得到的总损失函数是否收敛;
若不收敛,调整所述活体人脸检测模型的参数。
上述实施例的人脸活体检测模型的训练装置,通过采用上述模块实现人脸活体检测模型的训练的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如本公开的上述方法。例如,在一些实施例中,本公开的上述方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的本公开的上述方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开的上述方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (23)

1.一种人脸活体检测方法,包括:
对待检测人脸图像进行预处理,得到目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;
获取所述目标人脸图像的全局特征;
基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。
2.根据权利要求1所述的方法,其中,所述对待检测的人脸图像进行预处理,获取目标人脸图像,包括:
将所述待检测人脸图像输入人脸关键点检测模型进行关键点检测,得到所述待检测人脸图像的人脸区域中人脸关键点坐标;
基于所述人脸关键点坐标,对对应的目标人脸进行人脸对齐,得到对齐人脸图像;
基于所述对齐人脸图像获取所述目标人脸图像。
3.根据权利要求2所述的方法,其中,所述基于所述对齐人脸图像获取所述目标人脸图像,包括:
通过仿射变换截取所述对齐人脸图像中的第一人脸图像;
将所述第一人脸图像的尺寸配置为预设尺寸,得到第二人脸图像;
根据所述第二人脸图像获取所述目标人脸图像。
4.根据权利要求3所述的方法,其中,所述根据所述第二人脸图像获取所述目标人脸图像,包括:
对所述第二人脸图像进行归一化处理,得到所述目标人脸图像。
5.根据权利要求1所述的方法,其中,基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测之前,所述方法还包括:
基于预先训练的活体人脸检测模型、至少两张人脸图像模板和所述模板对应的第一标签,建立所述特征库,所述第一标签指示以下任意项:活体人脸、攻击、攻击类型。
6.根据权利要求5所述的方法,其中,基于所述活体人脸检测模型、至少两张人脸图像模板和所述模板对应的第一标签,建立所述特征库,包括:
采用所述活体人脸检测模型提取所述模板的模板特征;
基于所述模板特征和对应的所述第一标签,建立所述特征库。
7.根据权利要求6所述的方法,其中,基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测,包括:
获取所述全局特征和所述特征库中的各目标特征之间的第一相似度;
在所述第一相似度中获取最大的第二相似度;
响应于所述第二相似度大于或者等于预设阈值,所述待检测人脸图像的标签为所述第二相似度对应的所述目标特征的所述第一标签。
8.根据权利要求7所述的方法,其中,所述方法还包括:
响应于所述第二相似度小于所述预设阈值,向审核平台发送所述待检测人脸图像;
接收所述审核平台发送的所述待检测人脸图像的攻击类型;
将所述全局特征和所述攻击类型,加入所述特征库。
9.一种活体人脸检测模型的训练方法,包括:
获取包括至少两条训练数据的训练数据组,所述训练数据包括训练人脸图像、以及对应的标签,所述标签用于标识真实人脸或者攻击,且所述标签用于标识攻击时,包括至少两级标签;
对所述训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;所述训练目标人脸图像中人脸区域的占比大于所述训练人脸图像中人脸区域的占比;
基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练。
10.根据权利要求9所述的方法,其中,基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练,包括:
将所述训练目标人脸图像输入至所述活体人脸检测模型,得到所述训练目标人脸图像的全局特征;
基于所述训练目标人脸图像的全局特征和第一分类数量的全连接层,预测所述训练人脸图像对应的第一预测结果;
基于所述训练目标人脸图像的全局特征和第二分类数量的全连接层,预测所述训练人脸图像对应的第二预测结果;
分别基于所述第一预测结果、所述第二预测结果和所述训练人脸图像的标签,构建第一损失函数和第二损失函数;
基于所述训练数据组的不同的所述训练目标人脸图像的全局特征,构建三元损失函数;
检测所述第一损失函数、所述第二损失函数和所述第三损失函数之和得到的总损失函数是否收敛;
若不收敛,调整所述活体人脸检测模型的参数。
11.一种人脸活体检测装置,包括:
预处理模块,用于对待检测人脸图像进行预处理,得到目标人脸图像;所述目标人脸图像中人脸区域的占比大于所述待检测人脸图像中人脸区域的占比;
特征获取模块,用于获取所述目标人脸图像的全局特征;
人脸活体检测模块,用于基于所述全局特征和预建立的特征库,对所述待检测人脸图像进行人脸活体检测。
12.根据权利要求11所述的装置,其中,所述预处理模块,用于:
将所述待检测人脸图像输入人脸关键点检测模型进行关键点检测,得到所述待检测人脸图像的人脸区域中人脸关键点坐标;
基于所述人脸关键点坐标,对对应的目标人脸进行人脸对齐,得到对齐人脸图像;
基于所述对齐人脸图像获取所述目标人脸图像。
13.根据权利要求12所述的装置,其中,所述预处理模块,还用于:
通过仿射变换截取所述对齐人脸图像中的第一人脸图像;
将所述第一人脸图像的尺寸配置为预设尺寸,得到第二人脸图像;
根据所述第二人脸图像获取所述目标人脸图像。
14.根据权利要求13所述的装置,其中,所述预处理模块,还用于:
对所述第二人脸图像进行归一化处理,得到所述目标人脸图像。
15.根据权利要求11所述的装置,其中,所述装置还包括:
建立模块,用于基于预先训练的活体人脸检测模型、至少两张人脸图像模板和所述模板对应的第一标签,建立所述特征库,所述第一标签指示以下任意项:活体人脸、攻击、攻击类型。
16.根据权利要求15所述的装置,其中,所述建立模块,用于:
采用所述活体人脸检测模型提取所述模板的模板特征;
基于所述模板特征和对应的所述第一标签,建立所述特征库。
17.根据权利要求16任一所述的装置,其中,所述人脸活体检测模块,用于:
获取所述全局特征和所述特征库中的各目标特征之间的第一相似度;
在所述第一相似度中获取最大的第二相似度;
响应于所述第二相似度大于或者等于预设阈值,所述待检测人脸图像的标签为所述第二相似度对应的所述目标特征的所述第一标签。
18.根据权利要求17所述的装置,其中,所述装置还包括:
收发模块,用于响应于所述第二相似度小于所述预设阈值,向审核平台发送所述待检测人脸图像;
所述收发模块,用于接收所述审核平台发送的所述待检测人脸图像的攻击类型;
更新模块,用于将所述全局特征和所述攻击类型,加入所述特征库。
19.一种活体人脸检测模型的训练装置,包括:
获取模块,用于获取包括至少两条训练数据的训练数据组,所述训练数据包括训练人脸图像、以及对应的标签,所述标签用于标识真实人脸或者攻击,且所述标签用于标识攻击时,包括至少两级标签;
预处理模块,用于对所述训练数据组中的各训练人脸图像进行预处理,得到对应的训练目标人脸图像;所述训练目标人脸图像中人脸区域的占比大于所述训练人脸图像中人脸区域的占比;
训练模块,用于基于各所述训练目标人脸图像以及对应的所述标签,对活体人脸检测模型进行训练。
20.根据权利要求19所述的装置,其中,所述训练模块,用于:
将所述训练目标人脸图像输入至所述活体人脸检测模型,得到所述训练目标人脸图像的全局特征;
基于所述训练目标人脸图像的全局特征和第一分类数量的全连接层,预测所述训练人脸图像对应的第一预测结果;
基于所述训练目标人脸图像的全局特征和第二分类数量的全连接层,预测所述训练人脸图像对应的第二预测结果;
分别基于所述第一预测结果、所述第二预测结果和所述训练人脸图像的标签,构建第一损失函数和第二损失函数;
基于所述训练数据组的不同的所述训练目标人脸图像的全局特征,构建三元损失函数;
检测所述第一损失函数、所述第二损失函数和所述第三损失函数之和得到的总损失函数是否收敛;
若不收敛,调整所述活体人脸检测模型的参数。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8或者9-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8或者9-10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8或者9-10中任一项所述的方法。
CN202210834250.XA 2022-07-14 2022-07-14 人脸活体检测及相应模型的训练方法、装置及存储介质 Pending CN115359574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210834250.XA CN115359574A (zh) 2022-07-14 2022-07-14 人脸活体检测及相应模型的训练方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210834250.XA CN115359574A (zh) 2022-07-14 2022-07-14 人脸活体检测及相应模型的训练方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115359574A true CN115359574A (zh) 2022-11-18

Family

ID=84031722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210834250.XA Pending CN115359574A (zh) 2022-07-14 2022-07-14 人脸活体检测及相应模型的训练方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115359574A (zh)

Similar Documents

Publication Publication Date Title
CN113971751A (zh) 训练特征提取模型、检测相似图像的方法和装置
CN113065614B (zh) 分类模型的训练方法和对目标对象进行分类的方法
CN113657289B (zh) 阈值估计模型的训练方法、装置和电子设备
CN114612743A (zh) 深度学习模型的训练方法、目标对象识别方法和装置
CN112949767A (zh) 样本图像增量、图像检测模型训练及图像检测方法
CN112883902A (zh) 视频检测方法、装置、电子设备及存储介质
CN113205041A (zh) 结构化信息提取方法、装置、设备和存储介质
CN113643260A (zh) 用于检测图像质量的方法、装置、设备、介质和产品
CN112561879A (zh) 模糊度评价模型训练方法、图像模糊度评价方法及装置
CN114596188A (zh) 水印检测方法、模型训练方法、装置及电子设备
CN108734718B (zh) 用于图像分割的处理方法、装置、存储介质及设备
CN114494747A (zh) 模型的训练方法、图像处理方法、装置、电子设备及介质
CN113869253A (zh) 活体检测方法、训练方法、装置、电子设备及介质
CN113902899A (zh) 训练方法、目标检测方法、装置、电子设备以及存储介质
CN115116111B (zh) 抗扰动人脸活体检测模型训练方法、装置及电子设备
CN114639143B (zh) 基于人工智能的人像归档方法、设备及存储介质
CN115937950A (zh) 一种多角度人脸数据采集方法、装置、设备及存储介质
CN113255512B (zh) 用于活体识别的方法、装置、设备以及存储介质
CN115273184A (zh) 人脸活体检测模型训练方法及装置
CN114093006A (zh) 活体人脸检测模型的训练方法、装置、设备以及存储介质
CN114445898A (zh) 人脸活体检测方法、装置、设备、存储介质及程序产品
CN115359574A (zh) 人脸活体检测及相应模型的训练方法、装置及存储介质
CN113936158A (zh) 一种标签匹配方法及装置
CN113947146A (zh) 样本数据生成方法、模型训练方法、图像检测方法及装置
CN114067394A (zh) 人脸活体检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination