WO2021219095A1

WO2021219095A1 - 一种活体检测方法及相关设备

Info

Publication number: WO2021219095A1
Application number: PCT/CN2021/091118
Authority: WO
Inventors: 刁继尧
Original assignee: 华为技术有限公司
Priority date: 2020-04-30
Filing date: 2021-04-29
Publication date: 2021-11-04
Also published as: CN113591517A

Abstract

本申请实施例公开了一种活体检测方法及相关设备，具体可以应用于人脸识别等领域。其中，一种活体检测方法可以应用于终端设备，所述终端设备包括红外摄像模块，所述红外摄像模块包括红外灯，该方法包括：获取环境光照强度；根据所述环境光照强度，确定所述红外灯的N个红外光照强度；基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。如此，可以大大提高人脸识别中活体检测的准确率，保证用户的隐私和财产安全。

Description

一种活体检测方法及相关设备

本申请要求于2020年04月30日提交中国专利局、申请号为202010366189.1、申请名称为“一种活体检测方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人脸识别技术领域，尤其涉及一种活体检测方法及相关设备。

背景技术

目前，人脸识别技术已经广泛地应用于金融注册、支付等身份认证场景中，在越来越多用户使用人脸识别技术的情况下，如何保障人脸识别的安全性就显得尤为重要。其中，活体检测是人脸识别流程当中的关键技术，活体检测主要用于确认采集到的人脸图像是来自用户的真实人脸，而不是视频回放或者伪造材料等。

由于用户人脸数据信息容易泄露，因此针对现有的人脸识别技术，目前常见的利用用户人脸数据信息的人脸攻击方式主要包括以下三种：

a.打印照片攻击，主要包括使用用户本人的纸质打印照片(可以是多种打印材质，比如专业相纸、A4打印纸等)和手机里保存的用户本人照片等，其中，打印照片可以包括彩色打印照片、黑白打印照片和灰度打印照片等。

b.人脸视频攻击，主要包括录制的特定视频回放，例如包含眨眼、转头、张嘴等特定动作指令的视频回放，用于欺骗人脸识别系统。

c.三维人脸面具攻击，三维人脸面具的种类繁多，主要材质包括塑料和硬纸，此类材质的面具攻击成本较低，但其材质与真人皮肤的相似度极低，利用照片与真人的纹理特征差异就可以轻松识别。另外，还有用硅胶、乳胶以及3D打印的立体面具，此类材质的面具纹理与真人皮肤相似度极高，很难轻易识别。

因此，针对层出不穷的人脸攻击方式，如何有效提高活体检测的正确率，从而准确判断出摄像头采集到的人脸图像是否为活体的真实人脸，避免用户隐私泄露或者财产损失，是亟待解决的问题。

发明内容

本申请实施例提供一种活体检测方法及相关设备，可以有效提高活体检测的正确率，从而准确判断出摄像头采集到的人脸图像是否为活体的真实人脸，避免用户隐私泄露或者财产损失。

第一方面，本申请实施例提供了一种活体检测方法，其特征在于，应用于终端设备，所述终端设备包括红外摄像模块，所述红外摄像模块包括红外灯，所述方法包括：获取环境光照强度；根据所述环境光照强度，确定所述红外灯的N个红外光照强度；基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。

通过第一方面提供的方法，可以根据当前场景下的环境光照强度，在人脸识别的活体检测中制定不同的采图策略，设置不同的红外光照强度，并在该不同的红外光照强度(例如可以包括多个数值大于0的红外光照强度，还可以包括数值等于0的红外光照强度，也即关闭红外灯进行拍摄)下分别进行拍摄，采集得到多张人脸图像。然后根据该多张人脸图像中的目标人脸区域之间的差异，判断该目标人脸是否为活体人脸。如此，对比现有技术中，不考虑环境光照强度，仅仅根据预设的方案通过屏幕光源打光或者红外打光的方式采集人脸图像，然后根据采集到的图像进行活体检测，容易被攻击者用人脸照片、面具或者视频等方法攻破的方案而言。本申请实施例不仅考虑到了环境光照强度的影响，还通过不同打光下采集到的人脸图像之间的差异进行活体检测，大大降低了环境光照强度对活体检测的影响，极大程度上提高了活体检测的准确率，保证了人脸识别技术应用的安全性，进而保证用户的隐私和财产安全。

在一种可能的实现方式中，若所述环境光照强度小于预设值，则所述N个红外光照强度中的每一个红外光照强度均大于0；若所述环境光照强度大于或者等于所述预设值，则所述N个红外光照强度中的P个红外光照强度均等于0，所述N个红外光照强度中的K个红外光照强度均大于0；其中，P、K为大于或者等于1的整数，P与K的和为N。

在本申请实施例中，在环境光照强度小于预设值时(也即在黑夜、黄昏等暗光环境下)，可以采取开启红外灯的采图策略，将红外灯打光调节至多个数值大于0的红外光照强度，并在该多个数值大于0的红外光照强度下采集多张人脸图像。而在环境光照强度大于或者等于预设值时(也即在白天、开灯的室内等强光环境下)，可以采取开启红外灯以及关闭红外灯的采图策略，也即既要采集在多个数值大于0的红外光照强度打光下的人脸图像，也要采集关闭红外灯(也即没有红外打光，红外光照强度等于0)的人脸图像。如此，考虑到环境光照强度的影响，在不同的环境光照强度下采取不同的采图策略，可以大大提高各种环境情况下活体检测的准确率。可选地，上述红外灯还可以称之为红外发射器，本申请实施例对此不作具体限定。

在一种可能的实现方式中，其特征在于，所述终端设备还包括RGB摄像头，所述红外摄像模块还包括红外摄像头；所述基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像，包括：若所述环境光照强度小于所述预设值，则开启所述红外灯，并通过所述红外摄像头分别在所述N个红外光照强度下进行拍摄，采集得到所述N张人脸图像；若所述环境光照强度大于或者等于所述预设值，则关闭所述红外灯，并通过所述RGB摄像头分别在所述P个红外光照强度下进行拍摄，采集得到P张人脸图像；以及开启所述红外灯，并通过所述红外摄像头分别在所述K个红外光照强度下进行拍摄，采集得到K张人脸图像。

在本申请实施例中，终端设备还包括RGB摄像头，上述红外摄像模块还包括红外摄像头。可以理解的是，在暗光环境中，由于几乎不存在可见光，因此普通的RGB摄像头无法采集到清晰的人脸图像，而此时红外拍摄具有较好的效果，则可以通过开启红外灯，并利用红外摄像头在多个数值大于0的红外光照强度下分别进行拍摄，采集得到多张清晰的人脸图像，用于后续的活体检测。而在强光环境中，由于存在较强的可见光，红外光的效果微乎其微，因此可以关闭红外灯，利用RGB摄像头在未打红外光(也即红外光照强度为0)的情况下进行拍摄，采集人脸图像；并且，在强光环境中还可以开启红外灯，利用红外摄像头在多个数值大于0的红外光照强度下分别进行拍摄，采集人脸图像。上述强光环境中通过RGB摄像头和红外摄像头采集到的人脸图像均可以用于后续的活体检测。如此，考虑到环境光照强度的影响，在不同的环境光照强度下采取不同的采图策略，利用不同的摄像头(例如包括上述的RGB摄像头和红外摄像头)进行拍摄，采集多张的人脸图像，可以大大提高各种环境情况下活体检测的准确率。

在一种可能的实现方式中，其特征在于，对比所述N张人脸图像中的目标人脸区域，并根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸，包括：确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图；其中，M为大于或者等于1，且小于N的整数；将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸。

在本申请实施例中，可以首先确定该N张人脸图像中的每一张人脸图像中的目标人脸区域，然后对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图。最后将该M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸。如此，对比现有技术中仅仅通过采集到的人脸图像进行活体检测而言，通过人脸图像中的目标人脸区域的差异判断是否为活体人脸的条件更加严格，大大提高了活体检测的准确率，保证了用户的隐私和财产安全。

在一种可能的实现方式中，其特征在于，所述确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图，包括：对所述N张人脸图像中的每一张人脸图像进行人脸检测，得到所述每一张人脸图像中的所述目标人脸的检测框坐标；根据所述每一张人脸图像中的所述目标人脸的检测框坐标，对所述每一张人脸图像进行人脸裁剪，确定所述每一张人脸图像中的目标人脸区域；将第i张人脸图像中的目标人脸区域与第i+1张人脸图像中的目标人脸区域的像素相减，得到像素相减后的人脸图像；对所述像素相减后的人脸图像进行直方图均衡化，得到第i张人脸图像和第i+1张人脸图像对应的人脸差异图；i为大于或者等于1，且小于M的整数。

在本申请实施例中，可以首先对N张人脸图像中的每一张人脸图像进行人脸检测，得到每一张人脸图像中的目标人脸的检测框坐标；然后再根据该检测框坐标，对每一张人脸图像进行人脸裁剪，由此，可以更加准确的确定每一张人脸图像中的目标人脸区域，大大提高后续活体检测的准确率。并且，可以通过对目标人脸区域的像素相减，再进行直方图均衡化实现N张人脸图像中两两相邻两张人脸图像(或者是N张人脸图像中任意两张人脸图像)的目标人脸区域的差异计算。在一些可能的实施方式中，还可以通过计算将相邻人脸图像中目标人脸区域的像素的方差值，再进行直方图均衡化实现差异计算，等等，本申请实施例对此不作具体限定。由于活体人脸与非活体人脸的人脸差异图之间存在明显的差异，因此对比现有技术中仅仅通过采集到的人脸图像进行活体检测而言，通过人脸差异图判断是否为活体人脸可以大大提高活体检测的准确率，保证了用户的隐私和财产安全。

在一种可能的实现方式中，所述活体检测模型包括深度恢复网络和分类器；所述将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸，包括：将所述M张人脸差异图输入至所述活体检测模型中的所述深度恢复网络，得到所述M张人脸差异图对应的M张目标人脸区域的深度图；基于所述M张目标人脸区域的深度图，通过所述分类器判断所述目标人脸是否为活体人脸。

在本申请实施例中，可以首先通过该活体检测模型中的深度恢复网络对一张或者多张人脸差异图进行深度估计，得到对应的一张或者多张目标人脸区域的深度图，然后可以通过该活体检测模型中的分类器基于该一张或者多张目标人脸区域的深度图进行活体人脸的判断，并输出活体检测结果。例如，若该活体检测结果表明该目标人脸为活体人脸，则目标人脸通过活体检测，也即用户的人脸识别通过，用户可以进行注册或者支付等操作。又例如，若该活体检测结果表明该目标人脸为非活体人脸(也即为照片或者面具等假脸)，则目标人脸未通过活体检测，也即人脸识别未通过，有效阻止了攻击者利用他人的照片或者面具进行人脸识别，以盗用他人的隐私信息和窃取他人的财产的违法犯罪行为。

在一种可能的实现方式中，所述方法还包括：获取正样本集和负样本集，所述正样本集包括多张第一人脸差异图，所述负样本集包括多张第二人脸差异图；所述多张第一人脸差异图中的每一张第一人脸差异图为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；所述多张第二人脸差异图中的每一张第二人脸差异图为分别在所述两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图；所述两个红外光照强度中的至少一个红外光照强度大于0；以所述多张第一人脸差异图和所述多张第二人脸差异图作为训练输入，以所述多张第一人脸差异图和所述多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，训练得到所述活体检测模型。

在本申请实施例中，可以采集大量的正样本和负样本作为活体检测模型的训练输入。其中，正样本可以包括多张活体人脸在不同红外光照强度下的人脸差异图(例如可以包括在两个数值大于0的红外光照强度下通过红外摄像头分别拍摄得到的人脸图像的人脸差异图，还可以包括在未打红外光情况下通过RGB摄像头采集到的人脸图像与开启红外灯情况下通过红外摄像头采集到的人脸图像的人脸差异图)，负样本可以包括多张非活体人脸(比如照片、面具和视频等等)在不同红外光照强度下的人脸差异图。如此，通过大量的正、负样本可以更加高效地训练得到用于活体检测的活体检测模型，该活体检测模型可以基于输入的人脸差异图，准确判断当前进行人脸识别的是否为活体人脸，大大提高了活体检测的正确率，保证了用户的隐私和财产安全。

第二方面，本申请实施例提供的一种活体检测装置，其特征在于，应用于终端设备，所述终端设备包括红外摄像模块，所述红外摄像模块包括红外灯，所述装置包括：

第一获取单元，用于获取环境光照强度；

确定单元，用于根据所述环境光照强度，确定所述红外灯的N个红外光照强度；

采集单元，用于基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；

活体检测单元，用于对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。

在一种可能的实现方式中，所述终端设备还包括RGB摄像头，所述红外摄像模块还包括红外摄像头；所述采集单元，具体用于：

若所述环境光照强度小于所述预设值，则开启所述红外灯，并通过所述红外摄像头分别在所述N个红外光照强度下进行拍摄，采集得到所述N张人脸图像；

若所述环境光照强度大于或者等于所述预设值，则关闭所述红外灯，并通过所述RGB摄像头分别在所述P个红外光照强度下进行拍摄，采集得到P张人脸图像；以及开启所述红外灯，并通过所述红外摄像头分别在所述K个红外光照强度下进行拍摄，采集得到K张人脸图像。

在一种可能的实现方式中，所述活体检测单元，具体用于：

确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图；其中，M为大于或者等于1，且小于N的整数；

将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸。

在一种可能的实现方式中，所述活体检测单元，还具体用于：

对所述N张人脸图像中的每一张人脸图像进行人脸检测，得到所述每一张人脸图像中的所述目标人脸的检测框坐标；

根据所述每一张人脸图像中的所述目标人脸的检测框坐标，对所述每一张人脸图像进行人脸裁剪，确定所述每一张人脸图像中的目标人脸区域；

将第i张人脸图像中的目标人脸区域与第i+1张人脸图像中的目标人脸区域的像素相减，得到像素相减后的人脸图像；

对所述像素相减后的人脸图像进行直方图均衡化，得到第i张人脸图像和第i+1张人脸图像对应的人脸差异图；i为大于或者等于1，且小于M的整数。

将所述M张人脸差异图输入至所述活体检测模型中的所述深度恢复网络，得到所述M张人脸差异图对应的M张目标人脸区域的深度图；

基于所述M张目标人脸区域的深度图，通过所述分类器判断所述目标人脸是否为活体人脸。

在一种可能的实现方式中，所述装置还包括：

第二获取单元，用于获取正样本集和负样本集，所述正样本集包括多张第一人脸差异图，所述负样本集包括多张第二人脸差异图；所述多张第一人脸差异图中的每一张第一人脸差异图为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；所述多张第二人脸差异图中的每一张第二人脸差异图为分别在所述两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图；所述两个红外光照强度中的至少一个红外光照强度大于0；

训练单元，用于以所述多张第一人脸差异图和所述多张第二人脸差异图作为训练输入，以所述多张第一人脸差异图和所述多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，训练得到所述活体检测模型。

第三方面，本申请实施例提供的一种终端设备，其特征在于，该终端设备中包括处理器，处理器被配置为支持该终端设备实现第一方面提供的活体检测方法中相应的功能。该终端设备还可以包括存储器，存储器用于与处理器耦合，其保存该终端设备必要的程序指令和数据。该终端设备还可以包括通信接口，用于该终端设备与其他设备或通信网络通信。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述第一方面中任意一项所述的活体检测方法流程。

第五方面，本申请实施例提供了一种计算机程序，该计算机程序包括指令，当该计算机程序被计算机执行时，使得计算机可以执行上述第一方面中任意一项所述的活体检测方法流程。

第六方面，本本申请实施例提供了一种芯片系统，该芯片系统包括上述第一方面中任意一项所述的活体检测装置，用于实现上述第一方面中任意一项所述的活体检测方法流程所涉及的功能。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存活体检测方法必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例或背景技术中所需要使用的附图进行说明。

图1是现有技术中的一组人脸攻击方式的示意图。

图2是现有技术中的一种活体检测方法的流程示意图。

图3是现有技术中的一种活体检测方法中的屏幕打光方案示意图。

图4是本申请实施例提供的一种终端设备的功能框图。

图5是本申请实施例提供的一种终端设备的软件结构框图。

图6a是本申请实施例提供的一种活体检测方法的应用场景示意图。

图6b是本申请实施例提供的另一种活体检测方法的应用场景示意图。

图7a-图7b是本申请实施例提供的一组界面示意图。

图8是本申请实施例提供的一种活体检测方法的流程示意图。

图9是本申请实施例提供的另一种活体检测方法的流程示意图。

图10是本申请实施例提供的一组室外真人与室外照片的实验结果对比示意图。

图11是本申请实施例提供的一组室内真人与室内照片的实验结果对比示意图。

图12是本申请实施例提供的一种活体检测的过程示意图。

图13是本申请实施例提供的一种活体检测模型的网络结构示意图。

图14是本申请实施例提供的一种活体检测装置的结构示意图。

图15是本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例进行描述。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在本说明书中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示，在终端设备上运行的应用和终端设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中，部件可位于一个计算机上和/或分布在2个或更多个计算机之间。此外，这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据，例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

首先，对本申请中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)近红外光((Near Infrared，NIR)，是介于可见光(VIS)和中红外光(MIR)之间的电磁波，按美国试验和材料检测协会(American Society for Testing and Materials，ASTM)定义是指波长在780～2526nm范围内的电磁波，习惯上又将近红外区划分为近红外短波(780～1100nm)和近红外长波(1100～2526nm)两个区域。

(2)人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术，包括人脸检测与分析、五官定位、人脸比对与验证、人脸检索、活体检测等。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行识别的一系列相关技术，通常也叫做人像识别、面部识别。人脸识别技术可应用在美妆美颜、面部动效合成、安防监控追逃、金融领域身份认证等场景，解决各行业客户的多种多样的人脸特效处理及用户身份确认等需求。

(3)直方图均衡化，是图像处理领域中利用图像直方图对对比度进行调整的方法。这种方法通常用来增加许多图像的局部对比度，尤其是当图像的有用数据的对比度相当接近的时候。通过这种方法，亮度可以更好地在直方图上分布。这样就可以用于增强局部的对比度而不影响整体的对比度，直方图均衡化通过有效地扩展常用的亮度来实现这种功能。

随着人脸识别技术日趋成熟，商业化应用愈加广泛，尤其是在金融行业，人脸识别技术已逐渐用于远程开户、取款、支付等，涉及用户的切身利益。然而，请参阅图1，图1是现有技术中的一组人脸攻击方式的示意图。如图1所示，人脸极易用打印照片、电子照片、3D面具和视频等方式进行复制，因此对合法用户人脸的假冒是人脸识别与认证系统安全的重要威胁。考虑到一旦虚假人脸攻击成功，极有可能对用户造成重大损失，因此势必需要为现有的人脸识别系统开发可靠、高效的人脸活体检测技术。

为了便于理解本申请实施例，进一步分析并提出本申请所具体要解决的技术问题。在现有技术中，关于人脸识别中的活体检测技术，包括多种技术方案，以下示例性的列举如下常用的一种方案。

方案一：基于屏幕打光的人脸活体检测方案。

当前在借助外界打光以进行人脸活体检测的现有技术中，主要运用的是上述的基于屏幕打光的人脸活体检测方案。整个方案流程如图2所示，图2是现有技术中的一种活体检测方法的流程示意图，如图2所示，该方法可以包括以下步骤S10-S40：

步骤S10，接收客户端发送的第一实时视频流，对所述第一实时视频流中的待检测人脸图像进行静默活体检测，得到第一检测结果。

步骤S20，向所述客户端发送光线活体检测指令，以控制所述客户端屏幕按照预设规则进行发光。

步骤S30，在所述客户端屏幕发光过程中，接收所述客户端发送的第二实时视频流，对所述第二实时视频流中的待检测人脸图像进行光线活体检测，得到第二检测结果。

步骤S40，根据所述第一检测结果和所述第二检测结果确定所述待检测人脸图像是否为活体。

如上所述，在方案一的整个活体检测流程中实则包括两个活体检测方案，首先客户端会采集第一实时视频流，对视频流中的人脸图像进行静默活体检测，得到第一检测结果。然后，客户端控制屏幕(例如为智能手机的屏幕或者平板电脑的屏幕，等等)按照预定规则发光。例如，请参阅图3，图3是现有技术中的一种活体检测方法中的屏幕打光方案示意图，如图3所示，智能手机可以按照屏幕光源1(比如屏幕发光的光照强度为40勒克斯(lux，lx))、屏幕光源2(比如屏幕发光的光照强度为30lux)和屏幕光源3(比如屏幕发光的光照强度为50lux)等不同的光源方案进行发光。并在屏幕发光过程中采集第二实时视频流(例如包括在上述屏幕光源1、屏幕光源2和屏幕光源3下人别采集得到的多帧人脸图像)。然后，将采集的第二实时视频流中的待检测人脸图像进行光线活体检测，得到第二检测结果，如果第一检测结果与第二检测结果均为真(也即均为活体人脸)则可确定该人脸为活体人脸，否则为非活体人脸。

该方案一的缺点：方案一在触发活体检测后，首先其客户端需与服务器建立通信连接，然后客户端向服务器发送实时采集的视频流，服务器再利用该视频流中的多帧图片进行活体检测。显然，方案一实时性不高，活体检测的流程时间会很长，也就导致了整个人脸识别所需的时间较长，用户体验较差。与此同时，方案一采用屏幕主动打光，要始终保持屏幕光源的强度大于环境光，但在室外环境光照强度较大的使用场景下，此方案便会失效。并且，最后的活体检测结果完全依赖第一次的静默活体检测结果和第二次的光线活体检测结果，在牺牲用户体验的前提下，室内场景虽然可以大幅度提升活体检测的准确率，但是由于输入信息的局限，还是存在许多问题场景，导致攻击者可以攻破人脸活体检测算法。例如，在采用的是二维(Two Dimensions，2D)摄像头情况下，攻击者可以采用灯箱攻击，高保真照片，成功攻破；纵然手机具有三维(Three Dimensions，3D)摄像头，攻击者也可以通过高仿的3D面具骗过上述人脸活体检测算法。

综上，上述方案一无法满足在各类环境光情况下实现准确、高效的活体检测，并且其输入的信息单一，容易被各种照片、面具和视频等攻破，无法保证用户在应用人脸识别技术时的安全性。因此，为了解决当前活体检测技术中不满足实际业务需求的问题，本申请实际要解决的技术问题包括如下方面：基于现有的终端设备，实现准确、高效的人脸活体检测，保证人脸识别技术在各方面应用(例如应用人脸识别技术对用户的身份进行认证，比如银行机构、保险机构、税务机构或理财机构等金融机构中的各类注册、支付场景)的安全性，保证用户的隐私和财产安全。

请参阅图4，图4是本申请实施例提供的一种终端设备的功能框图。可选地，在一个实施例中，可将终端设备100配置为完全或部分地自动拍摄模式。例如，终端设备100可以处于定时持续自动拍摄模式，或者根据计算机指令在拍摄范围内检测到预先设置的目标对象(例如人脸等等)时进行拍摄的自动拍摄模式等。在终端设备100处于自动拍摄模式中时，可以将终端设备100设置为在没有和人交互的情况下操作。

下面以终端设备100为例对实施例进行具体说明。应该理解的是，终端设备100可以具有比图4中所示的更多的或者更少的部件，可以组合两个或多个的部件，或者可以具有不同的部件配置。图4中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

终端设备100可以包括：处理器110，外部存储器接口120，内部存储器121，通用串行总线(universal serial bus，USB)接口130，充电管理模块140，电源管理模块141，电池142，天线1，天线2，移动通信模块150，无线通信模块160，音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，传感器模块180，按键190，马达191，指示器192，摄像头193，显示屏194，以及用户标识模块(subscriber identification module，SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A，陀螺仪传感器180B，气压传感器180C，磁传感器180D，加速度传感器180E，距离传感器180F，接近光传感器180G，指纹传感器180H，温度传感器180J，触摸传感器180K，环境光传感器180L，骨传导传感器180M等。

可以理解的是，本申请实施例示意的结构并不构成对终端设备100的具体限定。在本申请另一些实施例中，终端设备100可以包括比图4所示更多或者更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置，等等。图4所示的部件可以以硬件、软件或者软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

其中，控制器可以是终端设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

处理器110中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器110中的存储器可以为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据，可以从所述存储器中直接调用。避免了指令或数据的重复存取，减少了处理器110的等待时间，因而可以大大提高系统的运作效率。

在一些实施例中，处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit，I2C)接口，集成电路内置音频(inter-integrated circuit sound，I2S)接口，脉冲编码调制(pulse code modulation，PCM)接口，通用异步收发传输器(universal asynchronous receiver/transmitter，UART)接口，移动产业处理器接口(mobile industry processor interface，MIPI)，通用输入输出(general-purpose input/output，GPIO)接口，用户标识模块(subscriber identity module，SIM)接口，和/或通用串行总线(universal serial bus，USB)接口等。

可以理解的是，本申请实施例示意的各模块间的接口连接关系，只是示意性说明，并不构成对终端设备100的结构限定。在本申请另一些实施例中，终端设备100也可以采用与上述实施例中不同的接口连接方式，或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。其中，充电器可以是无线充电器，也可以是有线充电器。

电源管理模块141用于连接电池142，充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入，为处理器110，内部存储器121，外部存储器，显示屏194，摄像头193，和无线通信模块160等供电。

终端设备100的无线通信功能可以通过天线1，天线2，移动通信模块150，无线通信模块160，调制解调处理器以及基带处理器等实现。

终端设备100通过GPU，显示屏194，以及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏194和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像，视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emitting diode，OLED)，有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的，AMOLED)，柔性发光二极管(flex light-emitting diode，FLED)，Miniled，MicroLed， Micro-oLed，量子点发光二极管(quantum dot light emitting diodes，QLED)等。在一些实施例中，终端设备100可以包括1个或多个显示屏194。

终端设备100可以通过ISP，摄像头193，视频编解码器，GPU，显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如，拍照时，打开快门，光线通过镜头被传递到摄像头感光元件上，光信号转换为电信号，摄像头感光元件将所述电信号传递给ISP处理，转化为肉眼可见的图像。ISP还可以对图像的噪点，亮度，对比度和人脸肤色等等进行算法优化。ISP还可以对拍摄场景的曝光，色温等参数优化。在一些实施例中，ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或者视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，CMOS)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB或者YUV等格式的图像信号。

本申请实施例中，终端设备100可以包括多个摄像头193，例如可以包括一个或多个RGB摄像头，以及一个或多个红外摄像头，等等。可选地，该红外摄像头可以为近红外摄像头(例如为2D NIR摄像头)。当应用红外摄像头进行红外拍摄时，终端设备100还可以包括用于红外摄像的一个或多个红外灯(也即红外发射器，图4中未示出)，本申请实施例对此不作具体限定。在一些实施例中，可以通过处理器控制红外灯的开启和关闭，还可以调节红外灯的红外光照强度。本申请实施例中的活体检测方法，可以根据当前场景下的环境光照强度制定不同的采图策略。当用户触发人脸识别后，若当前场景为暗光环境，则处理器可以控制开启红外灯，并通过红外摄像头在多个不同红外光照强度下进行拍摄，采集多张人脸图像。若当前场景为强光环境，则处理器可以控制关闭红外灯，并通过RGB摄像头进行拍摄，采集一张或多张未打光的人脸图像；以及处理器还可以控制开启红外灯，并通过红外摄像头在一个或多个红外光照强度下进行拍摄，采集一张或者多张人脸图像。在一些实施例中，处理器110可以获取上述暗光或者强光环境下采集到的多张人脸图像，然后对该多张人脸图像中的目标人脸区域(例如为正在进行人脸识别的用户的人脸区域)进行差异计算，根据该差异判断该目标人脸是否为活体人脸。例如，处理器110可以对每相邻两张人脸图像中的目标人脸区域进行差异计算，得到每相邻两张人脸图像的人脸差异图。然后可以将得到的一张或者多张人脸差异图输入至预先训练的活体检测模型，得到该目标人脸的活体检测结果，也即判断该目标人脸是否为活体人脸。由此实现高效、准确的活体检测，保证了人脸识别技术在各方面应用的安全性，保护了用户的隐私和财产安全，满足用户的实际需求。

其中，摄像头193可以位于终端设备100的正面，例如位于触控屏的上方，也可以位于其他位置，例如位于终端设备的背面。比如，用于人脸识别的RGB摄像头和红外摄像头一般可以位于终端设备100的正面，例如位于触控屏的上方，也可以位于其他位置，例如终端设备100的背面，本申请实施例对此不做具体限制。其中，用于红外摄像的红外灯一般也位于终端设备100的正面，例如位于触控屏的上方，可以理解的是，红外灯一般与红外摄像头位于终端设备100的同一侧，以便进行红外图像的采集。在一些实施例中，终端设备100还可以包括其他摄像头。在一些实施例中，终端设备100还可以包括点阵发射器(图4中未示出)，用于发射光线。

数字信号处理器用于处理数字信号，除了可以处理数字图像信号，还可以处理其他数字信号。例如，当终端设备100在频点选择时，数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。终端设备100可以支持一种或多种视频编解码器。这样，终端设备100可以播放或录制多种编码格式的视频，例如：动态图像专家组(moving picture experts group，MPEG)1，MPEG2，MPEG3，MPEG4等。

NPU为神经网络(neural-network，NN)计算处理器，通过借鉴生物神经网络结构，例如借鉴人脑神经元之间传递模式，对输入信息快速处理，还可以不断的自学习。通过NPU可以实现终端设备100的智能认知等应用，例如：图像识别，人脸识别(包括活体检测、人脸检测与分析、五官定位、人脸比对与验证和人脸检索等等)，语音识别，文本理解，直方图均衡化等图像处理等等。

外部存储器接口120可以用于连接外部存储卡，例如Micro SD卡，实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信，实现数据存储功能。例如将音乐，视频，照片等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令，从而执行终端设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用，例如人脸识别功能(包括活体检测、人脸检测与分析、五官定位、人脸比对与验证和人脸检索等功能)，录像功能、拍照功能、图像处理功能，等等。存储数据区可以存储终端设备100使用过程中所创建的数据等。此外，内部存储器121可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等。

终端设备100可以通过音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，以及应用处理器等实现音频功能。例如音乐播放，录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。

扬声器170A，也称“喇叭”，用于将音频电信号转换为声音信号。

受话器170B，也称“听筒”，用于将音频电信号转换成声音信号。

麦克风170C，也称“话筒”，“传声器”，用于将声音信号转换为电信号。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130，也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform，OMTP)标准接口，美国蜂窝电信工业协会(cellular telecommunications industry association of the USA，CTIA)标准接口。

压力传感器180A用于感受压力信号，可以将压力信号转换成电信号。在一些实施例中，压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多，如电阻式压力传感器，电感式压力传感器，电容式压力传感器等。

陀螺仪传感器180B可以用于确定终端设备100的运动姿态。在一些实施例中，可以通过陀螺仪传感器180B确定终端设备100围绕三个轴(即，x，y和z轴)的角速度。

接近光传感器180G可以包括例如发光二极管(LED)和光检测器，例如光电二极管。发光二极管可以是红外发光二极管。

环境光传感器180L用于感知环境光亮度。终端设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。在一些实施例中，环境光传感器180L可以用于获取当前场景下的环境光照亮度，终端设备100可以根据环境光照强度制定不同的采图策略，例如在暗光环境下(比如环境光照强度小于5勒克斯(lux，lx)，或者环境光照强度小于1lux，等等)，开启红外灯，并确定多个数值大于0的红外光照强度，然后通过红外摄像头在该多个红外光照强度下分别进行拍摄，采集多张人脸图像，等等，此处不再进行赘述。

指纹传感器180H用于采集指纹。终端设备100可以利用采集的指纹特性实现指纹解锁，访问应用锁，指纹拍照，指纹接听来电等。其中，该指纹传感器180H可以设置在触控屏下方，终端设备100可以接收用户在触控屏上该指纹传感器对应的区域的触摸操作，终端设备100可以响应于该触摸操作，采集用户手指的指纹信息，实现相关功能。

温度传感器180J用于检测温度。在一些实施例中，终端设备100利用温度传感器180J检测的温度，执行温度处理策略。

触摸传感器180K，也称“触控面板”。触摸传感器180K可以设置于显示屏194，由触摸传感器180K与显示屏194组成触摸屏，也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器，以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中，触摸传感器180K也可以设置于终端设备100的表面，与显示屏194所处的位置不同。

按键190包括开机键，音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备100可以接收按键输入，产生与终端设备100的用户设置以及功能控制有关的键信号输入。

指示器192可以是指示灯，可以用于指示充电状态，电量变化，也可以用于指示消息，未接来电，通知等。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195，或从SIM卡接口195拔出，实现和终端设备100的接触和分离。在一些实施例中，终端设备100采用eSIM，即：嵌入式SIM卡。eSIM卡可以嵌在终端设备100中，不能和终端设备100分离。

终端设备100可以是具备上述功能的智能手机、智能可穿戴设备、平板电脑、笔记本电脑、台式电脑和计算机等等设备，本申请实施例对此不作具体限定。

终端设备100的软件系统可以采用分层架构，事件驱动架构，微核架构，微服务架构，或云架构。本申请实施例以分层架构的Android系统为例，示例性说明终端设备100的软件结构。

请参阅图5，图5是本申请实施例提供的一种终端设备的软件结构框图。分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，将Android系统分为四层，从上至下分别为应用程序层，应用程序框架层，安卓运行时(Android runtime)和系统库，以及内核层。

应用程序层可以包括一系列应用程序包。

如图5所示，应用程序包可以包括相机，图库，日历，通话，地图，导航，WLAN，蓝牙，音乐，视频，短信息等应用程序(也可以称为应用)。还可以包括本申请涉及的相关活体检测应用，通过该活体检测应用可以运用本申请中的一种活体检测方法，高效、准确的实现人脸识别技术中的活体检测，有效阻止他人利用用户的照片或者面具等通过人脸识别，盗取用户的隐私和财产等违法犯罪行为。

应用程序框架层为应用程序层的应用程序提供应用编程接口(application programming interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。

如图5所示，应用程序框架层可以包括窗口管理器，内容提供器，视图系统，电话管理器，资源管理器，通知管理器等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕等。

内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问。所述数据可以包括视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。

视图系统包括可视控件，例如显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如，包括短信通知图标的显示界面，可以包括显示文字的视图以及显示图片的视图。例如，在一些实施例中，可以包括相关人脸识别控件的拍照界面，通过点击该人脸识别控件可以实现运用本申请中的一种活体检测方法，根据当前场景下的环境光照强度，制定不同的采图策略，并根据制定的采图策略采集多张人脸图像，并根据该多张人脸图像中目标人脸区域的差异判断该目标人脸是否为活体人脸。从而大大提高人脸识别中活体检测的准确率，保证用户的隐私和财产安全。

电话管理器用于提供终端设备100的通信功能。例如通话状态的管理(包括接通，挂断等)。

资源管理器为应用程序提供各种资源，比如本地化字符串，图标，图片，布局文件，视频文件等等。

通知管理器使应用程序可以在状态栏中显示通知信息，可以用于传达告知类型的消息，可以短暂停留后自动消失，无需用户交互。比如通知管理器被用于告知下载完成，消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知，例如后台运行的应用程序的通知，还可以是以对话界面形式出现在屏幕上的通知。例如在状态栏提示文本信息，发出提示音，终端设备振动，指示灯闪烁等。还例如，在进行本申请中涉及的人脸识别时，可以在人脸识别界面通过文本信息提示用户人脸识别已通过，并已通过人脸识别完成注册或者支付，等等。还例如在人脸识别无法正确进行时，例如用户戴着帽子、口罩，遮盖了脸部的大部分区域时，可以在人脸识别界面通过文本信息提示用户向镜头展示全部裸露的脸部。也例如在人脸识别的活体检测未通过时(也即通过活体检测判断出当前的目标人脸为非活体人脸，比如为照片或者视频等等)，可以在人脸识别界面通过文本信息提示用户人脸识别未通过，当前人脸为非活体，请使用用户的真实活体人脸进行人脸识别，等等，本申请实施例对此不作具体限定。

Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

系统库可以包括多个功能模块。例如：表面管理器(surface manager)，媒体库(Media Libraries)，三维图形处理库(例如：OpenGL ES)，2D图形引擎(例如：SGL)等。

表面管理器用于对显示子系统进行管理，并且为多个应用程序提供了2D和3D图层的融合。

媒体库支持多种常用的音频，视频格式回放和录制，以及静态图像文件等。媒体库可以支持多种音视频编码格式，例如:MPEG4，H.264，MP3，AAC，AMR，JPG，PNG等。本申请中涉及的视频格式例如可以为RM，RMVB，MOV，MTV，AVI，AMV，DMV，FLV等。

三维图形处理库用于实现三维图形绘图，图像渲染，合成，以及图层处理等。

2D图形引擎是2D绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含显示驱动，摄像头驱动(例如包括红外摄像头驱动和RGB摄像头驱动)，音频驱动，传感器驱动。

为了便于理解本申请实施例，以下示例性列举本申请中一种活体检测方法所适用的应用场景，可以包括如下2个场景。

场景一，用户通过终端设备进行活体检测，完成人脸识别并进行线上支付。

请参阅图6a，图6a是本申请实施例提供的一种活体检测方法的应用场景示意图。如图6a所示，该应用场景包括终端设备(图6a中以智能手机为例)。并且该终端设备中可以包括相关拍摄模块、显示器和处理器等。其中，拍摄模块、显示器和处理器可以通过系统总线进行数据传输。其中，拍摄模块可以包括红外拍摄模块和RGB摄像头，该红外拍摄模块可以包括红外灯(也即红外发射器)和红外摄像头。该RGB摄像头、红外摄像头和该红外灯可以位于终端设备的正面，上述摄像头均可以将捕捉到的光源信号转化为数字信号，完成图像的采集。在本申请实施例中，在用户通过终端设备触发人脸识别后，终端设备可以根据当前场景下的环境光照强度制定相应的采图策略，并根据该采图策略通过红外摄像头采集得到多张人脸图像，或者通过红外摄像头以及RGB摄像头采集得到多张人脸图像。然后，可以通过上述系统总线将采集到的人脸图像传输至终端设备的处理器，处理器根据获取到的人脸图像，利用本申请中的一种活体检测方法对人脸图像中的目标人脸进行活体检测。例如，处理器根据采集到的多张人脸图像，通过差异计算得到一张或者多张人脸差异图(也即得到人脸差异图序列)，再将该一张或者多张人脸差异图输入至预先训练的活体检测模型，判断该目标人脸是否为活体人脸，由此完成人脸识别中的活体检测部分。

在本申请实施例中，当用户想要进行人脸识别以完成相应的付款操作时，用户对终端设备的操作过程可以参阅图7a和图7b，图7a-图7b是本申请实施例提供的一组界面示意图。如图7a所示，终端设备显示了订单支付界面701，其中，该订单支付界面701可以包括有设置控件702、立即付款控件703和其他控件(例如返回控件、付款方式选择控件、商品删除控件和商品数量选择控件，等等)。例如，如图7a所示，当用户对该购物订单确认无误，想要进行付款时，可以通过输入操作704(例如为点击)触发付款操作。此时，如图7b所示，在用户点击了立即付款控件703后，终端设备显示了人脸识别界面705，其中，该人脸识别界面可以包括开始人脸识别控件706和其他控件(例如返回控件、设置控件和输入密码控件等等)。用户可以通过输入操作707(例如为点击)开始人脸识别，该人脸识别过程中包括了活体检测，在进行活体检测时，可以运用本申请提供的一种活体检测方法，首先获取当前场景下的环境光照强度，根据环境光照强度制定合理的采图策略，确定红外灯的多个红外光照强度。然后，根据该多个红外光照强度相应的调节该红外灯，并在多个红外光照强度下分别进行拍摄，采集多张人脸图像。然后，通过对该多张人脸图像中的每相邻两张人脸图像中的目标人脸区域的差异计算，得到一张或者多张人脸差异图(也即得到人脸差异图序列)，再将该一张或者多张人脸差异图输入至预先训练的活体检测模型，判断当前进行人脸识别的目标人脸(也即进行本次付款操作的用户的人脸)是否为活体人脸，由此完成人脸识别中的活体检测部分。若确定该目标人脸为活体人脸，并且本次人脸识别中的其他部分(比如人脸检测与分析、五官定位、人脸比对与验证等等)均通过，则用户的本次人脸识别通过，用户即可完成付款。可选地，用户还可以通过点击设置控件702设置默认的支付认证方式(例如为人脸识别、输入密码和输入指纹等等)，用户还可以设置人脸识别的人脸数量(例如设置本购物账号的人脸识别的人脸数量上限为5个不同的人脸，等等)或者修改人脸识别的人脸(例如重新录入用户自己的人脸，添加或者删除好友、家人的人脸等)，等等，本申请实施例对此不作具体限定。

可选地，在本申请实施例中，当开发人员想要进行人脸识别以测试本申请中的一种活体检测方法时，开发人员对终端设备的操作过程也可以参考图7a和图7b，此处不再进行赘述。开发人员可以根据得到的活体检测结果，不断优化本申请中的根据环境光照强度制定的采图策略，差异计算方法，以及活体检测模型，等等，从而不断提升活体检测的性能，有效提高活体检测的正确率。

如上所述，该终端设备可以为具备上述功能的智能手机、智能可穿戴设备、平板电脑、膝上计算机和台式电脑等等，本申请实施例对此不作具体限定。

场景二，用户通过终端设备以及与终端设备连接的服务器进行活体检测，完成人脸识别并进行金融注册。

请参阅图6b，图6b是本申请实施例提供的另一种活体检测方法的应用场景示意图。如图6b所示，该应用场景可以包括终端设备(图6b中以智能手机为例)以及计算设备(例如可以为某银行机构的服务器)。其中，终端设备和计算设备可以通过蓝牙、Wi-Fi或移动网络等无线通信方式或者数据线等有线通信方式进行数据传输。其中，终端设备可以包括相关拍摄模块、显示器和处理器等。其中，拍摄模块、显示器和处理器可以通过系统总线进行数据传输。其中，拍摄模块可以包括红外拍摄模块和RGB摄像头，该红外拍摄模块可以包括红外灯(也即红外发射器)和红外摄像头。该RGB摄像头、红外摄像头和该红外灯可以位于终端设备的正面，上述摄像头均可以将捕捉到的光源信号转化为数字信号，完成图像的采集。在本申请实施例中，在用户通过终端设备触发人脸识别后，终端设备可以根据当前场景下的环境光照强度制定相应的采图策略，并根据该采图策略通过红外摄像头采集得到多张人脸图像，或者通过红外摄像头以及RGB摄像头采集得到多张人脸图像。同时，例如，如图6b所示，在用户通过终端设备触发金融注册中的人脸识别后(例如用户通过点击终端设备显示的金融注册界面当中的相关人脸识别控件)，终端设备可以与相关银行机构的服务器建立即时通信连接，然后终端设备可以通过无线方式将采集到的多张人脸图像发送至该服务器，服务器根据接收到的人脸图像，利用本申请中的一种活体检测方法对人脸图像中的目标人脸进行活体检测。例如，服务器根据接收到的多张人脸图像，通过差异计算得到一张或者多张人脸差异图(也即得到人脸差异图序列)，再将该一张或者多张人脸差异图输入至预先训练的活体检测，判断该目标人脸是否为活体人脸，由此完成人脸识别中的活体检测部分。并且，如图6b所示，计算设备可以将活体检测结果发送至终端设备，终端设备可以根据该活体检测结果显示相应的界面。例如，若此次人脸识别中的活体检测以及其他部分(比如人脸检测与分析、五官定位、人脸比对与验证等等)均通过，则用户的本次人脸识别通过，用户可以通过终端设备完成其在相关银行机构的金融注册，例如为创建银行账户等等。

如上所述，该终端设备可以为具备上述功能的智能手机、智能可穿戴设备、平板电脑、膝上计算机和台式电脑等等，本申请实施例对此不作具体限定；该计算设备可以为具备上述功能的平板电脑、膝上计算机、台式电脑和服务器等，该服务器可以是具备上述功能的一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心，等等，本申请实施例对此不作具体限定。

可以理解的是，本申请提供的一种活体检测方法还可以应用于除上述两个应用场景外的其他场景，例如为通过人脸识别进行智能手机、平板电脑等终端设备的屏幕解锁，税务机构或者动车、高铁等公共交通场所通过人脸识别对用户进行身份认证等等应用场景，此处不再进行赘述。

请参阅图8，图8是本申请实施例提供的一种活体检测方法的流程示意图，该方法可应用于上述图6a或图6b中所述的应用场景及系统架构中，以及具体可应用于上述图4的终端设备100中。下面结合附图8以执行主体为上述图4中的终端设备100为例进行描述。该方法可以包括以下步骤S801-步骤S804：

步骤S801，获取环境光照强度。

具体地，终端设备获取当前场景下的环境光照强度。可选地，终端设备可以通过以下应用程序编程接口(Application Programming Interface，API)：“public static float light_strength；”获取当前场景下的环境光照强度。

可选地，请参阅图9，图9是本申请实施例提供的另一种活体检测方法的流程示意图。请参考如图9所示的步骤S11，首先，用户可以通过终端设备触发人脸识别(也即触发人脸识别中所包括的活体检测)。例如，用户可以通过点击终端设备显示的相关控件(例如人脸识别控件、人脸支付控件和身份验证控件等等)，或者双击终端设备已锁住的屏幕等等操作触发人脸识别，以触发本申请实施例中的活体检测流程，本申请实施例对此不作具体限定。在触发了活体检测后，终端设备可以通过上述的应用程序编程接口获取当前场景下的环境光照强度。比如，在室内开灯的场景下，其环境光照强度一般可以为50lux至60lux不等，又比如，在黑暗的街道或者夜晚室内不开灯等场景下，其环境光照强度一般小于5lux，甚至小于1lux，等等，此处不再进行赘述。

步骤S802，根据环境光照强度，确定红外灯的N个红外光照强度。

具体地，该终端设备可以包括红外摄像模块，该红外摄像模块可以包括红外灯(或者称之为红外发射器)，该终端设备可以根据获取到的环境光照强度，制定相应的采图策略，并确定红外灯的N个红外光照强度，其中，N为大于或者等于2的整数。可选地，请参考如图9所示的步骤S12和步骤S13。例如，当环境光照强度小于预设值(例如可以为小于5lux或者1lux等等，本申请实施例对此不作具体限定)时，也即在暗光环境中，可以采取完全红外摄像的采图策略，并确定红外灯的N个红外光照强度，其中，该N个红外光照强度的数值均大于0，比如可以分别为20lux、30lux和40lux等等。又例如，当环境光照强度大于或者等于该预设值时，也即在强光环境中，可以采取部分红外摄像的采图策略，并确定红外灯的N个红外光照强度，其中，该N个红外光照强度中的P个红外光照强度的数值等于0，也即关闭红外灯，不进行红外打光；并且，该N个红外光照强度中的K个红外光照强度的数值均大于0，比如可以分别为20lux、35lux和43lux等等。其中，P、K为大于或者等于1的整数，P与K的和为N。可选地，当环境光照强度等于该预设值时，终端设备也可以采取完全红外摄像的采图策略，本申请实施例对此不作具体限定。也即在暗光环境中，其采图策略一般为采集多张在不同强度的红外光打光下的人脸图像，而在强光环境中，其采图策略一般为采集一张或者多张未打红外光的人脸图像，并且采集一张或多张打红外光的人脸图像。

步骤S803，基于N个红外光照强度调节红外灯，并分别在N个红外光照强度下进行拍摄，采集得到N张人脸图像。

具体地，终端设备基于该N个红外光照强度调节终端设备的红外灯，并分别在该N个红外光照强度下进行拍摄，采集得到N张人脸图像，该N张人脸图像中的每一张人脸图像包括目标人脸(例如为用户的人脸，或者在软件测试阶段开发人员或者实验人员的人脸)。可选地，该终端设备还可以包括RGB摄像头，该红外摄像模块还可以包括红外摄像头。可选地，可以参考图9所示的步骤S14。

例如，若获取到的环境光照强度小于预设值(例如为上述的小于5lux或者1lux等等)，则终端设备控制开启该红外灯，并通过该红外摄像头分别在该N个红外光照强度下进行拍摄，采集得到该N张人脸图像。可以理解的是，在暗光环境中，由于几乎不存在可见光，因此普通的RGB摄像头无法采集到清晰的人脸图像，而此时红外拍摄具有较好的效果，则可以通过开启红外灯，并利用红外摄像头在多个红外光照强度下分别进行拍摄，采集得到多张清晰的人脸图像，用于后续的活体检测。

又例如，若获取到的环境光照强度大于或者等于该预设值，则终端设备控制关闭该红外灯，并通过该RGB摄像头分别在该P个数值等于0的红外光照强度下进行拍摄(也即在没有红外打光的情况下通过该RGB摄像头进行拍摄)，采集得到P张人脸图像；以及开启该红外灯，并通过该红外摄像头分别在该K个数值大于0的红外光照强度下进行拍摄(也即在有红外打光的情况下通过该红外摄像头进行拍摄)，采集得到K张人脸图像。可以理解的是，在强光环境中，由于存在较强的可见光，红外光的效果微乎其微，因此可以采取上述的分别调用RGB摄像头和红外摄像头进行拍摄的人脸图像采集方式。可以理解的是，基于红外成像的原理，红外灯发射的红外光线用于红外摄像头进行红外拍摄，因此，在利用红外摄像头采集人脸图像时通常需要开启红外灯，而在利用RGB摄像头采集人脸图像时通常关闭该红外灯。可选地，该红外灯可以是一个或多个红外灯，本申请实施例对此不作具体限定。

可选地，终端设备可以通过如下所示的红外灯设置接口控制红外灯：

//前置时(swing)，设置IR开关，即红外模式0，1 0关1开；

private void setIRF(CaptureRequest.Builder builder，int value)。

如上所述，在暗光环境中，其采图策略一般为采集多张在不同强度的红外光打光下的人脸图像，而在强光环境中，其采图策略一般为采集一张或者多张未打红外光的人脸图像，并且采集一张或多张打红外光的人脸图像。如此，根据不同的环境光照强度采取不同的采图策略，调用相应的摄像头进行拍摄，采集人脸图像，大大降低了环境光照强度对活体检测的影响，极大程度上提高了活体检测的准确率，保证了人脸识别技术应用的安全性，进而保证用户的隐私和财产安全。需要说明的是，在上述强光环境中，本申请对打红外光的人脸图像以及未打红外光的人脸图像的采集顺序不作具体限定。

步骤S804，对比N张人脸图像中的目标人脸区域，根据N张人脸图像中的目标人脸区域的差异判断目标人脸是否为活体人脸。

具体地，终端设备可以将采集到的N张人脸图像传输至处理器，处理器对比该N张人脸图像中的目标人脸区域，并根据该N张人脸图像中的目标人脸区域的差异判断该目标人脸是否为活体人脸。

可选地，上述对比N张人脸图像中的目标人脸区域，根据N张人脸图像中的目标人脸区域的差异判断目标人脸是否为活体人脸的步骤具体可以包括以下步骤S21-步骤S22：

步骤S21，确定N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图。

具体地，首先可以对该N张人脸图像分别进行预处理，其中，预处理过程可以包括人脸检测以及人脸裁剪。可选地，可以参考图9所示的步骤S15，首先可以对该N张人脸图像中的每一张人脸图像进行人脸检测，得到该每一张人脸图像中的目标人脸的检测框坐标。然后，可以根据该每一张人脸图像中的目标人脸的检测框坐标，对该每一张人脸图像进行人脸裁剪，确定该每一张人脸图像中的目标人脸区域。可选地，可以参考图9所示的步骤S16，在确定N张人脸图像中的每一张人脸图像中的目标人脸区域后，可以对其中每相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图。其中，M为大于或者等于1，且小于N的整数。例如，将N张人脸图像中的第i张人脸图像中的目标人脸区域与第i+1张人脸图像中的目标人脸区域的像素相减，得到像素相减后的人脸图像；然后，对像素相减后的人脸图像进行直方图均衡化，得到第i张人脸图像和第i+1张人脸图像对应的人脸差异图，如此便可以得到M张人脸差异图。其中，i为大于或者等于1，且小于M 的整数。可选地，还可以通过计算相邻两张人脸图像中目标人脸区域的像素的方差，再进行直方图均衡化的方法实现差异计算，得到人脸差异图，等等，本申请实施例对此不作具体限定。可选地，也可以对该N张人脸图像中的任意两张人脸差异图中的目标人脸区域进行差异计算，得到相应的人脸差异图。

例如，在环境光照强度为2lux(比如黑暗的街道)，预设值为5lux的情况下，也即环境光照强度小于预设值的情况下，可以采取完全红外摄像的采图策略，一共采集得到三张人脸图像，该三张人脸图像分别为人脸图像a、人脸图像b和人脸图像c。其中，人脸图像a可以是在红外光照强度为30lux的情况下通过红外摄像头采集得到的人脸图像；人脸图像b可以是在红外光照强度为40lux的情况下通过红外摄像头采集得到的人脸图像；人脸图像c可以是在红外光照强度为50lux的情况下通过红外摄像头采集得到的人脸图像。此时，终端设备可以将人脸图像a与人脸图像b中的目标人脸区域的像素进行相减，再对像素相减后得到的图像进行直方图均衡化，由此得到本次活体检测的第一张人脸差异图；然后，终端设备可以将人脸图像b与人脸图像c中的目标人脸区域的像素进行相减，再对像素相减后得到的图像进行直方图均衡化，由此得到本次活体检测的第二张人脸差异图。如此，完成了人脸图像的帧间差异计算，也即完成了对每相邻两张人脸图像的差异计算。可选地，终端设备也可以仅仅选择人脸图像a与人脸图像b进行差异计算，得到人脸差异图，用于后续的活体检测；还可以仅仅选择人脸图像b与人脸图像c进行差异计算，得到人脸差异图，用于后续的活体检测；还可以仅仅选择人脸图像a与人脸图像c进行差异计算，得到人脸差异图，用于后续的活体检测，等等，本申请实施例对此不作具体限定。一般情况下，本申请实施例中的活体检测方法通常会出3帧或者4帧人脸图像(也即采集3张或者4张人脸图像)，并计算得到一张或者多张人脸差异图，用于后续的活体检测，本申请实施例对此不作具体限定。

又例如，在环境光照强度为50lux(比如开灯的室内)，预设值为5lux的情况下，也即环境光照强度大于预设值的情况下，可以采取部分红外摄像的采图策略，一共采集得到三张人脸图像，该三张人脸图像分别为人脸图像d、人脸图像e和人脸图像f。其中，人脸图像d可以是在红外光照强度为0lux的情况下(也即关闭红外灯的情况下)通过RGB摄像头采集得到的人脸图像；人脸图像e可以是在红外光照强度为55lux的情况下通过红外摄像头采集得到的人脸图像；人脸图像f可以是在红外光照强度为60lux的情况下通过红外摄像头采集得到的人脸图像。此时，终端设备可以将人脸图像d与人脸图像e中的目标人脸区域的像素进行相减，再对像素相减后得到的图像进行直方图均衡化，由此得到本次活体检测的第一张人脸差异图；然后，终端设备可以将人脸图像e与人脸图像f中的目标人脸区域的像素进行相减，再对像素相减后得到的图像进行直方图均衡化，由此得到本次活体检测的第二张人脸差异图。如此，完成了人脸图像的帧间差异计算，也即完成了对每相邻两张人脸图像的差异计算。可选地，如上所述，终端设备也可以仅仅选择人脸图像d与人脸图像e进行差异计算，得到人脸差异图，用于后续的活体检测；还可以仅仅选择人脸图像e与人脸图像f进行差异计算，得到人脸差异图，用于后续的活体检测；还可以仅仅选择人脸图像d与人脸图像f进行差异计算，得到人脸差异图，用于后续的活体检测，等等，本申请实施例对此不作具体限定。

可选地，请参阅图10，图10是本申请实施例提供的一组室外真人与室外照片的实验结果对比示意图。如图10所示，人脸图像1和人脸图像2可以为在同一次室外场景(例如环境光照强度为60lux)的活体检测中采集到的人脸图像。其中，人脸图像1可以为在红外光照强度1(例如为0lux，也即未开启红外光)下针对真人的目标人脸1(也即活体人脸)拍摄得到人脸图像。人脸图像2可以为在红外光照强度2(例如为65lux，也即开启红外光)下针对真人的目标人脸1拍摄得到人脸图像。在将人脸图像1与人脸图像2中的目标人脸区域的像素进行相减后得到的图像如图10所示，其整体偏暗，无法看清，此时，可以通过对其进行直方图均衡化以提高图像质量，得到如图10所示的真人的人脸差异图，显然，在如图10所示的该真人的人脸差异图中，目标人脸1的五官清晰，脸部轮廓较为明显。请一并参阅图10，如图10所示，人脸图像3和人脸图像4可以为在同一次室外场景(例如环境光照强度为60lux)的活体检测中采集到的人脸图像。其中，人脸图像3可以为在红外光照强度3(例如为0lux，也即未开启红外光)下针对照片的目标人脸2(也即非活体人脸)拍摄得到人脸图像。人脸图像4可以为在红外光照强度4(例如为65lux，也即开启红外光)下针对照片的目标人脸2拍摄得到人脸图像。在将人脸图像3与人脸图像4中的目标人脸区域的像素进行相减后得到的图像如图10所示，其整体偏暗，无法看清，此时，可以通过对其进行直方图均衡化得到如图10所示的照片的人脸差异图，显然，在如图10所示的该照片的人脸差异图中，目标人脸2的五官模糊，脸部轮廓不明显。

可选地，请参阅图11，图11是本申请实施例提供的一组室内真人与室内照片的实验结果对比示意图。如图11所示，在室内场景下进行活体检测，得到的真人的人脸差异图和照片的人脸差异图存在较大差距，其中，在如图11所示的真人的人脸差异图中，目标人脸的五官清晰，脸部轮廓较为明显，而在如图11所示的照片的人脸差异图中，目标人脸的五官模糊，脸部轮廓不明显，此处不再进行赘述。

通过上述图10以及图11相关实施例的描述可知，活体人脸与非活体人脸的人脸差异图存在明显的区分。因此，可以通人脸差异图判断当前进行活体检测的目标人脸是否为活体人脸，从而可以提升活体检测的性能，大大提高活体检测的准确率，有效阻止攻击者利用他人的照片或者面具进行人脸识别，以盗用他人的隐私信息和窃取他人财产的违法犯罪行为。

步骤S22，将M张人脸差异图输入至预先训练的活体检测模型，判断目标人脸是否为活体人脸。

具体地，终端设备将通过差异计算得到的M张人脸差异图输入至预先训练的活体检测模型，通过该活体检测模型可以判断该目标人脸是否为活体人脸。可选地，可以参考图9所示的步骤S17和步骤S18。请参阅图12，图12是本申请实施例提供的一种活体检测的过程示意图。例如，如图12所示，在该活体检测中采集了2张人脸图像，可以包括在红外光照强度5下采集到的人脸图像5，以及在红外光照强度6下采集到的人脸图像6。可选地，如图12所示的此次活体检测的环境光照强度可以为40lux，该红外光照强度5可以为0lux，也即该人脸图像5可以为关闭红外灯，利用RGB摄像头进行拍摄，采集得到的人脸图像；该红外光照强度6可以为50lux，也即该人脸图像6可以为开启红外灯，利用红外摄像头进行拍摄，采集得到的人脸图像。可选地，如图12所示，该活体检测模型可以包括深度恢复网络和分类器。可选地，如图12所示，可以对该人脸图像5和人脸图像6中的目标人脸区域进行差异计算，得到相应的人脸差异图(图12中未示出)，可选地，可以将该人脸差异图通过法向量表示(也即图12所示的法向量提示)，然后将其输入至该活体检测模型中的深度恢复网络，通过深度图估计，得到目标人脸区域的深度图。然后，可以通过该分类器基于该目标人脸区域的深度图判断该目标人脸是否为活体人脸，也即可以通过该分类器直接输出本次活体检测的检测结果。显然，本申请提供的活体检测流程可以完全由终端设备完成，检测效率高，对比上述论述的现有技术中的活体检测算法具有更好的实时性，增强了用户体检。如图12所示，该分类器的输出结果可以为活体人脸或者非活体人脸(又或者，可以为真脸或者假脸，等等，本申请实施例对此不作具体限定)。可选地，若一次活体检测中通过差异计算得到多张人脸差异图，则可将该多张人脸差异图一并输入至该活体检测模型的深度恢复网络中，得到多张目标人脸区域的深度图，然后通过该分类器基于该多张目标人脸区域的深度图判断该目标人脸是否为活体人脸。

请参阅图13，图13是本申请实施例提供的一种活体检测模型的网络结构示意图。如图13所示，该活体检测模型可以包含两类输入，分别为第一类人脸差异图(image_face1)和第二类人脸差异图(image_face2)。其中，第一类人脸差异图可以为未打红外光下采集的人脸图像与红外打光下采集的人脸图像之间的人脸差异图；第二类人脸差异图可以为在不同强度的红外打光下采集的人脸图像之间的人脸差异图。可选地，样机文件(prototxt)中的输入(input)以及输入维度(input_dim)可以如下所示：

input:"image_face1"

input_dim:1

input_dim:256

input:"image_face2"

input_dim:1

input_dim:256

可选地，该活体检测模型的训练过程可以包括以下步骤S31-步骤S32：

步骤S31，获取正样本集和负样本集，该正样本集可以包括多张第一人脸差异图，该负样本集可以包括多张第二人脸差异图。其中，该多张第一人脸差异图中的每一张第一人脸差异图可以为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；该多张第二人脸差异图中的每一张第二人脸差异图可以为分别在两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图。其中，上述两个红外光照强度中的至少一个红外光照强度大于0，也即正样本集中的多张第一人脸差异图可以包括上述的第一类人脸差异图，也可以包括上述的第二类人脸差异图；并且，负样本集中的多张第二人脸差异图可以包括上述的第一类人脸差异图，也可以包括上述的第二类人脸差异图。

步骤S32，以多张第一人脸差异图和多张第二人脸差异图作为训练输入，以该多张第一人脸差异图和该多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，不断修正初始网络中的一个或多个参数，从而训练得到所述活体检测模型，此处不再进行赘述。

本申请实施例提供了一种活体检测方法，可以根据当前场景下的环境光照强度，在人脸识别的活体检测中制定不同的采图策略，设置不同的红外光照强度，并在该不同的红外光照强度(例如可以包括多个数值大于0的红外光照强度，还可以包括数值等于0的红外光照强度，也即关闭红外灯)下分别进行拍摄，采集得到多张人脸图像。然后根据该多张人脸图像中的目标人脸区域之间的差异，判断该目标人脸是否为活体人脸。如此，对比现有技术中，不考虑环境光照强度，仅仅根据预设的方案通过屏幕光源打光或者红外打光的方式采集人脸图像，然后根据采集到的图像进行活体检测，容易被攻击者用人脸照片、面具或者视频等方法攻破的方案而言。本申请实施例不仅考虑到了环境光照强度的影响，还通过不同打光下采集到的人脸图像之间的差异进行活体检测，大大降低了环境光照强度对活体检测的影响，极大程度上提高了活体检测的准确率，保证了人脸识别技术应用的安全性，进而保证用户的隐私和财产安全。

除此之外，需要说明的是，本申请旨在灵活的地根据不同的环境光照强度采取不同的采图策略，进一步调用相应的摄像头在不打红外光或者在不同强度的红外打光的情况下进行拍摄，采集得到用于活体检测的多张图像，从而进一步通过采集得到的图像之间的差异判断该活体检的对象是否为活体。因此，进一步地，本申请实施例所提供的一种活体检测方法还可以应用于除人脸外的其他活体检测，例如家禽、野生动物等的活体检测，等等，本申请实施例对此不作具体限定。

请参阅图14，图14是本申请实施例提供的一种活体检测装置的结构示意图，该活体检测装置可以应用于终端设备，所述终端设备可以包括红外摄像模块，所述红外摄像模块可以包括红外灯。该活体检测装置可以包括装置30，该装置30可以包括第一获取单元301、确定单元302、采集单元303和活体检测单元304，其中，各个单元的详细描述如下。

第一获取单元301，用于获取环境光照强度；

确定单元302，用于根据所述环境光照强度，确定所述红外灯的N个红外光照强度；

采集单元303，用于基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；

活体检测单元304，用于对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。

在一种可能的实现方式中，所述终端设备还包括RGB摄像头，所述红外摄像模块还包括红外摄像头；所述采集单元303，具体用于：

在一种可能的实现方式中，所述活体检测单元304，具体用于：

在一种可能的实现方式中，所述活体检测单元304，还具体用于：

在一种可能的实现方式中，所述装置30还包括：

第二获取单元305，用于获取正样本集和负样本集，所述正样本集包括多张第一人脸差异图，所述负样本集包括多张第二人脸差异图；所述多张第一人脸差异图中的每一张第一人脸差异图为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；所述多张第二人脸差异图中的每一张第二人脸差异图为分别在所述两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图；所述两个红外光照强度中的至少一个红外光照强度大于0；

训练单元306，用于以所述多张第一人脸差异图和所述多张第二人脸差异图作为训练输入，以所述多张第一人脸差异图和所述多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，训练得到所述活体检测模型。

需要说明的是，本申请实施例中所描述的活体检测装置中各功能单元的功能可参见上述图8中所述的方法实施例中步骤S801-步骤S804的相关描述，此处不再进行赘述。

图14中每个单元可以以软件、硬件、或其结合实现。以硬件实现的单元可以包括路及电炉、算法电路或模拟电路等。以软件实现的单元可以包括程序指令，被视为是一种软件产品，被存储于存储器中，并可以被处理器运行以实现相关功能，具体参见之前的介绍。

基于上述方法实施例以及装置实施例的描述，本申请实施例还提供一种终端设备。请参阅图15，图15是本申请实施例提供的一种终端设备的结构示意图，该终端设备至少包括处理器401，输入设备402、输出设备403和计算机可读存储介质404，该终端设备还可以包括其他通用部件，在此不再详述。其中，终端设备内的处理器401，输入设备402、输出设备403和计算机可读存储介质404可通过总线或其他方式连接。该输入设备402可以包括红外摄像模块，该红外摄像模块可以包括红外摄像头和红外灯，可以在弱光环境或者强光环境下开启红外灯，并调节不同的红外光照强度利用该红外摄像头进行红外摄像，采集多张用于活体检测的人脸图像。该输入设备402还可以包括RGB摄像头，可以在强光环境下利用该RGB摄像头进行拍摄，采集一张或多张用于活体检测的人脸图像。可选地，该红外摄像头可以为2D近红外摄像头，或者其他可实现上述功能的摄像头，等等。本申请实施例对此不作具体限定。

处理器401可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

该终端设备内的存储器可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

计算机可读存储介质404可以存储在终端设备的存储器中，所述计算机可读存储介质404用于存储计算机程序，所述计算机程序包括程序指令，所述处理器401用于执行所述计算机可读存储介质404存储的程序指令。处理器401(或称CPU(Central Processing Unit，中央处理器))是终端设备的计算核心以及控制核心，其适于实现一条或一条以上指令，具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能；在一个实施例中，本申请实施例所述的处理器401可以用于进行活体检测的一系列处理，包括：获取环境光照强度；根据所述环境光照强度，确定红外灯的N个红外光照强度；基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸，等等。

需要说明的是，本申请实施例中所描述的终端设备中各功能单元的功能可参见上述图8中所述的方法实施例中的步骤S801-步骤S804的相关描述，此处不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

本申请实施例还提供了一种计算机可读存储介质(Memory)，所述计算机可读存储介质是终端设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机可读存储介质既可以包括终端设备中的内置存储介质，当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了终端设备的操作系统。并且，在该存储空间中还存放了适于被处理器401加载并执行的一条或一条以上的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机可读存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器；可选地还可以是至少一个位于远离前述处理器的计算机可读存储介质。

本申请实施例还提供一种计算机程序，该计算机程序包括指令，当该计算机程序被计算机执行时，使得计算机可以执行任意一种活体检测方法的部分或全部步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可能可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以为个人计算机、服务端或者网络设备等，具体可以是计算机设备中的处理器)执行本申请各个实施例上述方法的全部或部分步骤。其中，而前述的存储介质可包括：U盘、移动硬盘、磁碟、光盘、只读存储器(Read-OnlyMemory，缩写：ROM)或者随机存取存储器(RandomAccessMemory，缩写：RAM)等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种活体检测方法，其特征在于，应用于终端设备，所述终端设备包括红外摄像模块，所述红外摄像模块包括红外灯，所述方法包括：

获取环境光照强度；

根据所述环境光照强度，确定所述红外灯的N个红外光照强度；

基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；

对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。
根据权利要求1所述的方法，其特征在于，若所述环境光照强度小于预设值，则所述N个红外光照强度中的每一个红外光照强度均大于0；若所述环境光照强度大于或者等于所述预设值，则所述N个红外光照强度中的P个红外光照强度均等于0，所述N个红外光照强度中的K个红外光照强度均大于0；其中，P、K为大于或者等于1的整数，P与K的和为N。
根据权利要求2所述的方法，其特征在于，所述终端设备还包括RGB摄像头，所述红外摄像模块还包括红外摄像头；所述基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像，包括：

若所述环境光照强度小于所述预设值，则开启所述红外灯，并通过所述红外摄像头分别在所述N个红外光照强度下进行拍摄，采集得到所述N张人脸图像；

若所述环境光照强度大于或者等于所述预设值，则关闭所述红外灯，并通过所述RGB摄像头分别在所述P个红外光照强度下进行拍摄，采集得到P张人脸图像；以及开启所述红外灯，并通过所述红外摄像头分别在所述K个红外光照强度下进行拍摄，采集得到K张人脸图像。
根据权利要求1-3任意一项所述的方法，其特征在于，对比所述N张人脸图像中的目标人脸区域，并根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸，包括：

确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图；其中，M为大于或者等于1，且小于N的整数；

将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸。
根据权利要求4所述的方法，其特征在于，所述确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图，包括：

对所述N张人脸图像中的每一张人脸图像进行人脸检测，得到所述每一张人脸图像中的所述目标人脸的检测框坐标；

根据所述每一张人脸图像中的所述目标人脸的检测框坐标，对所述每一张人脸图像进行人脸裁剪，确定所述每一张人脸图像中的目标人脸区域；

将第i张人脸图像中的目标人脸区域与第i+1张人脸图像中的目标人脸区域的像素相减，得到像素相减后的人脸图像；

对所述像素相减后的人脸图像进行直方图均衡化，得到第i张人脸图像和第i+1张人脸图像对应的人脸差异图；i为大于或者等于1，且小于M的整数。
根据权利要求4-5任意一项所述的方法，其特征在于，所述活体检测模型包括深度恢复网络和分类器；所述将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸，包括：

将所述M张人脸差异图输入至所述活体检测模型中的所述深度恢复网络，得到所述M张人脸差异图对应的M张目标人脸区域的深度图；

基于所述M张目标人脸区域的深度图，通过所述分类器判断所述目标人脸是否为活体人脸。
根据权利要求4-6任意一项所述的方法，其特征在于，所述方法还包括：

获取正样本集和负样本集，所述正样本集包括多张第一人脸差异图，所述负样本集包括多张第二人脸差异图；所述多张第一人脸差异图中的每一张第一人脸差异图为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；所述多张第二人脸差异图中的每一张第二人脸差异图为分别在所述两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图；所述两个红外光照强度中的至少一个红外光照强度大于0；

以所述多张第一人脸差异图和所述多张第二人脸差异图作为训练输入，以所述多张第一人脸差异图和所述多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，训练得到所述活体检测模型。
一种活体检测装置，其特征在于，应用于终端设备，所述终端设备包括红外摄像模块，所述红外摄像模块包括红外灯，所述装置包括：

第一获取单元，用于获取环境光照强度；

确定单元，用于根据所述环境光照强度，确定所述红外灯的N个红外光照强度；

采集单元，用于基于所述N个红外光照强度调节所述红外灯，并分别在所述N个红外光照强度下进行拍摄，采集得到N张人脸图像；所述N张人脸图像中的每一张人脸图像包括目标人脸；其中，N为大于或者等于2的整数；

活体检测单元，用于对比所述N张人脸图像中的目标人脸区域，根据所述N张人脸图像中的目标人脸区域的差异判断所述目标人脸是否为活体人脸。
根据权利要求8所述的装置，其特征在于，若所述环境光照强度小于预设值，则所述N个红外光照强度中的每一个红外光照强度均大于0；若所述环境光照强度大于或者等于所述预设值，则所述N个红外光照强度中的P个红外光照强度均等于0，所述N个红外光照强度中的K个红外光照强度均大于0；其中，P、K为大于或者等于1的整数，P与K的和为N。
根据权利要求9所述的装置，其特征在于，所述终端设备还包括RGB摄像头，所述红外摄像模块还包括红外摄像头；所述采集单元，具体用于：

若所述环境光照强度小于所述预设值，则开启所述红外灯，并通过所述红外摄像头分别在所述N个红外光照强度下进行拍摄，采集得到所述N张人脸图像；

若所述环境光照强度大于或者等于所述预设值，则关闭所述红外灯，并通过所述RGB摄像头分别在所述P个红外光照强度下进行拍摄，采集得到P张人脸图像；以及开启所述红外灯，并通过所述红外摄像头分别在所述K个红外光照强度下进行拍摄，采集得到K张人脸图像。
根据权利要求8-10任意一项所述的装置，其特征在于，所述活体检测单元，具体用于：

确定所述N张人脸图像中的每一张人脸图像中的目标人脸区域，并对相邻两张人脸图像中的目标人脸区域进行差异计算，得到M张人脸差异图；其中，M为大于或者等于1，且小于N的整数；

将所述M张人脸差异图输入至预先训练的活体检测模型，判断所述目标人脸是否为活体人脸。
根据权利要求11所述的装置，其特征在于，所述活体检测单元，还具体用于：

对所述N张人脸图像中的每一张人脸图像进行人脸检测，得到所述每一张人脸图像中的所述目标人脸的检测框坐标；

根据所述每一张人脸图像中的所述目标人脸的检测框坐标，对所述每一张人脸图像进行人脸裁剪，确定所述每一张人脸图像中的目标人脸区域；

将第i张人脸图像中的目标人脸区域与第i+1张人脸图像中的目标人脸区域的像素相减，得到像素相减后的人脸图像；

对所述像素相减后的人脸图像进行直方图均衡化，得到第i张人脸图像和第i+1张人脸图像对应的人脸差异图；i为大于或者等于1，且小于M的整数。
根据权利要求11-12任意一项所述的装置，其特征在于，所述活体检测单元，还具体用于：

将所述M张人脸差异图输入至所述活体检测模型中的所述深度恢复网络，得到所述M 张人脸差异图对应的M张目标人脸区域的深度图；

基于所述M张目标人脸区域的深度图，通过所述分类器判断所述目标人脸是否为活体人脸。
根据权利要求11-13任意一项所述的装置，其特征在于，所述装置还包括：

第二获取单元，用于获取正样本集和负样本集，所述正样本集包括多张第一人脸差异图，所述负样本集包括多张第二人脸差异图；所述多张第一人脸差异图中的每一张第一人脸差异图为分别在两个红外光照强度下对活体人脸进行拍摄，采集得到的两张活体人脸图像的人脸差异图；所述多张第二人脸差异图中的每一张第二人脸差异图为分别在所述两个红外光照强度下对非活体人脸进行拍摄，采集得到的两张非活体人脸图像的人脸差异图；所述两个红外光照强度中的至少一个红外光照强度大于0；

训练单元，用于以所述多张第一人脸差异图和所述多张第二人脸差异图作为训练输入，以所述多张第一人脸差异图和所述多张第二人脸差异图各自对应于活体人脸或非活体人脸为标签，训练得到所述活体检测模型。
一种终端设备，其特征在于，包括处理器和存储器，所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如权利要求1至7任意一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述权利要求1至7任意一项所述的方法。
一种计算机程序，其特征在于，所述计算机程序包括指令，当所述计算机程序被计算机执行时，使得所述计算机执行如权利要求1至7任意一项所述的方法。