CN112329696A

CN112329696A - 人脸活体检测方法、系统、设备及存储介质

Info

Publication number: CN112329696A
Application number: CN202011292181.1A
Authority: CN
Inventors: 沈涛; 罗超; 胡泓; 李巍
Original assignee: Ctrip Computer Technology Shanghai Co Ltd
Current assignee: Ctrip Computer Technology Shanghai Co Ltd
Priority date: 2020-11-18
Filing date: 2020-11-18
Publication date: 2021-02-05

Abstract

本发明提供了一种人脸活体检测方法、系统、设备及存储介质，该方法包括：采集训练样本图像；将训练样本图像输入人脸活体检测模型中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支；分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，并根据所述损失函数训练所述人脸活体检测模型；将待检测的图像输入训练好的所述人脸活体检测模型，得到输出的活体分类结果，所述活体分类结果包括检测到的至少一个活体属性类别。本发明提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了活体检测效果。

Description

人脸活体检测方法、系统、设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种人脸活体检测方法、系统、设备及存储介质。

背景技术

人脸活体检测是在一些身份验证场景确定对象真实生理特征的方法，在人脸识别应用中，活体检测能通过眨眼、张嘴、摇头、点头等组合动作，使用人脸关键点定位和人脸追踪等技术，验证用户是否为真实活体本人操作。可有效抵御照片、换脸、面具、遮挡以及屏幕翻拍等常见的攻击手段，从而帮助用户甄别欺诈行为，保障用户的利益。

现有技术中已经出现了一种基于CNN-RNN(卷积神经网络-递归神经网络)模型进行人体活性检测的方法，其使用深度图和rPPG(Remote Photoplethysmography，远程光电体积描记术)信号进行空间域和时间域的辅助监督，这种方法主要体现在论文《LearningDeep Models for Face Anti-Spoofing:Binary or Auxiliary Supervision》。然而，这种方法也存在一些问题，其需要视频作为输入信号来建立rPPG信号，同时rPPG信号在开放环境容易受到干扰。视频相对于图片来说，数据量太大，会大大增加处理时间。此外，这种方法使用真实的深度图来监督，会导致样本成本过高，限制了训练样本的规模，进而影响模型训练的效果。

发明内容

针对现有技术中的问题，本发明的目的在于提供一种人脸活体检测方法、系统、设备及存储介质，提供一种简单的辅助监督信号，监督活体检测模型的训练，提升活体检测效果。

本发明实施例提供一种人脸活体检测方法，包括如下步骤：

采集训练样本图像；

将训练样本图像输入人脸活体检测模型中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支；

分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，并根据所述损失函数训练所述人脸活体检测模型；

将待检测的图像输入训练好的所述人脸活体检测模型，得到输出的活体分类结果，所述活体分类结果包括检测到的至少一个活体属性类别。

在一些实施例中，所述训练样本图像输入所述傅里叶监督分支后，所述傅里叶监督分支对所述训练样本图像进行傅里叶变换和归一化后，尺寸调整至预设尺寸。

在一些实施例中，所述训练样本图像输入所述深度监督分支后，所述深度监督分支对负样本图像采用PRNet生成预设尺寸的伪深度图，对正样本图像采用预设尺寸的像素值全为0的图像作为深度图。

在一些实施例中，所述特征提取网络采用残差网络和金字塔网络，所述残差网络为resnet18网络或resnet34网络，所述金字塔网络的输出分别连接第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。

在一些实施例中，分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，包括如下步骤：

根据所述第一输出辅助监督分支的输出与所述傅里叶监督分支的输出计算傅里叶监督分支损失函数；

根据所述第二输出辅助监督分支的输出与所述深度监督分支的输出计算深度监督分支损失函数；

所述第三输出辅助监督分支的输出输入所述活体分类分支，得到所述活体分类分支的分类结果；

根据所述活体分类分支的分类结果和所述训练样本图像的标签计算活体分类分支损失函数。

在一些实施例中，所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支采用相同的结构，且所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支分别包括卷积层。

在一些实施例中，根据所述损失函数训练所述人脸活体检测模型，包括如下步骤：

将傅里叶监督分支损失函数、深度监督分支损失函数和活体分类分支损失函数加权求和，得到所述人脸活体检测模型的损失函数；

采用随机梯度下降的方式迭代训练所述人脸活体检测模型。

在一些实施例中，傅里叶监督分支损失函数采用MES损失函数，深度监督损失函数采用CLD损失函数。

在一些实施例中，分类分支损失函数包括人脸属性损失函数、欺骗类型损失函数、光照损失函数、环境损失函数和正负分类损失函数。

在一些实施例中，所述人脸属性损失函数采用BCE损失函数，所述欺骗类型损失函数、所述光照损失函数和所述环境损失函数分别采用CrossEntropy损失函数，所述正负分类损失函数采用arcface损失函数。

本发明的人脸活体检测方法通过增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了活体检测效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

本发明实施例还提供一种人脸活体检测系统，用于实现所述的人脸活体检测方法，其特征在于，所述系统包括：

样本采集模块，用于采集训练样本图像；

模型输入模块，用于将训练样本图像输入人脸活体检测模型中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支；

模型训练模块，用于分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，并根据所述损失函数训练所述人脸活体检测模型；

活体检测模块，用于将待检测的图像输入训练好的所述人脸活体检测模型，得到输出的活体分类结果，所述活体分类结果包括检测到的至少一个活体属性类别。

本发明的人脸活体检测系统通过增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了活体检测效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

本发明实施例还提供一种人脸活体检测设备，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行所述的人脸活体检测方法的步骤。

本发明的人脸活体检测设备的处理器执行所述存储器中的可执行指令时，实现所述人脸活体检测方法的步骤，因此，所述人脸活体检测设备也可以实现上述人脸活体检测方法的技术效果。

本发明实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被处理器执行时实现所述的人脸活体检测方法的步骤。

本发明的计算机可读存储介质中的可执行指令被处理器执行时，实现所述人脸活体检测方法的步骤，因此，所述计算机可读存储介质也可以实现上述人脸活体检测方法的技术效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显。

图1是本发明一实施例的人脸活体检测方法的流程图；

图2是本发明一实施例的人脸活体检测模型的示意图；

图3是本发明一实施例的金字塔层输出辅助监督分支结构示意图；

图4是本发明一实施例的活体分类分支的示意图；

图5是本发明一实施例的人脸活体检测系统的结构示意图；

图6是本发明一实施例的人脸活体检测设备的结构示意图；

图7是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

如图1所示，本发明实施例提供一种人脸活体检测方法，包括如下步骤：

S100：采集训练样本图像，所述训练样本图像具有是否为活体的标记；

S200：将训练样本图像输入人脸活体检测模型中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支；

S300：分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，并根据所述损失函数训练所述人脸活体检测模型；

S400：将待检测的图像输入训练好的所述人脸活体检测模型，得到输出的活体分类结果，所述活体分类结果包括检测到的至少一个活体属性类别，所述活体属性类别例如可以包括是否为活体的分类类别，还可以进一步根据需要增加活体性别的分类类别，活体年龄分段的分类类别等等，如果不是活体，则可以按照攻击类型分类等等。

本发明的人脸活体检测方法通过步骤S100～S300训练人脸活体检测模型，并且在人脸活体检测模型中增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了通过步骤S400进行待检测的图像中活体检测的效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

在该实施例中，所述步骤S100中采集训练样本图像，采用CelebA-Spoof数据集，该数据集中主要有两种图像，spoof图表示非活体图像，live图表示活体图像。CelebA-Spoof的攻击类型很丰富，共划分为四大攻击类型，分别为打印Print(照片、海报、A4纸)、剪纸PaperCut(仅纸质人脸、含有上身的纸质人脸和抠掉不同五官部位的纸质人脸)、重播Replay(电脑、平板和手机等屏幕人脸)及3DMask(面具类型)，并在丰富的光照条件(正常光、强光、背光和暗光)和环境(室内和室外)下按照上述三个维度交叉组合进行数据采集。因此，CelebA-Spoof具有数据量大、数据丰富多样、标注信息丰富等多种优势，可以很好地应用于人脸活体检测模型的训练。

如图2所示，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支。特征提取网络提取得到的特征图分别用于与傅里叶监督分支和深度监督分支计算对应分支的损失函数，并且特征提取网络提取得到的特征图可以用于活体分类分支进行活体检测分类。所述傅里叶监督分支包括傅里叶变换、归一化和尺寸缩放。具体地，所述训练样本图像输入所述傅里叶监督分支后，所述傅里叶监督分支对所述训练样本图像进行傅里叶变换，生成傅里叶频谱，然后进行中心化和归一化后，尺寸调整至预设尺寸，例如224*224。计算所述傅里叶监督分支的损失函数时，基于所述傅里叶频谱和所述特征提取网络提取的特征图来进行计算损失函数。

在该实施例中，所述训练样本图像输入所述深度监督分支后，所述深度监督分支对负样本图像采用PRNet生成预设尺寸的伪深度图，且该伪深度图与输入的训练样本图像的尺寸相同，例如缩放到224*224，对正样本图像采用预设尺寸的像素值全为0的图像作为深度图，且该深度图与输入的训练样本图像的尺寸相同，例如缩放到224*224。计算所述深度监督分支的损失函数时，基于所述伪深度图或深度图与所述特征提取网络提取的特征图来进行计算损失函数。在所述训练样本图像采用CelebA-Spoof数据集时，负样本图像就是spoof图像，正样本图像就是live图像。

所述特征提取网络的输出分别连接第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。在该实施例中，所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支采用相同的结构，且所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支分别包括卷积层。如图3示出了连接于特征提取网络之后的金字塔层输出辅助监督分支网络，傅里叶监督分支、深度监督分支和活体分类分支分别采用了一个图3的网络结构，即所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支分别采用图3的网络结构。金字塔输出特征映射的尺寸如下表1所示，对于辅助监督分支(傅里叶监督分支和深度监督分支)最后cat并reshape特征映射为B*224*224，对于活体分类分支最后cat并通过一个k＝7*7的卷积层，及BN(Batch Normalization，批归一化)层和activate层(激活函数层)，输出通道维数为分类数2。图3中A表示特征图，B表示stride＝2，k＝3*3的图像，C表示stride＝1，k＝3*3的图像。

表1特征金字塔输出特征映射尺寸

P3	B25656*56	B2567*7
			P4	B25628*28	B2567*7
P5	B25614*14	B2567*7
			P6	B2567*7	B2567*7

如图4所示，所述特征提取网络采用resnet34网络和四层的金字塔网络BiFPN，所述金字塔网络BiFPN的输出分别连接所述第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。在其他的实施方式中，resnet34网络也可以变更为resnet18网络。Resnet网络即为残差网络。残差网络主要是通过残差块组成的，在深度学习网络中引入残差块后，网络可以达到很深，网络的效果也随之变好，图像识别准确率很高。Resnet18网络包括17个卷积层和一个全连接层，单层物体检测算法中，无法用单一层的特征图同时有效的表征各个尺度的物体，因此，后来物体检测算法，就逐渐发展为利用不同层的特征图，形成特征金字塔网络(FPN，Feature Parymid Network)，表征不同层的物体，然后再基于特征金字塔做物体检测。BiFPN是一种效果较好的双向融合的特征金字塔网络。

在该实施例中，所述步骤S300中，分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，包括如下步骤：

根据所述第一输出辅助监督分支的输出特征图与所述傅里叶监督分支的输出傅里叶频谱图计算傅里叶监督分支损失函数；

根据所述第二输出辅助监督分支的输出特征图与所述深度监督分支的输出深度图计算深度监督分支损失函数；

所述第三输出辅助监督分支的输出特征图输入所述活体分类分支，得到所述活体分类分支的分类结果；

根据所述活体分类分支的分类结果和所述训练样本图像预先标记的分类标签计算活体分类分支损失函数。

在该实施例中，所述步骤S300中，根据所述损失函数训练所述人脸活体检测模型，包括如下步骤：

采用随机梯度下降的方式迭代训练所述人脸活体检测模型。

在该实施例中，傅里叶监督分支损失函数采用MES损失函数，权重例如是0.8，深度监督损失函数采用CLD损失函数，权重例如是0.8。分类分支损失函数包括人脸属性faceattribute损失函数、欺骗类型spoof type损失函数、光照ilumination损失函数、环境environment损失函数和正负分类损失函数。具体地，所述人脸属性损失函数采用BCE损失函数，权重例如是0.5，所述欺骗类型损失函数、所述光照损失函数和所述环境损失函数分别采用CrossEntropy损失函数，权重例如分别为0.5,0.1,0.01，所述正负分类损失函数采用arcface损失函数，权重例如是1.0。此处权重值仅为举例，在其他可替代的实施方式中，权重也可以为其他数值，并可以根据需要调整。

所述损失函数为交叉熵函数，优化器使用随机梯度下降(Stochastic GradientDescent，SGD)，lr为1e-1，weight_decay为5e-4，momentum为0.9，训练使用P100，batchsize为128，epoch为100。此处列举的选择的损失函数的类型、分类分支损失函数的分类、优化器的类型等等均为示例，在其他可替代的实施方式中，均可以进行调整而采用与上述列举的不同的方式，均属于本发明的保护范围之内。

如图5所示，本发明实施例还提供一种人脸活体检测系统，用于实现所述的人脸活体检测方法，其特征在于，所述系统包括：

样本采集模块M100，用于采集训练样本图像，所述训练样本图像具有是否为活体的标记；

模型输入模块M200，用于将训练样本图像输入人脸活体检测模型中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支；

模型训练模块M300，用于分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，并根据所述损失函数训练所述人脸活体检测模型；

活体检测模块M400，用于将待检测的图像输入训练好的所述人脸活体检测模型，得到输出的活体分类结果，所述活体分类结果包括检测到的至少一个活体属性类别，所述活体属性类别例如可以包括是否为活体的分类类别，还可以进一步根据需要增加活体性别的分类类别，活体年龄分段的分类类别等等。

本发明的人脸活体检测系统通过样本采集模块M100、模型输入模块M200和模型训练模块M300训练人脸活体检测模型，并且在人脸活体检测模型中增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了通过活体检测模块M400进行待检测的图像中活体检测的效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

本发明的人脸活体检测系统中，各个模块的功能可以采用如上所述的人脸活体检测方法的具体实施方式来实现。例如，样本采集模块M100可以采用CelebA-Spoof数据集中的图像作为训练样本图像。该数据集中主要有两种图像，spoof图表示非活体图像，live图表示活体图像。并且，CelebA-Spoof具有数据量大、数据丰富多样、标注信息丰富等多种优势，可以很好地应用于人脸活体检测模型的训练。

所述人脸活体检测模型可以采用如图2～图4所示出的网络结构。其中，所述人脸活体检测模型包括特征提取网络、傅里叶监督分支、深度监督分支和活体分类分支。特征提取网络提取得到的特征图分别用于与傅里叶监督分支和深度监督分支计算对应分支的损失函数，并且特征提取网络提取得到的特征图可以用于活体分类分支进行活体检测分类。所述傅里叶监督分支包括傅里叶变换、归一化和尺寸缩放。具体地，所述训练样本图像输入所述傅里叶监督分支后，所述傅里叶监督分支对所述训练样本图像进行傅里叶变换，生成傅里叶频谱，然后进行中心化和归一化后，尺寸调整至预设尺寸。所述训练样本图像输入所述深度监督分支后，所述深度监督分支对负样本图像采用PRNet生成预设尺寸的伪深度图，且该伪深度图与输入的训练样本图像的尺寸相同，对正样本图像采用预设尺寸的像素值全为0的图像作为深度图，且该深度图与输入的训练样本图像的尺寸相同。

所述特征提取网络的输出分别连接第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。在该实施例中，所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支采用相同的结构，且所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支分别包括卷积层。所述第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支可以分别采用如图3所示的网络结构。所述特征提取网络采用resnet18网络或resnet34网络和四层的金字塔网络BiFPN，所述金字塔网络BiFPN的输出分别连接所述第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。

所述模型训练模块M300可以采用上述步骤S300的具体实施方式计算所述人脸活体检测模型的损失函数，并且迭代优化训练所述人脸活体检测模型。具体地，根据所述第一输出辅助监督分支的输出特征图与所述傅里叶监督分支的输出傅里叶频谱图计算傅里叶监督分支损失函数；根据所述第二输出辅助监督分支的输出特征图与所述深度监督分支的输出深度图计算深度监督分支损失函数；所述第三输出辅助监督分支的输出特征图输入所述活体分类分支，得到所述活体分类分支的分类结果；根据所述活体分类分支的分类结果和所述训练样本图像预先标记的分类标签计算活体分类分支损失函数；将傅里叶监督分支损失函数、深度监督分支损失函数和活体分类分支损失函数加权求和，得到所述人脸活体检测模型的损失函数；采用随机梯度下降的方式迭代训练所述人脸活体检测模型。

本发明实施例还提供一种人脸活体检测设备，包括处理器；存储器，其中存储有所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行所述的人脸活体检测方法的步骤。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“平台”。

下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于：至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元610执行，使得所述处理单元610执行本说明书上述人脸活体检测方法部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元610可以执行如图1中所示的步骤。

所述存储单元620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202，还可以进一步包括只读存储单元(ROM)6203。

所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204，这样的程序模块6205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备600交互的设备通信，和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且，电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

本发明的人脸活体检测设备的处理器执行所述存储器中的可执行指令时，实现所述人脸活体检测方法的步骤，因此，所述人脸活体检测设备也可以实现上述人脸活体检测方法的技术效果。即通过步骤S100～S300训练人脸活体检测模型，并且在人脸活体检测模型中增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了通过步骤S400进行待检测的图像中活体检测的效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

本发明实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被处理器执行时实现所述的人脸活体检测方法的步骤。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上执行时，所述程序代码用于使所述终端设备执行本说明书上述人脸活体检测方法部分中描述的根据本发明各种示例性实施方式的步骤。

参考图7所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品800，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上执行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本发明的计算机可读存储介质中的可执行指令被处理器执行时，实现所述人脸活体检测方法的步骤，因此，所述计算机可读存储介质也可以实现上述人脸活体检测方法的技术效果。即通过步骤S100～S300训练人脸活体检测模型，并且在人脸活体检测模型中增加傅里叶监督分支和深度监督分支，分别生成傅里叶频谱和生成深度图，从而对活体分类分支进行监督，提供了一种简单的辅助监督信号，监督活体检测模型的训练，提升了通过步骤S400进行待检测的图像中活体检测的效果，本发明无需利用视频作为输入信号来建立rPPG信号，也不容易受环境影响，提高了检测的稳定性和准确性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种人脸活体检测方法，其特征在于，包括如下步骤：

采集训练样本图像；

2.根据权利要求1所述的人脸活体检测方法，其特征在于，所述训练样本图像输入所述傅里叶监督分支后，所述傅里叶监督分支对所述训练样本图像进行傅里叶变换和归一化后，尺寸调整至预设尺寸。

3.根据权利要求1所述的人脸活体检测方法，其特征在于，所述训练样本图像输入所述深度监督分支后，所述深度监督分支对负样本图像采用PRNet生成预设尺寸的伪深度图，对正样本图像采用预设尺寸的像素值全为0的图像作为深度图。

4.根据权利要求1所述的人脸活体检测方法，其特征在于，所述特征提取网络采用残差网络和金字塔网络，所述残差网络为resnet18网络或resnet34网络，所述金字塔网络的输出分别连接第一输出辅助监督分支、第二输出辅助监督分支和第三输出辅助监督分支。

5.根据权利要求4所述的人脸活体检测方法，其特征在于，分别计算所述傅里叶监督分支、深度监督分支和活体分类分支的损失函数，包括如下步骤：

6.根据权利要求4所述的人脸活体检测方法，其特征在于，所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支采用相同的结构，且所述第一输出辅助监督分支、所述第二输出辅助监督分支和所述第三输出辅助监督分支分别包括卷积层。

7.根据权利要求1所述的人脸活体检测方法，其特征在于，根据所述损失函数训练所述人脸活体检测模型，包括如下步骤：

采用随机梯度下降的方式迭代训练所述人脸活体检测模型。

8.根据权利要求1所述的人脸活体检测方法，其特征在于，傅里叶监督分支损失函数采用MES损失函数，深度监督损失函数采用CLD损失函数。

9.根据权利要求1所述的人脸活体检测方法，其特征在于，分类分支损失函数包括人脸属性损失函数、欺骗类型损失函数、光照损失函数、环境损失函数和正负分类损失函数。

10.根据权利要求9所述的人脸活体检测方法，其特征在于，所述人脸属性损失函数采用BCE损失函数，所述欺骗类型损失函数、所述光照损失函数和所述环境损失函数分别采用CrossEntropy损失函数，所述正负分类损失函数采用arcface损失函数。

11.一种人脸活体检测系统，用于实现权利要求1至10中任一项所述的人脸活体检测方法，其特征在于，所述系统包括：

样本采集模块，用于采集训练样本图像；

12.一种人脸活体检测设备，其特征在于，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至10中任一项所述的人脸活体检测方法的步骤。

13.一种计算机可读存储介质，用于存储程序，其特征在于，所述程序被处理器执行时实现权利要求1至10中任一项所述的人脸活体检测方法的步骤。