WO2019096029A1

WO2019096029A1 - 活体识别方法、存储介质和计算机设备

Info

Publication number: WO2019096029A1
Application number: PCT/CN2018/114096
Authority: WO
Inventors: 吴双; 丁守鸿; 梁亦聪; 刘尧; 李季檩
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-11-20
Filing date: 2018-11-06
Publication date: 2019-05-23
Also published as: US20200257914A1; CN107818313A; CN107818313B; US11176393B2

Abstract

一种活体识别方法，包括：获取目标图像；提取所述目标图像中人脸图像的人脸特征数据；根据所述人脸特征数据进行活体识别，得到第一置信度；所述第一置信度表示识别到活体的第一概率；从人脸扩展图像中提取背景特征数据；所述人脸扩展图像是扩展所述人脸图像所在区域得到的；根据所述背景特征数据进行活体识别，得到第二置信度；所述第二置信度表示识别到活体的第二概率；根据所述第一置信度和所述第二置信度，得到活体人脸图像判别结果。

Description

活体识别方法、存储介质和计算机设备

本申请要求于2017年11月20日提交中国专利局，申请号为2017111590398，申请名称为“活体识别方法、装置、存储介质和计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别是涉及一种活体识别方法、存储介质和计算机设备。

背景技术

随着计算机技术的不断发展，用户可以通过计算机完成的操作越来越多，比如申请贷款、远程考试或者远程遥控等。用户在进行各种操作前通常需要进行身份验证，而人脸活体判别作为身份验证的一种有效手段，已在较多的场景中有所应用。

传统的人脸活体判别技术中，通常需要结合一定的交互动作，比如摇头、眨眼等，以通过检测交互动作来区分真人和照片。然而，这种判别方式需要用户配合，只有用户按照提示做出正确的交互动作后，才能通过活体检测，从而导致活体检测率低。

发明内容

根据本申请提供的各种实施例，提供一种活体识别方法、存储介质和计算机设备。

一种活体识别方法，包括：

计算机设备获取目标图像；

所述计算机设备提取所述目标图像中人脸图像的人脸特征数据；

所述计算机设备根据所述人脸特征数据进行活体识别，得到第一置信度；所述第一置信度表示识别到活体的第一概率；

所述计算机设备从人脸扩展图像中提取背景特征数据；所述人脸扩展图像是扩展所述人脸图像所在区域得到的；

所述计算机设备根据所述背景特征数据进行活体识别，得到第二置信度；所述第二置信度表示识别到活体的第二概率；及

所述计算机设备根据所述第一置信度和所述第二置信度，得到活体人脸图像判别结果。

一种存储有计算机可读指令的非易失性存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：获取目标图像；

提取所述目标图像中人脸图像的人脸特征数据；

根据所述人脸特征数据进行活体识别，得到第一置信度；所述第一置信度表示识别到活体的第一概率；

从人脸扩展图像中提取背景特征数据；所述人脸扩展图像是扩展所述人脸图像所在区域得到的；

根据所述背景特征数据进行活体识别，得到第二置信度；所述第二置信度表示识别到活体的第二概率；及

根据所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的识别结果。

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

获取目标图像；

提取所述目标图像中人脸图像的人脸特征数据；

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中活体识别方法的应用环境图；

图2为另一个实施例中活体识别方法的应用环境图；

图3为一个实施例中活体识别方法的流程示意图；

图4为一个实施例中多尺度区域划分的示意图；

图5为一个实施例中识别模型使用的示意图；

图6为一个实施例中识别模型训练的示意图；

图7为另一个实施例中活体识别方法的流程示意图；

图8为一个实施例中活体识别装置的模块结构图；

图9为另一个实施例中活体识别装置的模块结构图；

图10为一个实施例中计算机设备的内部结构图；及

图11为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中活体识别方法的应用环境图。参照图1，该活体识别方法用于活体识别系统。该活体识别系统包括终端110和服务器120。其中，终端110和服务器120通过网络连接。终端110可用于执行该活体识别方法，终端110也可从现实场景中采集包含人脸的目标图像，将采集得到的目标图像发送至服务器120，使得服务器120执行该活体识别方法。终端110具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120具体可以是独立的服务器，也可以是多个独立的服务器组成的服务器集群。

图2为另一个实施例中活体识别方法的应用环境图。参照图2，该活体识别方法用于活体识别系统。该活体识别系统具体可以是门禁控制系统。该门禁控制系统包括人脸采集摄像头210和计算机设备220。人脸采集摄像头210可通过通信接口与计算机设备220连接。人脸采集摄像头210用于从现实场景中采集包含人脸的目标图像，将采集得到的目标图像发送至计算机设备220，使得计算机设备220执行该活体识别方法。计算机设备220可以是终端，也可以是服务器。

图3为一个实施例中活体识别方法的流程示意图。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图3，该活体识别方法具体包括如下步骤：

S302，获取目标图像。

其中，目标图像是待进行活体人脸图像判别的图像。目标图像可以是对活体进行图像采集得到的图像帧，也可以是对包含人脸的已有图像翻拍得到的图像帧。可以理解的是，正是因为目标图像可以是活体人脸图像，也可以是非活体人脸图像，因此本发明所提供的实施例正是用于判别目标图像是否为活体人脸图像的技术方案。

具体地，终端可通过内置的摄像头，或者外置的与终端关联的摄像头，在摄像头当前的视野下，采集现实场景的图像帧，获取采集得到的图像帧。终端在采集到图像帧后，可检测该图像帧中是否存在人脸图像，若存在人脸图像，则获取该图像帧作为目标图像并发送至服务器，服务器从而获取到目标图像。终端也可在采集到图像帧后，直接将采集的图像帧发送至服务器，服务器再检测该图像帧中是否存在人脸图像，若存在人脸图像，则获取该图像帧作为目标图像。

其中，采集现实场景的图像帧可以是采集现实场景中活体的图像帧，也可以是采集现实场景中包含人脸的已有图像的图像帧。包含人脸的已有图像，比如屏幕上显示的二维图像、身份证件或者人脸照片等。

在一个实施例中，终端可调用摄像头开启摄像扫描模式，并实时扫描摄像头视野中的目标对象，并按照一定的帧率实时地生成图像帧，所生成的图像帧可缓存在终端本地。其中，摄像头视野可以是在终端的显示界面上所呈现出的摄像头可扫描到拍摄到的区域。终端可检测所生成的帧图像中是否存在人脸图像，若是，则获取所生成的帧图像作为目标图像并发送至服务器，服务器从而获取到目标图像。其中，目标对象可以是现实场景中的活体，也可以是包含人脸的已有图像。

在一个实施例中，运行于终端上的应用程序在与相应的服务器交互并需要进行身份验证时，可调用终端内置的摄像头，或者外置的与终端关联的摄像头，在摄像头当前的视野下，采集现实场景的图像帧，获取采集得到的图像帧，进而得到目标图像，将目标图像发送至应用程序相应的服务器。其中，需要进行身份验证的场景，比如社交应用程序中真人实名认证或者账号解封申诉等，再比如银行应用程序中银行账号开户等。

在一个实施例中，在门禁控制系统中，人脸采集摄像头可在摄像头当前的视野下，采集现实场景的图像帧，再将采集得到的图像帧发送至计算机设备，计算机设备在接收到图像帧后，可检测该图像帧中是否存在人脸图像，若存在人脸图像，则获取该图像帧作为目标图像。

S304，提取目标图像中人脸图像的人脸特征数据。

其中，人脸特征数据是用于反映人脸特征的数据。人脸特征数据可以反映出人的性别、人脸的轮廓、发型、眼镜、鼻子、嘴以及各个脸部器官之间的距离等其中的一种或多种特征信息。

在一个实施例中，人脸特征数据可包括面部纹理数据。面部纹理数据可反映面部器官，包括鼻子、耳朵、眉毛、脸颊或嘴唇等的纹理特征与像素点深度。面部纹理数据可以包括面部图像像素点颜色值分布和面部图像像素点亮度值分布。

具体地，服务器在获取目标图像后，可根据预设的图像特征提取策略提取目标图像中人脸图像的人脸特征数据。其中，预设的图像特征提取策略可以是预设的图像特征提取算法或者预先训练完成的特征提取机器学习模型。

S306，根据人脸特征数据进行活体识别，得到第一置信度；该第一置信度表示识别到活体的第一概率。

其中，置信度与目标图像一一对应，用于表示目标图像是活体人脸图像的可信程度。活体人脸图像是对活体进行图像采集得到的图像。置信度越高，表示相应的目标图像是活体人脸图像的概率越高。也就是说，置信度越高，表示在目标图像是对活体进行图像采集得到的图像的概率越大。可以理解的是，这里的第一置信度和后文中的第二置信度均是置信度，但是对应不同的特征数据条件下的置信度。

具体地，服务器可根据提取的人脸特征数据对目标图像进行分类，在提取的人脸特征数据符合活体人脸图像的人脸特征数据时，将目标图像分类至活体人脸图像类。在提取的人脸特征数据符合非活体人脸图像的人脸特征数据时，将目标图像分类至非活体人脸图像类。其中，第一置信度表示提取的人脸特征数据与活体人脸图像的人脸特征数据的符合程度，提取的人脸特征数据与活体人脸图像的人脸特征数据的符合程度越高，则第一置信度越高，也就是说目标图像为活体人脸图像的可能性越大。

在一个实施例中，服务器也可对提取的人脸特征数据进行傅里叶变换，从而在频域空间进行特征分析。在提取的人脸特征数据的频域特征符合活体人脸图像的人脸特征数据的频域特征时，将目标图像分类至活体人脸图像类。在提取的人脸特征数据的频域特征符合非活体人脸图像的人脸特征数据的频域特征时，将目标图像分类至非活体人脸图像类。

S308，从人脸扩展图像中提取背景特征数据；该人脸扩展图像是扩展人脸图像所在区域得到的。

其中，人脸扩展图像包含人脸图像，是基于人脸图像在目标图像中所在区域扩展得到的区域而截取的图像。人脸扩展图像的尺寸大于人脸图像的尺寸。比如，人脸扩展图像所在的区域可以是将人脸图像所在区域向四个方向分别扩展一倍得到，此时人脸扩展图像的横向尺寸为人脸图像的横向尺寸的三倍，人脸扩展图像的纵向尺寸为人脸图像的纵向尺寸的三倍。可以理解的是，这里不对人脸扩展图像的尺寸与人脸图像的尺寸的比例关系作限定，可随实际应用场景的需要设定，只需要满足人脸扩展图像包含人脸图像，且人脸扩展图像的尺寸大于人脸图像的尺寸即可。

背景特征数据是反映图像中背景部分特征的数据。背景特征数据包括背景图像像素点颜色值分布以及背景图像像素连续性特征等。可以理解的是，由于翻拍照片得到的图像帧是采集二维平面图像得到的图像帧，图像帧中可能存在二维平面图像的边框或者边界，此时图像帧中该边框或者边界处的图像像素不连续，而针对活体采集的图像帧是从现实场景中采集三维立体对象得到的图像帧则不会出现此种情况。

具体地，服务器在获取目标图像后，可根据预设区域扩展方式，得到扩展人脸图像所在区域后形成的人脸扩展图像，再根据预设的图像特征提取策略提取目标图像中人脸扩展图像的背景特征数据。其中，预设区域扩展方式可以是仅一个方向上扩展或者是多个方向上均进行扩展。预设的图像特征提取策略可以是预设的图像特征提取算法或者预先训练完成的特征提取机器学习模型。

在一个实施例中，服务器可仅对人脸扩展图像中人脸图像以外的背景图像提取背景特征数据，也可对人脸扩展图像提取背景特征数据。

S310，根据背景特征数据进行活体识别，得到第二置信度；该第二置信度表示识别到活体的第二概率。

具体地，服务器可根据提取的背景特征数据对目标图像进行分类，在提取的背景特征数据符合活体人脸图像的背景特征数据时，将目标图像分类至活体人脸图像类。在提取的背景特征数据符合非活体人脸图像的背景特征数据时，将目标图像分类至非活体人脸图像类。其中，第二置信度表示提取的背景特征数据与活体人脸图像的背景特征数据的符合程度，提取的背景特征数据与活体人脸图像的背景特征数据的符合程度越高，则第二置信度越高，也就是说目标图像为活体人脸图像的可能性越大。

在一个实施例中，通过预先训练完成的机器学习模型提取的背景特征数据，是机器学习模型在训练过程中经过学习后提取的用于反映活体人脸图像或非活体人脸图像的特征数据。由于翻拍照片得到的图像帧中可能存在照片的边框或者边界，而针对活体采集的图像帧则不存在边框或边界，也就是说，边框或者边界特征能够有效地区分活体人脸图像和非活体人脸图像。那么可以理解的是，机器学习模型所学会的提取的特征数据可以包括边框特征数据或者边界特征数据。

S312，根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果。

具体地，由于第一置信度和第二置信度都是目标图像为活体人脸图像的置信度，而且是根据不同的图像特征分析得到的置信度，因此，服务器可将这两个置信度融合，得到最终的置信度，从而根据最终的置信度得到目标图像是否为活体人脸图像的识别结果。

进一步地，在身份验证场景下，服务器在得到目标图像是否为活体人脸图像的识别结果后，即可根据该识别结果以及人脸识别结果得到身份验证是否通过的验证结果，并执行验证结果相应的操作。这样能在极大程度上保证是用户本人进行的操作。比如，银行应用程序中银行账号开户中，若判定目标图像是活体人脸图像且人脸识别匹配，则身份验证通过，并继续后续的开户操作。再比如，门禁控制场景下，若判定目标图像是活体人脸图像且人脸识别匹配，则身份验证通过，并输出开门指令。

上述活体识别方法，在获取到目标图像后，一方面可自动对目标图像中人脸图像进行人脸特征数据提取，进而根据人脸特征数据进行活体识别，得到识别到活体的概率，另一方面还可自动对目标图像中人脸扩展图像提取背景特征数据，进而根据背景特征数据进行活体识别，得到识别到活体的概率，这样结合两个概率即可得到目标图像是否为活体人脸图像的识别结果，既在一定程度上保证了活体检测的准确性，又避免了需要用户配合交互带来的耗时，从而提高了活体检测效率。

在一个实施例中，S304包括：确定目标图像中的人脸区域；按照人脸区域在目标图像中截取人脸图像；将人脸图像输入第一识别模型，通过第一识别模型提取人脸图像的人脸特征数据。

其中，人脸区域是人脸在目标图像中位置。具体地，服务器可通过人脸检测算法识别目标图像中的人脸区域。人脸检测算法可根据需要自定义，如可为OpenCV人脸检测算法、IOS、Android系统自带的人脸检测算法或者优图人脸检测算法等。人脸检测算法可以返回目标图像中是否包含人脸以及具体的人脸区域，如通过矩形框标识人脸的位置。服务器在确定目标图像中的人脸区域后，可沿该人脸区域截取目标图像得到人脸图像。在本实施例中，人脸图像可仅包括人脸面部区域的图像。

图4示出了一个实施例中多尺度区域划分的示意图。参考图4左图，该图为通过终端摄像头采集到的目标图像。区域411为人脸区域，按照区域411截取的图像为人脸图像。参考图4右图，该图为门禁控制系统中人脸采集摄像头采集得到的目标图像。区域421为人脸区域，按照区域421截取的图像为人脸图像。

识别模型是经过训练后具有特征提取与特征识别能力的机器学习模型。机器学习英文全称为Machine Learning，简称ML。机器学习模型可通过样本学习具备特征提取与特征识别能力。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。可以理解的是，这里的第一识别模型和后文中的第二识别模型均是识别模型，但是提取不同的特征数据的识别模型。

在本实施例中，第一识别模型用于提取目标图像中人脸图像的人脸特征数据。

在一个实施例中，第一识别模型可以是由多层互相连接而形成的复杂网络模型。第一识别模型可包括多层特征提取层，每层特征提取层都有对应的模型参数，每层的模型参数可以是多个，每层特征提取层中的模型参数对输入的图像进行线性或非线性变化，得到特征图(Feature Map)作为运算结果。每个特征提取层接收前一层的运算结果，经过自身的运算，对下一层输出本层的运算结果。其中，模型参数是模型结构中的各个参数，能反应模型各层输出和输入的对应关系。

具体地，服务器在截取到人脸图像后，将人脸图像输入第一识别模型中，第一识别模型中包括的特征提取层逐层对输入的人脸图像进行线性或非线性变化操作，直至第一识别模型中最后一层特征提取层完成线性或非线性变化操作，服务器从而根据第一识别模型最后一层特征提取层输出的结果，得到针对当前输入图像提取的人脸特征数据。

在一个实施例中，第一识别模型可以是已经训练完成的通用的具有特征提取能力的机器学习模型。在将通用的机器学习模型用于特定场景进行提取时效果不佳，因此需要通过专用于特定场景的样本对通用的机器学习模型进行进一步训练和优化。在本实施例中，服务器可获取根据通用的机器学习模型的模型结构和模型参数，并将该模型参数导入第一识别模型结构，得到带有模型参数的第一识别模型。第一识别模型所带的模型参数，作为本实施例中训练第一识别模型的初始参数参与到训练中。

在一个实施例中，第一识别模型也可以是开发人员根据历史模型训练经验初始化的机器学习模型。服务器直接将初始化的机器学习模型中所带的模型参数，作为本实施例中训练第一识别模型的初始参数参与到训练中。其中，第一识别模型的参数初始化可以为高斯随机初始化。

在一个实施例中，将人脸图像输入第一识别模型，通过第一识别模型提取人脸图像的人脸特征数据，包括：将人脸图像输入第一识别模型；通过第一识别模型的卷积层提取人脸图像的人脸特征数据。S306包括：通过第一识别模型的全连接层，根据提取的人脸特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第一置信度。

其中，卷积层是卷积神经网络中的特征提取层。卷积层可以是多层，每层卷积层都有对应的卷积核，每层的卷积核可以是多个。卷积层通过卷积核对输入的图像进行卷积运算，提取图像特征得到特征图作为运算结果。

全连接层(fully connected layers，FC)是卷积神经网络中的特征分类层，用于根据学习到的分布式特征映射关系将提取的特征映射到相应的分类。

具体地，服务器在截取到人脸图像后，将人脸图像输入第一识别模型中，第一识别模型中包括的卷积层逐层对输入的人脸图像进行卷积操作，直至第一识别模型中最后一层卷积层完成卷积操作，再将最后一层卷积层输出的结果作为全连接层的输入，得到目标图像为活体人脸图像的第一置信度。

在一个实施例中，第一置信度可以直接是全连接层输出的目标图像为活体人脸图像的分数。第一置信度也可以是服务器通过回归层(softmax层)将全连接层输出的分数归一化后得到的位于数值范围(0,1)内的数值。此时，第一置信度也可以理解为目标图像为活体人脸图像的概率。

在本实施例中，识别模型的卷积层所输出的特征图，可以更好地反映出对相应输入图像提取的特性，从而可以根据反映特征的特征图采用全连接层分类得到目标图像为活体人脸图像的置信度，并保证识别模型的识别准确性。

图5示出了一个实施例中识别模型使用的示意图。参考图5左图，该图为第一识别模型使用的示意图。服务器获取到目标图像后，从目标图像中截取出人脸图像，将人脸图像输入第一识别模型，第一识别模型的多层卷积层逐层作卷积运算，每个卷积层接收前一层的运算结果，经过自身的运算，对下一层输出本层的运算结果，最后一层卷积层再将运算结果输入全连接层，全连接层输出目标图像为活体人脸图像的分数，回归层(softmax层)再将全连接层输出的分数归一化后得到的位于数值范围(0,1)内的数值，即第一置信度。

上述实施例中，在目标图像中确定人脸区域后，将人脸区域的图像截取下来，仅将人脸区域的图像作为第一识别模型的输入，这样第一识别模型的人脸特征提取并根据提取的人脸特征数据进行目标图像分类时，可避免非人脸区域图像的噪声干扰，识别效果更好。

在一个实施例中，该活体识别方法还包括：获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本；根据第一训练样本训练第一识别模型。

其中，图像样本集中包括若干图像样本。图像样本可以是活体人脸图像和非活体人脸图像。活体人脸图像和非活体人脸图像的数量比可以是1:1或者其他比例。

具体地，服务器可从图像样本集中图像样本中截取人脸图像得到第一训练样本。其中，服务器可将从活体人脸图像中截取出的人脸图像作为正训练样本，将从非活体人脸图像中截取出的人脸图像作为负训练样本，通过正负训练样本训练第一识别模型的分类能力，以将目标图像分类为活体人脸图像或者非活体人脸图像。

在一个实施例中，根据第一训练样本训练第一识别模型，包括：获取初始化的第一识别模型；确定第一训练样本相对应的第一训练标签；将第一训练样本输入第一识别模型得到第一识别结果；按照第一识别结果与第一训练标签的差异，调整第一识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

具体地，初始化的第一识别模型，可以是将已经训练完成的通用的具有识别能力的机器学习模型的模型参数导入第一识别模型结构，得到带有模型参数的第一识别模型。第一识别模型所带的模型参数，作为本实施例中训练第一识别模型的初始参数参与到训练中。初始化的第一识别模型，也可以是开发人员根据历史模型训练经验初始化的机器学习模型。服务器直接将初始化的机器学习模型中所带的模型参数，作为本实施例中训练第一识别模型的初始参数参与到训练中。第一识别模型的参数初始化可以为高斯随机初始化。

进一步地，服务器可对每个第一训练样本添加训练标签。训练标签用于表示第一训练样本所截取自的图像样本是否为活体人脸图像。服务器再根据第一训练样本和相应添加的训练标签训练第一识别模型。在具体训练过程中，将第一训练样本输出第一识别模型后，第一识别模型会输出第一识别结果，这时服务器可将第一识别结果，与输入的第一训练样本的训练标签进行对比，并朝向减小差异的方向调整第一识别模型的模型参数。

其中，训练停止条件可以是达到预设迭代次数，也可以是训练出的机器学习模型达到分类性能指标。分类性能指标可以是分类正确率达到第一预设阈值，也可以是分类错误率低于第二预设阈值。

服务器还可从第一训练样本中划分出部分训练样本用作测试样本。测试样本是用于在模型训练后进行模型矫正的样本。采用测试样本对训练得到的第一识别模型进行校准，具体可以是将测试样本输入训练得到的第一识别模型，将该第一识别模型的输出与测试样本的训练标签进行对比，若两者之间的差值落在允许的误差范围内，则完成对第一识别模型的校准，若两者之间的差值落在允许的误差范围外，则对第一识别模型进行参数调整，减少两者之间的差值，以完成对第一识别模型的校准。

服务器还可根据第一识别模型的实际输出和预期输出建立代价函数，采用随机梯度下降法最小化代价函数，更新第一识别模型的模型参数。代价函数比如方差代价函数或者交叉熵代价函数等。

在本实施例中，以活体人脸图像和非活体人脸图像训练第一识别模型，可以根据机器学习模型的分类性能动态地调整模型参数，可以更加准确、高效地完成训练任务。

图6示出了一个实施例中识别模型使用的示意图。参考图6左图，该图为通过第一识别模型训练的示意图。服务器获取到图像样本后，从图像样本中截取出人脸图像作为第一训练样本，并为第一训练样本添加训练标签。服务器再将第一训练样本输入第一识别模型，第一识别模型的多层卷积层逐层作卷积运算，每个卷积层接收前一层的运算结果，经过自身的运算，对下一层输出本层的运算结果，最后一层卷积层再将运算结果输入全连接层，全连接层输出训练样本的分类结果。服务器再根据分类结果和训练标签的差异建立代价函数，通过最小化代价函数来调整模型参数。

上述实施例中，利用机器学习模型强大的学习和表示能力进行识别能力学习，所训练得到的机器学习模型对目标图像是否为活体人脸图像进行识别，较传统方法对目标图像进行识别的效果更好。

在一个实施例中，S308包括：确定目标图像中的人脸区域；扩展人脸区域得到人脸扩展区域；按照人脸扩展区域在目标图像中截取人脸扩展图像；将人脸扩展图像输入第二识别模型，通过第二识别模型提取人脸扩展图像的背景特征数据。

其中，人脸扩展图像包含人脸图像，是基于人脸图像在目标图像中所在区域扩展得到的区域而截取的图像。人脸扩展图像的尺寸大于人脸图像的尺寸。服务器可预先设置用于扩展得到人脸扩展图像的扩展方式，并在确定目标图像中的人脸区域后，按照该扩展方式扩展得到人脸扩展区域。服务器再沿该人脸扩展区域截图目标图像得到人脸扩展图像。其中，预设区域扩展方式可以是仅一个方向上扩展或者是多个方向上均进行扩展。

在一个实施例中，通过终端摄像头采集的目标图像由于摄像头的视野范围小，可以直接将目标图像作为人脸扩展图像。

参考图4左图，该图为通过终端摄像头采集到的目标图像。区域411为人脸区域，区域412为扩展区域411得到的人脸扩展区域，按照区域412截取的图像为人脸扩展图像。参考图4右图，该图为门禁控制系统中人脸采集摄像头采集得到的目标图像。区域421为人脸区域，区域422为扩展区域421得到的人脸扩展区域，按照区域422截取的图像为人脸扩展图像。

在本实施例中，第二识别模型用于提取目标图像中人脸扩展图像的背景特征数据。

具体地，服务器在截取到人脸扩展图像后，将人脸扩展图像输入第二识别模型中，第二识别模型中包括的特征提取层逐层对输入的人脸图像进行线性或非线性变化操作，直至第二识别模型中最后一层特征提取层完成线性或非线性变化操作，服务器从而根据第二别模型最后一层特征提取层输出的结果，得到针对当前输入图像提取的背景特征数据。

在一个实施例中，将人脸扩展图像输入第二识别模型，通过第二识别模型提取人脸扩展图像的背景特征数据，包括：将人脸扩展图像输入第二识别模型；通过第二识别模型的卷积层提取人脸扩展图像的背景特征数据。S310包括：通过第二识别模型的全连接层，根据提取的背景特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第二置信度。

具体地，服务器在截取到人脸扩展图像后，将人脸扩展图像输入第二识别模型中，第二识别模型中包括的卷积层逐层对输入的人脸图像进行卷积操作，直至第二识别模型中最后一层卷积层完成卷积操作，再将最后一层卷积层输出的结果作为全连接层的输入，得到目标图像为活体人脸图像的第二置信度。

在一个实施例中，第二置信度可以直接是全连接层输出的目标图像为活体人脸图像的分数。第二置信度也可以是服务器通过回归层(softmax层)将全连接层输出的分数归一化后得到的位于数值范围(0,1)内的数值。此时，第二置信度也可以理解为目标图像为活体人脸图像的概率。

参考图5右图，该图为第二识别模型使用的示意图。服务器获取到目标图像后，从目标图像中截取出人脸扩展图像，将人脸扩展图像输入第二识别模型，第二识别模型的多层卷积层逐层作卷积运算，每个卷积层接收前一层的运算结果，经过自身的运算，对下一层输出本层的运算结果，最后一层卷积层再将运算结果输入全连接层，全连接层输出目标图像为活体人脸图像的分数，回归层(softmax层)再将全连接层输出的分数归一化后得到的位于数值范围(0,1)内的数值，即第二置信度。服务器在得到第一置信度和第二置信度后，可将第一置信度和第二置信度融合得到目标图像为活体人脸图像的置信度。

上述实施例中，对目标图像截取人脸扩展图像，并对人脸扩展图像进行背景特征数据提取，以根据背景特征数据来识别目标图像是否为活体图像，由于背景特征数据包括人脸周边的环境信息，可以有效避免翻拍图片冒充真人时图片边框的影响，提高了识别效果。

在一个实施例中，该活体识别方法还包括：获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本；根据第二训练样本训练第二识别模型。

具体地，服务器可从图像样本集中图像样本中截取人脸扩展图像得到第二训练样本。其中，服务器可将从活体人脸图像中截取出的人脸扩展图像作为正训练样本，将从非活体人脸图像中截取出的人脸扩展图像作为负训练样本，通过正负训练样本训练第二识别模型的分类能力，以将目标图像分类为活体人脸图像或者非活体人脸图像。

在一个实施例中，根据第二训练样本训练第二识别模型，包括：获取初始化的第二识别模型；确定第二训练样本相对应的第二训练标签；将第二训练样本输入第二识别模型得到第二识别结果；按照第二识别结果与第二训练标签的差异，调整第二识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

具体地，第二识别模型可通过上述训练第一识别模型的训练方式进行训练。在实际训练过程中，第一识别模型和第二识别模型相互独立，可以并行训练。

参考图6右图，该图为通过第二识别模型训练的示意图。服务器获取到图像样本后，从图像样本中截取出人脸扩展图像作为第二训练样本，并为第二训练样本添加训练标签。服务器再将第二训练样本输入第二识别模型，第二识别模型的多层卷积层逐层作卷积运算，每个卷积层接收前一层的运算结果，经过自身的运算，对下一层输出本层的运算结果，最后一层卷积层再将运算结果输入全连接层，全连接层输出训练样本的分类结果。服务器再根据分类结果和训练标签的差异建立代价函数，通过最小化代价函数来调整模型参数。

在一个实施例中，由于第一识别模型与第二识别模型中靠前的卷积层提取的是图像的基本特征，因此，第一识别模型和第二识别模型可共享靠前的卷积层，再分为两个分支分别训练。这样可以提高模型训练效率。

在一个实施例中，服务器还可联合训练第一识别模型和第二识别模型。具体地，服务器可分别获取第一识别模型与第二识别模型最后一层卷积层输出的特征图，将两个模型输出的特征图融合后得到特征融合图，这样特征融合图中既包括了人脸特征数据又包括了背景特征数据，服务器即可将特征融合图作为全连接层的输入，通过全连接层输出目标图像为活体人脸图像的置信度。

在一个实施例中，S302包括：进入图像采集状态；在图像采集状态下，选取采集的图像帧作为目标图像，选取的图像帧的人脸区域与采集视野下的预设人脸区域匹配。

其中，图像采集状态是摄像头进行扫描以进行图像采集的状态。具体地，运行于终端上的应用程序在与相应的服务器交互并需要进行身份验证时，可调用终端内置的摄像头，或者外置的与终端关联的摄像头，在摄像头当前的视野下扫描目标对象，并在摄像头当前的视野下设置预设人脸区域。终端按照预设的帧率采集图像帧，并将采集的图像帧中的人脸区域与预设人脸区域比较，当图像帧的人脸区域与采集视野下的预设人脸区域匹配时，则选取该图像帧作为目标图像进行候选的活体人脸图像判别。

在本实施例中，通过在采集图像帧中对人脸区域尺寸约束，既能避免目标图像中人脸图像尺寸过小时人脸特征数据的缺失，又能避免目标图像中人脸图像尺寸过大时背景特征数据的缺失，使得识别效果更好。

在一个实施例中，S312包括：融合第一置信度和第二置信度，得到目标图像为活体人脸图像的置信度；当置信度达到预设置信度阈值时，判定目标图像为活体人脸图像。

具体地，服务器可采用预设的融合方式融合第一置信度和第二置信度，得到最终的目标图像为活体人脸图像的置信度。比如，服务器可将第一置信度和第二置信度进行比较，将两个置信度中数值较小的置信度作为最终的置信度。再比如，服务器可对第一置信度和第二置信度求取加权平均值，将计算得到的加权平均值作为最终的置信度。在计算过程中，第一置信度和第二置信度的权重可根据实际场景需要进行调整。在人脸特征数据影响大的场景下第一置信度的权重大于第二置信度的权重。在背景特征数据影响大的场景下则反之。

进一步地，服务器可再将计算得到的最终的置信度与预设置信度阈值进行比较，当最终的置信度达到预设置信度阈值时，则判定目标图像为活体人脸图像，当最终的置信度小于预设置信度阈值时，则判定目标图像为非活体人脸图像。其中，预设置信度阈值是根据经验设定的阈值，并认为高于该阈值的置信度标识可以相信目标图像为活体人脸图像。

在本实施例中，在通过将根据两种图像特征识别得到的置信度融合，综合考虑人脸特征与背景特征的影响，提高了活体识别效果。

如图7所示，在一个具体的实施例中，该活体识别方法具体包括以下步骤：

S702，获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像。

S704，根据图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本。

S706，获取初始化的第一识别模型；确定第一训练样本相对应的第一训练标签；将第一训练样本输入第一识别模型得到第一识别结果；按照第一识别结果与第一训练标签的差异，调整第一识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

S708，根据图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本。

S710，获取初始化的第二识别模型；确定第二训练样本相对应的第二训练标签；将第二训练样本输入第二识别模型得到第二识别结果；按照第二识别结果与第二训练标签的差异，调整第二识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

S712，获取目标图像；确定目标图像中的人脸区域。

S714，按照人脸区域在目标图像中截取人脸图像。

S716，将人脸图像输入第一识别模型；通过第一识别模型的卷积层提取人脸图像的人脸特征数据。

S718，通过第一识别模型的全连接层，根据提取的人脸特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第一置信度。

S720，扩展人脸区域得到人脸扩展区域；按照人脸扩展区域在目标图像中截取人脸扩展图像。

S722，将人脸扩展图像输入第二识别模型；通过第二识别模型的卷积层提取人脸扩展图像的背景特征数据。

S724，通过第二识别模型的全连接层，根据提取的背景特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第二置信度。

S726，融合第一置信度和第二置信度，得到目标图像为活体人脸图像的置信度。

S728，判断置信度是否达到预设置信度阈值；若是，则跳转至步骤S730；若否，则跳转至步骤S732。

S730，判定目标图像为活体人脸图像。

S732，判定目标图像为非活体人脸图像。

本实施例中，在获取到目标图像后，一方面可自动对目标图像中人脸图像进行人脸特征数据提取，进而根据人脸特征数据进行活体识别，得到识别到活体的概率，另一方面还可自动对目标图像中人脸扩展图像提取背景特征数据，进而根据背景特征数据进行活体识别，得到识别到活体的概率，这样结合两个概率即可得到目标图像是否为活体人脸图像的识别结果，既在一定程度上保证了活体检测的准确性，又避免了需要用户配合交互带来的耗时，从而提高了活体检测效率。

应该理解的是，虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

如图8所示，在一个实施例中，提供了一种活体识别装置800。参照图8，该活体识别装置800包括：获取模块801、第一提取模块802、第一识别模块803、第二提取模块804、第二识别模块805和输出模块806。

获取模块801，用于获取目标图像。

第一提取模块802，用于提取目标图像中人脸图像的人脸特征数据。

第一识别模块803，用于根据人脸特征数据进行活体识别，得到第一置信度；第一置信度表示识别到活体的第一概率。

第二提取模块804，用于从人脸扩展图像中提取背景特征数据；人脸扩展图像是扩展人脸图像所在区域得到的。

第二识别模块805，用于根据背景特征数据进行活体识别，得到第二置信度；第二置信度表示识别到活体的第二概率。

输出模块806，用于根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果。

上述活体识别装置800，在获取到目标图像后，一方面可自动对目标图像中人脸图像进行人脸特征数据提取，进而根据人脸特征数据进行活体识别，得到识别到活体的概率，另一方面还可自动对目标图像中人脸扩展图像提取背景特征数据，进而根据背景特征数据进行活体识别，得到识别到活体的概率，这样结合两个概率即可得到目标图像是否为活体人脸图像的识别结果，既在一定程度上保证了活体检测的准确性，又避免了需要用户配合交互带来的耗时，从而提高了活体检测效率。

在一个实施例中，第一提取模块802还用于确定目标图像中的人脸区域；按照人脸区域在目标图像中截取人脸图像；将人脸图像输入第一识别模型，通过第一识别模型提取人脸图像的人脸特征数据。

在一个实施例中，第一提取模块802还用于将人脸图像输入第一识别模型；通过第一识别模型的卷积层提取人脸图像的人脸特征数据。第一识别模块803还用于通过第一识别模型的全连接层，根据提取的人脸特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第一置信度。

如图9所示，在一个实施例中，活体识别装置800还包括：模型训练模块807。

模型训练模块807，用于获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本；根据第一训练样本训练第一识别模型。

在一个实施例中，模型训练模块807还用于获取初始化的第一识别模型；确定第一训练样本相对应的第一训练标签；将第一训练样本输入第一识别模型得到第一识别结果；按照第一识别结果与第一训练标签的差异，调整第一识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

在一个实施例中，第二提取模块804还用于确定目标图像中的人脸区域；扩展人脸区域得到人脸扩展区域；按照人脸扩展区域在目标图像中截取人脸扩展图像；将人脸扩展图像输入第二识别模型，通过第二识别模型提取人脸扩展图像的背景特征数据。

在一个实施例中，第二提取模块804还用于将人脸扩展图像输入第二识别模型；通过第二识别模型的卷积层提取人脸扩展图像的背景特征数据。第二识别模块805还用于通过第二识别模型的全连接层，根据提取的背景特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第二置信度。

在一个实施例中，模型训练模块807还用于获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本；根据第二训练样本训练第二识别模型。

在一个实施例中，模型训练模块807还用于获取初始化的第二识别模型；确定第二训练样本相对应的第二训练标签；将第二训练样本输入第二识别模型得到第二识别结果；按照第二识别结果与第二训练标签的差异，调整第二识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。

在一个实施例中，获取模块801还用于进入图像采集状态；在图像采集状态下，选取采集的图像帧作为目标图像，选取的图像帧的人脸区域与采集视野下的预设人脸区域匹配。

在一个实施例中，输出模块806还用于融合第一置信度和第二置信度，得到目标图像为活体人脸图像的置信度；当置信度达到预设置信度阈值时，判定目标图像为活体人脸图像。

图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或者图2中的计算机设备220。如图10所示，该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、摄像头和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器实现活体识别方法。该内存储器中也可储存有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行活体识别方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏等。本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

图11示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120或者图2中的计算机设备220。如图11所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器实现活体识别方法。该内存储器中也可储存有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行活体识别方法。本领域技术人员可以理解，图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的活体识别装置可以实现为一种计算机可读指令的形式，计算机可读指令可在如图10或图11所示的计算机设备上运行，计算机设备的非易失性存储介质可存储组成该活体识别装置的各个指令模块，比如，图8所示的获取模块801、第一提取模块802、第一识别模块803、第二提取模块804、第二识别模块805和输出模块806等。各个指令模块组成的计算机可读指令使得处理器执行本说明书中描述的本申请各个实施例的活体识别方法中的步骤。

例如，图11所示的计算机设备可以通过如图8所示的活体识别装置800中的获取模块801获取目标图像。通过第一提取模块802提取目标图像中人脸图像的人脸特征数据。通过第一识别模块803根据人脸特征数据进行活体识别，得到第一置信度；第一置信度表示识别到活体的第一概率。通过第二提取模块804从人脸扩展图像中提取背景特征数据；人脸扩展图像是扩展人脸图像所在区域得到的。通过第二识别模块805根据背景特征数据进行活体识别，得到第二置信度；第二置信度表示识别到活体的第二概率。通过输出模块806根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果。

在一个实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时，使得处理器执行以下步骤：获取目标图像；提取目标图像中人脸图像的人脸特征数据；根据人脸特征数据进行活体识别，得到第一置信度；第一置信度表示识别到活体的第一概率；从人脸扩展图像中提取背景特征数据；人脸扩展图像是扩展人脸图像所在区域得到的；根据背景特征数据进行活体识别，得到第二置信度；第二置信度表示识别到活体的第二概率；根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果。

在一个实施例中，提取目标图像中人脸图像的人脸特征数据，包括：确定目标图像中的人脸区域；按照人脸区域在目标图像中截取人脸图像；将人脸图像输入第一识别模型，通过第一识别模型提取人脸图像的人脸特征数据。

在一个实施例中，将人脸图像输入第一识别模型，通过第一识别模型提取人脸图像的人脸特征数据，包括：将人脸图像输入第一识别模型；通过第一识别模型的卷积层提取人脸图像的人脸特征数据。根据人脸特征数据进行活体识别，得到第一置信度，包括：通过第一识别模型的全连接层，根据提取的人脸特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第一置信度。

在一个实施例中，该计算机程序被处理器执行时，还使得处理器执行以下步骤：获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本；根据第一训练样本训练第一识别模型。

在一个实施例中，从人脸扩展图像中提取背景特征数据，包括：确定目标图像中的人脸区域；扩展人脸区域得到人脸扩展区域；按照人脸扩展区域在目标图像中截取人脸扩展图像；将人脸扩展图像输入第二识别模型，通过第二识别模型提取人脸扩展图像的背景特征数据。

在一个实施例中，将人脸扩展图像输入第二识别模型，通过第二识别模型提取人脸扩展图像的背景特征数据，包括：将人脸扩展图像输入第二识别模型；通过第二识别模型的卷积层提取人脸扩展图像的背景特征数据。根据背景特征数据进行活体识别，得到第二置信度，包括：通过第二识别模型的全连接层，根据提取的背景特征数据对目标图像进行分类，得到目标图像为活体人脸图像的第二置信度。

在一个实施例中，该计算机程序被处理器执行时，还使得处理器执行以下步骤：获取图像样本集，图像样本集包括活体人脸图像和非活体人脸图像；根据图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本；根据第二训练样本训练第二识别模型。

在一个实施例中，获取目标图像，包括：进入图像采集状态；在图像采集状态下，选取采集的图像帧作为目标图像，选取的图像帧的人脸区域与采集视野下的预设人脸区域匹配。

在一个实施例中，根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果，包括：融合第一置信度和第二置信度，得到目标图像为活体人脸图像的置信度；当置信度达到预设置信度阈值时，判定目标图像为活体人脸图像。

上述存储介质，在获取到目标图像后，一方面可自动对目标图像中人脸图像进行人脸特征数据提取，进而根据人脸特征数据进行活体识别，得到识别到活体的概率，另一方面还可自动对目标图像中人脸扩展图像提取背景特征数据，进而根据背景特征数据进行活体识别，得到识别到活体的概率，这样结合两个概率即可得到目标图像是否为活体人脸图像的识别结果，既在一定程度上保证了活体检测的准确性，又避免了需要用户配合交互带来的耗时，从而提高了活体检测效率。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中储存有计算机程序，计算机程序被处理器执行时，使得处理器执行以下步骤：获取目标图像；提取目标图像中人脸图像的人脸特征数据；根据人脸特征数据进行活体识别，得到第一置信度；第一置信度表示识别到活体的第一概率；从人脸扩展图像中提取背景特征数据；人脸扩展图像是扩展人脸图像所在区域得到的；根据背景特征数据进行活体识别，得到第二置信度；第二置信度表示识别到活体的第二概率；根据第一置信度和第二置信度，得到目标图像为活体人脸图像的识别结果。

上述计算机设备，在获取到目标图像后，一方面可自动对目标图像中人脸图像进行人脸特征数据提取，进而根据人脸特征数据进行活体识别，得到识别到活体的概率，另一方面还可自动对目标图像中人脸扩展图像提取背景特征数据，进而根据背景特征数据进行活体识别，得到识别到活体的概率，这样结合两个概率即可得到目标图像是否为活体人脸图像的识别结果，既在一定程度上保证了活体检测的准确性，又避免了需要用户配合交互带来的耗时，从而提高了活体检测效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种活体识别方法，包括：

计算机设备获取目标图像；

所述计算机设备提取所述目标图像中人脸图像的人脸特征数据；

所述计算机设备根据所述人脸特征数据进行活体识别，得到第一置信度；所述第一置信度表示识别到活体的第一概率；

所述计算机设备从人脸扩展图像中提取背景特征数据；所述人脸扩展图像是扩展所述人脸图像所在区域得到的；

所述计算机设备根据所述背景特征数据进行活体识别，得到第二置信度；所述第二置信度表示识别到活体的第二概率；及

所述计算机设备根据所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的识别结果。
根据权利要求1所述的方法，其特征在于，所述计算机设备提取所述目标图像中人脸图像的人脸特征数据，包括：

所述计算机设备确定所述目标图像中的人脸区域；

所述计算机设备按照所述人脸区域在所述目标图像中截取人脸图像；及

所述计算机设备将所述人脸图像输入第一识别模型，通过所述第一识别模型提取所述人脸图像的人脸特征数据。
根据权利要求2所述的方法，其特征在于，所述计算机设备将所述人脸图像输入第一识别模型，通过所述第一识别模型提取所述人脸图像的人脸特征数据，包括：

所述计算机设备将所述人脸图像输入第一识别模型；及

所述计算机设备通过所述第一识别模型的卷积层提取所述人脸图像的人脸特征数据；

所述计算机设备根据所述人脸特征数据进行活体识别，得到第一置信度，包括：

所述计算机设备通过所述第一识别模型的全连接层，根据提取的所述人脸特征数据对所述目标图像进行分类，得到所述目标图像为活体人脸图像的第一置信度。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

所述计算机设备获取图像样本集，所述图像样本集包括活体人脸图像和非活体人脸图像；

所述计算机设备根据所述图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本；及

所述计算机设备根据所述第一训练样本训练第一识别模型。
根据权利要求4所述的方法，其特征在于，所述计算机设备根据所述第一训练样本训练第一识别模型，包括：

所述计算机设备获取初始化的第一识别模型；

所述计算机设备确定所述第一训练样本相对应的第一训练标签；

所述计算机设备将所述第一训练样本输入所述第一识别模型得到第一识别结果；及

所述计算机设备按照所述第一识别结果与所述第一训练标签的差异，调整所述第一识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。
根据权利要求1所述的方法，其特征在于，所述计算机设备从人脸扩展图像中提取背景特征数据，包括：

所述计算机设备确定所述目标图像中的人脸区域；

所述计算机设备扩展所述人脸区域得到人脸扩展区域；

所述计算机设备按照所述人脸扩展区域在所述目标图像中截取人脸扩展图像；及

所述计算机设备将所述人脸扩展图像输入第二识别模型，通过所述第二识别模型提取所述人脸扩展图像的背景特征数据。
根据权利要求6所述的方法，其特征在于，所述计算机设备将所述人脸扩展图像输入第二识别模型，通过所述第二识别模型提取所述人脸扩展图像的背景特征数据，包括：

所述计算机设备将所述人脸扩展图像输入第二识别模型；及

所述计算机设备通过所述第二识别模型的卷积层提取所述人脸扩展图像的背景特征数据；

所述计算机设备根据所述背景特征数据进行活体识别，得到第二置信度，包括：

所述计算机设备通过所述第二识别模型的全连接层，根据提取的所述背景特征数据对所述目标图像进行分类，得到所述目标图像为活体人脸图像的第二置信度。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

所述计算机设备获取图像样本集，所述图像样本集包括活体人脸图像和非活体人脸图像；

所述计算机设备根据所述图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本；及

所述计算机设备根据所述第二训练样本训练第二识别模型。
根据权利要求8所述的方法，其特征在于，所述计算机设备根据所述第二训练样本训练第二识别模型，包括：

所述计算机设备获取初始化的第二识别模型；

所述计算机设备确定所述第二训练样本相对应的第二训练标签；

所述计算机设备将所述第二训练样本输入所述第二识别模型得到第二识别结果；及

所述计算机设备按照所述第二识别结果与所述第二训练标签的差异，调整所述第二识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。
根据权利要求1所述的方法，其特征在于，所述计算机设备获取目标图像，包括：

所述计算机设备进入图像采集状态；及

所述计算机设备在所述图像采集状态下，选取采集的图像帧作为目标图像，选取的所述图像帧的人脸区域与采集视野下的预设人脸区域匹配。
根据权利要求1所述的方法，其特征在于，所述计算机设备根据所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的识别结果，包括：

所述计算机设备融合所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的置信度；及

所述计算机设备当所述置信度达到预设置信度阈值时，判定所述目标图像为活体人脸图像。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

获取目标图像；

提取所述目标图像中人脸图像的人脸特征数据；

根据所述人脸特征数据进行活体识别，得到第一置信度；所述第一置信度表示识别到活体的第一概率；

从人脸扩展图像中提取背景特征数据；所述人脸扩展图像是扩展所述人脸图像所在区域得到的；

根据所述背景特征数据进行活体识别，得到第二置信度；所述第二置信度表示识别到活体的第二概率；及

根据所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的识别结果。
根据权利要求12所述的计算机设备，其特征在于，所述提取所述目标图像中人脸图像的人脸特征数据，包括：

确定所述目标图像中的人脸区域；

按照所述人脸区域在所述目标图像中截取人脸图像；及

将所述人脸图像输入第一识别模型，通过所述第一识别模型提取所述人脸图像的人脸特征数据。
根据权利要求13所述的计算机设备，其特征在于，所述将所述人脸图像输入第一识别模型，通过所述第一识别模型提取所述人脸图像的人脸特征数据，包括：

将所述人脸图像输入第一识别模型；及

通过所述第一识别模型的卷积层提取所述人脸图像的人脸特征数据；

所述根据所述人脸特征数据进行活体识别，得到第一置信度，包括：

通过所述第一识别模型的全连接层，根据提取的所述人脸特征数据对所述目标图像进行分类，得到所述目标图像为活体人脸图像的第一置信度。
根据权利要求14所述的计算机设备，其特征在于，所述计算机可读指令被所述处理器执行时，还使得所述处理器执行以下步骤：

获取图像样本集，所述图像样本集包括活体人脸图像和非活体人脸图像；

根据所述图像样本集中各图像样本的人脸区域，在相应图像样本中截取人脸图像，得到第一训练样本；及

根据所述第一训练样本训练第一识别模型。
根据权利要求15所述的计算机设备，其特征在于，所述根据所述第一训练样本训练第一识别模型，包括：

获取初始化的第一识别模型；

确定所述第一训练样本相对应的第一训练标签；

将所述第一训练样本输入所述第一识别模型得到第一识别结果；及

按照所述第一识别结果与所述第一训练标签的差异，调整所述第一识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。
根据权利要求12所述的计算机设备，其特征在于，所述从人脸扩展图像中提取背景特征数据，包括：

确定所述目标图像中的人脸区域；

扩展所述人脸区域得到人脸扩展区域；

按照所述人脸扩展区域在所述目标图像中截取人脸扩展图像；及

将所述人脸扩展图像输入第二识别模型，通过所述第二识别模型提取所述人脸扩展图像的背景特征数据。
根据权利要求17所述的计算机设备，其特征在于，所述将所述人脸扩展图像输入第二识别模型，通过所述第二识别模型提取所述人脸扩展图像的背景特征数据，包括：

将所述人脸扩展图像输入第二识别模型；及

通过所述第二识别模型的卷积层提取所述人脸扩展图像的背景特征数据；

设备根据所述背景特征数据进行活体识别，得到第二置信度，包括：

通过所述第二识别模型的全连接层，根据提取的所述背景特征数据对所述目标图像进行分类，得到所述目标图像为活体人脸图像的第二置信度。
根据权利要求18所述的计算机设备，其特征在于，所述计算机可读指令被所述处理器执行时，还使得所述处理器执行以下步骤：

获取图像样本集，所述图像样本集包括活体人脸图像和非活体人脸图像；

根据所述图像样本集中各图像样本的人脸扩展区域，在相应图像样本中截取人脸扩展图像，得到第二训练样本；及

根据所述第二训练样本训练第二识别模型。
根据权利要求19所述的计算机设备，其特征在于，所述根据所述第二训练样本训练第二识别模型，包括：

获取初始化的第二识别模型；

确定所述第二训练样本相对应的第二训练标签；

将所述第二训练样本输入所述第二识别模型得到第二识别结果；及

按照所述第二识别结果与所述第二训练标签的差异，调整所述第二识别模型的模型参数并继续训练，直至满足训练停止条件时结束训练。
根据权利要求12所述的计算机设备，其特征在于，所述获取目标图像，包括：

进入图像采集状态；及

在所述图像采集状态下，选取采集的图像帧作为目标图像，选取的所述图像帧的人脸区域与采集视野下的预设人脸区域匹配。
根据权利要求12所述的计算机设备，其特征在于，所述根据所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的识别结果，包括：

融合所述第一置信度和所述第二置信度，得到所述目标图像为活体人脸图像的置信度；及

当所述置信度达到预设置信度阈值时，判定所述目标图像为活体人脸图像。
一种存储有计算机可读指令的非易失性存储介质，所述计算机可读指令被计算机设备的一个或多个处理器执行时，使得计算机设备的一个或多个处理器执行上述1至11中任一项所述的方法的步骤。