WO2019114580A1

WO2019114580A1 - 活体检测方法、计算机装置及计算机可读存储介质

Info

Publication number: WO2019114580A1
Application number: PCT/CN2018/119189
Authority: WO
Inventors: 余梓彤; 严蕤; 牟永强
Original assignee: 深圳励飞科技有限公司
Priority date: 2017-12-13
Filing date: 2018-12-04
Publication date: 2019-06-20
Also published as: CN107992842A; CN107992842B

Abstract

一种活体检测方法、计算机装置及计算机可读存储介质。所述方法包括利用预设训练集训练多层感知器确定多层感知器模型（S101），获取待检测的连续N帧人脸图像（S102），将连续N帧人脸图像的中间帧人脸图像由第一颜色空间转换为第二颜色空间（S103），提取转换后的中间帧的人脸图像的纹理特征及连续N帧人脸图像的动态模式特征（S104，S105），融合纹理特征与动态模式特征获取融合特征（S106），利用多层感知器模型对融合特征进行特征映射，输出映射特征并做归一化处理，获得活体标签的预测概率值和非活体标签的预测概率值（S107），进而确定连续N帧人脸图像为活体或者非活体人脸图像（S108，S109）。所述活体检测方法、计算机装置及计算机可读存储介质中的融合特征包含纹理特征和动态模式特征，因此，可以提高活体检测的识别准确率以及安全性。

Description

活体检测方法、计算机装置及计算机可读存储介质

本申请要求于2017年12月13日提交中国专利局，申请号为201711330349.1、发明名称为“活体检测方法、计算机装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明属于人脸防伪领域，尤其涉及一种活体检测方法、计算机装置及计算机可读存储介质。

背景技术

在人脸识别或者人脸防伪系统中，一般需要采用活体检测技术，以防止不法分子利用他人的图像或者视频信息进行攻击。现有的活体检测技术一般分为交互式和非交互式两种方法。交互式的活体检测技术需要用户配合完成相应的动作，例如眨眼、摇头、微笑等，导致用户的体验较差且识别效果不甚理想。非交互式的活体检测技术一般分为基于颜色纹理信息进行检测和基于图像运动信息进行检测两种。其中，基于颜色纹理信息的活体检测技术的基本思想是利用人脸颜色纹理信息进行分类识别，但该方法缺乏人脸动作信息，容易被高清图片或者视频攻击。另外，基于图像运动信息的活体检测技术的基本思想是利用人脸的微运动信息及简单的人脸纹理信息，但该方法缺乏对人脸可判别性特征的深刻提取，也容易被高清图片或者视频信息攻击。由此，导致现有的活体检测系统的识别准确率低且安全性较差。

因此，现有的活体检测系统存在识别准确率低、安全性差的问题。

发明内容

本发明提供一种活体检测方法、计算机装置及计算机可读存储介质，旨在解决现有的活体检测系统存在的识别准确率低、安全性差的问题。

本发明第一方面提供一种活体检测方法，所述活体检测方法包括：

利用预设训练集训练多层感知器，确定多层感知器模型；

获取待检测的连续N帧的人脸图像，其中，所述N为大于3的正整数；

将所述连续N帧的人脸图像中的中间帧的人脸图像由第一颜色空间转换为第二颜色空间，其中，当N为奇数，则所述中间帧的人脸图像为第(N+1)/2帧的人脸图像，当N为偶数，则所述中间帧的人脸图像为第N/2帧或者第N/2+1帧的人脸图像；

提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征；

提取所述连续N帧人脸图像的动态模式特征；

将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征；

将所述融合特征输入至所述多层感知器模型，获得活体标签的预测概率值和非活体标签的预测概率值；

当所述活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为活体人脸图像；

当所述非活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为非活体人脸图像。

在较优的一实施例中，所述第一颜色空间为RGB颜色空间，所述第二颜色空间为Lab颜色空间，所述提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征包括：

提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的局部相位量化纹理特征。

在较优的一实施例中，所述提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的局部相位量化纹理特征包括：

提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的多级局部相位量化纹理特征；

所述将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征包括：

将所述预设邻域的多级局部相位量化纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。

在较优的一实施例中，所述提取所述连续N帧人脸图像的动态模式特征包括：

提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征。

在较优的一实施例中，所述提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征包括：

采用(m*n)*1的列向量表示人脸图像所包含的m*n个灰度值数据，获取由前N-1帧人脸图像所对应的N-1个列向量组成的第一数据矩阵及由后N-1帧人脸图像所对应的N-1个列向量组成的第二数据矩阵，其中，m、n为正整数；

根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵，其中，所述线性映射矩阵为所述第一数据矩阵与所述第二数据矩阵的逆矩阵相乘后的矩阵；

通过特征值分解获取所述伴随矩阵的特征向量和特征值；

确定所述特征值中绝对值最大的特征值所对应的特征向量；

将所述第一数据矩阵与所述绝对值最大的特征值所对应的特征向量相乘，并对相乘后的结果取绝对值，获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征。

在较优的一实施例中，所述根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵包括：

对所述第一数据矩阵进行三角分解，并分别获得所述第一数据矩阵的上三角矩阵和下三角矩阵；

获取所述上三角矩阵的逆矩阵以及所述下三角矩阵的伪逆矩阵；

将所述上三角矩阵的逆矩阵、所述下三角矩阵的伪逆矩阵以及所述第二数据矩阵相乘，获取所述线性映射矩阵的伴随矩阵。

在较优的一实施例中，所述多层感知器至少包括第一全连接层和第二全连接层，所述利用预设训练集训练多层感知器，确定多层感知器模型包括：

从预设训练集中随机抽取第一样本和第二样本，其中，所述预设训练集中的每个样本均包含至少连续N帧的人脸图像；

分别提取所述第一样本的融合特征和所述第二样本的融合特征；

将所述第一样本的融合特征和第二样本的融合特征分别输入所述多层感知器，获取所述第一样本的Softmax损失和所述第二样本的Softmax损失；

确定所述第一样本和所述第二样本的对比损失；

通过所述第一样本的Softmax损失、所述第二样本的Softmax损失以及所述对比损失确定总损失；

当所述总损失不满足损失收敛的预设条件，则利用随机梯度下降法通过反向传播的过程调整所述多层感知器中第一全连接层的参数和所述第二全连接层的参数；

重复上述过程，直至所述总损失满足损失收敛的预设条件；

将满足损失收敛的预设条件之前的最后一次迭代过程的第一全连接层的参数和第二全连接层的参数作为所述多层感知器模型的第一全连接层的参数和第二全连接层的参数，确定所述多层感知器模型。

在较优的一实施例中，所述预设条件包括所述总损失的计算次数等于预设次数阈值或者所述总损失小于或者等于预设损失阈值。

本发明第二方面提供一种活体检测系统，所述活体检测系统包括：

训练模块，用于利用预设训练集训练多层感知器，确定多层感知器模型；

获取模块，用于获取待检测的连续N帧的人脸图像，其中，所述N为大于3的正整数；

转换模块，用于将所述连续N帧的人脸图像中的中间帧的人脸图像由第一颜色空间转换为第二颜色空间，其中，当N为奇数，则所述中间帧的人脸图像为第(N+1)/2帧的人脸图像，当N为偶数，则所述中间帧的人脸图像为第N/2 帧或者第N/2+1帧的人脸图像；

纹理特征提取模块，用于提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征；

动态模式特征提取模块，用于提取所述连续N帧人脸图像的动态模式特征；

融合模块，用于将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征；

概率获取模块，用于将所述融合特征输入至所述多层感知器模型，获得活体标签的预测概率值和非活体标签的预测概率值；

确定模块，用于当所述活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为活体人脸图像；

所述确定模块，还用于当所述非活体标签的预测概率值小于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为非活体人脸图像。

本发明第三方面提供一种计算机装置，所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现上述任一实施例所述活体检测方法。

本发明第四方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一实施例所述活体检测方法。

在本发明中，利用连续N帧的人脸图像的融合特征以及训练好的多层感知器模型，对所述连续N帧的人脸图像进行检测，进而确定确定所述连续N帧的人脸图像为活体人脸图像或者非活体人脸图像，鉴于融合特征包括纹理特征和动态模式特征，因此，可以提高活体检测的识别准确率以及安全性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的活体检测方法的实现流程图；

图2是本发明实施例提供的活体检测方法中步骤S105的实现流程图；

图3是本发明实施例提供的活体检测方法中步骤S101的实现流程图；

图4是本发明实施例提供的活体检测系统的功能模块图；

图5是本发明实施例提供的活体检测系统中动态模式特征提取模块105的结构框图；

图6是本发明实施例提供的活体检测系统中训练模块101的结构框图；

图7是本发明实施例提供的计算机装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示出了本发明实施例提供的活体检测方法的实现流程，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

如图1所示，活体检测方法包括：

步骤S101，利用预设训练集训练多层感知器，确定多层感知器模型。

所述预设训练集为预先设置的训练集，训练集中包含了大量的用于训练多层感知器模型的人脸图片。多层感知器是一种前馈人工神经网络(英文全称：Feedforward Artificial Neural Networks，简称FF-ANN)模型，其将输入的多个数据集映射到单一的输出的数据集上。在本发明实施例中，利用所述预设训练集中包含的大量的人脸图片训练多层感知器，确定训练后的多层感知器模型，以便利用所述多层感知器模型对人脸图片进行检测，以判断人脸图片为活体人脸图片或者非活体人脸图片。

步骤S102，获取待检测的连续N帧的人脸图像，其中，所述N为大于3的正整数。

为了检测人脸图像是活体人脸图像还是非活体人脸图像，首先需要通过图像获取设备获取连续N帧的人脸图像。例如，可以通过手机的摄像头或者门禁识别系统或者人脸防伪系统的图像获取设备，如摄像头等获取一定时间内的连续N帧的人脸图像；或者通过单目摄像头捕捉场景图像，使用人脸检测算法实时检测人脸图像，截取连续多帧的人脸图像。其中，N为大于3的正整数。例如，通过人脸防伪系统的摄像头获取到1-2秒时间内的连续60帧的人脸图像，以便后续检测该连续60帧的人脸图像是活体人脸图像还是非活体人脸图像。

在较优的一实施例中，为了进一步提高活体检测的识别准确率以及安全性，所述活体检测方法还包括：对所述连续N帧的人脸图像进行灰度化处理和/或归一化处理。

在获取到连续N帧的人脸图像后，可以对获取到的人脸图像进行预处理。例如，对获取到的人脸图像进行灰度化处理或者归一化处理。除此之外，还可以对获取到的人脸图像进行平滑、滤波、分割等预处理，此处不再详细赘述。另外，在对所述连续N帧的人脸图像进行归一化处理时可以根据人脸关键点检测和人脸对齐对所述连续N帧的人脸图像进行归一化处理。

步骤S103，将所述连续N帧的人脸图像中的中间帧的人脸图像由第一颜色空间转换为第二颜色空间，其中，当N为奇数，则所述中间帧的人脸图像为第(N+1)/2帧的人脸图像，当N为偶数，则所述中间帧的人脸图像为第N/2帧或者第N/2+1帧的人脸图像。

在获取到连续N帧的人脸图像后，将其中中间帧的人脸图像由第一颜色空间转换为第二颜色空间。对于中间帧的人脸图像的确定，当N为奇数，则中间帧的人脸图像为第(N+1)/2帧的人脸图像，假设以N为61为例，则此处第 31帧人脸图像即为中间帧的人脸图像；当N为偶数，假设以上述N为60为例，则中间帧的人脸图像为第30帧人脸图像或者第31帧人脸图像。

鉴于RGB颜色空间为最为常用的颜色空间，且Lab颜色空间相比于RGB颜色空间，能够更好的模拟人对颜色的感知、突出对立颜色空间(即红颜色通道a和蓝黄颜色通道b)的强选择性，因此，在较优的一实施例中，所述第一颜色空间为RGB颜色空间，所述第二颜色空间为Lab颜色空间。其中，RGB颜色空间包括红色通道R、绿色通道G以及蓝色通道B。Lab颜色空间包括亮度通道L以及绿红颜色通道a和蓝黄颜色通道b两个对立颜色通道，亮度通道L表示像素的亮度，取值范围是[0,100]，绿红颜色通道a表示从红色到绿色的范围，取值范围是[127,-128]，蓝黄颜色通道b表示从黄色到蓝色的范围，取值范围是[127,-128]。具体的，可以根据下述变换，将所述连续N帧的人脸图像中的中间帧的人脸图像由RGB颜色空间转换为Lab颜色空间：

L＝0.2126*R+0.7152*G+0.0722*B；

a＝1.4749*(2.2213*R-0.339*G+0.1177*B)+128；

b＝0.6245*(0.1949*R+0.6057*G-0.8006*B)+128；

其中，L、a以及b分别是Lab颜色空间亮度通道、绿红颜色通道以及蓝黄颜色通道的值，R、G以及B分别是RGB颜色空间红色通道、绿色通道以及蓝色通道的值。

另外，将所述连续N帧的人脸图像中的中间帧的人脸图像由RGB颜色空间转换为Lab颜色空间不限于上述变换，还可以通过先将人脸图片由RGB颜色空间转换为XYZ颜色空间，再由XYZ颜色空间转换为Lab颜色空间，此处不再详细赘述。其中，XYZ颜色空间是国际照明委员会在RGB颜色空间的基础上，通过大量正常人视觉测量和统计，改用三个假想的原色X、Y以及Z建立的一个新的色度系统，此处不再详细赘述。

步骤S104，提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征。

纹理特征是一种反映图像中同质现象的视觉特征，通过像素及其周围空间邻域的灰度分布，即局部纹理信息，来表现。纹理特征描述的是图像或其中小块区域的空间颜色分布和光强分布。在对中间帧的人脸图像进行颜色空间转换后，即提取转换后的第二颜色空间的中间帧的人脸图像的纹理特征，即提取转换为Lab颜色空间的中间帧的人脸图像的纹理特征。

在较优的一实施例中，为了提高活体检测的效率，以及进一步提高活体检测的识别准确率以及安全性，步骤S104，提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征包括：提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的局部相位量化纹理特征。

在提取人脸图像的纹理特征时，可以在空域提取人脸图像的局部二值模式(英文全称：Local binary pattern，简称LBP)纹理特征(以下简称LBP纹理特征)，也可以在频域提取人脸图像的局部相位量化(英文全称：Local phase quantization，简称LPQ)纹理特征(以下简称LPQ纹理特征)。为了提高活体检测的效率和准确率，在本发明实施例中，提取所述转换为Lab颜色空间的中间帧的人脸图像在频域上预设邻域的LPQ纹理特征。在其它实施例中，也可以提取所述转换为Lab颜色空间的中间帧的人脸图像在空域上的LBP纹理特征，此处不再详细赘述。

所述预设邻域为预先设置的邻域，此处并不做特别的限制。在较优的一实施例中，所述预设邻域为3*3邻域或者5*5邻域或者7*7邻域。另外，在较优的一实施例中，为了进一步提高活体检测的准确率，对于所述转换为Lab颜色空间的中间帧的人脸图像，提取预设邻域的多级LPQ纹理特征，例如，分别提取所述转换为Lab颜色空间的中间帧的人脸图像的3*3邻域、5*5邻域以及7*7邻域的LPQ纹理特征，并将提取的多级LPQ纹理特征拼接、进行融合，在本发明实施例中，LPQ纹理特征为向量形式表现的纹理特征，此处将多级的LPQ纹理特征进行融合是指：将3*3邻域、5*5邻域以及7*7邻域的LPQ纹理特征的向量进行拼接，形成向量维度为三者之和的拼接后的向量，即为融合后的多级LPQ纹理特征，作为所述转换为第二颜色空间的中间帧的人脸图像的最终的纹理特征。另外，3*3邻域、5*5邻域以及7*7邻域的LPQ纹理特征拼接的顺序和向量的位置并不做特别的限制，可以自由组合和安排。例如，依序将3*3邻域、5*5邻域以及7*7邻域的LPQ纹理特征进行拼接或者依序将5*5邻域、3*3邻域以及7*7邻域的LPQ纹理特征等。

步骤S105，提取所述连续N帧人脸图像的动态模式特征。

鉴于连续帧的动态模式特征包含了连续帧之间的动态运动信息，在活体检测时提取连续帧的动态模式特征，能够更好的检测出图像攻击，因此，为了提高活体检测的准确率和安全性，在本发明实施例中，提取所述连续N帧人脸图像的动态模式特征。在本发明实施例中，动态模式特征同样是以向量的形式表示。

步骤S106，将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。

在分别获取到人脸图像的纹理特征和动态模式特征之后，即可将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。融合特征同时包含了所述连续N帧的人脸图像的丰富的纹理特征和动态运动信息，因此，可以提高活体检测的准确率。

在较优的一实施例中，步骤S106，将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征包括：将所述预设邻域的多级局部相位量化纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。

所述多级LPQ纹理特征和所述动态模式特征均是以向量的形式表示，将多级LPQ纹理特征与所述动态模式特征进行拼接，获得融合后的融合特征。另外，在进行拼接融合时，可以按照多级LPQ纹理特征在前，动态模式特征在后的顺序进行拼接或者按照动态模式特征在前，多级LPQ纹理特征在后的顺序进行拼接融合。

步骤S107，将所述融合特征输入至所述多层感知器模型，获得活体标签的预测概率值和非活体标签的预测概率值。

在获取到上述融合特征之后，即将所述融合特征输入至训练后的多层感知器模型对融合特征进行特征映射以及归一化，获取相应的活体标签的预测概率值和非活体标签的预测概率值。其中，所述活体标签的预测概率值表示待检测的人脸图片为活体人脸图片的预测概率，所述非活体标签的预测概率值表示待检测的人脸图片为非活体人脸图片的预测概率。对于利用所述多层感知器模型对融合特征进行特征映射以及归一化，可参照下文中多层感知器训练的相关内容，此处不再详细赘述。

当所述活体标签的预测概率值大于所述非活体标签的预测概率值，则执行步骤S108，确定所述连续N帧的人脸图像为活体人脸图像。

当所述非活体标签的预测概率值大于所述非活体标签的预测概率值，则执行步骤S109，确定所述连续N帧的人脸图像为非活体人脸图像。

对获得的活体标签的预测概率值和非活体标签的预测概率值进行比较，在所述活体标签的预测概率值大于所述非活体标签的预测概率值时，确定所述连续N帧的人脸图像为活体人脸图像；在所述非活体标签的预测概率值大于所述非活体标签的预测概率值，确定所述连续N帧的人脸图像为非活体人脸图像。

在较优的一实施例中，为了进一步提高活体检测的识别准确率以及安全性，所述活体检测方法还包括：对所述动态模式特征进行归一化处理，获取归一化处理后的动态模式特征。

在较优的一实施例中，为了进一步提高活体检测的识别效率，步骤S105，提取所述连续N帧人脸图像的动态模式特征包括：

鉴于所述连续N帧的人脸图像的动态模式特征包含很多个动态模式特征，其中，能量最大的动态模式特征包含了连续帧之间最大的动态结构化信息和最丰富的纹理信息。因此，为了提高活体检测的效率，在本发明实施例中，提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征。

在本发明实施例中，利用训练好的多层感知器模型，根据连续N帧的人脸图像的融合特征，对所述连续N帧的人脸图像进行检测，确定所述连续N帧的人脸图像为活体人脸图像或者非活体标签的预测概率值，鉴于本发明实施例中的融合特征包括所述连续N帧的人脸图像的纹理特征和动态模式特征，因此，可以提高活体检测的识别准确率以及安全性。

图2示出了本发明实施例提供的活体检测方法中步骤S105包含的：提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征的实现流程，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在较优的一实施例中，如图2所示，步骤S105包含的：所述提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征包括：

步骤S1051，采用(m*n)*1的列向量表示人脸图像所包含的m*n个灰度值数据，获取由前N-1帧人脸图像所对应的N-1个列向量组成的第一数据矩阵及由后N-1帧人脸图像所对应的N-1个列向量组成的第二数据矩阵，其中，m、n为正整数。

将所述连续N帧的每个人脸图像所包含的m*n个灰度值数据采用(m*n)*1的列向量表示，其中，m、n为正整数。即将第r帧的人脸图像表示为(m*n)*1的列向量p _r，其中，r为小于或者等于N的正整数。之后将前N-1帧的人脸图像所对应的列向量依序组成第一数据矩阵P ₁，将后N-1帧的人脸图像所对应的列向量依序组成第二数据矩阵P ₂，即获得第一数据矩阵P ₁和第二数据矩阵P ₂。

步骤S1052，根据所述第一数据矩阵P ₁和所述第二数据矩阵P ₂获取线性映射矩阵A的伴随矩阵H，其中，所述线性映射矩阵A为所述第一数据矩阵P ₁与所述第二数据矩阵P ₂的逆矩阵

相乘后的矩阵。

在获得上述所述第一数据矩阵P ₁和所述第二数据矩阵P ₂后，即可根据所述第一数据矩阵P ₁和所述第二数据矩阵P ₂获取所述线性映射矩阵A的伴随矩阵H，其中，所述线性映射矩阵A为所述第一数据矩阵P ₁与所述第二数据矩阵P ₂的逆矩阵

相乘后的矩阵，即：

所述线性映射矩阵A包含有所述连续N帧的人脸图像中全局的视觉动态信息，可以通过所述线性映射矩阵A获得所述连续N帧的人脸图像的动态模式特征。

在较优的一实施例中，为了提高活体检测方法的识别效率，步骤S1052，根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵包括：

对所述第一数据矩阵进行三角分解，并分别获得所述第一数据矩阵的上三角矩阵和下三角矩阵。

鉴于三角分解主要用于简化矩阵、特别是维度较大的矩阵的计算过程，可以提高计算效率，进而提高活体检测的效率，因此，在本发明实施例中，采用三角分解求解线性映射矩阵A的伴随矩阵H。三角分解(即LU分解，LU Decomposition)是矩阵分解的一种，其可以将一个矩阵分解为单位上三角矩阵和单位下三角矩阵的乘积。在本发明实施例中，对所述第一数据矩阵P ₁进行三角分解，获取所述第一数据矩阵P ₁的上三角矩阵U和下三角矩阵L，即：P ₁＝L*U。

另外，在获取所述线性映射矩阵A的伴随矩阵H时，也可以通过其他的矩阵分解的方法求得，例如，正交三角分解(即QR分解)、奇异值分解，此处不再详细赘述。

获取所述上三角矩阵U的逆矩阵U ^-1以及所述下三角矩阵L的伪逆矩阵L ⁺。

在获得所述第一数据矩阵P ₁的上三角矩阵U后，进而获得所述上三角矩阵U 的逆矩阵U ^-1；另外，根据所述下三角矩阵L获得所述下三角矩阵L的伪逆矩阵L ⁺。伪逆矩阵是逆矩阵的广义形式，也称广义逆矩阵。当存在一个与矩阵K的逆矩阵K ^-1同型的矩阵X满足K*X*K＝K，且X*K*X＝X，此时称矩阵X为矩阵K的伪逆矩阵。

将所述上三角矩阵U的逆矩阵U ^-1、所述下三角矩阵L的伪逆矩阵L ⁺以及所述第二数据矩阵相乘P ₂，获取所述线性映射矩阵A的伴随矩阵H。

在获得所述上三角矩阵U的逆矩阵U ^-1、所述下三角矩阵L的伪逆矩阵L ⁺以及所述第二数据矩阵P ₂，将逆矩阵U ^-1、伪逆矩阵L ⁺以及第二数据矩阵P ₂相乘，获得所述线性映射矩阵A的伴随矩阵H，即：H＝U ^-1*L ⁺*P ₂。

步骤S1053，通过特征值分解获取所述伴随矩阵H的特征向量E _vec和特征值E _val。

特征值分解，又称为谱分解，其是将矩阵分解为由矩阵的特征值和特征向量表示的矩阵之积的方法。通常情况下，矩阵包含有多个特征值和特征向量。在获得伴随矩阵H后，可通过特征值分解求得伴随矩阵H的特征向量E _vec和特征值E _val。

步骤S1054，确定所述特征值E _val中绝对值最大的特征值E _val(K)所对应的特征向量E _vec(K)。

鉴于所述伴随矩阵H包含了多个特征值，且所述特征值中绝对值最大的特征值和动态模式特征中能量最大的动态模式特征相对应，此处，分别计算所述伴随矩阵H所包含的特征值E _val的绝对值，并对所有的绝对值进行比较，确定所述特征值中绝对值最大的特征值所对应的特征向量。例如，可以标记伴随矩阵的特征值E _val的索引位置，并将特征值和对应的特征向量对应起来。假设绝对值最大的特征值为索引位置为K的特征值E _val(K)，则在确定索引位置为K的特征值E _val(K)后，即确定索引位置为K的特征值E _val(K)所对应的特征向量E _vec(K)。

步骤S1055，将所述第一数据矩阵P ₁与所述特征值中绝对值最大的特征值 E _val(K)所对应的特征向量E _vec(K)相乘，并对相乘后的结果取绝对值，获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征。

在确定上述绝对值最大的索引位置为K的特征值E _val(K)所对应的特征向量E _vec(K)后，将第一数据矩阵P ₁与绝对值最大的特征值E _val(K)所对应的特征向量E _vec(K)相乘，并对相乘后的向量中的元素取绝对值，假设能量最大的动态模式特征为DM，则有：DM＝abs(P ₁*E _vec(K))，至此，即可获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征。

在本发明实施例中，利用三角分解获取所述线性映射矩阵A的伴随矩阵H，并通过特征值分解获取伴随矩阵H的特征值和特征向量，确定特征值中绝对值最大的特征值所对应的特征向量，进而获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征，鉴于三角分解可以降低矩阵计算量，简化矩阵运算，因此，本发明实施例可以提高活体检测效率。

图3示出了本发明实施例提供的活体检测方法中步骤S101的实现流程，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在较优的一实施例中，为了提高活体检测的识别准确率以及安全性，如图3所示，所述多层感知器至少包括第一全连接层和第二全连接层，步骤S101，利用预设训练集训练多层感知器，确定多层感知器模型包括：

步骤S1011，从预设训练集中随机抽取第一样本和第二样本，其中，所述预设训练集中的每个样本均包含至少连续N帧的人脸图像。

所述预设训练集为预先设置的训练集，其包括大量的人脸图片，即样本，且所述预设训练集中的每个样本均包含至少连续N帧的人脸图像。从所述预设训练集中随机抽取第一样本和第二样本，以进行训练。

步骤S1012，分别提取所述第一样本的融合特征和所述第二样本的融合特征。

在从所述预设训练集中抽取第一样本和第二样本之后，分别提取所述第一样本和所述第二样本的融合特征，具体可参照上述步骤S102至步骤S106的内容，此处不再详细赘述。

步骤S1013，将所述第一样本的融合特征和第二样本的融合特征分别输入所述多层感知器，获取所述第一样本的Softmax损失和所述第二样本的Softmax损失。

在本发明实施例中，所述多层感知器至少包括第一全连接层和第二全连接层，所述第一全连接层和第二全连接层用于对所述融合特征进行特征映射，具体的，所述第一全连接层和第二全连接层均采用激活函数对所述任一融合特征向量做特征映射变换。鉴于Relu(修正线性单元，英文全称：Rectified linear unit，简称ReLU)激活函数可以加速回归模型的收敛，提高回归模型训练的速度和效率，因此，在较优的一实施例中，所述第一全连接层和第二全连接层均采用Relu激活函数对所述任一融合特征向量做特征映射变换。所述多层感知器还包括Softmax层，所述预设训练集中还包括样本的标签类别，所述标签类别包括活体标签和非活体标签两类，在训练之前，所述预设训练集中每个样本的标签类别是已知的和确定的。

在经过所述多层感知器的全连接层的特征映射后，将第二全连接层的输出输入至所述多层感知器的Softmax层，所述多层感知器的Softmax层主要用于对输入的特征进行归一化处理，具体可以按照下述公式进行归一化处理：

以及

其中，f(z _i)和f(z _j)分别表示第一样本和第二样本的在经过多层感知器的Softmax层之后的标签的预测概率，z _i和z _j分别表示第一样本和第二样本在经过所述多层感知器的第二全连接层后的输出，i和j分别表示代表的标签类别，k表示标签类别数，此处只有活体标签和非活体标签，因此，在本发明实施例中，k为2。

在确定第一样本和第二样本的输出f(z _i)和f(z _j)后，即可确定所述第一样本的Softmax损失和所述第二样本的Softmax损失。假设所述预设训练集中包含2M个样本，且2M个样本中每个样本均包含至少连续N帧的人脸图像，其中，M为正整数。具体的，可以根据下述公式确定所述第一样本的Softmax损失和所述第二样本的Softmax损失：

以及

其中，L _s(i)和L _s(j)分别表示第一样本和第二样本的Softmax损失，M表示所述预设训练集中批量样本对的数量，y _i和y _j分别表示第一样本和第二样本的真实的标签类别，即在确定第一样本的Softmax损失时，对于第一样本来说，其y _i为1，而对于第一样本之外的其他样本，其y _i均为零；在确定第二样本的Softmax损失时，对于第二样本来说，其y _i为1，而对于第二样本之外的其他样本，其y _i均为零。至此，即可分别确定第一样本和第二样本的Softmax损失。

步骤S1014，确定所述第一样本和所述第二样本的对比损失。

对比损失(英文全称：Contrastive Loss)可以很好的表达成对样本的匹配程度，也能够很好的用于训练提取特征的模型，其主要用于降维中。在本发明实施例中，可以根据如下公式确定所述第一样本和第二样本的对比损失：

其中，L _c表示第一样本和第二样本的对比损失，M表示所述预设训练集批量样本对的数量，y _n在第一样本和第二样本为相同的标签类别时为1，在第一样本和第二样本为不同的标签类别时为零，即y _n可以表示第一样本和第二样本是否匹配，d表示第一样本和第二样本的欧氏距离，具体的第一样本和第二样本欧氏距离的计算，此处不再详细赘述，m _ij为预设距离阈值，即预先设置的距离阈值，其能够影响多层感知器模型训练的收敛速度和性能，在较优的一实施例中，所述预设距离阈值m _ij的范围为0.01至0.1。

步骤S1015，通过所述第一样本的Softmax损失、所述第二样本的Softmax损失以及所述对比损失确定总损失。

在分别获取到上述第一样本和第二样本的Softmax损失L _s(i)、L _s(j)以及第一样本和第二样本的对比损失L _c后，即可根据下述公式确定所述第一样本和所述第二样本的总损失：

L＝L _s(i)+L _s(j)+weight*L _c；

其中，L为第一样本和第二样本的总损失，weight为预设权重参数，即预先设置的权重参数，在较优的一实施例中，weight为0.003。

当所述总损失不满足损失收敛的预设条件，则执行步骤S1016，利用随机梯度下降法通过反向传播的过程调整所述多层感知器中第一全连接层的参数和所述第二全连接层的参数。跳转至步骤S1011，执行步骤S1011至步骤S1015。

随机梯度下降主要用于在神经网络模型中进行权重更新，在一个方向上更新和调整模型的参数，来最小化损失函数。反向传播是先在前向传播中计算输入信号的乘积及其对应的权重，然后将激活函数作用于这些乘积的总和，之后在网络模型的反向传播过程中回传相关误差，使用随机梯度下降更新权重值，通过计算误差函数相对于权重参数的梯度，在损失函数梯度的相反方向上更新权重参数。在多层感知器的第一全连接层和第二全连接层满足以下公式：S＝W*T+B，其中S表示输出特征，T表示输入特征，W表示全连接层中神经元的权值，B表示偏置项。因此，在本发明实施例中，在所述总损失L不满足损失收敛的预设条件时，则利用随机梯度下降法通过反向传播的过程调整所述回归模型的所述第一全连接层的参数和所述第二全连接层的参数，即调整全连接层神经元的权值W和偏置项。在调整所述回归模型的第一全连接层的参数和第二全连接层的参数后，跳转至步骤S1011，执行步骤S1011至步骤S1015。

所述损失收敛的预设条件为预先设置的损失收敛的条件，在较优的一实施例中，为了进一步提高活体检测的识别效率，所述预设条件包括：所述总损失的计算次数等于预设次数阈值或者所述总损失小于或者等于预设损失阈值。

在设置所述损失收敛的条件时，可以将总损失的计算次数，即上述过程的迭代过程的次数作为损失收敛的条件。例如，在所述总损失的计算次数等于预设次数阈值时，认为总损失满足损失收敛的预设条件，停止训练多层感知器，所述预设次数阈值为预先设置的次数阈值，此处并不做特别的限制。或者在所述总损失小于或者等于预设损失阈值时，认为所述总损失满足损失收敛的预设条件，所述预设损失阈值为预先设置的损失阈值，此处并不做特别的限制。

当所述总损失满足损失收敛的预设条件，则执行步骤S1017，将满足损失收敛的预设条件之前的最后一次计算过程的第一全连接层的参数和第二全连接层的参数作为所述多层感知器模型的第一全连接层的参数和第二全连接层的参数，确定所述多层感知器模型。

在所述总损失满足损失收敛的预设条件时，即停止训练多层感知器，将满足损失收敛的预设条件之前的最后一次计算过程的第一全连接层的参数和第二全连接层的参数作为所述多层感知器模型的第一全连接层的参数和第二全连接层的参数，以此确定训练后的多层感知器模型。

在较优的一实施例中，为了进一步提高活体检测的识别准确率以及安全性，步骤S1012，分别提取所述第一样本的融合特征和所述第二样本的融合特征包括：

分别提取所述第一样本的中间帧的局部相位量化纹理特征和所述第一样本的动态模式特征中能量最大的动态模式特征。

将所述第一样本的中间帧的局部相位量化纹理特征和所述第一样本的动态模式特征中能量最大的动态模式特征进行融合，获取所述第一样本的融合特征。

分别提取所述第二样本的中间帧的局部相位量化纹理特征和所述第二样本的动态模式特征中能量最大的动态模式特征。

将所述第二样本的中间帧的局部相位量化纹理特征和所述第二样本的动态模式特征中能量最大的动态模式特征进行融合，获取所述第二样本的融合特征。

对于提取所述第一样本或者第二样本的中间帧的局部相位量化纹理特征，具体可以参照上述步骤S104相关的内容；对于提取所述第一样本或者所述第二样本的动态模式特征中能量最大的动态模式特征，具体可以参照上述步骤S105相关的内容；对于将所述第一样本或者第二样本的中间帧的局部相位量化纹理特征和所述第一样本或者第二样本的动态模式特征中能量最大的动态模式特征进行融合，获取所述第一样本或者第二样本的融合特征，具体请参照上述步骤S106，此处均不再详细赘述。

在本发明实施例中，利用样本的融合特征训练所述多层感知器，采用随机梯度下降法通过反向传播的过程调整所述多层感知器全连接层的参数，在所述总损失满足损失收敛的预设条件时，确定训练后的多层感知器模型。鉴于本发明实施例中的样本的融合特征包含了样本的多级纹理特征和能量最大的动态模式特征，因此，可以提高活体检测的识别准确率和安全性。另外，随机梯度下降法相比于其他的梯度下降，运算速度更快，能够达到快速收敛的目的，因此，本发明实施例还可以提高活体检测的效率。

图4示出了本发明实施例提供的活体检测系统的功能模块，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

参考图4，所述活体检测系统10所包括的各个模块用于执行图1对应实施例中的各个步骤，具体请参阅图1以及图1对应实施例中的相关描述，此处不再赘述。在较优的一实施例中，所述活体检测系统10包括训练模块101、获取模块102、转换模块103、纹理特征提取模块104、动态模式特征提取模块105、融合模块106、概率获取模块107以及确定模块108。

所述训练模块101，用于利用预设训练集训练多层感知器，确定多层感知器模型。

所述获取模块102，用于获取待检测的连续N帧的人脸图像，其中，所述 N为大于3的正整数。

所述转换模块103，用于将所述连续N帧的人脸图像中的中间帧的人脸图像由第一颜色空间转换为第二颜色空间，其中，当N为奇数，则所述中间帧的人脸图像为第(N+1)/2帧的人脸图像，当N为偶数，则所述中间帧的人脸图像为第N/2帧或者第N/2+1帧的人脸图像。

所述纹理特征提取模块104，用于提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征。

所述动态模式特征提取模块105，用于提取所述连续N帧人脸图像的动态模式特征。

所述融合模块106，用于将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。

所述概率获取模块107，用于将所述融合特征输入至所述多层感知器模型，获得活体标签的预测概率值和非活体标签的预测概率值。

所述确定模块108，用于当所述活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为活体人脸图像。

所述确定模块108，还用于当所述非活体标签的预测概率值小于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为非活体人脸图像。

在本发明实施例中，利用训练好的多层感知器模型，根据连续N帧的人脸图像的融合特征，对所述连续N帧的人脸图像进行检测，确定模块108进而确定所述连续N帧的人脸图像为活体人脸图像或者非活体标签的预测概率值，鉴于本发明实施例中的融合特征包括所述连续N帧的人脸图像的纹理特征和动态模式特征，因此，可以提高活体检测的识别准确率以及安全性。

图5示出了本发明实施例提供的活体检测系统中动态模式特征提取模块105的结构框图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

参考图5，所述动态模式特征提取模块105所包括的各个单元用于执行图2对应实施例中的各个步骤，具体请参阅图2以及图2对应实施例中的相关描述，此处不再赘述。在较优的一实施例中，所述动态模式特征提取模块105包括数据矩阵获取单元1051、伴随矩阵获取单元1052、特征值分解单元1053、特征向量确定单元1054以及动态模式特征获取单元1055。

所述数据矩阵获取单元1051，用于采用(m*n)*1的列向量表示人脸图像所包含的m*n个灰度值数据，获取由前N-1帧人脸图像所对应的N-1个列向量组成的第一数据矩阵及由后N-1帧人脸图像所对应的N-1个列向量组成的第二数据矩阵。

所述伴随矩阵获取单元1052，用于根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵，其中，所述线性映射矩阵为所述第一数据矩阵与所述第二数据矩阵的逆矩阵相乘后的矩阵，其中，m、n为正整数。

所述特征值分解单元1053，用于通过特征值分解获取所述伴随矩阵的特征向量和特征值。

所述特征向量确定单元1054，用于确定所述特征值中绝对值最大的特征值所对应的特征向量。

所述动态模式特征获取单元1055，用于将所述第一数据矩阵与所述相位角度值中最接近零的特征值所对应的特征向量相乘，并对相乘后的结果取绝对值，获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征。

在本发明实施例中，首先伴随矩阵获取单元1052获取所述线性映射矩阵的伴随矩阵，特征值分解单元1053通过特征值分解获取伴随矩阵的特征值和特征向量，确定特征值中绝对值最大的特征值所对应的特征向量，进而获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征，本发明实施例中的动态模式特征为能量最大的动态模式特征，因此，本发明实施例可以进一步提高活体检测的识别准确率以及安全性。

图6示出了本发明实施例提供的活体检测系统中训练模块101的结构框图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

参考图6，所述训练模块101所包括的各个单元用于执行图3对应实施例中的各个步骤，具体请参阅图3以及图3对应实施例中的相关描述，此处不再赘述。在较优的一实施例中，所述训练模块101包括：样本抽取单元1011、融合特征提取单元1012、Softmax损失确定单元1013、对比损失确定单元1014、总损失确定单元1015、参数调整单元1016以及模型确定单元1017。

所述样本抽取单元1011，用于从预设训练集中随机抽取第一样本和第二样本，其中，所述预设训练集中的每个样本均包含至少连续N帧的人脸图像。

所述融合特征提取单元1012，用于分别提取所述第一样本的融合特征和所述第二样本的融合特征。

所述Softmax损失确定单元1013，用于将所述第一样本的融合特征和第二样本的融合特征分别输入所述多层感知器，获取所述第一样本的Softmax损失和所述第二样本的Softmax损失。

所述对比损失确定单元1014，用于确定所述第一样本和所述第二样本的对比损失。

所述总损失确定单元1015，用于通过所述第一样本的Softmax损失、所述第二样本的Softmax损失以及所述对比损失确定总损失。

所述参数调整单元1016，用于在所述总损失不满足损失收敛的预设条件时，利用随机梯度下降法通过反向传播的过程调整所述多层感知器中第一全连接层的参数和所述第二全连接层的参数。

所述模型确定单元1017，用于在所述总损失满足损失收敛的预设条件时，将满足损失收敛的预设条件之前的最后一次计算过程的第一全连接层的参数和第二全连接层的参数作为所述多层感知器模型的第一全连接层的参数和第二全连接层的参数，确定所述多层感知器模型。

在本发明实施例中，利用样本的融合特征训练所述多层感知器，参数调整单元1016采用随机梯度下降法通过反向传播的过程调整所述多层感知器全连接层的参数，模型确定单元1017在所述总损失满足损失收敛的预设条件时，确定训练后的多层感知器模型。鉴于本发明实施例中样本的融合特征包含了样本的多级纹理特征和能量最大的动态模式特征，因此，可以提高活体检测的识别准确率和安全性。另外，随机梯度下降法相比于其他的梯度下降，运算速度更快，能够达到快速收敛的目的，因此，本发明实施例还可以提高活体检测的效率。

图7是本发明实施例提供的实现活体检测方法的较佳实施例的计算机装置1的结构示意图。如图7所示，计算机装置1包括存储器11、处理器12及输入输出设备13。

所述计算机装置1是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机装置1可以是任何一种可与用户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)、游戏机、交互式网络电视(Internet Protocol Television，IPTV)、智能式穿戴式设备等。所述计算机装置1可以是服务器，所述服务器包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述计算机装置1所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network，VPN)等。

存储器11用于存储活体检测方法的程序和各种数据，并在计算机装置1运行过程中实现高速、自动地完成程序或数据的存取。存储器11可以是计算机装置1的外部存储设备和/或内部存储设备。进一步地，存储器11可以是集成电路中没有实物形式的具有存储功能的电路，如RAM(Random-Access Memory，随机存取存储设备)、FIFO(First In First Out，)等，或者，存储器11也可以是具有实物形式的存储设备，如内存条、TF卡(Trans-flash Card)等等。

处理器12可以是中央处理器(CPU，Central Processing Unit)。CPU是一块超大规模的集成电路，是计算机装置1的运算核心(Core)和控制核心(Control Unit)。处理器12可执行计算机装置1的操作系统以及安装的各类应用程序、程序代码等，例如执行活体检测系统10中的各个模块或者单元中的操作系统以及安装的各类应用程序、程序代码，以实现活体检测方法。

输入输出设备13主要用于实现计算机装置1的输入输出功能，比如收发输入的数字或字符信息，或显示由用户输入的信息或提供给用户的信息以及计算机装置1的各种菜单。

所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上说明的本发明的特征性的手段可以通过集成电路来实现，并控制实现上述任意实施例中所述活体检测方法的功能。即，本发明的集成电路安装于所述计算机装置1中，使所述计算机装置1发挥如下功能：

利用预设训练集训练多层感知器，确定多层感知器模型；

提取所述连续N帧人脸图像的动态模式特征；

在任意实施例中所述活体检测方法所能实现的功能都能通过本发明的集成电路安装于所述计算机装置1中，使所述计算机装置1发挥任意实施例中所述活体检测方法所能实现的功能，在此不再详述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

一种活体检测方法，其特征在于，所述活体检测方法包括：

利用预设训练集训练多层感知器，确定多层感知器模型；

获取待检测的连续N帧的人脸图像，其中，所述N为大于3的正整数；

将所述连续N帧的人脸图像中的中间帧的人脸图像由第一颜色空间转换为第二颜色空间，其中，当N为奇数，则所述中间帧的人脸图像为第(N+1)/2帧的人脸图像，当N为偶数，则所述中间帧的人脸图像为第N/2帧或者第N/2+1帧的人脸图像；

提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征；

提取所述连续N帧人脸图像的动态模式特征；

将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征；

将所述融合特征输入至所述多层感知器模型，获得活体标签的预测概率值和非活体标签的预测概率值；

当所述活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为活体人脸图像；

当所述非活体标签的预测概率值大于所述非活体标签的预测概率值，则确定所述连续N帧的人脸图像为非活体人脸图像。
如权利要求1所述的活体检测方法，其特征在于，所述第一颜色空间为RGB颜色空间，所述第二颜色空间为Lab颜色空间，所述提取所述转换为第二颜色空间的中间帧的人脸图像的纹理特征包括：

提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的局部相位量化纹理特征。
如权利要求2所述的活体检测方法，其特征在于，所述提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的局部相位量化纹理特征包括：

提取所述转换为Lab颜色空间的中间帧的人脸图像的预设邻域的多级局部相位量化纹理特征；

所述将所述纹理特征与所述动态模式特征进行融合，获取融合后的融合特征包括：

将所述预设邻域的多级局部相位量化纹理特征与所述动态模式特征进行融合，获取融合后的融合特征。
如权利要求1所述的活体检测方法，其特征在于，所述提取所述连续N帧人脸图像的动态模式特征包括：

提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征。
如权利要求4所述的活体检测方法，其特征在于，所述提取所述连续N帧人脸图像的动态模式特征中能量最大的动态模式特征包括：

采用(m*n)*1的列向量表示人脸图像所包含的m*n个灰度值数据，获取由前N-1帧人脸图像所对应的N-1个列向量组成的第一数据矩阵及由后N-1帧人脸图像所对应的N-1个列向量组成的第二数据矩阵，其中，m、n为正整数；

根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵，其中，所述线性映射矩阵为所述第一数据矩阵与所述第二数据矩阵的逆矩阵相乘后的矩阵；

通过特征值分解获取所述伴随矩阵的特征向量和特征值；

确定所述特征值中绝对值最大的特征值所对应的特征向量；

将所述第一数据矩阵与所述绝对值最大的特征值所对应的特征向量相乘，并对相乘后的结果取绝对值，获取所述连续N帧的人脸图像的动态模式特征中能量最大的动态模式特征。
如权利要求5所述的活体检测方法，其特征在于，所述根据所述第一数据矩阵和所述第二数据矩阵获取线性映射矩阵的伴随矩阵包括：

对所述第一数据矩阵进行三角分解，并分别获得所述第一数据矩阵的上三角矩阵和下三角矩阵；

获取所述上三角矩阵的逆矩阵以及所述下三角矩阵的伪逆矩阵；

将所述上三角矩阵的逆矩阵、所述下三角矩阵的伪逆矩阵以及所述第二数据矩阵相乘，获取所述线性映射矩阵的伴随矩阵。
如权利要求1所述的活体检测方法，其特征在于，所述多层感知器至少包括第一全连接层和第二全连接层，所述利用预设训练集训练多层感知器，确定多层感知器模型包括：

从预设训练集中随机抽取第一样本和第二样本，其中，所述预设训练集中的每个样本均包含至少连续N帧的人脸图像；

分别提取所述第一样本的融合特征和所述第二样本的融合特征；

将所述第一样本的融合特征和第二样本的融合特征分别输入所述多层感知器，获取所述第一样本的Softmax损失和所述第二样本的Softmax损失；

确定所述第一样本和所述第二样本的对比损失；

通过所述第一样本的Softmax损失、所述第二样本的Softmax损失以及所述对比损失确定总损失；

当所述总损失不满足损失收敛的预设条件，则利用随机梯度下降法通过反向传播的过程调整所述多层感知器中第一全连接层的参数和所述第二全连接层的参数；

直至所述总损失满足损失收敛的预设条件，将满足损失收敛的预设条件之前的最后一次计算过程的第一全连接层的参数和第二全连接层的参数作为所述多层感知器模型的第一全连接层的参数和第二全连接层的参数，确定所述多层感知器模型。
如权利要求7所述的活体检测方法，其特征在于，所述预设条件包括所述总损失的计算次数等于预设次数阈值或者所述总损失小于或者等于预设损失阈值。
一种计算机装置，其特征在于，所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至8中任意一项所述活体检测方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述活体检测方法。