WO2023273297A1

WO2023273297A1 - 基于多模态的活体检测方法、装置、电子设备及存储介质

Info

Publication number: WO2023273297A1
Application number: PCT/CN2022/071322
Authority: WO
Inventors: 李佼; 戴磊; 刘玉宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-06-30
Filing date: 2022-01-11
Publication date: 2023-01-05
Also published as: CN113435353A

Abstract

一种基于多模态的活体检测方法，包括：采集目标对象的RGB图像序列、IR图像序列和深度图像序列；对目标对象的RGB图像序列进行预处理，得到目标RGB图像序列；对目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；提取每一帧RGB图像的光流特征图像；提取多模态特征集；将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。还公开了一种基于多模态的活体检测装置、电子设备及存储介质。

Description

基于多模态的活体检测方法、装置、电子设备及存储介质

本申请要求于2021年6月30日提交中国专利局，申请号为202110735343.2申请名称为“基于多模态的活体检测方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，具体涉及一种基于多模态的活体检测方法、装置、电子设备及存储介质。

背景技术

人脸活体检测对于一些敏感度高，安全性要求高的项目，例如：人脸支付，身份核验等，是必不可少的一个环节。发明人发现现有的活体检测方案中，多是基于单模态的活体检测方案，例如，RGB活体检测，IR活体检测等。

然而，在进行活体检测时，单模态的RGB活体受光线影响较大，在昏暗或者强光的情况下，由于成像不明显导致活体检测准确率低；单模态的IR活体对于高分辨率的屏幕，由于呈现出人脸的信息导致活体检测准确率低。

因此，有必要提出一种可以快速准确的进行活体检测的方法。

发明内容

本申请提出一种基于多模态的活体检测方法、装置、电子设备及存储介质。

本申请的第一方面提供一种基于多模态的活体检测方法，所述方法包括：

采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。

本申请的第二方面提供一种电子设备，所述电子设备包括存储器及处理器，所述存储器用于存储至少一个计算机可读指令，所述处理器用于执行所述至少一个计算机可读指令以实现以下步骤：

本申请的第三方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有至少一个计算机可读指令，所述至少一个计算机可读指令被处理器执行时实现以下步骤：

本申请的第四方面提供一种基于多模态的活体检测装置，其中，所述装置包括：

采集模块，用于采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

预处理模块，用于对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

配对模块，用于按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

提取模块，用于采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

组合模块，用于将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

输入模块，用于将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。

本申请所述的基于多模态的活体检测方法、装置、电子设备及存储介质，提高了活体检测的正确率。

附图说明

图1是本申请实施例一提供的基于多模态的活体检测方法的流程图。

图2是本申请实施例二提供的基于多模态的活体检测装置的结构图。

图3是本申请实施例三提供的电子设备的结构示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

实施例一

在本实施例中，所述基于多模态的活体检测方法可以应用于电子设备中，对于需要进行基于多模态的活体检测的电子设备，可以直接在电子设备上集成本申请的方法所提供的基于多模态的活体检测的功能，或者以软件开发工具包(Software Development Kit，SDK)的形式运行在电子设备中。

如图1所示，所述基于多模态的活体检测方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像。

本实施例中，所述预设的摄像设备是由多个摄像组件集成的，通过所述预设的摄像设置可以采用目标对象的一系列RGB图像、IR图像和深度图像，具体地，需要连续采集所述目标对象的RGB图像序列、IR图像序列和深度图像序列，便于后续进行活体检测识别。

S12，对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列。

本实施例中，所述预处理是指对所述RGB图像序列中每一帧RGB图像进行归一化处理和亮度调整。

在一个可选的实施例中，所述对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列包括：

将所述RGB图像序列中每一帧RGB图像转化为YCbCr图像；

分别对所述YCbCr图像中的各个分量进行归一化处理，得到归一化后的各个分量图像；

根据所述RGB图像序列中每一帧RGB图像对应的插值曲线对归一化后的各个分量图像进行亮度调整，得到调整后的各个分量图像；

将调整后的各个分量图像进行叠加以得到处理后的YCbCr图像，并将处理后的YCbCr图像转化为RGB图像，得到目标RGB图像序列。

本实施例中，在对所述RGB图像序列中每一帧RGB图像处理过程中，将每一帧RGB图像转换为YCbCr图像，然后对YCbCr图像中的各个分量，即Y分量、Cb分量和Cr分量进行归一化处理，得到归一化后的各个分量图像，具体地，所述Y分量是通过归一化处理所述每一帧RGB图像中的明亮度，所述Cb分量用以表征RGB图像输入信号蓝色部分与RGB图像信号亮度值之间的差异，所述用以表征RGB图像输入信号红色部分与RGB图像信号亮度值之间的差异。

本实施例中，每一帧RGB图像对应一个插值曲线，根据所述RGB图像序列中每一帧RGB图像对应的插值曲线对归一化后的各个分量图像进行亮度调整，使得图像处理时，并不仅仅是调节Y分量，还可以同时调节图像Cb分量和Cr分量，不仅调节了每一帧RGB图像的亮度，还保持了每一帧RGB图像的纹理或颜色特征等细节信息，本实施例通过对每一帧RGB图像的各个分量分别归一化处理，再由插值曲线对各个分量图像进行调节，对包含不同的亮度的GRB图像均通用，而不需要根据不同的亮度区域采用不同的算法进行处理，从而提高了得到目标RGB图像序列的效率。

在其他可选的实施例中，所述对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列包括：

计算所述RGB图像序列的均值和方差值；

计算所述RGB图像序列中的每一帧RGB图像与所述均值之间的差值，得到每一帧图像的差值；

计算所述每一帧图像的差值与所述方差值之商，得到每一帧图像的商值，并对所述每一帧图像的商值进行归一化处理，得到目标RGB图像序列。

示例性地，若所述RGB图像序列中包含有M帧RGB图像，则针对M帧RGB图像中的每一帧RGB图像，分别进行先减去所述RGB图像序列的均值，再除以所述RGB图像序列的方差值后进行归一化处理，得到M帧RGB图像处理后的目标RGB图像序列。

本实施例中，通过对所述RGB图像序列中的每一帧RGB图像进行预处理，使得每一帧RGB图像在每一个特征维度上能够具有相同的数据级别，例如具有零均值和单位方差，进而滤除对于活体检测分类而言不感兴趣的图像特征，提高提取图像特征的有效性。

S13，按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像。

本实施例中，每一帧图像包含有采集时间信息，根据每一帧的采集时间信息，将同一时间信息的RGB图像、IR图像和深度图像进行配对，得到每一帧模态图像。

S14，采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像。

本实施例中，光流特征是通过采用光流法基于预设的摄像设备采集目标对象的RGB图像中提取得到的，具体地，所述光流特征是指空间运动物体在观察成像平面上的像素运动的瞬间速度，利用RGB图像序列中像素在时间域上的变化以及相邻帧之间的相关性找到当前帧和上一帧之间的关系。

本实施例中，针对目标对象的活体检测，人脸不是绝对静止的，那么用光流法提取光流特征之后，对于真实的人脸而言，光流特征在人脸部分是不规则的，而对于攻击样本而言，例如纸张攻击，人脸的肌肉是不会动的，所以纸张攻击的人脸部分光流特征是规则的。

本实施例通过提取所述RGB图像序列中每一帧RGB图像的光流特征图像，并将提取到的光流特征图像输入至后续的活体检测分类模型中，进而提高了活体检测的正确率。

在一个可选的实施例中，所述采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像包括：

对所述RGB图像序列中的每相邻两帧RGB图像进行光流计算，获取每一帧RGB图像的每个像素的位移矢量，并根据所述每一帧RGB图像的每个像素的位移矢量生成对应帧的光流特征图像。

本实施例中，通过对所述RGB图像序列中的相邻两帧RGB图像进行光流计算，估算出每一帧RGB图像的每个像素的位移矢量，进而生成每一帧的光流特征图像。

本实施例中，可以预先设定光流法进行光流计算，具体地，所述预设的光流法可以是Lucas-Kanade算法(简称为LK算法)等。

S15，将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集。

本实施例中，为了确保后续活体检测的正确率，将每一帧的4中模态图进行组合，得到每一帧目标图像，具体地，所述每一帧目标图像中包含有时域特征和空域特征，其中，所述时域特征用以表征光流特征图像的图像特征，所述空域特征用以表征所述RGB图像、IR图像及深度图像的图像特征。

在一个可选的实施例中，所述提取所述每一帧目标图像中的多模态特征集包括：

提取所述每一帧目标图像中的RGB图像的第一空间特征，形成第一特征；

提取所述每一帧目标图像中的IR图像的第二空间特征，形成第二特征；

提取所述每一帧目标图像中的深度图像的第三空间特征，形成第三特征；

提取所述每一帧目标图像中的光流特征图像的时序特征，形成第四特征；

将所述第一特征、所述第二特征、所述第三特征和所述第四特征进行合并，确定为每一帧的多模态特征集。

本实施例中，可以将所述每一帧目标图像输入至AlexNet网络特征提取模块中，分别提取出RGB图像的第一空间特征，IR图像的第二空间特征、深度图像的第三空间特征及光流特征图像的时序特征。

需要强调的是，为进一步保证上述多模态特征集的私密和安全性，上述多模态特征集还可以存储于一区块链的节点中。

S16，将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。

本实施例中，可以预先训练活体检测分类模型，在得到所述目标对象的每一帧的多模态特征集之后，将所述目标对象的多帧多模态特征集输入至预先训练好的活体检测分类模型中，并根据所述活体检测分类模型识别出所述目标对象是否为活体。

具体地，所述活体检测分类模型的训练过程包括：

获取第一样本集和第二样本集，其中，所述第一样本集中包含有预设第一数量的活体对象及每个活体对象对应的第一样本图像，所述第二样本集中包含有预设第二数量的非活体对象及每个非活体对象对应的第二样本图像，其中，所述预设第一数量和预设第二数量之间的差值小于预设的偏差阈值；

将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集；

将所述训练集输入预设神经网络中进行训练，得到活体检测分类模型；

将所述测试集输入至所述活体检测分类模型中进行测试，并计算测试通过率；

若所述测试通过率大于或者等于预设通过率阈值，确定所述活体检测分类模型训练结束；若所述测试通过率小于预设通过率阈值，增加训练集的数量，重新进行活体检测分类模型的训练。

本实施例中，在进行活体检测分类模型训练时，为了确保训练得到的活体检测分类模型的分类准确率，保证所述第一样本集和第二样本集的均衡性，可以预先设置偏差阈值，确保预设的第一数量的活体对象与预设的第二数量的非活体对象之间的偏差值小于所述预设的偏差阈值。

进一步地，所述将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集包括：

提取每个所述活体对象的每张第一样本图像的第一RGB图像、第一IR图像和第一深度图像，及提取每个所述非活体对象的每张第二样本图像的第二RGB图像、第二IR图像和第二深度图像；

按照图像采集的时间先后顺序对每一帧第一RGB图像、第一IR图像和第一深度图像进行配对，得到每一帧第一模态图像，及按照图像采集的时间先后顺序对每一帧第二RGB图像、第二IR图像和第二深度图像进行配对，得到每一帧第二模态图像；

采用光流法提取所述每一帧第一RGB图像的第一光流特征图像，及采用光流法提取所述每一帧第二RGB图像的第二光流特征图像；

将每一帧第一模态图像与对应帧的第一光流特征图像进行组合，得到每一帧第一目标图像，及将每一帧第二模态图像与对应帧的第二光流特征图像进行组合，得到每一帧第二目标图像；

提取所述每一帧第一目标图像中的多模态第一特征集，及提取所述每一帧第二目标图像中的多模态第二特征集；

将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集。

进一步地，所述将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集包括：

根据所述预设的划分规则确定训练集对应的多模态第一特征集的第一数量，及确定训练集对应的多模态第二特征集的第二数量，其中，所述第一数量等于所述第二数量；

将剩余的多模态第一特征集和多模态第二特征集确定为测试集。

本实施例中，可以预先设置划分规则，确定所述训练集占比为70％，测试集占比为30％，根据预设的划分规则确定所述训练集对应的多模态第一特征集的第一数量，及确定训练集对应的多模态第二特征集的第二数量，使得所述第一数量等于所述第二数量。

本实施例中，通过预设的划分规则可以确保所述训练集中的活体对象的多模态第一特征集等于非活体对象的多模态第二特征集，确保可后续活体检测分类模型中活体对象的第一特征集和非活体对象的第二特征集的样本的均衡性，进而提高了活体检测分类模型的活体检测的准确率。

本实施例中，RGB图像对于人脸活体检测而言是一种通用的输入模态，RGB图像在光线合适的情况下可以有效的判断活体和非活体的状态，但是在光线昏暗或者强光条件下，由于成像不明显会导致活体检测判断错误。

本实施例中，IR图像和深度图像不会因为光线的原因而呈现不同的图像，本实施例通过引入IR图像和深度图像来克服由于光线昏暗或者强光条件下导致的活体检测判断错误的问题，在进行活体检测分类模型训练时，考虑了RGB图像的第一空间特征、IR图像的第二空间特征、深度图像的第三空间特征和光流特征图像的时序特征，对多个模态进行融合后进行模型训练，提高了活体检测分类模型的鲁棒性和分类准确率，在得到所述目标对象的多帧多模态特征集时，将所述多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，在进行活体检测时，可以有效的进行活体和非活体检测，进而提高活体检测的准确率。

综上所述，本实施例所述的基于多模态的活体检测方法，一方面，在进行活体检测分类模型训练时，考虑了RGB图像的第一空间特征、IR图像的第二空间特征、深度图像的第三空间特征和光流特征图像的时序特征，对多个模态进行融合后进行模型训练，提高了活体检测分类模型的鲁棒性和分类准确率，在得到所述目标对象的多帧多模态特征集时，将所述多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，在进行活体检测时，可以有效的进行活体和非活体检测，进而提高活体检测的准确率；另一方面，采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像，通过提取所述RGB图像序列中每一帧RGB图像的光流特征图像，并将提取到的光流特征图像输入至后续的活体检测分类模型中，进而提高了活体检测的正确率；最后，对所述RGB图像序列中每一帧RGB图像进行预处理，使得每一帧RGB图像在每一个特征维度上能够具有相同的数据级别，例如具有零均值和单位方差，进而滤除对于活体检测分类而言不感兴趣的图像特征，提高提取图像特征的有效性。

实施例二

在一些实施例中，所述基于多模态的活体检测装置20可以包括多个由程序代码段所组成的功能模块。所述基于多模态的活体检测装置20中的各个程序段的程序代码可以存储于电子设备的存储器中，并由所述至少一个处理器所执行，以执行(详见图1描述)基于多模态的活体检测的功能。

本实施例中，所述基于多模态的活体检测装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：采集模块201、预处理模块202、配对模块203、提取模块204、组合模块205及输入模块206。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

采集模块201，用于采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像。

预处理模块202，用于对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列。

配对模块203，用于按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像。

提取模块204，用于采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像。

组合模块205，用于将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集。

输入模块206，用于将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。

本实施例所述的基于多模态的活体检测装置，一方面，在进行活体检测分类模型训练时，考虑了RGB图像的第一空间特征、IR图像的第二空间特征、深度图像的第三空间特征和光流特征图像的时序特征，对多个模态进行融合后进行模型训练，提高了活体检测分类模型的鲁棒性和分类准确率，在得到所述目标对象的多帧多模态特征集时，将所述多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，在进行活体检测时，可以有效的进行活体和非活体检测，进而提高活体检测的准确率；另一方面，采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像，通过提取所述RGB图像序列中每一帧RGB图像的光流特征图像，并将提取到的光流特征图像输入至后续的活体检测分类模型中，进而提高了活体检测的正确率；最后，对所述RGB图像序列中每一帧RGB图像进行预处理，使得每一帧RGB图像在每一个特征维度上能够具有相同的数据级别，例如具有零均值和单位方差，进而滤除对于活体检测分类而言不感兴趣的图像特征，提高提取图像特征的有效性。

实施例三

参阅图3所示，为本申请实施例三提供的电子设备的结构示意图。在本申请较佳实施例中，所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的电子设备的结构并不构成本申请实施例的限定，既可以是总线型结构，也可以是星形结构，所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述电子设备3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的电子设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述电子设备3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本申请，也应包含在本申请的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31用于存储程序代码和各种数据，例如安装在所述电子设备3中的基于多模态的活体检测装置20，并在电子设备3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括非易失性存储器和易失性存储器，比如只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

在一些实施例中，所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述电子设备3的控制核心(Control Unit)，利用各种接口和线路连接整个电子设备3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行电子设备3的各种功能和处理数据。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述电子设备3还可以包括给各个部件供电的电源(比如电池)，可选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分。

在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述电子设备3的操作装置以及安装的各类应用程序(如所述的基于多模态的活体检测装置20)、程序代码等，例如，上述的各个模块。

所述存储器31中存储有程序代码，且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器31中的程序代码，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能以达到基于多模态的活体检测的目的。

在本申请的一个实施例中，所述存储器31存储多个计算机可读指令，所述多个计算机可读指令被所述至少一个处理器32所执行以实现基于多模态的活体检测的功能。

示例性的，所述程序代码可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器31中，并由所述处理器32执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机程序在所述电子设备3中的执行过程。例如，所述程序代码可以被分割成采集模块201、预处理模块202、配对模块203、提取模块204、组合模块205及输入模块206。

具体地，所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

进一步地，所述计算机可读存储介质可以是非易失性，也可以是易失性。

进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。本申请中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种基于多模态的活体检测方法，其中，所述方法包括：

采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。
如权利要求1所述的基于多模态的活体检测方法，其中，所述活体检测分类模型的训练过程包括：

获取第一样本集和第二样本集，其中，所述第一样本集中包含有预设第一数量的活体对象及每个活体对象对应的第一样本图像，所述第二样本集中包含有预设第二数量的非活体对象及每个非活体对象对应的第二样本图像，其中，所述预设第一数量和预设第二数量之间的差值小于预设的偏差阈值；

将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集；

将所述训练集输入预设神经网络中进行训练，得到活体检测分类模型；

将所述测试集输入至所述活体检测分类模型中进行测试，并计算测试通过率；

若所述测试通过率大于或者等于预设通过率阈值，确定所述活体检测分类模型训练结束；若所述测试通过率小于预设通过率阈值，增加训练集的数量，重新进行活体检测分类模型的训练。
如权利要求2所述的基于多模态的活体检测方法，其中，所述将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集包括：

提取每个所述活体对象的每张第一样本图像的第一RGB图像、第一IR图像和第一深度图像，及提取每个所述非活体对象的每张第二样本图像的第二RGB图像、第二IR图像和第二深度图像；

按照图像采集的时间先后顺序对每一帧第一RGB图像、第一IR图像和第一深度图像进行配对，得到每一帧第一模态图像，及按照图像采集的时间先后顺序对每一帧第二RGB图像、第二IR图像和第二深度图像进行配对，得到每一帧第二模态图像；

采用光流法提取所述每一帧第一RGB图像的第一光流特征图像，及采用光流法提取所述每一帧第二RGB图像的第二光流特征图像；

将每一帧第一模态图像与对应帧的第一光流特征图像进行组合，得到每一帧第一目标图像，及将每一帧第二模态图像与对应帧的第二光流特征图像进行组合，得到每一帧第二目标图像；

提取所述每一帧第一目标图像中的多模态第一特征集，及提取所述每一帧第二目标图像中的多模态第二特征集；

将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集。
如权利要求3所述的基于多模态的活体检测方法，其中，所述将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集包括：

根据所述预设的划分规则确定训练集对应的多模态第一特征集的第一数量，及确定训练集对应的多模态第二特征集的第二数量，其中，所述第一数量等于所述第二数量；

将剩余的多模态第一特征集和多模态第二特征集确定为测试集。
如权利要求1所述的基于多模态的活体检测方法，其中，所述对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列包括：

将所述RGB图像序列中每一帧RGB图像转化为YCbCr图像；

分别对所述YCbCr图像中的各个分量进行归一化处理，得到归一化后的各个分量图像；

根据所述RGB图像序列中每一帧RGB图像对应的插值曲线对归一化后的各个分量图像进行亮度调整，得到调整后的各个分量图像；

将调整后的各个分量图像进行叠加以得到处理后的YCbCr图像，并将处理后的YCbCr图像转化为RGB图像，得到目标RGB图像序列。
如权利要求1所述的基于多模态的活体检测方法，其中，所述采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像包括：

对所述RGB图像序列中的每相邻两帧RGB图像进行光流计算，获取每一帧RGB图像的每个像素的位移矢量，并根据所述每一帧RGB图像的每个像素的位移矢量生成对应帧的光流特征图像。
如权利要求1所述的基于多模态的活体检测方法，其中，所述提取所述每一帧目标图像中的多模态特征集包括：

提取所述每一帧目标图像中的RGB图像的第一空间特征，形成第一特征；

提取所述每一帧目标图像中的IR图像的第二空间特征，形成第二特征；

提取所述每一帧目标图像中的深度图像的第三空间特征，形成第三特征；

提取所述每一帧目标图像中的光流特征图像的时序特征，形成第四特征；

将所述第一特征、所述第二特征、所述第三特征和所述第四特征进行合并，确定为每一帧的多模态特征集。
一种电子设备，其中，所述电子设备包括存储器及处理器，所述存储器用于存储至少一个计算机可读指令，所述处理器用于执行所述至少一个计算机可读指令以实现以下步骤：

采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。
如权利要求8所述的电子设备，其中，所述处理器执行所述至少一个计算机可读指令以实现所述活体检测分类模型的训练过程时，具体包括：

获取第一样本集和第二样本集，其中，所述第一样本集中包含有预设第一数量的活体对象及每个活体对象对应的第一样本图像，所述第二样本集中包含有预设第二数量的非活体对象及每个非活体对象对应的第二样本图像，其中，所述预设第一数量和预设第二数量之间的差值小于预设的偏差阈值；

将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集；

将所述训练集输入预设神经网络中进行训练，得到活体检测分类模型；

将所述测试集输入至所述活体检测分类模型中进行测试，并计算测试通过率；

若所述测试通过率大于或者等于预设通过率阈值，确定所述活体检测分类模型训练结束；若所述测试通过率小于预设通过率阈值，增加训练集的数量，重新进行活体检测分类模型的训练。
如权利要求9所述的电子设备，其中，所述处理器执行所述至少一个计算机可读指令以实现所述将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集时，具体包括：

提取每个所述活体对象的每张第一样本图像的第一RGB图像、第一IR图像和第一深度图像，及提取每个所述非活体对象的每张第二样本图像的第二RGB图像、第二IR图像和第二深度图像；

按照图像采集的时间先后顺序对每一帧第一RGB图像、第一IR图像和第一深度图像进行配对，得到每一帧第一模态图像，及按照图像采集的时间先后顺序对每一帧第二RGB图像、第二IR图像和第二深度图像进行配对，得到每一帧第二模态图像；

采用光流法提取所述每一帧第一RGB图像的第一光流特征图像，及采用光流法提取所述每一帧第二RGB图像的第二光流特征图像；

将每一帧第一模态图像与对应帧的第一光流特征图像进行组合，得到每一帧第一目标图像，及将每一帧第二模态图像与对应帧的第二光流特征图像进行组合，得到每一帧第二目标图像；

提取所述每一帧第一目标图像中的多模态第一特征集，及提取所述每一帧第二目标图像中的多模态第二特征集；

将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集。
如权利要求8所述的电子设备，其中，所述处理器执行所述至少一个计算机可读指令以实现所述对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列时，具体包括：

将所述RGB图像序列中每一帧RGB图像转化为YCbCr图像；

分别对所述YCbCr图像中的各个分量进行归一化处理，得到归一化后的各个分量图像；

根据所述RGB图像序列中每一帧RGB图像对应的插值曲线对归一化后的各个分量图像进行亮度调整，得到调整后的各个分量图像；

将调整后的各个分量图像进行叠加以得到处理后的YCbCr图像，并将处理后的YCbCr图像转化为RGB图像，得到目标RGB图像序列。
如权利要求8所述的电子设备，其中，所述处理器执行所述至少一个计算机可读指令以实现所述采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像时，具体包括：

对所述RGB图像序列中的每相邻两帧RGB图像进行光流计算，获取每一帧RGB图像的每个像素的位移矢量，并根据所述每一帧RGB图像的每个像素的位移矢量生成对应帧的光流特征图像。
如权利要求8所述的电子设备，其中，所述处理器执行所述至少一个计算机可读指令以实现所述提取所述每一帧目标图像中的多模态特征集时，具体包括：

提取所述每一帧目标图像中的RGB图像的第一空间特征，形成第一特征；

提取所述每一帧目标图像中的IR图像的第二空间特征，形成第二特征；

提取所述每一帧目标图像中的深度图像的第三空间特征，形成第三特征；

提取所述每一帧目标图像中的光流特征图像的时序特征，形成第四特征；

将所述第一特征、所述第二特征、所述第三特征和所述第四特征进行合并，确定为每一帧的多模态特征集。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有至少一个计算机可读指令，所述至少一个计算机可读指令被处理器执行时实现以下步骤：

采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。
如权利要求14所述的存储介质，其中，所述至少一个计算机可读指令被所述处理器执行以实现所述活体检测分类模型的训练过程时，具体包括：

获取第一样本集和第二样本集，其中，所述第一样本集中包含有预设第一数量的活体对象及每个活体对象对应的第一样本图像，所述第二样本集中包含有预设第二数量的非活体对象及每个非活体对象对应的第二样本图像，其中，所述预设第一数量和预设第二数量之间的差值小于预设的偏差阈值；

将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集；

将所述训练集输入预设神经网络中进行训练，得到活体检测分类模型；

将所述测试集输入至所述活体检测分类模型中进行测试，并计算测试通过率；

若所述测试通过率大于或者等于预设通过率阈值，确定所述活体检测分类模型训练结束；若所述测试通过率小于预设通过率阈值，增加训练集的数量，重新进行活体检测分类模型的训练。
如权利要求15所述的存储介质，其中，所述至少一个计算机可读指令被所述处理器执行以实现所述将所述第一样本集和所述第二样本集按照预设的划分规则划分出训练集和测试集时，具体包括：

提取每个所述活体对象的每张第一样本图像的第一RGB图像、第一IR图像和第一深度图像，及提取每个所述非活体对象的每张第二样本图像的第二RGB图像、第二IR图像和第二深度图像；

按照图像采集的时间先后顺序对每一帧第一RGB图像、第一IR图像和第一深度图像进行配对，得到每一帧第一模态图像，及按照图像采集的时间先后顺序对每一帧第二RGB图像、第二IR图像和第二深度图像进行配对，得到每一帧第二模态图像；

采用光流法提取所述每一帧第一RGB图像的第一光流特征图像，及采用光流法提取所述每一帧第二RGB图像的第二光流特征图像；

将每一帧第一模态图像与对应帧的第一光流特征图像进行组合，得到每一帧第一目标图像，及将每一帧第二模态图像与对应帧的第二光流特征图像进行组合，得到每一帧第二目标图像；

提取所述每一帧第一目标图像中的多模态第一特征集，及提取所述每一帧第二目标图像中的多模态第二特征集；

将多帧多模态第一特征集和多帧多模态第二特征集按照预设的划分规则划分出训练集和测试集。
如权利要求14所述的存储介质，其中，所述至少一个计算机可读指令被所述处理器执行以实现所述对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列时，具体包括：

将所述RGB图像序列中每一帧RGB图像转化为YCbCr图像；

分别对所述YCbCr图像中的各个分量进行归一化处理，得到归一化后的各个分量图像；

根据所述RGB图像序列中每一帧RGB图像对应的插值曲线对归一化后的各个分量图像进行亮度调整，得到调整后的各个分量图像；

将调整后的各个分量图像进行叠加以得到处理后的YCbCr图像，并将处理后的YCbCr图像转化为RGB图像，得到目标RGB图像序列。
如权利要求14所述的存储介质，其中，所述至少一个计算机可读指令被所述处理器执行以实现所述采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像时，具体包括：

对所述RGB图像序列中的每相邻两帧RGB图像进行光流计算，获取每一帧RGB图像的每个像素的位移矢量，并根据所述每一帧RGB图像的每个像素的位移矢量生成对应帧的光流特征图像。
如权利要求14所述的存储介质，其中，所述至少一个计算机可读指令被所述处理器执行以实现所述提取所述每一帧目标图像中的多模态特征集时，具体包括：

提取所述每一帧目标图像中的RGB图像的第一空间特征，形成第一特征；

提取所述每一帧目标图像中的IR图像的第二空间特征，形成第二特征；

提取所述每一帧目标图像中的深度图像的第三空间特征，形成第三特征；

提取所述每一帧目标图像中的光流特征图像的时序特征，形成第四特征；

将所述第一特征、所述第二特征、所述第三特征和所述第四特征进行合并，确定为每一帧的多模态特征集。
一种基于多模态的活体检测装置，其中，所述装置包括：

采集模块，用于采用预设的摄像设备采集目标对象的RGB图像序列、IR图像序列和深度图像序列，其中，所述RGB图像序列中包含有多帧RGB图像，IR图像序列中包含有多帧IR图像，深度图像序列中包含有多帧深度图像；

预处理模块，用于对所述RGB图像序列中每一帧RGB图像进行预处理，得到目标RGB图像序列；

配对模块，用于按照图像采集的时间先后顺序对所述目标RGB图像序列、IR图像序列和深度图像序列中的每一帧图像进行配对，得到每一帧模态图像；

提取模块，用于采用光流法提取所述RGB图像序列中每一帧RGB图像的光流特征图像；

组合模块，用于将每一帧模态图像与对应帧的光流特征图像进行组合，得到每一帧目标图像，并提取所述每一帧目标图像中的多模态特征集；

输入模块，用于将多帧多模态特征集输入至预先训练好的活体检测分类模型中进行活体检测，得到检测结果。