WO2022032549A1

WO2022032549A1 - 基于跨模态转化辅助的人脸防伪检测方法、系统及装置

Info

Publication number: WO2022032549A1
Application number: PCT/CN2020/108775
Authority: WO
Inventors: 万军; 李子青; 刘阿建
Original assignee: 中国科学院自动化研究所
Priority date: 2020-08-11
Filing date: 2020-08-13
Publication date: 2022-02-17
Also published as: CN111881884B; CN111881884A

Abstract

一种基于跨模态转化辅助的人脸防伪检测方法、系统及装置，旨在解决仅配备RGB摄像头的条件下无法利用IR模态辅助进行人脸检测，导致检测性能低的问题。所述方法包括：对输入图像进行人脸检测、图像裁剪；采用改进的CycleGAN通过RGB与IR模态训练样本对进行人脸模态转换单元的训练，并将输入图像转换为IR图像；通过RGB与IR模态训练样本对和样本标签进行人脸防伪检测模型的训练，并结合输入图像和IR图像计算输入图像属于真实人脸的概率；概率大于设定阈值的为真实人脸图像，否则为攻击图像。本方法利用IR模态更具判别的防伪信息辅助RGB样本的学习，并且IR模态仅参与训练阶段，模型进行人脸防伪检测准确率高，成本低。

Description

基于跨模态转化辅助的人脸防伪检测方法、系统及装置

技术领域

本发明属于图像处理与模式识别领域，具体涉及了一种基于跨模态转化辅助的人脸防伪检测方法、系统及装置。

背景技术

人脸识别系统已经是日常生活中不可或缺的设备，并广泛部署在手机移动端或配备人脸识别系统的场景中。然而这些人脸识别系统极易受到不法分子的恶意攻击，如在采集设备前展示真实用户的人脸图像，通过视频回放或者面具等攻击样本，以伪装成合法用户窃取私人数据或金钱等。因此，在人脸识别系统上部署人脸防伪检测模块不仅具有实际的应用意义，而且已经在多种场景中得到具体应用，如人脸支付、人脸安检、手机人脸解锁等人机交互情境。

在面对拍摄场景变化，光照变化或者相机设置变化等情况下，基于RGB摄像头的人脸防伪检测算法极易出现性能波动，而基于IR摄像头的人脸防伪系统则很少出现这种现象。因为IR摄像头主要捕获人脸样本辐射出的热量信息，该热量信息不仅可以有效判断待测样本的类别，而且不易受到外界环境变化的干扰。然而，大多数实际应用场景中人脸防伪系统很难配备一个额外的IR摄像头。基于这个事实与考虑，本领域还急需一种人脸防伪检测方法，可以利用IR模态的优秀判别特征辅助基于RGB摄像头进行人脸防伪检测，且无需在测试阶段提供真实的IR模态样本。

发明内容

为了解决现有技术中的上述问题，即现有技术在仅配备RGB摄像头的条件下无法利用IR模态辅助进行人脸防伪检测，因而导致检测性能低的问题，本发明提供了一种基于跨模态转化辅助的人脸防伪检测方法，该人脸防伪检测方法包括：

步骤S10，对获取的带人脸的RGB模态图像进行人脸检测，通过检测到的人脸边界框进行所述带人脸的RGB模态图像的裁剪，并缩放至设定大小，获得待检测RGB模态图像；

步骤S20，基于所述待检测RGB模态图像，通过训练好的人脸模态转换模型生成对应的IR模态图像；

步骤S30，基于所述待检测RGB模态图像和IR模态图像，通过训练好的人脸防伪检测模型获取所述待检测RGB模态图像属于真实人脸的概率；

步骤S40，若所述概率值大于设定阈值，则所述待检测RGB模态图像为真实人脸图像；否则，所述待检测RGB模态图像为攻击图像。

在一些优选的实施例中，所述人脸模态转换模型，其训练样本获取方法为：

步骤B10，获取带人脸的RGB模态图像集和对应的IR模态图像集；

步骤B20，对所述带人脸的RGB模态图像集中每一个图像进行人脸检测，通过检测到的人脸边界框进行对应的带人脸的RGB模态图像和IR模态图像的裁剪，并缩放至设定大小，获得RGB和IR模态训练样本对集。

在一些优选的实施例中，所述人脸模态转换模型，其训练方法为：

以所述人脸模态转换模型作为生成器G，构建反向生成器F以及判别器D _I与D _R，基于所述RGB和IR模态训练样本对集中的任一RGB和IR模态训练样本对，通过CycleGAN方法迭代进行对抗训练，直至总损失函数值低于设定阈值，获得训练好的人脸模态转换模型；

其中，所述总损失函数为：

其中，

和

分别代表G与F的目标损失函数，L _GAN(G _e，D _Ie)和L _GAN(F _e，D _Re)代表特征空间G _e与F _e的目标损失函数，L _cyc-final(G，F)代表循环约束一致性损失函数，α、λ为预设的权重因子，c＝1，2，3分别为G(r)，G(i)与i以及F(i)，F(r)与r的类别，r和i分别代表RGB模态训练样本和对应的IR模态训练样本，G(r)和G(i)分别代表RGB模态训练样本r和对应的IR模态训练样本i经过G后的样本。

在一些优选的实施例中，所述循环约束一致性损失函数为：

其中，‖·‖ ₁代表L1范数，P _r和P _i分别为RGB模态训练样本r和对应的IR模态训练样本i的分布，

和

分别代表在给定的概率分布下求模态训练样本r和对应的IR模态训练样本i的数学期望，F(i)代表RGB模态训练样本r对应的IR模态训练样本i经过F后的样本，F(G(r))代表RGB模态训练样本r经过G之后再经过F后的样本，G(F(i))代表RGB模态训练样本r对应的IR模态训练样本i经过F之后再经过G后的样本。

在一些优选的实施例中，所述G与F的目标损失函数包括判别器

和生成器G的对抗损失函数以及判别器

和反向生成器F的对抗损失函数；

所述判别器

和生成器G的对抗损失函数为：

所述判别器

和反向生成器F的对抗损失函数为：

其中，

和

分别代表在给定的概率分布下求模态训练样本r和对应的IR模态训练样本i的数学期望，

表示三类判别器，类别1，2，3分别为G(r)，G(i)与i所属的类别，

表示三类判别器，类别1，2，3分别为F(i)，F(r)与r所属的类别。

在一些优选的实施例中，所述特征空间G _e与F _e的目标损失函数为：

其中，r和i分别代表RGB模态训练样本和对应的IR模态训练样本，P _r为IR模态训练样本i的分布，P _le为RGB模态训练样本r对应的IR模态训练样本i在特征空间的特征分布，P _Re为RGB模态训练样本r在特征空间的特征分布，G _e(i)和G _e(r)分别代表RGB模态训练样本r和对应的IR 模态训练样本i在G的空间特征，F _e(r)和F _e(i)分别代表RGB模态训练样本r和对应的IR模态训练样本i在F的空间特征，D _Ie(G _e(i))和D _Ie(G _e(r))分别代表G _e(i)和G _e(r)属于P _Ie分布的概率，D _Re(F _e(r))和D _Re(F _e(i))分别代表F _e(r)和F _e(i)属于P _Re分布的概率，

代表求G _e(i)∈P _Ie分布下的数学期望，

代表求G _e(r)∈P _Re分布下的数学期望。

在一些优选的实施例中，所述人脸防伪检测模型，其训练方法为：

步骤C10，获取RGB和IR模态训练样本对集以及每一个RGB和IR模态训练样本对的样本标签；

步骤C20，随机选取所述RGB和IR模态训练样本对集任一RGB和IR模态训练样本对，采用所述人脸防伪检测模型的Branch-R与Branch-I分支分别提取RGB模态训练样本与IR模态训练样本的特征；

步骤C30，采用所述人脸防伪检测模型的Shared-branch分支将所述RGB模态训练样本与IR模态训练样本的特征进行信息前向融合与反馈，并结合样本标签计算分类损失值；

步骤C40，若所述分类损失值大于设定阈值，则调整所述人脸防伪检测模型的参数，并跳转步骤C20，直至所述分类损失值小于或等于设定阈值，获得训练好的人脸防伪检测模型。

在一些优选的实施例中，所述分类损失值，其计算方法为：

其中，

为模型预测Branch-I分支中训练样本为真实人脸图像的概率，

为模型预测Branch-R分支中训练样本为真实人脸图像的概率，

为模型预测Shared-branch分支中融合特征为真实人脸特征的概率，y为训练样本的样本标签，y＝1表示训练样本为真实人脸图像，y＝0表示训练样本为攻击图像。

本发明的另一方面，提出了一种基于跨模态转化辅助的人脸防伪检测系统，基于上述的基于跨模态转化辅助的人脸防伪检测方法，该人脸防伪检测系统包括预处理单元、人脸模态转化单元、人脸防伪检测单元和判别单元；

所述预处理单元，配置为对获取的带人脸的RGB模态图像进行人脸检测，通过检测到的人脸边界框进行所述带人脸的RGB模态图像的裁剪，并缩放至设定大小，获得待检测RGB模态图像；

所述人脸模态转化单元，配置为基于所述待检测RGB模态图像，通过训练好的人脸模态转换模型生成对应的IR模态图像；

所述人脸防伪检测单元，配置为基于所述待检测RGB模态图像和IR模态图像，通过训练好的人脸防伪检测模型获取所述待检测RGB模态图像属于真实人脸的概率；

所述判别单元，配置为若所述概率值大于设定阈值，则所述待检测RGB模态图像为真实人脸图像；否则，所述待检测RGB模态图像为攻击图像。

本发明的第三方面，提出了一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于跨模态转化辅助的人脸防伪检测方法。

本发明的第四方面，提出了一种处理装置，包括处理器、存储装置；所述处理器，适于执行各条程序；所述存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于跨模态转化辅助的人脸防伪检测方法。

本发明的有益效果：

(1)本发明基于跨模态转化辅助的人脸防伪检测方法，充分利用了IR模态图像，IR模态图像主要捕获人脸样本辐射出的热量信息，该热量信息不仅可以有效判断待测样本的类别，而且不易受到外界环境变化的干扰，本发明利用IR模态更具判别的防伪信息辅助RGB样本的学习，减少了外界环境干扰造成的人脸防伪检测算法的性能波动，大大提高了RGB人脸防伪检测的准确率与精度。

(2)本发明基于跨模态转化辅助的人脸防伪检测方法，仅在模型训练中引入IR模态图像，而模型训练完成后的测试中，仅需要RGB模态的图像即可通过模态转化获得对应的IR模态信息，系统无需配置额外的IR摄像头，降低了安装的难度与成本。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明基于跨模态转化辅助的人脸防伪检测方法的流程示意图；

图2是本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的训练样本获取流程示意图；

图3是本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的人脸模态转化示意图；

图4是本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的模态辅助示意图；

图5是本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的人脸防伪检测过程示例图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明的一种基于跨模态转化辅助的人脸防伪检测方法，该人脸防伪检测方法包括：

为了更清晰地对本发明基于跨模态转化辅助的人脸防伪检测方法进行说明，下面结合图1对本发明实施例中各步骤展开详述。

本发明第一实施例的基于跨模态转化辅助的人脸防伪检测方法，包括步骤S10-步骤S40，各步骤详细描述如下：

步骤S10，对获取的带人脸的RGB模态图像进行人脸检测，通过检测到的人脸边界框进行所述带人脸的RGB模态图像的裁剪，并缩放至设定大小，获得待检测RGB模态图像。

如图2所示，为本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的训练样本获取流程示意图，人脸模态转换模型的训练样本需要同时包含RGB模态图像和IR模态图像：

步骤B10，获取带人脸的RGB模态图像集和对应的IR模态图像集。

模型的训练和测试阶段，图像都是由预处理单元进行处理，将RGB图像输入到预处理单元，预处理单元首先对图像进行人脸检测，若未检测到人脸则放弃该张图片；否则，再对图像进行中心裁剪，即保留人脸中心区域，并裁剪成固定的大小。本发明一个实施例中，将图像裁剪为128*128大小，在其他实施例中还可以根据不同的应用场景进行裁剪尺寸设定，本发明对此不作限定。

测试阶段的RGB模态图像预处理完成后即可进行检测，训练阶段的RGB模态图像预处理完成后与对应的预处理完成后的IR模态图像配成训练样本对。

步骤S20，基于所述待检测RGB模态图像，通过训练好的人脸模态转换模型生成对应的IR模态图像。

人脸模态转换模型，其训练方法为：

以所述人脸模态转换模型作为生成器G，构建反向生成器F以及判别器D _I与D _R，基于所述RGB和IR模态训练样本对集中的任一RGB和IR模态训练样本对，通过CycleGAN方法迭代进行对抗训练，直至总损失函数值低于设定阈值，获得训练好的人脸模态转换模型。

本发明通过CycleGAN方法进行对抗训练，该训练过程进行了两个方面的改进：(1)在原始像素空间将循环一致约束L _cyc(G，F)从源模态扩展到目标模态；(2)在映射函数子空间对模态的映射方向进行调整，确保样本在模态转换过程中以最优的方向从原始模态向目标模态转换。

因而，总损失函数包括了判别器和生成器对抗损失函数、特征空间判别器和生成器对抗损失函数和循环约束一致性损失函数。

r表示一个RGB模态(简写为R)的人脸样本，分布为P _r。同理，i表示一个属于IR模态(简写为I)的样本，分布为P _i。因此，人将由样本r与i构成的样本对作为网络输入，在两个判别器D _I与D _R的监督下，分别训练两个循环映射函数G：R→I和F：I→R。基于GAN的对抗训练策略，将该过程如式(1)所示：

对于反向生成器F与判别器D _R也采用相同的原理，如式(2)所示：

其中，生成器G尽可能愚弄判别器D _I，使其相信转换后的样本G(r)属于I模态，而判别器D _I尽力分辨G(r)与真实属于I模态的样本i。反向生成器F尽可能愚弄判别器D _R，使其相信转换后的样本F(i)属于R模态，而判别器D _R尽力分辨F(i)与真实属于R模态的样本r。

为了进一步规范两个映射函数G与F，将一个循环一致约束(cycle-consistency loss)引入CycleGAN框架中，确保每个样本r(或i)可以返回到原始状态，以解决不同模态样本不对齐的问题。该循环约束一致性损失函数L _cyc(G，F)如式(3)所示：

其中，‖·‖ ₁代表L1范数。

从而，该过程的局部总损失函数如式(4)所示：

L _MT-j＝L _GAN(G，D _I)+L _GAN(F，D _R)+λL _cyc(G，F)

(4)

其中，L _GAN(G，D _I)与L _GAN(F，D _R)为两个映射函数G与F对应损失函数，λ控制循环一致约束L _cyc(G，F)在训练过程中所占的比重。所有生成器与判别器以交替训练的方式直至网络收敛。

基于上述模块对循环一致约束L _cyc(G，F)的讨论，可以发现该约束的本质是在源模态促使两个映射函数G与F循环一致。如对于样本r来说满足：r→G(r)→F(G(r))≈r，同理对于样本i满足：i→F(i)→G(F(i))≈i。然而，该约束在目标模态的作用是缺席的。因此，需要引入一个额外的约束L _cyc-tm(G)(或L _cyc-tm(F))鼓励映射函数G(或F)将来自目标模态的样本i(或r)映射到本身。如对于样本i来说满足：i→G(i)≈i，同理对于样本r满足：r→F(r)≈r。约束L _cyc-tm(G)如式(5)所示：

综上所述，最终的循环约束一致性损失函数如式(6)所示：

和

分别代表在给定的概率分布下求模态训练样本r和对应的IR模态训练样本i的数学期望，F(i)代表RGB 模态训练样本r对应的IR模态训练样本i经过映射函数F后的样本，F(G(r))代表RGB模态训练样本r经过映射函数G之后再经过映射函数F后的样本，G(F(i))代表RGB模态训练样本r对应的IR模态训练样本i经过映射函数F之后再经过映射函数G后的样本。

因为，在生成器G与反向生成器F中引入了新转换的样本G(i)与F(r)，在对应的判别器D _I与D _R中应将这些样本单独归为一类。通过将公式(1)根据生成器与判别器分步训练的策略拆写为L _G-GAN与

分别如式(7)和式(8)所示：

其中，D _I本质一个二分类判别器，将G(r)与i样本分别归为类别1与类别2。首先用

代替D _I将判别器

重写，如式(9)所示：

类似地，将样本G(i)，G(r)与i分别归为类别1，2，3。因此，最终判别器

和生成器G的对抗损失函数如式(10)所示：

其中，

和

表示三类判别器，类别1，2，3分别为G(r)，G(i)与i所属的类别。

类似地，最终判别器

和反向生成器F的对抗损失函数如式(11)所示：

其中，

和

通过对目标模态像素空间的约束，两个映射函数G与F无论输入何种模态的样本，都尽可能输出与目标模态不可区分的样本。实验验证，在引入约束后，生成器生成的样本在全局颜色方面与真实样本更为接近。

除了在目标模态像素空间进行约束，本发明进一步在特征子空间对映射方向进行调整。因为映射函数G(类似的方式对于F)是一个Encoder-Decoder级联的网络结构，在Encoder网络(表示为G _e)之后对样本r的输出进行调整，使其尽可能接近样本i输出的分布。样本r与i满足：G _e(r)～G(i)。由于样本r与i并非严格对齐，因此两个的特征空间G _e(r)与G(i)的分布拟合并不适合采用L1或L2范数。本发明采用一个对抗的子空间学习策略对齐特征分布。将一个额外的判别器D _Ie引入G _e之后，调整G _e(r)的分布与G(i)的分布对齐。类似于生成器G与判别器D _I，该部分的目标损失函数如式(12)和式(13)所示：

其中，r和i分别代表RGB模态训练样本和对应的IR模态训练样本，P _r为IR模态训练样本i的分布，P _Ie为RGB模态训练样本r对应的IR模态训练样本i在特征空间的特征分布，P _Re为RGB模态训练样本r在特征空间的特征分布，G _e(i)和G _e(r)分别代表RGB模态训练样本r和对应的IR模态训练样本i在映射函数G的空间特征，F _e(r)和F _e(i)分别代表RGB模态训练样本r和对应的IR模态训练样本i在映射函数F的空间特征，D _Ie(G _e(i))和D _Ie(G _e(r))分别代表G _e(i)和G _e(r)属于P _Ie分布的概率，D _Re(F _e(r))和D _Re(F _e(i))分别代表F _e(r)和F _e(i)属于P _Re分布的概率，

代表求G _e(i)∈P _Ie分布下的数学期望，

代表求G _e(r)∈P _Re分布下的数学期望。

通过对抗损失函数的约束，不仅保留了目标模态的结构信息，而且在子空间调整了映射函数G对样本r的映射方向，确保以最合适的方向从原始模态向目标模态转换。

综上所述，人脸模态转换模型的总损失函数如式(14)所示：

其中，其中，

和

如图3所示，为本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的人脸模态转化示意图：(1)将配对的训练集样本(r与i)输入模态转换网络中进行训练。(2)其中该模块包含两个互逆的映射函数G：R→I和F：I→R。该单元主要用到映射函数G：R→I，而采用两个互逆的映射函数主要为了解决不同模态样本不对齐的问题。(3)在原始像素空间将循环一致约束L _cyc(G，F)从源模态扩展到目标模态。如样本r满足：r→G(r)→F(G(r))≈r，样本i满足：i→F(i)→G(F(i))≈i。同时，将新生成的样本G(i)作为单独类别融入判别器D _I中。将原始的二分类判别器D _I替换为三分类判别器

(4)在映射函数G的子空间G _e对样本G _e(i)与样本G _e(r)进行约束。主要调整G _e(r)的分布与G _e(i)的分布对齐，确保样本r以最优的方向从RGB模态向IR模态转换。

步骤S30，基于所述待检测RGB模态图像和IR模态图像，通过训练好的人脸防伪检测模型获取所述待检测RGB模态图像属于真实人脸的概率。

人脸防伪检测模型，其训练方法为：

人脸防伪检测模型包括三个分支：Branch-I、Branch-R和Shared-branch分支。

Branch-I的网络结构是一个ResNet网络，将G(r)样本作为输入，经过一个卷积层与最大池化层后，接4个Resblock，分别为Res1，Res2，Res3与Res4，随后接一个全局池化层后输入到二分类损失函数层。因为IR模态样本包含RGB样本中不具备的防伪判别信息，因此将该分支每个Resblock的输出特征作为辅助信息指导RGB样本的学习。其中二分类损失函数层是一个softmax特征分类器。将人脸防伪检测任务视为一个二分类任务，且该分支中全局池化层的输出为判别特征。综上，该分支的二分类损失函数如式(15)所示：

其中，

为模型预测Branch-I分支中训练样本为真实人脸图像的概率，y为训练样本的样本标签，y＝1表示训练样本为真实人脸图像，y＝0表示训练样本为攻击图像。

Branch-R类似于Branch-I，该分支将样本r作为输入，并采用与Branch-I相同的网络结构。该分支除了将每个Resblock的输出作为Shared-branch的输入，同时将Shared-branch对应Resblock的输出作为对应模块的输入。最后采用二分类损失函数L _RGB，如式(16)所示：

其中，

为模型预测Branch-R分支中训练样本为真实人脸图像的概率，y为训练样本的样本标签，y＝1表示训练样本为真实人脸图像，y＝0表示训练样本为攻击图像。

Shared-branch分支每个Resblock的输出不仅作为Branch-R对应模块的输入，同时每个Resblock将Branch-R对应模块的输出作为输入。最后采用二分类损失函数L _Shared，如式(17)所示：

其中，

因而，分类损失函数如式(18)所示：

L _MA＝L _IR+L _RGB+L _Shared

(18)

在训练过程中，将IR模态样本的特征指导RGB样本的特征学习。如果将Branch-I中每个Resblock的输出直接融入Branch-R对应Resblock中，会导致最终Branch-R的性能变差。因为两个模态之间的样本分布差距(modal gap)会影响判别特征的学习。为此，本发明引入共享分支作为特征中介，在网络训练过程中，它融合特定模态分支中每个Resblock的特征输出，进行特征选择后输入Branch-R中。该过程可以表述为信息前向融合与反馈。信息前向融合阶段描述如式(19)所示：

其中，

为特定模态第t个Resblock的输出，

为样本的角标，

为Shared-branch第t+1个Resblock的输入，S ^t表示第t个 Resblock的输出。同时，采用Shared-branch的特征信息进行反馈，该反馈过程仅发生在Shared-branch与Branch-R之间，如式(20)所示：

在特征融合之后，

为Branch-R中第t+1个Resblock的输入，

为Branch-R中第t个Resblock的输出，S ^t为Shared-branch的反馈特征

在Shared-branch与Branch-I之间不进行信息反馈是因为IR模态的样本特征作为辅助信息，尽可能地减小其被RGB样本特征的影响。除此之外，对三个分支的全局池化层输出特征进行元素相加求和操作，并将求和后的特征作为输入样本r的最终判别特征。

如图4所示，为本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的模态辅助示意图：(1)将转换后的IR模态样本G(r)与原始样本r分别输入Branch-I与Branch-R中。在二分类损失函数的监督下学习样本的防伪特征。(2)将Branch-I与Branch-R中每个Resblock的输出特征送入Shared-branch对应的Resblock中。同时将Branch-I与Branch-R的Res1模块的输出求和后作为Shared-branch的输入。(3)将Shared-branch中每个Resblock的特征反馈到对应模块的Branch-R中，完成IR模态特征对RGB样本特征学习的辅助作用。

如图5所示，为本发明基于跨模态转化辅助的人脸防伪检测方法一种实施例的人脸防伪检测过程示例图：(1)采集RGB模态的待测样本r。(2)对待测样本进行人脸检测，并裁剪到与训练集样本相同的大小。(3)将预处理完毕的样本r输入人脸模态转换模型，进行模态转换，获得转换后的样本G(r)。(4)将样本r与样本G(r)一同输入人脸防伪检测模型，预测样本r被判定为真实样本的概率。(5)根据预先设定的阈值，对样本r进行最终判定。如概率值大于设定阈值，则判定为真实人脸图像，否则为攻击图像。

本发明第二实施例的基于跨模态转化辅助的人脸防伪检测系统，基于上述的基于跨模态转化辅助的人脸防伪检测方法，该人脸防伪检测系统包括预处理单元、人脸模态转化单元、人脸防伪检测单元和判别单元；

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的基于跨模态转化辅助的人脸防伪检测系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于跨模态转化辅助的人脸防伪检测方法。

本发明第四实施例的一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于跨模态转化辅助的人脸防伪检测方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的模块、方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

一种基于跨模态转化辅助的人脸防伪检测方法，其特征在于，该人脸防伪检测方法包括：

步骤S10，对获取的带人脸的RGB模态图像进行人脸检测，通过检测到的人脸边界框进行所述带人脸的RGB模态图像的裁剪，并缩放至设定大小，获得待检测RGB模态图像；

步骤S20，基于所述待检测RGB模态图像，通过训练好的人脸模态转换模型生成对应的IR模态图像；

步骤S30，基于所述待检测RGB模态图像和IR模态图像，通过训练好的人脸防伪检测模型获取所述待检测RGB模态图像属于真实人脸的概率；

步骤S40，若所述概率值大于设定阈值，则所述待检测RGB模态图像为真实人脸图像；否则，所述待检测RGB模态图像为攻击图像。
根据权利要求1所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述人脸模态转换模型，其训练样本获取方法为：

步骤B10，获取带人脸的RGB模态图像集和对应的IR模态图像集；

步骤B20，对所述带人脸的RGB模态图像集中每一个图像进行人脸检测，通过检测到的人脸边界框进行对应的带人脸的RGB模态图像和IR模态图像的裁剪，并缩放至设定大小，获得RGB和IR模态训练样本对集。
根据权利要求2所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述人脸模态转换模型，其训练方法为：

以所述人脸模态转换模型作为生成器G，构建反向生成器F以及判别器D _I与D _R，基于所述RGB和IR模态训练样本对集中的任一RGB和IR模态训练样本对，通过CycleGAN方法迭代进行对抗训练，直至总损失函数值低于设定阈值，获得训练好的人脸模态转换模型；

其中，所述总损失函数为：

其中，其中，
和
分别代表G与F的目标损失函数，L _GAN(G _e，D _Ie)和L _GAN(F _e，D _Re)代表特征空间G _e与F _e的目标损失函数，L _cyc-final(G，F)代表循环约束一致性损失函数，α、λ为预设的权重因子，c＝1，2，3分别为G(r)，G(i)与i以及F(i)，F(r)与r的类别，r和i分别代表RGB模态训练样本和对应的IR模态训练样本，G(r)和G(i)分别代表RGB模态训练样本r和对应的IR模态训练样本i经过G后的样本。
根据权利要求3所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述循环约束一致性损失函数为：

其中，‖·‖ ₁代表L1范数，P _r和P _i分别为RGB模态训练样本r和对应的IR模态训练样本i的分布，
和
分别代表在给定的概率分布下求模态训练样本r和对应的IR模态训练样本i的数学期望，F(i)代表RGB模态训练样本r对应的IR模态训练样本i经过F后的样本，F(G(r))代表RGB模态训练样本r经过G之后再经过F后的样本，G(F(i))代表RGB模态训练样本r对应的IR模态训练样本i经过F之后再经过G后的样本。
根据权利要求3所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述G与F的目标损失函数包括判别器
和生成器G的对抗损失函数以及判别器
和反向生成器F的对抗损失函数；

所述判别器
和生成器G的对抗损失函数为：

所述判别器
和生成器F的对抗损失函数为：

其中，
和
分别代表在给定的概率分布下求模态训练样本r和对应的IR模态训练样本i的数学期望，
表示三类判别器，类别1，2，3分别为G(r)，G(i)与i所属的类别，
表示三类判别器，类别1，2，3分别为F(i)，F(r)与r所属的类别。
根据权利要求3所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述特征空间G _e与F _e的目标损失函数为：

其中，r和i分别代表RGB模态训练样本和对应的IR模态训练样本，P _r为IR模态训练样本i的分布，P _Ie为RGB模态训练样本r对应的IR模态训练样本i在特征空间的特征分布，P _Re为RGB模态训练样本r在特征空间的特征分布，G _e(i)和G _e(r)分别代表RGB模态训练样本r和对应的IR模态训练样本i在G的空间特征，F _e(r)和F _e(i)分别代表RGB模态训练样本r和对应的IR模态训练样本i在F的空间特征，D _Ie(G _e(i))和D _Ie(G _e(r))分别代表G _e(i)和G _e(r)属于P _Ie分布的概率，D _Re(F _e(r))和D _Re(F _e(i))分别代表F _e(r)和F _e(i)属于P _Re分布的概率，
代表求G _e(i)∈P _Ie分布下的数学期望，
代表求G _e(r)∈P _Re分布下的数学期望。
根据权利要求1所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述人脸防伪检测模型，其训练方法为：

步骤C10，获取RGB和IR模态训练样本对集以及每一个RGB和IR模态训练样本对的样本标签；

步骤C20，随机选取所述RGB和IR模态训练样本对集任一RGB和IR模态训练样本对，采用所述人脸防伪检测模型的Branch-R与Branch-I分支分别提取RGB模态训练样本与IR模态训练样本的特征；

步骤C30，采用所述人脸防伪检测模型的Shared-branch分支将所述RGB模态训练样本与IR模态训练样本的特征进行信息前向融合与反馈，并结合样本标签计算分类损失值；

步骤C40，若所述分类损失值大于设定阈值，则调整所述人脸防伪检测模型的参数，并跳转步骤C20，直至所述分类损失值小于或等于设定阈值，获得训练好的人脸防伪检测模型。
根据权利要求7所述的基于跨模态转化辅助的人脸防伪检测方法，其特征在于，所述分类损失值，其计算方法为：

其中，
为模型预测Branch-I分支中训练样本为真实人脸图像的概率，
为模型预测Branch-R分支中训练样本为真实人脸图像的概率，
为模型预测Shared-branch分支中融合特征为真实人脸特征的概率，y为训练样本的样本标签，y＝1表示训练样本为真实人脸图像，y＝0表示训练样本为攻击图像。
一种基于跨模态转化辅助的人脸防伪检测系统，其特征在于，基于权利要求1-8任一项所述的基于跨模态转化辅助的人脸防伪检测方法，该人脸防伪检测系统包括预处理单元、人脸模态转化单元、人脸防伪检测单元和判别单元；

所述预处理单元，配置为对获取的带人脸的RGB模态图像进行人脸检测，通过检测到的人脸边界框进行所述带人脸的RGB模态图像的裁剪，并缩放至设定大小，获得待检测RGB模态图像；

所述人脸模态转化单元，配置为基于所述待检测RGB模态图像，通过训练好的人脸模态转换模型生成对应的IR模态图像；

所述人脸防伪检测单元，配置为基于所述待检测RGB模态图像和IR模态图像，通过训练好的人脸防伪检测模型获取所述待检测RGB模态图像属于真实人脸的概率；

所述判别单元，配置为若所述概率值大于设定阈值，则所述待检测RGB模态图像为真实人脸图像；否则，所述待检测RGB模态图像为攻击图像。
一种存储装置，其中存储有多条程序，其特征在于，所述程序适于由处理器加载并执行以实现权利要求1-8任一项所述的基于跨模态转化辅助的人脸防伪检测方法。
一种处理装置，包括

处理器，适于执行各条程序；以及

存储装置，适于存储多条程序；

其特征在于，所述程序适于由处理器加载并执行以实现：

权利要求1-8任一项所述的基于跨模态转化辅助的人脸防伪检测方法。