CN114692741A

CN114692741A - 基于域不变特征的泛化人脸伪造检测方法

Info

Publication number: CN114692741A
Application number: CN202210276512.5A
Authority: CN
Inventors: 沃焱; 吴远泸; 韩国强
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2022-03-21
Filing date: 2022-03-21
Publication date: 2022-07-01

Abstract

本发明公开了一种基于域不变特征的泛化人脸伪造检测方法，包括：1)构建训练图像集；2)用训练图像集来训练构建的域不变特征表征学习的人脸伪造检测网络，并得到最优的域不变特征表征学习的人脸伪造检测网络的权重参数；3)应用域不变特征表征学习的人脸伪造检测网络和最优的域不变特征表征学习的人脸伪造检测网络的权重参数对待测的输入图像给出预测结果，即输入图像是否为人脸伪造图像。本发明提出了域不变特征表征学习的人脸伪造检测网络分别去最小化训练图像集中多个源域数据集的特征分布差异和最优分类器距离，从而学习到一个合适的域不变特征表征，可以有效提升模型在未知的目标域上的泛化性能且优于现存的一系列人脸伪造检测方法。

Description

基于域不变特征的泛化人脸伪造检测方法

技术领域

本发明涉及多媒体的技术领域，尤其是指一种基于域不变特征的泛化人脸伪造检测方法。

背景技术

随着信息技术的不断发展，使得图像、视频、音频等成为信息传播的主要载体，但是，随着深度学习的发展，让图像和视频的伪造也变得更加容易。人们只需要使用一些先进的深度学习工具如对抗生成网络等，就可以轻松的创造出肉眼难以识别的伪造图片或视频。由于人脸信息非常重要，于是出现了一系列人脸伪造图像，从而起到欺骗他人、传播谣言等目的。因此，如何有效的检测人脸伪造图像成了图像取证领域的热门研究方向。

人脸伪造检测任务可以看作是一个二分类任务，即通过提取输入图像中存在的篡改痕迹来判断图像是否为人脸伪造图像。受益于深度学习的发展，目前大多数人脸伪造检测方法都是基于深度学习的的方法。这些方法通常都是使用特征变换网络来提取输入图像的篡改痕迹，再通过一个分类器得到二分类结果即输入人脸是否为伪造人脸。当训练集和测试集都来自于相同的人脸伪造技术时，这些方法可以实现不错的检测效果。但是当训练集和测试集由不同的人脸伪造技术生成时，不同人脸伪造技术可能会留下不同的篡改痕迹，所以这些人脸伪造检测方法的性能都出现了不同程度的大幅下降。最近，也出现了一些工作致力于解决人脸伪造检测的泛化问题。这些结合域迁移或者域泛化的思想的方法在一定程度上提高了模型的泛化性能，但是还存在着很大的进步空间。因此，如何更好的利用多个已知源域的数据集，并去消除它们数据分布之间的偏差来学习共有的判别特征用于进一步提高模型的泛化能力仍是一个很大的挑战。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提出了一种基于域不变特征的泛化人脸伪造检测方法，该方法架构中包括特征分布差异最小化网络FDDM和最优分类器距离最小化网络OCDM。先通过将多个已知的源域数据集模拟划分为虚拟源域和虚拟目标域，再使用FDDM用于最小化虚拟源域和虚拟目标域之间的特征分布差异来学习域共享特征，紧接着通过OCDM对域共享特征空间进行调整以减小虚拟源域和虚拟目标域之间的最优分类器距离。通过不断迭代的随机划分虚拟源域和虚拟目标域，以及使用FDDM和OCDM，就可以学习到合适的域不变表征以及可以大幅提升模型在未知目标域上的泛化性能。

为实现上述目的，本发明所提供的技术方案为：基于域不变特征的泛化人脸伪造检测方法，包括以下步骤：

1)构建训练图像集

获取大量的由不同的人脸伪造方法生成的人脸伪造图像和对应的正常人脸图像，将其都缩放到同一个尺寸并按照生成的人脸伪造方法的不同将这些人脸伪造图像和对应的正常人脸图像划分到不同的源域数据集中；将这些不同源域数据集归纳起来就得到了训练图像集；

2)用步骤1)中构建的训练图像集来训练构建的域不变特征表征学习的人脸伪造检测网络，并得到最优的域不变特征表征学习的人脸伪造检测网络的权重参数；其中所述人脸伪造检测网络包括特征分布差异最小化网络FDDM和最优分类器距离最小化网络OCDM；先将构建的训练图像集中的多个源域数据集模拟划分为虚拟源域和虚拟目标域，接着FDDM通过解耦的方式从划分的虚拟源域和虚拟目标域中学习到共享的域共享特征，而OCDM对学习到的域共享特征做进一步调整使得其转为域不变特征，通过不断迭代的随机划分虚拟源域和虚拟目标域，以及使用FDDM和OCDM，从而获取一个合适的域不变特征表征来进行泛化人脸伪造检测；

3)应用步骤2)中构建的域不变特征表征学习的人脸伪造检测网络和最优的域不变特征表征学习的人脸伪造检测网络的权重参数对待测的输入图像给出预测结果，即输入图像是否为人脸伪造图像。

进一步，在步骤1)中，对于获取到的大量的由不同的人脸伪造方法生成的人脸伪造图像和对应的正常人脸图像，将其都缩放到H×W大小的尺寸，其中H和W分别为图像的长度和宽度；并按照生成的人脸伪造方法的不同将这些人脸伪造图像和对应的正常人脸图像划分到不同的源域数据集中，对于得到的M个源域数据集S＝{Sⁱ|i＝1,2,...M}，其中Sⁱ代表第i个源域数据集，它包含Num_i张图像。

进一步，所述步骤2)包括以下步骤：

2.1)将构建的训练图像集中的M个源域数据集S模拟划分为虚拟源域S^v和虚拟目标域T^v；

2.2)构建域不变特征表征学习的人脸伪造检测网络中的特征分布差异最小化网络FDDM，该特征分布差异最小化网络FDDM包括特征提取器g_e、解码器

特征选择g_s、类判别器d_ψ、分类器C和M个域判别器d_μ ⁱ，i∈{1,2,...,M}；特征提取器g_e和解码器

均由多个卷积模块堆叠而成，不同的是，特征提取器g_e的每个卷积模块后都跟着一个最大池化层，而解码器

的每个卷积模块后都跟着一个上采样层；特征选择g_s为一步特征划分的操作，不包含具体的网络结构；类判别器d_ψ和域判别器d_μ ⁱ的网络结构相同，它们均由多个卷积模块堆叠而成；分类器C则是由多个卷积模块、一个平均池化层和一个全连接层组成；

对于从虚拟源域S^v和虚拟目标域T^v随机得到的第j张输入图像x_j，特征Z_ex_j是通过特征提取器g_e从输入图像x_j提取到的特征，并将特征Z_ex_j输入到解码器

来得到重构图像，以及通过最小化输入图像和重构图像之间的均方误差损失L_rec对其进行约束，使得特征提取器提取到输入图像的完整信息：

式中，N表示这次从虚拟源域和虚拟目标域中选取的样本数量；特征Z_ex_j通过特征选择g_s划分为特征Z_ir_j和特征Z_ds_j；特征Z_ds_j作为分类器C的输入来预测输入图像的标签，并通过最小化输入图像的预测结果和输入图像的标签之间的交叉熵损失L_cls来约束特征Z_ds_j代表类相关特征：

式中，y_j代表第j张输入图像的标签；而特征Z_ir_j则作为类判别器d_ψ的输入也来预测输入图像的标签，并且通过最小化输入图像的预测结果和输入图像的标签之间的负交叉熵损失L_cdis来约束特征Z_ir_j代表类无关特征：

接着利用对抗训练的方法将特征Z_ir_j和特征Z_ds_j均作为类判别器的输入来预测输入图像的标签，并最小化输入图像的预测结果和输入图像的标签的交叉熵损失L_ent来训练类判别器d_ψ将特征Z_ir_j和特征Z_ds_j两者相互解耦开来：

式中，1代表指示函数，k代表分类类别，即该预测任务为二分类任务，域判别器d_μ ⁱ不考虑虚拟源域和虚拟目标域而直接去最小化来自源域数据集每个域的特征Z_ds_j的分布差异，使得特征Z_ds_j为M个源域数据集共享的域共享特征；对于第i个域判别器d_μ ⁱ，用于判别特征Z_ds_j是否属于第i个源域数据集，其对应的损失函数L_dis ⁱ表示为：

式中，Z_ds_j ⁱ代表来自第i个域的第j张输入图像的特征，相应的，Z_ds_j ^r代表来自第r个域的第j张输入图像的特征，且r≠i；结合M个域判别器的损失函数，就使得来自第i个域的特征Z_ds_j ⁱ与剩下的M-1个源域数据集的特征分布差异最小；M个判别器的损失函数L_dis表示为：

FDDM整体优化目标的损失函数L_FDDM为：

L_FDDM＝L_rec+L_cdis+L_cls+L_dis (7)

2.3)构建域不变特征表征学习的人脸伪造检测网络中的最优分类器距离最小化网络OCDM，该最优分类器距离最小化网络OCDM由特征提取器g_e、特征选择器g_s和分类器h组成，其中特征提取器g_e、特征选择器g_s都来自于特征分布差异最小化网络FDDM，分类器h由多个卷积模块、一个平均池化层和一个全连接层组成；OCDM网络通过两阶段更新的方法调整最优的虚拟源域分类器

和最优的虚拟目标域分类器

之间的距离来调整学习到的域共享特征，从而得到域不变特征；

在第一阶段，对于从虚拟源域S^v随机得到的第j张输入图像

将其作为OCDM的输入去预测输入图像的标签，并最小化输入图像的预测结果和输入图像的标签的交叉熵损失L_Meta-train：

式中，l代表交叉熵损失函数，Φ(g_e,h)代表OCDM中特征提取器g_e和分类器h的权重参数，而

为输入图像

相对应的标签；OCDM相对于损失函数L_Meta-train的梯度为

通过该梯度将OCDM中特征提取器g_e和分类器h的权重参数更新为

其中α代表这一步更新的步长；

在第二阶段，对于从虚拟源域T^v随机得到的第j张输入图像

将其作为第一阶段更新的OCDM的输入来预测输入图像的标签，并最小化输入图像的预测结果和输入图像的标签的交叉熵损失L_Meta-test：

式中，

为输入图像

相对应的标签；

OCDM整体优化目标的损失函数L_OCDM为：

式中，β代表比例参数来平衡OCDM两个阶段的损失函数的比例；

2.4)初始化域不变特征表征学习的人脸伪造检测网络中特征分布差异最小化网络FDDM和最优分类器距离最小化网络OCDM中各个部分的权重参数，包括特征提取器g_e的权重参数

解码器

的权重参数

类判别器d_ψ和M个域判别器d_μ ⁱ的权重参数

和

分类器C和分类器h的权重参数W_C和W_h；初始化迭代次数e＝1；

2.5)将构建的训练图像集中的M个源域数据集S随机划分为虚拟源域S^v和虚拟目标域T^v；初始化迭代次数t＝1；

2.6)固定FDDM中类判别器d_ψ和M个域判别器d_μ ⁱ的权重参数；从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，并去计算FDDM整体优化目标的损失函数L_FDDM；根据计算得到的FDDM整体优化目标的损失函数L_FDDM来分别计算FDDM中特征提取器g_e、解码器

和分类器C的梯度并反向传播更新各个部分的权重参数：

在公式(11)、(12)和(13)中，η为给定的学习率，

和

分别代表特征提取器g_e、解码器

和分类器C的梯度；

2.7)固定FDDM中特征提取器g_e的权重参数；从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，并去计算公式(4)的损失函数L_ent和公式(5)的M个域判别器d_μ ⁱ的损失函数L_dis ⁱ；根据损失函数L_ent计算FDDM中类判别器d_ψ的梯度并反向传播更新类判别器d_ψ的权重参数：

式中，

为类判别器d_ψ的梯度；因为有M个域判别器d_μ ⁱ，即需要分别对每一个域判别器的权重参数进行更新，第i个域判别器d_μ ⁱ的权重参数更新过程表示为：

式中，

为第i个域判别器d_μ ⁱ的梯度；

2.8)从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，并去计算OCDM整体优化目标的损失函数L_OCDM；根据计算得到的OCDM整体优化目标的损失函数L_OCDM来分别计算OCDM中特征提取器g_e和分类器h的梯度并反向传播更新各个部分的权重参数：

在公式(16)和(17)中，

和

分别代表特征提取器g_e和分类器h的梯度；

2.9)更新迭代次数t＝t+1，并判断迭代条件是否满足

其中

和

分别为虚拟源域S^v和虚拟目标域T^v的总样本数量，N为每次迭代的样本数；如满足条件，则转至步骤2.6)；否则，进入步骤2.10)；

2.10)更新迭代次数e＝e+1，并判断迭代条件是否满足e≤E，其中E代表训练的epoch数；如满足，则转至步骤2.5)；否则，保存此时最优的域不变特征表征学习的人脸伪造检测网络的权重参数并退出迭代。

本发明与现有技术相比，具有如下优点与有益效果：

1、本发明提出了一种特征分布差异最小化网络FDDM通过联合解耦和生成对抗训练的思想来最小化来自各个源域的特征分布差异，从而提取到多个源域共享的域共享特征。

2、本发明提出了一种最优分类器距离最小化网络OCDM通过元学习的思想对给定的特征空间进行进一步调整，使得在这个特征空间上可以学习到一个理想分类器，它既是最优的虚拟源域分类器也是最优的虚拟目标域分类器。

3、本发明通过结合FDDM和OCDM可以从多个源域数据集中学习到一个合适的域不变特征表征，可以有效提升模型在未知的目标域上的泛化性能且优于现存的一系列人脸伪造检测方法。

附图说明

图1为本发明方法的架构图。

图2为特征分布差异最小化网络FDDM的网络结构图。

图3为最优分类器距离最小化网络OCDM的网络架构图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

参见图1所示，本实施例提供了一种基于域不变特征的泛化人脸伪造检测方法，具体包括以下主要技术步骤：

1)构建训练图像集

本实例选用目前最大的人脸伪造基准数据集FaceForensics++作为实验数据集，FaceForensics++数据集包含由四种不同的人脸伪造方法生成的数据集，即FaceSwap、Deepfakes、Face2Face和NeuralTextures。每种不同的人脸伪造方法生成的数据集都包含1000个伪造视频，还包含1000个真实视频。对于每个视频，我们都以相等的间隔提取30帧图像，并通过OpenCV Dlib工具自动裁剪出每帧图像的脸部区域，且确保至少90％的人脸区域都被有效的裁剪出来了，从而得到大量由不同的人脸伪造方法生成的人脸伪造图像和对应的正常人脸图像。

对于获取到的大量的由不同的人脸伪造方法生成的人脸伪造图像和对应的正常人脸图像，将其都缩放到128×128大小的尺寸。并按照生成的人脸伪造方法的不同将这些人脸伪造图像和对应的正常人脸图像划分到不同的数据集中，即可得到4个不同数据集。这四个不同的数据集，随机选择3个作为源域数据集，还有一个作为未知的目标域数据集。对于得到的3个源域数据集S＝{Sⁱ|i＝1,2,3}，其中Sⁱ代表第i个源域数据集，它包含Num_i张图像。

2)用步骤1)中构建的训练图像集来训练构建的域不变特征表征学习的人脸伪造检测网络包括以下步骤：

2.1)将构建的训练图像集中的M个源域数据集S模拟划分为虚拟源域S^v和虚拟目标域T^v。M在实施例中为3，且3个源域数据集中2个源域作为虚拟源域，1个源域作为虚拟目标域。

特征选择g_s、类判别器d_ψ、分类器C和M个域判别器d_μ ⁱ(i∈{1,2,...,M})，具体网络架构如图2所示。特征提取器g_e和解码器

均由3个卷积模块堆叠而成，不同的是，特征提取器g_e的每个卷积模块后都跟着一个最大池化层，而解码器

的每个卷积模块后都跟着一个上采样层。特征选择g_s为一步特征划分的操作，不包含具体的网络结构。类判别器d_ψ和域判别器d_μ ⁱ(i∈{1,2,...,M})的网络结构相同，它们均由4个卷积模块堆叠而成。分类器C则是由3个卷积模块、一个平均池化层和一个全连接层组成。

来得到重构图像，以及通过最小化输入图像和重构图像之间的均方误差损失L_rec对其进行约束使得特征提取器提取到输入图像的完整信息：

式中，N表示这次从虚拟源域和虚拟目标域中选取的样本数量。特征Z_ex_j通过特征选择g_s划分为特征Z_ir_j和特征Z_ds_j。特征Z_ds_j作为分类器C的输入来预测输入图像的标签，并通过最小化输入图像的预测结果和输入图像的标签之间的交叉熵损失L_cls来约束特征Z_ds_j代表类相关特征：

式中，N表示这次从虚拟源域和虚拟目标域选取的样本数量，y_j代表第j张输入图像的标签。而特征Z_ir_j则作为类判别器d_ψ的输入也来预测输入图像的标签，并且通过最小化输入图像的预测结果和输入图像的标签之间的负交叉熵损失L_cdis来约束特征Z_ir_j代表类无关特征：

式中，N表示这次从虚拟源域和虚拟目标域选取的样本数量。接着利用对抗训练的方法将特征Z_ir_j和特征Z_ds_j均作为类判别器的输入来预测输入图像的标签，并最小化输入图像的预测结果和输入图像的标签的交叉熵损失L_ent来训练类判别器d_ψ将特征Z_ir_j和特征Z_ds_j两者相互解耦开来：

式中，1代表指示函数，k代表分类类别，即该预测任务为二分类任务，y_j代表第j^th张输入图像的标签。域判别器d_μ ⁱ(i∈{1,2,...,M})不考虑虚拟源域和虚拟目标域而直接去最小化来自源域数据集每个域的特征Z_ds_j的分布差异使得特征Z_ds_j为M个源域数据集共享的域共享特征。对于第i个域判别器d_μ ⁱ，用于判别特征Z_ds_j是否属于第i个源域数据集，其对应的损失函数L_dis ⁱ表示为：

式中，Z_ds_j ⁱ代表来自第i个域的第j张输入图像的特征，相应的，Z_ds_j ^r代表来自第r个域的第j张输入图像的特征，且r≠i。结合M个域判别器的损失函数，就使得来自第i个域的特征Z_ds_j ⁱ与剩下的M-1个源域数据集的特征分布差异最小。M个判别器的损失函数L_dis表示为：

FDDM整体优化目标的损失函数为：

L_FDDM＝L_rec+L_cdis+L_cls+L_dis (7)

2.3)构建域不变特征表征学习的人脸伪造检测网络中的最优分类器距离最小化网络OCDM，该最优分类器距离最小化网络OCDM由特征提取器g_e、特征选择器g_s和分类器h组成，具体的网络架构如图3所示，其中特征提取器g_e、特征选择器g_s都来自于特征分布差异最小化网络FDDM。分类器h由3个卷积模块、一个平均池化层和一个全连接层组成。OCDM通过两阶段更新的方法调整最优的虚拟源域分类器

和最优的虚拟目标域分类器

之间的距离来调整学习到的域共享特征，从而得到域不变特征。

在第一阶段，对于从虚拟源域S^v随机得到的第j张输入图像

为输入图像

相对应的标签。OCDM相对于损失函数L_Meta-train的梯度为

其中α代表这一步更新的步长，在实施例中被设置为0.0001。

在第二阶段，对于从虚拟源域T^v随机得到的第j张输入图像

式中，

为输入图像

相对应的标签。

OCDM整体优化目标的损失函数为：

式中，Φ(g_e,h)代表OCDM中特征提取器g_e和分类器h的权重参数，β代表比例参数来平衡OCDM两个阶段的损失函数的比例，在实施例中，β被设置为1，

代表OCDM相对于损失函数L_Meta-train的梯度。

解码器

的权重参数

类判别器d_ψ和M个域判别器d_μ ⁱ(i∈{1,2,...,M})的权重参数

和

分类器C和分类器h的权重参数W_C和W_h。初始化迭代次数e＝1。

2.5)将构建的训练图像集中的M个源域数据集S随机划分为虚拟源域S^v和虚拟目标域T^v。初始化迭代次数t＝1。

2.6)固定FDDM中类判别器d_ψ和3个域判别器d_μ ⁱ(i∈{1,2,3})的权重参数。从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，在实施例中N被设置为96，并去计算FDDM整体优化目标的损失函数L_FDDM。根据计算得到的FDDM整体优化目标的损失函数L_FDDM来分别计算FDDM中特征提取器g_e、解码器

和分类器C的梯度并反向传播更新各个部分的权重参数：

在公式(11)、(12)和(13)中，η为给定的学习率，在实施例中被设置为0.0001，

和

分别代表特征提取器g_e、解码器

和分类器C的梯度。

2.7)固定FDDM中特征提取器g_e的权重参数。从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，并去计算公式(4)的损失函数L_ent和公式(5)的M个判别器d_μ ⁱ(i∈{1,2,...,M})的损失函数L_dis ⁱ(i∈{1,2,...,M})。根据损失函数L_ent计算FDDM中类判别器d_ψ的梯度并反向传播更新类判别器d_ψ的权重参数：

式中，η为给定的学习率，

为类判别器d_ψ的梯度。因为有M个判别器d_μ ⁱ(i∈{1,2,...,M})，即需要分别对每一个域判别器的权重参数进行更新，第i个域判别器d_μ ⁱ的权重参数更新过程表示为：

式中，η为给定的学习率，

为第i个域判别器d_μ ⁱ的梯度。

2.8)从虚拟源域S^v和虚拟目标域T^v中随机选取N个样本构成训练对，并去计算OCDM整体优化目标的损失函数L_OCDM。根据计算得到的OCDM整体优化目标的损失函数L_OCDM来分别计算OCDM中特征提取器g_e和分类器h的梯度并反向传播更新各个部分的权重参数：

在公式(16)和(17)中，η为给定的学习率，

和

分别代表特征提取器g_e和分类器h的梯度。

2.9)更新迭代次数t＝t+1，并判断迭代条件是否满足

其中

和

分别为虚拟源域S^v和虚拟目标域T^v的总样本数量，N为每次迭代的样本数。如满足条件，则转至步骤2.6)。否则，进入步骤2.10)。

2.10)更新迭代次数e＝e+1，并判断迭代条件是否满足e≤E，其中E代表训练的epoch数，在实施例中被设置为200。如满足，则转至步骤2.5)。否则，保存此时最优的域不变特征表征学习的人脸伪造检测网络的权重参数并退出迭代。

3)选用步骤1)中未知的目标域数据集作为测试集，对于待测的测试集的输入图像，应用步骤2)中构建的域不变特征表征学习的人脸伪造检测网络和最优的域不变特征表征学习的人脸伪造检测网络的权重参数给出预测结果，即输入图像是否为人脸伪造图像。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于域不变特征的泛化人脸伪造检测方法，其特征在于，包括以下步骤：

1)构建训练图像集

2.根据权利要求1所述的基于域不变特征的泛化人脸伪造检测方法，其特征在于，在步骤1)中，对于获取到的大量的由不同的人脸伪造方法生成的人脸伪造图像和对应的正常人脸图像，将其都缩放到H×W大小的尺寸，其中H和W分别为图像的长度和宽度；并按照生成的人脸伪造方法的不同将这些人脸伪造图像和对应的正常人脸图像划分到不同的源域数据集中，对于得到的M个源域数据集S＝{Sⁱ|i＝1,2,...M}，其中Sⁱ代表第i个源域数据集，它包含Num_i张图像。

3.根据权利要求1所述的基于域不变特征的泛化人脸伪造检测方法，其特征在于，所述步骤2)包括以下步骤：