CN112102261A

CN112102261A - 一种基于多尺度生成对抗网络的篡改图像检测方法

Info

Publication number: CN112102261A
Application number: CN202010883513.7A
Authority: CN
Inventors: 白万荣; 朱小琴; 张蕾; 刘吉祥; 赵博; 杨凡; 田秀霞; 刘正; 李华强
Original assignee: STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE; State Grid Gansu Electric Power Co Ltd; Shanghai University of Electric Power
Current assignee: STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE; State Grid Gansu Electric Power Co Ltd; Shanghai University of Electric Power
Priority date: 2020-08-28
Filing date: 2020-08-28
Publication date: 2020-12-18

Abstract

本发明涉及一种基于多尺度生成对抗网络的篡改图像检测方法，包括：从标准的图像数据集中合成基本的复制粘贴图像，并得到对应的xml文件，以构建初步篡改图像数据集；构建基于多尺度生成对抗式网络的模型，并设置模型相关参数；优化多尺度生成对抗网络的生成器，以学习图像中篡改区域的边缘特征；交替训练生成器和判别器，输出不同尺度下的篡改图像，构建多层次篡改图像数据集；利用多层次篡改图像数据集训练卷积神经网络；将待检测的篡改图像输入训练好的卷积神经网络，得到对应的检测结果。与现有技术相比，本发明能够生成多尺度、多层次的篡改图像数据集，以提高篡改图像的数量及质量，从而保证后续卷积神经网络的可靠训练、提高检测性能。

Description

一种基于多尺度生成对抗网络的篡改图像检测方法

技术领域

本发明涉及图像信息安全技术领域，尤其是涉及一种基于多尺度生成对抗网络的篡改图像检测方法。

背景技术

随着图像处理和图像编辑技术的发展，产生了越来越多的恶意篡改图片，这对社会造成了极大的负面影响，同时也激发了大量学者对图像篡改检测的研究。常见的图像篡改包括三种类型：拼接、复制移动和移除。图像拼接可以从一幅图像中复制部分区域，并将其粘贴到其它图像中，复制移动是复制并粘贴同一幅图像中的区域，移除则会从图像中消除部分区域，然后进行修补。而且为了加大篡改图片的检测识别难度，通常会在图片篡改后再进行平滑、模糊等后处理操作。

当前基于深度学习的被动图像篡改检测，能够自动地寻找和学习抽象的图像特征，模型的鲁棒性与检测效率都有了一定的提高，但仍存在以下问题：缺乏高质量、丰富的训练数据，而低质量、少量的训练数据会影响模型的检测性能，容易发生模型过拟合现象，降低检测准确性。目前训练数据的来源通常有三种：第一，获取标准的篡改图像数据集，但其数量较少；第二，利用目标检测数据集中的信息自动地合成图片，该方法没有对图像进行后处理，会降低篡改图像的质量；第三，聘请专业的标注人员创建篡改图像，但是这样做的成本很大。所以，对于提高图像篡改的检测性能而言，如何方便地获得高质量、丰富的训练数据是至关重要的。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多尺度生成对抗网络的篡改图像检测方法，通过生成高质量、丰富的篡改图像数据集，以提高篡改图像的检测性能。

本发明的目的可以通过以下技术方案来实现：一种基于多尺度生成对抗网络的篡改图像检测方法，包括以下步骤：

S1、从标准的图像数据集中合成基本的复制粘贴图像，并得到合成图像对应的xml文件，以构建初步篡改图像数据集；

S2、构建基于多尺度生成对抗式网络的模型，以初步篡改图像数据集作为模型的输入，以设置模型相关参数；

S3、对多尺度生成对抗网络的生成器进行优化，以学习图像中篡改区域的边缘特征；

S4、交替训练生成器和判别器，输出不同尺度下的篡改图像，以构建多层次篡改图像数据集；

S5、利用多层次篡改图像数据集训练卷积神经网络；

S6、将待检测的篡改图像输入训练好的卷积神经网络，得到对应的检测结果。

进一步地，所述步骤S1具体包括以下步骤：

S11、从标准的图像数据集中选取目标图像和待处理图片；

S12、以目标图像作为背景，将待处理图片中篡改区域掩膜对应的部分粘贴到目标图像的随机位置上，合成得到基本的复制粘贴图像；

S13、从标准的图像数据集中读取待处理图片对应的xml文件，以读出篡改区域掩膜对应的边界框位置信息，之后对目标图像对应的xml文件进行修改，将修改后的xml文件作为复制粘贴图像对应的xml文件；

S14、按照标准的图像数据集中图像的排序，依次重复步骤S11～S13，合成得到多个基本的复制粘贴图像，并得到对应的xml文件，以构建初步篡改图像数据集。

进一步地，所述步骤S12具体包括以下步骤：

S121、读取待处理图片对应的掩膜图片，并将掩膜图片中所有物体的区域掩膜读出；

S122、随机选取一类物体的区域掩膜，作为篡改区域掩膜；

S123、找出待处理图片中对应篡改区域掩膜的区域，将该区域从待处理图片中截取，作为篡改源图片；

S124、将篡改源图片粘贴到目标图像的随机位置上，合成得到基本的复制粘贴图像。

进一步地，所述步骤S13的具体过程为：从标准的图像数据集的注释文件夹中读取待处理图片对应的xml文件，将步骤S122中选取的篡改区域掩膜所对应的边界框位置信息读出；

根据读出的边界框位置信息以及复制粘贴图像中粘贴区域的位置，对目标图像对应的xml文件进行修改，将检测类别修改为“tamper”，将目标图像中的边界框位置信息改为复制粘贴图像中粘贴区域的位置信息，并将修改后的xml文件作为复制粘贴图像对应的xml文件。

进一步地，所述步骤S2具体包括以下步骤：

S21、构建包含判别器网络和生成器网络的多尺度生成对抗式网络模型；

S22、根据初步篡改图像数据集，设置模型的相关参数。

进一步地，所述步骤S21中生成器网络包括多个对应于不同尺度的生成器，多个生成器呈金字塔结构，对于顶层最小尺度的生成器，其输入仅包含空间高斯噪声；

对于顶层以下各大尺度的生成器，其输入包含空间高斯噪声以及上一尺度生成器生成图像的上采样；

对于顶层以下各大尺度的生成器，其输出结果具体为：上一尺度生成器生成图像的上采样加上空间高斯噪声图像，经过卷积操作后输出一副残差图像，将该残差图像再加上上一尺度生成器生成图像的上采样，即为该生成器的输出。

进一步地，所述步骤S3具体是对生成器的损失函数进行优化，包括以下步骤：

S31、定义重建背景损失以加快训练速度；

S32、定义边缘损失以约束篡改区域形状。

进一步地，所述步骤S31中重建背景损失函数具体为：

其中，N_bg为背景中的像素总数，m_i为M中的第i个像素，M为复制粘贴图像，mask_i为位置i处的篡改区域掩膜M_mask中的像素值，tar_i为M_tar中的第i个像素，M_tar为目标图像；

边缘损失函数具体为：

其中，N_edge为边缘像素的数目，e_i是位置i处的边缘掩膜的值，tam_i为M_tam中的第i个像素，M_tam为篡改源图片。

进一步地，所述步骤S4具体包括以下步骤：

S41、从最小尺度到最大尺度按顺序对模型进行训练，其中，每个生成器的训练损失均包括对抗损失和梯度损失，每个生成器分别有一个对应的马尔可夫判别器，判别器的损失仅包括对抗损失，整个生成器网络的总体损失由对抗损失与梯度损失复合而成；

S42、按照预设的迭代次数进行训练，将不同迭代次数下的生成图像共同构建成多层次篡改图像数据集。

进一步地，所述步骤S41中整个生成器网络的总体损失具体为：

L_G＝λ_advL_adv+λ_gradL_grad

其中，L_adv为对抗损失，L_grad为梯度损失，λ_adv和λ_grad分别为L_adv和L_grad的超参数，G_x(M)为复制粘贴图像M在水平方向上的梯度图像，G_y(M)为复制粘贴图像M在垂直方向上的梯度图像，f(M)为复制粘贴图像M与多尺度生成对抗网络f输出的融合图像。

与现有技术相比，本发明具有以下优点：

一、本发明基于多尺度生成对抗式网络结构，能够从不同大小的图像中学习到丰富的特征，由于生成篡改图像的尺度不同，表明篡改痕迹的呈现度不同，多尺度的网络结构能够学习到不同尺度层次的特征，以此增强模型的泛化能力，不再依赖于大规模数据集，基于单幅图像即可生成高质量的篡改图片，同时能扩充生成图像的数量，有利于后续对卷积神经网络进行高质量的训练，从而提高篡改图像的检测性能。

二、本发明通过对生成器的损失函数进行优化，使生成器能够学习到篡改边缘的特征、同时加快训练速度，从而保证生成对抗网络模型生成图像更加自然，有效提高篡改图像的质量，避免篡改图像检测时发生过拟合现象、提高检测准确性。

附图说明

图1为本发明的方法流程示意图；

图2为实施例中构建多层次篡改图像数据集的过程示意图；

图3a为实施例中篡改区域掩膜示意图；

图3b为实施例中篡改源图像示意图；

图3c为实施例中目标图像示意图；

图3d为实施例中合成的复制粘贴图像示意图；

图4为实施例中多尺度生成对抗式网络结构示意图；

图5a为实施例中生成的多层次篡改图像示例；

图5b为另一实施例中生成的多层次篡改图像示例。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示，一种基于多尺度生成对抗网络的篡改图像检测方法，包括以下步骤：

S5、利用多层次篡改图像数据集训练卷积神经网络；

本实施例整个训练和测试均在Ubuntu16.04.6系统下的深度学习开源框架TensorFlow下运行，显卡型号为Nvidia GeForce RTX 2080TI，CPU型号为Intel Core i9-9900K，CUDA版本为CUDA 10.1，cuDNN版本为cuDNN v7.5.0。

本实施例选用PASCAL VOC标准数据集作为标准的图像数据集，该数据集包括大约2万张图像和对应的掩膜图像，为图像识别和分类提供了一整套标准化的优秀的数据集，本实施例应用上述方法构建多层次篡改图像数据集的具体工作过程如图2所示，包括：

步骤一、从标准的图像数据集合成基本的复制粘贴图像：

从PASCAL VOC标准数据集中选取出篡改区域掩膜、篡改源图像和目标图像(如图3a～图3c所示)，以篡改源图像为前景，目标图像为背景，创建简单的复制粘贴图像(如图3d所示)作为多尺度对抗生成网络的输入，具体的，

(a1)按顺序抽取PASCAL VOC数据集中的一张图片作为目标图像；

(a2)随机从除目标图像外的剩余图片中抽取一张图片，作为待处理图片；

(a3)读取待处理图片对应的掩膜图片，将真值掩膜图片中所有物体的区域掩膜读出，随机选取一类目标的区域掩膜，作为篡改区域掩膜；

(a4)根据掩膜图片中选取的篡改区域掩膜，找出待处理图片中对应篡改区域掩膜的区域，将该区域从待处理图片中截取，将截取部分粘贴到目标图像的随机位置上，形成合成的复制粘贴图像；

(a5)从数据集的Annotations(即图像的注释文件夹)文件夹中读取待处理图片对应的xml文件，将步骤(a3)中选取的篡改区域掩膜所对应的边界框位置信息读出，位置信息为边界框左上角坐标与右下角坐标，根据读出的边界框位置信息以及复制粘贴图像中粘贴区域的位置，对目标图像对应的xml文件(脚本文件，包括篡改类型和篡改图像坐标)进行修改，将检测类别修改为“tamper”(即篡改类型)，将目标图像中的边界框位置信息改为复制粘贴图像中粘贴区域的位置信息，并将修改后的xml文件作为复制粘贴图像所对应的xml文件，至此完成一张复制粘贴图像与它对应的xml文件；

(a6)对PASCAL VOC数据集中的下一张图片执行步骤(a2)～步骤(a5)的操作，循环操作至最后一张图片，创建出合成的基本篡改图像数据集。

步骤二、搭建基于多尺度生成对抗式网络的模型，该模型包含判别器网络和生成器网络，并设置相应参数，具体的，

(b1)如图4所示，多尺度对抗生成网络包含金字塔结构的生成器{G₀,...,G_N}，整个对抗生成网络从G_N开始处理，G_N为最小尺度，尺度越来越大，到G₀是最大尺度，分别针对图像

进行训练，其中图像x_n是由图像x下采样(下采样即缩放图片尺寸，满足网络要求)获得，采样因子为rⁿ，其中r＞1，每个生成器G_n负责生成对应x_n的真实图像样本，模型会从最小的尺度进行图像样本生成，然后顺序地通过生成器，逐渐生成最大尺度的图像样本，每个尺度对应的生成器G_n都有随机噪声Z_n作为输入(0≤n≤N)；

(b2)在最小尺度下，生成器G_N的输入仅包含空间高斯噪声Z_N，并将其映射为

(b3)对于更大的尺度，其生成器G_n(n＜N)不仅将噪声Z_n(n＜N)作为输入，还接收上一尺度生成图像的上采样

(上采样即扩充图片尺寸，满足网络要求)作为输入：

(b4)所有的生成器具有相似的结构，当生成器为G_n(n＜N)时，其上一尺度生成图像的上采样

加上噪声图像Z_n，经过卷积操作后输出一幅残差图像，再加上

最后得到

的即为生成器G_n的输出，生成器为G_n的操作可表示如下：

(b5)根据模型与数据集，设置模型的相关参数，将模型输入大小调整为256×256，多尺度结构中，最小尺度为25×25，最大尺度为250×250，上采样的倍数设置为10，学习率固定为2×10^-4，超参数λ_adv和λ_grad分别设置为5和20。

步骤三、进一步优化篡改区域的边缘痕迹，使模型生成的图像更加自然，具体的，

(c1)为了进一步优化篡改区域的边缘痕迹，对生成器的损失函数进行优化，鼓励生成器学习篡改区域的边缘特征，为了加快训练过程，使用L1损失来重建背景：

(c2)为了约束篡改区域的形状，定义边缘损失：

步骤四、交替训练生成器和判别器，输出不同尺度下的篡改图像，用于构建多层次篡改图像数据集，具体的，

(d1)从最小尺度到最大尺度按顺序地对模型进行训练，当每个生成器训练好，就会被固定，第n个生成器的训练损失包括对抗损失L_adv和梯度损失L_grad，如公式：

(d2)在模型的训练过程中，每个生成器G_n都有一个对应的马尔可夫判别器D_n来判别真假，判别器D_n的结构与生成器G_n相同，为了增加训练稳定性，仅选择WGAN-GP的对抗损失L_adv；

(d3)为了使图像中篡改区域与背景拥有相近的色彩变化趋势，借鉴泊松融合中梯度场的思想，提出一种自定义的梯度损失，对于包含输入的复制粘贴图像M与生成对抗网络f输出的融合图像f(M)，将梯度损失定义为两者之间梯度差的L1范数的平方根形式：

其中，G_x(M)表示M在水平方向上的梯度图像，G_y(M)表示M在垂直方向上的梯度图像。在模型中，梯度损失起到了限制篡改区域中梯度变化的作用，保证了篡改区域的固有语义不变。平方根形式的梯度损失关注梯度方向的一致性，缓和了对较大梯度差值的惩罚，为生成阶段对篡改区域明度信息的预测保留了一定的空间；

(d4)生成器G的总体损失由对抗损失与梯度损失复合而得：

L_G＝λ_advL_adv+λ_gradL_grad

其中，λ_adv和λ_grad是控制相应损失项的重要参数。在以上约束条件下，生成器保留篡改区域的边缘纹理信息，同时将篡改区域与背景区域融合，生成高质量的篡改图像；

(d5)随着模型迭代次数的增加，生成图像看上去会越来越逼真，针对这一特点，利用图像在不同迭代次数(Epoch)下的生成图像(如图5a所示)，构建了多层次篡改图像数据集。

需注意的是，在实际应用中，步骤一中合成的图像还可以为拼接形式，即初步篡改图像数据集中的图像均为拼接图像，其余步骤与上述实施例一致，最终生成对抗网络生成的多层次篡改图像数据集也为拼接形式(如图5b所示)。

综上所述，采用本发明提出的方法，能够基于多尺度生成对抗网络生成丰富的、高质量篡改图像，以此保证后续卷积神经网络的可靠训练，从而提高篡改图像的检测性能。

Claims

1.一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，包括以下步骤：

S5、利用多层次篡改图像数据集训练卷积神经网络；

2.根据权利要求1所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S1具体包括以下步骤：

S11、从标准的图像数据集中选取目标图像和待处理图片；

3.根据权利要求2所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S12具体包括以下步骤：

S122、随机选取一类物体的区域掩膜，作为篡改区域掩膜；

4.根据权利要求3所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S13的具体过程为：从标准的图像数据集的注释文件夹中读取待处理图片对应的xml文件，将步骤S122中选取的篡改区域掩膜所对应的边界框位置信息读出；

5.根据权利要求1所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S2具体包括以下步骤：

S22、根据初步篡改图像数据集，设置模型的相关参数。

6.根据权利要求5所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S21中生成器网络包括多个对应于不同尺度的生成器，多个生成器呈金字塔结构，对于顶层最小尺度的生成器，其输入仅包含空间高斯噪声；

7.根据权利要求3所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S3具体是对生成器的损失函数进行优化，包括以下步骤：

S31、定义重建背景损失以加快训练速度；

S32、定义边缘损失以约束篡改区域形状。

8.根据权利要求7所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S31中重建背景损失函数具体为：

边缘损失函数具体为：

9.根据权利要求8所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S4具体包括以下步骤：

10.根据权利要求9所述的一种基于多尺度生成对抗网络的篡改图像检测方法，其特征在于，所述步骤S41中整个生成器网络的总体损失具体为：

L_G＝λ_advL_adv+λ_gradL_grad