CN113436287A

CN113436287A - 一种基于lstm网络与编解码网络的篡改图像盲取证方法

Info

Publication number: CN113436287A
Application number: CN202110755400.3A
Authority: CN
Inventors: 高天畅; 吕颖达; 周功涛; 吴悦莹; 胡汉清; 贾康健
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2021-09-24
Anticipated expiration: 2041-07-05
Also published as: CN113436287B

Abstract

本发明公开了一种基于LSTM网络与编解码网络的篡改图像盲取证方法，本发明首先将图像进行插值转化为标准大小，将图像输入到编码器提取图像的像素级篡改特征，将图像分割为8*8的图像块输入到LSTM网络中提取块之间的过渡信息，融合两个特征利用解码器生成篡改区域预测图像。本发明能够对篡改图像进行准确的预测，能够帮助信息鉴别工作者提高了网络图像真伪取证的便捷性与准确度。

Description

一种基于LSTM网络与编解码网络的篡改图像盲取证方法

技术领域

本发明涉及了信息媒体取证领域，特别是利用了LSTM网络与编解码网络进行图像篡改盲取证。

背景技术

图像处理软件及数字图像获取设备的快速发展，使得非专业人士也可以轻松编辑、修改图像。在当今数字化的时代，图像已经是一种普遍至极的媒介，向人们传达着各种社会信息。因此，借助计算机强大的计算能力，来完成伪造图片的辨别与篡改区域的定位是当前图像真伪取证的迫切需求。数字图像盲取证技术(Blind Image Forensic)，因其无需对图像预处理、仅利用图像自身的特征就能鉴别图像真伪，而成为目前该领域的研究热点。

发明内容

本发明能够对篡改图像进行准确的预测，能够帮助信息鉴别工作者提高了网络图像真伪取证的便捷性与准确度。

本发明提供的技术方案为：

一种基于LSTM网络与编解码网络的篡改图像盲取证方法其特征在于，包括如下步骤：

步骤一：输入任意图像，将图像利用二次线性插值重构为256*256的图像X；

步骤二：图像值转化为0-255之间的值，存入hdf5文件；

步骤三：将图像X切割分成8*8个图像块，利用拉普拉斯滤波器对每一个图像块进行锐化处理，通过Rodan变换对图像提取重采样特征图X1；

步骤四：将重采样特征X1输入到LSTM网络提取出重采样特征热图Y1，代表每个块之间的宏观过渡信息；

步骤五：将图像X输入到编码器中，经过第一次二维卷积、批标准化、池化操作得到早期空间特征图Y2，将特征图保存用作解码器的跳过链接。再进行两次二维卷积、批标准化、池化操作得到压缩后的深层特征图Y3。

步骤六：将特征图Y3与特征图X1进行堆叠得到融合特征图Y4，经过一次上采样、批标准化、RELU函数激活得到的特征图与跳过链接特征图Y2堆叠得到融合特征图Y5，再经过一次上采样、批标准化、RELU函数激活得到预测特征图Y6，对Y6利用sigmoid函数进行0-1处理得到最终的预测蒙版图。

优选地，所述步骤三，将图像X切割分成8*8个图像块，利用拉普拉斯滤波器对每一个图像块进行锐化处理，通过Rodan变换对图像提取重采样特征图X1；步骤如下：

给定一幅图像，我们首先提取64(即8×8)个不重叠的patch。由于输入图像的尺寸为256 ×256×3，所以每个patch的尺寸为32×32×3。然后，用3×3拉普拉斯滤波器的幅度的平方根来计算，得到每个提取的patch的线性预测误差的幅度。由于重采样信号的线性预测误差具有周期性的相关性，我们应用Radon变换沿不同的投影角度累积误差。最后，我们应用快速傅里叶变换(FFT)来找出信号的周期性。一般来说，这些重采样特征能够捕获不同的重采样特征——JPEG质量阈值高于或低于阈值、上采样、下采样、顺时针旋转、逆时针旋转和剪切。

优选地，所述步骤四，将重采样特征X1输入到LSTM网络提取出重采样特征热图Y1，代表每个块之间的宏观过渡信息；步骤如下：为了更好地保留块的空间局域性，我们采用了希尔伯特曲线，这种曲线通常用于将多维问题简化为一维的。我们从一个图像中总共提取了 64(8×8)块，需要对平面进行三次递归分割。利用Hilbert曲线对补丁进行排序后，按顺序输入到LSTM网络中。LSTM细胞是LSTM网络的基础组成部分，LSTM细胞间的信息流由三个门控制:输入门、遗忘门和输出门。每个门都有一个从0到1的值，由一个sigmoid函数激活。我们将定义当前t细胞的细胞状态和输出状态为C_t和z_t，每个细胞有一个候选细胞状态

使用之前的细胞状态C_t-1和

我们可以将更新后的单元格状态C_t写为

这里的

代表对应相乘，然后我们可以得到当前细胞的输出

LSTM网络通过将每个块的重采样特征发送到每个LSTM细胞来计算块之间的对数距离。LSTM细胞学习相邻块之间的相关性。本文在LSTM网络中使用了2个堆叠层，64个时间步长。我们从最后一层的每个时间步长得到64维的特征向量。

优选地，所述步骤五，将图像X输入到编码器中，经过第一次二维卷积、批标准化、池化操作得到早期空间特征图Y2，将特征图保存用作解码器的跳过链接。再进行两次二维卷积、批标准化、池化操作得到压缩后的深层特征图Y3。操作步骤如下：卷积网络(ConvNet)由不同的层组成，其中每层输入数据是一个大小为h×w×c的三维数组，其中h和w分别是数据的高度和宽度，c是通道的维度。第一层以图像为输入，尺寸为256×256×3(宽、高、色道)。每个编码器的基本构造块利用卷积、池化和激活函数，使用残差单元可以方便地对残差映射进行优化，并且可以训练更多的层。在每个卷积层中，我们使用3×3×d的卷积核，其中d是一个过滤器的深度，我们利用32、64、128和256个特征映射分别在编码器架构的第一、第二、第三和第四层。激活函数我们选择了可以表示为max(0,x)的整流线性单元(ReLU)，在每个残差单元的末端，进行步长为2的最大池化，这将特征图的大小减少了2倍。

优选地，所述步骤六，将特征图Y3与特征图X1进行堆叠得到融合特征图Y4，经过一次上采样、批标准化、RELU函数激活得到的特征图与跳过链接特征图Y2堆叠得到融合特征图Y5，再经过一次上采样、批标准化、RELU函数激活得到预测特征图Y6，对Y6利用sigmoid函数进行0-1处理得到最终的预测蒙版图。步骤如下：每个解码器遵循基本操作-上采样卷积、批标准化和RELU函数激活。每个解码器首先对前一层学习到的特征图进行上采样。然后进行批归一化和RELU函数激活。解码器网络采用3×3大小的内核。该解码器在第一层和第二层分别开发了64和16个特征图。在第一个解码器输入之前，将特征图Y3与特征图X1进行纵向堆叠得到融合特征图Y4，输入到第一个解码器中，输出特征图与跳过链接特征图Y2 堆叠得到融合特征图Y5，输入第二个解码器当中，最后，利用2张热图对译码网络末端的被操纵类和非被操纵类进行预测。

本发明的有益效果：

1.为媒体土相鉴别提供新的方法，推动图像伪造鉴别的事业发展，在新闻等行业能够发挥极大的价值。能够有效解决当前鉴定工作者鉴定费时费力，而且准确率不高的问题。我们提出的方案能够通过人工提取一些小样本作为输入，训练出一个实用的模型。

2.模型易于推广，可以应用在多领域。我们设计的网络不仅采用小样本学习方式，而且我们的模型参数量小，易于推广，便于应用在一些对硬件资源要求不高的环境以及一些实时系统中。

附图说明

图1为本发明所述的基于LSTM网络与编解码网络的篡改图像盲取证方法流程图。

具体实施方式

下面结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

如图1所示，本发明提供了一种基于残基于LSTM网络与编解码网络的篡改图像盲取证方法。将任意维度的图像重新插值为256*256大小的图像，封装进hdf5文件，打开文件将图像分成8*8个图像块，利用拉普拉斯滤波器与Rodan变换对图像进行重采样，提取重采样特征，输入到LSTM网络提取出重采样特征热图；将图像输入到编码器，经过三次二维卷积、批标准化、池化操作提取图像深层微观空间信息，同时保存经过第一次操作后的特征图用作跳过链接。融合宏观特征与微观特征，输入解码器网络，经过一次上采样、批标准化、RELU 函数激活，融合跳过链接特征，再进行一次操作得到最终预测蒙版，其步骤如下：

步骤101：将输入任意图像，将图像利用二次线性插值重构为256*256的图像X。

步骤102：将图像值转化为0-255之间的值，存入hdf5文件。

步骤103：将图像X切割分成8*8个图像块，利用拉普拉斯滤波器对每一个图像块进行锐化处理，通过Rodan变换对图像提取重采样特征图X1；步骤如下：给定一幅图像，我们首先提取64(8×8)个不重叠的patch。由于输入图像的尺寸为256x256x3，所以每个patch的尺寸为32x32x3。然后，用3×3拉普拉斯滤波器的幅度的平方根来计算，得到每个提取的patch的线性预测误差的幅度。由于重采样信号的线性预测误差具有周期性的相关性，我们应用Radon变换沿不同的投影角度累积误差。最后，我们应用快速傅里叶变换(FFT)来找出信号的周期性。一般来说，这些重采样特征能够捕获不同的重采样特征——JPEG质量阈值高于或低于阈值、上采样、下采样、顺时针旋转、逆时针旋转和剪切。

步骤104：将重采样特征X1输入到LSTM网络提取出重采样特征热图Y1，代表每个块之间的宏观过渡信息；步骤如下：为了更好地保留块的空间局域性，我们采用了希尔伯特曲线，这种曲线通常用于将多维问题简化为一维的。我们从一个图像中总共提取了64(8×8)块，需要对平面进行三次递归分割。利用Hilbert曲线对补丁进行排序后，按顺序输入到LSTM 网络中。LSTM细胞是LSTM网络的基础组成部分，LSTM细胞间的信息流由三个门控制:输入门、遗忘门和输出门。每个门都有一个从0到1的值，由一个sigmoid函数激活。我们将定义当前t细胞的细胞状态和输出状态为C_t和z_t，每个细胞有一个候选细胞状态

使用之前的细胞状态C_t-1和

我们可以将更新后的单元格状态C_t写为

这里的

代表对应相乘，然后我们可以得到当前细胞的输出

步骤105：将图像X输入到编码器中，经过第一次二维卷积、批标准化、池化操作得到早期空间特征图Y2，将特征图保存用作解码器的跳过链接。再进行两次二维卷积、批标准化、池化操作得到压缩后的深层特征图Y3。操作步骤如下：卷积网络(ConvNet)由不同的层组成，其中每层输入数据是一个大小为h×w×c的三维数组，其中h和w分别是数据的高度和宽度，c是通道的维度。第一层以图像为输入，尺寸为256×256×3(宽、高、色道)。每个编码器的基本构造块利用卷积、池化和激活函数，使用残差单元可以方便地对残差映射进行优化，并且可以训练更多的层。在每个卷积层中，我们使用3×3×d的卷积核，其中 d是一个过滤器的深度，我们利用32、64、128和256个特征映射分别在编码器架构的第一、第二、第三和第四层。激活函数我们选择了可以表示为max(0,x)的整流线性单元(ReLU)，在每个残差单元的末端，进行步长为2的最大池化，这将特征图的大小减少了2倍。

步骤106：将特征图Y3与特征图X1进行堆叠得到融合特征图Y4，经过一次上采样、批标准化、RELU函数激活得到的特征图与跳过链接特征图Y2堆叠得到融合特征图Y5，再经过一次上采样、批标准化、RELU函数激活得到预测特征图Y6，对Y6利用sigmoid函数进行0-1处理得到最终的预测蒙版图。步骤如下：每个解码器遵循基本操作-上采样卷积、批标准化和RELU函数激活。每个解码器首先对前一层学习到的特征图进行上采样。然后进行批归一化和RELU函数激活。解码器网络采用3×3大小的内核。该解码器在第一层和第二层分别开发了64和16个特征图。在第一个解码器输入之前，将特征图Y3与特征图X1进行纵向堆叠得到融合特征图Y4，输入到第一个解码器中，输出特征图与跳过链接特征图Y2堆叠得到融合特征图Y5，输入第二个解码器当中，最后，利用2张热图对译码网络末端的被操纵类和非被操纵类进行预测。

传统的图像盲取证方法大多利用图像本身的物理特征进行检测，而且很难对图像篡改区域进行准确的定位，我们利用LSTM与编解码网络进行混合的网络结构，不仅可以有效的提取块之间的过渡信息，也可以在像素级别上对篡改区域进行定位。定位过程主要分为四个部分，第一部分通过插值、封装操作将图片进行封装，第二部分将图像分块利用拉普拉斯过滤器与Rodan变换提取重采样特征并输入到LSTM网络之中，第三部分将图像通过卷积、批标准化、池化操作进行编码，第四部分利用特征图堆叠、上采样、批标准化、RELU函数激活得到预测蒙版，在像素级别上定位篡改区域。

第一部分的具体步骤如下：

第一步：确定固定的点，如果图片小于256则点数不变进行双线性插值，大于256则等比例删除一些点。

第二步：确定四个边界点Q11＝(x1,y1)、Q12＝(x1,y2)、Q21＝(x2,y1)、Q22＝(x2,y2)

第三步：在x轴方向上进行插值，根据点Q11、Q21得到

根据点Q12、Q22得到

第四步：在y轴上进行插值

第五步：重复执行二、三、四直到图像的像素为256*256*3

第六步：将图像压缩进hdf5文件，数据部分命名为data

第二部分的具体步骤如下：

第一步：将文件内的图像取出，提取出64(8×8)个不重叠的patch。由于输入图像的尺寸为256×256×3，所以每个patch的尺寸为32×32×3。

第二步：用3×3拉普拉斯滤波器的幅度的平方根来计算，得到每个提取的patch的线性预测误差的幅度。

第三步：应用Radon变换沿不同的投影角度累积误差。

第四步：应用快速傅里叶变换(FFT)来找出信号的周期性。

第五步：将特征存储进蝴hdf5文件，命名为feature。

第六步：生成希尔伯特曲线的顺序

第七步：对平面图像进行三次递归分割，得到64(8×8)个图像特征块。

第八步：利用Hilbert曲线对补丁进行排序后，按顺序输入到LSTM网络中。

第九步：通过LSTM细胞计算内部输入后的状态信息，将定义当前t细胞的细胞状态和输出状态为C_t和z_t，每个细胞有一个候选细胞状态

使用之前的细胞状态C_t-1和

我们可以将更新后的单元格状态C_t写为

这里的

代表对应相乘，然后我们可以得到当前细胞的输出

第十步：LSTM网络通过将每个块的重采样特征发送到每个LSTM细胞来计算块之间的对数距离。

第十一步：将学习结果输出为特征图1

第三部分的具体步骤如下：

第一步：将图像做为输入，尺寸为256×256×3(宽、高、色道)。

第二步：每个编码器的基本构造块利用卷积、步长为2的最大池化和ReLU激活函数，使用残差单元可以方便地对残差映射进行优化，并且可以训练更多的层。这里是第一个卷积层，我们使用3×3×32的卷积核。

第三步：这里是第二个卷积层，我们使用3×3×64的卷积核。

第四步：这里是第三个卷积层，我们使用3×3×128的卷积核。

第五步：这里是第四个卷积层，我们使用3×3×256的卷积核。

第六步：保存第一个卷积层的输出结果为特征图2

第七步：将学习结果输出为特征图3

第四部分的具体步骤如下：

第一步：在第三维堆叠特征图1与特征图3

第二步：每个解码器遵循基本操作-上采样卷积、批标准化和RELU函数激活。解码器网络采用3×3大小的内核，这是第一层解码器，开发了64个特征图，使用批标准化和RELU函数激活。

第三步：输出的结果保存为特征图4

第四步：在第三维堆叠特征图2与特征图4

第五步：这是第二层解码器，开发了16个特征图，批标准化和RELU函数激活。

第六步：输出结果进行sigmoid函数激活，得到预测0-1蒙版

第七步：对蒙版进行阈值分析，小于0.5为0，大于等于0.5为1。

第八步：将学习结果输出为图像。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。

Claims

1.一种基于LSTM网络与编解码网络的篡改图像盲取证方法，其特征在于，包括如下步骤：

步骤二：图像值转化为0-255之间的值，存入hdf5文件；

步骤五：将图像X输入到编码器中，经过第一次二维卷积、批标准化、池化操作得到早期空间特征图Y2，将特征图保存用作解码器的跳过链接；再进行两次二维卷积、批标准化、池化操作得到压缩后的深层特征图Y3；

2.根据权利要求1所述的一种基于LSTM网络与编解码网络的篡改图像盲取证方法，其特征在于，步骤三具体步骤如下：

给定一幅图像，我们首先提取64(8×8)个不重叠的patch；由于输入图像的尺寸为256×256×3，所以每个patch的尺寸为32×32×3；然后，用3×3拉普拉斯滤波器的幅度的平方根来计算，得到每个提取的patch的线性预测误差的幅度；由于重采样信号的线性预测误差具有周期性的相关性，我们应用Radon变换沿不同的投影角度累积误差；最后，我们应用快速傅里叶变换(FFT)来找出信号的周期性。

3.根据权利要求1所述的一种基于LSTM网络与编解码网络的篡改图像盲取证方法，其特征在于，步骤四的具体步骤如下：

为了更好地保留块的空间局域性，我们采用了希尔伯特曲线，这种曲线通常用于将多维问题简化为一维的；我们从一个图像中总共提取了64(8×8)块，需要对平面进行三次递归分割；利用Hilbert曲线对补丁进行排序后，按顺序输入到LSTM网络中；

LSTM细胞是LSTM网络的基础组成部分，LSTM细胞间的信息流由三个门控制:输入门、遗忘门和输出门；每个门都有一个从0到1的值，由一个sigmoid函数激活；我们将定义当前t细胞的细胞状态和输出状态为C_t和z_t，每个细胞有一个候选细胞状态

使用之前的细胞状态C_t-1和

我们可以将更新后的单元格状态C_t写为

这里的

代表对应相乘，然后我们可以得到当前细胞的输出

LSTM网络通过将每个块的重采样特征发送到每个LSTM细胞来计算块之间的对数距离；LSTM细胞学习相邻块之间的相关性；所述的LSTM网络中使用了2个堆叠层，64个时间步长；从最后一层的每个时间步长得到64维的特征向量。

4.根据权利要求1所述的一种基于LSTM网络与编解码网络的篡改图像盲取证方法，其特征在于，步骤五操作步骤如下：

卷积网络由不同的层组成，其中每层输入数据是一个大小为h×w×c的三维数组，其中h和w分别是数据的高度和宽度，c是通道的维度；第一层以图像为输入，尺寸为256×256×3；每个编码器的基本构造块利用卷积、池化和激活函数，使用残差单元可以方便地对残差映射进行优化，并且可以训练更多的层；在每个卷积层中，我们使用3×3×d的卷积核，其中d是一个过滤器的深度，我们利用32、64、128和256个特征映射分别在编码器架构的第一、第二、第三和第四层；激活函数我们选择了可以表示为max(0,x)的整流线性单元，在每个残差单元的末端，进行步长为2的最大池化，这将特征图的大小减少了2倍。

5.根据权利要求1所述的一种基于LSTM网络与编解码网络的篡改图像盲取证方法，其特征在于，步骤六具体步骤如下：

每个解码器遵循基本操作-上采样卷积、批标准化和RELU函数激活；每个解码器首先对前一层学习到的特征图进行上采样；然后进行批归一化和RELU函数激活；解码器网络采用3×3大小的内核；该解码器在第一层和第二层分别开发了64和16个特征图；在第一个解码器输入之前，将特征图Y3与特征图X1进行纵向堆叠得到融合特征图Y4，输入到第一个解码器中，输出特征图与跳过链接特征图Y2堆叠得到融合特征图Y5，输入第二个解码器当中，最后，利用2张热图对译码网络末端的被操纵类和非被操纵类进行预测。