CN115795370A - 基于重采样痕迹的电子数字信息取证方法及系统 - Google Patents

基于重采样痕迹的电子数字信息取证方法及系统 Download PDF

Info

Publication number
CN115795370A
CN115795370A CN202310097747.2A CN202310097747A CN115795370A CN 115795370 A CN115795370 A CN 115795370A CN 202310097747 A CN202310097747 A CN 202310097747A CN 115795370 A CN115795370 A CN 115795370A
Authority
CN
China
Prior art keywords
digital information
electronic digital
resampling
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310097747.2A
Other languages
English (en)
Other versions
CN115795370B (zh
Inventor
丁峰
范冰
刘帅旗
朱小刚
李向军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University
Original Assignee
Nanchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang University filed Critical Nanchang University
Priority to CN202310097747.2A priority Critical patent/CN115795370B/zh
Publication of CN115795370A publication Critical patent/CN115795370A/zh
Application granted granted Critical
Publication of CN115795370B publication Critical patent/CN115795370B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供一种基于重采样痕迹的电子数字信息取证方法及系统,该方法包括如下步骤:获取待检测电子数字信息;提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵;将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行检测和分类,获取电子数字信息取证结果。本申请实现对电子数字信息所采用的重采样算法的种类进行准确检测和分类,以及提高检测准确度。

Description

基于重采样痕迹的电子数字信息取证方法及系统
技术领域
本申请涉及数据识别技术领域,尤其涉及一种基于重采样痕迹的电子数字信息取证方法及系统。
背景技术
电子数字信息作为一种重要的信息载体,在众多领域都具有不可替代的使用价值,例如:医学治疗、媒体报道和司法取证等领域。电子数字信息可以是图片和图像,随着电子数字信息的应用越来越多,数字图像编辑软件也得到大力的推广与使用,导致一般人都可以使用数字图像编辑软件任意篡改图像的内容或在图像中隐藏信息,制作虚假电子数字信息。虚假电子数字信息给社会带来了很多不利影响。
电子数字信息取证主要通过分析电子数字信息内在统计特性、电子数字信息篡改痕迹特征、成像设备一致性等来实现电子数字信息的鉴别,具体包括:图像JPEG压缩检测、图像拼接检测、图像锐化检测、图像复制粘贴检测、图像重采样检测等一系列技术。
在电子数字信息篡改过程中,图像重采样操作是常用的技术手段之一,进行重采样操作过程中会利用到各种插值算法,这些插值算法会将图像中的各个相邻像素点之间建立起线性关系,因此,目前,常依靠这种线性关系检测图像是否发生重采样操作,从而对电子数字信息进行取证,鉴别电子数字信息是否真实。
目前,在电子数字信息处理领域,有如下几种常见的重采样插值算法:
第一,最近邻插值算法。最近邻插值算法是一种最简单、快速,但精度低的图像像素模拟方法。这种方法是在图像被上采样时,缺少的像素通过使用周围的原有像素的值生成,即用最邻近点的像素值计算新的像素值。
第二,双线性插值算法。双线性插值算法是一种通过平均周围像素颜色值来添加像素的方法。它会先找出最接近像素的四个图素,然后在它们之间作差补效果。最后产生的结果才会被贴到像素的位置上,这样就不会看到“马赛克”现象。
第三,双三次插值算法。双三次插值算法利用待求像素点在源图像中相邻的16个像素点的值,即待求像素点的值为这16个像素点的加权求平均值,每个像素值的权重由该点到待求像素点的距离确定。
第四,Lanczos插值算法。Lanczos插值算法将给定信号的每个样本映射到Lanczos核的平移和缩放副本, 然后在所需点计算这些平移和缩放的核的总和。Lanczos重采样通常用于增加数字信号的采样率,也用于多变量插值,例如调整数字图像的大小或旋转。Lanczos插值算法类似于双三次插值算法,分别计算x轴和y轴上最近像素的权重,然后将最近的像素加权平均得到最终的输出值。
现有技术中,提出了一种法医图像重采样检测的 SVD 方法(An SVD approachto forensic image resampling detection,David Vazquez-Padin, et al,EUSIPCO2015: 2067-2071);该方法存在的不足在于:只是区分图像是否进行过重采样,而并未区分具体是使用何种方法进行重采样的。
另外,现有技术中还提出了基于卷积神经网络的图像重采样检测(ImageResampling Detection Based on Convolutional Neural Network,Yaohua Liang,Yanmei Fang, Shangjun Luo, Bing Chen,CIS 2019: 257-261),该方法存在的不足在于:没有充分利用重采样算法的邻域中像素的关系,检测准确度低。
因此,目前亟需解决的技术问题是:如何对电子数字信息所采用的重采样算法的种类进行准确检测和分类,以及提高检测准确度。
发明内容
本申请的目的在于提供一种基于重采样痕迹的电子数字信息取证方法及系统,实现对电子数字信息所采用的重采样算法的种类进行准确检测和分类,以及提高检测准确度。
为达到上述目的,本申请提供一种基于重采样痕迹的电子数字信息取证方法,该方法包括如下步骤:获取待检测电子数字信息;提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵;将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,预先构建卷积神经网络分类器的方法包括如下步骤:构建残差块网络结构;将残差块网络结构构建在卷积神经网络中,形成卷积神经网络分类器。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,提取待检测电子数字信息中像素与邻近像素的关系特征的方法为:使用约束卷积核对待检测电子数字信息进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,还包括:对预先构建的卷积神经网络分类器检测准确率进行检测,
对预先构建的卷积神经网络分类器检测准确率进行检测包括如下步骤:
选取训练集和测试集;
将训练集和测试集中的电子数字信息均通过不同重采样插值算法进行处理;
对重采样插值算法处理后的训练集和测试集中的电子数字信息进行预处理;
使用预处理后的训练集中的电子数字信息对卷积神经网络分类器进行训练;
使用预处理后的测试集中的电子数字信息对训练后的卷积神经网络分类器进行测试,获取检测结果。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,分别使用随机插值倍数和固定插值倍数处理后的卷积神经网络分类器模型进行测试,对比插值算法处理后的卷积神经网络分类器的检测准确率。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,分别使用灰度电子数字信息和彩色电子数字信息作为训练集训练卷积神经网络分类器,对训练后的卷积神经网络分类器进行测试,对比灰度电子数字信息和彩色电子数字信息训练后的卷积神经网络分类器的检测精度。
如上所述的基于重采样痕迹的电子数字信息取证方法,其中,将训练集和测试集中的电子数字信息均通过不同重采样插值算法进行处理之前,还包括如下步骤:对训练集和测试集中电子数字信息进行压缩处理。
本申请还提供一种基于重采样痕迹的电子数字信息取证系统,该系统包括:获取模块,用于获取待检测电子数字信息;提取模块,用于提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵;取证模块,用于将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
如上所述的基于重采样痕迹的电子数字信息取证系统,其中,预先构建的卷积神经网络分类器为在卷积神经网络模型中插入残差块网络结构。
如上所述的基于重采样痕迹的电子数字信息取证系统,其中,所述提取模块中包括:
约束卷积核,用于对待检测电子数字信息进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征。
本申请实现的有益效果如下:
(1)本申请在卷积神经网络中引入ConvNeXt块,增加了卷积神经网络的分类准确能力,进而提升了整个模型的检测精度和鲁棒性。
(2)本申请没有直接使用卷积神经网络端到端的模型结构,在输入卷积神经网络模型前进行了电子数字信息邻域像素关系特征提取,获得邻域关系特征矩阵,将邻域关系特征矩阵输入到卷积神经网络分类器中,排除了冗余的内容特征,从而降低了整个模型的计算量,节省检测时间。
(3)本申请不仅对电子数字信息是否进行了重采样操作进行判断,还根据电子数字信息邻域像素关系(即重采样过程中新的像素点的值都是其周围像素点计算得出,新的像素点与周围像素点的像素值关系),识别电子数字信息具体使用何种算法进行了重采样。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例的一种基于重采样痕迹的电子数字信息取证方法的流程图。
图2为本申请实施例的预先构建卷积神经网络分类器的方法流程图。
图3为本申请实施例的使用约束卷积核对待检测电子数字信息进行卷积操作的方法示意图。
图4为本申请实施例的残差块网络结构的结构示意图。
图5为本申请实施例的卷积神经网络分类器的结构示意图。
图6为本申请实施例的一种基于重采样痕迹的电子数字信息取证系统的结构示意图。
附图标记:01-待检测电子数字信息;02-约束卷积核;03-邻域关系特征矩阵;10-获取模块;20-提取模块;30-取证模块;100-电子数字信息取证系统。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
如图1所示,本申请提供一种基于重采样痕迹的电子数字信息取证方法,该方法包括如下步骤:
步骤S1,获取待检测电子数字信息。
步骤S2,提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵。
具体的,提取待检测电子数字信息中像素与邻近像素的关系特征的方法为:
如图3所示,使用约束卷积核02对待检测电子数字信息01进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征的,获得邻域关系特征矩阵03。该关系特征是各个像素点的像素值之间的数值关系。
其中,如图3所示,约束卷积核02是一个5X5大小的参数固定的矩阵,矩阵最中间位置的参数为24,中间位置周围的24个位置的参数都为-1。
针对输入的待检测电子数字信息,虽然卷积神经网络模型能够自适应地学习用于电子数字信息识别的强分类特征,但是它学习到的往往是代表电子数字信息内容的特征。由于电子数字信息重采样操作会改变像素间独立于电子数字信息内容的局部关系,在电子数字信息取证检测的任务场景下,期望模型可以学习到像素点和它的局部邻域像素点之间的关系,获得邻域关系特征矩阵,将邻域关系特征矩阵输入到卷积神经网络分类器中,排除了冗余的内容特征,从而提高电子数字信息重采样痕迹的检测准确度,电子数字信息重采样痕迹即采用何种类型的重采样算法,不同类型的重采样算法处理后的电子数字信息中像素点和它的局部领域像素点之间的关系不同。
基于不同类型的重采样算法处理后的电子数字信息中像素点和它的局部领域像素点之间的关系,识别电子数字信息重采样痕迹采用何种类型的重采样算法,进而提高电子数字信息重采样痕迹的检测准确度。
步骤S3,将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
其中,获取电子数字信息取证结果可以理解为:识别电子数字信息是否存在重采样痕迹,具体的识别重采样痕迹是指识别电子数字信息是否采用了重采样插值算法,以及采样了何种重采样插值算法。
如图2所示,预先构建卷积神经网络分类器(CNN分类器)的方法为:
步骤S310,构建残差块网络结构(ConvNeXt块)。
ConvNeXt是一个残差块,有一定的几率跳过这部分网络结构。在ConvNeXt块中,首先使用了深度可分离卷积,将卷积以通道为单位进行运算,并且使用了更大的卷积核。其次ConvNeXt块使用的是GELU激活函数(格鲁激活函数)以及更少的激活函数,仅在两个全连接层之间使用了激活函数。再者ConvNeXt块中的BN(Batch Normalization批标准化)层都被替换为LN(Layer Norm特征归一化)层。使用ConvNeXt块的优点为在增加模型容量和分类准确率的同时,避免模型退化的问题。ConvNeXt块在重采样检测方面有很好的检测效果,且在JPEG压缩参数估计方面,提高了JPEG 参数估计的准确度。
如图4所示,残差块网络结构(ConvNeXt块)依次包括如下层:
深度可分离卷积层(Depthwise Conv2d)、特征归一化层(Layer Norm)、全连接层(Linear)、格鲁激活层(GELU)、全连接层(Linear)、特征层(Layerscale )和正则化层。正则化层(DropPath)的效果是将深度学习模型中的多分支结构的子路径随机删除,可以防止过拟合,提升模型表现,而且克服了网络退化问题。
步骤S320,将残差块网络结构构建在卷积神经网络中,形成卷积神经网络分类器。
如图5所示,卷积神经网络分类器的结构为:电子数字信息输入层-预测误差过滤器(prediction error filter)-ConvNeXt块-卷积层(Convolution Module)-全连接层-输出层。
其中,卷积神经网络分类器中首先将邻域关系特征矩阵从电子数字信息输入层输入,经过预测误差过滤器处理,再输入ConvNeXt块中处理后获得RGB电子数字信息,RGB电子数字信息经过7个卷积层处理,每一个卷积层都使用步长为4的5×5的卷积核;为了减少内部协变量的转移(即整个输入的分布变化),本发明在卷积神经网络训练时运用了均值方差归一化,在每一个卷积层之后都使用批量归一化操作。批量归一化解决了每层的输入受前面层参数的影响,且在一定程度上提高了卷积神经网络的分类精度。在卷积神经网络结构中,选择双曲正切函数(TanH)作为激活函数。本发明使用卷积层替换掉池化层,以更好地提取深层次特征。在卷积层处理之后,电子数字信息输入全连接层处理,然后从输出层输出。
作为本发明的一个具体实施例,计算给定电子数字信息块的SVD(奇异值)和每行/列的饱和像素程度的度量,训练能够区分上采样电子数字信息和真实电子数字信息的检测器,在小尺寸电子数字信息块上取得了显著的效果。
作为本发明的一个具体实施例,将纹理分析与重采样检测相结合,将重采样检测任务视为纹理分类问题,把重采样插值算法操作对原始单采样电子数字信息的影响视为电子数字信息纹理在精细尺度上的改变。首先,使用局部线性变换来获得纹理细节;然后从纹理细节的归一化特征函数矩阵中提取36维特征向量(邻域关系特征矩阵),使用提取的邻域关系特征矩阵(36维特征向量)来训练卷积神经网络分类器。对训练样本的36维特征向量进行训练,获得每种类型的重采样插值算法的模型和参数,然后可以用训练的模型和参数,对未知重采样插值算法的电子数字信息所使用的重采样插值算法的类型进行鉴别和取证。
作为本发明的一个具体实施例,获取电子数字信息数据集,将电子数字信息数据集输入到卷积神经网络分类器进行训练测试,获取测试结果。
具体的,电子数字信息数据集包括第一数据集、第二数据集和第三数据集。第一数据集为COCO 数据集,包括具有复杂场景的未压缩彩色电子数字信息,优选为328,000张;第二数据集为PASCAL VOC2012数据集,包括大小为375×500 的电子数字信息,优选为17125 张;第三数据集为ImageNet数据集,包括超过一千万张电子数字信息,是用于促进计算机电子数字信息识别技术发展而设立的一个大型电子数字信息数据集。
训练过程中,学习率的变化如下式所示,
Figure SMS_1
其中,学习率随重复训练数据集的次数变化而变化,设置边界数据集次数为
Figure SMS_2
Figure SMS_3
为当前的学习率,
Figure SMS_4
为设置的训练数据集的总次数,
Figure SMS_5
为更新后的学习率。
作为本发明的具体实施例,建立邻域关系特征矩阵之后,且将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类之前还包括:对预先构建的卷积神经网络分类器检测准确率进行检测。
作为本发明的具体实施例,对预先构建的卷积神经网络分类器模型性能进行检测的方法包括如下步骤:
步骤S410,选取训练集和测试集。
从第三数据集中选择训练集和测试集。训练集用于训练和测试集用于测试,训练集优选为:48561张电子数字信息;测试集优选为:8000张电子数字信息。训练集和测试集两组的重采样率都固定为 2。
步骤S420,将训练集中的电子数字信息通过不同重采样插值算法进行处理,将测试集中的电子数字信息通过不同重采样插值算法进行处理。
步骤S430,对重采样插值算法处理后的训练集和测试集中的电子数字信息进行预处理。
预处理例如:翻转和裁剪等方法来进行数据增强,并调整电子数字信息大小为:260×260像素,即最终输入模型中训练样本的大小为260×260像素。
步骤S440,使用预处理后的训练集中的电子数字信息对卷积神经网络分类器进行训练。
作为本发明的另一个具体实施例,使用预处理后的训练集中的电子数字信息和原图对卷积神经网络分类器进行训练。其中,原图为未进行重采样插值算法处理的电子数字信息,但调整电子数字信息大小为:260×260像素,即最终输入训练样本的大小为260×260像素。
步骤S450,使用预处理后的测试集中的电子数字信息对训练后的卷积神经网络分类器进行测试,获取检测结果,即获取不同重采样插值方法的检测准确率。
作为本发明的另一个具体实施例,使用测试集中经过不同重采样插值算法和预处理后的电子数字信息和原图(未经重采样插值算法处理)对训练后的卷积神经网络分类器进行测试,获取检测结果。
具体的,使用固定采样率的重采样插值方法的检测准确率如表1所示。
表1
Figure SMS_6
需要解释的是,表 1 为混淆矩阵,其中,表 1 中的行标题表示测试集中电子数字信息采用的重采样插值算法的真实类别,原图表示未采用任何重采样插值算法,表 1 中的列标题表示将测试集中电子数字信息输入到卷积神经网络分类器中获得的测试类别,若测试类别与真实类别相同,则表示卷积神经网络分类器的测试结果准确,其他的均为不准确,表 1 中的具体数值表示卷积神经网络分类器的检测准确率。例如,表 1 中真实类别为原图的,卷积神经网络分类器的测试类别为原图,则卷积神经网络分类器的检测准确,卷积神经网络分类器的其他测试类别均为不准确。从表1中可以看出卷积神经网络分类器对使用固定采样率的重采样插值方法的检测准确率结果为:原图、最近邻插值算法和双线性插值算法的检测准确率均为100%,双三次插值算法的检测准确率为99.9%。
进一步,为了验证模型(卷积神经网络分类器)的鲁棒性,分别使用随机插值倍数和固定插值倍数处理后的卷积神经网络分类器模型进行测试,对比不同重采样插值算法处理后的卷积神经网络分类器模型检测准确率。使用1.5~2.5的随机插值倍数处理后的模型进行测试,测试结果如表2所示。
表2
Figure SMS_7
需要解释的是,表 2 为混淆矩阵,其中,表 2 中的行标题表示测试集中电子数字信息采用的重采样插值算法的真实类别,列标题表示将测试集中电子数字信息输入到卷积神经网络分类器中获得的测试类别,表 2 中的具体数值表示卷积神经网络分类器的检测准确率。从表2中可以看出,使用随机插值倍数处理后的模型对原图的检测准确率为99.975%,对最近邻插值算法检测准确率为100%,对双线性插值算法检测准确率为99.875%,对双三次插值算法检测准确率为99.875%,本申请提出的卷积神经网络分类器对随机的插值倍数具有很好的鲁棒性,可以对不同重采样插值算法精确分类。
进一步,为验证输入电子数字信息的通道数对模型检测(重采样痕迹取证)准确率的影响,电子数字信息即图像,电子数字信息的通道数指的是图像的通道数。灰度图像和二值化图像的通道数均为单通道,有RGB三种颜色的图像的通道数为三通道。本发明训练了两种训练模型(五标签分类网络),一个使用灰度电子数字信息作为输入进行训练,另一个使用彩色电子数字信息作为输入进行训练。两种训练模型的检测性能如表3和表4所示。其中,表 3中的模型为使用彩色电子数字信息作为输入进行训练的模型;表 4 中的模型为使用灰度电子数字信息作为输入进行训练的模型。
表3
Figure SMS_8
如表3所示,使用RGB电子数字信息训练的模型在重采样率为2上可以获得很好的分类性能,平均准确率为99.9%左右,在具有随机重采样率的电子数字信息上有所减少。
表4
Figure SMS_9
如表4所示,行标题中的原图、最近邻插值、双线性插值、双三次插值和 Lanzos 插值表示电子数字信息被处理的真实类别,即输入模型的电子数字信息的真实类别;列标题中原图、最近邻插值、双线性插值、双三次插值和 Lanzos 插值表示电子数字信息输入模型中,模型输出电子数字信息的测试类别。对于在灰度电子数字信息上训练的模型,真实类别为双线性插值的分类精度在重采样率为2时仅为81.41%,即在重采样率为 2,真实类别为双线性插值时,模型测试类别也为双线性插值的准确度为 81.41%,真实类别为双三次插值中有18.59%被模型误判为双线性插值。在随机插值测试中,即重采样率为[1.5, 6]时,对于双线性插值,仅有67.49% 的测试电子数字信息的重采样插值算法被正确检测。对于双三次插值方法,预测精度分别为0.04%,其余99.96%的测试电子数字信息被错误地预测为采用最近邻插值、双线性插值或Lanzos插值方法。
由表3和表4可知,在重采样率范围较大时,用灰度电子数字信息训练的模型比彩色电子数字信息训练的模型的检测精度低。因此,本发明使用彩色电子数字信息作为模型训练的输入电子数字信息。
为了隐藏篡改的痕迹,攻击者可能会对伪造的电子数字信息进行JPEG(静止图片压缩)压缩处理,然后进行重采样。因此,需要检查模型对JPEG压缩的鲁棒性。
作为本发明的具体实施例,对JPEG压缩的鲁棒性测试的方法包括如下步骤:
步骤T1,在第一数据集中选择训练集,在第二数据集中选择测试集。
优选的,第一数据集中选择4000张电子数字信息进行训练,在第二数据集中选择1008张电子数字信息进行测试。
步骤T2,对训练集和测试集中电子数字信息进行压缩处理。
具体的,压缩4000张随机质量因子QF={10, 20, 30, 40, 50, 60, 70, 80, 90,100}的测试电子数字信息。
可以理解的是,本发明随机的使用QF={10, 20, 30, 40, 50, 60, 70, 80, 90,100}中任意一个质量因子,QF可以是10、20、30或50等,对训练集和测试集中的电子数字信息进行压缩,获取经过压缩处理的训练集和测试集。
步骤T3,将训练集和测试集中的电子数字信息均通过不同重采样插值算法进行处理。
步骤T4,对重采样插值算法处理后的训练集和测试集中的电子数字信息进行预处理。
步骤T3,使用预处理后的训练集对模型进行训练。
步骤T4,使用预处理后的测试集,在彩色电子数字信息上训练的模型进行测试,获取测试结果。
可以理解的是,对JPEG压缩的鲁棒性测试的方法中训练集中的电子数字信息为彩色电子数字信息,模型为通过训练集中的彩色电子数字信息训练的。
具体的,不同质量因子JPEG电子数字信息压缩后,重采样率为2的插值检测准确率如表5所示。
表5
Figure SMS_10
从表5中可以看出,当质量因子较高时,模型的平均准确率可以达到99.31%以上。随着压缩质量的下降,模型的检测准确性也会下降。
具体的,不同质量因子JPEG压缩后,重采样率在范围[1.5,2.5]的插值检测准确率如表6所示。
表6
Figure SMS_11
由表6可知,质量因子为 [70, 90] 的高压缩质量的电子数字信息的平均精度略微下降到97.82%,随机重采样率为1.5 到2.5。当质量因子QF=10时,准确率只有19%左右。在不同的质量因子下,本发明的模型预测双线性插值算法的性能始终很高,平均准确率为99.81%。考虑到在实际应用中,低压缩质量的电子数字信息具有明显的视觉质量下降,攻击者通常不会选择低压缩质量因子来处理电子数字信息,因此,模型在高质量因子电子数字信息上的性能更为重要。
作为本发明的其他实施例,本发明也可以进行JPEG压缩参数(参数即质量因子)估计。使用重采样检测方法相同的方法步骤,把输入电子数字信息由经过不同重采样方法的类别替换为经过不同参数的JPEG压缩的类别进行训练和预测,可以进行JPEG压缩参数估计预测。
实施例二
如图6所示,本申请提供一种基于重采样痕迹的电子数字信息取证系统100,该系统包括:
获取模块10,用于获取待检测电子数字信息;待检测电子数字信息可以是图片和图像。
提取模块20,用于提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵。
取证模块30,用于将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
其中,获取电子数字信息取证结果可以理解为:识别电子数字信息是否存在重采样痕迹,具体的识别重采样痕迹是指识别电子数字信息是否采用了重采样插值算法,以及采样了何种重采样插值算法。
其中,预先构建的卷积神经网络分类器为在卷积神经网络模型中插入残差块网络结构。
其中,提取模块20中包括:约束卷积核,用于对待检测电子数字信息进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征。
本申请实现的有益效果如下:
(1)本申请在卷积神经网络中引入ConvNeXt块,增加了卷积神经网络的分类准确能力,进而提升了整个模型的检测精度和鲁棒性。
(2)本申请没有直接使用卷积神经网络端到端的模型结构,在输入卷积神经网络模型前进行了电子数字信息邻域像素关系特征提取,获得邻域关系特征矩阵,将邻域关系特征矩阵输入到卷积神经网络分类器中,排除了冗余的内容特征,从而降低了整个模型的计算量,节省检测时间。
(3)本申请不仅对电子数字信息是否进行了重采样操作进行判断,还根据电子数字信息邻域像素关系(即重采样过程中新的像素点的值都是其周围像素点计算得出,新的像素点与周围像素点的像素值关系),识别电子数字信息具体使用何种算法进行了重采样。
以上所述仅为本发明的实施方式而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理内所做的任何修改、等同替换、改进等,均应包括在本发明的权利要求范围之内。

Claims (10)

1.一种基于重采样痕迹的电子数字信息取证方法,其特征在于,该方法包括如下步骤:
获取待检测电子数字信息;
提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵;
将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
2.根据权利要求1所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,预先构建卷积神经网络分类器的方法包括如下步骤:
构建残差块网络结构;
将残差块网络结构构建在卷积神经网络中,形成卷积神经网络分类器。
3.根据权利要求1所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,提取待检测电子数字信息中像素与邻近像素的关系特征的方法为:使用约束卷积核对待检测电子数字信息进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征。
4.根据权利要求1所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,建立邻域关系特征矩阵之后,且将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类之前还包括:对预先构建的卷积神经网络分类器检测准确率进行检测,
对预先构建的卷积神经网络分类器检测准确率进行检测包括如下步骤:
选取训练集和测试集;
将训练集和测试集中的电子数字信息均通过不同重采样插值算法进行处理;
对重采样插值算法处理后的训练集和测试集中的电子数字信息进行预处理;
使用预处理后的训练集中的电子数字信息对卷积神经网络分类器进行训练;
使用预处理后的测试集中的电子数字信息对训练后的卷积神经网络分类器进行测试,获取检测结果,检测结果即卷积神经网络分类器对电子数字信息真实类别的检测准确率。
5.根据权利要求4所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,分别使用随机插值倍数和固定插值倍数处理后卷积神经网络分类器的模型进行测试,对比插值算法处理后的卷积神经网络分类器模型的检测准确率。
6.根据权利要求4所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,分别使用灰度电子数字信息和彩色电子数字信息作为训练集训练卷积神经网络分类器,对训练后的卷积神经网络分类器进行测试,对比灰度电子数字信息和彩色电子数字信息训练后的卷积神经网络分类器的检测精度。
7.根据权利要求4所述的基于重采样痕迹的电子数字信息取证方法,其特征在于,将训练集和测试集中的电子数字信息均通过不同重采样插值算法进行处理之前,还包括如下步骤:
对训练集和测试集中电子数字信息进行压缩处理。
8.一种基于重采样痕迹的电子数字信息取证系统,其特征在于,该系统包括:
获取模块,用于获取待检测电子数字信息;
提取模块,用于提取待检测电子数字信息中像素与邻近像素的关系特征,建立邻域关系特征矩阵;
取证模块,用于将邻域关系特征矩阵输入到预先构建的卷积神经网络分类器进行重采样痕迹检测和分类,获取电子数字信息取证结果。
9.根据权利要求8所述的基于重采样痕迹的电子数字信息取证系统,其特征在于,预先构建的卷积神经网络分类器为在卷积神经网络模型中插入残差块网络结构。
10.根据权利要求8所述的基于重采样痕迹的电子数字信息取证系统,其特征在于,所述提取模块中包括:
约束卷积核,用于对待检测电子数字信息进行卷积操作,提取电子数字信息中各个像素与邻近像素之间的关系特征。
CN202310097747.2A 2023-02-10 2023-02-10 基于重采样痕迹的电子数字信息取证方法及系统 Active CN115795370B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310097747.2A CN115795370B (zh) 2023-02-10 2023-02-10 基于重采样痕迹的电子数字信息取证方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310097747.2A CN115795370B (zh) 2023-02-10 2023-02-10 基于重采样痕迹的电子数字信息取证方法及系统

Publications (2)

Publication Number Publication Date
CN115795370A true CN115795370A (zh) 2023-03-14
CN115795370B CN115795370B (zh) 2023-05-30

Family

ID=85430858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310097747.2A Active CN115795370B (zh) 2023-02-10 2023-02-10 基于重采样痕迹的电子数字信息取证方法及系统

Country Status (1)

Country Link
CN (1) CN115795370B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709915A (zh) * 2017-01-06 2017-05-24 天津大学 一种图像重采样操作检测方法
CN106845540A (zh) * 2017-01-06 2017-06-13 天津大学 一种图像重采样操作插值类型识别方法
CN108682007A (zh) * 2018-04-28 2018-10-19 华中师范大学 基于深度随机森林的jpeg图像重采样自动检测方法
US20200126209A1 (en) * 2018-10-18 2020-04-23 Nhn Corporation System and method for detecting image forgery through convolutional neural network and method for providing non-manipulation detection service using the same
CN111080586A (zh) * 2019-12-04 2020-04-28 湖南大学 基于卷积神经网络的篡改图像来源取证方法
CN111080587A (zh) * 2019-12-04 2020-04-28 中山大学 一种基于卷积神经网络的重采样图像检测方法
CN112613371A (zh) * 2020-12-16 2021-04-06 上海大学 一种基于密集连接卷积神经网络高光谱图像道路提取方法
CN113850284A (zh) * 2021-07-04 2021-12-28 天津大学 一种基于多尺度特征融合和多分支预测的多操作检测方法
CN114202592A (zh) * 2021-11-23 2022-03-18 南京航空航天大学 一种基于空间相关性的重新着色图像取证方法
CN114936986A (zh) * 2022-06-28 2022-08-23 张学武 一种深度学习的图像防篡改系统及方法
CN115472179A (zh) * 2022-08-04 2022-12-13 湖北工业大学 面向数字音频删除和插入篡改操作自动检测方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709915A (zh) * 2017-01-06 2017-05-24 天津大学 一种图像重采样操作检测方法
CN106845540A (zh) * 2017-01-06 2017-06-13 天津大学 一种图像重采样操作插值类型识别方法
CN108682007A (zh) * 2018-04-28 2018-10-19 华中师范大学 基于深度随机森林的jpeg图像重采样自动检测方法
US20200126209A1 (en) * 2018-10-18 2020-04-23 Nhn Corporation System and method for detecting image forgery through convolutional neural network and method for providing non-manipulation detection service using the same
CN111080586A (zh) * 2019-12-04 2020-04-28 湖南大学 基于卷积神经网络的篡改图像来源取证方法
CN111080587A (zh) * 2019-12-04 2020-04-28 中山大学 一种基于卷积神经网络的重采样图像检测方法
CN112613371A (zh) * 2020-12-16 2021-04-06 上海大学 一种基于密集连接卷积神经网络高光谱图像道路提取方法
CN113850284A (zh) * 2021-07-04 2021-12-28 天津大学 一种基于多尺度特征融合和多分支预测的多操作检测方法
CN114202592A (zh) * 2021-11-23 2022-03-18 南京航空航天大学 一种基于空间相关性的重新着色图像取证方法
CN114936986A (zh) * 2022-06-28 2022-08-23 张学武 一种深度学习的图像防篡改系统及方法
CN115472179A (zh) * 2022-08-04 2022-12-13 湖北工业大学 面向数字音频删除和插入篡改操作自动检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUANGHUI HAN: "Hybrid resampling and multi-feature fusion for automatic recognition of cavity imaging sign in lung CT", 《FUTURE GENERATION COMPUTER SYSTEMS 》, vol. 99 *
彭安杰;曾辉;康显桂;: "基于多方向差分的重采样取证技术", 中国科学:信息科学, no. 05 *

Also Published As

Publication number Publication date
CN115795370B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
Yuan Blind forensics of median filtering in digital images
CN109325550B (zh) 基于图像熵的无参考图像质量评价方法
Kang et al. Robust median filtering forensics using an autoregressive model
CN110717450B (zh) 自动识别原始文档的翻拍图像的训练方法和检测方法
CN108052980B (zh) 基于图像的空气质量等级检测方法
CN111311563A (zh) 一种基于多域特征融合的图像篡改检测方法
CN108280480B (zh) 一种基于残差共生概率的隐写图像载体安全性评价方法
CN106203461B (zh) 一种图像处理方法及装置
CN108830829B (zh) 联合多种边缘检测算子的无参考质量评价算法
CN111415323A (zh) 图像的检测方法及装置,神经网络的训练方法及装置
CN111696021A (zh) 一种基于显著性检测的图像自适应隐写分析系统及方法
CN103067713A (zh) 一种位图jpeg压缩检测的方法及系统
Li et al. Robust median filtering detection based on the difference of frequency residuals
CN106709915B (zh) 一种图像重采样操作检测方法
CN115272350A (zh) 一种计算机pcb主板生产质量检测方法
CN115497010A (zh) 一种基于深度学习的地理信息的识别方法及系统
CN112070714B (zh) 一种基于局部三元计数特征的翻拍图像检测方法
Xiang et al. Research on splicing image detection algorithms based on natural image statistical characteristics
CN111027573B (zh) 基于盲取证技术的图像真伪鉴别方法
CN110619594B (zh) 一种半色调图像隐写分析方法
CN115795370B (zh) 基于重采样痕迹的电子数字信息取证方法及系统
CN113344110B (zh) 一种基于超分辨率重建的模糊图像分类方法
Zhu et al. Recaptured image forensics based on local ternary count of high order prediction error
CN106845540B (zh) 一种图像重采样操作插值类型识别方法
CN111754459B (zh) 基于统计深度特征的染色伪造图像检测方法及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant