CN112614116A - 一种用于数字图像的篡改检测方法和系统 - Google Patents

一种用于数字图像的篡改检测方法和系统 Download PDF

Info

Publication number
CN112614116A
CN112614116A CN202011582666.4A CN202011582666A CN112614116A CN 112614116 A CN112614116 A CN 112614116A CN 202011582666 A CN202011582666 A CN 202011582666A CN 112614116 A CN112614116 A CN 112614116A
Authority
CN
China
Prior art keywords
image
tamper detection
compression
ghost
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011582666.4A
Other languages
English (en)
Other versions
CN112614116B (zh
Inventor
晏榕
张光斌
高志鹏
赵建强
杜新胜
张辉极
尤俊生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202011582666.4A priority Critical patent/CN112614116B/zh
Publication of CN112614116A publication Critical patent/CN112614116A/zh
Application granted granted Critical
Publication of CN112614116B publication Critical patent/CN112614116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明给出了一种用于数字图像的篡改检测方法和系统,包括利用第一质量系数q0压缩彩色图像获得第一图像;随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像;分别计算以上图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图;对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型;响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。该方法极大地提高了篡改检测的精确度和检测速度。

Description

一种用于数字图像的篡改检测方法和系统
技术领域
本发明涉及图像检测的技术领域,尤其是一种用于数字图像的篡改检测方法和系统。
背景技术
JPEG格式图像是最常用的图像文件格式,它是一种有损压缩格式,能够将图像压缩在很小的储存空间,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现丰富生动的图像。JPEG格式的应用非常广泛,目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
同时图像编辑技术的进步使得人们可以制作出更加逼真且肉眼难以分辨的合成图像,这也给不法分子的违法犯罪行为提供了手段,因此对数字图像的伪造检测具有重要意义。
数字图像篡改检测方法通常分为事先在原始图像中插入标识性数据信息的主动取证技术和检测图像内部特征的被动盲取证技术,主动方法具有局限性,而盲算法应用更广泛。然而由于压缩削弱了图像篡改的伪造痕迹,目前一些被动盲取证方法例如基于DCT伪造篡改检测算法,SIFT检测算法,基于重采样痕迹检测算法等等对于低质量JPEG图像的篡改检测效果不佳。而基于二次压缩痕迹的检测可以利用被篡改的JPEG图像重新保存为JPEG格式留下的二次压缩痕迹来检测篡改,所以这种基于格式的伪造检测方法可以一定程度上解决对于低质量JPEG图像的篡改检测效果不佳的问题。
现有技术中对图像篡改检测一般存在以下几种方式:通过估计JPEG图像的原始量化步长的方法检测是否经过了二次压缩;通过分析二次JPEG压缩对离散余弦变换(DCT系数)产生的影响判断是否经过二次压缩;提出了一种基于Benford定律的所有非零和零AC模型的二次压缩检测,但目前的基于二次压缩的伪造检测方法存在误检较多,速度较慢的问题。
发明内容
为了解决现有技术中图像篡改检测中存在的误检多、需要人工检测和速度慢的技术问题,本发明提出了一种用于数字图像的篡改检测方法和系统,利用JPEGGhost特征,自动检测图像篡改区域,并提高算法的准确度。
根据本发明的一个方面,提出了一种用于数字图像的篡改检测方法,包括:
S1:利用第一质量系数q0压缩彩色图像获得第一图像;
S2:随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;
S3:利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像;
S4:分别计算第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图;
S5:对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型;以及
S6:利用模型进行数字图像的篡改检测,响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。
在一些具体的实施例中,第一质量系数q0=q1-δ,δ∈{5,10,15},第二质量系数q1取自50-95的范围内。
在一些具体的实施例中,步骤S4中差分图像的计算方式为:
Figure BDA0002866251990000021
其中,I(x,y,c)中c=R,G,B记为图像I(x,y)的每个颜色通道,Iq2(x,y,c)表示质量因子q2重新保存的图片,q2=1,2,…,100是二次压缩块的质量系数,ω=16。
在一些具体的实施例中,步骤S4中归一化获得残影图的方式具体为:
Figure BDA0002866251990000022
其中,δ(q2)表示差分图像,δ(q2)(x,y)表示差分图像上的坐标点,
Figure BDA0002866251990000023
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最小值,
Figure BDA0002866251990000024
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最大值。
在一些具体的实施例中,步骤S5中的特征是基于质量系数q2遍历不同值获得的差值d(q2)的均值生成差值曲线c(x)。
在一些具体的实施例中,特征具体包括:
差值曲线c(x)的加权平均值
Figure BDA0002866251990000025
其中w1(x)=xq1,w2(x)=1-w1(x),w1(x)表示更关注高JPEG品质的加权函数,w2(x)表示更关注低JPEG品质的加权函数;
0≤x≤q1时,所有c(x)的中位数f2=u1/2
Figure BDA0002866251990000026
其中p(c(x)≤x)表示c(x)的累积分布函数,lc(x)=0.5;
0≤x≤q1时回归线通过c(x)的斜率f3
0≤x≤q1时回归线通过c(x)的斜率f4
c(x)<t=0.5时的加权点数
Figure BDA0002866251990000031
g5(x)=1。
曲线与线性函数:l(x)=1-x/q1
Figure BDA0002866251990000032
之间的平均平方距离,当l(x)>c(x)时,g6(x)=(l(x)-c(x))2,否则g6(x)=0。
在一些具体的实施例中,特征还包括利用高斯混合模型的最大期望对残影图中的每个像素点值进行聚类,将像素分为ghost区域和非ghost区域,计算ghost区域和非ghost区域的像素点之间的一维Bhattacharyya距离
Figure BDA0002866251990000033
其中μ0,μ1
Figure BDA0002866251990000034
Figure BDA0002866251990000035
分别是ghost区域和非ghost区域像素点的均值和方差。
在一些具体的实施例中,采用Adaboost模型进行特征的分类训练,分块根据特征值单独分类。采用Aadboost算法系统可以具有较高的检测速率,且不易出现过适应现象。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
根据本申请的第三方面,提出了一种用于数字图像的篡改检测系统,系统包括:
图像压缩单元:利用第一质量系数q0压缩彩色图像获得第一图像;随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像;
图像计算单元:分别计算第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图;
特征训练单元:对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型;
判断单元:利用模型进行数字图像的篡改检测,响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。
在一些具体的实施例中,第一质量系数q0=q1-δ,δ∈{5,10,15},第二质量系数q1取自50-95的范围内。
在一些具体的实施例中,差分图像的计算方式为:
Figure BDA0002866251990000036
残影图的方式具体为:
Figure BDA0002866251990000041
其中,I(x,y,c)中c=R,G,B记为图像I(x,y)的每个颜色通道,
Figure BDA0002866251990000042
表示质量因子q2重新保存的图片,q2=1,2,…,100是二次压缩块的质量系数,ω=16;δ(q2)表示差分图像,δ(q2)(x,y)表示差分图像上的坐标点,
Figure BDA0002866251990000043
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最小值,
Figure BDA0002866251990000044
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最大值。
在一些具体的实施例中,特征是基于质量系数q2遍历不同值获得的差值d(q2)的均值生成差值曲线c(x),且特征包括:
差值曲线c(x)的加权平均值
Figure BDA0002866251990000045
其中w1(x)=xq1,w2(x)=1-w1(x),w1(x)表示更关注高JPEG品质的加权函数,w2(x)表示更关注低JPEG品质的加权函数;
0≤x≤q1时,所有c(x)的中位数f2=u1/2
Figure BDA0002866251990000046
其中p(c(x)≤x)表示c(x)的累积分布函数,lc(x)=0.5;
0≤x≤q1时回归线通过c(x)的斜率f3
0≤x≤q1时回归线通过c(x)的斜率f4
c(x)<t=0.5时的加权点数
Figure BDA0002866251990000047
g5(x)=1。
曲线与线性函数:l(x)=1-x/q1
Figure BDA0002866251990000048
之间的平均平方距离,当l(x)>c(x)时,g6(x)=(l(x)-c(x))2,否则g6(x)=0。
在一些具体的实施例中,特征还包括利用高斯混合模型的最大期望对残影图中的每个像素点值进行聚类,将像素分为ghost区域和非ghost区域,计算ghost区域和非ghost区域的像素点之间的一维Bhattacharyya距离
Figure BDA0002866251990000049
其中μ0,μ1
Figure BDA00028662519900000410
Figure BDA00028662519900000411
分别是ghost区域和非ghost区域像素点的均值和方差。
在一些具体的实施例中,采用Adaboost模型进行特征的分类训练,分块根据特征值单独分类。采用Aadboost算法系统可以具有较高的检测速率,且不易出现过适应现象。
本发明提出了一种用于数字图像的篡改检测方法和系统,该方法通过对原始图像的多种压缩处理计算获得的残影图进行分块并提取相应特征,基于分块特征值单独分类,并识别分块的一次压缩或二次压缩属性,最终通过一次压缩和二次压缩的最终占比情况判断图像是否被篡改。根据伪造区域和未伪造区域篡改图像保存时的质量因子不同有效地检测图像上的伪造区域,解决了现有基于JPEGhost方法缺乏自动化需要人工判断非常耗时,提高了篡改检测的精确度,对图像进行异图拼接篡改检测上表现效果很好。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例的JPEG Ghost方法原理示意图;
图2是本申请的一个实施例的用于数字图像的篡改检测方法流程图;
图3是本申请的一个具体的实施例的用于数字图像的篡改检测方法流程图;
图4是本申请的一个具体的实施例的差值曲线示意图;
图5是本申请的一个实施例的用于数字图像的篡改检测系统的框架图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个实施例的用于数字图像的篡改检测方法,图1示出了根据本申请的实施例的JPEG Ghost方法原理示意。图像的第一次压缩来自相机内部,假设图片A这部分的压缩质量因子为q0,二次压缩来自于后期图像编辑工具。图像B上的区域剪切后通过缩放等操作拼接到图像A中,这个过程图像B经过了质量因子q′0的压缩,拼接的伪造图片以质量因子q1保存成图像Iq1。图像Iq1中来自图像A的区域质量系数为q0q1,来自图像B的区域为q′0q1。为了检测这个伪造区域,我们定义一组质量因子Q={q2|0<q2<q1},并以这个质量系数再次压缩图像Iq1,得到图像Iq2。定义图像Iq2的差值图像Dq2为:
Figure BDA0002866251990000061
当q2接近q0时,其差值图像的伪造部分由于RGB值接近或等于0,更接近黑色,将看起来比剩下的图像更暗,利用这一条件,可以完成对图片是否是拼接伪造的识别,具体流程图如图1所示。由上述原理可以看到JPEG Ghost存在以下问题:观察残影图的过程需要人工判断,而人工检测JPEG图像上的Ghost痕迹是非常耗时的。
继续参考图2,图2示出了本申请的一个实施例的用于数字图像的篡改检测方法流程图,如图2所示,该方法包括:
S201:利用第一质量系数q0压缩彩色图像获得第一图像。
S202:随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像。
S203:利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像。
在具体的实施例中,使用未压缩彩色图像数据集进行训练,对每张尺寸为m*n的图像I做如上述处理:进行一次压缩,压缩的质量系数为q0,得到第一图像I′;随机选择图像上w*w的部分以质量系数q0一次压缩q1二次压缩,其中w<min(m,n),该部分以外的区域以质量系数q0进行一次压缩,得到第二图像I″。二次压缩系数q1随机从[50,95]进行取值,一次压缩系数q0=q1-δ,δ∈{5,10,15}。与S202中的步骤相反,随机选择图像上w*w的部分以质量系数q0进行一次压缩,该区域以外部分以质量系数q0一次压缩q1二次压缩得到第三图像I″′。上述步骤中,按以上步骤得到第一图像I′属于0类(即真实图片类),第二图像I″和第三图像I″′属于1类(即伪造图片类)。
S204:分别计算第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图。
在具体的实施例中,分别计算第一图像I′、第二图像I″和第三图像I″′经过平滑处理的差分图像,后文中用I(x,y)代表I′,I″和I″′,差分图像的计算方式如下:
Figure BDA0002866251990000062
其中I(x,y,c)中c=R,G,B记为图像I(x,y)的每个颜色通道,Iq2(x,y,c)表示质量因子q2重新保存的图片,其中q2=1,2,…,100是二次压缩块的质量系数,我们使用ω=16。通过平滑处理的差分图像的计算可以保证纹理的鲁棒性。
在具体的实施例中,根据计算的平滑差分图像通过归一化得到对应图像的残影图,具体方式如下:
Figure BDA0002866251990000071
其中δ(q2)表示Step2中的差分图像,δ(q2)(x,y)表示差分图像上的坐标点,
Figure BDA0002866251990000072
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最小值,
Figure BDA0002866251990000073
表示遍历q2=1,2,…,100后δ(q2)(x,y)的最大值。
S205:对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型。
在具体的实施例中,将上述步骤中得到的残影图进行零填充,便于其能够按ω*ω进行分块,接下来对每个小块做特征提取,提取的特征是基于质量系数q2遍历不同值时得到的差值d(q2)的均值,由该值可以得到差值曲线c(x),记c(x)是质量因子等级为x的差值曲线,该差值曲线如图4所示。
在具体的实施例中,提取的特征包括:
(1)c(x)的加权平均值:
Figure BDA0002866251990000074
其中w1(x)=xq1,w2(x)=1-w1(x),w1(x)表示更关注高JPEG品质的加权函数,w2(x)表示更关注低JPEG品质的加权函数。
(2)0≤x≤q1时,所有c(x)的中位数,也即f2=u1/2
Figure BDA0002866251990000075
Figure BDA0002866251990000076
其中p(c(x)≤x)表示c(x)的累积分布函数,lc(x)=0.5。
(3)f3为0≤x≤q1时回归线通过c(x)的斜率。
(4)f4是0≤x≤q1时回归线通过c(x)的斜率。
(5)f5是c(x)<t=0.5时的加权点数,
Figure BDA0002866251990000077
Figure BDA0002866251990000078
g5(x)=1;否则g5(x)=0。
(6)曲线与线性函数:l(x)=1-x/q1
Figure BDA0002866251990000079
之间的平均平方距离。
当l(x)>c(x)时,g6(x)=(l(x)-c(x))2,否则g6(x)=0。
(7)根据残影图中每个像素点的值用高斯混合模型(GMM)的最大期望(EM)进行聚类,聚类的方式如下:选择簇的数量为2,一类簇标签记为0,一类记为1,随机初始化每个簇的高斯分布参数(均值和方差);给定每个簇的高斯分布,计算每个数据点属于每个簇的概率,一个点越靠近高斯分布的中心就越可能属于该簇;基于这些改了计算高斯分布参数使得数据点的概率最大化,可以使用数据点概率的加权来计算这些新的参数,其中权重就是数据点属于该簇的概率;重复迭代直到迭代中的变化不大。通过以上的聚类方式将像素分为两类(0类认为ghoest区域的像素点,1类是其余区域像素点),该方法的输出是二进制索引图像Y(x,y),每个像素被标记为0类(Ghost区)和1类(图像其余部分)。)得到的0类像素点和1类像素点之间的一维Bhattacharyya距离计算:
Figure BDA0002866251990000081
Figure BDA0002866251990000082
其中μ0,μ1
Figure BDA0002866251990000083
分别是0类和1类的均值和方差,将得到的一维Bhattacharyya距离作为第7维特征。
在具体的实施例中,采用Adaboost模型进行模型的训练,最后将训练好的模型进行预测,每个块都是根据其特征值单独分类的,Adaboost对每个块是否是一次压缩和二次压缩进行识别,最终可以得到一张图像一次压缩和二次压缩的占比。采用Aadboost算法系统具有较高的检测速率,且不易出现过适应现象。
S206:利用模型进行数字图像的篡改检测,响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。上述方法能根据伪造区域和未伪造区域篡改图像保存时的质量系数不同有效地检测图像上的伪造区域。解决了现有的一些基于JPEGhost方法需要人工识别判断缺乏自动化,提高了试用范围,提高了篡改检测的精确度,对图像进行异图拼接篡改检测上表现效果很好。
图3示出了本申请的一个具体的实施例的用于数字图像的篡改检测方法流程图,如图3所示,原始无压缩图像经过单压缩、二次压缩的三种组合方式的处理后通过Gohst分别对应处理为相应的残影图,并分别对残影图进行分块,提取各分块的特征输入模型中训练获得最终的模型。在判断图像是否被篡改或伪造时,输入待判定的图像,按上述方法步骤进行Ghost处理形成残影图,分块后输入最终模型中进行预测,通过预测分块后的以此压缩和二次压缩占比与预设阈值之间的大小关系,可以轻易的判断出图像是否被篡改或伪造。
继续参考图5,图5示出了根据本发明的实施例的用于数字图像的篡改检测系统的框架图。该系统具体包括图像压缩单元501、图像计算单元502、特征训练单元503和判断单元504。
在具体的实施例中,图像压缩单元501配置用于利用第一质量系数q0压缩彩色图像获得第一图像;随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像;图像计算单元502配置用于分别计算第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图;特征训练单元503配置用于对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型;判断单元504配置用于利用模型进行数字图像的篡改检测,响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:利用第一质量系数q0压缩彩色图像获得第一图像;随机选取第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;利用第二质量系数q1压缩彩色图像,并随机选取压缩后的图像中的区域以第一质量系数q0进行二次压缩获得第三图像;分别计算第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将差分图像归一化获得对应的残影图;对残影图进行分块,提取分块的特征,并按特征进行分类训练,识别分块属于一次压缩或二次压缩,获得预测数字图像的一次压缩和二次压缩占比模型;利用模型进行数字图像的篡改检测,响应于数字图像的一次压缩和二次压缩占比大于预设阈值,数字图像被篡改。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (15)

1.一种用于数字图像的篡改检测方法,其特征在于,包括:
S1:利用第一质量系数q0压缩彩色图像获得第一图像;
S2:随机选取所述第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;
S3:利用所述第二质量系数q1压缩所述彩色图像,并随机选取压缩后的图像中的区域以所述第一质量系数q0进行二次压缩获得第三图像;
S4:分别计算所述第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将所述差分图像归一化获得对应的残影图;
S5:对所述残影图进行分块,提取所述分块的特征,并按所述特征进行分类训练,识别所述分块属于一次压缩或二次压缩,获得预测所述数字图像的一次压缩和二次压缩占比模型;以及
S6:利用所述模型进行所述数字图像的篡改检测,响应于所述数字图像的一次压缩和二次压缩占比大于预设阈值,所述数字图像被篡改。
2.根据权利要求1所述的用于数字图像的篡改检测方法,其特征在于,所述第一质量系数q0=q1-δ,δ∈{5,10,15},第二质量系数q1取自50-95的范围内。
3.根据权利要求1所述的用于数字图像的篡改检测方法,其特征在于,所述步骤S4中差分图像的计算方式为:
Figure FDA0002866251980000011
其中,I(x,y,c)中c=R,G,B记为图像I(x,y)的每个颜色通道,
Figure FDA0002866251980000012
表示质量因子q2重新保存的图片,q2=1,2,…,100是二次压缩块的质量系数,ω=16。
4.根据权利要求3所述的用于数字图像的篡改检测方法,其特征在于,所述步骤S4中归一化获得所述残影图的方式具体为:
Figure FDA0002866251980000013
其中,δ(q2)表示差分图像,δ(q2)(x,y)表示差分图像上的坐标点,
Figure FDA0002866251980000014
表示遍历q2=1,2,...,100后δ(q2)(x,y)的最小值,
Figure FDA0002866251980000015
表示遍历q2=1,2,...,100后δ(q2)(x,y)的最大值。
5.根据权利要求3所述的用于数字图像的篡改检测方法,其特征在于,所述步骤S5中的所述特征是基于质量系数q2遍历不同值获得的差值d(q2)的均值生成差值曲线c(x)。
6.根据权利要求5所述的用于数字图像的篡改检测方法,其特征在于,所述特征具体包括:
所述差值曲线c(x)的加权平均值
Figure FDA0002866251980000021
其中w1(x)=xq1,w2(x)=1-w1(x),w1(x)表示更关注高JPEG品质的加权函数,w2(x)表示更关注低JPEG品质的加权函数;
0≤x≤q1时,所有c(x)的中位数
Figure FDA0002866251980000022
其中p(c(x)≤x)表示c(x)的累积分布函数,lc(x)=0.5;
0≤x≤q1时回归线通过c(x)的斜率f3
0≤x≤q1时回归线通过c(x)的斜率f4
c(x)<t=0.5时的加权点数
Figure FDA0002866251980000023
g5(x)=1。
曲线与线性函数:l(x)=1-x/q1
Figure FDA0002866251980000024
之间的平均平方距离,当l(x)>c(x)时,g6(x)=(l(x)-c(x))2,否则g6(x)=0。
7.根据权利要求1或6所述的用于数字图像的篡改检测方法,其特征在于,所述特征还包括利用高斯混合模型的最大期望对所述残影图中的每个像素点值进行聚类,将像素分为ghost区域和非ghost区域,计算所述ghost区域和所述非ghost区域的像素点之间的一维Bhattacharyya距离
Figure FDA0002866251980000025
其中μ0,μ1
Figure FDA0002866251980000026
分别是所述ghost区域和所述非ghost区域像素点的均值和方差。
8.根据权利要求1所述的用于数字图像的篡改检测方法,其特征在于,采用Adaboost模型进行所述特征的分类训练,所述分块根据所述特征值单独分类。
9.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至8中任一项所述的方法。
10.一种用于数字图像的篡改检测系统,其特征在于,所述系统包括:
图像压缩单元:利用第一质量系数q0压缩彩色图像获得第一图像;随机选取所述第一图像中的区域以第二质量系数q1进行二次压缩获得第二图像;利用所述第二质量系数q1压缩所述彩色图像,并随机选取压缩后的图像中的区域以所述第一质量系数q0进行二次压缩获得第三图像;
图像计算单元:分别计算所述第一图像、第二图像和第三图像经过平滑处理的差分图像,并分别将所述差分图像归一化获得对应的残影图;
特征训练单元:对所述残影图进行分块,提取所述分块的特征,并按所述特征进行分类训练,识别所述分块属于一次压缩或二次压缩,获得预测所述数字图像的一次压缩和二次压缩占比模型:
判断单元:利用所述模型进行所述数字图像的篡改检测,响应于所述数字图像的一次压缩和二次压缩占比大于预设阈值,所述数字图像被篡改。
11.根据权利要求10所述的用于数字图像的篡改检测系统,其特征在于,所述第一质量系数q0=q1-δ,δ∈{5,10,15},第二质量系数q1取自50-95的范围内。
12.根据权利要求10所述的用于数字图像的篡改检测系统,其特征在于,所述差分图像的计算方式为:
Figure FDA0002866251980000031
所述残影图的方式具体为:
Figure FDA0002866251980000032
其中,I(x,y,c)中c=R,G,B记为图像I(x,y)的每个颜色通道,
Figure FDA0002866251980000033
表示质量因子q2重新保存的图片,q2=1,2,…,100是二次压缩块的质量系数,ω=16;δ(q2)表示差分图像,δ(q2)(x,y)表示差分图像上的坐标点,
Figure FDA0002866251980000034
表示遍历q2=1,2,...,100后δ(q2)(x,y)的最小值,
Figure FDA0002866251980000035
表示遍历q2=1,2,...,100后δ(q2)(x,y)的最大值。
13.根据权利要求12所述的用于数字图像的篡改检测系统,其特征在于,所述特征是基于质量系数q2遍历不同值获得的差值d(q2)的均值生成差值曲线c(x),且所述特征包括:
所述差值曲线c(x)的加权平均值
Figure FDA0002866251980000036
其中w1(x)=xq1,w2(x)=1-w1(x),w1(x)表示更关注高JPEG品质的加权函数,w2(x)表示更关注低JPEG品质的加权函数;
0≤x≤q1时,所有c(x)的中位数
Figure FDA0002866251980000037
其中p(c(x)≤x)表示c(x)的累积分布函数,lc(x)=0.5;
0≤x≤q1时回归线通过c(x)的斜率f3
0≤x≤q1时回归线通过c(x)的斜率f4
c(x)<t=0.5时的加权点数
Figure FDA0002866251980000041
g5(x)=1。
曲线与线性函数:l(x)=1-x/q1
Figure FDA0002866251980000042
之间的平均平方距离,当l(x)>c(x)时,g6(x)=(l(x)-c(x))2,否则g6(x)=0。
14.根据权利要求13所述的用于数字图像的篡改检测系统,其特征在于,所述特征还包括利用高斯混合模型的最大期望对所述残影图中的每个像素点值进行聚类,将像素分为ghost区域和非ghost区域,计算所述ghost区域和所述非ghost区域的像素点之间的一维Bhattacharyya距离
Figure FDA0002866251980000043
其中μ0,μ1
Figure FDA0002866251980000044
分别是所述ghost区域和所述非ghost区域像素点的均值和方差。
15.根据权利要求10所述的用于数字图像的篡改检测系统,其特征在于,采用Adaboost模型进行所述特征的分类训练,所述分块根据所述特征值单独分类。
CN202011582666.4A 2020-12-28 2020-12-28 一种用于数字图像的篡改检测方法和系统 Active CN112614116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011582666.4A CN112614116B (zh) 2020-12-28 2020-12-28 一种用于数字图像的篡改检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011582666.4A CN112614116B (zh) 2020-12-28 2020-12-28 一种用于数字图像的篡改检测方法和系统

Publications (2)

Publication Number Publication Date
CN112614116A true CN112614116A (zh) 2021-04-06
CN112614116B CN112614116B (zh) 2022-06-28

Family

ID=75248593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011582666.4A Active CN112614116B (zh) 2020-12-28 2020-12-28 一种用于数字图像的篡改检测方法和系统

Country Status (1)

Country Link
CN (1) CN112614116B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521606A (zh) * 2011-11-29 2012-06-27 中南大学 一种对jpeg图像的像素块分类方法及基于此的图像篡改检测和被篡改区域定位方法
US20160132985A1 (en) * 2014-06-10 2016-05-12 Sam Houston State University Rich feature mining to combat anti-forensics and detect jpeg down-recompression and inpainting forgery on the same quantization
CN106228557A (zh) * 2016-07-26 2016-12-14 浙江捷尚视觉科技股份有限公司 基于二次jpeg压缩的图像篡改区域检测方法
CN108537762A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于深度多尺度网络的二次jpeg压缩图像取证方法
CN111754380A (zh) * 2020-06-28 2020-10-09 苏州科达科技股份有限公司 图像篡改区域的定位方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521606A (zh) * 2011-11-29 2012-06-27 中南大学 一种对jpeg图像的像素块分类方法及基于此的图像篡改检测和被篡改区域定位方法
US20160132985A1 (en) * 2014-06-10 2016-05-12 Sam Houston State University Rich feature mining to combat anti-forensics and detect jpeg down-recompression and inpainting forgery on the same quantization
CN106228557A (zh) * 2016-07-26 2016-12-14 浙江捷尚视觉科技股份有限公司 基于二次jpeg压缩的图像篡改区域检测方法
CN108537762A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于深度多尺度网络的二次jpeg压缩图像取证方法
CN111754380A (zh) * 2020-06-28 2020-10-09 苏州科达科技股份有限公司 图像篡改区域的定位方法、装置及存储介质

Also Published As

Publication number Publication date
CN112614116B (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
CN115861135B (zh) 一种应用于箱体全景探测的图像增强及识别方法
CN109151501B (zh) 一种视频关键帧提取方法、装置、终端设备及存储介质
WO2021139324A1 (zh) 图像识别方法、装置、计算机可读存储介质及电子设备
Fadl et al. Exposing video inter-frame forgery via histogram of oriented gradients and motion energy image
CN110826429A (zh) 一种基于景区视频的旅游突发事件自动监测的方法及系统
CN110457996B (zh) 基于vgg-11卷积神经网络的视频运动对象篡改取证方法
Tao et al. Smoke vehicle detection based on multi-feature fusion and hidden Markov model
CN114169381A (zh) 图像标注方法、装置、终端设备及存储介质
CN111415336A (zh) 一种图像篡改识别方法、装置、服务器及存储介质
Tang et al. Improving cloud type classification of ground-based images using region covariance descriptors
Siddiqi et al. Image Splicing‐Based Forgery Detection Using Discrete Wavelet Transform and Edge Weighted Local Binary Patterns
Rhee Detection of spliced image forensics using texture analysis of median filter residual
Liao et al. First step towards parameters estimation of image operator chain
CN115392937A (zh) 一种用户欺诈风险识别方法、装置、电子设备及存储介质
CN112906671B (zh) 面审虚假图片识别方法、装置、电子设备及存储介质
Tripathi et al. Image splicing detection system using intensity-level multi-fractal dimension feature engineering and twin support vector machine based classifier
CN114155363A (zh) 换流站车辆识别方法、装置、计算机设备和存储介质
CN108269221B (zh) 一种jpeg重压缩图像篡改定位方法
CN110930287B (zh) 一种图像隐写检测方法、装置及计算机设备、存储介质
Dhar et al. Interval type-2 fuzzy set and human vision based multi-scale geometric analysis for text-graphics segmentation
CN112614116B (zh) 一种用于数字图像的篡改检测方法和系统
Wan et al. Statistical multiscale image segmentation via alpha-stable modeling
CN112052863B (zh) 一种图像检测方法及装置、计算机存储介质、电子设备
CN114445788A (zh) 车辆停放检测方法、装置、终端设备和可读存储介质
CN111986176A (zh) 一种裂纹图像识别方法、系统、终端及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant