CN104661037A - 压缩图像量化表篡改的检测方法和系统 - Google Patents

压缩图像量化表篡改的检测方法和系统 Download PDF

Info

Publication number
CN104661037A
CN104661037A CN201310583368.0A CN201310583368A CN104661037A CN 104661037 A CN104661037 A CN 104661037A CN 201310583368 A CN201310583368 A CN 201310583368A CN 104661037 A CN104661037 A CN 104661037A
Authority
CN
China
Prior art keywords
quantization table
image
quantization
frequency
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310583368.0A
Other languages
English (en)
Other versions
CN104661037B (zh
Inventor
王维语
杨建权
朱国普
黄晓霞
赵希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201310583368.0A priority Critical patent/CN104661037B/zh
Publication of CN104661037A publication Critical patent/CN104661037A/zh
Application granted granted Critical
Publication of CN104661037B publication Critical patent/CN104661037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本发明涉及一种压缩图像量化表篡改的检测方法和系统。该压缩图像量化表篡改的检测方法,包括以下步骤:图像获取步骤,获取测试图像;特征提取步骤,计算所述测试图像的区分性特征向量;量化表提取步骤,提取所述测试图像的量化表;检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。上述压缩图像量化表篡改的检测方法和系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。

Description

压缩图像量化表篡改的检测方法和系统
技术领域
本发明涉及多媒体信息安全领域,特别是涉及一种压缩图像量化表篡改的检测方法和系统。
背景技术
多媒体技术在手持数码设备上的广泛应用持续改变着人们已往以语音为主的通信方式。随着各类图片发布、分享平台功能的完善和用户的增加,图像通信逐渐成为人们所接收的通信方式,主要是因为图像中包含事件的细节,便于发布者更好的表达其观点,且相对于纯文字或纯语音消息更具有说服力和感染力。
然而,图像包含的信息可能被篡改或隐含秘密信息,例如图像可能被恶意篡改用于造谣,或作为载体传递非法信息,给图像的取证分析带来困难,而无法检测图像是否被篡改。
发明内容
基于此,有必要针对无法检测图像是否被篡改的问题,提供一种能准确检测图像是否被篡改的压缩图像量化表篡改的检测方法。
此外,还有必要提供一种能准确检测图像是否被篡改的压缩图像量化表篡改的检测系统。
一种压缩图像量化表篡改的检测方法,包括以下步骤:
图像获取步骤,获取测试图像;
特征提取步骤,计算所述测试图像的区分性特征向量;
量化表提取步骤,提取所述测试图像的量化表;
检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
一种压缩图像量化表篡改的检测系统,包括:
图像获取模块,用于获取测试图像;
特征提取模块,用于计算所述测试图像的区分性特征向量;
量化表提取模块,用于提取所述测试图像的量化表;
检测模块,用于采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
上述压缩图像量化表篡改的检测方法和系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
另外,通过第一标记和第二标记容易标记判断,提高检测效率;采用总邻域系数幅值和的比重,计算量少。
附图说明
图1为一个实施例中压缩图像量化表篡改的检测方法的流程图;
图2为一个实施例中特征提取步骤的流程图;
图3为另一个实施例中特征提取步骤的流程图;
图4为预先训练构建量化表篡改检测分类器的流程图;
图5为一个实施例中压缩图像量化表篡改的检测系统的结构框图;
图6为一个实施例中特征提取模块的内部结构框图;
图7为另一个实施例中特征提取模块的内部结构框图;
图8为一个实施例中构建模块的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,为一个实施例中压缩图像量化表篡改的检测方法的流程图。该压缩图像量化表篡改的检测方法,包括以下步骤:
步骤102,图像获取步骤,获取测试图像。
具体的,该测试图像可为JPEG(Joint Photographic Experts Group)图像。JPEG是一种有损压缩标准。
步骤104,特征提取步骤,计算该测试图像的区分性特征向量。
具体的,该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。
计算得到测试图像的区分性特征向量Fdet
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,如图2所示,为一个实施例中特征提取步骤的流程图。该特征提取步骤包括:
步骤202,读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
该图像可为JPEG图像等。本实施例中图像为JPEG图像。JPEG图像压缩是基于分块的图像压缩,对于RGB(Red-Green-Blue)彩色图像,需把像素从RGB彩色空间映射到YCbCr空间(Y为亮度分量,Cb、Cr为色差分量),再对Y、Cb、Cr通道独立进行压缩操作。
JPEG压缩时,首先将输入图像的亮度值矩阵分割成连续不重叠的8×8像素小块,并对每一个小块进行离散余弦变换(Discrete Cosine Transform,DCT),得到8×8的实数型DCT系数。然后根据一个8×8的量化表(量化表中的每个数据项是一个正整数,表示相应DCT频率系数的量化步长)对实数型的DCT系数依次进行量化、取整,得到整型的量化DCT系数。最后将所得的量化DCT系数进行哈夫曼(Huffman,一种熵编码)编码后形成字节流,并依照JPEG标准定义的规则与压缩参数(量化表,哈夫曼码表等)一同写成JPEG文件。对图像的8×8分块DCT变换会产生64个频率分量,其中1个直流(Direct Current,DC)分量,63个交流(Alternating Current,AC)分量。
JPEG解压缩时,首先从JPEG头文件读取量化表并对文件内字节流进行解码,得到量化DCT系数矩阵。然后根据量化表,依次对量化DCT系数进行反量化、反离散余弦变换(Inverse Discrete Cosine Transform,IDCT)、并取整、截断后,还原出亮度值矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
步骤204,计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
步骤206,计算总频率的系数幅值之和。
计算总频率的系数幅值之和S的计算公式可为:
S = Σ i = 1 8 Σ j = 1 8 K ( i , j ) - - - ( 4 )
步骤208,采用该总频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
F = 1 S × [ K ( 1,1 ) , K ( 1,2 ) , · · · , K ( i , j ) , · · · , K ( 8,8 ) ] , i , j = 1,2,3,4,5,6,7,8 - - - ( 5 )
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。Zig-zag为量化系数的Z行排序。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。如图3所示,为一个实施例中特征提取步骤的流程图。该特征提取步骤包括:
步骤302,读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
步骤304,计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
步骤306,计算总邻域频率系数幅值之和。
计算总邻域频率系数幅值之和S的计算公式可为:
S r ( i , j ) = Σ i - r i + r Σ j - r j + r K ( i , j ) i - r ≥ 1 , j - r ≥ 1 , i + r ≤ 8 , j + r ≤ 8 - - - ( 6 )
其中,r为(i,j)值附近正方邻域的边长,可调节。
步骤308,采用该总邻域频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
F r = [ K ( 1,1 ) S r ( 1,1 ) , K ( 1,2 ) S r ( 1,2 ) , . . . , K ( i , j ) S r ( i , j ) , . . . , K ( 8.8 ) S r ( 8.8 ) ] i , j = 1,2,3,4,5,6,7,8 - - - ( 7 )
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。
步骤106,量化表提取步骤,提取该测试图像的量化表。
具体的,从测试图像的文件头提取测试图像的量化表Qdet。JPEG图像的文件头数据包括量化表、霍夫曼编码、缩略图和EXIF信息等。
步骤108,检测步骤,采用对应于该测试图像的量化表的预先训练得到的量化表篡改检测分类器对该区分性特征向量进行检测,得到检测结果。
具体的,采用对应于测试图像的量化表Qdet的预先训练得到的量化表篡改检测分类器,对Fdet进行检测,得到对应的类别标记,根据该类别标记即可确定该测试图像的量化表是否被篡改,例如量化表篡改检测分类器预先得到的标记为“1”,表示未被篡改,得到的标记为“-1”,表示被篡改。
上述压缩图像量化表篡改的检测方法,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
如图4所示,在一个实施例中,上述压缩图像量化表篡改的检测方法,还包括:
预先训练构建量化表篡改检测分类器,包括:
步骤402,图像集获取步骤,获取未压缩的图像构成的图像集。
具体的,收集未经压缩的图像作为产生正负样本的图像素材,并将收集的图像构成图像集W。
步骤404,正样本图像获取步骤,获取测试图像的量化表,并采用该量化表对该图像集中的每幅图像进行压缩,得到正样本图像。
具体的,获取测试图像的量化表Qdet。使用Qdet对图像集W中的每幅图像进行JPEG压缩,得到正样本图像。
步骤406,负样本图像获取步骤,对该测试图像的量化表随机修改,得到修改后的量化表,采用该修改后的量化表对该图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像。
具体的,随机对测试图像的量化表Qdet中的某些步长值进行修改,得到量化表Qalt。使用Qalt对图像集W中的每幅图像进行JPEG压缩,并将得到的JPEG图像的量化表Qalt篡改成Qdet,得到负样本图像。
步骤408,样本特征提取步骤,计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记。
具体的,采用如步骤202至208或者,步骤302至308的方式分别计算正样本图像和负样本图像的区分性特征向量。步骤408计算区分性特征向量的方式与步骤104中计算测试图像的区分性特征向量的方式应保持一致。本实施例中,第一标记为“1”,第二标记为“-1”,在其他实施例中,第一标记和第二标记也可采用其他数字、符号等表示。
步骤410,篡改检测分类器构建步骤,根据该正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
该预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;该支持向量机分类器采用的核函数可为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
支持向量机(Support Vector Machine,SVM)技术是广泛使用的一种监督式机器学习技术,可用于对输入的特征向量进行分类。该技术涉及机器学习领域的大量数学理论,为方便非机器学习领域的研究者使用SVM,提供了开源的现成软件包。其中使用最为广泛的是libSVM,且具有多种语言版本。在使用SVM预测新样本类别前,需要用SVM对已有样本进行训练,使之具有特定分类问题的预测能力,这一过程称为SVM分类器的训练,具体过程是:首先提取具有区分性的特征向量,然后标记特征向量所属类别(如第一类标记为1,第二类标记为-1,如此类推),最后将特征向量和类别标记作为参数输入至LibSVM提供的接口函数svmtrain得到SVM模型文件(即SVM分类器)。
SVM分类器训练完成后,可对新样本的类别进行预测。具体过程是:首先提取新样本的特征向量,然后将该特征向量和上述得到的SVM模型输入至libsvm提供的接口函数svmpredict,即可得到新样本的所属的类别标记。
如图5所示,为一个实施例中压缩图像量化表篡改的检测系统的结构框图。该压缩图像量化表篡改的检测系统,包括图像获取模块520、特征提取模块540、量化表提取模块560和检测模块580。其中:
图像获取模块520用于获取测试图像。
特征提取模块540用于计算该测试图像的区分性特征向量。
具体的,该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。计算得到测试图像的区分性特征向量Fdet。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,如图6所示,在一个实施例中,该特征提取模块540包括第一反量化单元542、第一单个系数幅值计算单元544、总系数幅值计算单元546和第一特征向量计算单元548。其中:
第一反量化单元542用于读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
第一单个系数幅值计算单元544用于计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
总系数幅值计算单元546用于计算总频率的系数幅值之和。
计算总频率的系数幅值之和S的计算公式可为:
S = Σ i = 1 8 Σ j = 1 8 K ( i , j ) - - - ( 4 )
第一特征向量计算单元548用于采用该总频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
F = 1 S × [ K ( 1,1 ) , K ( 1,2 ) , · · · , K ( i , j ) , · · · , K ( 8,8 ) ] , i , j = 1,2,3,4,5,6,7,8 - - - ( 5 )
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。Zig-zag为量化系数的Z行排序。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重时,如图7所示,在一个实施例中,该特征提取模块包括第二反量化单元541、第二单个系数幅值计算单元543、总邻域系数幅值计算单元545和第二特征向量计算单元547。其中:
第二反量化单元541,用于读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
第二单个系数幅值计算单元543,用于计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
总邻域系数幅值计算单元545,用于计算总邻域频率系数幅值之和。
计算总邻域频率系数幅值之和S的计算公式可为:
S r ( i , j ) = Σ i - r i + r Σ j - r j + r K ( i , j ) i - r ≥ 1 , j - r ≥ 1 , i + r ≤ 8 , j + r ≤ 8 - - - ( 6 )
其中,r为(i,j)值附近正方邻域的边长,可调节。
第二特征向量计算单元547,用于采用该总邻域频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
F r = [ K ( 1,1 ) S r ( 1,1 ) , K ( 1,2 ) S r ( 1,2 ) , . . . , K ( i , j ) S r ( i , j ) , . . . , K ( 8.8 ) S r ( 8.8 ) ] i , j = 1,2,3,4,5,6,7,8 - - - ( 7 )
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。
量化表提取模块560用于提取该测试图像的量化表。
具体的,从测试图像的文件头提取测试图像的量化表Qdet。JPEG图像的文件头数据包括量化表、霍夫曼编码、缩略图和EXIF信息等。
检测模块580用于采用对应于该测试图像的量化表的预先训练得到的量化表篡改检测分类器对该区分性特征向量进行检测,得到检测结果。
具体的,采用对应于测试图像的量化表Qdet的预先训练得到的量化表篡改检测分类器,对Fdet进行检测,得到对应的类别标记,根据该类别标记即可确定该测试图像的量化表是否被篡改,例如量化表篡改检测分类器预先得到的标记为“1”,表示未被篡改,得到的标记为“-1”,表示被篡改。
上述压缩图像量化表篡改的检测系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
在一个实施例中,该压缩图像量化表篡改的检测系统还包括:构建模块,用于预先训练构建量化表篡改检测分类器。
如图8所示,构建模块800包括图像集获取单元810、正样本图像获取单元820、负样本图像获取单元830、样本特征提取单元840和篡改检测分类器构建单元850。
图像集获取单元810用于获取未压缩的图像构成的图像集。具体的,收集未经压缩的图像作为产生正负样本的图像素材,并将收集的图像构成图像集W。
正样本图像获取单元820用于获取测试图像的量化表,并采用该量化表对该图像集中的每幅图像进行压缩,得到正样本图像。
具体的,获取测试图像的量化表Qdet。使用Qdet对图像集W中的每幅图像进行JPEG压缩,得到正样本图像。
负样本图像获取单元830用于对该测试图像的量化表随机修改,得到修改后的量化表,采用该修改后的量化表对该图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像。
具体的,随机对测试图像的量化表Qdet中的某些步长值进行修改,得到量化表Qalt。使用Qalt对图像集W中的每幅图像进行JPEG压缩,并将得到的JPEG图像的量化表Qalt篡改成Qdet,得到负样本图像。
样本特征提取单元840用于计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记。
具体的,采用如步骤202至208或者,步骤302至308的方式分别计算正样本图像和负样本图像的区分性特征向量。步骤408计算区分性特征向量的方式与步骤104中计算测试图像的区分性特征向量的方式应保持一致。本实施例中,第一标记为“1”,第二标记为“-1”,在其他实施例中,第一标记和第二标记也可采用其他数字、符号等表示。
篡改检测分类器构建单元850用于根据该正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
该预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;该支持向量机分类器采用的核函数可为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
下面结合具体的例子说明上述压缩图像量化表篡改的检测方法和系统的检测过程:
(1)实验环境:在实验中,选择的图片库是具有1338幅未经压缩处理彩色图片的UCID(Uncompressed Color Image Database)图片库;JPEG图像的压缩以及篡改操作均在Matlab7.12.0平台上进行。
(2)预处理:在预处理步骤(b)存在对负类样本压缩量化表由Qtable*替换为Qtable的操作,在JPEG压缩体系中,图像的质量分为1~100个级别,每个级别的量化表可用一个质量因子表示,质量因子100对应最高的图像保真度,这时图像质量最高,相应的质量因子1对应最低的图像保真度,图像质量最差,数值越近压缩效果也越相似。具体实验中发现选取压缩质量相差5级的量化表模拟量化,如下表1所示。
表1
Qtable*/Qtable 60/65 70/75 80/85 90/95 65/60 75/70 85/80 95/90
操作某些图像产生了肉眼可以分辨的些许区别。经过分析,这些区别与直流系数的改变存在着一定的关系,因此本实验中仅考虑直流系数不改变的量化表替换情况,如表2所示。
表2
Qtable*/Qtable 59/60 69/70 80/81 90/91 60/59 70/69 81/80 91/90
这种操作情况下的图像产生的差别是肉眼无法辨别的,以往的常规特征也无法很好的检测。
(3)特征提取:在此过程中,主要依照上文描述特征提取的步骤进行。其中反量化的操作是调用Phil Sallee的JPEG工具箱中的函数完成的。由于经过离散余弦变化,图像中绝大部分能量都集中在DCT系数中直流分量上,因此这个数值一般要远大于其它交流分量,这也是上面预处理中提到量化表中直流系数不改变难以检测的原因,而在步骤206或步骤306中由于直流系数的存在,除以总能量后最终得到的比例信息的后63维信息都比较小,经过取舍可能会失掉一些细节,会对训练判断过程造成一定的影响。
(4)SVM分类器训练与检测:这里采用的是libsvm中默认的参数设置,与五倍交叉校验的方式。实验得到了如下表3结果,其中Qtable替代Qtable*,accuracy为检测准确率。
表3
Qtable*/Qtable 59/60 69/70 80/81 90/91 60/59 70/69 81/80 91/90
Accuracy(%) 94.58 97.72 99.36 99.81 94.62 97.53 99.44 99.78
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种压缩图像量化表篡改的检测方法,包括以下步骤:
图像获取步骤,获取测试图像;
特征提取步骤,计算所述测试图像的区分性特征向量;
量化表提取步骤,提取所述测试图像的量化表;
检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
2.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,所述压缩图像量化表篡改的检测方法还包括:
预先训练构建量化表篡改检测分类器,包括:
图像集获取步骤,获取未压缩的图像构成的图像集;
正样本图像获取步骤,获取测试图像的量化表,并采用所述量化表对所述图像集中的每幅图像进行压缩,得到正样本图像;
负样本图像获取步骤,对所述测试图像的量化表随机修改,得到修改后的量化表,采用所述修改后的量化表对所述图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像;
样本特征提取步骤,计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记;
篡改检测分类器构建步骤,根据所述正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
3.根据权利要求2所述的压缩图像量化表篡改的检测方法,其特征在于,所述预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;
所述支持向量机分类器采用的核函数为高斯核函数、线性核函数、多项式核函数或sigmoid核函数。
4.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重;
所述特征提取步骤包括:
读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
计算总频率的系数幅值之和;
采用所述总频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
5.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重;
所述特征提取步骤包括:
读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
计算总邻域频率系数幅值之和;
采用所述总邻域频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
6.根据权利要求4或5中所述的压缩图像量化表篡改的检测方法,其特征在于,所述计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,‖·‖q为q范数,q∈[1,∞)。
7.一种压缩图像量化表篡改的检测系统,其特征在于,包括:
图像获取模块,用于获取测试图像;
特征提取模块,用于计算所述测试图像的区分性特征向量;
量化表提取模块,用于提取所述测试图像的量化表;
检测模块,用于采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
8.根据权利要求7所述的压缩图像量化表篡改的检测系统,其特征在于,所述压缩图像量化表篡改的检测系统还包括:
构建模块,用于预先训练构建量化表篡改检测分类器,包括:
图像集获取单元,用于获取未压缩的图像构成的图像集;
正样本图像获取单元,用于获取测试图像的量化表,并采用所述量化表对所述图像集中的每幅图像进行压缩,得到正样本图像;
负样本图像获取单元,用于对所述测试图像的量化表随机修改,得到修改后的量化表,采用所述修改后的量化表对所述图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像;
样本特征提取单元,用于计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记;
篡改检测分类器构建单元,用于根据所述正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
9.根据权利要求8所述的压缩图像量化表篡改的检测系统,其特征在于,所述预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;所述支持向量机分类器采用的核函数为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
10.根据权利要求7所述的压缩图像量化表篡改的检测系统,其特征在于,所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重;
所述特征提取模块包括:
第一反量化单元,用于读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
第一单个系数幅值计算单元,用于计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
总系数幅值计算单元,用于计算总频率的系数幅值之和;
第一特征向量计算单元,用于采用所述总频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
11.根据权利要求7所述的压缩图像量化表篡改的检测系统,其特征在于,所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重;
所述特征提取模块包括:
第二反量化单元,用于读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
第二单个系数幅值计算单元,用于计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
总邻域系数幅值计算单元,用于计算总邻域频率系数幅值之和;
第二特征向量计算单元,用于采用所述总邻域频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
12.根据权利要求10或11中所述的压缩图像量化表篡改的检测系统,其特征在于,所述计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,‖·‖q为q范数,q∈[1,∞)。
CN201310583368.0A 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统 Active CN104661037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310583368.0A CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310583368.0A CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Publications (2)

Publication Number Publication Date
CN104661037A true CN104661037A (zh) 2015-05-27
CN104661037B CN104661037B (zh) 2017-12-05

Family

ID=53251660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310583368.0A Active CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Country Status (1)

Country Link
CN (1) CN104661037B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016180198A1 (zh) * 2015-07-27 2016-11-17 中兴通讯股份有限公司 一种图像压缩方法和装置
CN106485316A (zh) * 2016-10-31 2017-03-08 北京百度网讯科技有限公司 神经网络模型压缩方法以及装置
CN106488250A (zh) * 2015-08-26 2017-03-08 中国科学院深圳先进技术研究院 一种估计jpeg双重压缩图像首压量化步长的方法和装置
CN107464237A (zh) * 2017-08-04 2017-12-12 平安科技(深圳)有限公司 图像篡改检测方法、电子装置及可读存储介质
CN107578453A (zh) * 2017-10-18 2018-01-12 北京旷视科技有限公司 压缩图像处理方法、装置、电子设备及计算机可读介质
CN108510083A (zh) * 2018-03-29 2018-09-07 国信优易数据有限公司 一种神经网络模型压缩方法以及装置
CN108537762A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于深度多尺度网络的二次jpeg压缩图像取证方法
CN110363207A (zh) * 2018-04-09 2019-10-22 阿里巴巴集团控股有限公司 图像检测和分类器模型的生成方法、装置及设备
CN110519595A (zh) * 2019-08-08 2019-11-29 浙江大学 一种基于频域量化损失估计的jpeg压缩图像复原方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1925546A (zh) * 2006-07-20 2007-03-07 中山大学 一种数码相机jpeg图像的真伪鉴别方法
KR20100137989A (ko) * 2009-06-24 2010-12-31 대한민국(관리부서:행정안전부 국립과학수사연구원장) 디지털사진 위조 검출 방법
CN102957915A (zh) * 2012-11-15 2013-03-06 西安理工大学 针对双重jpeg压缩图像的篡改检测及篡改定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1925546A (zh) * 2006-07-20 2007-03-07 中山大学 一种数码相机jpeg图像的真伪鉴别方法
KR20100137989A (ko) * 2009-06-24 2010-12-31 대한민국(관리부서:행정안전부 국립과학수사연구원장) 디지털사진 위조 검출 방법
CN102957915A (zh) * 2012-11-15 2013-03-06 西安理工大学 针对双重jpeg压缩图像的篡改检测及篡改定位方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016180198A1 (zh) * 2015-07-27 2016-11-17 中兴通讯股份有限公司 一种图像压缩方法和装置
CN106412583A (zh) * 2015-07-27 2017-02-15 中兴通讯股份有限公司 一种图像压缩方法和装置
CN106412583B (zh) * 2015-07-27 2020-02-11 中兴通讯股份有限公司 一种图像压缩方法和装置
CN106488250B (zh) * 2015-08-26 2019-05-07 中国科学院深圳先进技术研究院 一种估计jpeg双重压缩图像首压量化步长的方法和装置
CN106488250A (zh) * 2015-08-26 2017-03-08 中国科学院深圳先进技术研究院 一种估计jpeg双重压缩图像首压量化步长的方法和装置
CN106485316B (zh) * 2016-10-31 2019-04-02 北京百度网讯科技有限公司 神经网络模型压缩方法以及装置
CN106485316A (zh) * 2016-10-31 2017-03-08 北京百度网讯科技有限公司 神经网络模型压缩方法以及装置
CN107464237A (zh) * 2017-08-04 2017-12-12 平安科技(深圳)有限公司 图像篡改检测方法、电子装置及可读存储介质
CN107578453A (zh) * 2017-10-18 2018-01-12 北京旷视科技有限公司 压缩图像处理方法、装置、电子设备及计算机可读介质
CN108537762A (zh) * 2017-12-29 2018-09-14 西安电子科技大学 基于深度多尺度网络的二次jpeg压缩图像取证方法
CN108510083A (zh) * 2018-03-29 2018-09-07 国信优易数据有限公司 一种神经网络模型压缩方法以及装置
CN108510083B (zh) * 2018-03-29 2021-05-14 国信优易数据股份有限公司 一种神经网络模型压缩方法以及装置
CN110363207A (zh) * 2018-04-09 2019-10-22 阿里巴巴集团控股有限公司 图像检测和分类器模型的生成方法、装置及设备
CN110519595A (zh) * 2019-08-08 2019-11-29 浙江大学 一种基于频域量化损失估计的jpeg压缩图像复原方法

Also Published As

Publication number Publication date
CN104661037B (zh) 2017-12-05

Similar Documents

Publication Publication Date Title
CN104661037B (zh) 压缩图像量化表篡改的检测方法和系统
Mistry et al. Content based image retrieval using hybrid features and various distance metric
Shojae Chaeikar et al. PSW statistical LSB image steganalysis
CN113378710B (zh) 图像文件的版面分析方法、装置、计算机设备和存储介质
CN106126617A (zh) 一种视频检测方法及服务器
US20170262478A1 (en) Method and apparatus for image retrieval with feature learning
CN104657468A (zh) 基于图像与文本的视频的快速分类方法
CN108875727A (zh) 图文标识的检测方法及装置、存储介质、处理器
CN104504406A (zh) 一种快速高效的近似重复图像匹配方法
Gou et al. Representation-based classification methods with enhanced linear reconstruction measures for face recognition
CN103177105A (zh) 一种图像检索方法及装置
Chen et al. Image retrieval based on quadtree classified vector quantization
CN103903214A (zh) 基于mcuu模型下的dct域图像隐写容量的评估方法
CN108009434A (zh) 基于粗糙集α-正域约简的富模型隐写检测特征选取方法
Yadav et al. Noval approach of classification based Indian sign language recognition using transform features
Sheng et al. Detection of content-aware image resizing based on Benford’s law
Parnak et al. A novel forgery detection algorithm based on mantissa distribution in digital images
CN114996360B (zh) 数据分析方法、系统、可读存储介质及计算机设备
CN113221649B (zh) 一种解决有线表格识别与解析的方法
Parnak et al. A Novel Image Splicing Detection Algorithm Based on Generalized and Traditional Benford’s Law
CN114329050A (zh) 视觉媒体数据去重处理方法、装置、设备和存储介质
Du et al. Image hashing for tamper detection with multiview embedding and perceptual saliency
Jayanthi et al. Efficient fuzzy color and texture feature extraction technique for content based image retrieval system
Burns et al. Robust unsupervised segmentation of degraded document images with topic models
Sui et al. Creating visual vocabulary based on SIFT descriptor in compressed domain

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150527

Assignee: Dongguan Meixin Clothing Co.,Ltd.

Assignor: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES

Contract record no.: X2023980039817

Denomination of invention: Detection Method and System for Tampering of Compressed Image Quantization Tables

Granted publication date: 20171205

License type: Common License

Record date: 20230816

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150527

Assignee: Dongguan Shengtu Education Technology Co.,Ltd.

Assignor: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES

Contract record no.: X2023980041642

Denomination of invention: Detection Method and System for Tampering of Compressed Image Quantization Tables

Granted publication date: 20171205

License type: Common License

Record date: 20230912