CN104661037B - 压缩图像量化表篡改的检测方法和系统 - Google Patents

压缩图像量化表篡改的检测方法和系统 Download PDF

Info

Publication number
CN104661037B
CN104661037B CN201310583368.0A CN201310583368A CN104661037B CN 104661037 B CN104661037 B CN 104661037B CN 201310583368 A CN201310583368 A CN 201310583368A CN 104661037 B CN104661037 B CN 104661037B
Authority
CN
China
Prior art keywords
image
quantization table
frequency
sum
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310583368.0A
Other languages
English (en)
Other versions
CN104661037A (zh
Inventor
王维语
杨建权
朱国普
黄晓霞
赵希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201310583368.0A priority Critical patent/CN104661037B/zh
Publication of CN104661037A publication Critical patent/CN104661037A/zh
Application granted granted Critical
Publication of CN104661037B publication Critical patent/CN104661037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本发明涉及一种压缩图像量化表篡改的检测方法和系统。该压缩图像量化表篡改的检测方法,包括以下步骤:图像获取步骤,获取测试图像;特征提取步骤,计算所述测试图像的区分性特征向量;量化表提取步骤,提取所述测试图像的量化表;检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。上述压缩图像量化表篡改的检测方法和系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。

Description

压缩图像量化表篡改的检测方法和系统
技术领域
本发明涉及多媒体信息安全领域,特别是涉及一种压缩图像量化表篡改的检测方法和系统。
背景技术
多媒体技术在手持数码设备上的广泛应用持续改变着人们已往以语音为主的通信方式。随着各类图片发布、分享平台功能的完善和用户的增加,图像通信逐渐成为人们所接收的通信方式,主要是因为图像中包含事件的细节,便于发布者更好的表达其观点,且相对于纯文字或纯语音消息更具有说服力和感染力。
然而,图像包含的信息可能被篡改或隐含秘密信息,例如图像可能被恶意篡改用于造谣,或作为载体传递非法信息,给图像的取证分析带来困难,而无法检测图像是否被篡改。
发明内容
基于此,有必要针对无法检测图像是否被篡改的问题,提供一种能准确检测图像是否被篡改的压缩图像量化表篡改的检测方法。
此外,还有必要提供一种能准确检测图像是否被篡改的压缩图像量化表篡改的检测系统。
一种压缩图像量化表篡改的检测方法,包括以下步骤:
图像获取步骤,获取测试图像;
特征提取步骤,计算所述测试图像的区分性特征向量;
量化表提取步骤,提取所述测试图像的量化表;
检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
一种压缩图像量化表篡改的检测系统,包括:
图像获取模块,用于获取测试图像;
特征提取模块,用于计算所述测试图像的区分性特征向量;
量化表提取模块,用于提取所述测试图像的量化表;
检测模块,用于采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果。
上述压缩图像量化表篡改的检测方法和系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
另外,通过第一标记和第二标记容易标记判断,提高检测效率;采用总邻域系数幅值和的比重,计算量少。
附图说明
图1为一个实施例中压缩图像量化表篡改的检测方法的流程图;
图2为一个实施例中特征提取步骤的流程图;
图3为另一个实施例中特征提取步骤的流程图;
图4为预先训练构建量化表篡改检测分类器的流程图;
图5为一个实施例中压缩图像量化表篡改的检测系统的结构框图;
图6为一个实施例中特征提取模块的内部结构框图;
图7为另一个实施例中特征提取模块的内部结构框图;
图8为一个实施例中构建模块的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,为一个实施例中压缩图像量化表篡改的检测方法的流程图。该压缩图像量化表篡改的检测方法,包括以下步骤:
步骤102,图像获取步骤,获取测试图像。
具体的,该测试图像可为JPEG(Joint Photographic Experts Group)图像。JPEG是一种有损压缩标准。
步骤104,特征提取步骤,计算该测试图像的区分性特征向量。
具体的,该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。
计算得到测试图像的区分性特征向量Fdet
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,如图2所示,为一个实施例中特征提取步骤的流程图。该特征提取步骤包括:
步骤202,读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
该图像可为JPEG图像等。本实施例中图像为JPEG图像。JPEG图像压缩是基于分块的图像压缩,对于RGB(Red-Green-Blue)彩色图像,需把像素从RGB彩色空间映射到YCbCr空间(Y为亮度分量,Cb、Cr为色差分量),再对Y、Cb、Cr通道独立进行压缩操作。
JPEG压缩时,首先将输入图像的亮度值矩阵分割成连续不重叠的8×8像素小块,并对每一个小块进行离散余弦变换(Discrete Cosine Transform,DCT),得到8×8的实数型DCT系数。然后根据一个8×8的量化表(量化表中的每个数据项是一个正整数,表示相应DCT频率系数的量化步长)对实数型的DCT系数依次进行量化、取整,得到整型的量化DCT系数。最后将所得的量化DCT系数进行哈夫曼(Huffman,一种熵编码)编码后形成字节流,并依照JPEG标准定义的规则与压缩参数(量化表,哈夫曼码表等)一同写成JPEG文件。对图像的8×8分块DCT变换会产生64个频率分量,其中1个直流(Direct Current,DC)分量,63个交流(Alternating Current,AC)分量。
JPEG解压缩时,首先从JPEG头文件读取量化表并对文件内字节流进行解码,得到量化DCT系数矩阵。然后根据量化表,依次对量化DCT系数进行反量化、反离散余弦变换(Inverse Discrete Cosine Transform,IDCT)、并取整、截断后,还原出亮度值矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
步骤204,计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
步骤206,计算总频率的系数幅值之和。
计算总频率的系数幅值之和S的计算公式可为:
步骤208,采用该总频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。Zig-zag为量化系数的Z行排序。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。如图3所示,为一个实施例中特征提取步骤的流程图。该特征提取步骤包括:
步骤302,读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
步骤304,计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
步骤306,计算总邻域频率系数幅值之和。
计算总邻域频率系数幅值之和S的计算公式可为:
其中,r为(i,j)值附近正方邻域的边长,可调节。
步骤308,采用该总邻域频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。
步骤106,量化表提取步骤,提取该测试图像的量化表。
具体的,从测试图像的文件头提取测试图像的量化表Qdet。JPEG图像的文件头数据包括量化表、霍夫曼编码、缩略图和EXIF信息等。
步骤108,检测步骤,采用对应于该测试图像的量化表的预先训练得到的量化表篡改检测分类器对该区分性特征向量进行检测,得到检测结果。
具体的,采用对应于测试图像的量化表Qdet的预先训练得到的量化表篡改检测分类器,对Fdet进行检测,得到对应的类别标记,根据该类别标记即可确定该测试图像的量化表是否被篡改,例如量化表篡改检测分类器预先得到的标记为“1”,表示未被篡改,得到的标记为“-1”,表示被篡改。
上述压缩图像量化表篡改的检测方法,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
如图4所示,在一个实施例中,上述压缩图像量化表篡改的检测方法,还包括:
预先训练构建量化表篡改检测分类器,包括:
步骤402,图像集获取步骤,获取未压缩的图像构成的图像集。
具体的,收集未经压缩的图像作为产生正负样本的图像素材,并将收集的图像构成图像集W。
步骤404,正样本图像获取步骤,获取测试图像的量化表,并采用该量化表对该图像集中的每幅图像进行压缩,得到正样本图像。
具体的,获取测试图像的量化表Qdet。使用Qdet对图像集W中的每幅图像进行JPEG压缩,得到正样本图像。
步骤406,负样本图像获取步骤,对该测试图像的量化表随机修改,得到修改后的量化表,采用该修改后的量化表对该图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像。
具体的,随机对测试图像的量化表Qdet中的某些步长值进行修改,得到量化表Qalt。使用Qalt对图像集W中的每幅图像进行JPEG压缩,并将得到的JPEG图像的量化表Qalt篡改成Qdet,得到负样本图像。
步骤408,样本特征提取步骤,计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记。
具体的,采用如步骤202至208或者,步骤302至308的方式分别计算正样本图像和负样本图像的区分性特征向量。步骤408计算区分性特征向量的方式与步骤104中计算测试图像的区分性特征向量的方式应保持一致。本实施例中,第一标记为“1”,第二标记为“-1”,在其他实施例中,第一标记和第二标记也可采用其他数字、符号等表示。
步骤410,篡改检测分类器构建步骤,根据该正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
该预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;该支持向量机分类器采用的核函数可为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
支持向量机(Support Vector Machine,SVM)技术是广泛使用的一种监督式机器学习技术,可用于对输入的特征向量进行分类。该技术涉及机器学习领域的大量数学理论,为方便非机器学习领域的研究者使用SVM,提供了开源的现成软件包。其中使用最为广泛的是libSVM,且具有多种语言版本。在使用SVM预测新样本类别前,需要用SVM对已有样本进行训练,使之具有特定分类问题的预测能力,这一过程称为SVM分类器的训练,具体过程是:首先提取具有区分性的特征向量,然后标记特征向量所属类别(如第一类标记为1,第二类标记为-1,如此类推),最后将特征向量和类别标记作为参数输入至LibSVM提供的接口函数svmtrain得到SVM模型文件(即SVM分类器)。
SVM分类器训练完成后,可对新样本的类别进行预测。具体过程是:首先提取新样本的特征向量,然后将该特征向量和上述得到的SVM模型输入至libsvm提供的接口函数svmpredict,即可得到新样本的所属的类别标记。
如图5所示,为一个实施例中压缩图像量化表篡改的检测系统的结构框图。该压缩图像量化表篡改的检测系统,包括图像获取模块520、特征提取模块540、量化表提取模块560和检测模块580。其中:
图像获取模块520用于获取测试图像。
特征提取模块540用于计算该测试图像的区分性特征向量。
具体的,该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重。计算得到测试图像的区分性特征向量Fdet。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,如图6所示,在一个实施例中,该特征提取模块540包括第一反量化单元542、第一单个系数幅值计算单元544、总系数幅值计算单元546和第一特征向量计算单元548。其中:
第一反量化单元542用于读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
第一单个系数幅值计算单元544用于计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
总系数幅值计算单元546用于计算总频率的系数幅值之和。
计算总频率的系数幅值之和S的计算公式可为:
第一特征向量计算单元548用于采用该总频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。Zig-zag为量化系数的Z行排序。
当该区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重时,如图7所示,在一个实施例中,该特征提取模块包括第二反量化单元541、第二单个系数幅值计算单元543、总邻域系数幅值计算单元545和第二特征向量计算单元547。其中:
第二反量化单元541,用于读取图像的量化表,并将该图像的字节流熵解码为量化系数矩阵,采用该量化表对该量化系数矩阵进行反量化,得到反量化系数矩阵。
本实施例中,读取输入的JPEG图像,从文件头读取量化表Q(8×8矩阵),按照JPEG压缩标准将文件内的字节流熵解码为量化系数矩阵,并采用量化表Q对量化系数矩阵进行反量化,得到反量化系数矩阵C。C的大小为m×n,m,n为大于8的自然数。
第二单个系数幅值计算单元543,用于计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和。
该计算该反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式可为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,‖·‖q为q范数,q∈[1,∞)。
总邻域系数幅值计算单元545,用于计算总邻域频率系数幅值之和。
计算总邻域频率系数幅值之和S的计算公式可为:
其中,r为(i,j)值附近正方邻域的边长,可调节。
第二特征向量计算单元547,用于采用该总邻域频率的系数幅值之和对该各离散余弦变换频率系数的幅值之和进行归一化,得到该图像的区分性特征向量。
具体的,进行归一化的公式表示如下:
该区分性特征向量为64维的区分性特征向量。该区分性特征向量可有多种排列形式,可以采用Zig-zag扫描得到频率,然后由低到高排列区分性特征向量,也可采用行扫描和列扫描得到区分性特征向量。
量化表提取模块560用于提取该测试图像的量化表。
具体的,从测试图像的文件头提取测试图像的量化表Qdet。JPEG图像的文件头数据包括量化表、霍夫曼编码、缩略图和EXIF信息等。
检测模块580用于采用对应于该测试图像的量化表的预先训练得到的量化表篡改检测分类器对该区分性特征向量进行检测,得到检测结果。
具体的,采用对应于测试图像的量化表Qdet的预先训练得到的量化表篡改检测分类器,对Fdet进行检测,得到对应的类别标记,根据该类别标记即可确定该测试图像的量化表是否被篡改,例如量化表篡改检测分类器预先得到的标记为“1”,表示未被篡改,得到的标记为“-1”,表示被篡改。
上述压缩图像量化表篡改的检测系统,通过采用训练得到的篡改检测分类器对测试图像的区分性特征向量进行检测,能准确判断该测试图像的量化表是否被篡改。
在一个实施例中,该压缩图像量化表篡改的检测系统还包括:构建模块,用于预先训练构建量化表篡改检测分类器。
如图8所示,构建模块800包括图像集获取单元810、正样本图像获取单元820、负样本图像获取单元830、样本特征提取单元840和篡改检测分类器构建单元850。
图像集获取单元810用于获取未压缩的图像构成的图像集。具体的,收集未经压缩的图像作为产生正负样本的图像素材,并将收集的图像构成图像集W。
正样本图像获取单元820用于获取测试图像的量化表,并采用该量化表对该图像集中的每幅图像进行压缩,得到正样本图像。
具体的,获取测试图像的量化表Qdet。使用Qdet对图像集W中的每幅图像进行JPEG压缩,得到正样本图像。
负样本图像获取单元830用于对该测试图像的量化表随机修改,得到修改后的量化表,采用该修改后的量化表对该图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像。
具体的,随机对测试图像的量化表Qdet中的某些步长值进行修改,得到量化表Qalt。使用Qalt对图像集W中的每幅图像进行JPEG压缩,并将得到的JPEG图像的量化表Qalt篡改成Qdet,得到负样本图像。
样本特征提取单元840用于计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记。
具体的,采用如步骤202至208或者,步骤302至308的方式分别计算正样本图像和负样本图像的区分性特征向量。步骤408计算区分性特征向量的方式与步骤104中计算测试图像的区分性特征向量的方式应保持一致。本实施例中,第一标记为“1”,第二标记为“-1”,在其他实施例中,第一标记和第二标记也可采用其他数字、符号等表示。
篡改检测分类器构建单元850用于根据该正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
该预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者Deep Learning分类器;该支持向量机分类器采用的核函数可为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
下面结合具体的例子说明上述压缩图像量化表篡改的检测方法和系统的检测过程:
(1)实验环境:在实验中,选择的图片库是具有1338幅未经压缩处理彩色图片的UCID(Uncompressed Color Image Database)图片库;JPEG图像的压缩以及篡改操作均在Matlab7.12.0平台上进行。
(2)预处理:在预处理步骤(b)存在对负类样本压缩量化表由Qtable*替换为Qtable的操作,在JPEG压缩体系中,图像的质量分为1~100个级别,每个级别的量化表可用一个质量因子表示,质量因子100对应最高的图像保真度,这时图像质量最高,相应的质量因子1对应最低的图像保真度,图像质量最差,数值越近压缩效果也越相似。具体实验中发现选取压缩质量相差5级的量化表模拟量化,如下表1所示。
表1
Qtable*/Qtable 60/65 70/75 80/85 90/95 65/60 75/70 85/80 95/90
操作某些图像产生了肉眼可以分辨的些许区别。经过分析,这些区别与直流系数的改变存在着一定的关系,因此本实验中仅考虑直流系数不改变的量化表替换情况,如表2所示。
表2
Qtable*/Qtable 59/60 69/70 80/81 90/91 60/59 70/69 81/80 91/90
这种操作情况下的图像产生的差别是肉眼无法辨别的,以往的常规特征也无法很好的检测。
(3)特征提取:在此过程中,主要依照上文描述特征提取的步骤进行。其中反量化的操作是调用Phil Sallee的JPEG工具箱中的函数完成的。由于经过离散余弦变化,图像中绝大部分能量都集中在DCT系数中直流分量上,因此这个数值一般要远大于其它交流分量,这也是上面预处理中提到量化表中直流系数不改变难以检测的原因,而在步骤206或步骤306中由于直流系数的存在,除以总能量后最终得到的比例信息的后63维信息都比较小,经过取舍可能会失掉一些细节,会对训练判断过程造成一定的影响。
(4)SVM分类器训练与检测:这里采用的是libsvm中默认的参数设置,与五倍交叉校验的方式。实验得到了如下表3结果,其中Qtable替代Qtable*,accuracy为检测准确率。
表3
Qtable*/Qtable 59/60 69/70 80/81 90/91 60/59 70/69 81/80 91/90
Accuracy(%) 94.58 97.72 99.36 99.81 94.62 97.53 99.44 99.78
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种压缩图像量化表篡改的检测方法,包括以下步骤:
图像获取步骤,获取测试图像;
特征提取步骤,计算所述测试图像的区分性特征向量;
量化表提取步骤,提取所述测试图像的量化表;
检测步骤,采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果;
所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重;
当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,或者当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重时,所述特征提取步骤包括:
读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,||·||q为q范数,q∈[1,∞)。
2.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,所述压缩图像量化表篡改的检测方法还包括:
预先训练构建量化表篡改检测分类器,包括:
图像集获取步骤,获取未压缩的图像构成的图像集;
正样本图像获取步骤,获取测试图像的量化表,并采用所述量化表对所述图像集中的每幅图像进行压缩,得到正样本图像;
负样本图像获取步骤,对所述测试图像的量化表随机修改,得到修改后的量化表,采用所述修改后的量化表对所述图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像;
样本特征提取步骤,计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记;
篡改检测分类器构建步骤,根据所述正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
3.根据权利要求2所述的压缩图像量化表篡改的检测方法,其特征在于,所述预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者DeepLearning分类器;
所述支持向量机分类器采用的核函数为高斯核函数、线性核函数、多项式核函数或sigmoid核函数。
4.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,所述特征提取步骤还包括:
计算总频率的系数幅值之和;
采用所述总频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
5.根据权利要求1所述的压缩图像量化表篡改的检测方法,其特征在于,当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重时,所述特征提取步骤还包括:
计算总邻域频率系数幅值之和;
采用所述总邻域频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
6.一种压缩图像量化表篡改的检测系统,其特征在于,包括:
图像获取模块,用于获取测试图像;
特征提取模块,用于计算所述测试图像的区分性特征向量;
量化表提取模块,用于提取所述测试图像的量化表;
检测模块,用于采用对应于所述测试图像的量化表的预先训练得到的量化表篡改检测分类器对所述区分性特征向量进行检测,得到检测结果;
所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重,或者为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重;
所述特征提取模块包括:
反量化单元,用于读取图像的量化表,并将所述图像的字节流熵解码为量化系数矩阵,采用所述量化表对所述量化系数矩阵进行反量化,得到反量化系数矩阵;
单个系数幅值计算单元,用于计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和;
所述计算所述反量化系数矩阵中各离散余弦变换频率系数的幅值之和的计算公式为:
其中,K(i,j)表示各离散余弦变换频率系数的幅值之和,C表示反量化系数矩阵,C的大小为m×n,m,n为大于8的自然数,表示下取整操作,|·|表示绝对值操作;
或者,
或者,
其中,||·||q为q范数,q∈[1,∞)。
7.根据权利要求6所述的压缩图像量化表篡改的检测系统,其特征在于,所述压缩图像量化表篡改的检测系统还包括:
构建模块,用于预先训练构建量化表篡改检测分类器,包括:
图像集获取单元,用于获取未压缩的图像构成的图像集;
正样本图像获取单元,用于获取测试图像的量化表,并采用所述量化表对所述图像集中的每幅图像进行压缩,得到正样本图像;
负样本图像获取单元,用于对所述测试图像的量化表随机修改,得到修改后的量化表,采用所述修改后的量化表对所述图像集中的每幅图像进行压缩,将压缩后的图像的量化表修改为测试图像的量化表,得到负样本图像;
样本特征提取单元,用于计算每幅正样本图像和负样本图像的区分性特征向量,并标记正样本图像的区分性特征向量为第一标记,以及标记负样本图像的区分性特征向量为第二标记;
篡改检测分类器构建单元,用于根据所述正样本和负样本图像的区分性特征向量及相应的第一标记和第二标记对预设分类器进行训练,得到对应于测试图像的量化表的篡改检测分类器。
8.根据权利要求7所述的压缩图像量化表篡改的检测系统,其特征在于,所述预设分类器为支持向量机分类器、聚类分类器、BP神经网络分类器、Fisher分类器或者DeepLearning分类器;所述支持向量机分类器采用的核函数为高斯核函数、线性核函数、多项式核函数或者sigmoid核函数。
9.根据权利要求6所述的压缩图像量化表篡改的检测系统,其特征在于,当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总频率的系数幅值和的比重时,所述特征提取模块还包括:
总系数幅值计算单元,用于计算总频率的系数幅值之和;
第一特征向量计算单元,用于采用所述总频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
10.根据权利要求6所述的压缩图像量化表篡改的检测系统,其特征在于,当所述区分性特征向量为反量化离散余弦变换频率系数的幅值所占总邻域频率系数幅值和的比重时,所述特征提取模块还包括:
总邻域系数幅值计算单元,用于计算总邻域频率系数幅值之和;
第二特征向量计算单元,用于采用所述总邻域频率的系数幅值之和对所述各离散余弦变换频率系数的幅值之和进行归一化,得到所述图像的区分性特征向量。
CN201310583368.0A 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统 Active CN104661037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310583368.0A CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310583368.0A CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Publications (2)

Publication Number Publication Date
CN104661037A CN104661037A (zh) 2015-05-27
CN104661037B true CN104661037B (zh) 2017-12-05

Family

ID=53251660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310583368.0A Active CN104661037B (zh) 2013-11-19 2013-11-19 压缩图像量化表篡改的检测方法和系统

Country Status (1)

Country Link
CN (1) CN104661037B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412583B (zh) * 2015-07-27 2020-02-11 中兴通讯股份有限公司 一种图像压缩方法和装置
CN106488250B (zh) * 2015-08-26 2019-05-07 中国科学院深圳先进技术研究院 一种估计jpeg双重压缩图像首压量化步长的方法和装置
CN106485316B (zh) * 2016-10-31 2019-04-02 北京百度网讯科技有限公司 神经网络模型压缩方法以及装置
CN107464237A (zh) * 2017-08-04 2017-12-12 平安科技(深圳)有限公司 图像篡改检测方法、电子装置及可读存储介质
CN107578453B (zh) * 2017-10-18 2019-11-01 北京旷视科技有限公司 压缩图像处理方法、装置、电子设备及计算机可读介质
CN108537762B (zh) * 2017-12-29 2019-12-24 西安电子科技大学 基于深度多尺度网络的二次jpeg压缩图像取证方法
CN108510083B (zh) * 2018-03-29 2021-05-14 国信优易数据股份有限公司 一种神经网络模型压缩方法以及装置
CN110363207A (zh) * 2018-04-09 2019-10-22 阿里巴巴集团控股有限公司 图像检测和分类器模型的生成方法、装置及设备
CN110519595A (zh) * 2019-08-08 2019-11-29 浙江大学 一种基于频域量化损失估计的jpeg压缩图像复原方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1925546A (zh) * 2006-07-20 2007-03-07 中山大学 一种数码相机jpeg图像的真伪鉴别方法
KR20100137989A (ko) * 2009-06-24 2010-12-31 대한민국(관리부서:행정안전부 국립과학수사연구원장) 디지털사진 위조 검출 방법
CN102957915A (zh) * 2012-11-15 2013-03-06 西安理工大学 针对双重jpeg压缩图像的篡改检测及篡改定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1925546A (zh) * 2006-07-20 2007-03-07 中山大学 一种数码相机jpeg图像的真伪鉴别方法
KR20100137989A (ko) * 2009-06-24 2010-12-31 대한민국(관리부서:행정안전부 국립과학수사연구원장) 디지털사진 위조 검출 방법
CN102957915A (zh) * 2012-11-15 2013-03-06 西安理工大学 针对双重jpeg压缩图像的篡改检测及篡改定位方法

Also Published As

Publication number Publication date
CN104661037A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN104661037B (zh) 压缩图像量化表篡改的检测方法和系统
Wu et al. Blind image quality assessment based on multichannel feature fusion and label transfer
Ye et al. No-reference image quality assessment using visual codebooks
Shojae Chaeikar et al. PSW statistical LSB image steganalysis
CN102413328B (zh) Jpeg图像双重压缩检测方法及系统
Wang et al. Background-driven salient object detection
Tang et al. Perceptual image hashing with weighted DWT features for reduced-reference image quality assessment
CN113536990A (zh) 深度伪造人脸数据鉴别方法
Vidyadharan et al. Digital image forgery detection using compact multi-texture representation
Yu et al. Perceptual hashing with complementary color wavelet transform and compressed sensing for reduced-reference image quality assessment
CN110457996B (zh) 基于vgg-11卷积神经网络的视频运动对象篡改取证方法
Yang et al. A clustering-based framework for improving the performance of JPEG quantization step estimation
Tang et al. Robust image hashing with visual attention model and invariant moments
Tang et al. Perceptual image hashing using local entropies and DWT
CN111274446A (zh) 视频处理方法及相关装置
Qiao et al. Csc-net: Cross-color spatial co-occurrence matrix network for detecting synthesized fake images
Wang et al. Steganalysis of JPEG images by block texture based segmentation
Chen et al. Image retrieval based on quadtree classified vector quantization
Simon et al. DeepLumina: A method based on deep features and luminance information for color texture classification
CN103903214A (zh) 基于mcuu模型下的dct域图像隐写容量的评估方法
Chhikara et al. A review on digital image steganalysis techniques categorised by features extracted
Sabitha et al. Enhanced model for fake image detection (EMFID) using convolutional neural networks with histogram and wavelet based feature extractions
Parnak et al. A novel forgery detection algorithm based on mantissa distribution in digital images
Sheng et al. Detection of content-aware image resizing based on Benford’s law
CN107870923B (zh) 图像检索方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150527

Assignee: Dongguan Meixin Clothing Co.,Ltd.

Assignor: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES

Contract record no.: X2023980039817

Denomination of invention: Detection Method and System for Tampering of Compressed Image Quantization Tables

Granted publication date: 20171205

License type: Common License

Record date: 20230816

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150527

Assignee: Dongguan Shengtu Education Technology Co.,Ltd.

Assignor: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES

Contract record no.: X2023980041642

Denomination of invention: Detection Method and System for Tampering of Compressed Image Quantization Tables

Granted publication date: 20171205

License type: Common License

Record date: 20230912