一种JPEG图片量化表篡改的检测方法
技术领域
本发明属于多媒体信息安全与取证领域,具体涉及一种JPEG图片量化表篡改的检测方法。
背景技术
伴随着各种功能强大的专业级图像编辑软件例如Photoshop、ACDsee的普及,篡改图像变得越来越容易,即使普通用户也能篡改出视觉上足以以假乱真的图片。然而,原始JPEG图片经过Photoshop、ACDsee等篡改后,当再次保存成JPEG后将不可避免的引入自身的量化表,因为软件的量化表大多不同于相机和手机拍摄的JPEG图片的量化表,这导致了篡改前后的JPEG图片量化表不一致。如果不将量化表替换回篡改前的量化表,将很容易被检测出来。因此,为了消除量化表的不一致性,篡改者有可能会替换量化表,以掩盖篡改的事实。通过大量替换量化表的实验,我们发现替换后的JPEG图片并不会明显失真,人眼很难察觉。
近年来,数字图像的篡改已经影响到政治、法律、传媒等方方面面。各种恶意的篡改实例不胜枚举,因此图像认证技术变得十分重要。
图像认证技术可分为主动认证和被动认证两类。典型的主动认证技术包括数字水印和数字签名。这两种方法都需要事先对图片附加额外的信息,认证时从图片中提取相应信息,然后与事先附加信息进行匹配判别。而在实际的应用中,更多的情况下我们不可能获得有效的附加信息,因此主动认证方法有很大局限性。这种情况下,就需要借助于被动式的认证技术。图像被动认证技术不需要任何附加的信息,而是利用和分析图像的一些内在特征,来达到认证的目的。
在图像被动认证方面,虽然理论上可以通过检测JPEG图片是否经过两次JPEG压缩来判别JPEG图片原始性,但是由于目前相机、手机等拍摄设备生成的JPEG图片的量化表与Photoshop等软件的常用量化表相近,所以两次JPEG压缩的检测结果通常不理想。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷(不足),提供一种JPEG图片量化表篡改的检测方法,本发明能够有效检测原始JPEG图片被图像编辑软件压缩,然后篡改量化表的行为。
为解决上述技术问题,本发明的技术方案如下:
一种JPEG图片量化表篡改的检测方法,包括以下步骤:
步骤S1:选取若干JPEG图片作为原始JPEG图片,对原始JPEG图片的量化表进行篡改,获取量化表篡改后的JPEG图片;
步骤S2:对原始JPEG图片和量化表篡改后的JPEG图片提取特征;
步骤S3:根据步骤S2中得到的特征,用原始JPEG图片与量化表篡改后的JPEG图片对分类器进行训练,得到分类器模型;
步骤S4:提取待测图片的特征,根据分类器模型判断待测图片的量化表是否篡改。
在一种优选的方案中,步骤S1中,原始JPEG图片通过拍摄设备拍摄得到。
在一种优选的方案中,步骤S1中,选取的原始JPEG图片为彩色图片。
在一种优选的方案中,步骤S1中,对原始JPEG图片的量化表进行篡改,获取量化表篡改后的JPEG图片的方法为:对选取的每幅原始JPEG图片,分别用Photoshop或ACDsee软件,采用与其原始JPEG图片不同的量化表进行JPEG重压缩,然后用原始JPEG图片的量化表替换重压缩后的JPEG图片的量化表。
在一种优选的方案中,步骤S2中,对原始JPEG图片和量化表篡改后的JPEG图片进行特征提取的方法包括以下步骤:
(1)分别在JPEG图片的Y、Cb、Cr通道中,统计采用ZigZag指标算法排序后,即量化系数的Z行排序,的前N个频率子带的量化DCT系数的绝对值之和,构成一个3×N的矩阵,记为A,
A=FirstSumPerFre(i,j),i=1,2,3...N,j=1,2,3分别对应Y,Cb,Cr通道;
(2)将JPEG图片解压到RGB空域,以[x,y]方式裁剪图片,即去除前x行和前y列的像素点,然后对剩余像素点重新进行JPEG压缩,得到新的JPEG图片,接着分别在Y、Cb、Cr通道中,统计采用ZigZag指标算法排序后的前N个频率子带的量化DCT系数的绝对值之和,构成一个3×N的矩阵,记为B,
B=SecondSumPerFre(i,j),i=1,2,3...N,j=1,2,3分别对应Y,Cb,Cr通道;
(3)计算裁剪前与裁剪后相对应的频率子带的量化DCT系数的绝对值之和的比值,即矩阵A与矩阵B的对应元素相除,构成3×N维的特征,记为特征矩阵C,
在一种优选的方案中,所述x=4,y=4。
在一种优选的方案中,步骤S3中,所述分类器是SVM分类器,训练过程中采取五折交叉验证。
与现有技术相比,本发明技术方案的有益效果是:
(1)目前尚未有JPEG图片量化表篡改检测的相关技术的公布,本发明弥补了这方面的空白。
(2)本发明能够有效检测原始JPEG图片被图像编辑软件压缩、然后对量化表进行篡改的行为,为JPEG图片原始性的鉴定提供了有效的方法。
(3)本发明对JPEG图片量化表篡改的检测具有较高的准确率,当本发明选择的参数N大于10时,准确率大于99%。
附图说明
图1是篡改JPEG量化表的过程。
图2是本专利算法的流程。
图3是原始JPEG图片和量化表被替换后图片的特征(仅Y通道)示例。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
(2)篡改量化表的图片的构造:首先对原始JPEG分别用软件Photoshop的常用压缩参数(品质因子为11、12)和ACDsee的常用压缩参数(量化因子为96、97、98和99)进行JPEG重压缩,然后将压缩后的JPEG图片的量化表替换成对应的原始图片的量化表。其中排除压缩后的JPEG量化表与原始JPEG量化表一致的情况。
(3)对每幅原始JPEG图片与篡改量化表后的JPEG图片,如图2所示按照以下方法提取特征:
a)分别在JPEG的Y、Cb、Cr通道中,对ZigZag排序后的前N个频率子带,统计每个子带的量化DCT系数的绝对值之和,构成一个3×N的矩阵,记为A,
A=FirstSumPerFre(i,j),i=1,2,3...N,j=1,2,3分别对应Y,Cb,Cr通道;
b)将JPEG图片解压到RGB空域,以[4,4]方式裁剪图片,即去除前4行和前4列的像素点,然后对剩余像素点的重新JPEG压缩,得到新的JPEG图片,接着分别从Y、Cb、Cr通道中对按照ZigZag排列的前N个频率子带,再统计每个子带的量化DCT系数的绝对值之和,构成一个3×N的矩阵,记为B,B=SecondSumPerFre(i,j),i=1,2,3...N,j=1,2,3分别对应Y,Cb,Cr通道;
c)计算裁剪前与裁剪后,量化DCT系数的绝对值的比值,即矩阵A与矩阵B的对应元素相除,构成3×N维的特征,记为特征矩阵C,
(4)根据c)中得到的特征,利用已知的原始JPEG图片与篡改量化表后的JPEG图片对分类器进行训练,得到分类器模型。
(5)利用分类器对待测JPEG图片做检测判断:首先按步骤(3)提取待测图片的特征,然后利用步骤(4)得到的分类器模型进行判别。
表1拍摄设备型号列表
本发明方法的原理如下:
当原始JPEG图片,经过图像编辑软件重新压缩,然后将其量化表替换成原始量化表后,会留下基于信号处理的统计特征。通过大量实验发现,当对篡改量化表后的JPEG图片,用[4,4]裁剪去除前4行和前4列的像素点,再进行JPEG压缩,单个频率子带的量化DCT系数的绝对值之和与裁剪前有着明显的区别,即两者的比值偏离1而原始图片的比值接近1。如图3所示,原始JPEG图片被Photoshop以12的品质因子压缩,然后替换成原始JPEG图片量化表。
为了说明方便,仅列出Y通道提取的特征序列,可以发现原始图片的特征序列大都接近1,尤其是对应低频部分的特征,而替换后的图片的特征明显偏离1。同样,Cb和Cr通道的特征也有类似的现象。
下面给出本发明方法的一些具体实验及其结果:
1、实验组织:
正样本:3000张原始JPEG图片来自15个不同型号和种类的拍摄设备;
负样本:对原始JPEG分别用软件Photoshop的常用压缩参数,品质因子为11、12和ACDsee的常用压缩参数,品质因子为96、97、98和99;进行JPEG重压缩。其中排除压缩后的JPEG量化表与原始JPEG量化表一致的情况。替换后的图片的平均峰值信噪比(PSNR)大于44dB,人眼很难察觉出差异。最后从中随机选择3000张作为最终的负样本。
分类方式:对1500个正样本和1500个负样本的特征进行训练,剩下的1500个正样本和1500个负样本用作测试。其中,分类器是SVM分类器,训练过程中采取五折交叉验证。
2、实验结果
如表2所示,参数N表示从Y、Cb和Cr通道的前N个频率子带提取特征,准确率表示被正确分类的样本占所有用于分类的样本的比例。表2给出了不同参数N的情况下,本发明的检测准确率。
表2:不同的参数N下的分类结果
参数N |
5 |
10 |
15 |
20 |
25 |
30 |
准确率 |
97.34% |
99.63% |
99.90% |
99.81% |
99.88% |
99.87% |
参数N |
35 |
40 |
45 |
50 |
55 |
60 |
准确率 |
99.86% |
99.82% |
99.81% |
99.74% |
99.83% |
99.83% |
从表2可以看出,对于不同的参数N,本发明的准确率都大于97%,且当N≥10时,准确率在99.8%附近,这充分说明本发明对于鉴定JPEG图片是否由原始JPEG先被图像编辑软件重压缩然后被篡改量化表,有着很高的准确性,对于有效识别恶意篡改行为有着重要价值。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。