基于DCT域统计特性的自然图像与计算机生成图像的鉴别方法
技术领域
本发明涉及图像鉴别技术领域,尤其涉及的是一种基于DCT域统计特性的自然图像与计算机生成图像的鉴别方法。
背景技术
随着信息时代的到来,数字化成像设备越来越普遍,传统的胶片图像正逐步被数字图像所取代,但数字图像更很容易被篡改,伪造。一些3D图像生成软件可以轻易的生成以假乱真的计算机图像,以至于人眼几乎无法将其与自然图像区分开来。随着数字图像的应用范围不断扩大,特别是其在新闻、司法等行业的应用不断增多,面对大量的数字图像如何鉴别其相应的来源便成了一个急需解决的问题。
真实图像和计算机生成图像的鉴别方法,一直是数字图像取证中的重要问题,也是首要的问题。自然图像PIM是指由数码相机、扫描仪等成像设备获取的真实世界的影像,它强调由真实世界获取。而计算机生成图像CG是指由计算机通过图像处理软件(常用的有3DsMAX,Maya,Softimage等)生成的与真实世界相似的影像,它虽有真实世界的对应物,但不是由真实世界直接获得。CG的生成过程是:首先构建一个3D多边模型模拟期望的形状,然后为模型赋予颜色和纹理,并且用模拟光源照射,最后将修饰好的模型送到一个虚拟的照相机前成像,生成图像。两者在平滑度、色彩数量、直方图连续性和细小纹理复杂度等方面有很大的不同。目前多数的数字图像处理软件都是在电脑上操作的,也即那些伪造、篡改的图像都是在电脑上操作的,对计算机生成图像和自然图像的区别的认识,将对篡改图像的篡改区域的认识起到引领作用,可以依此来对篡改图像进行检测,因此对计算机生成图像的检测研究就具有十分重要的意义。
现有的自然图像与计算机鉴别方法的特征提取都是采用单一类型的特征信息,信息涵盖不全,分析能力不强,收集到的特征信息不能够十分准确地用于计算机生成图像和自然图像的检测。比如,目前基于离散小波变换的统计特征提取技术、特征阀值判决技术等都没有包含足够全面的特征信息,以至于自动检测的准确率不高。
经过现有技术文献的检索发现,S.Lyu和H.Farid在文章“HowRealisticisPhotorealistic?”(IEEETransactionsonSignalProcessing,2005,53(2):845-850.)(IEEE信号处理期刊)提出首先对待测图像进行小波变换,然后在小波域上提取均值、方差、偏态、峰态四个统计量,将这四个统计量作为统计特征,然后对这些特征向量用机器学习方法进行分类判决。该方法只从统计上对图像进行分析,并未指出计算机生成图像与自然图像的本质差异,鉴别率只有84.97%,因此鉴别率并不理想。W.Chen和Q.Y.shi在文章“IdentifyingComputerGraphicsusingHSVColorModelandStatisticalMomentsofCharacteristicFunctions”(IEEEInternationalConferenceonMultimediaandExpo.Beijing:IEEE,2007:1123-1126.)一种基于HSV颜色模型的统计方法来区分Photo和CG,将图像由RGB颜色空间映射到HSV颜色空间,然后对图像进行离散小波变换(DWT)以及离散傅里叶变换(DFT)之后,再统计图像特征进行图像分类鉴别,进一步提高了图像的鉴别准确率。鉴别率只有82.1%,该方法的鉴别率并不理想。李文祥和张涛在文章“基于二阶差分统计量的自然图像与计算机图形的鉴别”(计算机辅助设计与图形学学报计算机辅助设计与图形学学报.2010,22(9):195-200.)提出一种基于图像二阶差分统计量的鉴别方法.首先在HSV颜色空间提取图像及其校准图像的二阶差分信号和预测误差信号,在此基础上提取二阶差分信号的方差、峰度以及预测误差信号的1~4阶统计量,并将其作为分类特征,结合Fisher线性判别分析,实现2类图像的正确分类.实进一步提高了图像的鉴别准确率。鉴别率达到了92.8%。王让定和郭克在专利中“基于多小波变换的自然图像和计算机生成图像的识别方法”(专利号:201010618428.4)中公开了一种基于多小波变换的自然图像和计算机生成图像的识别方法,特点包括以下步骤:(1)将训练样本图像和测试样本图像转换到HSV颜色空间,分别获取相应的色相分量图像、饱和度图像和亮度量图像;(2)将各分量图像进行预处理后再将各分量图像进行一阶多小波变换;(3)将获得的色相分量图像、饱和度分量图像和亮度分量图像的16个子带作为对象,计算每个子带小波系数的均值、方差、偏斜度和峰度,获得192个特征值;(4)将特征值校准再归一化处理后代入SVM分类器中进行训练和测试,获得图像的类别,检测识别率达到了92.79%。
现有的自然图像与计算机鉴别方法的特征提取都是采用单一类型的特征信息,信息涵盖不全,分析能力不强,收集到的特征信息不能够十分准确地用于计算机生成图像和自然图像的检测。比如,目前基于离散小波变换的统计特征提取技术、特征阀值判决技术等都没有包含足够全面的特征信息,以至于自动检测的准确率不高。
发明内容
针对目前自然图像和计算机生成图像的鉴别方法鉴定准确率不高的问题,提出了一种基于DCT域统计特性的自然图像与计算机生成图像的鉴别方法。
本发明的技术方案如下:
一种基于DCT域统计特性的自然图像与计算机生成图像的鉴别方法,包括以下步骤:(1)首先对待测图像进行高斯模糊处理、降维处理,然后对图像R、G、B3个通道分别进行8×8的不重复块DCT离散余弦变换,得到的8×8分块DCT系数矩阵;(2)对每一通道DCT域AC系数的首位有效数字的分布进行统计,得到3条概率分布曲线;(3)计算3条概率分布曲线的平均绝对差分,若平均绝对差分大于设定的阈值T,说明3条概率分布曲线的重合程度不强,将待测图像判定为自然图像,否则判定为计算机生成图像;所述平均绝对差分定义如下:
式中,i表示首位有效数字,Ri、Gi、Bi分别表示RGB3个色彩通道下的MSDi, 分别表示首位有效数字在RGB三个色彩通道下的概率。
所述的鉴别方法,所述步骤(1)中,所述的对图像进行高斯模糊处理,模糊半径设定为0.3,在二维空间正态分布方程为:
其中,r是模糊半径,σ是正态分布的标准偏差;
在对图像进行DCT离散余弦变换时将图像分成若干的8×8小块,以提高DCT变换的速度和算法的鲁棒性。图像处理运用二维离散余弦变换,二维DCT变换的公式:
0≤p≤M-1,0≤q≤N-1
其中
式中Amn为M×N的数字图像矩阵。
所述的鉴别方法,所述步骤(3)中,所述阈值T的确定方法如下:
(1)首先对实验组图像进行高斯模糊处理、降维处理,然后对图像R、G、B3个通道分别进行8×8的不重复块离散余弦变换,得到的8×8分块DCT系数矩阵;
(2)对每一通道DCT域AC系数的首位有效数字的分布进行统计,得到3条概率分布曲线;
(3)计算3条曲线的平均绝对差分,通过统计实验组图像的平均绝对差分,比较出平均绝对差分的最大值与最小值,并以最小值为初始值,初始值与每一个平均绝对差分作对比,统计出自然图像平均绝对差分小于初始值的个数A以及计算机生成图像平均绝对差分大于初始值的个数B,通过A的值除以自然图像的个数,计算出自然图像的鉴别错误率,利用同样的方法计算出计算机生成图像的鉴别错误率,得到相应的鉴别正确率后,取两个鉴别正确率平均数,得到最终的鉴别平均正确率,在初始值的基础上加上0.00001,直到数值等于平均绝对差分的最大值,利用上述方法统计出最高的鉴别正确率已经对应的数值,此数值就是阈值T。
本发明利用Benford模型作为统计依据,总结自然图像和计算机生成图像的DCT域AC系数首位有效数字的统计特性,根据两类图像差异的显著性水平来设定阈值对待检图像的来源做出真实性判决。实验结果显示,这种算法提高了自然图像与计算机生成图像的鉴别准确率。与已有算法相比具有更高的识别率,鉴别准确率达到95.22%,且计算量小、易于实现。
附图说明
图1为本发明方法的算法流程图;
图2为自然图像;
图3为计算机生成图像;
图4为高斯模糊后的自然图像(即图2)MSD概率分布曲线;
图5为高斯模糊后的计算机生成图像(即图3)MSD概率分布曲线。
具体实施方式
以下结合具体实施例,对本发明进行详细说明。
实施例1
本方法的基本原理是首先对图像进行高斯模糊处理,然后利用Benford的模型,分析图像RGB三个色彩通道的DCT域AC系数首位有效数字的概率分布特性,最终根据图像特性的不同对图像分类鉴别。以下是对算法中的benford模型、高斯模糊、DCT域统计特性的详细介绍:
1Benford模型
Benford法则也被称为“首位数现象”(First-digitphenomenon)、有效数字法则(Significantdigitlaw)、对数法则(LogarithmLaw)。是从统计学角度检测鲜为人知的数字分布的内在规律。该定律揭示了在满足特定条件的情况下。大量统计数据中数字1-9出现在数据首位的概率分布规律。
20世纪30年代,美国通用电气公司研究中心的物理学家FrankBenford在图书馆翻阅对数表手册时发现:前几页比后面的页码更脏一些,这说明前几页在平时被更多的人翻阅。他由此推测在现实生活中,人们处理首位数字较小的数据的频率较大。于是,Benford收集并验证了20229个来源千差万别的样本数据的首位数字,其中包括河流的长度、湖泊的面积、各个城市的人口总量、不同元素的原子质量等等。经过研究后,得出这样一个结论:大量自然数据中数据的首位数字的出现频率符合对数规律,即以1开头的数字出现的频率并非1/9,而是30.1%。而以2为首位的数字在样本中出现的频率为17.6%,其他数据依次减少。后续的研究发现首位数在数据样本中出现频率的规律为:
并以该定律的发现人Benford的名字命名为Benford定律,也被称为第一数字定律。
2高斯模糊
高斯模糊是一种图像模糊滤波器,它用正态分布计算图像中每个像素的变换。其在二维空间的正态分布方程为:
其中,r是模糊半径,σ是正态分布的标准偏差。在二维空间中,这个公式生成的曲面的等高线是从中心开始呈正态分布的同心圆。分布不为零的像素组成的矩阵与原始图像做卷积变换。每个像素的值都是周围相邻像素值的加权平均。原始像素的值有最大的高斯分布值,所以有最大的权重,相邻像素随着距离原始像素越来越远,其权重也越来越小,这样进行模糊处理比其它的均衡模糊滤波器更高地保留了边缘效果,同时减小了图像噪声以及降低了图像的细节层次。
3DCT域统计特性
离散余弦变换(DiscreteCosineTransform,DCT)是一种实数域变换,其变换核为实数余弦函数。通过DCT变换可以将图像空间上的信息变换到频域上,使图像在空域上所表现出的能量发散形式变换为频域能量相对集中的形式,以便对图像信息进行各种处理,在进行DCT变换时将图像分成若干的8×8小块,以提高DCT变换的速度和算法的鲁棒性。图像处理运用二维离散余弦变换,二维DCT变换的公式:
0≤p≤M-1,0≤q≤N-1(2-2)
其中
式中Amn为M×N的数字图像矩阵。当p=0,q=0,得到的频率系数与余弦函数无关(cos0=1),完全就是图像抽样信号的均值,也是最大的一个值,称为DCT变换的直流(DC)系数,其它的频率系数都由余弦函数参与得到,所以被称为交流(AC)系数。当对图像8×8分块DCT后,会得到1个DC值和63个AC系数,其中这63个频率系数则多半是一些接近于0的正负浮点数。交流(AC)系数代表了图像中每块的纹理特征和像素值,是形成图像特征向量的关键要素。因此,本算法充分考虑DCT域中AC系数的首位数字的分布特点,提取AC系数首位数字的分布熵来描述图像的内容特征。
本发明在前人有关研究的基础上通过实验发现,自然图像与计算机图像的DCT域AC系数首位有效数字分布概率利用Benford模型进行统计表现出了类似的规律。
实施例2
本发明的算法流程图如图1所示,鉴别方法的实现步骤如下:
(1)首先对待测图像进行高斯模糊处理、降维处理,然后对图像R、G、B3个通道分别进行8×8的不重复块DCT离散余弦变换,得到的8×8分块DCT系数矩阵。
所述的高斯模糊处理,对图像进行高斯模糊处理,模糊半径设定为0.3,在二维空间正态分布方程为:
其中,r是模糊半径,σ是正态分布的标准偏差。
在对图像进行DCT离散余弦变换时将图像分成若干的8×8小块,以提高DCT变换的速度和算法的鲁棒性。图像处理运用二维离散余弦变换,二维DCT变换的公式:
0≤p≤M-1,0≤q≤N-1(2-2)
其中
式中Amn为M×N的数字图像矩阵。当p=0,q=0,得到的频率系数与余弦函数无关(eos0=1),完全就是图像抽样信号的均值,也是最大的一个值,称为DCT变换的直流(DC)系数,其它的频率系数都由余弦函数参与得到,所以被称为交流(AC)系数。当对图像8×8分块DCT后,会得到1个DC值和63个AC系数,其中这63个频率系数则多半是一些接近于0的正负浮点数。交流(AC)系数代表了图像中每块的纹理特征和像素值,是形成图像特征向量的关键要素。因此,本算法充分考虑DCT域中AC系数的首位数字的分布特点,提取AC系数首位数字的分布熵来描述图像的内容特征。
(2)对每一通道DCT域AC系数的首位有效数字的分布进行统计,得到3条概率分布曲线。通过对图像进行DCT变换,然后对图像RGB每一通道DCT域AC系数的首位有效数字的分布进行统计,得到3条概率分布曲线。计算机生成图像R、G、B3个色彩通道的DCT域AC系数首位数字概率分布相关性比自然图像MSD概率分布相关性更高。
(3)计算3条曲线的平均绝对差分,若平均绝对差分大于设定的阈值T,说明3条曲线的重合程度不强,将待测图像判定为自然图像,否则判定为计算机生成图像。为了表征3条概率分布曲线的重合程度进而对自然图像与计算机生成图像进行有力的区分,这里选取平均绝对差分(AbsoluteDifference)作为取证依据的参数,平均绝对差分定义如下:
式中,i表示首位有效数字,Ri、Gi、Bi分别表示RGB3个色彩通道下的MSDi, 分别表示首位有效数字在RGB三个色彩通道下的概率。
实施例3
本发明解决上述技术问题所采用的技术方案为:一种基于DCT域统计特性的自然图像与计算机生成图像的鉴别方法,鉴别方法中阈值T的确定方法如下:
(1)首先对实验组图像进行高斯模糊处理、降维处理,然后对图像RGB3个通道分别进行8×8的不重复块离散余弦变换,得到的8×8分块DCT系数矩阵。
(2)对每一通道DCT域AC系数的首位有效数字的分布进行统计,得到3条概率分布曲线。
(3)计算3条曲线的平均绝对差分,通过统计实验组图像的平均绝对差分,比较出平均绝对差分的最大值与最小值,并以最小值为初始值,初始值与每一个平均绝对差分作对比,统计出自然图像平均绝对差分小于初始值的个数A以及计算机生成图像平均绝对差分大于初始值的个数B,通过A的值除以自然图像的个数,计算出自然图像的鉴别错误率,利用同样的方法计算出计算机生成图像的鉴别错误率,得到相应的鉴别正确率后,取两个鉴别正确率平均数,得到最终的鉴别平均正确率,在初始值的基础上加上0.00001,直到数值等于平均绝对差分的最大值,利用上述方法统计出最高的鉴别正确率已经对应的数值,此数值就是阈值T。
实施例4
下面以自然图像与计算机生成图像为例来说明,分别对图像进行高斯模糊处理,模糊半径设定为0.3,然后对图像的RGB3个通道的DCT域AC系数的MSD(最高位有效数字)进行概率分布统计并观察其变化规律。如图2、图3所示,图像取自哥伦比亚大学真实图像和计算机生成图像数据库。
从图4中可以看出,自然图像R、G、B3个色彩通道的DCT域AC系数首位数字概率分布具有近似一致性,但仍能够看出有所差异,其中R、G、B3个色彩通道的MSD概率分布曲线的平均绝对差分值为0.00555。
通过图5可以发现,计算机生成图像R、G、B3个通道的MSD概率分布曲线的平均绝对差分值为0.00127,由此可以看出计算机生成图像RGB3个色彩通道的DCT域AC系数首位数字概率分布一致性变得更加强烈甚至达到了高度重合。
通过大量实验我们发现自然图像DCT域AC系数的统计特性并非严格稳定,不同自然图像之间的R、G、B3个色彩通道DCT域AC系数的Benford曲线分布具有近似一致性。但是计算机生成图像的三条Benford曲线的拟合程度较自然图像变的更加强烈,接近重合。我们利用这一特性对鉴别自然图像与计算机生成图像能够达到令人满意的效果。因此,本发明提出了一种基于DCT域统计特性的自然图像与计算机生成图像鉴别方法。
实施例5
系统的稳定性体现在算法的检测效果不随所选验证集的不同具有较大波动。为了验证所提算法的稳定性,使用上述方法以图像RGB3个色彩通道的DCT域AC系数首位有效数字概率的平均绝对差分作为特征,选取9种不同类型的相机拍摄的1800幅自然图像,并在哥伦比亚大学计算机生成图像数据库中随机选取500幅计算机生成图像,并从其他CG图像网站下载1300幅计算机生成图像进行鉴别试验。3600副图像测试库包含的图片格式为jpeg,图片大小从640×412到4032×3024不等,图片内容涵盖了车辆、动物、风景、建筑、人物、室内、天空、纹理、物品、植物和夜景等各个方面。尽可能做到图片库中的图像能够包括所有的场景,从而避免图像鉴别结果不会因为图片库中图像的种类不全面而造成鉴别准确率下降。用阈值法进行判别图像的来源,阈值设定为0.004,设定不同模糊半径进行鉴别效果对比,实验结果如表1所示:
表1图像来源鉴别结果
从以上结果可以分析得出,该方法对于图像的来源能够有效的进行鉴别。并且本算法针对的是自然图像与计算机生成图像DCT域统计特性的不同,准确度受相机的型号影响不大,模糊半径为0.3时,图像来源的平均正确率达到95.22%。实验表明3个概率分布曲线拟合程度与图像的平滑度密切相关,由于计算机生成图像在渲染过程中,为了去除混叠现象,必须对图像函数进行滤波以去除高频成分,计算机生成图的生成过程几乎是“无噪”的,然而自然图像拍摄过程中无法避免种种固有的模式噪声,计算机生成图像的平滑度比自然图像的平滑度更高,当对图像进行高斯模糊处理后,两者的平滑度差距变的更大,因此利用上述方法比较有效的鉴别图像的来源。此外,算法原理建立在RGB3个通道上,故对于3个通道严重失衡的情况下分析效果不明显。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。