CN111783848A

CN111783848A - 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Info

Publication number: CN111783848A
Application number: CN202010542010.3A
Authority: CN
Inventors: 宋传鸣; 葛明博; 刘丹; 王相海
Original assignee: Liaoning Normal University
Current assignee: Dalian Houren Technology Co ltd
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2020-10-16
Anticipated expiration: 2040-06-15
Also published as: CN111783848B

Abstract

本发明公开一种基于概率分布参数特征和马尔可夫转移特征的图像分类方法，首先，采用柯西分布、拉普拉斯分布、广义高斯分布和α‑稳态分布为原子，建立一个分布字典，对输入图像的不同尺度、不同子带下的高频小波变换系数分布进行拟合；利用1阶差分算子分别计算离散余弦变换系数沿水平方向、竖直方向的马尔可夫转移概率；将概率密度分布参数特征和马尔可夫转移概率参数特征作为分类特征，以支持向量机LIBSVM作为分类器，以径向基函数作为核函数，训练得到一种基于支持向量机LIBSVM的、用于屏幕内容图像和自然图像的分类器，进而实现屏幕内容图像块和自然图像块的自动分类。

Description

基于概率密度分布字典和马尔可夫转移特征的图像分类方法

技术领域

本发明涉及屏幕内容的图像和视频处理领域，尤其是一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。

背景技术

复杂度适中、面向屏幕内容视频的高效率编码是视频编码领域具有挑战性的最新研究课题之一，学者们将其称为“屏幕内容视频编码”。目前，H.264/AVC、HEVC对屏幕内容中的线条、文字、图形等非连续色调内容的压缩效率尚未满足应用需求，且计算复杂度高。究其原因在于，屏幕内容由不连续色调区域和连续色调区域两部分共同组成，而二者的成像机制和获取手段却完全不同，使得其通道特性也大相径庭。在空间域中，不连续色调区域拥有背景简单、对比度高、色调数量有限的锐化边缘和线条，而连续色调区域的纹理特点却恰恰相反；在频率域中，与连续色调区域相比，不连续色调区域的离散余弦变换(DiscreteCosine Transform,DCT)系数分布呈现更加显著的非高斯特性。所以，无论在空间域，还是在频率域，不连续色调区域的统计分布规律都明显有别于连续色调区域，目前还不存在任何一种编码方法，能在这两类区域上均取得令人满意的编码效率。在这种情况下，面向屏幕内容视频的国际编码标准HEVC-SCC采用了一种混合编码框架对屏幕内容进行压缩，其主要思路是首先将待编码帧划分为不连续色调块和连续色调块，再为不同类型的块选择恰当的编码算法，从而形成复合码流。然而，由于研究人员目前尚缺乏对屏幕内容视频的统计分布特征，尤其是DCT系数统计分布特征的深入认识，HEVC-SCC编码器仅能依靠对不同编码模式的枚举和多次率失真选择，才能为每个待编码块确定恰当的图像块类型及其编码方法，其决策过程的计算负担非常繁重。因此，对自然图像块和屏幕内容图像块进行准确地自动分类，已经成为一个现实且重要的问题，它是指导SCC视频编码器实现快速块分类决策的关键环节，有利于加快编码器的编码模式决策和率失真优化的速度，进而提高编码器的时间效率。

目前，还鲜见对包含大量文字、电脑桌面内容的屏幕内容图像与自然图像进行分类的方法。现有方法主要集中于对自然图像和计算机生成图像的分类，这些方法大致可以分为三类：基于统计特征的分类方法、基于几何特征的分类方法和基于物理特征的分类方法。

在基于统计特征的分类方法方面，Fard等人对图像的RGB颜色通道采取4阶小波变换，然后提取每阶小波高频子带的216维统计特征，并采用SVM及LDA进行分类，其对自然图像的识别准确率为98.8％，但计算机生成图像的识别准确率仅66.8％，并且其特征维数较高，准确率也不足，尤其是计算机生成图像的分类识别精度不够。Chen等人提出采用图像特征函数的统计矩以及小波子带作为分类特征，应用小波系数直方图的特征函数来构造一个234维的区分特征，并采用LIBSVM在RBF核的基础上实现图像种类判别，其识别精度达到了82.1％。虽然精度有所提升，但特征向量的维度和计算复杂度均更高。Li等人在YCbCr颜色空间中提取均匀的59维灰度不变LBP特征，再使用SVM和多项式核函数完成图像分类，其平均精确度可以达到98.33％，但复杂度较高，鲁棒性也不尽人意。Wang等人利用同态滤波突出图像细节，用共生矩阵构建分类特征，再通过计算各灰度共生矩阵的能量、对比度、同质性、列平均最大值以及纹理相似性等特征，使平均分类精度达到了98％。

在基于几何特征的图像分类方面，Peng等人提出了一种基于多重分形谱和回归分析的自然图像和计算机生成图像分类算法，利用多元线性回归得到残差图像，同时研究纹理差异和回归模型的拟合度，从而得到9维直方图特征、9维多重分形谱特征和6维回归模型拟合特征，再应用LIBSVM的RBF核函数和5倍交叉验证训练模型。通过分析局部边缘斑块的统计特性，Zhang等人对图像边缘块进行预处理，将其投影到一个7维的球面空间，再依据Voronoi单元确定关键采样点，形成可视化词汇表，进而采用SVM实现图像分类。不过，该方法对特征维数非常敏感，当特征维数降为14时，其识别精度仅为88％，尚需提高小维度特征的精确度。Pan等人提出应用分形几何来实现图像分类的目的，从HSV颜色空间的H、S通道获取10个分类特征，再从H通道中提取一个用于表征图像粗糙度的10维特征向量，从而借助SVM和网格搜索优化完成分类，其平均分类精度为91.2％，但是对计算机生成图像的识别精度仍然不足。

在基于物理特征的图像分类方面，考虑到自然图像是由采集设备(如数码相机、手机等)所获取的，设备的物理特性必然能够在图像中得以反映。自然图像在采集过程中必定经过彩色滤波阵列(Color Filter Array，CFA)的插值操作，而计算机生成图像却无需该过程。故此，CFA插值系自然图像所特有的运算，亦被称为“马赛克”。为此，张晓琳等人在分析了插值图像与原图像的频谱差异后，提出了一种基于通道间相关性的CFA图像盲取证算法，能够实现对篡改图像的自动识别。Gallagher等人发现，CFA插值会降低像素方差，于是提出了一种基于CFA插值的去噪周期方差特征存在性检测的检测方案，平均可达到98.4％的判别精度。然而，如果仅使用处于图像中心的、大小为64×64像素的块来完成判别，则其精度会急剧下降到66％。此外，PRNU也是一种由传感器产生的、自然图像所特有的模式噪声，在图像源识别中具有广泛应用。由于CFA插值与其邻域的像素有较强的相关性，且具有周期性，Peng等人认为PRNU在像素的某个邻域内将同样表现出周期性特点，于是提出了一种借助PRNU来度量CFA插值影响的方法，其主要思路是通过分析PRNU方差直方图，从而获得峰值、均值和方差的9维特征，再使用LIBSVM的RBF核函数和5倍交叉验证进行训练，将图像分类的平均精度提高到了99.43％。但是，该方法的计算复杂度较高，且依赖于图像所特有的PRNU模式噪声，其鲁棒性尚不尽如人意。

总体来看，上述方案仍存在分类特征维度大、计算复杂度高、鲁棒性差、自适应性弱的缺点。并且，由于屏幕视频的统计特性不同于计算机生成图像，这些方案尚无法很好地适用于屏幕内容图像块与自然图像块的自动分类。

发明内容

本发明是为了解决现有技术所存在的上述技术问题，提供一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。

本发明的技术解决方案是：一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法，其特征在于按如下步骤进行：

步骤1.输入一幅大小为B×B的图像I，将其进行3层离散小波变换，得到9个高频子带：3个水平方向子带cH_j∈{cH₁,cH₂,cH₃}、3个垂直方向子带cV_j∈{cV₁,cV₂,cV₃}和3个对角线方向子带cD_j∈{cD₁,cD₂,cD₃}，所述j表示高频子带所在的尺度且j∈{1,2,3}；

步骤2.分别统计9个高频子带的归一化系数直方图；

步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子，建立一个概率密度分布字典D；

步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合，进而提取广义高斯分布在9个高频子带上的参数特征；

步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合，得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合

所述

和

分别表示水平方向子带cH_j的尺度参数和形状参数，

和

分别表示垂直方向子带cV_j的尺度参数和形状参数，

和

分别表示对角线方向子带cD_j的尺度参数和形状参数；

步骤4.2根据公式(1)-公式(3)的定义，利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差：

所述

和

分别表示水平方向子带cH_j、垂直方向子带cV_j和对角线方向子带cD_j的标准差，Γ(·)表示Gamma函数；

步骤4.3根据公式(4)的定义，将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征

所述J表示高频子带所在的尺度且J∈{1,2}，

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差，

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数；

步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合，进而提取柯西分布在9个高频子带上的参数特征；

步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合，得到柯西分布在9个高频子带上的位置参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

步骤5.2根据公式(5)的定义，将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征

所述

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数；

步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合，进而提取拉普拉斯分布在9个高频子带上的参数特征；

步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合，得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

步骤6.2根据公式(6)的定义，将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征

所述

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数，

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数；

步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合，进而提取α-稳态分布在9个高频子带上的参数特征；

步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合，得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的形状参数和尺度参数，

和

分别表示垂直方向子带cV_j的形状参数和尺度参数，

和

分别表示对角线方向子带cD_j的形状参数和尺度参数；

步骤7.2根据公式(7)的定义，将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征

所述

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数，

和

分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数，

和

分别表示在尺度J下，水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数，

和

则分别表示在尺度J+1下，水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数；

步骤8.令图像I的概率密度分布参数特征

步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块，并将每个图像块进行离散余弦变换，进而，对于每个图像块的离散余弦变换系数矩阵F(u,v)，执行步骤9.1～步骤9.3来计算F(u,v)的1阶差分，所述1≤u,v≤8；

步骤9.1利用前向差分算子，分别沿着水平方向计算1阶差分矩阵F^→(u,v)和沿着竖直方向计算1阶差分矩阵F^↓(u,v)；

步骤9.2对差分矩阵F^→(u,v)和F^↓(u,v)中的每个元素进行取整运算，取整原则为四舍五入；

步骤9.3根据公式(8)和公式(9)的定义，利用预设阈值T对差分矩阵F^→(u,v)和F^↓(u,v)中的每个元素进行截断运算：

步骤10.利用图像I中全部图像块的1阶差分矩阵F^→(u,v)和F^↓(u,v)，执行步骤10.1～步骤10.3来提取图像I的马尔可夫转移概率参数特征；

步骤10.1根据公式(10)的定义，计算1阶差分矩阵F^→(u,v)沿着水平方向的马尔可夫转移概率P_h(F^→(u+1,v)＝n|F^→(u,v)＝m)：

所述δ(·)表示Delta函数，m,n∈{-T,-T+1,-T+2,…,T-1,T}；

步骤10.2根据公式(11)的定义，计算1阶差分矩阵F^↓(u,v)沿着竖直方向的马尔可夫转移概率P_v(F^↓(u,v+1)＝|nF^↓(u,v)＝m)：

步骤10.3令图像I的马尔可夫转移概率参数特征

共(2T+1)×(2T+1)×2个维度，所述m和n是整数，且m,n∈{-T,-T+1,-T+2,…,T-1,T}；

步骤11.利用95％的主成分分析方法将图像I的概率密度分布参数特征

和马尔可夫转移概率参数特征

进行降维，得到

和

步骤12.以径向基函数作为核函数，将

和

输入基于支持向量机LIBSVM的图像分类模型，进而计算得出图像I的分类结果；

所述基于支持向量机LIBSVM的图像分类模型，是按照如下步骤训练而成：

步骤13.1输入一组包含N幅图像的训练集{T_i,C_i}，训练集中每幅图像的大小为B×B像素，所述1≤i≤N，T_i表示第i幅训练图像，C_i表示第i幅训练图像的分类标签且C_i∈{-1,+1}，标签“-1”表示T_i为屏幕内容图像样本，标签“+1”表示T_i为自然图像样本，令i←1；

步骤13.2从训练集中取出第i幅训练图像T_i，并将其进行3层离散小波变换，得到9个高频子带：3个水平方向子带cH_j∈{cH₁,cH₂,cH₃}、3个垂直方向子带cV_j∈{cV₁,cV₂,cV₃}和3个对角线方向子带cD_j∈{cD₁,cD₂,cD₃}，所述j表示高频子带所在的尺度且j∈{1,2,3}；

步骤13.3分别统计9个高频子带的归一化系数直方图；

步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子，建立一个概率密度分布字典D；

步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合，进而提取广义高斯分布在9个高频子带上的参数特征；

步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合，得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合

所述

和

分别表示水平方向子带cH_j的尺度参数和形状参数，

和

分别表示垂直方向子带cV_j的尺度参数和形状参数，

和

分别表示对角线方向子带cD_j的尺度参数和形状参数；

步骤13.5.2根据公式(12)-公式(14)的定义，利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差：

所述

和

步骤13.5.3根据公式(15)的定义，将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征

所述J表示高频子带所在的尺度且J∈{1,2}，

和

和

和

和

步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合，进而提取柯西分布在9个高频子带上的参数特征；

步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合，得到柯西分布在9个高频子带上的位置参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

步骤13.6.2根据公式(16)的定义，将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征

所述

和

和

步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合，进而提取拉普拉斯分布在9个高频子带上的参数特征；

步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合，得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

步骤13.7.2根据公式(17)的定义，将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征

所述

和

和

和

和

步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合，进而提取α-稳态分布在9个高频子带上的参数特征；

步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合，得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合

所述

和

分别表示水平方向子带cH_j的形状参数和尺度参数，

和

分别表示垂直方向子带cV_j的形状参数和尺度参数，

和

分别表示对角线方向子带cD_j的形状参数和尺度参数；

步骤13.8.2根据公式(18)的定义，将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征

所述

和

和

和

和

步骤13.9.令图像T_i的概率密度分布参数特征

步骤13.10.对图像T_i划分为不重叠的、大小为8×8像素的图像块，并将每个图像块进行离散余弦变换，进而，对于每个图像块的离散余弦变换系数矩阵F(u,v)，执行步骤13.10.1～步骤13.10.3来计算F(u,v)的1阶差分，所述1≤u,v≤8；

步骤13.10.1利用前向差分算子，分别沿着水平方向计算1阶差分矩阵F^→(u,v)和沿着竖直方向计算1阶差分矩阵F^↓(u,v)；

步骤13.10.2对差分矩阵F^→(u,v)和F^↓(u,v)中的每个元素进行取整运算，取整原则为四舍五入；

步骤13.10.3根据公式(19)和公式(20)的定义，利用预设阈值T对差分矩阵F^→(u,v)和F^↓(u,v)中的每个元素进行截断运算：

步骤13.11.利用图像T_i中全部图像块的1阶差分矩阵F^→(u,v)和F^↓(u,v)，执行步骤13.11.1～步骤13.11.3来提取图像T_i的马尔可夫转移概率参数特征；

步骤13.11.1根据公式(21)的定义，计算1阶差分矩阵F^→(u,v)沿着水平方向的马尔可夫转移概率P_h(F^→(u+1,v)＝n|F^→(u,v)＝m)：

所述δ(·)表示Delta函数，m,n∈{-T,-T+1,-T+2,…,T-1,T}；

步骤13.11.2根据公式(22)的定义，计算1阶差分矩阵F^↓(u,v)沿着竖直方向的马尔可夫转移概率P_v(F^↓(u,v+1)＝n|F^↓(u,v)＝m)：

步骤13.11.3令图像T_i的马尔可夫转移概率参数特征

步骤13.12.利用95％的主成分分析方法将图像T_i的概率密度分布参数特征

和马尔可夫转移概率参数特征

进行降维，得到

和

步骤13.13.将

作为第i条训练数据，输入支持向量机LIBSVM，令i←i+1，若i≤N，则转入步骤13.2，否则转入步骤13.14；

步骤13.14.以全部的N条训练数据组成训练集，以径向基函数作为核函数，以网格搜索作为自动寻优方式，通过五倍交叉验证，对支持向量机LIBSVM进行训练，进而得到基于支持向量机LIBSVM的图像分类模型。

本发明首先，利用4种“厚尾”分布构建了一个概率密度分布字典，组成自适应的混合“厚尾”分布，在理论上能够得到更加丰富的“厚尾”分布及其概率密度函数形式，有利于突破传统方法采用单一分布或某两个固定分布对小波变换系数分布进行统计建模时所存在的局限性，从而突破现有“厚尾”分布的种类限制，可为变换系数拟合提供更大的灵活性和更多的自由度，提高分布拟合的精度；其次，由于成像内容和成像机理的不同，自然图像和屏幕内容图像在空间域呈现出明显的纹理特征差异，在频率域也表现出明显的统计特征差异。本发明采用概率密度分布字典将两类图像的频率域统计特征差异建模为概率密度分布参数特征的差异，而采用马尔可夫随机过程将两类图像的空间域纹理特征差异建模为马尔可夫转移概率参数特征的差异，进而形成了空间域—频率域联合的可判别性特征，有利于提高图像分类的精度。因此，本发明具有稳定高效、自适应性强、分类精度高的优点。

具体实施方式

本发明的一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法，按照如下步骤进行：

步骤1.输入一幅大小为B×B的图像I，将其进行3层离散小波变换，得到9个高频子带：3个水平方向子带cH_j∈{cH₁,cH₂,cH₃}、3个垂直方向子带cV_j∈{cV₁,cV₂,cV₃}和3个对角线方向子带cD_j∈{cD₁,cD₂,cD₃}，所述j表示高频子带所在的尺度且j∈{1,2,3}，本实施例中，令B＝256；

步骤2.分别统计9个高频子带的归一化系数直方图；

所述

和

分别表示水平方向子带cH_j的尺度参数和形状参数，

和

分别表示垂直方向子带cV_j的尺度参数和形状参数，

和

分别表示对角线方向子带cD_j的尺度参数和形状参数；

所述

和

所述J表示高频子带所在的尺度且J∈{1,2}，

和

和

和

和

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

所述

和

和

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

所述

和

和

和

和

所述

和

分别表示水平方向子带cH_j的形状参数和尺度参数，

和

分别表示垂直方向子带cV_j的形状参数和尺度参数，

和

分别表示对角线方向子带cD_j的形状参数和尺度参数；

所述

和

和

和

和

步骤8.令图像I的概率密度分布参数特征

在本实施例中，令T＝3；

所述δ(·)表示Delta函数，m,n∈{-T,-T+1,-T+2,…,T-1,T}；

步骤10.2根据公式(11)的定义，计算1阶差分矩阵F^↓(u,v)沿着竖直方向的马尔可夫转移概率P_v(F^↓(u,v+1)＝n|F^↓(u,v)＝m)：

步骤10.3令图像I的马尔可夫转移概率参数特征

和马尔可夫转移概率参数特征

进行降维，得到

和

步骤12.以径向基函数作为核函数，将

和

所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成：

步骤13.1.输入一组包含N幅图像的训练集{T_i,C_i}，训练集中每幅图像的大小为B×B像素，所述1≤i≤N，T_i表示第i幅训练图像，C_i表示第i幅训练图像的分类标签且C_i∈{-1,+1}，标签“-1”表示T_i为屏幕内容图像样本，标签“+1”表示T_i为自然图像样本，令i←1，本实施例中，令B＝256；

步骤13.2.从训练集中取出第i幅训练图像T_i，并将其进行3层离散小波变换，得到9个高频子带：3个水平方向子带cH_j∈{cH₁,cH₂,cH₃}、3个垂直方向子带cV_j∈{cV₁,cV₂,cV₃}和3个对角线方向子带cD_j∈{cD₁,cD₂,cD₃}，所述j表示高频子带所在的尺度且j∈{1,2,3}；

步骤13.3.分别统计9个高频子带的归一化系数直方图；

步骤13.4.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子，建立一个概率密度分布字典D；

步骤13.5.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合，进而提取广义高斯分布在9个高频子带上的参数特征；

所述

和

分别表示水平方向子带cH_j的尺度参数和形状参数，

和

分别表示垂直方向子带cV_j的尺度参数和形状参数，

和

分别表示对角线方向子带cD_j的尺度参数和形状参数；

所述

和

所述J表示高频子带所在的尺度且J∈{1,2}，

和

和

和

和

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

所述

和

和

所述

和

分别表示水平方向子带cH_j的位置参数和尺度参数，

和

分别表示垂直方向子带cV_j的位置参数和尺度参数，

和

分别表示对角线方向子带cD_j的位置参数和尺度参数；

所述

和

和

和

和

所述

和

分别表示水平方向子带cH_j的形状参数和尺度参数，

和

分别表示垂直方向子带cV_j的形状参数和尺度参数，

和

分别表示对角线方向子带cD_j的形状参数和尺度参数；

所述

和

和

和

和

步骤13.9.令图像T_i的概率密度分布参数特征

在本实施例中，令T＝3；

所述δ(·)表示Delta函数，m,n∈{-T,-T+1,-T+2,…,T-1,T}；

步骤13.11.3令图像T_i的马尔可夫转移概率参数特征

和马尔可夫转移概率参数特征

进行降维，得到

和

步骤13.13.将

为验证本发明的有效性，以1000幅自然图像和1000幅屏幕内容图像组成图像数据集进行实验。其中，自然图像和屏幕内容图像的来源为JCT-VC公布的标准屏幕内容视频以及自然视频序列，每个图像被裁剪为256×256像素；训练集包括1000幅图像(由500幅自然图像和500幅屏幕内容图像组成)，测试集包括1000张图像(由500幅自然图像和500幅屏幕内容图像组成)。分类准确度定义为正确分类的自然图像数量与全部测试自然图像之比，以及正确分类的屏幕内容图像数量与全部屏幕内容图像之比之间的平均值，并将5次实验的平均值作为最终的分类准确度。

采用本发明和基于广义高斯分布的分类方法、基于镶嵌处理的分类方法、基于残差模式噪声的分类方法和基于隐马尔可夫树的分类方法进行图像分类的分类准确度对比如表1所示。

表1

从表1可见，通过充分发掘分布字典的概率分布参数的判别性特征，并将其与马尔可夫转移特征进行有机整合，本发明得到了适用屏幕内容图像和自然图像的、更加有效的判别性特征，获得了最高的图像分类准确度，比基于镶嵌处理的分类方法、基于残差模式噪声的分类方法、基于隐马尔可夫树的分类方法和基于广义高斯分布的分类方法分别提高了65.74％、19.45％、12.17％、7.04％。